Disertasi Lian G.otaya 16701261002

MODEL PENILAIAN PENDIDIKAN PROFESI GURU (PPG)
DENGAN PENSKORAN PARSIAL DAN HOLISTIK
Oleh:
LIAN G. OTAYA
NIM : 16701261002
Disertasi ini ditulis untuk memenuhi sebagian persyaratan

untuk mendapatkan gelar Doktor Pendidikan
PROGRAM STUDI PENELITIAN DAN EVALUASI PENDIDIKAN

PROGRAM PASCASARJANA
UNIVERSITAS NEGERI YOGYAKARTA
2020
ABSTRAK
LIAN G. OTAYA: Model Penilaian Pendidikan Profesi Guru (PPG) dengan

Penskoran Parsial dan Holistik. Disertasi. Yogyakarta: Program Pascasarjana,
Universitas Negeri Yogyakarta, 2019.
Penelitian ini bertujuan mengembangkan model penilaian PPG dengan

penskoran parsial dan holistik. Penelitian ini menggunakan model penelitian
Research and Development (R&D). Subjek penelitian pada uji coba tahap I
berjumlah 236 peserta dan uji coba tahap II berjumlah 516 peserta pada PPG
Prajabatan bersubsidi dan PPG Dalam Jabatan tahun akademik 2018/2019 yang
diselenggarakan LPTK Universitas Negeri Yogyakarta, Universitas Negeri
Gorontalo, dan UIN Alauddin Makassar. Teknik pengumpulan data menggunakan
focus group discussion, observasi, dan dokumentasi. Teknik analisis data yang
digunakan yaitu analisis validitas isi melalui Aiken V dan reliabilitas melalui
reliabilitas inter-rater, untuk membuktikan validitas konstruk melalui analisis
faktor konfirmatori, mengestimasi reliabilitas konstruk melalui reliabilitas
komposit, dan untuk menganalisis karakteristik item dan estimasi kemampuan
peserta PPG melalui analisis IRT politomus model Partial Credit Model dan
Graded Response Model, serta analisis fungsi informasi dan kesalahan baku
estimasi. Hasil penelitian dan pengembangan model penilaian ini menghasilkan
tiga konstruk instrumen yaitu: instrumen penilaian RPP, instrumen penilaian
pelaksanaan pembelajaran, serta instrumen penilaian kompetensi sosial dan
kompetensi kepribadian. Model penilaian PPG yang dikembangkan dengan
penskoran parsial dan holistik telah akurat dan terpercaya berdasarkan konstruk
instrumen yang dihasilkan, validitas isi dan reliabilitas instrumen melalui telaah
expert judgement telah memenuhi item-tem instrumen yang dikembangkan
berdasarkan substansial teoretiknya, validitas konstruk dan reliabilitas konstruk
menunjukkan seluruh instrumen pada model penilaian PPG valid dan reliabel
berdasarkan muatan-muatan faktornya. Instrumen model penilaian PPG baik
dengan penskoran parsial maupun penskoran holistik telah memiliki nilai
informasi yang memadai yang bergerak antara 10 hingga 19 dengan estimasi
kesalahan pengukuran yang relatif kecil yaitu sekitar 0,2 hingga 0,3. Hasil
penilaian dengan menggunakan instrumen model penilaian PPG menunjukkan
bahwa penilaian dengan penskoran parsial lebih akurat dibandingkan dengan
penilaian dengan penskoran holistik. Model penilaian telah memenuhi aspek
kepraktisan berdasarkan penilaian oleh pengguna yaitu mampu dipahami oleh
pengguna, dapat diterapkan di lapangan, relevansi dengan Program PPG, memberi
manfaat pada peserta PPG, efektif dan efisien dalam penggunaannya.
Kata kunci: Penilaian PPG, Penskoran Parsial, Penskoran Holistik
ii
ABSTRACT
LIAN G. OTAYA: A Model of the Teaching Profession Education (TPE)

Assessment with Partial and Holistic Scoring. Dissertation. Yogyakarta:
Graduate School, State University of Yogyakarta, 2019.
This study aimed to develop a model of the TPE assessment with partial
and holistic scoring. The study used a research and development (R&D) model
with subjects in the first stage try-out comprising 236 participants and those in the
second stage try-out involving 516 participants of the subsidized pre-service TPE
and the in-service TPE in the 2018/2019 academic year conducted by three
teacher training universities in Yogyakarta, Gorontalo, and Makassar. Data was
collected using focus group discussion, observation and documentation. The data
analyses included content validity analysis through Aiken V, reliability through
inter-rater reliability, proof of construct validity through confirmatory factor
analysis, construct reliability estimate through composite reliability, and analysis
of item characteristics and estimate of TPE participants’ capabilities through IRT
analyses with the polytomous, Partial Credit, and Graded Response models, as
well as analysis of the information function and standard error of the estimate.
The results of the assessment model produced three constructs of instruments,
namely a lesson plan assessment instrument, a learning implementation
assessment instrument, and a social competency and personality competency
assessment instrument. The TPE assessment model developed by partial and
holistic scoring was accurate and reliable based on the constructs of the developed
instruments. The instrument content validity and the reliability through the expert
judgment review fulfilled the developed instrument items based on the theoretical
substance. The construct validity and the construct reliability showed that all
instruments in the TPE assessment model were valid and reliable based on the
factor loadings. The TPE assessment model instruments with both partial and
holistic scoring had adequate information values ranging from 10 to 19 with
relatively small measurement error estimates of around 0.2 to 0.3. The results of
assessments using the TPE assessment model instruments indicated that that of
partial scoring was more accurate than that of holistic scoring. The assessment
model had fulfilled practicality aspects based on the assessments used by users
namely understandable for user, implementable in the field, relevant with the TPE
program, also effective and efficient in the usage.
Keywords: TPE Assessment, Partial Scoring, Holistic Scoring
iii
LEMBAR PENGESAHAN
MODEL PENILAIAN PENDIDIKAN PROFESI GURU (PPG)

DENGAI{ PENSKORAN PARSIAL DAN EOLISTIK
LIAN G. OTAYA
NIIM: l670t}6tffi2
Dipertahankan di depan Dewan penguji Disertasi

Program Pascasarjana Universitas Negeri yogyakarta
Tanggal: 13lanuan2020
DEWAN PENGUJI
Dr. Sugito, M.A.

(Ketua/Penguji)
Dr. Supnhar, M.Si.

(Sekretaris/Penguji)
6/z r zo2o
Prof. Dn Badrun Kartowagiran.
f= o.u
.
(PembimbingUtama/PenguJ| €
Prof. Dr. Heri Retr*weti, M,Pd.

(Pembimbing8enguji)
lt 12 / zozo
Prof. Zamroni, Ph.I).
(Penguji Utama) 7-v/\^- re{,')-,JLu,
Prof. Sulistyo Saputro, M.Si., Ph.I)

(Penguji Utama) li/l: w)a
,y''.usrDtKAnl Pascasa{ana
4
/"*'-"r--"ffi
8" liil:A4
195707191
KATA PENGANTAR
Memanjatkan puji dan syukur ke hadirat Allah swt., atas berkat limpahan
rahmat, taufiq, hidayah, dan inayah-Nya, sehingga disertasi ini dapat diselesaikan.
Disertasi ini bertujuan mengembangkan model penilaian Pendidikan Profesi Guru
(PPG) dengan peskoran parsial dan holistik.
Penyelesaian disertasi ini tidak terlepas dari bantuan dan dukungan dari
berbagai pihak. Dalam kesempatan ini, penulis menyampaikan ucapan terima
kasih yang tak terhingga kepada Bapak Prof. Dr. Badrun Kartowagiran, M.Pd.,
dan Ibu Prof. Dr. Heri Retnawati, M.Pd., selaku tim promotor dalam penyusunan
disertasi ini, yang dengan tulus hati telah memberikan bimbingan, arahan ataupun
masukan mulai dari pengajuan judul, penulisan proposal sampai dengan akhir
penyelesaian disertasi ini. Bimbingan, arahan dan masukan-masukan yang
membangun dan motivasi terus-menerus disertai dengan dukungan yang sangat
berharga telah memotivasi penulis menyelesaikan disertasi ini, sehingga secara
tulus dan penuh hormat penulis sampaikan ucapan terima kasih dan penghargaan
yang setinggi-tingginya teriring doa semoga kebaikan-kebaikannya selama
membimbing penulis mendapatkan balasan dari Allah swt. Selain itu penulis
menyampaikan ucapan terima kasih kepada:
1. Prof. Dr. Marsigit, MA., selaku Direktur Pascasarjana Universitas Negeri
Yogyakarta yang telah memberikan pengarahan, dorongan, masukan sehingga
disertasi ini dapat selesai.
2. Prof. Dr. Margana, M.Hum, M.A., selaku Wakil Rektor I sekaligus sebagai
penanggung jawab Program PPG di LPTK Universitas Negeri Yogyakarta

v
yang telah memberikan izin dan kemudahan dalam melakukan penelitian
disertasi.
3. Prof. Dr. Anik Ghufron, M.Pd., selaku Ketua LPPMP Universitas Negeri
Yogyakarta yang telah mengizinkan melakukan penelitian di P4TKN LPPMP
UNY.
4. Drs. Suyud, M.Pd., selaku Kepala P4TKN Universitas Negeri Yogyakarta,
Dr. Jusna Ahmad, M.Si., selaku Direktur PPG Universitas Negeri Gorontalo,
Dr. H. Muhammad Amri, Lc, M.Ag., selaku Dekan Fakultas Tarbiyah dan
Keguruan Universitas Islam Negeri Makassar sekaligus penanggung jawab
PPG yang telah memberikan izin dan kemudahan dalam melakukan penelitian
disertasi.
5. Kementerian Agama RI pada Direktorat Jenderal Pendidikan Islam yang telah
memberikan penulis kesempatan sebagai penerima Program Beasiswa 5000
Doktor Kementerian Agama RI Tahun 2016 pada Program Studi Penelitian
dan Evaluasi Pendidikan Pascasarjana Universitas Negeri Yogyakarta.
6. Dr. Lahaji, M.Ag., selaku Rektor IAIN Sultan Amai Gorontalo yang telah
memberikan kesempatan sangat berharga kepada penulis dapat melanjutkan
studi Program Doktor. Untuk semua bantuan, dorongan dan motivasi yang
diberikan penulis ucapkan terima kasih yang mendalam.
7. Prof. Dr. H. Kasim Yahiji, M.Ag, selaku Direktur Pascasarjana IAIN Sultan
Amai Gorontalo. Dukungan dan bantuan yang diberikan sangat bernilai dan
sulit terbalaskan.
vi
8. Dr. Lukman Arsyad, M.Pd., selaku Dekan Fakultas Ilmu Tarbiyah dan
Keguruan IAIN Sultan Amai Gorontalo, yang telah memfasilitasi dan
memberi dorongan moril kepada penulis mengikuti program doktor.
9. Dosen dan guru pamong/penguji UKIN yang telah bersedia sebagai subjek
penelitian dalam penelitian disertasi ini.
10. Segenap teman-teman mahasiswa Program Studi Penelitian dan Evaluasi
Pendidikan Pascasarjana Universitas Negeri Yogyakarta angkatan 2016 yang
memberikan dorongan untuk penulisan disertasi ini bisa terwujud.
11. Segenap teman-teman mahasiswa penerima Program beasiswa 5000 Doktor
Kementerian Agama R.I tahun 2016 Program Studi Penelitian dan Evaluasi
Pendidikan Pascasarjana Universitas Negeri Yogyakarta.
12. Segenap keluarga besar yang telah memberikan dukungan, motivasi, doa
restu dan senantiasa mendoakan keberhasilan penulis menyelesaikan program
doktor ini, serta tak lupa kolega-kolega lainnya yang tidak mungkin
disebutkan namanya satu persatu.
Semoga amal kebaikan bapak/ibu, teman-teman semua, dan terutama
keluarga mendapatkan pahala yang berlipat ganda dari Allah swt. Akhirnya
penulis berharap disertasi ini dapat memberi inspirasi, menjadi referensi dan
bermanfaat dalam pengembangan ilmu pengetahuan pada dunia akademik dan
masyarakat di masa kini dan masa datang.
Yogyakarta, Juli 2019

Lian G. Otaya
vii
PERI{YATAAN KEASLIAN
Yang bertanda tangan di bawah ini:
Nama Mahasiswa : Lian G. Otaya
Nomor Mahasiswa : 16701261002
Program Studi : Penelitian dan Evaluasi Pendidikan
Dengan ini menyatakan bahwa disertasi ini merupakan hasil karya saya sendiri
dan belum pernah diajukan untuk memperoleh gelar doktor di suatu perguuan
tinggi, dan sepanjang pengetahuan saya dalam disertasi ini tidak terdapat karya
atau pendapat yang pemah ditulis atau diterbitkan oleh orang lain kecuali yang
secara tertulis diacu dalam naskah ini dan disebutkan dalaln daftar pustaka.
Yogyakarta, Juli 2019

Yang Mernbuat Pemyataan,
Lian G. Otaya.
NIM. 1670t261002
vlll
DAFTAR ISI
HALAMAN JUDUL ............................................................................................ i
ABSTRAK .......................................................................................................... ii
ABSTRACT ....................................................................................................... iii
LEMBAR PENGESAHAN ................................................................................. iv
KATA PENGANTAR ......................................................................................... v
PERNYATAAN KEASLIAN ........................................................................... viii
DAFTAR ISI ...................................................................................................... ix
DAFTAR TABEL ............................................................................................. xii
DAFTAR GAMBAR ........................................................................................ xvi
DAFTAR LAMPIRAN ................................................................................... xxiii
BAB I PENDAHULUAN .................................................................................... 1
A. Latar Belakang Masalah .................................................................... 1
B. Identifikasi Masalah......................................................................... 19
C. Pembatasan Masalah ........................................................................ 20
D. Rumusan Masalah............................................................................ 22
E. Tujuan Pengembangan ..................................................................... 23
F. Manfaat Pengembangan ................................................................... 24
G. Asumsi Pengembangan .................................................................... 25
H. Spesifikasi Produk yang Dikembangkan .......................................... 26
BAB II KAJIAN PUSTAKA ............................................................................. 28
A. Kajian Teori..................................................................................... 28
1. Pendidikan Profesi Guru (PPG) ................................................. 28
ix
2. Sistem dan Prinsip Pembelajaran Pendidikan Profesi Guru ........ 35
3. Standar Pendidikan Profesi Guru (PPG) .................................... 43
4. Sistem Penilaian Pendidikan Profesi Guru (PPG) ...................... 53
5. Performance Assessment ........................................................... 82
6. Penskoran Parsial, Holistik dan Perbandingannya ...................... 86
7. Teori Respons Butir dan Penerapannya ................................... 101
B. Kajian Penelitian yang Relevan ..................................................... 138
C. Kerangka Pikir ............................................................................... 145
D. Pertanyaan Penelitian..................................................................... 148
BAB III METODE PENELITIAN ................................................................... 149
A. Model Pengembangan .................................................................... 149
B. Prosedur Pengembangan ................................................................ 152
C. Desain Uji Coba Produk ................................................................ 155
1. Desain Uji Coba ...................................................................... 155
2. Subjek Uji Coba ...................................................................... 160
3. Teknik dan Instrumen Pengumpulan Data ............................... 166
4. Teknik Analisis Data ............................................................... 167
BAB IV HASIL PENELITIAN DAN PENGEMBANGAN ............................. 173
A. Hasil Pengembangan Produk Awal ................................................ 173
B. Hasil Ujicoba Produk ..................................................................... 188
C. Revisi Produk ................................................................................ 269
x
D. Kajian Produk Akhir ...................................................................... 369
E. Keterbatasan Penelitian .................................................................. 422
BAB V SIMPULAN DAN SARAN ................................................................. 428
A. Simpulan tentang Produk ............................................................... 426
B. Saran Pemanfaatan Produk ............................................................ 428
C. Diseminasi dan Pengembangan Produk Lebih Lanjut ..................... 429
DAFTAR PUSTAKA ...................................................................................... 431
xi
DAFTAR TABEL
Hal
Tabel 1. Kelompok Mata Kegiatan PPG Prajabatan .................................. 50
Tabel 2. Kelompok Mata Kegiatan PPG Daljab ........................................ 51
Tabel 3. Bobot Penilaian Akhir PPL ......................................................... 56
Tabel 4. Rambu-Rambu Ujian Tulis LPTK (UTL) .................................... 57
Tabel 5. Kompetensi Pedagagik, Subkompetensi, dan Indikatornya .......... 66
Tabel 6. Kompetensi Profesional, Subkompetensi, dan Indikatornya......... 70
Tabel 7. Kompetensi Kepribadian, Subkompetensi, dan Indikatornya ....... 76
Tabel 8. Kompetensi Sosial, Subkompetensi, dan Indikatornya ................. 80
Tabel 9. Subjek Uji Coba .......................................................................... 163
Tabel 10. Pengkategorian Validitas Isi Instrumen Penilaian RPP ................ 182
Tabel 11. Pengkategorian Validitas Isi Instrumen Penilaian PP ................... 184
Tabel 12. Pengkategorian Validitas Isi Instrumen Penilaian KSKK ............ 185
Tabel 13. Pengkategorian Validitas Isi Panduan Model Penilaian PPG ....... 187
Tabel 14. Hasil Estimasi Reliabilitas dengan Inter-Rater............................. 188
Tabel 15. Muatan Faktor Variabel Observasi pada Instrumen Penilaian
RPP Penskoran Parsial untuk Penilai Dosen ................................ 205
RPP Penskoran Parsial Penilai Guru pamong/penguji
UKIN .......................................................................................... 207
RPP Penskoran Holistik untuk Penilai Dosen .............................. 208
RPP Penskoran Holistik Penilai Guru pamong/penguji
UKIN .......................................................................................... 209
Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai
Dosen ......................................................................................... 211
Guru pamong/penguji UKIN ....................................................... 212
Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai
Dosen ......................................................................................... 213
xii
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran
Parsial Penilai Dosen .................................................................. 216
Parsial Penilai Guru pamong/penguji UKIN ................................ 217
KSKK Penskoran Holistik untuk Penilai Dosen .......................... 218
Holistik untuk Penilai Guru pamong/penguji UKIN .................... 219
Tabel 27. Hasil Analisis Karakteristik Item Instrumen Penilaian RPP
Penskoran Pasial untuk Penilai Dosen ......................................... 221
Penskoran Pasial Penilai Guru pamong/penguji UKIN ................ 226
Penskoran Holistik Penilai Dosen................................................ 230
Penskoran Holistik Penilai Guru pamong/penguji UKIN ............. 234
Tabel 31. Hasil Analisis Karakteristik Item Instrumen Penilaian
Pelaksanaan Pembelajaran (PP) Penskoran Pasial Penilai
Dosen ......................................................................................... 238
Pelaksanaan Pembelajaran (PP) Penskoran Pasial Penilai
Pelaksanaan Pembelajaran Penskoran Holistik Penilai
Dosen ......................................................................................... 246
Pelaksanaan Pembelajaran Penskoran Holistik Penilai
Kompetensi Sosial dan Kompetensi Kepribadian (KSKK)
Penskoran Pasial Penilai Dosen ................................................... 254
xiii
Pasial Penilai Guru pamong/penguji UKIN ................................. 258
Pembelajaran Penskoran Holistik Penilai Dosen .......................... 262
Holistik Penilai Guru pamong/penguji UKIN .............................. 266
RPP Penskoran Parsial untuk Penilai Dosen pada Uji Coba II ..... 290
RPP Penskoran Parsial untuk Penilai Guru pamong/penguji
UKIN pada Uji Coba II ............................................................... 292
RPP Penskoran Holistik untuk Penilai Dosen pada Uji Coba II ... 293
RPP Penskoran Holistik Penilai Guru pamong/penguji UKIN
pada Uji Coba II.......................................................................... 295
Tabel 43. Muatan Faktor Variabel Observasi pada Instrumen
Penilaian Pelaksanaan Pembelajaran (PP) Penskoran Parsial
untuk Penilai Dosen pada Uji Coba II ......................................... 297
Guru pamong/penguji UKIN pada Uji Coba II ............................ 298
Dosen pada Uji Coba II ............................................................... 300
Pelaksanaan Pembelajaran (PP) Penskoran Holistik untuk Penilai
Guru pamong/penguji UKIN pada Uji Coba II ............................ 301
Parsial untuk Penilai Dosen pada Uji Coba II .............................. 303
Parsial untuk Penilai Guru pamong/penguji UKIN ...................... 305
Holistik Penilai Dosen ................................................................ 306
xiv
Holistik Penilai Guru pamong/penguji UKIN .............................. 308
RPP Penskoran Parsial untuk Penilai Dosen ............................... 310
RPP Penskoran Pasial untuk Penilai Guru pamong/penguji UKIN 317
Penskoran Holistik untuk Penilai Dosen ...................................... 320
Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN .... 324
Pelaksanaan Pembelajaran (PP) Penskoran Pasial untuk Penilai
Dosen ......................................................................................... 230
Tabel 56. Hasil Analisis Karakteristik Item Instrumen Penilaian Pelaksanaan
Pembelajaran (PP) Penskoran Pasial untuk Penilai Guru pamong/
penguji UKIN ............................................................................. 335
Pelaksanaan Pembelajaran Penskoran Holistik untuk Penilai
Dosen ......................................................................................... 344
Pelaksanaan Pembelajaran Penskoran Holistik Penilai Guru
pamong/penguji UKIN ................................................................ 350
Tabel 59. Hasil Analisis Karakteristik Item Instrumen Penilaian Kompetensi
Sosial dan Kompetensi Kepribadian (KSKK) Penskoran Pasial
Penilai Dosen .............................................................................. 353
Pembelajaran Penskoran Holistik untuk Penilai Dosen ................ 360
Holistik untuk Penilai Guru pamong/penguji UKIN .................... 360
Tabel 62. Perbandingan Akurasi Model Penilaian dengan Penskoran
Parsial dengan Model Penilaian dengan Penskoran Holistik ........ 402
xv
DAFTAR GAMBAR
Hal
Gambar 1. Proses Penyelenggaraan PPG ................................................. 48
Gambar 2. Mata Kegiatan PPG Prajabatan ............................................... 49
Gambar 3. Mata Kegiatan PPG Dalam Jabatan ........................................ 50
Gambar 4. Teknik Penilaian Kualitas Proses dan Hasil Belajar PPG ........ 57
Gambar 5. Domain Model Penilaian Guru .............................................. 85
Gambar 6. Contoh Kurva Karakteristik Butir Model Logistik 1 Parameter 110
Gambar 7. Kurva Karakteristik Butir Untuk Model Logistik 2 Parameter 112
Gambar 8. Kurva Karakteristik Butir Untuk Model Logistik 3 Parameter 113
Gambar 9. Operating Characteristic Curves (OCF) untuk lima kategori .. 123
Gambar 10. Category Response Curves (CRF) untuk lima kategori ........... 123
Gambar 11. Fungsi Informasi .................................................................... 125
Gambar 12. Grafik fungsi informasi tes ..................................................... 130
Gambar 13. Fungsi informasi tes ............................................................... 133
Gambar 14. Grafik CRF untuk 2 kategori .................................................. 135
Gambar 18. Hubungan timbal balik antara NIF dengan SEM ..................... 137
Gambar 19. Kerangka Pikir ....................................................................... 147
Gambar 20. Alur Pengembangan Model R & D ......................................... 150
Gambar 21. Prosedur Pengembangan Model Penilaian PPG ...................... 154
Gambar 22. Konstruk Penilaian Rencana Pelaksanaan Pembelajaran (RPP) 175
Gambar 23. Konstruk Penilaian Pelaksanaan Pembelajaran (PP)................ 178
Gambar 24. Konstruk Penilaian Kompetensi Sosial Kepribadian (KSKK) . 180
Gambar 25. Kurva Karakteristik Item 10 dari Instrumen Penilaian RPP
Penskoran Parsial untuk Penilai Dosen ................................... 223
Gambar 26. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai
Dosen ..................................................................................... 224
Gambar 27. Hubungan timbal balik antara NIF dengan SEM Instrumen
Penilaian RPP Penskoran Parsial Penilai Dosen ...................... 225
xvi
Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN . 227
Guru Pamong/Penguji UKIN .................................................. 228
Penilaian RPP Penskoran Parsial Penilai Guru pamong/
penguji UKIN ......................................................................... 229
Penskoran Holistik untuk Penilai Dosen ................................. 231
Gambar 32. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai
Dosen ..................................................................................... 232
Penilaian RPP Penskoran Holistik untuk Penilai Dosen .......... 233
Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN 235
Penilaian RPP Penskoran Holistik untuk Guru pamong/
penguji UKIN ......................................................................... 237
Gambar 37. Kurva Karakteristik Item 4 dari Instrumen Penilaian
Pelaksanaan Pembelajaran Penskoran Parsial untuk Penilai
Dosen ..................................................................................... 239
Gambar 38. Fungsi Informasi Instrumen PP Penskoran Parsial Penilai
Dosen ..................................................................................... 240
untuk Penilai Dosen ................................................................ 241
Pelaksanaan Pembelajaran (PP) Penskoran Parsial untuk
Penilai Guru pamong/penguji UKIN ....................................... 243
Gambar 41. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran
Penskoran Parsial Penilai Guru Pamong/Penguji UKIN .......... 244
Penilaian Pelaksanaan Pembelajaran Penskoran Parsial untuk
Dosen ..................................................................................... 247
xvii
Instrumen Pelaksanaan Pembelajaran (PP) Penskoran
Holistik Penilai Dosen ............................................................ 249
Pelaksanaan Pembelajaran (PP) Penskoran Holistik untuk
Penskoran Holistik Penilai Guru Pamong/Penguji UKIN ........ 252
Guru pamong/penguji UKIN .................................................. 253
Penskoran Parsial Penilai Dosen ............................................. 255
Gambar 50. Fungsi Informasi Instrumen KSKK Penskoran Parsial Penilai
Dosen ..................................................................................... 256
Penilaian Kompetensi Sosial dan Kompetensi Kepribadian
(KSKK) Penskoran Parsial Penilai Dosen ............................... 257
KSKK Penskoran Parsial untuk Penilai Guru pamong/penguji
UKIN ..................................................................................... 259
Penilaian KSKK Penskoran Parsial untuk Penilai
Gambar 55. Kurva Karakteristik Item 9 dari Instrumen Penilaian KSKK
Gambar 56. Fungsi Informasi Instrumen KSKK Penskoran Holistik Penilai
Dosen ..................................................................................... 264
Penilaian KSKK Penskoran Holistik untuk Penilai Dosen....... 265
KSKK Penskoran Holistik untuk Penilai Guru pamong/
penguji UKIN ......................................................................... 267
xviii
Gambar 59. Fungsi Informasi Instrumen KSKK Penskoran Holistik
Penilai Guru Pamong/Penguji UKIN ...................................... 268
Penilaian KSKK Penskoran Holistik untuk Penilai Guru
pamong/penguji UKIN .......................................................... 269
Penskoran Parsial untuk Penilai Dosen ................................... 312
Dosen ..................................................................................... 313
Penilaian RPP Penskoran Parsial untuk Penilai Dosen ............ 313
Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN . 320
Penilaian RPP Penskoran Parsial untuk Penilai Guru pamong/
penguji UKIN ......................................................................... 318
Dosen ..................................................................................... 322
Penilaian RPP Penskoran Holistik untuk Penilai Dosen .......... 323
Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN 325
Penilaian RPP Penskoran Holistik untuk Penilai
Pelaksanaan Pembelajaran Penskoran Parsial untuk Penilai
Dosen ..................................................................................... 331
xix
Penilaian Pelaksanaan Pembelajaran Penskoran Parsial untuk
Penilai Dosen ......................................................................... 333
Pelaksanaan Pembelajaran (PP) Penskoran Parsial untuk
Dosen ..................................................................................... 341
Penskoran Holistik Penilai Dosen ........................................... 342
Penilaian Pelaksanaan Pembelajaran (PP) Penskoran Holistik
Penilai Dosen ......................................................................... 343
Penilaian Pelaksanaan Pembelajaran (PP) Penskoran Holistik
Gambar 86. Fungsi Informasi Instrumen Kompetensi Sosial dan
Kompetensi kepribadian Penskoran Parsial Penilai Dosen ...... 352
(KSKK) Penskoran Parsial Penilai Dosen ............................... 353
Penskoran Parsial Penilai Guru pamong/penguji UKIN .......... 356
xx
(KSKK) Penskoran Parsial Penilai Guru pamong/penguji
UKIN ..................................................................................... 358
Kompetensi Sosial Kepribadian (KSKK) Penskoran Holistik
Penilai Dosen ......................................................................... 361
Gambar 92. Fungsi Informasi Instrumen Kompetensi Sosial dan
Kepribadian Penskoran Holistik Penilai Dosen ....................... 362
PenilaianKompetensi Sosial Kepribadian (KSKK)
Penskoran Holistik Penilai Dosen ........................................... 363
Kompetensi Sosial Kepribadian Penskoran Holistik
Gambar 95. Fungsi Informasi Instrumen kompetensi sosial dan kompetensi
kepribadian Penskoran Holistik Penilai Guru Pamong/Penguji
UKIN ..................................................................................... 366
Penilaian Kompetensi Sosial Kepribadian Penskoran Holistik
Gambar 97. Hasil Penilaian Buku Panduan Model Penilaian PPG.............. 383
Gambar 98. Sebaran Daya Beda Item Instrumen Penilaian RPP ................. 395
Gambar 99. Sebaran Daya Beda Instrumen Penilaian Pelaksanaan
Pembelajaran .......................................................................... 396
Gambar 100. Sebaran Daya Beda Instrumen Kompetensi Sosial
Kepribadian ............................................................................ 397
Gambar 101. Fungsi Informasi Instrumen Model Penilaian PPG ................. 400
Gambar 102. Standard Error of Measurement Instrumen Model Penilaian .. 400
Gambar 103. Profil Kemampuan Menyusun RPP untuk Peserta LPTK UNY 405
Gambar 104. Profil Kemampuan Menyusun RPP untuk Peserta LPTK UNG 406
Gambar 105. Profil Kemampuan Menyusun RPP untuk Peserta LPTK
UINAM .................................................................................. 407
Gambar 106. Profil Kemampuan Pelaksanaan Pembelajaran Peserta LPTK
UNY ...................................................................................... 408
xxi
UNG ...................................................................................... 408
UINAM .................................................................................. 409
Gambar 109. Profil Kompetensi Sosial Kepribadian untuk Peserta LPTK
UNY ...................................................................................... 410
UNG ...................................................................................... 411
UINAM .................................................................................. 412
Gambar 112. Hasil Penilaian Kepraktisan Model Penilaian Oleh Pengguna . 419
xxii
DAFTAR LAMPIRAN
Hal
Lampiran 1. Kisi-Kisi Instrumen Penilaian PPG ....................................... 449
Lampiran 2. Hasil Penilaian Expert Judgement dan Pengujian Kecukupan
Sampel ................................................................................. 459
Lampiran 3. Hasil Pembuktian Validitas Konstruk Uji Coba I .................. 466
Lampiran 4. Hasil Estimasi Reliabilitas Uji Coba I................................... 478
Lampiran 5. Karakteristik Instrumen Penilaian PPG Uji Coba I ............... 490
Lampiran 6. Hasil Pembuktian Validitas Konstruk Uji Coba II ................ 542
Lampiran 7. Hasil Estimasi Reliabilitas Uji Coba II ................................. 554
Lampiran 8. Karakteristik Instrumen Penilaian PPG Uji Coba II .............. 566
Lampiran 9. Hasil Penilaian PPG ............................................................ 618
Lampiran 10. Instrumen Penilaian Kepraktisan Model Penilaian PPG
Dengan Penskoran Parsial Dan Holistik ............................... 644
Lampiran 11. Hasil Penilaian Kepraktisan Model Penilaian PPG
Dengan Penskoran Parsial Dan Holistik ............................... 645
Lampiran 12. Rekomendasi Izin Penelitian ............................................... 647
xxiii
BAB I
PENDAHULUAN
A. Latar Belakang Masalah
Pendidikan merupakan aktivitas kompleks melibatkan sejumlah komponen
yang saling berinteraksi ataupun interdepensi satu sama lain secara fungsional
dalam satu kesatuan yang terpadu sebagai komponen sentral. Komponen sentral
yang memengaruhi kualitas pendidikan yaitu guru, peserta didik dan tujuan
pendidikan. Terwujudnya tujuan pendidikan sangat tergantung dari segala bentuk
interaksi yang terjadi antara guru dan peserta didik, dan hal ini hanya menjadi
slogan atau pencitraan jika tidak didukung oleh kualitas guru.
Kualitas guru dipandang sebagai faktor paling berpengaruh terhadap
kualitas pendidikan. Banyak temuan menunjukkan baik buruknya kualitas
pendidikan sangat ditentukan oleh kualitas guru (Bahcivan & Cobern, 2016;
Gerritsen, Plug, & Webbink, 2017; Kartowagiran, 2012a; Le Cornu, 2016;
Retnawati, Apino, & Anazifa, 2018). Beberapa studi juga ditemukan bahwa ada
hubungan yang kuat antara apa yang dilakukan guru dengan pencapaian hasil
belajar peserta didik. Jika guru berkinerja tinggi, maka cenderung peserta
didiknya juga memiliki prestasi belajar yang tinggi, sehingga upaya meningkatkan
prestasi belajar peserta didik salah satunya melalui perbaikan kinerja guru (Fahmi,
Maulana, & Yusuf, 2011; Steinberg & Garrett, 2016; Stronge, 2018; Sulisworo,
Nasir, & Maryani, 2017; Suswantar & Retnawati, 2016). Oleh karena itu, penting
untuk memperbaiki faktor-faktor yang memengaruhi kualitas guru.
1
Kualitas guru hingga saat ini tetap menjadi perhatian global semua negara
di dunia dan menjadi isu-isu penting untuk terus diupayakan peningkatannya. Hal
ini tidak lepas dari kritik dan konsensus berbagai kalangan, baik pemerhati
pendidikan, peneliti dan pembuat kebijakan yang mempertanyakan kualitas guru
sesuai dengan standar yang diharapkan dan tentunya membutuhkan kesadaran diri
dari para guru untuk selalu mengembangkan kemampuannya menjadi seorang
guru yang berkualitas (Creemers, Kyriakides, & Antoniou, 2012; Gareis & Grant,
2014; Good, 2008; Goodwin, 2010; Rabadi-Raol, 2019; Zhu, Goodwin, & Zhang,
2017). Hal ini menunjukkan kualitas guru di berbagai negara termasuk Indonesia,
menjadi sebuah keniscayaan untuk ditingkatkan dalam mencapai kualitas
pembelajaran dan keberhasilan peserta didik dalam belajar.
Kualitas pembelajaran dan prestasi peserta didik di Indonesia berdasarkan
perkembangan terkini berada pada kondisi gawat darurat. Hal ini didukung oleh
data hasil pemetaan oleh Kemendikbud terhadap 40.000 sekolah pada tahun 2012
terdapat 75% sekolah di Indonesia tidak memenuhi standar layanan pendidikan,
hasil uji kompetensi guru tahun 2012 terhadap 460.000 guru hanya mencapai nilai
rata-rata 44,5 dari standar yang diharapkan pada nilai 70. Hasil pemetaan akses
dan mutu pendidikan pada tahun 2013 dan 2014 oleh The Learning Curve-
Pearson posisi Indonesia 10 negara berkinerja rendah. Hasil pemetaan mutu
pendidikan tinggi oleh 21 Universitas tahun 2013 Indonesia berada pada peringkat
49 dari 50 negara. Jika dilihat dari data hasil uji kompetensi guru tahun 2015
terhadap 2.430.427 guru di Indonesia secara nasional belum mencapai target yang
diharapkan dengan nilai rata-rata 55 yaitu hanya 53,05, yang diperoleh dari nilai
2
rata-rata kemampuan profesional 54,77 dan nilai rata-rata kompetensi pedagogik
49.84. Dari 34 Provinsi hanya ada 7 Provinsi yang mencapai nilai rata-rata
nasional, yaitu Provinsi D.I Yogyakarta (62,48), Jawa Tengah (59,10), DKI
Jakarta (58,44), Jawa Timur (56,73), Bali (56,13), Bangka Belitung (55,13), dan
Jawa Barat (55,05), rata-rata terendah hanya mencapai 41,96 untuk Provinsi di
luar Jawa (Baswedan, 2014; Bhakti & Maryani, 2017).
Permasalahan lain yang dihadapi adalah adanya disparitas antara kuantitas
dan kualitas guru di Indonesia. Hal ini dibuktikan dari beberapa hasil studi
menunjukkan: 1) terdapat ketidakmerataan distribusi guru terutama pada sekolah-
sekolah di daerah terpencil masih sangat kekurangan guru, 2) banyak guru yang
mengajar tidak sesuai dengan kualifikasi pendidikannya, 3) masih rendahnya
penguasaan kompetensi guru (Fahdini, Mulyadi, Suhandani, & Julia, 2014; Fahmi
et al., 2011; Krisna, 2017; Mangkunegara & Puspitasari, 2015). Permasalahan ini
juga berbanding lurus dengan hasil survei Program for international student
assessment (PISA) tahun 2015 yang diumumkan pada 6 Desember 2016,
Indonesia berada pada peringkat ke-64 dari 72 negara yang disurvei. Demikian
halnya hasil survey yang dilakukan Progress in International Reading Literacy
Study (PIRLS) dan Trend in International Mathematics and Science Study
(TIMMS) juga tidak menaikkan peringkat Indonesia. Bahkan setiap terjadi
penyimpangan moral di kalangan peserta didik, guru dianggap tidak profesional
dalam mendidik (Antoro, 2017: 9). Data ini menunjukkan permasalahan
pendidikan di Indonesia sangat fundamental dan urgen membutuhkan solusi
penanganan yang serius.
3
Solusi mengatasi permasalahan guru tersebut, tidak terlepas dari
peningkatan kualifikasi dan kompetensi yang dipersyaratkan secara utuh dan
terpadu sebagai guru profesional. Idealnya guru harus memiliki kualifikasi
akademik yang relevan dengan mata pelajaran yang diampunya dan memiliki
berbagai cara untuk memperkaya pengetahuannya tentang materi yang diajarkan.
Selain itu, guru harus memiliki kemampuan yang memadai untuk melakukan
transformasi pembelajaran dalam mencapai efektivitas pengajaran dan
meningkatkan keberhasilan peserta didik dalam belajar (Gerdeman, Garrett, &
Monahan, 2018; Kartowagiran, 2010; McDiarmid & Caprino, 2017; Vangrieken,
Meredith, Packer, & Kyndt, 2017). Artinya untuk menjadi seorang guru, penting
meningkatkan kualifikasi dan kompetensinya dengan melakukan berbagai inovasi
dan terobosan dalam pengembangan profesionalismenya secara terus-menerus.
Berbagai kebijakan telah diambil pemerintah Indonesia dalam
meningkatkan kualifikasi dan kompetensi guru. Salah satunya melalui Program
Pendidikan Profesi Guru (PPG) yang diyakini akan memperbaiki dan
meningkatkan kualitas guru/calon guru di Indonesia. Seiring pemantapan
kebijakan Program PPG tersebut, Pemerintah telah menetapkan berbagai
peraturan pendukung diantaranya melalui Peraturan Menteri Riset, Teknologi dan
Pendidikan Tinggi Republik Indonesia Nomor 55 tahun 2017 tentang Standar
Pendidikan Guru (Standardikgu) yang mengatur sertifikasi atau pemberian
sertifikat pendidik sebagai bukti formal pengakuan kepada guru menjadi tenaga
profesional melalui Program PPG. Sebagaimana disebutkan pada Bab I Pasal 1 (5)
bahwa: “Program Pendidikan Profesi Guru yang selanjutnya disebut program PPG
4
adalah program pendidikan yang diselenggarakan setelah program sarjana atau
sarjana terapan untuk mendapatkan sertifikat pendidik pada pendidikan anak usia
dini jalur pendidikan formal, pendidikan dasar, dan/atau pendidikan menengah”.
Hal ini mempertegas bahwa untuk menjadi seorang guru, lulusan sarjana wajib
mengikuti Program PPG dan jika dinyatakan lulus diberikan sertifikat pendidik.
Program PPG di Indonesia merupakan salah satu upaya pemerintah dalam
merespon berbagai permasalahan pendidikan secara nasional, seperti: 1) shortage,
adanya kekurangan jumlah guru khususnya di daerah terluar, terdepan, dan
tertinggal, 2) unbalanced distribution (distribusi tidak seimbang), 3) under
qualification (kualifikasi di bawah standar), 4) low competence atau guru-guru
yang kurang kompeten, serta 5) missmatched, ketidak sesuaian antara kualifikasi
pendidikan dengan bidang yang diampu (Kemenristekdikti, 2017, 2018b). Hal ini
juga didukung dengan beberapa pendapat yang menyatakan bahwa pendidikan
profesi bagi guru dapat membantu mereka menguasai materi dan mendukung
kesiapannya menjadi guru profesional (Gerdeman et al., 2018; Hotimah &
Suyanto, 2017; Robertson, 2017; Wahyudin, 2016). Dengan demikian untuk
menjadi guru profesional penting mengikuti Program PPG.
Program PPG dalam penyelenggaraannya terbagi menjadi dua bentuk yaitu
PPG prajabatan yang diselenggarakan untuk mempersiapkan lulusan S1
Kependidikan dan S1/DIV nonkependidikan yang memiliki bakat dan minat untuk
menjadi guru. Bentuk kedua adalah PPG dalam jabatan yang diselenggarakan
untuk guru pegawai negeri sipil dan guru bukan pegawai negeri sipil yang sudah
mengajar pada satuan pendidikan. Pada tahun 2018 mengembangkan
5
pembelajaran PPG menggunakan Hybrid Learning yang terdiri dari pembelajaran
tatap muka dan pembelajaran dalam jaringan (daring) melalui aplikasi
Brightspace pada PPG dalam jabatan mulai dari instruktur menyiapkan materi
perkuliahan, mengelola forum diskusi, melakukan video conference dengan
mahasiswa/peserta PPG, memberikan tugas dan tes hingga mengevaluasinya
(Kemenristekdikti, 2018a, 2018b; Pamungkas, Novalitasari, Setiani, & Yuhana,
2019). Hal ini mengindikasikan untuk memperoleh sertifikat pendidik bagi
lulusan S1/DIV kependidikan dan non kependidikan dapat memilih PPG
prajabatan dan bagi guru yang sudah mengajar dapat mengikuti PPG dalam
jabatan yang diselenggarakan oleh Rayon Lembaga Pendidikan Tenaga
Kependidikan (LPTK).
LPTK adalah perguruan tinggi yang diberi tugas oleh pemerintah untuk
menyelenggarakan Program PPG, baik itu di lingkungan Kementerian Riset
Teknologi dan Pendidikan Tinggi (Kemenristekdikti) maupun Kementerian
Agama. LPTK di lingkungan Kemenristekdikti yang menyelenggarakan program
studi PPG Prajabatan ada 45 Universitas dari 27 Provinsi dan untuk tahun 2017
LPTK penyelenggara Program PPG Prajabatan SM3T ada 23 universitas baik
negeri maupun swasta (Kemenristekdikti, 2017b). Khusus Provinsi Daerah
Istimewa (DI) Yogyakarta terdapat 4 LPTK yaitu Universitas Negeri Yogyakarta
(UNY), Universitas PGRI Yogyakarta, Universitas Sanata Dharma dan
Universitas Sarjanawiyata Tamansiswa. Dari keempat rayon LPTK tersebut,
LPTK UNY merupakan LPTK terbanyak pesertanya setiap tahun dengan 24
Program Studi diantaranya: Bimbingan Konseling, Pendidikan Guru Anak Usia
6
Dini (PAUD), Pendidikan Guru SD (PGSD), Pendidikan Luar Biasa, Bahasa
Indonesia, Bahasa Inggris, Pendidikan Kesejahteraan Keluarga, Pendidikan
Pancasila dan Kewarganegaraan, Pendidikan Jasmani, Kesehatan dan Olahraga
(PJKR), Pendidikan Sejarah, Ekonomi, Akuntansi, Sosiologi, Geografi, IPS, IPA,
Biologi, Fisika, Kimia, Teknik Mesin, Teknik Otomotif (P4TKN, 2018).
Penyelenggaraan PPG pada LPTK di lingkungan Kementerian Agama,
kebijakannnya dilaksanakan tahun 2012 dengan kewenangan menyelenggarakan
PPG dalam Jabatan untuk program studi mata pelajaran rumpun keagamaan pada
madrasah (Fikih/Usul Fikih, Akidah Akhlak, Qur’an Hadis, Sejarah Kebudayaan
Islam pada Madrasah Ibtidaiyah (MI), Madrasah Tsanawiyah (MTs) dan
Madrasah Aliyah (MA), guru mata pelajaran Bahasa Arab pada Madrasah dan
guru mata pelajaran Pendidikan Agama Islam di sekolah, namun terdapat
beberapa Perguruan Tinggi Keagamaan Islam Negeri (PTKAIN) diberi peluang
untuk mempersiapkan program studi PPG mata pelajaran umum. Berdasarkan
Surat Keputusan Direktur Jenderal Pendidikan Islam Nomor 1909/2012
ditetapkan 13 LPTK penyelenggara PPG yaitu: Universitas Islam Negeri (UIN)
Syarif Hidayatullah Jakarta, UIN Sunan Kalijaga Yogyakarta, UIN Syarif Kasim
Riau, UIN Sunan Gunung Djati Bandung, UIN Alauddin Makassar, UIN Sunan
Ampel Surabaya, UIN Ar-Raniry Aceh, Institut Agama Islam Negeri (IAIN)
Raden Fatah Palembang, IAIN Sumatera Utara, IAIN Walisongo Semarang yang
saat ini telah menjadi UIN Walisongo Semarang, IAIN Raden Intan Lampung,
IAIN Mataram yang saat ini telah menjadi UIN Mataram, dan Sekolah Tinggi
7
Agama Islam Negeri (STAIN) Jember yang saat ini telah menjadi IAIN Jember
(Fuadi, Sudjanto, & Kamaluddin, 2018; Kemenag, 2012).
Penyelenggaraan Program PPG di LPTK lingkungan Kemenristekdikti
maupun di lingkungan Kementerian Agama tersebut, mengacu pada struktur
kurikulum PPG yang dilaksanakan melalui lokakarya pengembangan perangkat
pembelajaran disertai dengan implementasi pembelajaran dalam bentuk peer
teaching dan dilanjutkan dengan praktik pengalaman lapangan (PPL) dan uji
kompetensi mahasiswa PPG (UKMPPG), substansi kurikulum PPG mengacu
pada tuntutan kompetensi guru, yakni kompetensi pedagogik, profesional,
kepribadian dan sosial (Fauzan & Bahrissalim, 2017; Pamungkas et al., 2019;
Prasojo, Wibowo, & Hastutiningsih, 2017). Dengan demikian penyelenggaraan
PPG di LPTK meliputi kegiatan perkuliahan teori dan praktik tatap muka atau
daring bagi PPG daljab, lokakarya perangkat pembelajaran, PPL dan UKMPPG.
Penyelenggaraan PPG di berbagai LPTK dipengaruhi oleh suatu sistem
penyelenggaraan yang keberhasilannya sangat tergantung pada berbagai
komponen sistem didalamnya, diantaranya sistem penerimaan peserta, kurikulum,
pembelajaran, penilaian, dan penjaminan mutu Program PPG. Berbagai penelitian
telah dilakukan terkait dengan penyelenggaraan PPG diantaranya penelitian di
LPTK UNY pada 255 mahasiswa kependidikan Fakultas Ekonomi UNY terdiri
dari angkatan 2012 dan 2013 ditemukan sebagian besar (50,20%) mahasiswa
ragu-ragu terhadap penerimaan/penyerapan mereka tentang Program PPG, begitu
pula dengan evaluasi atau penilaian mereka terhadap Program PPG sebanyak
48,23% menyatakan ragu-ragu (Indriyani & Ismandari, 2015). Hasil penilaian
8
peserta PPG SM-3T Prodi PPKN Unesa terhadap pelaksanaan Program PPG
tahun 2013 menunjukkan bahwa kemampuan peserta PPG dalam menyusun
perangkat evaluasi berada pada kategori kurang baik (Anita & Rahman, 2013).
Hasil penelitian terkait evaluasi program PPG Pendidikan Agama Islam di
UIN Sunan Kalijaga Yogyakarta tahun 2016 menunjukkan sebagian peserta PPG
mengeluhkan tentang padatnya kegiatan PPG dan juga banyaknya materi yang
harus dikuasai, tugas yang tidak terselesaikan tepat waktu, lamanya waktu jeda
antar kegiatan satu dengan kegiatan lainnya serta banyaknya laporan yang harus
dibuat oleh peserta PPG. Penelitian di LPTK Universitas Negeri Semarang pada
Program PPG SM3T guru geografi, ditemukan perbedaan bentuk perangkat
pembelajaran yang dipelajari saat workshop SSP dengan yang ada di lapangan,
terdapat beberapa peserta PPG yang harus menjalani ujian tulis nasional (UTN)
ulang karena nilainya dibawah standar yaitu 60 (Ningsih, Fatchan, & Susilo,
2016).
Berdasarkan hasil penelitian terkait analisis kesalahan perangkat
pembelajaran mahasiswa Program PPG Prodi Pendidikan Bahasa dan Sastra
Indonesia Universitas Sanata Dharma Yogyakarta tahun 2018 ditemukan ada
sejumlah kesalahan dalam penyusunan RPP mahasiswa PPG Prodi diantaranya: 1)
kurang cermatnya rumusan tujuan pembelajaran, 2) kurang paham dalam
menentukan jenis materi pembelajaran yang mengarah pada metakognitif, 3)
kurang bervariasinya bentuk penilaian yang disusun (Dewi, 2018). Namun
berdasarkan kajian tentang investigasi persepsi, interaksi dan capaian mahasiswa
PPG dalam jabatan pada platform pembelajaran Brightspace terhadap 29
9
mahasiswa Program Studi Matematika di Universitas Ageng Tirtayasa
menunjukkan capaian mahasiswa baik tugas akhir, nilai akhir dan forum diskusi
termasuk dalam kategori sangat baik, persepsi peserta PPG termasuk dalam
kategori baik (Pamungkas et al., 2019).
Hasil penelitian tahun 2018 oleh Research on Improving Systems of
Education (RISE) di Indonesia yang mengevaluasi dampak program PPG
Prajabatan Bersubsidi Pendidikan Guru Sekolah Dasar (PGSD) terhadap calon
guru melalui lokakarya dan PPL di LPTK Universitas Negeri Jakarta, Universitas
Pakuan Bogor, Universitas Negeri Surabaya, Universitas Sebelas Maret Solo,
Universitas Muhammdiyah Purwokerto, Universitas Muhammadiyah Malang,
Universitas Sanata Dharma ditemukakan 59% peserta PPG mampu menyiapkan
pertanyaan untuk peserta didik pada saat pengajaran di kelas, 60% mampu
menerapkan strategi pengajaran yang sesuai keragaman tingkat kemampuan
peserta didik, 60% mampu memberikan pengajaran, dan 89% mampu
menggunakan teknologi pendidikan dalam mengajar. Selain itu, ditemukan
peserta PPG pada pelaksanaan PPL yang mampu melakukan manajemen kelas
hanya 34%, menguasai metode mengajar 27%, menguasai karakteristik peserta
didik 26%, mampu menyesuaikan dengan kondisi sekolah 15%. Selanjutnya
terkait hasil temuan evaluasi terhadap uji kelulusan PPG dititikkan pada uji
pengetahuan yang belum merefleksikan apa yang peserta pelajari selama
pelaksanaan lokakarya, ujian belum diarahkan kepada penilaian kemampuan calon
guru dalam menguasai subjek specific pedagogy (SSP) atau pedagogical content
knowledge (PCK), padahal idealnya syarat kelulusan harus selaras dengan
10
penilaian poses pembelajaran pada program PPG. Sementara hasil evaluasi dari
persepsi peserta setelah mengikuti Program PPG ditemukan 33,7% peserta
mampu menguasai materi pelajaran, 13% mampu membuat instrumen penilaian,
39% mampu membuat media pembelajaran, 44,2% mampu membuat strategi
pengajaran. Oleh karena itu, disimpulkan hanya sebagian kecil peserta PPG yang
mengikuti survei mengakui bahwa program PPG meningkatkan penguasaan
mereka terhadap aspek-aspek yang dinilai tersebut, padahal aspek-aspek tersebut
merupakan indikator penilaian pada saat praktik mengajar di kelas (RISE, 2018).
Berbagai realitas hasil penelitian di atas, menunjukkan bahwa masih
banyak permasalahan-permasalahan yang muncul di lapangan terkait
penyelenggaraan program PPG di berbagai LPTK. Permasalahan-permasalahan
tersebut, semuanya mengerucut pada permasalahan bagaimana meningkatkan
capaian penguasaan kompetensi peserta PPG. Jika kemudian ternyata masih
banyak lulusan Program PPG yang belum memenuhi tuntuan kompetensi yang
dipersyaratkan, maka apakah model penilaian yang digunakan saat ini telah
mencakup komponen-komponen yang dapat menggambarkan pencapaian
kompetensi peserta PPG? Jawabannya, dibutuhkan penelitian dan pengembangan
terhadap model penilaian yang mampu menghasilkan seperangkat prosedur
penilaian capaian penguasaan kompetensi peserta PPG mulai dari pedoman
pengembangan instrumen-instrumennya, prosedur penggunaan instrumen-
instrumen tersebut dan cara pelaporan hasil-hasil penilaiannya.
Berkaitan dengan upaya tersebut, perlu ada model penilaian yang dapat
mengestimasi penguasaan kompetensi peserta PPG untuk pemerolehan hasil
11
penilaian yang objektif, akurat, konsisten dan tidak bias. Meskipun saat ini sudah
ada model penilaian PPG yang dikembangkan oleh Kemenristekdikti Dirjen
Belmawa. Terdapat beberapa alasan model penilaian PPG yang sudah ada perlu
dikembangkan, yaitu: Pertama, penilaian capaian penguasaan kompetensi peserta
PPG diestimasi dengan menggunakan skor mentah yaitu dengan menjumlah skor
setiap aspek menjadi total skor perolehan dibagi dengan skor maksimal, kemudian
hasil skor yang diperoleh peserta tersebut dibandingkan dengan batas kelulusan
(passing grade) capaian pembelajaran program PPG yang ditetapkan yaitu 76
(dengan kriteria Baik). Penilaian seperti ini bersifat relatif tidak mampu
membedakan peserta yang memiliki kemampuan tinggi, sedang maupun
kemampuan rendah berdasarkan komponen dari setiap aspek yang dinilai dan
penilaian seperti ini dalam teori pengukuran masih menggunakan pendekatan teori
klasik. Pendekatan teori ini memiliki keterbatasan diantaranya skor sebenarnya
sangat tergantung pada pengukuran yang dilaksanakan dan pengujiannya tidak
bisa dibandingkan, karena pendekatan penilaian dengan teori klasik memiliki
kesalahan pengukuran yang bersifat acak (tidak sistematis), dimana tidak ada
hubungan antara skor sebenarnya dengan skor kesalahan. Skor amatan dan skor
sebenarnya berubah-ubah bergantung pada tingkat kesulitan dan pembobotan,
sehingga keduanya sangat bergantung pada hasil dari karakteristik peserta yang
dinilai, dimana skor amatan adalah satu-satunya skor yang tampak sedangkan skor
sebenarnya dan skor kesalahan bersifat tersembunyi atau latent (Istiyono,
Mardapi, & Suparno, 2014a; Mardapi, 2017; Retnawati, 2011, 2016b; Sumintono
12
& Widhiarso, 2014). Hal ini menunjukkan penilaian yang ada belum dapat
meningkatkan akurasi pengukuran capaian kemampuan/kompetensi peserta PPG.
Alasan kedua, berdasarkan hasil penelaahan instrumen penilaian PPG yang
dikembangkan oleh Kemenristekdikti Dirjen Belmawa dalam menilai kemampuan
peserta PPG menyusun rencana pelaksanaan pembelajaran dan kemampuan
melaksanakan pembelajaran ditemukan masih terdapat indikator dari komponen
yang perlu dinilai sebagaimana dijabarkan dalam Buku Pedoman
Penyelenggaraan Program PPG Tahun 2018 diantaranya menerapkan prinsip
TPACK (Technological Pedagogical and Content Knowledge), mengingat
komponen tersebut penting untuk dinilai dalam pembelajaran di era revolusi
industri 4.0 saat ini. Selanjutnya untuk penilaian terkait penguasan kompetensi
sosial dan kepribadian dari instrumen penilaian yang sudah ada, menyatu dengan
instrumen penilaian pelaksanaan pembelajaran padahal capaian penguasaan
terhadap kompetensi tersebut harus dinilai secara terpisah berdasarkan komponen
dan indikator yang dinilai. Oleh karena itu, perlu dilakukan pengembangan
instrumen penilaian yang mampu mengambarkan penguasaan capaian kompetensi
peserta PPG secara menyeluruh.
Alasan ketiga, terkait dengan model penskoran yang digunakan.
Berdasarkan hasil Focus Discussion Group (FGD) dengan dosen dan guru
pamong/penguji UKIN, khususnya pada tiga LPTK yaitu LPTK Universitas
Negeri Yogyakarta, LPTK Universitas Negeri Gorontalo dan LPTK Universitas
Islam Negeri Alauddin Makassar diperoleh informasi adanya kecenderungan
penilai memberi skor pada angka 7, 8, dan 9 tanpa memperhatikan perbedaan skor
13
tersebut dari setiap tahapan komponen/aspek yang dinilai, padahal komponen
yang dinilai dalam mengukur capaian kompetensi peserta PPG memiliki
serangkaian tahapan dan skor seharusnya diberikan pada setiap tahapan tersebut.
Selanjutnya setiap kategori dari item yang dinilai pada instrumen menunjukkan
kecenderungan kemampuan peserta PPG benar dilangkah tertentu, namun salah
dilangkah lain. Hal ini terjadi, karena penskoran yang ada dalam instrumen
penilaian menggunakan skala semantik diferensial dari rentang skor 1 sampai 10
dengan 2 kategori sangat baik/tidak baik, sangat sesuai/tidak sesuai, sangat
lengkap/tidak lengkap, tampak/tidak tampak. Alasan keempat, belum ada buku
panduan penilaian yang disertai dengan rubrik yang rinci dan jelas terhadap
komponen dari indikator dan aspek yang dinilai. Padahal buku panduan ini, sangat
membantu penilai memiliki persepsi yang sama dalam melakukan penilaian agar
penguasaan kompetensi peserta PPG mampu diukur capaiannya secara maksimal.
Hasil analisis need assessment menunjukkan adanya kebutuhan yang
dirasakan penilai tentang pentingnya model penilaian PPG yang memuat
seperangkat prosedur dalam menilai penguasaan capaian kompetensi peserta PPG,
terutama pada penilaian kemampuan peserta PPG menyusun rencana pelaksanaan
pembelajaran dan melaksanakan pembelajaran yang termanifestasikan dalam
penguasaan kompetensi pedagogik dan penilaian terhadap capaian penguasaan
kompetensi sosial dan kepribadian berdasarkan komponen dan indikator yang
harus ternilai. Karena selama ini penilai kurang mampu mendeskripsikan
indikator capaian penguasaan kompetensi peserta PPG, diakibatkan kurangnya
informasi yang diperoleh terkait kekurangan capaian kemampuan peserta PPG
14
yang harus diperbaiki dan dikuasai dan tentunya hal ini berdampak pada
ketidakmampuan penilai melakukan pembinaan dan perbaikan terhadap
kekurangan-kekurangan yang dimiliki peserta PPG. Padahal menurut hasil
penelitian Ratnaningrum (2016); Yahya, Abdal, Setialaksana, & Putri (2019)
bahwa penilaian kompetensi peserta PPG memberikan informasi untuk
mengetahui tingkat kemampuan peserta yang difokuskan pada kelemahan-
kelemahan yang dimilikinya dalam menguasai standar kompetensi guru,
berdasarkan hasil penilaian juga dapat diketahui kemampuan rata-rata para peserta
PPG pada aspek mana yang perlu ditingkatkan dan siapa yang perlu mendapatkan
pembinaan secara kontinu, serta siapa yang telah mencapai standar kemampuan
minimal, karena tingkat ketercapaian dari keberhasilan program PPG, dapat
dilihat dari tinggi rendahnya prestasi yang diperoleh peserta PPG dan prestasi
tersebut dapat diketahui setelah diadakan evaluasi yang dinyatakan dalam bentuk
nilai pada setiap sub kompetensi, selain itu untuk mengidentifikasi kesulitan
belajar yang dialami peserta dengan mencari penyebab dan solusi pemecahannya.
Hal ini juga diperkuat oleh Selvi (2010); Kartowagiran (2010); Munadi,
Arlinwibowo, Wulandari, & Sulistyaningsih (2017); Mardapi (2017: 14-15)
bahwa penilaian harus mampu menggambarkan hasil belajar yang komprehensif,
memberikan informasi terhadap kekurangan-kekurangan dari peserta yang dinilai
dan menemukan penyebabnya, penyimpulan tingkat pencapaian hasil belajar
dibandingkan dengan kriteria yang harus dicapai sesuai dengan kompetensi,
sehingga dalam pelaksanaan penilaian perlu ditingkatkan sistem penilaiannya
secara terus-menerus dan berkelanjutan.
15
Kelebihan-kelebihan yang dapat diperoleh dengan adanya pengembangan
model penilaian PPG ini diantaranya: pertama, pengukuran dirancang dengan
pendekatan teori respon butir (Item Response Theory, IRT) model politomus
untuk menentukan level atau kategori yang dicapai peserta berdasarkan respons
yang diberikan, agar dapat menggali informasi karakteristik item lebih jauh dan
mampu mengestimasi kemampuan atau capaian kompetensi peserta PPG, karena
pemberian skor yang dilakukan memperhatikan seluruh tahapan-tahapan yang
harus dikerjakan peserta PPG pada komponen yang dinilai dan skor yang
diberikan memperhatikan tingkat kesukaran setiap tahapan. Alasan kedua,
instrumen penilaian yang dikembangkan memiliki acuan kerangka teoretik yang
cocok dan sesuai dengan kebutuhan dalam mengestimasi penguasaan kompetensi
peserta PPG, mulai dari mencari teori yang relevan dari buku reverensi, jurnal-
jurnal atau penelitian yang terdahulu, kemudian dikonstruk menjadi indikator-
indikator dan dikembangkan menjadi sub indikator untuk menyusun item
instrumen yang dibuktikan validitas isi, validitas konstruk dan estimasi
reliabilitasnya.
Kelebihan ketiga, model penskoran dalam penilaian ini menggunakan
penskoran parsial dan holistik yang bertujuan untuk menggali informasi lebih jauh
hasil estimasi kemampuan peserta PPG. Pada penilaian dengan penskoran parsial,
skor dikumpulkan berdasarkan respons tahap demi tahap, sehingga mampu
menggambarkan tahap-tahap yang dikuasai oleh peserta PPG, karena biasanya
tahapan yang dinilai dari peserta PPG benar ditahap tertentu, tetapi salah ditahap
berikutnya atau yang lain. Oleh karena itu, penskoran parsial merupakan pilihan
16
yang berpeluang untuk memberikan informasi posisi kemampuan peserta PPG.
Semakin tinggi parameter kemampuan peserta PPG, maka semakin besar pula
peluang peserta tersebut mengerjakan tahapan demi tahapan dengan benar untuk
suatu item yang dinilai. Sementara penskoran holistik digunakan untuk menilai
kemampuan atau proses secara keseluruhan tanpa ada pembagian komponen
secara terpisah, namun mampu menilai semua kinerja yang ditunjukkan dalam
kategori karena skor yang diberikan berdasarkan urutan kategori, misalnya
menilai kelengkapan rumusan tujuan pembelajaran memenuhi kriteria ABCD
(Audience, Behavior, Condition, Degree), agar rumusan tujuan pembelajaran
tersebut memenuhi kategori lengkap, maka peserta PPG dalam rumusan tujuan
pembelajarannya ada audience sebagai tahap ke-1, tahap ke-2 ada audience dan
behavior, tahap ke-3 audience, behavior, condition, tahap ke-4 ada audience,
behavior, condition, degree. Oleh karena itu, penskoran holistik merupakan
pilihan penskoran yang berpeluang untuk memberikan informasi posisi
kemampuan peserta PPG secara urut berdasarkan kategori respons.
Kelebihan keempat, untuk mengetahui keakuratan kedua model penskoran
ini dalam mengestimasi kemampuan peserta PPG, digunakan fungsi informasi dan
kesalahan baku estimasi, karena dalam mengembangkan model penilaian tersebut
memerlukan ketepatan dan akurasi yang tinggi untuk menghindari adanya resiko
atau kesalahan pengukuran dalam penilaian capaian penguasaan kompetensi
peserta PPG. Kelebihan kelima, model penilaian ini dikembangkan berdasarkan
kaidah prosedur pengembangan dan memperhatikan kepraktisan penggunaannya,
serta dilengkapi dengan panduan penilaian. Kelebihan keenam, applicability dari
17
model penilaian ini bukan hanya dapat digunakan untuk menilai penguasaan
capaian kompetensi peserta PPG, namun juga dapat digunakan untuk penilaian
kinerja guru, supervisi guru, praktik lapangan persekolahan (PLP)/praktik
pengalaman lapangan mahasiswa, dan penilaian bidang keguruan lainnya.
Berdasarkan berbagai alasan pentingnya mengembangkan model penilaian
PPG dan kelebihan yang dimilikinya, maka hasil penilaian yang diperoleh akan
lebih objektif, akurat dan akuntabel dalam mengestimasi penguasaan capaian
kompetensi peserta PPG. Melalui perbaikan proses penilaian diharapkan mampu
menghasilkan lulusan yang menguasai kompetensi secara memadai dan mampu
mengimplementasikannya. Upaya inilah yang dapat mewujudkan peningkatan
kompetensi guru sebagai guru yang profesional. Hal diperkuat dengan beberapa
hasil penelitian dan beberapa teori pendukung diantaranya Biktagirova and
Valeeva (2014); Pollard (2014); K. Liu (2015); Galih & Iriani (2018)
profesionalisme seorang guru harus selalu ditingkatkan bukan hanya saat
mengajar di kelas tetapi juga sebelum dan setelahnya setelah berkelanjutan,
menjadi guru profesional tidak cukup hanya dinilai dari kepemilikan sertifikat
pendidik secara legalitas, tetapi pada upaya meningkatkan profesionalismenya
secara terus-menerus dan berkelanjutan dalam menjalankan tugas dan tanggung
jawabnya, melakukan refleksi diri dalam membuat keputusan lebih lanjut untuk
perbaikan pengajaran di masa kini dan masa depan. Karena ketidakmampuan guru
menerapkan pengetahuan secara sistematis dan konstruktif dalam kegiatan
pembelajaran, akan berdampak pada hasil pembelajaran yang dicapai. Dengan
demikian, melalui hasil penelitian ini diharapkan akan mengantarkan pada usaha
18
peningkatan kompetensi peserta PPG tidak hanya berhenti selama pelaksanaan
PPG, namun penguasaan peserta terhadap standar kompetensi guru yang
dipersyaratkan benar-benar terimplementasi dengan baik.
B. Identifikasi Masalah
Berdasarkan uraian pada latar belakang masalah, berikut disampaikan
beberapa permasalahan sebagai berikut.
1. Penilaian PPG saat ini bersifat relatif belum mampu membedakan peserta
yang memiliki kemampuan tinggi, sedang maupun kemampuan rendah
berdasarkan komponen dari setiap aspek yang dinilai karena masih
menggunakan pendekatan teori klasik dimana skor sebenarnya sangat
tergantung pada pengukuran yang dilaksanakan dan tidak bisa dibandingkan.
2. Model penskoran yang digunakan belum memperhatikan perbedaan skor dari
setiap tahapan komponen/aspek yang dinilai, padahal komponen yang dinilai
dalam mengukur capaian kompetensi peserta PPG memiliki serangkaian
tahapan dan skor seharusnya diberikan pada setiap tahapan tersebut, sehingga
penskoran dalam model penilaian PPG dikembangkan menggunakan
pendekatan teori respon butir model politomus yaitu parcial credit model dan
graded respons model.
3. Model penilaian PPG dengan penskoran parsial dan holistik hingga kini
belum ada yang mengembangkan, padahal penskoran parsial merupakan
pilihan yang berpeluang untuk memberikan informasi posisi kemampuan
peserta PPG meskipun tidak secara urut, sedangkan penskoran holistik
19
berpeluang untuk memberikan informasi posisi kemampuan peserta PPG
secara urut berdasarkan kategori respons.
4. Belum adanya panduan model penilaian PPG dengan penskoran parsial dan
holistik yang berisi komponen-komponen penilaian apa saja yang harus
dinilai, mekanisme penilaian yang dilakukan beserta instrumennya, penskoran
yang digunakan dan interpretasi hasil penilaian, untuk membantu dan
memudahkan pengguna/penilai dalam menilai capaian penguasaan
kompetensi peserta PPG.
C. Pembatasan Masalah
Menghindari kekeliruan dan ketidakselarasan antara pembatasan dengan
pokok masalah di atas, maka penelitian ini membatasi pada pengembangan model
penilaian PPG dengan penskoran parsial dan holistik dengan beberapa batasan:
1. Penelitian ini fokus pada pengembangan model penskoran yaitu dengan
penskoran parsial dan holistik yang mengacu pada penguasaan kompetensi
berdasarkan komponen dan indikator yang dinilai dalam Buku Pedoman
Penyelenggaraan PPG yaitu kompetensi pedagogik, kompetensi kepribadian,
kompetensi sosial, dan kompetensi profesional. Namun dalam pengembangan
ini, difokuskan pada penilaian kompetensi pedagogik yang menilai
kemampuan peserta PPG dalam menyusun Rencana Pelaksanaan
Pembelajaran (RPP) dan melaksanakan pembelajaran, penilaian kompetensi
sosial dan kepribadian. Untuk penilaian penguasaaan kompetensi profesional
tidak dinilai dan dikembangkan, karena pelaksanaan penilaiannya secara
20
tertulis menggunakan soal dari Panitia Nasional Uji Kompetensi Mahasiswa
Program PPG (Panas UKMPPG) yang terjadwal secara nasional dan tentunya
item-item pada soal tersebut telah melalui tahapan-tahapan pengembangan
soal yang baku dan memenuhi kriteria item yang baik dan telah digunakan
secara nasional dalam skala besar.
2. Untuk penilaian kompetensi pedagogik yang menilai kemampuan peserta
PPG dalam menyusun RPP dan melaksanakan pembelajaran menggunakan
instrumen penilaian rencana pembelajaran dengan penskoran parsial dan
holistik dan instrumen penilaian pelaksanaan pembelajaran dengan penskoran
parsial dan holistik. Item-item yang ada dalam instrumen yang dikembangkan
menyesuaikan dengan item-item yang sudah dikembangkan oleh
Kemenristekdikti dan melengkapi item-item yang tidak ternilai. Untuk
penilaian kompetensi sosial dan kepribadian, belum ada item-item yang
dikembangkan, sehingga instrumen penilaian kompetensi sosial dan
kepribadian dikembangkan berdasarkan konstruk indikator ukur.
3. Lingkup Program PPG yang diteliti yaitu PPG Prajabatan bersubsidi dan PPG
Dalam Jabatan tahun akademik 2018/2019 yang diselenggarakan Rayon
LPTK Universitas Negeri Yogyakarta (UNY), LPTK Universitas Negeri
Gorontalo (UNG), dan LPTK UIN Alauddin Makassar (UINAM).
4. Model penilaian PPG yang dikembangkan difokuskan pada penilaian kinerja
(performance assessment) dari peserta PPG saat lokakarya perangkat
pembelajaran, PPL dan pelaksanaan UKMPPG dengan cakupan penilaian
pada penguasaan kemampuan peserta PPG dalam menyusun rencana
21
pelaksanaan pembelajaran, kemampuan melaksanakan pembelajaran,
penguasaan kompetensi sosial dan kepribadian peserta PPG.
5. Model penilaian PPG yang dikembangkan berisi instrumen-instrumen
penilaian kompetensi pedagogik dengan teknik analisis dokumen dan
observasi, penilaian kompetensi sosial dan kompetensi kepribadian
menggunakan penskoran secara parsial dan holistik dengan teknik observasi.
6. Lingkup Program Studi PPG yang diteliti disesuaikan dengan Program Studi
yang ada pada saat penyelenggaraan PPG Prajabatan bersubsidi dan PPG
Dalam Jabatan tahun akademik 2018/ 2019 di Rayon LPTK UNY, LPTK
UNG, dan LPTK UINAM.
D. Rumusan Masalah
Berdasarkan latar belakang dan identifikasi masalah yang telah
dikemukakan, permasalahan utama pada penelitian ini dirumuskan sebagai
berikut: “Bagaimana model penilaian PPG dengan penskoran parsial dan holistik
yang dapat digunakan dalam mengestimasi penguasaan kompetensi peserta PPG
secara akurat dan terpercaya?”. Secara operasional permasalahan penelitian ini
dapat dirumuskan sebagai berikut.
1. Bagaimana konstruk model penilaian PPG dengan penskoran parsial dan
holistik yang dapat digunakan dalam mengestimasi penguasaan kompetensi
peserta PPG?
22
2. Bagaimanakah validitas dan reliabilitas model penilaian PPG dengan
penskoran parsial dan holistik yang dapat digunakan dalam mengestimasi
penguasaan kompetensi peserta PPG?
3. Bagaimana karakteristik model penilaian PPG dengan penskoran parsial dan
peserta PPG?
4. Bagaimana deskripsi hasil penskoran parsial dan holistik dalam model
penilaian PPG terhadap akurasi estimasi kemampuan peserta PPG?
5. Bagaimana kepraktisan model penilaian PPG dengan penskoran parsial dan
holistik berdasarkan penilaian oleh pengguna?
E. Tujuan Pengembangan
Tujuan pengembangan dalam penelitian ini secara umum bertujuan untuk
mengetahui pengembangan model penilaian PPG dengan penskoran parsial dan
holistik untuk mencapai penguasaan kompetensi peserta PPG secara akurat dan
terpercaya dan secara khusus bertujuan:
1. Merumuskan konstruk model penilaian PPG dengan penskoran parsial dan
peserta PPG.
2. Menyusun model penilaian kompetensi peserta PPG dengan penskoran
parsial dan holistik yang memenuhi syarat validitas dan reliabilitas, agar
mampu menghasilkan estimasi penguasaan kompetensi peserta PPG lebih
akurat dan terpercaya.
23
3. Mendeskripsikan karakteristik model penilaian PPG dengan penskoran parsial
dan holistik yang dapat digunakan berdasarkan fungsi informasi dan
kesalahan baku estimasi dalam mengestimasi penguasaan kompetensi peserta
PPG.
4. Mendeskripsikan hasil penskoran parsial dan holistik yang dapat digunakan
dalam model penilaian PPG terhadap akurasi estimasi kemampuan peserta.
5. Mendeskripsikan kepraktisan model penilaian PPG dengan penskoran parsial
dan holistik berdasarkan penilaian oleh pengguna.
F. Manfaat Pengembangan
Hasil penelitian ini diharapkan dapat memberikan manfaat secara teoritis
maupun praktis sebagai berikut:
1. Secara teoretis hasil penelitian ini diharapkan dapat digunakan sebagai acuan
teoritik dalam mengembangkan model penilaian PPG dengan penskoran
parsial dan holistik. Selain itu memperkuat pentingnya pengembangan model
penilaian PPG dalam mengestimasi penguasaan kompetensi peserta PPG.
2. Secara praktis, hasil penelitian dapat dijadikan sebagai panduan bagi penilai
dalam menilai penguasaan kompetensi peserta PPG dengan penskoran parsial
maupun holistik secara akurat dan terpercaya serta mampu melakukan
pelaporan hasil penilaian lebih rinci dan detail.
3. Hasil penelitian ini dapat digunakan sebagai bahan evaluasi dalam melakukan
perbaikan model penilaian PPG yang ada selama ini dalam menilai
penguasaan kompetensi peserta PPG, sehingga mampu menghasilkan
24
estimasi kemampuan peserta yang lebih akurat dibandingkan dengan
penskoran yang sudah ada.
G. Asumsi Pengembangan
Beberapa asumsi yang mendasari pengembangan model penilaian PPG
dengan penskoran parsial dan holistik yaitu:
1. Jika teori yang relevan digunakan untuk membuat konstruk, indikator yang
dinilai dapat diukur dan diamati, maka model penilaian PPG dengan
penskoran parsial dan holistik yang dikembangkan diasumsikan memiliki
acuan kerangka teoretik yang cocok dan sesuai dengan kebutuhan dalam
mengestimasi penguasaan kompetensi peserta PPG. Untuk keperluan ini,
peneliti mencari teori yang relevan dari buku reverensi, jurnal-jurnal atau
penelitian yang terdahulu, kemudian dikonstruk menjadi indikator-indikator
dan dikembangkan menjadi sub indikator untuk menyusun item instrumen.
2. Jika model penilaian PPG dengan penskoran parsial dan holistik yang
dikembangkan dapat dibuktikan validitas dan diestimasi reliabilitasnya, maka
diasumsikan mampu mengestimasi penguasaan kompetensi peserta PPG lebih
akurat dibandingkan dengan penskoran yang sudah ada.
3. Jika model penilaian PPG dengan penskoran parsial dan holistik yang telah
dikembangkan sudah memenuhi kaidah atau prosedur pengembangan , maka
diasumsikan dapat melengkapi penilaian PPG saat ini.
4. Jika prinsip-prinsip dan prosedur pengembangan model penilaian PPG
dengan penskoran parsial dan holistik diterapkan dengan baik, maka
diasumsikan dapat menghasilkan model penilaian PPG yang akurat dan
25
praktis dalam meningkatkan kualitas hasil pelaksanaan PPG di LPTK dan
penguasaan kemampuan akademik dan penguasaan kompetensi lulusan PPG.
H. Spesifikasi Produk yang Dikembangkan
Spesifikasi produk yang dikembangkan dari model penilaian PPG dalam
penelitian dan pengembangan ini fokus pada dua penskoran yaitu penskoran
parsial dan holistik yang menghasilkan produk sebagai berikut.
1. Instrumen penilaian rencana pembelajaran dengan penskoran parsial dan
holistik yang mengacu pada komponen dan indikator kompetensi pedagogik
yang ada dalam Buku Pedoman Penyelenggaraan PPG Tahun 2018 dan
menyesuaikan dengan item-item pada instrumen penilaian rencana
pembelajaran yang sudah dikembangkan Kemenristekdikti Dirjen Belmawa.
2. Instrumen penilaian pelaksanaan pembelajaran dengan penskoran parsial dan
holistik yang mengacu pada komponen dan indikator kompetensi pedagogik
yang ada dalam Buku Pedoman Penyelenggaraan PPG Tahun 2018 dan
menyesuaikan dengan item-item pada instrumen penilaian pelaksanaan
pembelajaran yang telah dikembangkan Kemenristekdikti Dirjen Belmawa.
3. Instrumen penilaian kompetensi sosial dan kepribadian dengan penskoran
parsial dan holistik yang mengacu pada komponen dan indikator kompetensi
sosial dan kepribadian yang ada dalam Buku Pedoman Penyelenggaraan PPG
Tahun 2018 oleh Kemenristekdikti Dirjen Belmawa.
4. Buku Panduan Penilaian PPG dengan penskoran parsial dan holistik. Panduan
penilaian ini bertujuan untuk memandu penilai dalam menilai setiap tahapan
26
komponen dari masing-masing instrumen yang dikembangkan, sehingga
memiliki persepsi yang sama dalam melakukan penilaian agar penguasaan
kompetensi peserta PPG mampu diukur capaiannya secara maksimal.
5. Model yang dimaksud dalam penelitian ini adalah seperangkat prosedur yang
terdiri dari sejumlah alat dan cara yang disusun secara berurutan untuk
menilai suatu proses dan hasil. Oleh karena itu, model penilaian PPG dengan
penskoran parsial dan holistik merupakan seperangkat prosedur yang disusun
untuk mengestimasi capaian penguasaan kompetensi peserta PPG.
Seperangkat prosedur yang dimaksud berisi konsep dasar sistem penilaian
Program PPG, mekanisme penilaian Program PPG, penskoran dan
interpretasi hasil penilaian Program PPG. Sistem penilaian Program PPG
menjelaskan tentang pengertian, prinsip, acuan penilaian serta teknik
penilaian. Mekanisme penilaian Program PPG yang meliputi lingkup
penilaian berisi cakupan komponen-komponen yang dinilai dan perumusan
indikator, teknik penilaian dan bentuk instrumen. Selanjutnya penskoran dan
interpretasi hasil penilaian Program PPG yang mencakup pengertian
penskoran, model penskoran, interpretasi hasil penilaian, contoh penilaian
dan tindak lanjut, skoring dan pemanfaatan hasil penilaian.
27
BAB II
KAJIAN PUSTAKA
A. Kajian Teori
1. Pendidikan Profesi Guru (PPG)
Profesi guru di Indonesia memiliki kedudukan sentral sebagai tenaga
profesional pada jenjang pendidikan anak usia dini, pendidikan dasar, dan
pendidikan menengah sehingga menuntut adanya kualifikasi akademik dan latar
belakang pendidikan yang relevan. Indonesia juga telah merumuskan syarat
kompetensi yang harus dimiliki oleh seorang guru dalam Undang-Undang Nomor
14 Tahun 2005 tentang Guru dan Dosen Pasal 10 disebutkan bahwa kompetensi
guru meliputi kompetensi pedagogik, kompetensi kepribadian, kompetensi sosial,
dan kompetensi profesional yang diperoleh melalui pendidikan profesi. Adanya
pengakuan profesi guru sebagai tenaga profesional di Indonesia dibuktikan secara
nyata sejak tahun 2007 dilakukan uji sertifikasi guru untuk selanjutnya bagi yang
lulus berhak mendapatkan sertifikat pendidik dan tunjangan sertifikasi atas
profesinya.
Pendidikan profesi mengacu pada pendidikan untuk pekerjaan profesional
termasuk pengacara/penasihat hukum, dokter, guru, dan sebagainya. Istilah
pendidikan profesi secara umum mencakup program pembelajaran formal,
nonformal dan informal bagi setiap orang di semua profesi sehingga sering
disebut sebagai “white collar” adalah tipe pekerja yang memiliki keterampilan
khusus namun istilah ini biasanya digunakan untuk menggambarkan
pengembangan profesi guru. Guru termasuk profesi khusus seperti dokter dan
28
penasihat hukum karena menjadi seorang guru dituntut memiliki keahlian tertentu
sebagaimana dipersyaratkan dari segi kualifikasi dan kompetensi yang terukur dan
teruji sesuai dengan fungsi dan perannya. Oleh karena itu, pengembangan profesi
guru sangat penting, karena ketika guru berada di sekolah akan berhadapan
dengan peserta didik dari berbagai latar belakang, sehingga membutuhkan sosok
guru yang memiliki kompetensi yang tinggi sesuai dengan kebutuhan dan
tantangan yang dihadapi (Athar & Jamal, 2017; Copriady, 2013; Cranton, 2016).
Seseorang yang ingin berprofesi menjadi guru, maka ia dipersyaratkan
harus mengikuti berbagai jenjang pendidikan formal, praktik lapangan, magang
atau pendidikan lainnya yang mendukung profesinya dalam kurun waktu tertentu.
Bahkan, di negara-negara maju seperti negara-negara di wilayah Eropa yaitu
Luksemburg, Polandia, Portugal, Slovakia, Slovenia dan Spanyol lebih
menekankan pada pengembangan profesi guru secara berkelanjutan melalui
peningkatan gaji dan kemajuan karir guru, serta guru juga harus memiliki
kesadaran dan komitmen yang kuat secara internal untuk terus belajar
meningkatkan kompetensinya, sehingga layak disebut sebagai guru profesional
(Hendriks, Luyten, Scheerens, Sleegers, & Steen, 2010; Sulisworo et al., 2017).
Pendidikan profesi bagi guru sangat terkait dengan guru profesional karena
memberikan kesempatan dalam menguasai pengetahuan terkait profesi guru dan
memiliki pengalaman belajar agar dapat meningkatkan kompetensinya sesuai
dengan tuntutan perubahan. Pendidikan profesi bagi guru memberikan
pembelajaran yang memperkaya pengetahuan, konsep teori dan pengalaman yang
lebih mendalam untuk menjadi guru profesional (Caena, 2011; Galih & Iriani,
29
2018; Oviyanti, 2016; Petrie & McGee, 2012). Pendapat ini menunjukkan
pentingnya pendidikan profesi bagi guru dan akan terus menjadi isu penting dalam
meningkatkan kualitas guru di Indonesia.
Salah satu pendidikan profesi yang diselenggarakan dalam pengembangan
profesi dan profesional guru di Indonesia adalah melalui Program Pendidikan
Profesi Guru (PPG). PPG merupakan salah satu program pemerintah yang
bertujuan untuk menghasilkan guru yang memiliki kompetensi dan mampu
mengembangkan profesionalitas secara berkelanjutan, melalui Program PPG
diharapkan menghasilkan lulusan guru/calon guru yang memiliki kompetensi utuh
yaitu unggul dan berkarakter disamping kompetensi-kompetensi keprofesionalan
guru lainnya untuk menjadi guru yang profesional. Disamping itu, program PPG
merupakan syarat mutlak bagi guru untuk mendapatkan pengalaman nyata yang
mendukung profesionalismenya sesuai dengan standar nasional pendidikan dan
memperoleh sertifikat pendidik (Amadi, 2013; Anita & Rahman, 2013; Hotimah
& Suyanto, 2017; Ningrum, 2012; Nurmaliah, 2018).
Rumusan di atas menunjukkan PPG merujuk kepada pengembangan
keterampilan dan pengetahuan yang dicapai dalam pengembangan pribadi dan
pengembangan karir guru. pendapat ini mengindikasikan bahwa Program PPG
dinilai efektif bagi calon guru dan guru di Indonesia dalam meningkatkan
kompetensinya menjadi lebih profesional melakukan inovasi baru pada praktik
pembelajaran. Pendapat ini didukung oleh Mizell (2010), Smylie (2014), Gareis
and Grant (2014) menyatakan untuk menjadi guru profesional penting mengikuti
pendidikan profesi guru dalam meningkatkan kompetensinya menjadi lebih baik,
30
karena untuk mempersiapkan seseorang menjadi guru profesional tergantung pada
praktik mengajarnya secara nyata dan pengembangan dari serangkaian
pengetahuan, keterampilan dan kecenderungan hal lain yang mendukung
pengembangan kompetensinya. Oleh karena itu, pengembangan profesi guru
harus fokus pada tugas-tugas pengajaran, proses pengembangannya harus
dirancang sesuai dengan kebutuhan dan bagaimana guru belajar, berlatih, dan
melakukan refleksi diri memperbaiki praktik mengajar yang lebih efektif secara
intensif dan berkelanjutan.
Program PPG membantu peserta/mahasiswa mendalami bidang studi
sehingga mampu meningkatkan kompetensinya sebagai seorang guru. Terdapat
tiga aspek yang berbeda dalam mengartikulasikan profesi guru yaitu terletak pada
pengetahuan, pemahaman dan intuisi, teknik “tahu dan bagaimana” dalam
menerapkan pengetahuan prosedural menjadi refleksi kritis terhadap apa yang
dilakukan guru di masa lalu dengan tujuan untuk mempertahankan atau
meningkatkan praktik mengajar mereka di masa depan (Winch, Oancea, &
Orchard, 2015, Indriyani & Ismandari, 2015). Dengan demikian secara teoritis
Program PPG dimaksudkan untuk membimbing, menambah pengalaman dan
penghayatan guru/calon guru tentang proses pendidikan dan profesionalisme
melaksanakan pembelajaran yang berkualitas.
Pengembangan profesi yang diterapkan dalam Program PPG yaitu
profesionalisasi guru berbasis individu, karena dalam program ini hal yang
ditekankan adalah peningkatan kompetensi yang wajib dimiliki oleh seorang guru
untuk mendapatkan tunjangan sertifikasi. Pembinaan dan pengembangan profesi
31
guru meliputi pembinaan kompetensi pedagogik, kepribadian, profesional, dan
sosial. Program PPG membelajarkan peserta/mahasiswa bagaimana mereka
mengajar dengan berbagai strategi pembelajaran yang baru (Prasojo et al., 2017;
Surya, 2014). Untuk mewujudkan hal ini mahasiswa/peserta PPG perlu difasilitasi
agar siap mengikuti program tersebut dengan baik dan perlu ditumbuhkan
semangat serta motivasinya untuk berperan aktif mengikuti berbagai kegiatan
yang dirancang dalam program tersebut.
Berbagai kajian di atas menunjukkan bahwa Program PPG sangat penting
dalam penyiapan guru masa depan yang berkualitas sehingga pelaksanaannya
perlu memperhatikan prinsip-prinsip yang mendasarinya. Menurut American
Federation of Teachers (2014) pendidikan profesi bagi guru memiliki prinsip
yaitu (a) memastikan kedalaman pengetahuan materi, (b) memberikan fondasi
yang kuat dalam disiplin pengetahuan tertentu, (c) memberikan pengetahuan yang
lebih umum tentang proses belajar dan mengajar di sekolah dan lembaga
pendidikan, (d) mencerminkan penelitian terbaik yang tersedia, (e) berkontribusi
terhadap prestasi belajar peserta didik yang terukur, (f) setiap guru untuk terikat
intelektual dengan ide-ide dan sumber daya, (g) memberikan cukup waktu,
dukungan dan sumber daya untuk memungkinkan para guru menguasai konten
dan pengetahuan baru. Hal ini menunjukkan bahwa Program PPG mampu
membekali dan mengembangkan kompetensi calon guru/guru melalui praktik
mengajar pada pengalaman lapangan dengan mengaplikasikan kompetensi yang
telah dikuasainya. Jika prinsip-prinsip ini terlaksana dengan baik maka tujuan
dari Program PPG akan tercapai.
32
Konsep pembelajaran program PPG di atas, sejalan dengan teori
pembelajaran orang dewasa (andragogi). Pembelajaran orang dewasa merupakan
inti dari praktik pembelajaran yang berbeda dengan anak-anak. Orang dewasa
berada di posisi yang berbeda dalam siklus hidup, pengalaman hidup orang
dewasa lebih besar dan lebih bervariasi dibandingkan dengan anak-anak sehingga
kebutuhan dan minat belajar orang dewasa dan anak-anak berbeda. Pembelajaran
orang dewasa dilakukan sepanjang hayat atau seumur hidup tanpa memandang
usia untuk menjamin pertumbuhan dan kecakapan hidup yang pada akhirnya
terletak pada sifat dan kebutuhannya (Jarvis, 2004; Merriam & Bierema, 2013).
Sebagaimana dinyatakan Merriam (2001) terdapat lima asumsi yang mendasari
pembelajaran orang dewasa yaitu: 1) memiliki konsep diri dan kemandirian dalam
pembelajaran, 2) memiliki pengalaman hidup yang memperkaya dalam belajar, 3)
memiliki kebutuhan belajar yang erat kaitannya dengan perubahan peran sosial, 4)
tertarik dan terpusat pada penerapan pengetahuan langsung, 5) memiliki dorongan
belajar yang bersumber dari diri internal.
Pembelajaran pada orang dewasa memiliki karakteristik untuk
membangun karakter kemandirian dalam diri pembelajar (outonomus learning)
dan menekankan pada self directed learning yang memberikan acuan bagaimana
mereka memiliki inisiatif untuk belajar, menganalisis kebutuhan belajar sendiri,
mencari sumber belajar sendiri, memformulasi tujuan belajar sendiri atau
menetapkan tujuan belajar sendiri, memilih/merancang dan mengimplementasikan
strategi belajar serta mengevaluasi kemajuan terhadap pencapaian tujuan belajar
secara mandiri (Brookfield, 1984; Knowles, Holton, & Swanson, 2015).
33
Kaitannya dengan pembelajaran pada Program PPG, menjadikan peserta PPG
sebagai subjek belajar aktif, yang mampu merubah etos belajar mandiri pada diri
mereka sebagai guru/calon guru, karena sikap belajar orang dewasa memengaruhi
usahanya dalam pencapaian hasil yang lebih baik. Dalam pembelajaran orang
dewasa memberikan kesempatan untuk secara aktif terlibat dalam pembelajaran
dan memberikan pengalaman belajar yang terpusat pada pembelajar, karena
pembelajar perlu terlibat secara aktif dalam proses pembelajaran untuk
membangun pengetahuan mereka sendiri, untuk memahami pembelajaran, dan
menerapkan apa yang dipelajari menuju pada peningkatan arah diri secara
otonomi guna membantu pembelajar tidak hanya memiliki pengalaman belajar
tetapi juga untuk memberdayakan interaksi mereka (Chan, 2010; Giannoukos,
Besas, Galiropoulos, & Hioctour, 2015; Henschke, 2011; Ozuah, 2016). Dengan
demikian, peserta PPG sebagai orang dewasa cenderung memilih kegiatan belajar
yang dapat segera diaplikasikan baik pengetahuan maupun keterampilan yang
dipelajarinya.
Hatton (1997) menyatakan dalam pembelajaran orang dewasa mengenal
konsep DAMN yaitu: 1) desire to learn, orang dewasa belajar karena dorongan
instrinsik, kebutuhan intelektual dan keingingan meraih cita-cita, 2) ability to
learn, sasaran belajar berada pada kemampuan dan peningkatan penguasaan
terhadap langkah-langkah kegiatan belajar secara bermakna, 3) means to learn,
belajar dikonsepkan sebagai suatu proses pemenuhan kebutuhan hidup dalam
menghadapi kehidupan yang lebih kompleks, 4) need to learn, belajar dalam
konsepsi belajar sepanjang hayat sebagai suatu kebutuhan, sehingga mendorong
34
dirinya untuk terus belajar dan sebagai kebutuhan yang mendesak untuk terus
beradaptasi dengan kondisi perkembangan masyarakat dan kehidupan. Dari
konsep tersebut, perlunya penerapan konsep pembelajaran andragogi pada
program PPG, karena lebih pada kegiatan membimbing dan membantu peserta
PPG mengembangkan pengetahuan, keterampilan, dan sikap yang dimilikinya
menguasai kompetensi yang dipersyaratkan sebagai guru profesional. Hal ini
didukung pendapat Wardoyo (2015) profesi guru berbeda dengan profesi lain,
karena ada karakteristik tertentu yang dapat mengarahkan pembelajar ke empat
pilar pendidikan yang dikeluarkan oleh UNESCO (learning to know, learning to
do, and learning to be, learning to live together).
Dengan demikian pembelajaran orang dewasa (andragogi) dapat menjadi
landasan dalam proses pembelajaran Program PPG, agar mampu menghasilkan
lulusan Program PPG yang dapat mengarahkan dirinya sendiri untuk terus belajar
mengembangkan kompetensinya sebagai seorang guru dan mampu menjadi
menjadi guru bagi dirinya sendiri. Hal ini berpijak pada landasan pembelajaran
andragogi itu sendiri yang memiliki formula pembelajaran yang selalu diarahkan
pada kondisi dan sasaran yang menekankan pada pemberian keterampilan dan
peningkatan kemampuan untuk memecahkan permasalahan yang dialami terutama
dalam pembelajaran.
2. Sistem dan Prinsip Pembelajaran Pendidikan Profesi Guru (PPG)
Sistem merupakan berbagai komponen yang memiliki satu kesatuan antara
satu dengan yang lain saling berinteraksi dan berkaitan untuk mencapai hasil yang
diharapkan sesuai dengan tujuan yang telah ditentukan. Demikian halnya dengan
35
PPG memiliki sistem yang terdiri dari berbagai komponen dalam mendukung
pembelajaran seperti sistem penerimaan peserta, kurikulum, pembelajaran,
penilaian, sarana dan prasarana, penjaminan mutu PPG dan komponen pendukung
lainnya yang saling berinteraksi dan berkaitan satu sama. Dengan adanya berbagai
komponen tersebut diharapkan mampu menghasilkan lulusan yang memiliki
kompetensi utuh (kompetensi pedagogik, kompetensi profesional, kompetensi
kepribadian, dan kompetensi sosial), unggul, dan berkarakter yang kesemuanya
sangat tergantung dari sistem pembelajaran.
Sistem pembelajaran pada program PPG mencakup praktek pengalaman
lapangan (PPL) dan uji kompetensi mahasiswa PPG (UKMPPG) yang ditekankan
pada p pendidikan profesi dalam rangka perubahan pola pikir mahasiswa/peserta
bahwa PPG adalah pendidikan profesi. Pengajaran dan pembelajaran pada
Program PPG dilakukan berdasarkan prinsip yaitu (a) Belajar dengan melakukan,
(b) keaktifan peserta didik, (c) Berpikir tingkat tinggi, (d) dampak pengiring, (e)
mekanisme balikan secara teratur, (f) pemanfaatan teknologi informasi, (g)
pembelajaran kontekstual, (h) penggunaan multistrategi dan aneka sumber belajar,
(i) berorientasi pada TPACK (Caena, 2011; Widiati & Hayati, 2015; Winch et al.,
2015). Prinsip-prinsip ini yang perlu mendapat perhatian khusus pada pengajaran
dan pembelajaran Program PPG.
Prinsip pertama belajar dengan melakukan (learning by doing)
mengembangkan pengetahuan, sikap dan keterampilan seorang guru dalam
melakukan tugas-tugas pembelajaran dan pemecahan masalah. Prinsip ini
digunakan untuk membentuk keterampilan, pengetahuan, dan sikap sebagai guru,
36
karena proses pengembangan profesionalnya dimulai sebelum guru memasuki
program pendidikan guru yang dilengkapi dengan pengalaman bertahun-tahun
sebagai peserta didik di sekolah (Prasojo et al., 2017). Dengan prinsip ini,
pengetahuan dan sikap peserta terbentuk melalui pengalaman. Dewey (1997)
menyatakan pengalaman adalah segala proses kehidupan manusia dalam
berinteraksi dengan berbagai macam hal dari luar diri maupun dari dalam diri
manusia itu sendiri, yang kemudian interaksi itu akan memengaruhi interaksi
selanjutnya. Oleh karena itu, pengalaman yang diperoleh peserta selama
mengikuti PPG merupakan seluruh proses pembelajaran yang dialaminya tidak
sekedar menjadi tumpukan pengalaman yang lepas, tetapi dapat terjadi suatu
perpaduan yang memperkaya dan menumbuhkan penguasaan kompetensinya
sebagai seorang guru profesional.
Pandangan Dewey menyiratkan makna bahwa proses pendidikan adalah
hasil pengalaman dari peserta yang terus-menerus baik dari masa lalu maupun
masa kini. Pengalaman masa lalu dapat digunakan untuk merekonstruksi masa
kini, sebaliknya masa kini digunakan untuk membangun masa depan. Oleh karena
itu, pandangan Dewey ini dapat menjadi dasar dalam merefleksi pengalaman yang
berkesinambungan pada diri peserta PPG dalam meningkatkan kompetensinya
secara timbal balik baik yang bersifat pribadi maupun sosial, dan dapat menjadi
kontribusi sejarah pendidikan dalam membangun perolehan pengalaman masa lalu
untuk merekonstruksi teori masa kini, sehingga penting peserta PPG perlu diajak
untuk merefleksikan masa lalunya dengan perolehannya masa kini agar mampu
membuat keputusan yang tepat dalam berbuat di masa kini untuk masa depannya
37
dalam meningkatkan kompetensinya sebagai guru profesional. Hal ini sejalan
dengan pandangan Paterson (2010) bahwa pendidikan tidak hanya dapat terjadi
pada diri seseorang, melainkan sebagai proses yang akan membentuk diri
seseorang menjadi lebih baik.
Prinsip kedua yaitu keaktifan peserta didik yang diarahkan pada upaya
mengaktifkan peserta didik bukan dalam arti fisik melainkan dalam keseluruhan
perilaku belajar. Prinsip ini menggunakan konsep pembelajaran terpusat pada
pembelajar keaktifan peserta tidak hanya diukur dari pengertian fisik semata,
tetapi juga dilihat dari tingginya minat dalam menyelesaikan permasalahan yang
sedang dihadapi serta mencari berbagai macam sumber belajar termasuk media
online dan offline (Prasojo et al., 2017; Widiati & Hayati, 2015). Prinsip ini dapat
diwujudkan antara lain melalui pemberian kesempatan menyatakan gagasan,
mencari informasi dari berbagai sumber dan melaksanakan tugas-tugas yang
merupakan aplikasi dari konsep-konsep yang telah dipelajari. Hal ini sejalan
dengan teori konstruktivisme sebagai salah satu filosofi pembelajaran yang paling
berpengaruh dalam pendidikan. Para pendukung teori konstruktivisme ini
berpandangan bahwa pembelajaran berlangsung melalui suatu proses dimana
pengetahuan dibangun atas dasar pengetahuan sebelumnya dan pembelajaran
adalah hasil dari gagasan dan pengalaman (Calvert, 2016; Krahenbuhl, 2016).
Prinsip ketiga berpikir tingkat tinggi (higher order thinking), semua
kegiatan pembelajaran berorientasi untuk mendukung pengembangan
keterampilan berpikir tingkat tinggi, keterampilan berpikir kritis, kreatif, logis,
dan reflektif, keterampilan dalam pemecahan masalah dan pengambilan
38
keputusan. Menurut Tekkumru Kisa and Stein (2015) berpikir tingkat tinggi
memerlukan lebih dari sekedar menghafal informasi yang diberikan, lebih dari
sekedar mengetahui definisi dari sebuah konsep ilmiah namun memahaminya
secara lebih mendalam. Penerapan sistem pembelajaran yang berorientasi pada
kemampuan berfikir tingkat tinggi meliputi: eksplorasi, elaborasi, konfirmasi dan
koreksi pada saat memaparkan hasil workshop, peerteaching maupun real
teaching saat PPL (Prasojo et al., 2017; Widiati & Hayati, 2015). Prinsip ini
menunjukkan pembelajaran pada Program PPG mampu mendukung
pengembangan keterampilan berpikir tinggi peserta agar memiliki keterampilan
berpikir kritis, kreatif, logis, dan reflektif dalam memecahkan setiap permasalahan
pembelajaran yang dihadapinya dan menjadi sebuah pengalaman yang akan
menuntun ke arah perubahan pembelajaran yang lebih baik. Hal ini sejalan dengan
pandangan Dewey (1997:11) terdapat dua jenis pengalaman yaitu pengalaman
yang bersifat mendidik dan pengalaman yang justru bersifat menghambat
perkembangan individu menuju kedewasaan. Setiap pengalaman yang bersifat
mendidik akan diorganisasikan secara sistematis dan dijadikan pijakan untuk
merumuskan pengalaman yang akan dilalui dan dipelajari oleh individu, sehingga
pengalaman dijadikan sebagai basis dari pendidikan.
Prinsip keempat dampak pengiring (nurturant effects) yang diarahkan
pada pencapaian dampak instruksional (instructional effects), proses pembelajaran
yang diharapkan mengakomodasi upaya pencapaian dampak pengiring. Prinsip ini
mendukung pengembangan soft skill yang diperlukan untuk menjadi seorang guru
profesional, seperti kerjasama tim, kepemimpinan, kebebasan dan sikap yang baik
39
serta menghormati satu sama lain (Calvert, 2016; Widiati & Hayati, 2015). Prinsip
ini akan membantu pengembangan sikap dan kepribadian peserta PPG sebagai
guru disamping penguasaan materi.
Prinsip kelima yang harus diperhatikan dalam pembelajaran pada Program
PPG adalah mekanisme balikan dengan menerapkan tahapan eksplorasi, elaborasi,
konfirmasi, dan koreksi terutama pada saat presentasi hasil workshop, peer
teaching, dan realteaching. Prinsip ini dilakukan secara teratur melalui tugas-
tugas, menulis tes, tes kinerja, dan memberikan umpan balik pada kinerja peserta
didik pada tugas dan tes. Dengan demikian prinsip mekanisme balikan pada
pembelajaran PPG harus dilakukan secara teratur agar dapat diketahui kinerja
pada tugas dan tes dari peserta PPG.
Prinsip keenam dalam pembelajaran Program PPG harus memanfaatkan
teknologi dan informasi. Menurut Cober, Tan, Slotta, So, and Könings (2015)
guru sebagai perancang desain lingkungan belajar penting menggunakan
teknologi dalam pembelajaran, karena peran teknologi dalam pendidikan sangat
penting dalam mendesain proses pembelajaran yang partisipatif yang melibatkan
peserta didik. Guru yang selalu menggunakan teknologi dalam pembelajaran
dapat meningkatkan keterlibatan peserta didik, meningkatkan interaksi dan
partisipasi peserta didik, meningkatkan komunikasi, dan meningkatkan
pembelajaran yang terpusat pada peserta didik serta dengan penggunaan teknologi
yang mampu menggabungkan materi pengajaran dengan berbagai bentuk
teknologi yang bervariasi secara bersamaan akan mampu menstimulasi indrawi
peserta didik tertarik dalam belajar (Aburezeq & Ishtaiwa, 2013; Chen, Chang, &
40
Yen, 2012). Demikian halnya menurut Yueh, Lin, Jo-Yi, and Sheen (2012) bahwa
pembelajaran yang menerapkan teknologi telah terbukti memiliki potensi untuk
menciptakan lingkungan belajar yang berkualitas tinggi. Oleh karena itu, tujuan
penggunaan multimedia dan ICT peserta PPG untuk mengembangkan
pengetahuan dan keterampilan mereka dan menggunakan ICT sebagai media
instruksional (Prasojo et al., 2017; Widiati & Hayati, 2015). Pemanfaatan
teknologi informasi perlu dikembangkan selama kegiatan Program PPG baik
untuk mengembangkan pengetahuan, sikap, dan keterampilan maupun sebagai
media pembelajaran, sehingga prinsip ini menekankan pada penggunaan dan
pemaksimalan teknologi informasi sebagai sumber belajar dan pembelajaran.
Prinsip ketujuh dalam pembelajaran Program PPG menggunakan
pembelajaran kontekstual yaitu dalam pendampingan pemilihan materi atau objek
dalam workshop pengembangan perangkat pembelajaran menggunakan
pendekatan Contextual Teaching and Learning. Peserta Program PPG belajar
melalui bahan dan kegiatan yang sedang dalam konteks pengembangan,
menemukan dan mencerminkan kondisi mereka sebagai guru dan menumbuhkan
kreativitas dan inovasi yang ada dalam diri peserta PPG (Prasojo et al., 2017;
Widiati & Hayati, 2015). Hal ini didukung pendapat Suryawati & Osman (2018)
bahwa efektivitas pengajaran guru dapat ditingkatkan dengan mengikuti prosedur
yang sistematis, dua aspek penting dalam pengajaran sistematis adalah metode
pembelajaran yang digunakan dan pengumpulan informasi yang sedang
berlangsung untuk menghasilkan hasil pembelajaran yang diinginkan dan
menentukan tingkat perencanaan pembelajaran berikutnya. Oleh karena itu, tugas
41
utama guru adalah menggunakan strategi pengajaran yang memungkinkan
pembelajaran efektif. Dengan demikian prinsip ini menekankan pada penggunaan
strategi yang bervariasi dengan berbagai macam sumber belajar yang tersedia.
Prinsip kedelapan dalam pembelajaran Program PPG menggunakan multi
strategi dan aneka sumber belajar. Keberhasilan pembelajaran sangat tergantung
dari strategi yang digunakan seorang pendidik menempatkan peserta didik dalam
situasi dan kondisi dimana ia belajar, sehingga seorang pendidik hendaknya
memberikan kebebasan kepada peserta didik untuk memilih kondisi yang
menyenangkan baginya untuk belajar (Moore, 2010; Peters, 2010; Pring, 2005).
Dengan demikian kegiatan pembelajaran Program PPG dapat menerapkan
berbagai strategi pembelajaran yang inovatif dan menggunakan beraneka sumber
belajar..
Prinsip kesembilan dalam pembelajaran PPG berorientasi pada TPACK
(Technological Pedagogical and Content Knowledge) yaitu integrasi teknologi
informasi, pedagogi, dan content knowledge dalam proses pembelajaran. Oleh
karena itu, selama lokakarya pengembangan perangkat pembelajaran dosen perlu
memastikan mahasiswa menerapkan TPACK, ketika memilih dan menetapkan
strategi, pendekatan ataupun model dan media pembelajaran, harus
memperhatikan karakteristik peserta didik, materi, dan tujuan pembelajaran.
Berdasarkan sistem dan prinsip yang perlu diperhatikan dalam
pembelajaran Program PPG secara teoritis dapat disimpulkan sistem pembelajaran
pada Program PPG mencakup lokakarya/workshop pengembangan perangkat
pembelajaran dan PPL. Untuk melaksanakan sistem pembelajaran tersebut perlu
42
memperhatikan prinsip-prinsip pembelajaran yang mendasarinya yaitu belajar
dengan melakukan, keaktifan, berpikir tingkat tinggi, dampak pengiring,
mekanisme balikan secara teratur, pemanfaatan teknologi informasi, pembelajaran
kontekstual, penggunaan multistrategi dan aneka sumber belajar, serta berorientasi
pada TPACK.
3. Standar Pendidikan Profesi Guru (PPG)
Standar pendidikan guru diperlukan dalam menyediakan kerangka kerja
yang jelas tentang keseluruhan pengetahuan, praktik dan keterlibatan profesional
yang diperlukan pada Program PPG. Standar Program PPG membedakan antara
belajar profesional merupakan pengembangan pengetahuan profesional, praktik
profesional merupakan belajar dari pengalaman dan keterlibatan profesional
merupakan belajar berkelanjutan melalui keterlibatan aktif berbagai kegiatan
pendukung profesi. Pengembangan profesi guru yang efektif merupakan
pembelajaran profesi yang terstruktur menghasilkan perubahan pada pengetahuan
dan praktik mengajar guru, serta peningkatan hasil pembelajaran peserta didik.
Standar pengembangan profesi guru harus dilakukan oleh semua orang
yang berprofesi sebagai guru, untuk meningkatkan harapan pengembangan
profesionalnya, untuk fokus pada pencapaian peningkatan terbesar dalam
keberhasilan peserta didik. Hal ini mengindikasikan bahwa standar ini akan
membantu siapa saja yang ingin memahami secara lebih rinci persyaratan untuk
melaksanakan pendidikan profesi guru yang efektif. Terdapat standar profesi yang
berlaku untuk semua guru yaitu: a) nilai dan hubungan profesional, b) integritas
profesional, c) perilaku profesional, d) praktik profesional, e) pengembangan
43
profesional, f) kerjasama dan kolaborasi profesional (Darling-Hammond, Hyler, &
Gardner, 2017; Departement of Education, 2016; The Teaching Council, 2012).
Standar pendidikan profesi bagi guru berkaitan dengan sejumlah harapan
mengenai pengembangan profesionalnya, karena pembelajaran yang dilakukan
oleh guru profesional akan menunjukkan dampak pada pencapaian hasil belajar
peserta didik terkait dengan materi yang diajarkannya. Dalam mengembangkan
guru yang profesional harus: (a) meningkatkan pengetahuan dan keterampilan
sebagai guru, (b) bertanggung jawab untuk meningkatkan pengajaran, (c)
menunjukkan pengetahuan dan pemahaman tentang bagaimana peserta didik
belajar dan berdampak pada pengajaran, (d) memiliki pengetahuan yang relevan
dengan kurikulum, (e) merefleksikan pendekatan pengajaran dan pembelajaran
secara sistematis dan efektif; dan, (f) mengetahui dan memahami bagaimana cara
menilai ranah hasil belajar peserta didik. Hal ini mensyaratkan untuk menjadi
guru yang profesional senantiasa meningkatkan pengetahuan dan keterampilan,
bertanggungjawab, merefleksikan pendekatan pengajaran dan tahu menilai hasil
pembelajaran (Darling-Hammond et al., 2017; Departement of Education, 2016).
Standar pengembangan profesi guru seperti di Australia mencakup tujuh
standar yang menguraikan apa yang harus diketahui dan dilakukan guru yaitu: a)
tahu peserta didik dan bagaimana mereka belajar, b) tahu konten dan bagaimana
mengajarkannya, c) merencanakan dan melaksanakan pengajaran dan
pembelajaran efektif, d) menciptakan dan memelihara lingkungan belajar yang
aman dan mendukung, e) menilai, memberikan umpan balik dan melaporkan
pembelajaran peserta didik, f) terlibat dalam pembelajaran profesional, g) terlibat
44
secara profesional dengan kolega, orang tua/wali dan masyarakat (O’Meara,
2011). Ketujuh standar tersebut dikelompokkan ke dalam tiga domain yaitu
pengetahuan profesional, praktik profesional dan keterlibatan profesional. Dengan
demikian guru harus memiliki pengetahuan yang berkaitan dengan profesinya
yang dijewantahkan dalam praktik pembelajaran di kelas dan selalu terlibat dalam
berbagai kegiatan pendukung profesinya, misalnya pengembangan pedagogical
content knowledge (PCK) penting dikuasai oleh setiap guru karena berkaitan
dengan bagaimana peserta didik belajar dan materi yang diajarkan (Van Driel &
Berry, 2012).
Indonesia juga melakukan standarisasi terhadap guru agar kompetensinya
teruji dan terukur yang dikembangkan secara utuh dari empat kompetensi utama,
yaitu kompetensi pedagogik, kompetensi profesional, kompetensi sosial dan
kepribadian. Keempat kompetensi tersebut terintegrasi dalam kinerja guru.
Kaitannnya dengan standar pendidikan pada Program PPG dalam
Permenristekdikti Nomor 55 Tahun 2017 disebutkan pada pasal 17 bahwa standar
pendidikan Program PPG terdiri atas: a) standar kompetensi lulusan; b) standar
isi; c) standar proses; d) standar penilaian; e) standar pendidik dan tenaga
kependidikan; f) standar sarana dan prasarana; g) standar pengelolaan; dan h)
standar pembiayaan. Standar ini dijadikan acuan kriteria LPTK dalam
penyelenggaraan program PPG untuk menyelenggarakan pembelajaran yang
mendukung peserta menjadi guru profesional dengan memiliki, menguasai, dan
mampu menerapkan kompetensi akademik dan kompetensi profesional. Dari
delapan standar pendidikan pada program PPG hanya empat standar yang dibahas
45
yaitu standar kompetensi lulusan, standar isi, standar proses dan standar: penilaian
dengan deskripsi berikut.
Standar kompetensi lulusan program PPG merupakan kriteria minimal
mengenai kualifikasi kemampuan lulusan yang mencakup sikap, pengetahuan, dan
keterampilan yang dinyatakan dalam rumusan capaian pembelajaran lulusan
(CPL) dan capaian pembelajaran Bidang Studi (CPBS) Program PPG. Rumusan
capaian pembelajaran lulusan mengacu pada deskripsi capaian pembelajaran
lulusan dalam Standar Nasional Pendidikan Tinggi yang memuat kompetensi
pedagogik, kompetensi kepribadian, kompetensi profesional dan kompetensi
sosial (Permenristekdikti Nomor 55 Tahun 2017 Pasal 18). Sehubungan dengan
standar kompetensi lulusan tersebut, maka standar ini dalam penyelenggaraan
PPG ini dimaksudkan untuk menghasilkan lulusan yang memiliki sertifikat
pendidik sesuai dengan kebutuhan.
Terkait implementasi standar ini dalam Buku Panduan PPG tahun 2018
sebagaimana Pasal 5 Permenristekdikti Nomor 44 tahun 2015 tentang Standar
Nasional Pendidikan Tinggi SNDikti) dan Pasal 18 Permenristekdikti Nomor 55
tahun 2017 tentang Standar Pendidikan Guru (StandarDikgu) yang mencakup
sikap, pengetahuan, dan keterampilan dinyatakan dalam rumusan capaian
pembelajaran lulusan Program PPG yang memuat kompetensi pedagogik,
kompetensi profesional, kompetensi sosial dan kepribadian yang harus dimiliki
oleh peserta PPG beserta sub kompetensi dan indikatornya yang tertera dalam
Lampiran Permenristekdikti Nomor 55 tahun 2017 tentang StandarDikgu
(Kemenristekdikti, 2018: 16).
46
Standar isi pada program PPG merupakan kriteria minimal tingkat
keluasan, kedalaman, urutan, dan saling keterkaitan materi pembelajaran dan
keilmuan dan/atau keahlian Program PPG. Standar isi untuk Program PPG
meliputi isi pembelajaran terkait pengembangan kompetensi pedagogik,
kompetensi kepribadian, kompetensi profesional, dan kompetensi sosial
(Permenristekdikti Nomor 55 Tahun 2017 Pasal 19). Tahap pengembangan
kurikulum Program PPG dilakukan berdasarkan: a) perumusan capaian
pembelajaran lulusan (CPL)/capaian pembelajaran bidang studi (CPBS), b)
penentuan mata kegiatan belajar dan bobot/beban kegiatan belajar, c) perumusan
capaian mata kegiatan (CPMK) dan penyusunan rencana pembelajaran semester
(Kemenristekdikti, 2018b).
Dengan demikian struktur kurikulum PPG tersebut dijabarkan ke dalam
rencana program semester (RPS) Program PPG yang digunakan sebagai
penjabaran lebih lanjut dari tujuan Program PPG. RPS sekurang-kurangnya berisi
capaian pembelajaran workshop/PPL, sub capaian pembelajaran workshop/PPL,
bahan kajian, bentuk/model pembelajaran, pengalaman belajar mahasiswa, alokasi
waktu, indikator penilaian, bobot nilai, dan referensi. Proporsi antara workshop
SSP dan PPL yaitu 60 : 40 dari beban belajar PPG (Kemenristekdikti, 2018b;
Prasojo et al., 2017). Dengan demikian struktur kurikulum PPG berisi workshop
pengembangan perangkat pembelajaran bidang studi yang diimplementasikan
peer teaching dan PPL.
47
Standar proses merupakan kriteria minimal pelaksanaan pembelajaran
pada Program PPG untuk memperoleh capaian pembelajaran lulusan sebagai guru
profesional. Standar proses yang dimaksud mencakup karakteristik proses
pembelajaran, perencanaan proses pembelajaran, pelaksanaan proses
pembelajaran, dan beban belajar PPG Prajabatan adalah 36-40 SKS dengan
karakteristik pembelajaran yaitu interaktif, holistik, integratif, saintifik,
kontekstual, tematik, efektif, kolaboratif, inovatif dan berpusat pada peserta didik
serta mandiri. Implementasi dari standar proses PPG disajikan pada Gambar 1:
Gambar 1. Proses Penyelenggaraan PPG
Berdasarkan mata kegiatan dan bobot kegiatan, Program PPG terbagi
menjadi PPG Prajabatan dan PPG dalam Jabatan dengan mengacu pada
Permenristekdikti Nomor 55 Tahun 2017 tentang StandarDikgu dijelaskan
kegiatan Program Studi PPG Prajabatan sebagaimana disajikan Gambar 2:
48
Gambar 2. Mata Kegiatan PPG Prajabatan
Berdasarkan mata kegiatan PPG Prajabatan pada Gambar 2, kegiatan
pembelajaran pada program PPG dikelompokkan ke dalam tiga kegiatan yaitu
lokakarya pengembangan mata kegiatan umum (MKU), lokakarya pengembangan
perangkat pembelajaran, dan PPL. MKU terdiri dari orientasi awal, penyusunan
rancangan Penelitian Tindakan Kelas (PTK), serta praktik dan seminar hasil PTK.
Hasil Mata kegiatan lokakarya merupakan kegiatan untuk menyusun perangkat
pembelajaran bidang studi dengan bobot SKS keseluruhan sebesar 19 SKS.
Sementara kegiatan PPL berisi kegiatan praktik mengajar dan non mengajar
dengan bobot SKS 19 SKS dan untuk PPG kejuruan, PPL dapat disertai dengan
kegiatan industri. Adapun mata kegiatan, kode dan besaran jumlah SKS mata
kegiatan PPG Prajabatan disajikan pada tabel 1 berikut.
49
Tabel 1. Kelompok Mata Kegiatan PPG Prajabatan
Jumlah
No Kelompok Mata Kegiatan Kode
SKS
1 Mata kegiatan Umum MKU 4
2 Lokakarya Pengembangan
LOK 19
Perangkat Pembelajaran
3 PPL MPL 15
Jumlah 38
Selanjutnya mata kegiatan dan bobot kegiatan Program PPG dalam jabatan
(Daljab) mengacu pada Permenristekdikti Nomor 55 tahun 2017 Pasal 20 Ayat
(11) Beban belajar Program PPG Daljab paling sedikit 24 sks yang dibagi dalam
tiga bentuk pembelajaran sebagaimana disajikan pada Gambar 3.
Gambar 3. Mata Kegiatan PPG Dalam Jabatan
50
Selanjutnya untuk mahasiswa/peserta PPG Daljab mengingat telah
memiliki pengalaman mengajar menjadi guru di sekolahnya, untuk pendalaman
materi dilakukan secara online (daring) dengan bobot 10 SKS. Sedangkan
lokakarya dilakukan secara tatap muka di LPTK dengan bobot 8 SKS dan PPL
dilakukan di sekolah-sekolah sekitar lokasi LPTK dengan bobot 6 SKS
(Kemenristekdikti, 2018b). Adapun mata kegiatan, kode dan besaran jumlah SKS
mata kegiatan PPG Daljab disajikan pada Tabel 2 berikut.
Tabel 2. Kelompok Mata Kegiatan PPG Daljab

No Kelompok Mata Kegiatan Kode Jumlah SKS
1 Pendalaman Materi DAR 10
2 Lokakarya LOK 8
3 PPL PPL 6
Jumlah 24
Standar penilaian pada Program PPG merupakan kriteria minimal
mengenai penilaian proses dan hasil belajar mahasiswa/peserta PPG dalam rangka
pemenuhan capaian pembelajaran lulusan Program PPG. Penilaian terhadap
proses dan hasil belajar mahasiswa meliputi penilaian proses dan produk
pengembangan perangkat pembelajaran, proses dan produk PPL, uji kompetensi
mahasiswa Program. Program PPG diakhiri dengan uji kompetensi yang
diselenggarakan oleh Panitia Nasional yang dilakukan melalui uji tulis dan uji
kinerja sesuai dengan standar nasional kompetensi guru dan mahasiswa/peserta
PPG yang lulus penilaian proses dan produk, uji kompetensi, dan penilaian
kehidupan berasrama memperoleh sertifikat pendidik yang berlaku secara
nasional (Permenristekdikti Nomor 55 Tahun 2017 Pasal 21). Dengan adanya
standar penilaian proses dan hasil belajar mahasiswa/peserta PPG, tentunya
51
capaian pembelajaran lulusan Program PPG dapat terukur dan teruji. Oleh karena
itu, capaian pembelajaran mata kegiatan dirumuskan berdasarkan capaian
pembelajaran bidang studi untuk masing-masing mata kegiatan belajar pada
Program PPG untuk suatu bidang studi.
Pelaksanaan PPG daljab melalui daring pelaksanaan pembelajarannya
memanfaatkan teknologi dengan ditunjuk instruktur PPG yang bertugas sebagai
kurator tugas, dimana instruktur setelah membaca tugas mahasiswa/peserta PPG
harus menentukan apakah tugas dapat diberikan ke peserta atau tugas harus
diganti. Selain itu, tugas instruktur PPG daljab adalah kurator tes, yang harus
menentukan apakah tes dapat diberikan ke peserta atau tes harus diganti.
Selanjutnya tugas instruktur juga membuat topik diskusi dengan cara menuliskan
pemantik diskusi, semua hasil diskusi peserta merupakan komponen penilaian
sehingga forum diskusi hanya dapat digunakan untuk mendiksuiakn materi yang
sedang dibahas dalam kegiatan belajar tersebut (Anggraeni, 2019; Khaerudin,
2019). Intisari dari Program PPG bukan merupakan jalur pintas menjadi guru
profesional, namun harus melalui tahapan proses yang panjang mulai dari lulus
Daring bagi peserta PPG Dalam Jabatan, lapor diri, orientasi, mengikuti
lokakarya, PPL, uji kompetensi mahasiswa PPG (UKMPPG).
Berbagai kajian secara teoritis tentang standar pendidikan profesi guru
baik secara de jure maupun de facto berkonstribusi pada peningkatan
profesionalisasi pengajaran dari profesi guru dan sebagai dasar model
akuntabilitas profesional guru. Hal ini bertujuan untuk memastikan bahwa guru
dapat menunjukkan tingkat pengetahuan profesional, praktik profesional dan
52
keterlibatan profesional yang sesuai dengan yang distandarkan. Jika standar
pendidikan pada PPG terlaksana dengan baik, maka berimplikasi kepada
perancangan, pelaksanaan, dan penilaian pembelajaran dengan mengacu pada
perangkat kompetensi yang dicapai.
4. Sistem Penilaian Pendidikan Profesi Guru (PPG)
Penilaian merupakan komponen penting dalam penyelenggaraan
pendidikan yang berkualitas, keduanya saling terkait dan tidak dapat dipisahkan
karena kualitas pendidikan dapat dilihat dari hasil penilaiannya. Penilaian
mengidentifikasi keberhasilan pendidikan dan hasil dari penilaian tersebut
memiliki fungsi utama dalam proses pendidikan lebih lanjut, memberikan
informasi berharga untuk membantu dalam membuat keputusan tentang kinerja
suatu kelompok misalnya kelas, sekolah atau pembuat kebijakan (Kartowagiran &
Jaedun, 2016; Retnawati, Kartowagiran, Arlinwibowo, & Sulistyaningsih, 2017).
Selain itu, penilaian memberikan informasi penting untuk meningkatkan proses
pendidikan yang mampu menggambarkan hasil belajar komprehensif, dan
kegiatan penilaian itu sendiri dapat dilakukan melalui kegiatan pengukuran
(Anisa, 2017; Ofianto & Suhartono, 2015; Suyata, Mardapi, Kartowagiran, &
Retnawati, 2011). Jika ingin meningkatkan kualitas penyelenggaraan pendidikan,
maka perlu meningkatkan kualitas penilaiannya.
Penilaian yang berkualitas dapat diwujudkan jika tujuan penilaian
dirumuskan dengan jelas, dapat diukur dan mampu menjelaskan keberhasilan dari
tujuan penilaian yang dirumuskan. Kegiatan penilaian perlu diarahkan pada
empat hal, yaitu: a) penelusuran, yaitu menelusuri apakah telah berlangsung
53
sesuai yang direncanakan, b) pengecekan, yaitu untuk mencari informasi apakah
terdapat kekurangan-kekurangan pada peserta didik selama proses pembelajaran,
c) pencarian, yaitu mencari dan menemukan penyebab kekurangan yang muncul,
d) penyimpulan, yaitu menyimpulkan tingkat pencapaian belajar dibandingkan
dengan yang harus dicapai sesuai dengan kompetensi (Mardapi, 2017: 14-15).
Pendapat ini menunjukkan bahwa penilaian menjadi isu yang sangat penting
dalam mengukur capaian kompetensi yang diukur termasuk capaian kompetensi
peserta PPG menjadi guru profesional.
Kaitan antara penilaian dan ketercapaian kompetensi lulusan PPG
dipertegas dalam Permenristekdikti Nomor 55 Tahun 2017 bagian kelima pasal 21
dalam standar penilaian dijelaskan bahwa penilaian proses dan hasil belajar
mahasiswa dilakukan dalam rangka pemenuhan capaian pembelajaran peserta
PPG. Hal ini juga sejalan dengan paradigma penilaian yang merupakan bagian
dari cara membelajarkan peserta didik, jika ingin mengevaluasi pelaksanaan hasil
belajar harus didahului penilaian yang mampu mendorong peserta didik belajar
lebih baik (Mardapi, 2017: 14). Penilaian sebenarnya terbatas pada penafsiran
skor hasil tes atau hasil pengukuran lainnya yang bukan tes (Popham, 1997: 6;
Mardapi, 2017: 162). Pendapat ini memperjelas titik fokus penilaian merupakan
bagian dari evaluasi keberhasilan pembelajaran pada Program PPG.
PPG merupakan suatu program dari kebijakan pemerintah guna
pemantapan kompetensi dasar yang harus dimiliki peserta sebagai seorang guru
profesional, sehingga perlu dinilai dan dievaluasi keberhasilannya. Program perlu
dievaluasi, jika ingin memperbaiki desain, implementasi dan hasil dari
54
pelaksanaan sebuah program menjadi lebih baik, maka harus dilakukan penilaian
(American Educational Research Association & National Council on
Measurement in Education, 2014).
Lingkup penilaian kompetensi mahasiswa/peserta PPG di Indonesia
dikembangkan mengacu pada tuntutan empat kompetensi guru yaitu kompetensi
pedagogik, komptensi profesional, kompetensi sosial dan kompetensi kepribadian
baik dalam konteks pembelajaran maupun dalam konteks kehidupan guru sebagai
anggota masyarakat sebagaimana dipersyaratkan dalam Undang-Undang Nomor
20 Tahun 2003 tentang sistem pendidikan nasional, Undang-Undang Nomor 14
Tahun 2005 tentang guru dan dosen. Selain itu mengacu pada Permendiknas
Nomor 16 Tahun 2007 tentang standar kualifikasi akademik dan kompetensi guru,
serta tertuang dalam Permendikbud Nomor 57 tahun 2012 tentang uji kompetensi
guru, Peraturan Pemerintah Nomor 19 tahun 2017 tentang perubahan Atas
Peraturan Pemerintah Nomor 74 Tahun 2008 tentang Guru dan Permenristekdikti
Nomor 55 Tahun 2017 tentang Standar Pendidikan Guru. Hal ini menunjukkan
bahwa penilaian kompetensi lulusan Program PPG memiliki landasan hukum
yang kuat sebagai pijakannya.
Penilaian penguasaan kompetensi peserta PPG kaitannya dengan
kompetensi pedagogik, kompetensi sosial dan kompetensi kepribadian melalui
penilaian kinerja penguasaan kemampuan menyusun rencana pelaksanaan
pembelajaran untuk pendalaman lebih lanjut dilakukan wawancara sebelum
maupun setelah proses pembelajaran dilaksanakan. Selanjutnya penilaian kinerja
dalam konteks otentik ditekankan pada kualitas kinerja secara keseluruhan selama
55
peserta melakukan PPL melalui pengamatan dan juga dapat dilengkapi dengan
wawancara (Kemenristekdikti, 2017; Prasojo et al., 2017).
Ketentuan mengenai penilaian kinerja PPL dilakukan oleh guru pamong
dan dosen pembimbing lapangan meliputi penilaian praktik mengajar, praktik
persekolahan, kemampuan interpersonal, dan laporan hasil PPL dengan
deskripsi kompetensi yang masih perlu ditingkatkan dalam bentuk rubrik.
Penilaian setiap peserta melalui penilaian portofolio dengan kriteria nilai minimal
kelulusan kegiatan PPL adalah B (3,0) bagi yang gagal diberi latihan tambahan
sampai berhasil mencapai nilai minimal (Kemenristekdikti, 2017; Prasojo et al.,
2017). Untuk bobot penilaian akhir PPL seperti disajikan pada Tabel 3.
Tabel 3. Bobot Penilaian Akhir PPL
No Aspek yang dinilai Bobot

1 Praktik mengajar 4
2 Kegiatan non mengajar 2
3 Kompetensi sosial dan kepribadian 2
4 Laporan PPL dan PTK 2
Jumlah 10
Selanjutnya penilaian dalam konteks ujian akhir melalui uji kompetensi
terdiri atas ujian tulis dan ujian kinerja. Ujian tulis terdiri dari Uji Tulis LPTK
(UTL) dan Uji Tulis Nasional (UTN) yang ditempuh mahasiswa/peserta PPG
setelah lulus dalam kegiatan workshop dan PPL dengan penyelenggaranya
program studi menggunakan seperangkat tes essai yang berupa pemecahan
masalah dan untuk UTN diselenggarakan oleh Ditjen Belmawa mengukur
kompetensi pedagogis dan profesional yang diselenggarakan secara online dan
serentak (Kemenristekdikti, 2017b: 26) sebagaimana dapat dilihat pada Tabel 4:
56
Tabel 4. Rambu-Rambu Ujian Tulis LPTK (UTL)
No Aspek Ujian Deskripsi

1 Materi ujian Materi uji bersumber dari portofolio hasil
workshop, PPL, dan Subject-Specific Pedagogy
(SSP). Bahan ajar SSP dapat berupa modul,
buku teks, media dan lain-lain
2 Bentuk soal Soal berbentuk uraian berbasis kasus dan
berorientasi pada pencapaian SKL PPG
3 Kualitas soal Mengungkap kemampuan kognitif minimal
pada level analisis (C4)
Ada beberapa macam teknik penilaian yang dapat digunakan untuk
menetapkan kualitas proses dan hasil belajar mahasiswa Program PPG seperti
disajikan pada Gambar 4 sebagai berikut.
Gambar 4. Teknik Penilaian Kualitas Proses dan Hasil Belajar PPG

(Kemenristekdikti, 2018b)
57
Mencermati Gambar 4 menunjukkan bahwa teknik-teknik penilaian
tersebut baik tes maupun non tes dapat digunakan untuk menilai kualitas proses
dan hasil belajar peserta/mahasiswa Program PPG. Sebagaimana dinyatakan pada
Buku Pedoman Penyelenggaraan PPG tahun 2018 (Kemenristekdikti, 2018: 17)
dijelaskan rincian atau pembagian teknik penilaian menurut standar pendidikan
guru ini adalah: a) penilaian proses dan produk pengembangan perangkat
pembelajaran dapat menggunakan teknik analisis isi dokumen; b) proses dan
produk Praktik Pengalaman Lapangan (PPL) dapat menggunakan teknik observasi
dan analisis isi dokumen; c) uji kompetensi berupa tes tulis dan tes kinerja
(performance test), mencakup penilaian proses dan produk kegiatan (lokakarya
dan PPL); dan d) penilaian kehidupan bermasyarakat di asrama/sarana lain dapat
menggunakan teknik kuesioner dan observasi.
Memperhatikan sistem dan teknik penilaian tersebut dalam menentukan
kelulusan peserta menunjukkan bahwa penilaian kompetensi lulusan PPG menjadi
sangat penting untuk mendapatkan keakuratan dan konsistensi penilaian dari
mahasiswa/peserta PPG. Akurasi dan konsistensi penilaian pada PPG merupakan
prasyarat mutlak untuk menghasilkan penilaian kompetensi lulusan PPG yang
objektif dan akuntabel. Menurut Kane, Kerr, & Pianta, (2014: 1) mengajar adalah
interaksi yang kompleks antara guru, siswa, dan materi yang tidak hanya satu
instrumen yang digunakan sebagai alat pengukuran untuk dapat menilainya,
sehingga untuk memastikan ketepatan dalam pengukurannya, menimbulkan
tantangan besar dalam mendesain instrumen penilaian dan melaksanakannya agar
mampu mengukurnya dengan efektif.
58
Guna menghasilkan penilaian yang objektif dan akuntabel dilakukan
berbagai kajian teoritik yang mampu menggambarkan karakteristik dari
kompetensi yang diukur, sehingga bisa digunakan sebagai point pencermatan
dalam penetapan dimensi yang diukur yang selanjutnya diuraikan menjadi
indikator. Indikator ini yang menjadi acuan dari dimensi yang dinilai dari capaian
penguasaan kompetensi mahasiswa/peserta PPG dengan merujuk kepada empat
kompetensi yang dipersyaratkan yaitu kompetensi pedagogik, sosial, kepribadian
dan kompetensi profesional dengan deskripsi sebagai berikut.
a. Kompetensi Pedagogik
Kompetensi adalah kemampuan seseorang untuk melakukan pekerjaan
atau tugas yang didasarkan pada pengetahuan, sikap, dan keterampilan yang
sesuai dengan tuntutan pekerjaan. Kompetensi juga merupakan kebulatan
penguasaan pegetahuan, keterampilan, dan sikap yang ditampilkan melalui unjuk
kerja yang diharapkan bisa dicapai seseorang setelah menyelesaikan suatu
program pendidikan (Hakim, 2015; Kartowagiran, 2012b). Kompetensi yang
berkenaan langsung dengan profesi guru dan banyak disoroti dalam proses
pembelajaran adalah kompetensi pedagogik.
Kompetensi pedagogik adalah serangkaian prinsip-prinsip yang efektif
dalam mengajar. Kompetensi ini secara khas mencirikan dan membedakan
profesi guru dengan profesi lainnya yaitu fokus pada penguasaan terhadap teori
perkembangan dan teori-teori belajar mutlak ada pada guru, serta mampu
mengoptimalkan potensi peserta didik dan mampu melakukan penilaian terhadap
kegiatan pembelajaran yang telah dilakukan, sehingga dapat dikatakan kompetensi
59
pedagogik berkaitan dengan kemampuan guru mengelola peserta didik dan
mengelola pembelajaran dengan baik yang mendidik dan dialogis (Kartowagiran,
2012b; Nur, 2014; Pamungkas et al., 2019; Robinson & Campbell, 2010;
Wardoyo, 2015; Yasin, 2012). Artinya untuk menjadi seorang guru harus
memahami tujuan pembelajaran dan mampu mengelola proses pembelajaran.
Kaitan dengan kemampuan mengelola proses pembelajaran, Shulman
(2005) menggambarkan kompetensi pedagogik sebagai bentuk karakteristik
pembelajaran. Terdapat tiga aspek dari praktik profesional guru yang terintegrasi
dengan kompetensi pedagogik, yaitu: 1) berpikir, mempekerjakan pengetahuan
secara profesional, 2) melaksanakan, memanfaatkan keterampilan profesi, dan 3)
bertindak dengan integritas, mengamalkan nilai-nilai etika dan profesi. Pendapat
ini mempertegas bahwa kompetensi pedagogik adalah menyangkut pengetahuan
dan keterampilan pengajaran yang mengacu pada kinerja pembelajaran.
Kompetensi pedagogik sangat penting dan menjadi tantangan dalam
perspektif guru profesional. Kompetensi ini cenderung digunakan dalam standar
profesional minimum guru, yang akan meningkatkan peran dari profesinya serta
pada program pendidikan guru menjadi suatu kebutuhan untuk terus ditingkatkan
(Jurčić, 2014; Martínez, 2010; Suciu & Mata, 2011). Ini mengindikasikan bahwa
rendahnya kompetensi pedagogik guru dapat menyebabkan kualitas proses
pembelajaran akan rendah, sehingga kompetensi ini perlu selalu dikembangkan.
Pengembangan kompetensi ini memiliki banyak dimensi yaitu dimensi
pertama, pengembangan individu dan spesifik pada jalur karir yang dipilih.
Dimensi kedua, adalah perguruan tinggi mengembangkan kompetensi pedagogik
60
melalui program praktik pengalaman lapangan untuk mempromosikan mahasiswa
yang siap dengan segala kemampuannya mengabdikan diri dalam dunia
pendidikan. Dimensi ketiga, meletakkan kerangka dasar dan prosedural mengenai
kemampuan guru dalam peraturan yang relevan. Dimensi keempat adalah
pengembangan standar nasional pendidikan guru berbasis kompetensi.
Kompetensi pedagogik guru telah menjadi standar kompetensi yang harus
dikuasai calon guru dan guru di negara-negara bagian Eropa, terutama di bagian
Utara dan Barat (Merkt, 2017). Indonesia sendiri juga telah mensyaratkan
kompetensi pedagogik sebagai salah satu kompetensi yang harus dimiliki calon
guru dan guru dengan selalu memfokuskan perhatian pada peningkatan
kompetensi ini. Keberhasilan guru dalam melaksanakan pembelajaran sangat
terkait dengan kompetensi pedagogik dan kompetensi ini memiliki hubungan
yang signifikan dengan kualitas pembelajaran yang dilaksanakannya.
Kualitas pembelajaran dari seorang guru sangat dipengaruhi oleh
kompetensi pedagogik. Orazbayeva (2016) mengemukakan bahwa idealnya guru
yang memiliki kompetensi pedagogik ditunjukkan dengan 4 dimensi yaitu: 1)
effective classroom management, 2) effective teaching practices, 3) effective
assessment, 4) technology skill. Keempat dimensi kompetensi tersebut
dideskripsikan sebagai berikut.
Dimensi pertama, effective teaching practices yaitu pengelolaan kelas
dengan cara: 1) mengidentifikasi karakteristik peserta didik, 2) memberikan
kesempatan yang sama kepada semua peserta didik, 3) merencanakan dan
menggorganisasikan pembelajaran, 4) melakukan berbagai strategi untuk
61
menciptakan hubungan yang positif, kerjasama dan mencapai tujuan belajar.
Dimensi kedua, effective teaching practices yaitu melaksanakan praktik mengajar
yang efektif dengan cara: 1) mengidentifikasi, memilih dan menerapkan berbagai
strategi mengajar yang dapat membantu peserta didik terlibat aktif dalam
pembelajaran, 2) melakukan aktivitas pembelajaran secara bervariasi atau tidak
monoton, 3) mengidentifikasi masalah yang dihadapi peserta didik dan
membantunya dalam memecahkannya, 4) membantu peserta didik menggunakan
sumber belajar, 5) memberikan banyak kesempatan kepada peserta didik untuk
bertanya, mempraktekkan dan berinterkasi dengan peserta didik lainnya. Kedua
dimensi ini memiliki keterkaitan satu sama lain dalam menunjang keberhasilan
pembelajaran yang dilaksanakan guru.
Dimensi ketiga, effective assessment yaitu melaksanakan penilaian yang
efektif dengan cara: 1) menyusun alat penilaian yang sesuai dengan tujuan
pembelajaran, 2) melaksanakan penilaian dengan berbagai jenis dan teknik
penilaian, 3) melibatkan peserta didik dalam kegiatan penilaian untuk membantu
mereka menjadi sadar akan kekuatan dan kelemahan mereka, 4) mendorong
peserta didik memiliki keinginan prestasi belajar yang tinggi, 5) memanfaatkan
hasil penilaian dari peserta didik dan merefleksikannya untuk meningkatkan
pembelajaran selanjutnya. Dimensi keempat, technology skill yaitu memiliki
keterampilan dalam menggunakan teknologi. Guru harus mengetahui kapan dan
bagaimana menggunakan teknologi pendidikan saat ini, serta mampu
mengidentifikasi dan memilih yang paling sesuai dengan materi yang diajarkan
dan mampu memaksimalkan dengan waktu pembelajaran yang ada. Dari kedua
62
dimensi ini menunjukkan bahwa menjadi seorang guru yang berkualitas harus
mampu melaksanakan penilaian yang efektif dan dan terampil dalam
menggunakan teknologi dalam pembelajaran.
Guru berkualitas tercermin dari pengetahuan dan kemampuannya dalam
merencanakan pembelajaran, mengelola kelas, memilih metode dan strategi
pembelajaran, menggunakan media pendukung hingga melakukan evaluasi
pembelajaran. Selain itu, untuk mewujudkan guru yang berkualitas, guru
senantiasa aktif belajar memperkaya pengetahuan dan kemampuan yang
dimilikinya melalui seminar, lokakarya, dan kegiatan pendukung lainnya (Calvert,
2016; Griffin & Care, 2014; König & Pflanzl, 2016).
Menurut Lewin & Shoemaker, (2011: 4) sistem penilaian guru
memasukkan empat unsur penting: 1) valid dalam menilai didasarkan pada
sejumlah sumber data, termasuk pengamatan langsung, penilaian kinerja,
penilaian diri, tes, dan tugas kelas yang mencerminkan kemampuan siswa dari
waktu ke waktu, 2) keamanan penilaian yang diberikan di bawah kondisi yang
terkendali (selama waktu tertentu), yang mana tidak ada bantuan yang diberikan,
3) penilaian kelas, 4) catatan yang menyediakan bukti pengetahuan, keterampilan
dan pengembangan peserta didik dari waktu ke waktu. Sementara menurut
Kartowagiran, Jaedun, and Hamdi (2017) bahwa guru dapat melakukan penilaian
ini kapan saja baik melalui pengamatan langsung maupun tes harian. Melalui
pengamatan langsung, guru mungkin dapat mengidentifikasi kemajuan dan
pencapaian sikap peserta didik sehingga penilaian tersebut harus menjadi sarana
untuk meningkatkan kinerja mengajar guru, yang dikenal sebagai assessment for
63
learning (AfL), dan menjadi sarana untuk meningkatkan pembelajaran peserta
didik, yang dikenal sebagai assessment as learning (AaL).
Keempat dimensi kompetensi pedagogik tersebut secara eksplisit
menunjukkan bahwa guru perlu memiliki kemampuan dalam hal: 1) memilih
materi belajar yang harus diajarkan, 2) menetapkan kriteria keberhasilan
pembelajaran dan memberitahukan kriteria tersebut kepada peserta didik, 3) guru
menunjukkan kepada peserta didik belajar menggunakan pengetahuan dan
keterampilannya melalui pemodelan, 4) melakukan evaluasi terhadap peserta
didik, 5) memberikan kesempatan perbaikan untuk memperoleh pengetahuan/
keterampilan jika diperlukan, 6) menutup kegiatan pembelajaran di akhir
pelajaran. Selain itu, guru juga penting memiliki kesadaran dan kesiapan untuk
melakukan perubahan atau perbaikan selama proses belajar seperti membiasakan
peserta didik melakukan aktivitas pembelajaran yang mendukung peserta didik
memiliki kemampuan Higher Order Thinking Skills (HOTS), hal ini penting
untuk membantu peserta didik dalam memecahkan masalah baru, aklimatisasi diri,
dan membuat keputusan tentang masalah tertentu (Retnawati, Djidu, Apino, &
Anazifa, 2018). Pendapat ini menunjukkan bahwa kompetensi pedagogik yang
perlu dimiliki guru terkait kemampuan dalam hal pemilihan materi, penetapan
kriteria keberhasilan pembelajaran, penggunaan berbagai strategi pembelajaran,
melakukan penilaian dan perbaikan pembelajaran serta menutup pembelajaran.
Jika mampu melakukan berbagai hal tersebut, maka hal ini akan menjadikan
pembelajaran yang dilaksanakan guru berkualitas.
64
Kaitannya dengan standar kompetensi pedagogik guru dalam penilaian
pendidikan, Sanders et al. (1999) mengemukakan bahwa menurut American
Federation of Teachers (AFT), National Council on Measurement in Education
(NCME), dan National Education Association (NEA) terdapat 7 (tujuh) standar
lingkup peran dan tanggung jawab guru dalam penilaian peserta didik yaitu: “1)
terampil dalam memilih metode penilaian, 2) terampil dalam mengembangkan
metode penilaian, 3) terampil dalam merancang dan menafsirkan hasil penilaian,
4) terampil menggunakan hasil penilaian, 5) terampil dalam mengembangkan
prosedur penilaian, 6) terampil dalam mengkomunikasikan atau menyampaikan
hasil penilaian, 7) terampil dalam mengenali metode penilaian yang tidak pantas,
tidak etis, illegal, dan menggunakan informasi penilaian”. Sebagai pendukung
pengembangan sistem pembelajaran menyelaraskan penilaian guru dan peserta
didik dengan tujuan utama untuk meningkatkan keduanya (National Education
Association, 2010). Hal ini menunjukkan bagaimana standar pembelajaran dapat
memiliki hubungan yang sistemik antara pengajaran guru dengan penilaian yang
dilakukan.
Idealnya dalam melakukan penilaian harus dipersiapkan dengan baik
terutama dalam mengembangkan instrumen penilaian yang baik dan tepat, namun
kemampuan tersebut jarang dikuasai oleh seorang guru seperti memutuskan
indikator yang sesuai dengan tujuan pembelajaran menjadi masalah besar bagi
guru, belum lagi menjabarkannya ke dalam beberapa item. Banyak guru sering
mengeluh dalam proses penilaian seperti masalah dalam penilaian kognitif yaitu
dalam mengkonstruksi item tes, dalam penilaian sikap para guru tidak dapat
65
mendesain instrumen yang baik dari perumusan definisi konseptual dari
perumusan definisi operasional hingga perumusan indikator dan menguji item
(Retnawati, Hadi, & Nugraha, 2016; Retnawati, Munadi, et al., 2017).
Berbagai pendapat di atas, mempertegas bahwa kompetensi pedagogik
menjadi sangat penting dimiliki dan dikuasai calon guru dan guru di Indonesia.
Kompetensi pedagogik mendukung dan membantu mereka dalam meningkatkan
kemampuannya pada proses pembelajaran. Jika merujuk pada buku Pedoman
Penyelenggaraan Program PPG tahun 2018 terdapat capaian kompetensi
pedagogik yang harus dikuasai oleh mahasiswa/peserta PPG ini beserta
subkompetensi dan indikatornya seperti disajikan dalam Tabel 5.
Tabel 5. Kompetensi Pedagagik, Subkompetensi, dan Indikatornya
Kompetensi Sub Kompetensi Indikator

Kompetensi 1. Merencanakan a. Merumuskan indikator kompetensi dan capaian
Pedagogik pembelajaran pembelajaran berdasarkan standar kompetensi
lulusan
b. Mengorganisasikan materi, proses, sumber, media,
penilaian, dan evaluasi pembelajaran
c. Menyusun Rencana Pelaksanaan
Pembelajaran (RPP) sesuai silabus dengan
menerapkan prinsip Techno-Pedagogical Content
Knowledge (TPACK)
2. Melaksanakan Mewujudkan suasana dan proses pembelajaran yang
Pembelajaran mendidik dan mencerdaskan sesuai dengan kaidah
pedagogik untuk memfasilitasi pengembangan potensi
diri dan karakter peserta didik
3. Menilai dan a. Melaksanakan penilaian yang otentik-holistik yang
Mengevaluasi mencakup ranah sikap, pengetahuan, dan
Pembelajaran keterampilan (assessment of learning)
b. Melaksanakan penilaian sebagai proses belajar
(assessment as learning)
c. Menggunakan hasil penilaian untuk meningkatkan
kualitas pembelajaran (assessment for learning)
66
Berdasarkan Tabel 5 menunjukkan secara teoritis bahwa penilaian capaian
kompetensi pedagogik yang harus dikuasai oleh mahasiswa/peserta PPG perlu
dikembangkan meliputi seperangkat kemampuan yang dikuasai dalam
merencanakan pembelajaran, melaksanakan pembelajaran, menilai dan
mengevaluasi pembelajaran dengan sub kompetensi yaitu: kemampuan dalam
merencanakan pembelajaran dapat dikembangkan dari indikator merumuskan
indikator kompetensi dan capaian pembelajaran berdasarkan standar kompetensi
lulusan, mengorganisasikan materi, proses, sumber, media, penilaian, dan evaluasi
pembelajaran serta kemampuan menyusun Rencana Pelaksanaan Pembelajaran
(RPP) sesuai silabus dengan menerapkan prinsip Techno-Pedagogical Content
Knowledge (TPACK). Kemampuan dalam melaksanakan pembelajaran
dikembangkan dari indikator: kemampuan dalam mewujudkan suasana dan proses
pembelajaran yang mendidik, kemampuan dalam mewujudkan suasana dan proses
pembelajaran yang mencerdaskan sesuai dengan kaidah pedagogik serta
kemampuannya dalam memfasilitasi pengembangan potensi diri dan karakter
peserta didik.
Selanjutnya kemampuan dalam menilai dan mengevaluasi pembelajaran
dikembangkan dari indikator yang meliputi: kemampuan melaksanakan penilaian
yang otentik-holistik yang mencakup ranah sikap, pengetahuan, dan keterampilan
(assessment of learning), kemampuan melaksanakan penilaian sebagai proses
belajar (assessment as learning), dan kemampuan menggunakan hasil penilaian
untuk meningkatkan kualitas pembelajaran (assessment for learning). Pentingnya
penguasaan capaian kompetensi pedagogik oleh mahasiswa/peserta PPG yang
67
harus dikuasainya adalah untuk mengembangkan kemampuan peserta didiknya
secara maksimal. Oleh karena itu, diperlukan instrumen penilaian yang mampu
mengukur kompetensi ini pada program PPG agar penilaian dari kompetensi ini
teruji dan terukur dalam mengestimasi kemampuan mahasiswa/peserta PPG
merencanakan pembelajaran dan melaksanakan pembelajaran dengan baik.
b. Kompetensi Profesional
Kompetensi profesional termasuk kemampuan, keterampilan, pengetahuan
dan sikap yang dibutuhkan mencapai tujuan profesional secara efisien.
Kompetensi profesional guru umumnya dipahami sebagai kebutuhan individu
guru yang memiliki kecenderungan bergerak secara kontinum berdasarkan
keterampilan yang dimiliki, karena kompetensi ini berkaitan dengan kemampuan
guru dalam menguasai materi bidang studi secara luas dan mendalam yang
mencakup penguasaan subtstansi isi materi kurikulum mata pelajaran di sekolah
dan substansi keilmuwan yang menaungi materi kurikulum tersebut
(Kartowagiran, 2012b; Zinn, 2017). Kompetensi ini secara implisit membedakan
keterampilan yang dimiliki setiap guru, yang dapat dipelajari dan berubah, karena
kompetensi ini berkaitan dengan kemampuan dan kewenangan guru dalam
menjalankan profesi keguruan secara profesional.
Guru yang profesional memiliki komitmen tidak hanya sekedar memenuhi
seperangkat kriteria teknis dalam mencapai tingkat kompetensi yang terkait
dengan pekerjaannya. Kompetensi profesional guru sangat penting dalam
membantu mengatur strategi pengembangan pendidikan nasional dan pemodelan
kurikulum pendidikan dengan fokus pada tantangan dan perkembangan era
68
globalisasi (Orazbayeva, 2016). Oleh karena itu, Kamerilova et al. (2018)
mengemukakan pembentukan kompetensi profesional guru-guru di masa depan,
diperlukan perbaikan proses sistem pendidikan guru di perguruan tinggi secara
terpadu dalam menyiapkan calon guru yang profesional. Hakim (2015)
menyatakan indikator yang dapat digunakan untuk mengukur kompetensi
profesional seorang guru mencakup pemahaman tentang kurikulum yang sesuai
dengan bidang studi yang diajar, memahami konsep yang berkaitan dengan ilmu
pengetahuan lain, serta menguasai langkah dalam penelitian untuk
mengembangkan bahan ajar. Ketiga pendapat ini mempertegas bahwa kompetensi
profesional guru sangat penting dalam meningkatkan sistem pendidikan nasional
dikarenakan untuk menjadi guru yang profesional ia harus memiliki pengetahuan
yang luas dan mendalam mengenai bidang studi yang diajarkan kepada peserta
didik dan metodologinya serta memiliki pengetahuan yang fundamental tentang
pendidikan.
Mencermati permasalahan di atas, maka penilaian kompetensi profesional
mahasiswa/peserta Program PPG sangat penting untuk dilakukan. Dengan
dilakukan penilaian kompetensi profesional akan mampu membekali mereka
memiliki kemampuan penguasaaan materi pembelajaran secara luas dan
mendalam yang sekiranya dapat mungkin membimbing peserta didik untuk
memenuhi standar kompetensi yang ditetapkan. Penilaian kompetensi profesional
pada Program PPG dapat dinilai secara lengkap, jika memperhatikan item-item
yang ada pada instrumen yang digunakan dalam menilai kompetensi profesional
guru di Indonesia seperti instrumen pada uji kompetensi guru dan instrumen
69
penilaian kinerja guru kelas/mata pelajaran. Jika merujuk pada Pedoman PPG
terdapat capaian kompetensi profesional yang harus dimiliki oleh lulusan program
PPG ini beserta subkompetensi dan indikatornya seperti disajikan dalam Tabel 6.
Tabel 6. Kompetensi Profesional, Subkompetensi, dan Indikatornya

Kompetens 1. Menguasai materi a. Menganalisis kompetensi (capaian
i pelajaran pembelajaran) sebagai dasar pemilihan
profesional secara luas dan materi
mendalam b. Menerapkan dan mengevaluasi materi,
struktur, konsep, dan pola pikir keilmuan
yang mendukung pengembangan ilmu
pengetahuan, teknologi, dan seni (Ipteks)
2. Menguasai dan a. Menguasai konsep, pendekatan, teknik,
menemukan konsep, atau metode keilmuan, teknologi, atau
pendekatan, teknik, seni yang relevan
dan metode ilmu b. Menemukan konsep, pendekatan, teknik,
pengetahuan, atau metode baru dalam ilmu
teknologi, atau seni pengetahuan, teknologi, atau seni yang
yang relevan relevan
Berdasarkan Tabel 6 menunjukkan secara teoritis bahwa penilaian
kompetensi profesional yang perlu dikembangkan meliputi seperangkat
kemampuan yang dimiliki dalam menguasai materi pelajaran secara luas dan
mendalam, menguasai dan menemukan konsep, pendekatan, teknik, dan metode
ilmu pengetahuan, teknologi, atau seni yang relevan. Sub kompetensi yang dinilai
yaitu kemampuan menguasai materi pelajaran secara luas dan mendalam yang
dapat dikembangkan dari indikator: kemampuan dalam menganalisis kompetensi
(capaian pembelajaran) sebagai dasar pemilihan materi, dan kemampuan dalam
menerapkan dan mengevaluasi materi, struktur, konsep, dan pola pikir keilmuan
70
yang mendukung pengembangan ilmu pengetahuan, teknologi, dan seni (Ipteks).
Kemampuan dalam menguasai dan menemukan konsep, pendekatan, teknik, dan
metode ilmu pengetahuan, teknologi, atau seni yang relevan dikembangkan dari
indikator: kemampuan dalam menguasai konsep, pendekatan, teknik, atau metode
keilmuan, teknologi, atau seni yang relevan dan kemampuan dalam menemukan
konsep, pendekatan, teknik, atau metode baru dalam ilmu pengetahuan, teknologi,
atau seni yang relevan. Jika kompetensi profesional peserta program PPG yang
dinilai dilaksanakan sesuai dengan komponen dan sistem penilaiannya, maka
tentunya akan mampu memberikan informasi terkait penguasaan kompetensi yang
dimiliki peserta dengan akurasi yang tinggi.
c. Kompetensi Kepribadian
Kepribadian adalah karakteristik seseorang yang mencerminkan tingkah
lakunya sehari-hari yang membedakan dengan individu lainnya. Teori kepribadian
telah memainkan peran penting dalam psikologi positif, dan salah satu temuan
yang paling konsisten di antara prediktor yang memengaruhi sifat kepribadian
terkuat adalah kebahagiaan dan kepuasan hidup. Setiap individu memiliki
kepribadian yang berbeda, karena kepribadian sebagai pola perilaku yang
kompleks yang tertanam secara mendalam dan sebagai karakter psikologis yang
muncul secara otomatis pada setiap individu (Jordan, 2011; Matthews, Deary, &
Whiteman, 2009; Villanueva, 2010).
Kepribadian mengacu pada pola perilaku yang stabil atau sifat yang
memengaruhi individu untuk bertindak secara konsisten, kepribadian juga
menggambarkan dan menjelaskan perilaku seseorang dalam hal sifat kepribadian
71
yang dimilikinya seperti: bertanggungjawab, kreatif, dan komunikatif serta
kepribadian adalah organisasi-organisasi dinnamis dari sistem-sistem psikifisik
dalam indvidu yang turut menentukan cara-caranya yang unik dalam
menyesuaikan diri dengan lingkungan (Chamorro-Premuzic & Furnham, 2006,
2014; Nicholson, 2003). Hal ini menunjukkan bahwa kepribadian mencerminkan
setiap tindakan dan tingkah laku seseorang, termasuk setiap perkataan, tindakan,
dan tingkah laku dari seorang guru menceminkan kepribadiannya sebagai guru.
Kepribadian seorang guru adalah proyeksi diri kepada orang lain yang
membantu guru menjadi peka terhadap kebutuhan peserta didik dan memberikan
pengetahuan dan keterampilan yang diperlukan untuk membuat peduli pada
lingkungan belajar yang sehat, menjadi pribadi yang terbuka dan tidak emosional,
memiliki kredibilitas dan ketulusan dalam mengekspresikan perasaan dan
menjalin hubungan dengan sesama, memiliki semangat yang tinggi dalam bekerja
secara optimal, memiliki keterampilan berkomunikasi, kreatif, produktif, memiliki
etika kerja yang tinggi, dan komitmen terhadap profesi serta bersedia dan
memiliki kesadaran untuk terus mengembangkan kemampuannya (Mirzagitova &
Akhmetov, 2015; Mkpanang, 2015; Wardoyo, 2015).
Guru dalam melaksanakan tugasnya sebagai pengajar dan pendidik harus
mampu menjadi pribadi yang dapat dicontoh dan dijadikan sebagai figur teladan
dan panutan bagi peserta didik, memiliki kesadaran sosial/berempati kepada
sesama, mampu menjalin hubungan saling percaya, mampu menyelaraskan diri
dengan berbagai tipe individu, mampu memotivasi diri dan peserta didik serta
sebagai seorang guru mampu mencerminkan kepribadian yang mantap, stabil,
72
dewasa, arif, dan berwibawa, menjadi teladan bagi peserta didik dan berakhlak
mulia (Kartowagiran, 2011, 2012b; Mangkunegara & Puspitasari, 2015). Oleh
karena itu, kompetensi kepribadian penting untuk dinilai dikarenakan kompetensi
ini mencakup kemantapan pribadi dan akhlak mulia dari guru sebagai orang yang
ditiru dan digugu oleh peserta didiknya, sehingga guru perlu memiliki sikap
kedewasaan, arif, teladan dan berwibawa.
Kompetensi kepribadian merupakan salah satu kompetensi guru
profesional dan tidak terpisahkan dengan kompetensi lainnya dikarenakan
kompetensi ini merupakan perpaduan antara pengetahuan, kemampuan, dan
penerapan dalam melaksanakan tugas sebagai guru. Guru harus senantiasa
mengembangkan kompetensi kepribadiannya dalam menjalin komunikasi dengan
kelompok-kelompok sosial meskipun memiliki bahasa dan budaya yang berbeda
seperti toleransi, tanggung jawab, inisiatif, dan menjalin komunikasi dengan siapa
saja, selain itu seseorang yang memiliki kompetensi kepribadian ditandai dengan
adanya inisiatif yang tinggi, penetapan tujuan yang realistis, memiliki
perencanaan yang substansial, memiliki kesabaran dalam upaya memberikan
pelayanan untuk mencapai tujuan. Sebaliknya, orang yang tidak memiliki
kompetensi kepribadian menjadi pribadi yang pasif, memiliki tujuan yang tidak
menentu dan dan akhirnya merasa diri selalu gagal (Orazbayeva, 2016; Tyler,
1978). Pendapat ini mengindikasikan kepribadian seorang guru yang terpenting
adalah toleransi, tanggung jawab, inisiatif, dan menjalin komunikasi dengan siapa
saja yang sangat dibutuhkan oleh seorang guru sebagai teladan bagi peserta
didiknya sebagai pribadi yang ditiru dan digugu.
73
Guru sebagai panutan seharusnya tidak menunjukkan citra negatif di depan
peserta didik, karena akan memberikan pengaruh buruk pada perkembangan
karakter peserta didik, ketika perilaku buruk terjadi di antara para guru, para
peserta didik mungkin meniru dan membuat kebiasaan itu. Guru diharapkan
memiliki kepribadian yang mantap dan stabil, dewasa yang ditunjukkan dengan
bertindak sesuai dengan norma agama, norma hukum, norma sosial, senang
bekerja, konsisten dalam bertindak, kemandirian dalam bertindak dan memiliki
etika kerja sebagai seorang guru, serta memiliki kepribadian yang bijaksana,
berwibawa dan berkarakter mulia, menampilkan tindakan yang bermanfaat bagi
peserta didik, sekolah dan masyarakat, menunjukkan keterbukaan dalam
bertindak, memiliki sikap positif yang dapat diikuti peserta didik dan perilaku
yang dihormati. Selain itu, dalam proses pembelajaran, para guru penting
memberikan contoh model bagaimana berperilaku di sekolah sesuai dengan ajaran
agama dan peraturan sekolah serta guru senantiasa mengingatkan peserta didik
akan perbuatan yang baik dan mengevaluasi perilaku peserta didik (Hakim, 2015;
Kartowagiran & Maddini, 2015). Oleh karena itu, dalam keadaan apa pun, guru
hendaknya selalu memberikan teladan yang baik bagi peserta didik.
Kompetensi kepribadian juga mencakup nilai-nilai yang ada pada
kepribadian seorang guru dan dapat disalurkan kepada para peserta didik dalam
proses belajar sehingga tercipta pembelajaran yang kondusif, sehingga guru yang
efektif senantiasa melengkapi dirinya dengan kepribadian yang baik, humoris,
antusias dan memiliki kreativitas (Archer & Hughes, 2011; Pahrudin, Martono, &
Murtini, 2016). Kedua pendapat ini menunjukkan bahwa jika guru memiliki
74
kompetensi kepribadian yang baik, maka guru yang bersangkutan akan selalu
memahami kekurangan diri untuk terus merefleksi diri.
Guru yang mampu memahami kekurangan diri sendiri akan selalu belajar
untuk menutup kekurangan itu, sehingga kompetensi ini menjadi tuntutan
pendidikan di berbagai negara. Menurut Russian Federation Education Act dalam
konsep Federal Education Development Target Program for 2011-2015
disebutkan perkembangan tuntutan pada guru meningkat, terutama kepribadian
dari seorang guru, tanggung jawab dan memiliki kemampuan yang komunikatif
ditetapkan sebagai prioritas dari pendidikan guru yang profesional (Olesova &
Borisova, 2016). Dengan demikian karakter kepribadian guru yang diinginkan
peserta didik perlu untuk dikembangkan pada penilaian kompetensi kepribadian
yang harus dikuasai mahasiswa/peserta Program PPG.
Temuan Piri, Keshtiaray, and Saadatmand (2016) menyatakan bahwa
terdapat hubungan yang signifikan antara kompetensi kepribadian guru dengan
kinerja peserta didik. Jika guru ramah, perhatian, baik, teliti, terbuka, dan tidak
mudah emosi dapat meningkatkan kinerja belajar peserta didik. Dengan demikian
kompetensi kepribadian menjadi sangat penting untuk dinilai pada capaian
penguasaan kompetensi mahasiswa/peserta PPG. Adanya penilaian pada
kompetensi ini akan mampu membekali mereka memiliki kemampuan yang
berhubungan dengan sikap dan kepribadian sebagai calon guru atau guru.
Idealnya penilaian kompetensi kepribadian pada Program PPG mencakup
komponen kompetensi kepribadian yang dipersyaratkan. Target minimal
kompetensi kepribadian yang harus dimiliki mahasiswa setelah mereka
75
melaksanakan PPG adalah: 1) menunjukkan sikap dewasa dalam berpikir dan
bertindak, 2) memiliki perilaku dan bertutur kata sopan, 3) memiliki perilaku
ilmiah sebagai seorang akademisi, 4) menunjukkan rasa tanggung jawab yang
tinggi dalam melaksanakan tugas, 5) memiliki kedisiplinan yang tinggi dalam
melaksanakan tugas dan kewajiban, 6) mampu menampilkan diri sebagai calon
guru yang baik. Oleh karena itu, diperlukan pengembangan instrumen penilaian
kompetensi kepribadian pada Program PPG yang dapat mengungkap penguasaan
kompetensi tersebut pada mahasiswa/peserta PPG secara lengkap. Jika merujuk
pada buku Pedoman PPG terdapat capaian kompetensi kepribadian yang harus
dimiliki oleh lulusan program PPG ini beserta subkompetensi dan indikatornya
seperti disajikan dalam Tabel 7.
Tabel 7. Kompetensi Kepribadian, Subkompetensi, dan Indikatornya

Kompetensi Berperilaku sesuai a. Mengamalkan ajaran agama yang dianutnya
Kepribadian dengan norma agama, sebagai insan yang
norma hukum, norma beriman, bertaqwa, dan berakhlak mulia.
sosial, etika, dan nilai b. Memiliki jiwa dan rasa kebangsaan dan cinta
budaya tanah air berdasarkan Pancasila, Undang-
Undang Dasar Negara RepubIik Indonesia
Tahun 1945, komitmen NKRI, dan semangat
Bhinneka Tunggal Ika.
c. Menunjukkan kesadaran hukum
dengan melaksanakan norma sesuai peraturan
peundang-undangan di bidang pendidikan dan
keguruan.
d. Tampil sebagai pribadi teladan yang jujur,
berakhlak mulia, beretos kerja, bertanggung
jawab, dan bangga menjadi guru.
e. Memiliki sikap mau mengembangkan diri
secara mandiri dan berkelanjutan.
76
Berdasarkan uraian di atas secara teoritis disimpulkan bahwa penilaian
kompetensi kepribadian yang perlu dikembangkan meliputi seperangkat
kemampuan yang dimiliki dan dihayati dalam berperilaku sesuai dengan norma
agama, norma hukum, norma sosial, etika, dan nilai budaya. Sub kompetensi
yang dinilai yaitu berperilaku sesuai dengan norma agama, norma hukum, norma
sosial, etika, dan nilai budaya dalam penelitian ini dikembangkan dari indikator
yang meliputi: mengamalkan ajaran agama yang dianutnya sebagai insan yang
beriman, bertaqwa, dan berakhlak mulia, memiliki jiwa dan rasa kebangsaan dan
cinta tanah air, komitmen NKRI, dan semangat Bhinneka Tunggal Ika,
menunjukkan kesadaran hukum dengan melaksanakan norma sesuai peraturan
peundang-undangan di bidang pendidikan dan keguruan, tampil sebagai pribadi
teladan yang jujur, berakhlak mulia, beretos kerja, bertanggung jawab, dan bangga
menjadi guru, memiliki sikap mau mengembangkan diri secara mandiri dan
berkelanjutan. Jika kompetensi kepribadian lulusan program PPG yang dinilai
dilaksanakan sesuai dengan komponen dan sistem penilaiannya, maka
diasumsikan penilaian yang dilakukan pada kompetensi ini memiliki akurasi dan
konsistensi yang tinggi.
d. Kompetensi Sosial
Kompetensi yang tidak kalah penting dikuasai oleh mahasiswa/peserta
PPG menjadi seorang guru adalah kompetensi sosial. Keberhasilan dari
kompetensi sosial yang dimiliki seseorang dapat dinilai dalam konteks bagaimana
perilaku individu yang bersangkutan memahami atau respek terhadap orang lain
(Rose‐Krasnor, 1997). Demikian halnya kompetensi sosial guru berkaitan dengan
77
keterampilan yang dimiliki guru beradaptasi menyesuaikan diri dengan situasi
mengajar atau situasi dimana dirinya bertindak sebagai pendidik. Indikator yang
dapat digunakan dalam pengukuran kompetensi sosial guru yaitu termasuk
kemampuan untuk berkomunikasi dan berinteraksi secara efektif dengan peserta
didik, sesama guru, orangtua/wali peserta didik dan masyarakat (Hakim, 2015;
Lacey, 2012)
Pengembangan kompetensi sosial guru harus didasarkan pada pendekatan
proses pendidikan dan pengajaran, karena kompetensi ini berkenaan dengan
kemampuan guru sebagai bagian dari masyarakat untuk berkomunikasi dan
bergaul secara efektif dengan peserta didik, sesama pendidik, tenaga
kependidikan, orangtua/wali peserta didik dan masyarakat sekitar
(Dzheksembekova et al., 2016; Kartowagiran, 2011, 2012b). Kompetensi sosial
adalah kompetensi yang berkaitan dengan hubungan antara guru dan lingkungan,
orang-orang yang ada di sekolah atau di luar sekolah, berkomunikasi,
berinteraksi dengan warga sekolah dan memiliki nilai, perilaku dan etika, sebagai
orang yang tinggal di tengah masyarakat, guru perlu memiliki kemampuan
bersosialisasi atau berinteraksi dengan masyarakat (Pahrudin et al., 2016;
Wardoyo, 2015). Hal ini mempertegas bahwa bagaimana, guru/calon guru dituntut
memiliki kemampuan bersosialisasi dan beradaptasi dengan lingkungan baik di
dalam maupun di luar sekolah, karena lingkungan belajar yang baik dipengaruhi
oleh kompetensi sosial guru.
Kompetensi sosial menuntut guru mampu menyesuaikan diri dengan
lingkungan kerja, mampu menilai kerja sendiri, dan mampu bekerja mandiri serta
78
mampu bekerjasama yang dikuatkan dengan kemampuan untuk berkomunikasi.
Seperti pendapat O'Malley (1977), Cooper (2013: 227), Kamerilova et al. (2018)
bahwa kemampuan guru ditentukan oleh cara berinteraksi dengan lingkungan
melalui komunikasi. Ini sangat penting untuk bersosialisasi dan beradaptasi
dengan lingkungan sekitar dan situasi sosial, sehingga kompetensi sosial menjadi
prioritas utama dalam pendidikan dan menjadi faktor penting yang
dipertimbangkan dalam tatanan sosial seperti komunikasi, pengakuan, pernyataan
diri, tekad diri dan lain-lain. Hal ini menunjukkan bahwa kompetensi sosial
penting untuk dinilai.
Penilaian kompetensi sosial pada Program PPG menjadi penting untuk
dinilai dikarenakan dengan adanya penguasaan terhadap kompetensi ini,
mahasiswa/peserta PPG akan memiliki kemampuan yang berhubungan dengan
cara menempatkan diri dalam lingkungan maupun cara menjalin hubungan dengan
orang lain. Kompetensi ini merupakan kemampuan berkomunikasi dan
berinteraksi secara efektif dan menarik serta kemampuan dalam menjalin relasi
yang positif, empatik, dan santun. Oleh karena itu, penilaian kompetensi sosial
tidak bisa diabaikan. Penilaian pada kompetensi ini akan mampu mengungkap
kecakapan dan keluwesan seorang mahasiswa/peserta PPG dalam bersosialisasi
dengan lingkungan sekitarnya, membina hubungan dengan sesama.
Pengembangan instrumen penilaian pada kompetensi ini perlu
memperhatikan item-item yang ada pada instrumen yang digunakan dalam
menilai kompetensi sosial guru di Indonesia. Jika merujuk pada buku Pedoman
79
PPG terdapat capaian kompetensi sosial yang harus dimiliki oleh lulusan program
PPG ini beserta subkompetensi dan indikatornya seperti disajikan dalam Tabel 8.
Tabel 8. Kompetensi Sosial, Subkompetensi, dan Indikatornya
Kompetensi Memiliki kemampuan a. Berkomunikasi dan berinteraksi dengan peserta

Sosial berkomunikasi, didik, guru, tenaga kependidikan, orang tua,
berinteraksi, dan dan masyarakat secara lisan dan tulisan dengan
beradaptasi secara santun, efektif, dan produktif
efektif dan efisien b. Berpartisipasi sebagai warga negara yang baik
dengan peserta didik, dalam pembangunan
sesama guru,
bangsa
orangtua/wali dan
masyarakat sekitar c. Memiliki komitmen mengadaptasi dan
menggunakan teknologi informasi dan
komunikasi dalam melaksanaan tugas
profesionalnya
Berdasarkan Tabel 8 menunjukkan secara teoritis bahwa penilaian
kompetensi sosial yang perlu dikembangkan meliputi seperangkat kemampuan
yang dimiliki dalam berkomunikasi, berinteraksi, dan beradaptasi secara efektif
dan efisien dengan peserta didik, sesama guru, orangtua/wali dan masyarakat
sekitar. Sub kompetensi yang dinilai yaitu memiliki kemampuan berkomunikasi,
berinteraksi, dan beradaptasi secara efektif dan efisien dengan peserta didik,
sesama guru, orangtua/wali dan masyarakat sekitar yang dapat dikembangkan dari
indikator: kemampuan berkomunikasi dan berinteraksi dengan peserta didik, guru,
tenaga kependidikan, orang tua, dan masyarakat secara lisan dan tulisan dengan
santun, efektif, dan produktif, kemampuan dalam berpartisipasi sebagai warga
negara yang baik dalam pembangunan bangsa serta komitmen mengadaptasi dan
menggunakan teknologi informasi dan komunikasi dalam melaksanaan tugas
80
profesionalnya. Jika kompetensi sosial mahasiswa/peserta PPG yang dinilai sesuai
dengan komponen dan sistem penilaiannya, maka maka diasumsikan penilaian
yang dilakukan pada kompetensi ini memiliki akurasi dan konsistensi yang tinggi.
Berdasarkan komponen penilaian capaian kompetensi yang dipersyaratkan
menjadi guru pada peserta PPG, maka perlu dikembangkan model penilaian yang
mengukur capaian kompetensi pedagogik, kompetensi profesional, kompetensi
sosial dan kompetensi kepribadian dari peserta PPG. Keempat kompetensi
tersebut pada PPG terintegrasi dalam penilaian kinerja melalui kegiatan
workshop, PPL dan uji kompetensi. Namun dalam pengembangan model
penilaian ini dibatasi pada kompetensi pedagogik, kompetensi sosial dan
kompetensi kepribadian. Sebagaimana pendapat Marzano & Toth (2013: 76)
bahwa model penilaian guru terbagi dalam empat kategori atau yang disebut
sebagai domain yaitu: 1) Domain-1 strategi pengelolaan kelas dan perilaku yang
memiliki pengaruh langsung pada prestasi siswa, 2) Domain 2- perencanaan dan
persiapan, sejauhmana rencana dan cara guru mempersiapkan diri untuk
melaksanaan pekerjaan dalam mengajar sehari-hari sesuai pelajaran, 3) Domain 3-
pelaksanaan pembelajaran. Domain ini memiliki kaitan langsung dengan
perencanaan dan persiapan yang dibuat guru seperti mengevaluasi kinerja pribadi
kekuatan dan kelemahan yang dimiliki dalam pembelajaran, mengevaluasi
efektivitas pembelajaran, mengevaluasi efektivitas strategi pembelajaran yang
spesifik dengan kemampuan siswa pada berbagai, 4) Domain 4-profesionalisme
dan hubungan dengan teman sejawat. Hubungan keempat domain tersebut
disajikan pada Gambar 5.
81
Gambar 5. Domain model penilaian guru (Marzano & Toth, 2013: 76)
Jika teori yang relevan digunakan untuk membuat konstruk, indikator yang
dinilai dapat diukur dan diamati dalam menilai penguasan empat kompetensi
mahasiswa/peserta PPG yaitu kompetensi pedagogik, kompetensi profesional, dan
kompetensi sosial dan kepribadian, maka diasumsikan penilaian yang dilakukan
pada keempat kompetensi tersebut memiliki akurasi dan konsistensi yang tinggi
dalam mengestimasi penguasaan capaian kompetensi mahasiswa/peserta PPG.
5. Performance Assessment
Salah satu teknik penilaian yang banyak digunakan dalam menentukan
kemampuan seseorang adalah penilaian kinerja atau unjuk kerja yang lebih
dikenal dengan istilah performance assessment. Penilaian ini terkait pengujian
82
jabatan, sertifikasi dan lisensi jabatan profesional (American Educational
Research Association & National Council on Measurement in Education, 2014).
Hasil penilaian kinerja digunakan untuk sertifikasi atau lisensi penting dilakukan
agar kualitas pekerjaan yang dilakukan seseorang mencapai standar atau kriteria
yang ditetapkan, dalam arti benar-benar bekerja secara profesional (Mardapi,
2017: 18). Hal ini menunjukkan dalam menentukan kemampuan seseorang agar
diperoleh informasi yang sahih dan memiliki kesalahan kecil hendaknya
menggunakan penilaian dengan teknik performance assessment. Performance
assessment merupakan teknik yang digunakan dalam penilaian berbasis
kompetensi karena teknik dan sistem penilaiannya fokus pada kinerja atau hasil.
Performance assessment menilai penguasaan kemampuan dan
keterampilan yang dimiliki seseorang terkait dengan objek yang dan dinilai.
Penilaian dilakukan terhadap unjuk kerja, tingkah laku, atau interaksi serta dapat
digunakan untuk menilai kemampuan seseorang selama proses pembelajaran
tanpa harus menunggu sampai proses tersebut berakhir (Stiggins and Chappuis
(2005); Brookhart & Nitko (2008: 167). Pendapat ini menunjukkan bahwa
performance assessment adalah suatu bentuk penilaian untuk mendemostrasikan
atau mengaplikasikan pengetahuan yang telah diperoleh dan menggambarkan
suatu kemampuan seseorang melalui suatu proses, kegiatan, atau unjuk kerja.
Unjuk kerja seseorang dalam performance assessment dapat dinilai dari
beberapa kriteria yang dapat digunakan sebagai bahan pertimbangan antara
lain: generalizability atau keumuman, authenticity atau keaslian/nyata, muliple
focus (lebih dari satu fokus), fairness (keadilan), teachability (bisa tidaknya
83
diajarkan), feasibility (kepraktisan), scorability atau bisa tidaknya tugas tersebut
diberi skor (Popham, 1999). Bila hasil pengukuran tidak baik, dengan teknik
apapun yang digunakan untuk menganalisa data, hasilnya tetap tidak baik
(Retnawati, 2016: 2, Mardapi, 2017: 1). Hal ini dipertegas Lutasari and
Kartowagiran (2019) performance assessment tidak hanya mengukur hasil
pembelajaran tetapi juga memberikan informasi yang lebih jelas tentang kegiatan
belajar. Pendapat ini mempertegas bahwa performance assessment memiliki
esensi penting dalam mengukur kemampuan seseorang.
Esensi penting dari performance assessment dapat secara langsung
mengukur keterampilan-keterampilan dari seseorang. Penilaian ini menempatkan
penekanan lebih besar pada kemampuan seseorang dalam menerapkan konsep
pengetahuan yang dimiliki ke dalam situasi dunia nyata, dan untuk berkomunikasi
secara efektif. Hal ini sesuai dengan hakikat dan tujuan pengukuran dilaksanakan
untuk mengetahui kemampuan atau performa dari sesuatu atau seseorang, baik
berupa kemampuan, sikap, keterampilan, persepsi dan lain-lain.
Menurut The Center for Collaborative Education (CCE 2017)
performance assessment sebagai penilaian kualitas kinerja tingkat tinggi kinerja
karena memuat multi-langkah tugas dengan kriteria jelas, harapan, dan proses
yang mengukur seberapa baik mahasiswa mentransfer pengetahuannya dan
mampu menilai keterampilan kompleks dalam membuat atau memperbaiki hasil
(French, 2017). Dengan menggunakan penilaian ini dapat mengukur proses
kinerja seseorang langkah demi langkah yang sesuai dengan prosedur yang telah
ditetapkan termasuk dalam penilaian capaian penguasaan mahasiswa/peserta PPG.
84
Dengan demikian penilaian pada Program PPG berdasarkan capaian
kompetensi yang dipersyaratkan sebagai seorang guru tidak terlepas dari
performance assessment misalnya performance dalam lokakarya/workshop,
praktik mengajar pada PPL, sehingga metode pengukurannya harus dilakukan
secara langsung terhadap tindakan/performance kerja yang ditampilkan oleh
seorang mahasiswa/peserta PPG pada saat praktik mengajar dengan menggunakan
instrumen penilaian untuk mengukur capaian kompetensi yang harus dinilai.
Melalui penilaian kinerja mampu menggambarkan capaian penguasaan
kompetensi mahasiswa/peserta PPG.
Penilaian kompetensi mahasiswa/peserta PPG juga harus dilakukan secara
langsung pada saat mengajar yaitu dengan cara mengobservasi kompetensi
mahasiswa yang meliputi kompetensi pedagogik, sosial dan kompetensi
kepribadian. Sebagaimana dikemukakan Sax (1980: 472) mengukur kemampuan
calon guru termasuk didalamnya adalah mengukur kemampuan pedagogik,
kemampuan profesional, kemampuan personal dan kemampuan sosial calon guru
baik kemampuan di kelas maupun kemampuan di luar kelas. Dengan
menggunakan performance assessment, kompetensi mahasiswa/peserta PPG akan
terukur dan teruji dengan baik.
Berdasarkan kajian tentang performance assessment tersebut dikaitkan
dengan penilaian penguasaan capaian kompetensi yang dinilai pada saat
mahasiswa/peserta PPG melakukan praktik mengajar di dalam kelas dengan
mengunakan instrumen penilaian yang dikembangkan berdasarkan konstruk yang
diukur. Menurut Wilson (2005: 12) pengembangan instrumen penilaian biasanya
85
tidak lepas dari beberapa permasalahan: a) kesewenang-wenangan dalam pilihan
item dan format item, b) tidak ada teknik yang jelas untuk menghubungkan hasil
empiris untuk perbaikan instrumen, dan c) ketidakmampuan untuk menggunakan
temuan empiris untuk meningkatkannya dalam membangun ide. Untuk
menghindari masalah ini, pada penilaian capaian penguasaan kompetensi
mahasiswa/peserta PPG perlu mengembangkan model penilaian yang mampu
mengungkap performance mahasiswa/peserta PPG berdasarkan hasil pengamatan
pada komponen yang dapat teramati dan terukur. Oleh karena itu, penilaian yang
dilakukan difokuskan pada penguasaan kompetensi pedagogik, kompetensi sosial
dan kompetensi kepribadian.
6. Penskoran Parsial, Holistik dan Perbandingannya
Pengukuran pada hakikatnya adalah kuantifikasi atribut dengan skala
psikologi sebagai instrumennya yang tidak terlepas dari masalah penskoran.
Istilah penskoran sangat penting dalam pemerolehan hasil penilaian yang
tidak bias dikarenakan penilaian yang dilakukan tidak konsisten. Dengan adanya
penskoran dapat diperoleh deskripsi performansi dari suatu subjek dinilai dan
dapat memberikan evaluasi terhadap perfomansi subjek dalam bentuk nilai.
Penskoran merupakan salah satu langkah penting untuk menetapkan atau
menentukan besaran angka pada suatu gejala atau objek yang harus diberikan
sebagai harga suatu jawaban yang lebih dikenal dengan score (Sumintono &
Widhiarso, 2014: 20, Mardapi, 2017: 194, Azwar, 2017: 55). Pendapat ini
menunjukkan bahwa penskoran sebagai proses pemberian skor atau angka
terhadap respons, sehingga skor atau angka tersebut dapat ditafsirkan sebagai
86
ukuran ciri terpendam yang tak tampak (latent trait) yang ada pada peserta tes,
sehingga dalam pemberian skor atau angka tersebut dilakukan perdasarkan aturan
dan kriteria tertentu.
Penskoran sendiri tidak terlepas dari proses penskalaan, karena skala
adalah aturan pemberian angka kepada atribut dan pemberian angka pada atribut
berarti mempertemukan karakteristik sistem angka riil yang merupakan besaran
berupa kontinum yang membentang dari minus (-) tak hingga sampai plus (+) tak
hingga dengan karakteristik sistem atribut dimana ada atribut yang menggunakan
sedikit karakteristik sistem angka dan ada juga yang menggunakan lebih banyak,
sehingga perbedaan kandungan informasi pada karakteristik sistem atribut ini
dikenal dengan level skala (Naga, 2013: 21-23). Penskoran juga tidak lepas dari
pembobotan dan umumnya besar skor suatu item/butir ditetapkan berdasarkan
tingkat kesulitan, tingkat kepentingan dan lama kerja (Wakhinuddin, 2012). Hal
ini menunjukkan bahwa penetapan atau penentuan skor sangat penting dilakukan
dalam proses penskalaan.
Proses penskalaan merupakan upaya untuk menempatkan atribut atau
karakteristik pada suatu rentang kontinum, yang didalamnya melibatkan
perubahan nilai atau transformasi skor baik berupa transformasi linear maupun
nonlinear (Brennan, 2006, de Ayala, 2009: 2). Penskalaan dikaitkan dengan upaya
untuk menempatkan atribut psikologi dengan mengubah atau mentransformasi
data yang semula berbentuk data ordinal yang tidak memiliki unit pembanding
yang sama menjadi data interval atau rasio yang memiliki satuan pembanding
87
yang sama. Berbagai macam cara atau metode dilakukan dalam upaya untuk
mentransformasi data menjadi data interval.
Pengukuran dengan skala interval menunjukkan perbedaan antar titik
dalam skala haruslah sistematis artinya ada perbedaan angka 1 dan 2 sama dengan
perbedaan angka 2 dan 3, begitu seterusnya walaupun angka nol masih bersifat
semu, namun beda ukuran antara angka 1 dan 3 sama dengan beda angka 3 dan 5.
Kategori skala dinilai sebagai alat praktis untuk penilaian cepat dengan tujuan
menentukan prestasi atau kemampuan dari subjek yang dinilai dengan angka
daripada memberikan umpan balik secara detail (Dogan & Uluman, 2017). Jika
dilihat dari penggunaannya di lapangan penilai lebih senang menggunakan skala
sesuai dengan kategori dinilai dalam situasi dimana mereka perlu melakukan
penilaian dengan cepat.
Berdasarkan berbagai pendapat di atas menunjukkan bahwa penskoran erat
kaitannya dengan masalah penskalaan, sehingga dibutuhkan kecermatan dan
kemantapan dalam penskoran. Penskoran merupakan proses pengubahan jawaban
instrumen menjadi angka-angka yang merupakan nilai kuantitatif dari suatu
jawaban terhadap item dalam instrumen. Dengan demikian penskoran adalah
suatu proses pengubahan jawaban-jawaban item menjadi angka-angka, yang
hasilnya tidak selalu tetap karena ditentukan berdasarkan atas banyak item serta
bobot item yang dibuat. Penskoran dalam penilaian Program PPG adalah proses
pemberian skor atau angka yang dilakukan berdasarkan aturan dan kriteria
tertentu terhadap respons yang diberikan oleh mahasiswa/peserta PPG, sehingga
88
skor tersebut dapat ditafsirkan sebagai ukuran ciri dari laten trait yang ada pada
mahasiswa/peserta PPG.
Penskoran dalam penilaian Program PPG diperlukan sebagai pedoman
menentukan skor hasil kerja mahasiswa/peserta PPG, sehingga diperoleh skor
seobjektif mungkin. Oleh karena itu, penting mengembangkan model penilaian
Program PPG dengan penskoran yang sesuai dan tepat, sehingga hasil penilaian
yang diperoleh lebih akurat dan konsisten. Dalam mengembangkan model
penilaian PPG harus mampu menentukan dengan tepat jenis penskoran yang akan
dibuat sehingga pedoman penskoran tersebut benar-benar dapat memberikan hasil
yang akurat dan konsisten terhadap hasil capaian penguasaan kompetensi
mahasiswa/peserta PPG. Model penskoran yang dapat dipilih yaitu dengan
menggunakan penskoran parsial dan holistik dengan karakteristik dan
perbandingan sebagai berikut.
a. Penskoran Parsial
Istilah parsial bukanlah istilah yang umum digunakan sehari-hari. Istilah
ini lebih banyak digunakan dalam bidang-bidang tertentu seperti Matematika dan
penelitian ilmiah. Secara bahasa pengertian parsial adalah sebagian dari suatu
keseluruhan. Jika istilah parsial tersebut, digunakan dalam penskoran lebih
dikenal dengan model dikotomi dalam praktiknya.
Penskoran parsial dalam praktiknya, sebagai panduan penyekoran yang
berisi kategori skor memiliki jenjang atau peringkat (ordered category). Pada
pengukuran pendidikan, kesehatan, psikologi, dan lainnya, penskoran sering
dilakukan secara dikotomus yaitu skor 1 dan 0. Data yang bersifat pilah disebut
89
data dikotomi yang hanya memiliki dua kategori saja. Misalnya, untuk pilihan
benar dan salah, maka kategorinya hanya dua, yaitu ‘benar’ yang dapat
dilambangkan dengan angka 1, dan ‘salah’ yang dilambangkan dengan angka nol
(Sumintono & Widhiarso, 2014: 32, Retnawati, 2016a: 114). Kedua pendapat ini
menunjukkan bahwa penyekoran secara dikotomus misalnya: benar-salah, ya-
tidak, melakukan-tidak melakukan suatu kegiatan, ada-tidak ada dan lainnya.
Biasanya pada penyekoran dikotomus, yang benar atau yang melakukan
diskor 1 dan yang salah atau tidak melakukan diskor 0 (de Ayala, 2009: 162).
Naga (2013: 86) menyatakan bahwa pada penskoran parsial, penjumlahan skor
satuan dilakukan sebagian-sebagian. Skor bagian ini dikenal dengan sub skor yang
pembagiannya berdasarkan keperluan. Jika sub skor berdasarkan dimensi ukur,
maka setiap dimensi ukur memiliki sub skor sendiri, demikian halnya jika ada
beberapa dimensi ukur pada atribut yang diukur, maka ada beberapa sub skor.
Kaitannya dengan sub skor ada banyak ragam instrumen yang
mengggunakan model dikotomi, diantaranya: benar salah, setuju-tidak setuju,
sesuai-tidak sesuai, ataupun ya-tidak. Respons butir dikotomus mempunyai dua
kategori skor jawaban, yaitu jawaban betul skor 1 dan jawaban salah skor 0 (Bond
& Fox, 2007: 49, DeMars, 2010: 9). Model penskoran dikotomus tidak dapat
digunakan untuk menemukan kesalahan yang dilakukan oleh peserta, karena
semua option yang salah diberi skor 0.
Berdasarkan karakteristik tersebut, menunjukkan bahwa penilaian capaian
kompetensi mahasiswa/peserta PPG dengan penskoran parsial menilai respons
dari mahasiswa/peserta PPG tersebut dalam bagian demi bagian yaitu skor 1
90
diberikan pada respons yang mampu melakukan bagian demi bagian yang dinilai
dan skor 0 untuk peserta yang tidak mampu melakukannya. Artinya penskoran ini
jika diterapkan dalam menilai capaian penguasaan kompetensi mahasiswa/peserta
PPG dapat bermakna bahwa seorang mahasiswa/peserta PPG mendapatkan skor 1
apabila memiliki kesesuaian dengan suatu item yang dinilai dan skor 0 bila tidak
terdapat kesesuaian dengan item yang dinilai.
Contoh penskoran model ini, misalnya pada instrumen untuk menilai
kemampuan mahasiswa/peserta PPG dalam melakukan kegiatan apersepsi pada
pelaksanaan pembelajaran diperlukan 4 bagian atau 4 tahap yang harus dilakukan
pada tahapan tersebut yaitu: 1) mengungkap kembali materi yang telah dipelajari
sebagai tahap 1, 2) mengajukan pertanyaan yang mengaitkan pengetahuan
sebelumnya dengan materi yang dipelajari sebagai tahap 2, 3) mengaitkan dengan
kehidupan sehari-hari sebagai tahap 3, 4) mengaitkan dengan isu mutakhir sebagai
tahap 3. Jika keempat tahap tersebut dapat dilakukan oleh mahasiswa/peserta
PPG, maka mahasiswa/peserta PPG yang bersangkutan mendapatkan total skor 4
dalam melakukan kegiatan apersepsi, namun jika ada salah satu tahapan yang
tidak dapat dilakukan peserta PPG, maka mahasiswa/peserta PPG yang
bersangkutan akan dikurangi 1 skornya, sehingga total skor yang diperoleh adalah
skor 3. Sebaliknya jika ada mahasiswa/peserta PPG yang bersangkutan tidak
melakukan salah satu tahap atau beberapa tahap dari aspek yang diamati, maka
masing-masing tahapan yang tidak dilakukan mahasiswa/peserta PPG mendapat
skor 0 atau berkurang sesuai dengan jumlah tahapan yang tidak dapat dilakukan
dari skor total. Artinya total skor yang diperoleh mahasiswa/peserta PPG tersebut
91
berdasarkan jumlah tahapan yang dilakukan, misalnya jika peserta hanya mampu
melakukan 3 tahapan, maka total skor yang diperolehnya adalah 3 meskipun
tahapan yang dilakukan peserta tidak berurutan.
Berdasarkan uraian dan contoh yang dikemukakan menunjukkan bahwa
model penskoran parsial dalam aplikasi penilaian capaian penguasaan kompetensi
pada mahasiswa/peserta PPG yang dinilai diberikan skor untuk tiap langkah yang
dilakukannya. Langkah yang dilakukan diskor 1, yang tidak dilakukan diskor 0,
meskipun kadang subjek yang diamati tidak melakukan semua tahap atau bagian
yang harus dipenuhi pada aspek yang dinilai, dan kemungkinan tahap-tahap
tersebut tidak berurutan namun dilakukan. Total skor yang diperoleh merupakan
penjumlahan dari setiap tahapan yang dilakukan dan hal ini merupakan
karakteristik dari penskoran dengan model parsial.
b. Penskoran Holistik
Sebelum membahas penskoran holistik, perlu untuk memahami istilah
“holistik”. Sebagaimana dinyatakan Horby and Cowie (2000) mendefinisikan
“holism” as: “Considering a whole thing or being to be more than a collection of
parts” (Holistik adalah mempertimbangkan keseluruhan hal atau lebih). Dengan
demikian, istilah “holistik” merujuk kepada keseluruhan aspek yang dinilai.
Holistik dalam penilaian bertujuan untuk melihat pengujian keseluruhan
kinerja. Dalam jenis penilaian dengan penskoran ini, keterampilan yang diuji
dianggap sebagai sebuah kesatuan utuh, dimana tidak ada kemungkinan untuk
menilai setiap bagian secara independen atau terpisah dengan yang lain (Harsch &
Martin, 2013, Ounis, 2017). Selama proses penilaian, penilai berusaha untuk
92
menimbang dampak berbeda dari efektivitas keseluruhan dimensi dari kriteria
yang dinilai dengan skor holistik.
Penilaian degan penskoran holistik dalam hal penyusunan penskoran dapat
diawali dengan menyusun atribut dan indikator kunci dari aspek yang diukur.
Atribut dan indikator kunci tersebut kemudian dirumuskan menjadi kategori-
kategori untuk menentukan skor jawaban. Dengan penskoran holistik penilai tetap
dapat memberikan penghargaan yang lebih akurat dan berkeadilan untuk seluruh
subjek yang dinilai dengan masing-masing cara penyelesaiannya yang mungkin
satu dengan yang lain berbeda.
Penskoran holistik oleh Borich & Kubiszyn, (2003: 154) digunakan ketika
penilai lebih tertarik dalam memperkirakan kualitas keseluruhan dari kinerja dan
menetapkan angka nilai pada kualitas tersebut daripada menerapkan penambahan
atau pengurangan poin atas aspek kinerja tertentu. Menurut Brookhart (2013 : 6)
bahwa penskoran holistik merupakan rubrik yang menerapkan semua kriteria pada
waktu yang sama dan memungkinkan penilaian keseluruhan tentang kualitas
pekerjaan. Kedua pendapat ini menunjukkan bahwa penskoran holistik merupakan
penetapan atau pemberian angka untuk menilai berdasarkan kesan keseluruhan
atau kombinasi semua kriteria dari aspek atau objek yang dinilai.
Kriteria dari aspek atau objek yang dinilai dalam penskoran holistik, harus
menggunakan makna yang jelas, dimana harus ada perbedaan jelas antara skor,
dan setiap level skor harus memiliki keterangan sendiri (Jones & Vickers, 2011).
Artinya penskoran dengan model ini harus jelas dalam mengartikulasikan kriteria
untuk pemberian skor setiap level. Deskriptor level skor harus memiliki hubungan
93
dari level satu skor ke level lain, dengan kata lain kriteria yang digunakan untuk
mengevaluasi respons harus diwakili di setiap level skor.
Penskoran holistik dapat disebut penskoran dengan skala global, caranya
adalah dengan membaca jawaban secara keseluruhan tiap item kemudian
meletakkan dalam kategori-kategori mulai dari yang baik sampai yang kurang
baik, bisa tiga sampai lima kategori. Karakteristik dari penskoran holistik perlu
untuk mengidentifikasi kriteria untuk kinerja yang akan didasarkan untuk dinilai,
tiap jawaban dimasukkan dalam salah satu kategori, dan selanjutnya tiap jawaban
diberi skor sesuai dengan kualitas jawabannya (Brookhart & Nitko, 2008: 197,
Mardapi, 2017: 163). Dengan demikian dalam menyusun rubrik penilaian dengan
penskoran holistik deskripsi yang paling sesuai dengan kinerja subjek yang dinilai
mampu mengidentifikasi skor yang diberikan.
Penskoran holistik biasanya dapat menggunakan antara tiga kategori
misalnya dibedakan, mahir, menengah dan pemula dan lima kategori, seperti A,
B, C, D, dan F; atau 4, 3, 2 dan 1. Misalnya jika menggunakan nilai A sampai F,
kemudian menggunakan lima kategori, menunjukkan adanya jumlah yang berbeda
yang akan memengaruhi tingkat kualitas dalam rubrik penilaian dan akan
menyulitkan dalam memberi angka (Brookhart & Nitko, 2008: 197). Hal ini
menunjukkan bahwa kategori yang sesuai dengan sistem penilaian yang paling
mudah untuk digunakan adalah penskoran holistik.
Adapun contoh penskoran holistik, misalnya yang dicontohkan pada
penilaian dengan penskoran parsial pada aspek yang diamati dari kemampuan
peserta PPG melakukan kegiatan apersepsi, jika penilaiannya dilakukan dengan
94
penskoran holistik, maka contoh penskorannya pada aspek melakukan kegiatan
apersepsi dengan menggunakan empat kategori skor yaitu skor 4 (sangat baik),
skor 3 (baik), skor 2 (kurang baik), dan skor 1 (tidak baik). Pada aplikasi penilaian
peserta PPG, akan mendapat skor 4 jika peserta mampu mengungkap kembali
materi yang telah dipelajari, mengajukan pertanyaan yang mengaitkan,
pengetahuan sebelumnya dengan materi yang akan dipelajari, mengaitkan dengan
kehidupan sehari-hari dan isu mutakhir dengan sangat baik. Peserta mendapat skor
3 jika mampu mengungkap kembali materi yang telah dipelajari, mengajukan
pertanyaan yang mengaitkan, pengetahuan sebelumnya dengan materi yang akan
dipelajari, mengaitkan dengan kehidupan sehari-hari dan isu mutakhir dengan
baik. Peserta mendapat skor 2 jika mampu mengungkap kembali materi yang telah
dipelajari, mengajukan pertanyaan yang mengaitkan, pengetahuan sebelumnya
dengan materi yang akan dipelajari, namun kurang mengaitkan dengan kehidupan
sehari-hari dan isu mutakhir. Selanjutnya peserta mendapat skor 1 jika tidak
mampu mengungkap kembali materi yang telah dipelajari, tidak mengajukan
pertanyaan yang mengaitkan, pengetahuan sebelumnya dengan materi yang
dipelajari, kehidupan sehari-hari dan isu mutakhir. Total skor yang diperoleh
peserta tersebut berdasarkan total skor yang diperoleh dari setiap aspek yang
diamati secara keseluruhan berdasarkan kategori skor.
Berbagai pendapat tersebut menunjukkan bahwa penskoran holistik adalah
berisi rubrik penskoran yang deskripsi aspek penilaiannya dibuat secara umum,
karena deskripsi aspek penilaian dibuat umum maka biasanya rubrik penskoran
holistik dapat digunakan untuk menilai berbagai jenis kinerja maupun hasil kerja.
95
Penskoran dilakukan terhadap proses keseluruhan atau kesatuan produk tanpa
menilai bagian komponen secara terpisah namun berdasarkan kategori skor secara
urut. Setiap aspek yang akan dinilai ditentukan indikator tingkatan mutu bersifat
khusus dari yang paling baik sampai yang paling tidak baik.
c. Perbandingan Penskoran Parsial dan Holistik
Penskoran yang tepat dibutuhkan untuk memperoleh hasil penilaian yang
tepat pula. Tanpa penskoran yang tepat, maka kesalahan penilaian yang ditetapkan
akan terjadi (Mardapi, 2017: 162). Mengingat penentuan skor hasil pengukuran
berbeda-beda sesuai dengan jenis alat ukur yang digunakan, karena penskoran
masing-masing memiliki kelebihan dan kelemahan, termasuk penskoran model
parsial dan holistik.
Penskoran parsial memiliki kelebihan sebagai model yang sangat
sederhana dan mudah digunakan, yaitu skor 1 dan 0 dan ini termasuk pada model
proses penskalaan stimulus. Azwar (2017: 57) mengemukakan dalam prosedur
penskalaan stimulus, skor akan diberikan pada respons positif (endorsement) yaitu
jawaban ‘Ya’ diberi skor 1 dan ‘tidak’ diberi skor 0, namun angka skornya
ditentukan lebih dahulu lewat penskalaan itemnya. Prinsip penskoran model
dikotomus, skor 1 pada jawaban benar dan 0 pada jawaban yang salah. Hal ini
menunjukkan letak stimulus (item) pada kontinum ditentukan terlebih dahulu dan
angka pada titik kontinum itu dijadikan skor bagi jawaban ‘Ya’.
Penskoran parsial dalam penilaian capaian kompetensi mahasiswa/peserta
PPG mencakup penilaian capaian kompetensi pegagogik yang menilai
kemampuan peserta PPG dalam menyusun rencana pembelajaran dan
96
melaksanakan pembelajaran, penilaian capaian kompetensi sosial dan kepribadian
mahasiswa/peserta PPG. Untuk Threshold kategori yang lebih tinggi dalam
penskoran model ini tidak selalu lebih besar dari Threshold kategori sebelumnya.
Demikian halnya dalam permasalahan penilaian capaian penguasaan kompetensi
mahasiswa/peserta PPG, tingkat kesukaran untuk mencapai kategori yang lebih
tinggi tidak selalu besar dibandingkan tingkat kesukaran untuk mencapai kategori
sebelumnya. Misalnya dalam penyusunan rencana pembelajaran, tahapan
selanjutnya dalam menyelesaikan langkah memerlukan banyak pengetahuan dan
keterampilan, tetapi bila sudah sampai pada tahapan tersebut untuk mencapai
tahapan berikutnya justru lebih sederhana.
Model penskoran parsial kurang akurat untuk menganalisis respons
instrumen yang hanya memiliki 2 kategori, karena umumnya penskoran parsial
memiliki serangkaian tahapan. Model penskoran ini tidak dapat digunakan untuk
menemukan kesalahan yang dilakukan oleh peserta, karena semua option yang
salah diberi skor 0. Padahal kenyataannya kesalahan yang dilakukan peserta dapat
berbeda-beda sehingga penskoran parsial belum memberikan penghargaan yang
adil kepada setiap respons yang dinilai.
Kelebihan penskoran holistik mampu menilai semua kinerja yang
ditunjukkan dalam kategori. Penggunaannya lebih dapat dipercaya, dan membuat
lebih mudah untuk digunakan pada waktu berikutnya untuk memilih spesimen
atau contoh-contoh yang baik dari setiap kategori penilaian. Penskoran holistik
dapat membandingkan dengan setiap tingkat kualitas yang ditetapkan dalam
kategori untuk memutuskan ke kategori mana untuk menempatkan subjek yang
97
dinilai dan kurang memakan waktu dalam penggunaannya (Brookhart & Nitko,
2008: 197, Metruk, 2018). Jika penilai ingin mempertimbangkan waktu secara
efektif dan efisien dalam melakukan penilaian, disarankan menggunakan model
penskoran holistik.
Penskoran holistik memungkinkan penilaian untuk fokus pada penilaian
keterampilan keseluruhan bukan sifat setiap individu. Jika penskoran holistik
diterapkan ke respon subjek secara keseluruhan mampu menggambarkan tingkat
kinerja, misalnya, “lengkap menjelaskan”, “sebagian dijelaskan”, atau “minimal
dijelaskan” (Jones & Vickers, 2011). Untuk penilaian skala besar, penilaian
menggunakan penskoran holistik sering menjadi pilihan, karena dapat
memberikan deskripsi dari kinerja secara keseluruhan. Selain itu, menggunakan
model penskoran ini mendukung proses penilaian yang efisien dan handal.
Penskoran holistik selain mendukung penilaian yang efisien dan handal,
juga memberikan penilaian yang lebih luas mengenai kualitas proses atau produk.
Namun dalam penskoran holistik membutuhkan pengalaman dalam menilai
kinerja, penskoran holistik memiliki kelemahan diantaranya adalah masing-
masing skor tidak memberikan informasi secara keseluruhan tentang apa yang
harus dilakukan untuk meningkatkannya (Bainer & Porter, 1992: 26, Moskal,
2000: 3, Brookhart, 2013: 7). Pendapat ini mengindikasikan bahwa penskoran
holistik memiliki makna dalam variabel yang dinilai berdasarkan kategori skor.
Ketika penilai ingin melakukan penilaian dengan penskoran holistik,
mereka pertama kali harus dengan jelas mengidentifikasi hasil yang diinginkan
untuk dinilai. Selanjutnya harus mengembangkan sebuah rubrik yang jelas dan
98
khusus membahas hasil tersebut pada setiap kategori skor. Setiap kategori skor
pada rubrik harus mencerminkan bervariasi derajat level yang dinilai, hal ini
membatasi kegunaan dari penilaian ini ke situasi atau tugas yang dikembangkan.
Selain itu, penilai harus diajarkan untuk mampu menilai dengan model penskoran
ini secara ringkas dan cepat dengan fokus pada konten dan terstruktur untuk
menilai kinerja yang diinginkan apakah itu ekspositoris atau narasi.
Kelemahan lain yang dimiliki model penskoran holistik adalah mengambil
seluruh tanggapan tertulis ke perhitungan untuk menetapkan nilai keseluruhan
untuk kinerja. Bukan menilai komponen individual, komponen-komponen
tersebut terintegrasi ke dalam satu cara skor. Umumnya penilaian holistik
menempatkan penekanan pada apa yang dilakukan dengan “baik” dan bukan pada
apa yang “kurang” atau kekurangan yang dimiliki dari subjek yang dinilai.
Skala penilaian holistik relatif pendek dan tidak mencakup beberapa
kategori kriteria nilai individu yang harus diperoleh (Bainer & Porter, 1992: 26).
Penskoran holistik hanya menyediakan skor komposit yang tidak memberikan
bukti-bukti tertentu dari mana dan berapa banyak tambahan instruksi diperlukan.
Penilaian dengan penskoran ini, penilai tetap dapat memberikan penghargaan
yang lebih akurat dan berkeadilan untuk seluruh subjek yang dinilai mungkin satu
dengan yang lain berbeda.
Mengacu pada berbagai pendapat terkait kelebihan dan kelemahan
penskoran parsial dan holistik dapat disimpulkan meskipun model penskoran
holistik memiliki kelemahan namun model penskoran ini dapat digunakan untuk
menilai kemampuan/proses secara keseluruhan tanpa ada pembagian komponen
99
secara terpisah. Penggunaannya lebih mudah dan lebih cepat, efektif bila
digunakan untuk evaluasi akhir, memberikan nilai/skor komposit untuk
performansi lengkap dan sangat efektif jika semua elemen yang dinilai saling
terkait. Jika prinsip-prinsip dan prosedur pengembangan model penilaian PPG
dengan penskoran parsial dan holistik diterapkan dengan baik, maka diasumsikan
dapat meningkatkan kualitas hasil pelaksanaan Program PPG dalam mengukur
capaian penguasaan kompetensi mahasiswa/peserta PPG.
Berdasarkan kelebihan dan kelemahan yang dimiliki masing-masing
model penskoran baik secara parsial maupun holistik sebagaimana disebutkan di
atas, maka dalam mengembangkan model penilaian Program PPG pada penelitian
ini kedua model penskoran tersebut memiliki karakteristik masing-masing dan
aturan tertentu untuk menentukan level atau kategori yang dicapai dalam
penguasaan kompetensi dari mahasiswa/peserta PPG yang dinilai. Pemilihan
penskoran parsial menggunakan kategori partial credit didasarkan pada
kompleksitas setiap pembobotan dan pemberlakukan pengurangan skor (penalty)
untuk tahapan atau bagian yang salah dari item yang dinilai dari
mahasiswa/peserta PPG. Selanjutnya pada penskoran holistik penilaiannya
berdasarkan penentuan kategori tanpa memperhatikan pembobotan dan tidak
memperlakukan penalty, karena model penskoran ini tidak menghendaki
kesamaan jumlah kategori respons antar butir dan kurva probabilitasnya
jumlahnya sebanyak jumlah kategori respons.
100
7. Teori Respons Butir dan Penerapannya
Pengukuran harus menggunakan instrumen yang akurat dan terpercaya dan
hasil pengukuran harus mampu menjelaskan aspek yang diukur tanpa dipengaruhi
oleh faktor lain yang tidak berkaitan dengan aspek yang diukur, karena instrumen
yang telah dipengaruhi oleh faktor lain tentu berisi kesalahan atau error serta
tidak memihak kepada salah satu orang atau kelompok (Kartowagiran &
Retnawati, 2008; Retnawati, 2018). Guna memeroleh instrumen penilaian yang
akurat dan terpercaya, termasuk instrumen penilaian capaian penguasaan
kompetensi mahasiswa/peserta PPG yang dikembangkan dengan penskoran
parsial dan holistik, selain dilakukan analisis item secara teoritis (telaah butir)
oleh expert judgment, perlu juga dilakukan analisis item secara empirik.
Terdapat dua metode estimasi yang dapat digunakan untuk menganalisis
item instrumen secara empirik yaitu berdasakan teori tes klasik dan teori respon
butir (Item Response Teory, IRT) yang keduanya menggunakan teknik statistika
untuk mengetahui besarnya kemampuan seseorang, validitas (kesahihan) dan
keandalan (reliabilitas hasil pengukuran, kesalahan pengukuran, penyamaan skor
dan sebagainya (Retnawati, 2016a: 113, Mardapi, 2017: 174). Asumsi yang
digunakan pada kedua teori ini ada yang sama dan ada pula yang berbeda, berikut
ini penjelasan tentang kedua teori tersebut agar memberikan gambaran perbedaan
dan kesamaan kedua asumsi tersebut, terutama dalam analisis untuk mengetahui
karakteristik item dan kemampuan seseorang berdasarkan teori tes klasik dan
berdasarkan teori respon butir.
101
a. Teori Tes Klasik
Teori tes klasik digagas oleh Charles Spearmen pada tahun 1904 dan
merupakan teori psikometri yang membolehkan untuk melakukan prediksi tentang
hasil dari suatu tes dengan mempertimbangkan beberapa parameter seperti
kemampuan orang yang dites dan tingkat kesulitan. Teori ini juga menunjukkan
hubungan antara skor amatan, skor sebenarnya, dan skor kesalahan dalam
mengestimasi kehandalan dan kesahihan suatu instrumen (Sumintono &
Widhiarso, 2014: 48, Mardapi, 2017: 175). Model pengukuran yang digunakan
pada teori ini adalah: skor amatan (X) terdiri dari skor sebenarnya (T) dan skor
kesalahan (E), sehingga pada teori ini skor tampak (amatan) merupakan
penjumlahan dari skor murni dan kesalahan pengukuran (Retnawati, 2016a: 113).
Artinya didalam skor amatan, terkandung skor murni dari atribut yang diukur dan
kesalahan pengukuran yang secara matematis dinyatakan sebagai berikut:
X T E ………………………… (1)
dengan,
X  skor tampak
T  skor murni
E  kesalahan pengukuran (error) (Allen & Yen, 1979)
Kesalahan pengukuran yang dimaksud dalam teori ini merupakan
kesalahan acak (tidak sistematis), yaitu kesalahan yang terjadi karena
penyimpangan secara teoritis dari skor tampak yang diperoleh dengan skor
tampak yang diharapkan. Kesalahan yang bersifat sistematis bukan merupakan
kesalahan pengukuran . Asumsi utamanya adalah tidak ada hubungan antara skor
102
sebenarnya dan skor kesalahan, sehingga varians skor amatan merupakan
penjumlahan varians skor sebenarnya dan varians skor kesalahan, V x = Vt + Ve
(Mardapi, 2017: 175). Asumsi lain yang perlu diketahui adalah skor kesalahan (E)
bersifat acak dan tidak berinteraksi dengan skor sebenarnya (T). Skor kesalahan
(E) tidak berkorelasi dengan skor sebenarnya (T), dan rata-rata dari skor
kesalahan sama dengan nol. Hal yang perlu diperhatikan skor amatan (X) adalah
satu-satunya skor yang tampak/nyata, sedangkan skor sebenarnya (T) dan skor
kesalahan (E) bersifat tersembunyi (latent), sehingga teori ini memiliki
keterbatasan berdasarkan asumsi yang dibuat yaitu skor sebenarnya sangat
tergantung pada pengukuran yang dilaksanakan, dan pengujiannya tidak bisa
dibandingkan jika dua jenis tes berbeda diberikan kepada dua kelompok berbeda
(Sumintono & Widhiarso, 2014: 48, Retnawati, 2016a: 113). Hal ini menunjukkan
analisis item berdasarkan teori tes klasik, skor amatan dan skor sebenarnya
berubah-ubah bergantung pada tingkat kesulitan dan pembobotan, dimana
keduanya sangat bergantung pada hasil dari karakteristik peserta yang diuji.
Teori tes klasik mengembangkan model pengukuran untuk menaksir
besarnya kemampuan dan parameter butir/item, parameter kemampuan
dinyatakan sebagai jumlah butir yang benar atau jumlah skor yang diperoleh dan
parameter butir adalah tingkat kesulitan butir, daya beda dan dugaan (Mardapi,
2017: 176). Salah satu parameter butir yang sangat berguna dalam analisis
karakteristik item adalah tingkat kesulitan butir soal. Tingkat kesulitan butir soal
merupakan proporsi peserta tes yang menjawab benar tiap butir soal terhadap
jumlah peserta tes seluruhnya. Secara matematis dirumuskan sebagai berikut.
103
pi 
B ………………………… (2)
N
dengan,
p i  proporsi menjawab benar atau tingkat kesulitan butir i
 B  jumlah peserta tes yang menjawab benar pada butir i

N  jumlah peserta tes (Crocker & Algina, 1986: 90)
Tingkat kesulitan butir digunakan untuk mengetahui seberapa baik kualitas
suatu butir soal. Jika p i mendekati 0, maka soal tersebut terlalu sulit, dan jika p i
mendekati 1, maka soal tersebut terlalu mudah sehingga kedua-duanya harus
direvisi atau dibuang karena tidak bisa memberikan informasi yang maksimum
dalam membedakan peserta tes yang berkemampuan rendah dengan peserta tes
yang berkemampuan tinggi.
Menurut Allen & Yen (1979: 121) secara umum tingkat kesulitan butir
soal sebaiknya terletak pada interval 0,3 sampai 0,7. Pada interval ini informasi
tentang kemampuan peserta tes akan diperoleh secara maksimal. Menurut
Fernandes (1984) butir soal menghasilkan rerata skor sekitar 50% dari skor
maksimum dapat dikatakan bahwa butir tersebut memiliki tingkat kesulitan yang
tepat. Sementara menurut Naga (2013: 428) secara teori, nilai parameter tingkat
kesulitan butir adalah minus tak hingga sampai plus tak hingga (    b   ),
namun secara empirik, nilai parameter tingkat kesulitan butir berkisar dari – 2,0
sampai 2,0 (  2,0  b  2,0 ). Menurut Sumintono & Widhiarso (2014: 48)
tingkat kesulitan memiliki titik tertinggi 0 berarti tidak ada satupun (0%) peserta
tes menjawab dengan benar dan jika menunjukkan angka 1 berarti peserta tes
mampu menjawab dengan benar. Dengan demikian, tingkat kesulitan berkisar
104
antara 0 dan 1, suatu butir kadang dikategorikan ke dalam ekstrim yang sukar jika
nilai tingkat kesukaran mendekati 0 dan ekstrim mudah jika nilai tingkat
kesukaran mendekati 1.
Daya pembeda butir soal merupakan parameter yang memberikan
informasi tentang dapat tidaknya suatu butir soal membedakan kelompok dalam
aspek yang diukur sesuai dengan perbedaan yang ada dalam kelompok itu. Indeks
atau besaran yang digunakan dalam membedakan antara peserta tes yang
berkemampuan tinggi dengan peserta tes yang berkemampuan rendah adalah
indeks daya pembeda butir soal (item discrimination). Semakin besar nilai indeks
daya pembeda butir, maka semakin berfungsi butir itu dalam membedakan
kemampuan peserta tes. Seperti dinyatakan Naga (2013: 428) bahwa parameter
daya beda butir berkaitan dengan probabilitas jawaban benar, makin besar nilai
parameter daya beda butir makin peka probabilitas jawaban benar terhadap
perbedaan parameter kemampuan, makin besar nilai parameter daya butir makin
curam karakteristik butirnya, sehingga pada parameter daya beda butir yang besar,
sedikit perbedaan pada parameter kemampuan yang menyebabkan perbedaan
cukup besar pada probabilitas jawaban benar.
Nilai indeks daya pembeda butir soal ( d i ) dapat bernilai positif atau
negatif. Jika d i bernilai positif, maka butir soal telah mampu berfungsi dengan
baik. Artinya, peserta tes yang berkemampuan tinggi dapat menjawab dengan
benar dan peserta tes yang berkemampuan rendah menjawab dengan salah.
Sebaliknya, jika d i bernilai negatif, maka butir soal tidak berfungsi dengan baik.
105
Artinya, peserta tes yang berkemampuan tinggi menjawab dengan salah dan
peserta tes yang berkemampuan rendah menjawab dengan benar. Secara
matematis, nilai indeks daya pembeda butir soal dapat dihitung dengan rumus:
Di  piU  piL ………………………… (3)

dengan,
Di = Daya beda butir i
piU  proporsi kelompok atas yang menjawab benar butir i
piL  proporsi kelompok bawah yang menjawab benar butir i

(Allen & Yen, 1979; Crocker & Algina, 1986)
Indeks daya pembeda butir soal didefinisikan sebagai selisih antara
proporsi jawaban benar pada kelompok atas yang merupakan kelompok peserta
tes yang berkemampuan tinggi dengan proporsi jawaban benar pada kelompok
bawah yang merupakan kelompok peserta tes yang berkemampuan rendah.
Fernandes (1984) menyatakan bahwa butir soal yang baik adalah butir soal yang
memiliki indeks daya beda lebih dari 0,2. Sedangkan Ebel (1972) menyatakan
suatu butir soal dikatakan berkualitas apabila indeks daya pembedanya paling
sedikit 0,41. Selanjutnya menurut Kelley (Crocker & Algina, 1986: 314), yang
paling stabil dan sensitif serta paling banyak digunakan adalah dengan
menentukan 27% kelompok atas dan 27% kelompok bawah. Sementara menurut
Retnawati (2016a: 115) indeks daya beda pada suatu item dikatakan baik jika
lebih besar atau sama dengan 0,3, indeks daya beda yang nilainya kecil akan
menyebabkan item tersebut tidak dapat membedakan peserta tes yang
kemampuannya tinggi dan yang kemampuannya rendah, namun pada analisis tes
106
dengan Content-References Measuremes, indeks daya pembeda tidak terlalu perlu
menjadi perhatian, asalkan tidak negatif. Menurut Sumintono & Widhiarso (2014:
113) pada teori tes klasik, biasanya tingkat kesulitan 0,5 akan menyumbang pada
bagusnya nilai indeks daya beda, yang semakin besar nilai indeksnya
menunjukkan semakin bagus, misalya tingkat kesulitan 0,50 (50%) dari kelompok
peserta yang diuji lulus, merupakan tingkat kesulitan optimal dan soal tersebut
dinyatakan memiliki tingkat pembeda kemampuan tertinggi untuk peserta tes.
b. Teori Respons Butir Unidimensi Dikotomi
Teori Responsi Butir (Item Response Theory disingkat IRT) dinamai juga
sebagai Teori Ciri Laten (Latent Trait Theory disingkat LTT) atau Lengkungan
Karakteristik Butir (Item Characteristic Curve disingkat ICC). Pada IRT, peluang
jawaban benar yang diberikan siswa, ciri atau parameter butir, dan ciri atau
parameter peserta tes dihubungkan melalui suatu model formula yang harus ditaati
baik oleh kelompok butir tes maupun kelompok peserta tes (Hambleton,
Swaminathan, & Rogers, 1991). Artinya, butir yang sama terhadap peserta tes
yang berbeda harus tunduk pada aturan rumus itu, atau peserta tes yang sama
terhadap butir tes yang berbeda juga harus patuh terhadap rumus tersebut. Dalam
proses semacam ini terjadilah apa yang disebut invariansi diantara butir tes dan
peserta tes. Pada pengukuran modern, taraf sukar butir tidak dikaitkan langsung
dengan kemampuan responden.
Perbedaan mendasar antara pengukuran klasik dengan pengukuran modern
terletak pada invariansi penskoran, dimana penskoran modern adalah invarians
(tidak berubah atau tetap) terhadap butir tes serta terhadap peserta tes (Sudaryono,
107
2011). Lebih lanjut Lorf (1990: 121) bahwa invariansi parameter-parameter butir
tes melalui kelompok peserta tes merupakan karakteristik yang paling penting dari
IRT. Indeks kesukaran butir tes sebagai proporsi jawaban yang benar sehingga
sukar untuk membayangkan bagaimana indeks kesukaran tes dapat menjadi
invarians terhadap kelompok peserta tes dari tingkat kemampuan yang berbeda.
Menurut Hambleton et al., (1991: 5) secara umum ciri-ciri teori respon
butir adalah sebagai berikut: 1) karakteristik butir tidak tergantung pada peserta
ujian, 2) skor yang digambarkan peserta ujian tidak tergantung pada tes, 3)
merupakan model yang lebih menekankan pada tingkat butir daripada tingkat tes,
4) merupakan model yang tidak mensyaratkan secara ketat tes paralel untuk
menaksir reliabilitas, dan 5) merupakan model yang menguraikan sebuah ukuran
keputusan untuk tiap skor kemampuan yakni ada hubungan fungsional antara
peserta tes dengan tingkat kemampuan yang dimiliki.
Teori respon butir juga dikembangkan atas dasar dua postulat yaitu: 1)
performansi subyek pada suatu butir dapat diprediksikan oleh seperangkat faktor
yang disebut latent trait atau kemampuan dan 2) hubungan performansi subyek
pada suatu butir dan perangkat kemampuan laten yang mendasarinya digambarkan
oleh fungsi naik monoton yang disebut Item Characteristic Curve (ICC). Selain
itu, menurut Hambleton et al., (1991: 9) bahwa asumsi-asumsi yang melandasi
teori respon butir adalah unidimensi, independensi lokal, dan fungsi karakteristik
butir atau kurva karakteristik butir.
108
Pada awalnya teori respon butir menggunakan distribusi normal, namun
dalam perkembangan selanjutnya digunakan model distribusi logistik. Hal ini
dikarenakan model distribusi logistik lebih sederhana analisis matematiknya
(Mardapi, 2017: 178). Ada tiga macam model logistik dalam teori respon butir
yaitu model logistik satu parameter, model logistik dua parameter, dan model
logistik tiga parameter. Perbedaan ketiga model tersebut terletak pada banyaknya
parameter yang digunakan untuk menggambarkan karakteristik butir dalam model
yang bersangkutan Hambleton et al., (1991: 6).
1) Model Logistik 1 Parameter / 1PL (Model Rasch)
Model logistik satu parameter merupakan model estimasi parameter butir
yang meninjau tingkat kesukaran butir dengan mengasumsikan bahwa daya beda
sama untuk semua butir dan tebakan sama dengan 0. Model 1PL dan Model Rasch
memiliki kesamaan yaitu sama-sama mengasumsikan daya beda yang sama untuk
semua butir. Adapun yang membedakan keduanya dijelaskan oleh Ayala (2008:
19) bahwa pada Model Rasch daya beda konstan pada nilai 1 sedangkan untuk
Model 1PL daya beda konstan tidak harus berada pada nilai 1. Retnawati (2014:
14) merumuskan Model logistik 1 parameter sebagai berikut:
e D ( bi )
Pi ( )  dengan i = 1, 2, 3, …..n …………… (4)
1  e D ( bi )
Keterangan:
Pi ( ) = Peluang menjawab benar peserta yang berkemampuan  pada
butir ke i
bi = Tingkat kesukaran butir ke-i
e = Bilangan natural yang bernilai 2,712
n = Jumjah butir soal
D = Kostanta bernilai 1,7 sebagai simpangan baku distribusi logistik
109
Persamaan tersebut merupakan cara yang digunakan untuk mengestimasi
butir dengan 1 parameter. Melalui persamaan tersebut juga dapat digunakan untuk
menggambarkan kurva karakteristik butir ke-i yang menggambarkan
probabilitas/peluang peserta (  ) menjawab butir soal dengan benar. Parameter bi
merupakan suatu titik pada skala kemampuan agar peluang menjawab benar
sebesar 50 %. Semakin besar nilai bi, maka semakin besar kemampuan yang
diperlukan untuk menjawab benar dengan peluang 50 % atau dengan kata lain
semakin besar nilai parameter bi, maka semakin sulit butir soal tersebut.
Hubungan peluang menjawab benar Pi ( ) dengan tingkat kemampuan
peserta (  ) dapat digambarkan sebagai kurva karakteristik butir (item
charasteristic curve, ICC). Berikut Gambar 4 ditampilkan contoh kurva
karakteristik butir untuk Model Logistik 1 Parameter.
Gambar 6. Contoh Kurva Karakteristik Butir Model Logistik 1 Parameter

Sumber: Retnawati (2014: 15)
Gambar 6 tersebut merupakan ilustrasi kurva karakteristik butir untuk
model Rasch (1 parameter, 1P), dengan butir 1(b=-0,5), butir 2 (b=0) dan butir
3(b=0,5). Menurut Hambleton et al., (1991: 13) bahwa nilai bi (tingkat kesukaran
110
butir) bervariasi dari -2 sampai +2. Nilai mendekati -2 menunjukkan bahwa butir
tersebut sangat mudah sedangkan nilai mendekati +2 menunjukkan bahwa butir
tersebut sangat sulit. Probabilitas jawaban betul pada butir ke-i berhubungan
dengan letak  terhadap bi atau terhadap (  - bi) atau Pi ( ) = f (  - b). Nilai
taraf sukar butir ke-i ditentukan oleh  - bi = 0 atau bi = 0 pada saat Pi ( ) = 0,5.
2) Model Logistik 2 Parameter / 2 PL (Birnbaum Model)
Model logistik dua parameter merupakan model yang menitik beratkan
selain pada tingkat kesukaran butir, juga menitik beratkan pada daya beda butir
soal. Faktor tebakan masih diasumsikan sama dengan 0 atau tidak ada tebakan.
Hambleton et al., (1991: 15) merumuskan Model logistik 2 parameter berikut:
e Dai ( bi )
Pi ( )  dengan i = 1, 2, 3, …..n ……………(5)
1  e Dai ( bi )
Keterangan:
Pi ( ) = Peluang menjawab benar peserta yang berkemampuan ɵ
pada butir ke i
ai = Parameter daya beda butir
n = Jumlah butir soal
D = Kostanta bernilai 1,7 sebagai simpangan baku distribusi
logistik
Sama halnya dengan Model Logistik 1 parameter, pada Model Logistik 2
Parameter hubungan peluang menjawab benar Pi ( ) dengan tingkat kemampuan
peserta (  ) dapat digambarkan sebagai kurva karakteristik butir (item
charasteristic curve, ICC) 2 Parameter. Berikut Gambar 7 ditampilkan contoh
kurva karakteristik butir untuk Model Logistik 2 Parameter dengan 2 butir soal.
111
Gambar 7. Kurva Karakteristik Butir Untuk Model Logistik 2 Parameter
Pada Gambar 7 disajikan kurva karakteristik butir 1 (a=0,5; b=0,5) dan
butir 2 (a=1; b=0,5). Berdasarkan gambar tersebut, jika indeks daya pembeda butir
1 lebih rendah dibandingkan butir 2, maka akan nampak bahwa kurva
karakteristik butir 1 lebih landai didbandingkan dengan butir 2. Menurut
Hambleton et al., (1991: 37) pada model logistik dua parameter probabilitas
peserta tes untuk dapat menjawab benar suatu butir soal ditentukan oleh dua
karakteristik butir, yaitu indeks kesukaran butir (bi) dan indeks daya beda butir
(ai). Parameter ai merupakan indeks daya pembeda yang dimiliki butir ke-i. Pada
kurva karakteristik, ai proporsional terhadap koefisien arah garis singgung (slope)
pada titik  = b. Butir soal yang meiliki daya pembeda yang besar mempunyai
kurva yang sangat menanjak, sedangkan butir soal yang mempunyai daya
pembeda kecil mempunyai kurva yang sangat landai. Secara teoritis, nilai a i ini
terletak antara   dan   . Pada butir yang baik nilai ini memiliki hubungan
positif dengan performan pada butir dengan kemampuan yang diukur, dan a i
terletak antara 0 dan 2.
112
3) Model Logistik 3 Parameter / 3 PL (Birbaum Model)
Model Logistik 3 merupakan salah satu model dalam IRT dimana tingkat
kesukaran, daya beda dan tebakan dikontrol secara bersama-sama. Hambleton et
al., (1991: 17) merumuskan Model logistik 3 parameter sebagai berikut:
1
Pi ( )  c  (1  c)  ai (  bi )
dengan i = 1, 2, 3, …..n …………(6)
1 e
Keterangan:
Pi ( ) = Peluang menjawab benar peserta yang berkemampuan ɵ pada
butir ke i
ai = Parameter daya beda butir
c = Parameter tebakan
n = Jumlah butir soal
Sama halnya dengan Model Logistik 1 Parameter dan 2 Parameter, pada
Model Logistik 3 Parameter hubungan peluang menjawab benar Pi ( ) dengan
tingkat kemampuan peserta (  ) dapat digambarkan sebagai kurva karakteristik
butir (item charasteristic curve, ICC) 3 Parameter. Berikut ditampilkan contoh
kurva karakteristik butir untuk Model Logistik 3 Parameter pada Gambar 8.
Gambar 8. Kurva Karakteristik Butir Untuk Model Logistik 3 Parameter

113
Gambar 8 tersebut merupakan kurva karakteristik butir 1 (a=1, b=0,5,
c=0), butir 2 (a=0,5, b=0,5, c=0). Menurut Hullin (Retnawati, 2014: 17)) pada
suatu butir tes, nilai ci ini berkisar antara 0 dan 1, suatu butir dikatakan baik jika
nilai ci tidak lebih dari 1/k, dengan k banyaknya pilihan misalnya pada suatu
perangkat tes pilihan ganda dengan 4 pilihan untuk setiap butir tesnya, butir ini
dikatakan baik jika nilai ci tidak lebih dari 0,25. Setelah membahas model 1PL,
2PL, dan 3PL, maka model logistik 3PL lebih baik dibandingkan dengan model
logistik lainnya. Hal tersebut juga didukung pendapat Hambleton et al., (1991)
yang menjelaskan bahwa model 3PL adalah model terbaik.
c. Teori Respons Butir Politomi
Banyak teori pengukuran baru telah berkembang selama dekade terakhir
yang dapat memberikan informasi terperinci tentang pengujian atribut laten atau
kemampuan yang dimiliki seseorang dan relevan untuk menilai penilaian yang
kompleks dan untuk mengevaluasi keakuratan skor yang dihasilkan (Templin &
Hoffman, 2013). Teori pengukuran yang berkembang saat ini dan yang lebih
populer adalah teori respon butir atau lebih dikenal dengan istilah Item Response
Theory (IRT). Metode ini berasumsi bahwa variabel laten diwakili oleh sebuah
kontinum unidimensional dan dapat memberikan informasi yang tepat dan
terperinci tentang atribut laten atau kemampuan yang dimiliki seseorang (de
Ayala, 2009; Hu, Qin, Sullivan, & Templin, 2017).
Pemikiran model IRT menurut Hambleton et al., (1991: 2-5) didasarkan
pada dua buah postulat, yaitu: 1) prestasi subjek pada suatu butir soal dapat
diprediksikan dengan seperangkat faktor yang disebut kemampuan (latent traits),
114
dan 2) hubungan antara prestasi subjek pada suatu butir dan perangkat
kemampuan yang mendasarinya digambarkan oleh fungsi naik monoton yaitu
kurva karakteristik butir (item characteristic curve, ICC). Model IRT merupakan
model logistik yang terdiri dari 1 parameter (1PL), 2 parameter (2PL), dan 3
parameter (3PL) yang memberikan perkiraan invariant item dan kemampuan
parameter (Hambleton, 2004). Model ini dapat dipakai untuk mengidentifikasi
hubungan antara pola respons individu terhadap indikator dengan faktor ukurnya.
Penskoran pada model IRT terdapat 2 model yaitu model dikotomi dan
politomi. Menurut Naga (2013: 82) sesuai dengan rentangan skala, ada skor yang
terdiri atas skor satuan dikotomi, serta ada juga yang terdiri atas skor satuan
politomi. Untuk skor satuan dikotomi hanya memiliki nilai sederhana 0 dan 1.
Model respons butir nominal dapat diterapkan pada butir yang mempunyai
alternatif jawaban yang tidak terurut (ordered) dan adanya berbagai tingkat
kemampuan yang diukur. Pada model respons ordinal terjadi pada butir yang
dapat diskor ke dalam banyaknya kategori tertentu yang tersusun dalam jawaban,
skala likert diskor berdasarkan pedoman penskorankategori respons terurut, yang
merupakan penskoran ordinal (Retnawati & Munadi, 2013). Dengan demikian
model respon butir politomi dapat dikategorikan menjadi butir nominal dan
ordinal, tergantung pada asumsi karakteristik data.
Penskoran politomi terdapat lebih dari dua nilai yang membentang dari
nilai yang terendah sampai nilai yang tertinggi, misalnya nilai yang diberikan
pada satu butir tes membentang antara nilai 0 sampai dengan 2 atau nilai yang
membentang dengan skala yang lebih luas. Model politomi memiliki keunggulan
115
karena dapat dipakai untuk menyusun model yang menjelaskan interaksi antara
subjek dengan butir (Widhiarso, 2010: 106) . Oleh karena itu model politomus
dapat diterapkan pada skala kepribadian dengan format Likert yang memiliki
alternatif respon bergradasi dari setuju hingga tidak setuju.
Terdapat 2 model IRT yaitu IRT satu dimensi atau unidimensional IRT
(UIRT) dan multidimensional IRT (MIRT). UIRT menggunakan data dikotomi
seperti benar skor 1 dan salah skor 0 dapat menggunakan model logistik 1
parameter (1PL), model logistik 2 parameter (2PL), model logistik 3 parameter
(2PL). Selanjutnya ada dua jenis pendekatan di dalam model politomus IRT
pertama adalah pendekatan tidak langsung (indirect) dan kedua adalah pendekatan
langsung (direct). Jenis pendekatan langsung adalah sebelum memasuki
persamaan utama untuk melihat fungsi respons kategori (category response
functions/CRF), harus melihat fungsi karakteristik operasi (operating
characteristic functions/OCF) tiap kategori terlebih dahulu (Retnawati, 2014).
Model dalam politomi untuk data berskala ordinal, model yang dapat
digunakan adalah graded response model (GRM), modified graded response
model (MGRM), partial credit model (PCM), generalized partial credit model
(GPCM), dan rating scale model (RSM) dan dari model tersebut yang paling
sering dipakai ahli yakni PCM, GRM, dan GPCM (Embretson & Reise, 2000: 95,
de Ayala, 2009: 162, Retnawati, 2014: 32). Model tersebut sangat tergantung dari
karakteristik parameter dan kecocokan model yang digunakan, karena semua
model penskoran respons pada politomus mendasarkan pada asumsi bahwa
respons pada suatu item tergantung pada kemampuan peserta tes yang diukur
116
dengan menggunakan skala unidimensi (Retnawati & Munadi, 2013, Retnawati,
2014: 32). Berdasarkan model penskoran yang digunakan dalam pengembangan
model penilaian ini adalah penskoran parsial dan holistik, maka model politomi
yang dipilih adalah Parcial Credit Model (PCM) dan Graded Response Model
(GRM) dengan karakteristik sebagai berikut.
1) Parcial Credit Model (PCM)
Pada awal perkembangan teori respons butir politomus, model yang lebih
dikenal yakni perluasan dari model Rasch yang disebut dengan Partial Credit
Model, PCM (Retnawati, 2018). Pemodelan Rasch diperkenalkan oleh Georg
Rasch pada tahun tahun 1960-an merupakan model IRT yang paling popular dan
berkembang dari asalnya untuk analisis data dikotomi ke bentuk data skala
peringkat (rating scale) oleh Andrich, partial model oleh Masters, sampai ke
facets model oleh Linacre. Fitur utama dari Rasch model adalah peluang
keberhasilan seseorang tergantung pada perbedaan antara kemampuan orang dan
kesulitan item (Bond & Fox, 2007: 10, Sumintono & Widhiarso, 2014: 50).
Pendapat ini mempertegas bahwa pemodelan Rasch mengakomodasi pendekatan
probabilitas dalam memandang atribut sebuah objek ukur. Hal ini menyebabkan
pemodelan Rasch mampu mengidentifikasi objek ukur lebih cermat.
PCM adalah aplikasi dari Rasch model untuk data dikotomi untuk tes
dimana tanggapan item dicatat dalam beberapa kategori dengan skor 0 1, 2,...
Ki..., sehingga pemahaman tentang model PCM tergantung pada pemahaman
Rasch model dikotomus menjadi politomus dengan 1 PL logistik yaitu tingkat
kesukaran (Nering & Ostini, 2011: 115, Istiyono et al., 2014a). Bila penskoran
117
dikotomus membagi respons peserta tes menjadi 2 kategori saja, yaitu benar (1),
dan salah (0), namun pada PCM respons peserta tes dikumpulkan dari tahap demi
tahap dan menghargai partial correct, sehingga PCM memiliki kategori lebih dari
dua dan termasuk model penskoran politomus. de Ayala (2009: 163) meyakini
bahwa jika partial correct dihargai tahap demi tahap sesuai tahapan/langkah yang
ditugaskan kepada peserta tes, dapat memberikan informasi yang berguna untuk
memperkirakan respons peserta berada pada lokasi yang mana. Hal ini tersirat
makna bahwa dalam rubrik penilaian terdapat beberapa langkah/tahapan yang
harus dilakukan oleh peserta, setiap langkah/tahapan peserta dihargai dengan
memberikan skor 1, sebaliknya jika ada langkah/tahapan yang tidak dapat
dilakukan peserta, maka peserta tersebut mendapatkan skor 0. Artinya peserta
akan dihargai skor yang diperoleh sejumlah langkah/tahapan yang dilakukan
dengan benar atau mendapat skor 1.
Model PCM dikembangkan untuk menganalisis item tes yang
memerlukan beberapa langkah penyelesaian dan PCM juga dapat diberikan pada
langkah-langkah yang dapat dikerjakan oleh individu, sehingga PCM mempunyai
kemiripan dengan Graded Response Model (GRM) pada butir yang diskor dalam
kategori berjenjang, namun indeks kesukaran dalam setiap langkah tidak perlu
terurut, suatu langkah dapat lebih sukar dibandingkan langkah berikutnya
(Istiyono et al., 2014a, Retnawati, 2016b: 37). Jika diasumsikan bahwa sebuah
butir mengikuti pola kredit parsial, maka kemampuan individu lebih tinggi
diharapkan memiliki skor yang lebih tinggi daripada individu yang memiliki
118
kemampuan rendah. Adapun bentuk rumus umum PCM menurut Muraki & Bock
(Retnawati, 2014: 37) sebagai berikut.
k
exp  (  b jv )
Pjk ( )  m
v 0
k
,k=0,1,2,...,m ………………………… (7)

h 0
exp  (  b jv )
v 0
dengan
Pjk ( ) = probabilitas peserta berkemampuan  memperoleh skor kategori k pada
butir j,
 = kemampuan peserta,
m+1 : banyaknya kategori butir j,
bjk : indeks kesukaran kategori k butir j
dan
k h h
 (  b
h 0
jh )  0 dan  (  b
h 0
jh )   (  b jh ) ………………………… (8)
h 1
Skor kategori pada PCM menunjukkan banyaknya langkah untuk
menyelesaikan dengan benar butir tersebut. Skor kategori yang lebih tinggi
menunjukkan kemampuan yang lebih besar daripada skor kategori yang lebih
rendah (Istiyono et al., 2014b). Pada PCM, jika suatu butir memiliki dua kategori,
maka persamaan 2 menjadi persamaan model Rasch. Sebagai akibat dari hal ini,
PCM dapat diterapkan pada butir politomus dan dikotomus.
Persamaan di atas, dapat dijabarkan berdasarkan jumlah kategori di dalam
butir, sehingga persamaan model Rasch yang digunakan untuk menganalisis
respons item dengan 4 pilihan, maka didapatkan kategori (j) sebanyak 4(j=0,1,2,3)
119
buah persamaan yang probabilitas individu pada tiap kategori dalam category
response function (CRF) diwujudkan dalam persamaan berikut.
Kategori 0 :
expDai (  b11 )
P10 ( )  0  Pi1* ( )  0 
1  expDai (  b11 )
Kategori 1 :
expDai (  b11 ) expDai (  b12 )
P11 ( )  0  Pi1* ( )  Pi*2 ( )  
1  expDai (  b11 ) 1  expDai (  b12 )
Kategori 2 :
expDai (  b12 ) expDai (  b13 )
P12 ( )  0  Pi*2 ( )  Pi*2 ( )  
1  expDai (  b12 ) 1  expDai (  b13 )
Kategori 3:
expDai (  b13 ) expDai (  b14 )
P13 ( )  0  Pi*3 ( )  Pi*4 ( )  
1  expDai (  b13 ) 1  expDai (  b14 )
Dengan demikian PCM adalah model penskoran bersifat politomus yang
menilai respons bagian/langkah demi bagian/langkah, dan proses penskoran
dengan PCM diperoleh sejumlah kategori lebih dari dua, sehingga setiap
mencapai bagian tertentu diberikan kategori, dengan Threshold untuk mencapai
kategori lebih tinggi pada penskoran PCM tidak terlalu selalu lebih besar
dibandingkan dengan Threshold kategori sebelumnya. Hal ini sejalan dengan
asumsi PCM yang dinyatakan oleh Widhiarso (2010) bahwa jika sebuah item
mengikuti pola kredit parsial, maka kemampuan individu lebih tinggi diharapkan
memiliki skor lebih tinggi daripada individu yang memiliki kemampuan rendah.
Berdasarkan uraian di atas, model yang cocok dipilih untuk menganalisis
respons mahasiswa/peserta PPG terhadap capaian kompetensi pedagogik,
kompetensi sosial dan kepribadian adalah model politomus dengan PCM yang
120
menggambarkan serangkaian tahapan demi tahapan yang dicapai peserta PPG,
karena proses penskoran dengan model PCM diperoleh sejumlah kategori lebih
dari dua dalam menyelesaikan tahapan demi tahapan.
2) Graded Response Model (GRM)
Model GRM menjadi sebuah kerangka pemodelan standar statistik untuk
respons skala ordinal misalnya skala likert. Model ini merupakan perluasan dari
model 2PL yang tidak menghendaki kesamaan jumlah kategori respons antar
butir, sehingga kurva probabilitasnya jumlahnya sebanyak jumlah kategori
respons (Y. Liu & Thissen, 2014). Model GRM termasuk dalam pendekatan tidak
langsung pada model IRT, sehingga sebelum masuk ke persamaan fungsi respon
kategori (CRF) harus terlebih dahulu melihat fungsi karakteristik operasi (OCF).
Mengingat model IRT merupakan komputasi bersyarat memperkirakan respons
tertentu dikategori memerlukan dua langkah proses, sehingga untuk model GRM
dalam ukuran item tidak perlu memiliki jumlah yang sama untuk kategori respon,
tidak ada pengaruh yang timbul pada estimasi parameter item atau interpretasi
parameter berikutnya karena parameter memiliki item dengan respons yang
berbeda format dan setiap kategori respons pada butir diperlakukan layaknya butir
dikotomi (Embretson & Reise, 2000: 85).
GRM merupakan ekstensi dari skala Thurstone yang muncul pada 1928
dan tepat digunakan ketika respons peserta tes terhadap item termasuk respons
kategori yang berurutan dan tingkat penyelesaiannya cenderung meningkat seperti
pada skala likert, nilai tingkat kesukaran relative kategori 1 > 2 > …> n atau urut
121
(Ridlo, 2012). Hubungan parameter butir dan kemampuan peserta tes dalam GRM
dinyatakan oleh Retnawati (2014: 35) sebagai berikut:
Pjk ( )  Pjk* ( )  Pjk* 1 ( ) ………………………… (9)
exp[ Da j (  b jk )]
Pjk ( ) 
1  exp[ Da j (  b jk )] ………………………… (10)
dengan Pjk* ( ) = 1 dan Pjm

*
1 ( )  0
aj : Indeks daya beda butir j,

 : kemampuan peserta,
bjk : Indeks kesukaran kategori k butir j
Pjk (  ) : Probabilitas peserta berkemampuan  yang memperoleh skor
kategori k pada butir j
P jk (  ) : Probabilitas peserta berkemampuan  yang memperoleh skor
*
kategori k atau lebih pada butir j

D : Faktor skala
Persamaan (9) merupakan fungsi karakteristik operasi (OCF) dalam
GRM. Persamaan tersebut identik dengan persamaan logistik pada model 2-PL,
namun lebih spesifik karena dalam butir j terdapat kategori k yang diestimasi
secara terpisah. OCF tidak dapat langsung digunakan untuk menentukan
probabilitas pada setiap kategori butir, sehingga perlu menghitung CRF butir
terlebih dahulu dengan menggunakan persamaan (10). Embretson and Reise
(2000) menyebutkan dengan category response curves (CRCs) yang mewakili
probabilitas individu dalam menanggapi dalam kategori tertentu yang tergantung
pada level traitnya.
Salah satu tujuan model GRM adalah untuk menentukan lokasi dari
threshold ini pada kontinum sifat laten. Pada model GRM, setiap item skala (i)
dijelaskan oleh satu item slope parameter (ai) dan j = 1... mi antara kategori
122
threshold parameters (bij), yang ditunjukkan mi + 1 = ki untuk menjadi sama
dengan jumlah item respon kategori dalam item. Ada dua tahap untuk komputasi
kategori respon probabilitas di GRM. Untuk memahami tahap ini, misalnya item
tes dengan K = 5 pilihan jawaban dimana item nilai x = 0... 4. dengan lima pilihan
jawaban, ada mi = ambang batas 4 (j = 1... 4) antara pilihan jawaban seperti yang
ditunjukkan pada gambar di bawah. Salah satu tujuan model GRM adalah untuk
menentukan lokasi dari ambang batas ini pada kontinum sifat laten (Embretson &
Reise, 2000: 98), sebagaimana dicontohkan pada Gambar 9 dan Gambar 10.
Gambar 9. Operating Characteristic Gambar 10. Category Response

Curves (OCF) untuk lima kategori Curves (CRF) untuk lima kategori
(Embretson & Reise, 2000: 98) (Embretson & Reise, 2000: 98)
Berdasarkan Gambar 9 dan Gambar 10 menunjukkan parameter item
dalam GRM mengikuti bentuk dan lokasi CRF dan kurva OCF. Secara umum,
semakin tinggi parameter lereng (ai), semakin curam kurva OCF (gambar 9) dan
semakin sempit dan memuncak CRF (gambar 10). Hal ini menunjukkan parameter
item dalam GRM menentukan lereng dan lokasi kategori respons kurva dan
karakteristik kurva. Lereng bukan menunjukkan daya diskriminasi seperti halnya
pada politomi. Lereng nantinya akan berkaitan dengan fungsi informasi item
123
(Embretson & Reise, 2000: 99). Dengan demikian model GRM diformulasikan
atas asumsi bahwa probabilitas sebuah respons lebih tinggi daripada yang
diberikan pada kategori k, misalnya jika sebuah item memiliki 4 kategori respons
maka fungsi dikotomus pertama adalah 0 lawan 1, 2 atau 3, fungsi kedua adalah 0
atau 1 lawan 2 atau 3, dan fungsi ketiga adalah 0, 1, atau 2 lawan 3.
Salah satu hal penting yang perlu diperhatikan dalam model penskoran
dalam IRT adalah pemilihan model yang tepat. Pemilihan model yang tepat akan
mengungkap keadaan yang sesungguhnya dari data sebagai hasil pengukuran.
Dengan demikian model PCM dan GRM dipilih dalam penelitian ini dapat
menjelaskan hal-hal penting dari data aktual penilaian capaian penguasaan
kompetensi mahasiswa/peserta PPG, yang dapat diupayakan kedua model ini
merupakan model yang paling sederhana untuk dapat menjelaskan data dengan
baik tanpa harus membandingkannya, namun mampu menemukan model yang
paling akurat dalam mengestimasi kemampuan mahasiswa/peserta PPG.
d. Nilai Fungsi Informasi dan Kesalahan Pengukuran
Istilah nilai informasi atau fungsi informasi pada model IRT merupakan
parameter kemampuan untuk menyatakan tingkat kehandalan atau tingkat
keakuratan (ukuran presisi) hasil pengukuran suatu item, karena jika fungsi
informasi sudah diketahui, maka dapat ditemukan fungsi informasi suatu item dan
juga dapat diketahui kesalahan bakunya dalam mengestimasi kemampuan peserta
tes (Lord, 2012: 65). Menurut Baker & Kim (2017: 85) fungsi informasi pada
tingkat kemampuan yang diberikan adalah memiliki hubungan timbal-balik
dengan varians. Jika nilai informasi yang besar, itu berarti bahwa kemampuan
124
peserta tes yang sebenarnya adalah pada tingkat yang dapat diperkirakan dengan
presisi; maksudnya, semua perkiraan akan cukup dekat dengan nilai sebenarnya.
Jika nilai informasi kecil, itu berarti kemampuan peserta tes tidak dapat
diperkirakan dengan ketepatan dan perkiraan akan tersebar luas. Varians terbalik
adalah ukuran presisi yang tingkat kemampuan tertentu dapat diperkirakan, nilai
informasi yang bisa dihitung untuk setiap tingkat kemampuan pada skala
kemampuan dari negatif ke positif. Jika nilai informasi yang dipetakan terhadap
kemampuan, hasilnya adalah grafik fungsi informasi seperti pada Gambar 11.
Gambar 11. Fungsi Informasi (Baker & Kim, 2017: 85)
Memperhatikan Gambar 11 menunjukkan bahwa nilai informasi memiliki
kemampuan maksimum pada level -0.1 dan 3 untuk berbagai kemampuan dari
-2.0 ≤  ≤ 0.0. Dalam kisaran ini, kemampuan diperkirakan dengan beberapa
presisi. Fungsi informasi memberikan informasi seberapa baik tingkat
kemampuan masing-masing item yang diperkirakan. Hal ini penting untuk
diketahui bahwa fungsi informasi tidak tergantung pada distribusi tes atas skala
kemampuan. Dalam hal ini, seperti kurva karakteristik item dan kurva
karakteristik tes. Dalam tes untuk keperluan secara umum, fungsi informasi secara
125
ideal akan memberikan informasi tingkat kemampuan yang dapat diperkirakan
dengan ketepatan sama.
Dengan demikian fungsi informasi dalam pengembangan model penilaian
Program PPG merupakan parameter pengukuran yang diharapkan mampu
memberikan informasi potensi suatu item dalam mengukur capaian kompetensi
peserta PPG. Jika fungsi informasi masing-masing item sudah diketahui, maka
dapat ditemukan fungsi informasi suatu tes, dan akhirnya dapat diketahui pula
kesalahan baku tes tersebut dalam mengestimasi kemampuan peserta PPG. Oleh
karena itu, dengan diketahuinya fungsi informasi item atau tes, maka dapat
menyeleksi atau membandingkan suatu item atau tes tersebut.
1) Fungsi Informasi Item (Item information function)
Fungsi informasi item merupakan salah satu hal yang perlu diperhatikan
dalam analisis item pada IRT. Fungsi informasi ini menyatakan kekuatan atau
sumbangan butir tes dalam mengungkap laten trait yang diukur pada tes tesebut.
Pada model IRT, setiap item memiliki fungsi informasi spesifik yang
menyediakan informasi tentang tingkat trait laten dianalisis pada tingkat tertentu
paling terpercaya (Zięba, 2013). Sama halnya oleh Nurcahyo (2016) dinyatakan
fungsi ini menunjukkan sumbangan yang diberikan item terhadap estimasi
kemampuan pada suatu titik dalam kontinum kemampuan. Menurut Baker &
Kim (2017: 92) fungsi informasi ini sangat berguna dalam IRT untuk
mengevaluasi ketepatan setiap item dalam tes termasuk mengukur tingkat laten
trait yang diberikan (nilai parameter i). Pendapat ini menunjukkan fungsi
informasi sangat diperlukan dalam parameter pengukuran IRT guna
126
mendeskripsikan potensi suatu item, dimana item-item yang menyusun suatu tes
dipilih berdasar fungsi informasi item tersebut dan dapat menyeleksi atau
membandingkan suatu item atau tes tersebut.
Menurut Retnawati (2014: 16) bahwa fungsi informasi item (item
information function) merupakan suatu metode untuk menjelaskan kekuatan suatu
butir pada perangkat tes, pemilihan butir tes, dan perbandingan beberapa
perangkat tes. Setiap butir memiliki fungsi informasi sendiri berbentuk suatu
kurva yang disebut fungsi informasi butir. Pada data politomi fungsi informasi
dapat dihitung dengan menggunakan rumus yang disarankan oleh (Samejima,
1974); Du Toit (2003: 613) sebagai berikut.

mj
I j ( )   A jk ( )
k 0
  ………………………… (11)
2
mj  P ( ) 

jk
 
k 0 Pjk ( )
(Sumber: Du Toit, 2003: 613)
Dengan k adalah kategori dalam data politomus, dan A jk ( ) adalah fungsi dasar
dari item response model. Untuk bentuk ogive normal dari model graded
response, fungsi dasar A jk ( ) ditulis sebagai berikut.
A jk ( )  D 2 a j
 jk ( )   j ,k 1 ( ) 
2
………………………… (12)
A jk ( )
di mana  jk ( ) adalah ordinat normal untuk Pjk ( ) . Untuk model graded
response, fungsi dasar menjadi,
127
A jk ( )  D a
2 2
j
P 
jk   
( ) 1  P  jk ( )  P  j ,k 1 ( ) 1  P  jk ( ) 
2
…………… (13)
Pjk ( )
Fungsi informasi untuk parsial kredit model sebagai berikut,
 mj  mj 2  
2
I j ( )  D a j  Tc Pjc ( )   Tc Pjc ( )  …………………… (14)

2 2 2
 c 0  c 0  

(Sumber: Du Toit, 2003: 613)
Nilai fungsi informasi item sebagai fungsi kuadrat kemiringan bersyarat
dari varians atau berbanding terbalik dengan variansi kekeliruan asimptotik
pengestimasian parameter dan fungsi informasi sebuah item merupakan hasil
penjumlahan fungsi informasi masing-masing kategori respons (de Ayala, 2009;
Hambleton, Jones, & Rogers, 1993; Nering & Ostini, 2011). Hal ini dipertegas
oleh Lord (2008: 65) menyatakan bahwa semakin besar varians, berarti semakin
lebar sebaran hasil estimasi, maka semakin kecil nilai fungsi informasinya dan
semakin tidak akurat item tersebut dalam mengestimasi kemampuan. Variansi
kekeliruan asimptotik tersebut dapat didekati dengan parameter kemampuan
peserta (). Bila diambil nilai  di bawah dan di atas titik kritis, kemudian kedua
nilai  tersebut didekatkan, maka secara limit diperoleh fungsi informasi item.
Baker & Kim (2017: 89) juga menyatakan bahwa nilai informasi pada
tingkat kemampuan yang diestimasi memiliki hubungan timbal-balik dengan
varians. Jika nilai fungsi informasinya besar, maka semakin akurat mengestimasi
kemampuan peserta tes pada tingkat yang diperkirakan dengan presisi.
Maksudnya, hasil estimasi akan cukup dengan dengan nilai sebenarnya.
128
Sebaliknya, jika nilai informasi kecil, maka berarti bahwa kemampuan peserta tes
tidak dapat diperkirakan dengan tepat dan sebaran hasil estimasi semakin lebar,
yang berakibat pada semakin kecil nilai informasi yang diberikan, sehingga
semakin tidak akurat dalam mengestimasi kemampuan peserta tes.
Nilai dari fungsi informasi ini dimungkinkan untuk mengevaluasi
bagaimana masing-masing item memberikan kontribusi dalam mengestimasi
kemampuan peserta tes. Hal ini dimungkinkan untuk memperkirakan tingkat
informasi yang diberikan oleh item dalam lingkup seluruh kemampuan peserta tes
(Zięba, 2013). Kegunaan nilai fungsi informasi dalam pengembangan tes dan
evaluasi tergantung pada kecocokan kurva karakteristik butir atau item
characterististic curves (ICCs) untuk pengujian data. Kurva informasi butir dapat
digabungkan atau ditambahkan untuk menentukan bentuk dari kurva fungsi
informasi tes. Menurut Hambleton et al., (1991: 91) fungsi informasi perangkat
tes secara matematis dapat dituliskan sebagai berikut.
n
 i ( )    i ( ) ………………………… (15)
i 1
Aspek penting dari nilai fungsi informasi yang diberikan dalam persamaan
14 adalah bahwa semakin banyak item dalam tes, semakin besar jumlah informasi.
Dicontohkan kurva dari fungsi informasi untuk tes yang dibangun atas dasar lima
pertanyaan yang dipilih menunjukkan fungsi informasi mencapai nilai maksimum
pada titik dekat dengan i=0,25 dan kemudian menurun pada kedua sisi sehingga
tes yang dibangun atas dasar lima pertanyaan yang dipilih akan mengukur sifat
laten paling terpercaya di tingkat i=0,25 seperti disajikan pada Gambar 12.
129
Gambar 12. Grafik fungsi informasi tes (Zięba, 2013)
Berdasarkan Gambar 12 menunjukkan bahwa fungsi informasi pada
dasarnya menginformasikan seberapa baik tes dilakukan dan memperkirakan
kemampuan peserta tes. Selanjutnya nilai informasi item terbagi menjadi 2 model
yaitu model dikotomus dan model politomus. Pada model dikotomus respons
peserta terbagi dalam dua kategori, yaitu bena r dengan skor 1 dan salah dengan
skor 0. Bila harga Pi ( ) menyatakan probabilitas orang dengan kemampuan  dan
Qi ( ) merupakan probabilitas jawaban salah, maka informasi yang disajikan item
i pada kemampuan  dinyatakan sebagai I i ( ) yang dinyatakan oleh :
[ Pi ( )]2
'
I i ( )  i = 1, 2, …, n ………………………… (16)
Pi ( )Qi ( )
dengan Pi ( ) menyatakan turunan pertama dari Pi ( ) terhadap  , dan Qi ( ) =1-

'
Pi ( ) . Pada persamaan di atas, Pi ( ) menunjukkan koefisien arah lengkungan

'
pada grafik respons item, secara matematis, turunan atau deviasi suatu fungsi
menyatakan titik kritis atau titik belok dari fungsi tersebut. Jika diturunkan pada
aspek tiga parameter yang ditinjau dalam karakteristik butir, maka persamaan
130
fungsi informasi butir sebagai berikut (Hambleton & Swaminathan, 1985:107;
Retnawati, 2014: 81).
2,89ai (1  c)
2
I i ( )  ……………………… (17)
(ci  exp( Dai (  bi))1  exp(  Dai (  bi )2
dengan,
I i ( ) : fungsi informasi butir-i
 : tingkat kemampuan
ai : paramater daya beda butir-i
bi : parameter indeks kesukaran butir-i
ci : indeks tebakan semu butir-i
Selanjutnya fungsi informasi item pada model politomus memperlakukan
respons peserta ke dalam kategori yang jumlahnya lebih dari dua. de Ayala (2009)
menyatakan item pada politomus berbeda dengan model dikotomus, karena
masing-masing alternatif jawaban atau kategori menghasilkan informasi tentang
kemampuan peserta tes, karena untuk item politomus model responsnya
berjenjang, sehingga untuk mengetahui informasi suatu item harus dijumlahkan
semua informasi dari setiap kategori. Model politomous juga akan terbatas dalam
cara-cara yang sudah ditetapkan, contoh yang paling umum ini adalah dimana
item politomous respons peserta menggunakan skala rating (de Ayala, 2009: 162,
Reise & Revicki, 2014: 290). Faktor yang mungkin dianggap penting dalam
menggunakan model politomous dalam IRT adalah pertanyaan tentang bagaimana
memberikan hasil pengukuran yang berbeda.
Politomus dalam model IRT untuk satu set data secara efektif
memperkirakan satu set parameter model untuk level trait dan karakteristik item.
Model ini memungkinkan jumlah kategori untuk item yang berbeda dalam tes
131
yang berbeda. Secara bersamaan memperkirakan invarian item dan parameter
peserta pada skala pengukuran yang sama. Hal ini juga memberikan informasi
tentang setiap parameter item dengan teliti dan informasi pada model politomus
IRT dapat dinilai pada tingkat item atau tingkat ategori (Nering & Ostini, 2011:
12, Reise & Revicki, 2014: 295). Penelitian Keller, Swaminathan, and Sireci
(2003) menunjukkan bahwa pilihan hasil model dikotomus vs politomus (testlet) k
tergantung pada konteks item mempengaruhi perkiraan nilai peserta tes.
Hambleton et al. (1993) menyatakan ketika item terbaik dipilih atas dasar
karakteristiknya, maka terdapat kecenderungan memperbesar kemungkinan
disebabkan error dalam ukuran taksiran item. Untuk mengatasinya ada tiga tahap
yang dilakukan untuk mengurangi masalah-masalah pada pemilihan item, yaitu:
(a) menggunakan sampel besar pada waktu mengkalibrasi item untuk memproleh
presisi dalam menaksir parameter item, dengan menaikkan ketelitian dalam
menaksir item akan mengurangi signifikansi pengaruh yang disebabkan error, (b)
melebihkan fungsi informasi target yang telah diputuskan, (c) menaksir seberapa
besar masalahnya dengan membagi sampel menjadi dua bagian.
Dengan demikian pengembangan model penilaian Program PPG dengan
penskoran parsial dan holistik memerlukan pemilihan item-item dalam instrumen
berdasarkan pertimbangan fungsi informasinya. Item-item dalam instrumen perlu
memiliki domain isi dan konsepsi yang teruji serta menyediakan taksiran yang
reliabel, meskipun tetap akan muncul masalah yang disebabkan oleh fungsi
informasi yang terdeterminasi oleh taksiran parameter itemnya yang memiliki
error (Zenisky, Hambleton, & Sired, 2002). Hal ini menunjukkan bahwa nilai-
132
nilai indeks parameter kemampuan dan item merupakan hasil penaksiran,
sehingga kebenarannya memiliki probabilitas dan tidak terlepas dari kesalahan
pengukuran.
2) Fungsi Informasi Tes
Tes digunakan untuk memperkirakan kemampuan peserta tes. Setiap
kemampuan peserta tes dapat diperoleh dari nilai informasi yang dihasilkan oleh
tes pada setiap tingkat kemampuan. Baker (2001: 107) menyatakan fungsi
informasi tes akan jauh lebih tinggi daripada untuk satu fungsi informasi item,
karena tes mengukur kemampuan lebih tepat daripada satu item. Dengan
demikian, merencanakan nilai informasi pengujian terhadap kemampuan peserta
tes menghasilkan grafik fungsi informasi tes seperti pada Gambar 13.
Gambar 13. Fungsi informasi tes (Baker, 2001: 107)
Fungsi informasi tes merupakan penjumlahan semua fungsi informasi
item-item yang membangun tes tersebut. Nurcahyo (2016) menyatakan bahwa
gabungan fungsi informasi dari keseluruhan item akan membentuk fungsi
informasi tes. Menurut de Ayala (2009: 200) pada model politomus,
dimungkinkan untuk menentukan jumlah informasi yang disediakan oleh masing-
133
masing kategori respons. Jumlah dari fungsi kategori informasi I xj (θ) yang dinilai
(atau skor kategori) adalah fungsi informasi item. Berikut ini fungsi informasi
untuk data politomus.
mj mj
I j ( )   ixj ( ) p xj  
p 
x' j
2
……………………… (18)
xj 0 xj 0 p xj
di mana pxj adalah probabilitas untuk mendapatkan kategori xj bersyarat
pada θ, dan px’j adalah turunan pertama dari pxj. Istilah pxj dapat berupa Model
Parsial Credit. Lebih lanjut jumlah dari fungsi informasi item menghasilkan
informasi total instrumen yang disajikan sebagai berikut (de Ayala, 2009: 200).
L
I i ( )   i j ( ) ……………………… (19)
j 0
Model dikotomus ada 2 kategori yaitu 1 dan 0 untuk daya pembeda (a)
sebesar 1,0 dan tingkat kesulitan pada kategori menjawab 1 sebesar -1,0 seperti
nampak pada gambar 14. Pada dikotomus model 3 kategori yaitu 0, 1 dan 2.
Untuk daya pembeda (a) sebesar 1,0 dan tingkat kesulitan pada kategori
menjawab 1 sebesar-2,0 dan 0,0 seperti nampak pada gambar 15. Pada gambar 16
disajikan model politomus dengan 4 kategori yaitu 0,1,2 dan 3 untuk daya
pembeda (a) sebesar 1,0 dan tingkat kesulitan pada kategori menjawab -2,0, 0,0
dan 2,0. Pada Gambar 17 disajikan model politomus dengan 4 kategori yaitu 0,1,2
dan 3, untuk daya pembeda (a) sebesar 1,0 dan tingkat kesulitan pada kategori
menjawab -1,5, -0,5, 0,5 dan 1,5.
134
Gambar 14. Grafik CRF untuk 2 kategori Gambar 15. CRF untuk 3 kategori
Gambar 16. Grafik CRF untuk 4 kategori Gambar 17. CRF untuk 5 kategori
(Retnawati, 2014: 35-36)
Dengan demikian ketika menginterpretasikan fungsi informasi tes, sangat
penting untuk diingat hubungan timbal balik antara nilai informasi dan variabilitas
dari perkiraan kemampuan. Sebagaimana pendapat Baker (2001: 115) untuk
mengartikan nilai informasi ke dalam kesalahan standar estimasi, satu hal yang
perlu diperhatikan hubungan timbal-balik akar kuadrat dari nilai informasi
pengujian. Demikian halnya oleh menyatakan Hambleton & Swaminathan (1985:
104) salah satu faktor yang paling penting dari fungsi informasi tes adalah
kontribusi dari setiap item untuk informasi total tes. Dengan demikian, pengaruh
135
dari setiap item dan dampaknya pada total tes dapat mudah ditentukan. Susongko
(2010) juga menyatakan jika makin tinggi ketidakpastian, maka makin rendah
nilai fungsi informasinya. Sebaliknya, makin rendah ketidakpastian, maka makin
tinggi nilai fungsi informasi tes. Hal ini menunjukkan fungsi informasi dalam
model IRT berhubungan secara terbalik dengan ketidakpastian.
3) Kesalahan Baku Estimasi
Fungsi informasi tidak terlepas dari kesalahan pengukuran, karena nilai-
nilai indeks parameter item dan kemampuan peserta merupakan hasil estimasi
yang kebenarannya bersifat probalilitas, sehingga setelah informasi tes diketahui,
tentu dapat ditemukan kesalahan baku tes tersebut dalam mengestimasi
kemampuan peserta tes. Retnawati (2014: 19) bahwa kesalahan pengukuran dalam
IRT disebut dengan kesalahan penaksiran standar atau standard error of
measurement (SEM) berkaitan erat erat dengan fungsi informasi. Kaitan antara
fungsi informasi dengan SEM memiliki hubungan yang berbanding terbalik
secara kuadratik. Sebagaimana dinyatakan Hambleton et al., (1991: 94),
Retnawati (2014: 82) dan Ridlo (2012) bahwa jika semakin besar atau tinggi
nilai fungsi informasi, maka semakin SEM atau kesalahan bakunya semakin kecil
atau sebaliknya, yang berarti semakin akurat model penskoran tersebut dalam
mengestimasi kemampuan peserta. Hubungan keduanya oleh Hambleton et al.,
(1991: 94) dan Retnawati (2014: 82) dinyatakan jika nilai fungsi informasi
^
dinyatakan dengan Ii (  ) dan estimasi SEM dinyatakan dengan SEM ( ) maka
persamaannya adalah:
136
^ 1
SEM ( )  ……………………………………………… (20)
I ( )
^ ^
Kesalahan standar baku  , SEM ( ) adalah standar deviasi distribusi
normal estimasi asimptotik maksimum pendugaan dalam mengestimasi
kemampuan peserta. Kesalahan ini dalam IRT berdasarkan pada fungsi informasi
suatu tes. Jika semakin besar fungsi informasi suatu tes, maka semakin kecil
kesalahan baku pengukuran. Semakin besar fungsi informasi tersebut, semakin
dipercaya dalam mengukur kemampuan peserta tes yang sebenarnya. Oleh karena
itu, besar kecilnya nilai fungsi informasi tes sangat memengaruhi kesalahan baku
pengukuran. Berikut ini disajikan contoh hubungan timbal balik antara nilai
fungsi informasi dengan standard error of measurement pada Gambar 18.
Gambar 18. Hubungan timbal balik antara NIF dengan SEM

Sumber: Du Toit (2003: 510).
Berdasarkan nilai fungsi informasi dan bentuk persamaannya, dapat
dikatakan bahwa semakin tinggi puncak nilai fungsi informasi yang diperoleh,
semakin memberikan informasi model yang dipilih dalam menjelaskan level
kemampuan peserta tes. Oleh karena itu, nilai fungsi informasi dalam IRT sangat
penting dalam menunjukkan sebuah fungsi yang mengukur model yang dipilih
137
mampu memberikan informasi terhadap pendugaan level kemampuan peserta tes
dan semakin kecil kesalahan bakunya berarti semakin akurat model penskoran
tersebut dalam menaksir kemampuan, sehingga dalam penelitian ini nilai fungsi
informasi butir berfungsi untuk memberikan informasi-informasi terhadap
pendugaan level kemampuan mahasiswa/peserta PPG sesuai dengan model yang
dipilih berdasarkan penskoran parsial atau holistik. Mengingat karakteristik dari
nilai fungsi informasi ini adalah independensi diantara butir mengakibatkan butir
didalam perangkat tes dapat ditambahkan, dikurangi, atau diganti secara bebas,
dan dengan menggunakan sifat aditif dari kurva fungsi informasi butir, sehingga
dengan nilai fungsi informasi ini dapat dirakit instrumen penilaian yang mengukur
capaian kompetensi mahasiswa/peserta PPG yang sesuai dengan model tertentu
mendekati model yang diinginkan.
B. Kajian Penelitian yang Relevan
Telah dilakukan berbagai penelusuran terkait penelitian yang mengkaji
tentang pengembangan model penilaian Program PPG dengan penskoran parsial
dan holistik tidak ditemukan. Namun terdapat beberapa penelitian yang relevan
dengan penelitian ini baik di luar negeri maupun di Indonesia sebagai berikut.
Penelitian Wiseman (2012) yaitu membandingkan penskoran holistik dan
analitik untuk menilai kinerja menulis mahasiswa di salah satu perguruan tinggi.
Hasil penelitian menunjukkan rubrik analitik lebih baik digunakan sebagai
instrumen penilaian kinerja menulis dibanding dengan menggunakan penskoran
holistik. Berbeda dengan penelitian Ounis (2017) yang meneliti tentang
138
perbandingan penskoran holistik dan analitik pada keterampilan berbicara,
diperoleh hasil bahwa penskoran holistik lebih baik, dapat diandalkan dan
konsisten dalam menilai keterampilan berbicara mahasiswa. Kedua penelitian
tersebut berbeda dengan penelitian ini, meskipun terdapat kesamaan pada
penskoran holistik. Kedua penelitian tersebut membandingkan penskoran holistik
dengan analitik, sementara dalam penelitian ini membandingkan penskoran parsial
dengan holistik. Selain itu objek penilaian yang dilakukan juga berbeda meskipun
subjeknya sama yaitu mahasiswa dimana dalam penelitian ini difokuskan pada
penilaian mahasiswa/peserta PPG sementara kedua penelitian tersebut fokus pada
penilaian kinerja mahasiswa dalam menulis dan menilai keterampilan berbicara.
Penelitian Kim & Kim (2016) dalam mengembangkan dan memvalidasi
indikator penilaian kompetensi mengajar di STEAM Korea menunjukkan terdapat
35 item yang dapat menjadi pedoman dalam mengukur kompetensi mengajar yang
terdiri dari 35 item dalam tujuh indikator: pemahaman mata pelajaran (lima item);
Metode pembelajaran (delapan item); memotivasi peserta didik untuk
berpartisipasi dalam belajar (lima item); pemahaman peserta didik (empat item);
lingkungan belajar dan keadaan (lima item); evaluasi peserta didik (empat item);
dan mengindentifikasi karakteristik individual peserta didik(empat item).
Penelitian Kim & Kim (2016) hanya fokus pada pengembangan salah satu
kompetensi yang dinilai dalam mengajar atau kompetensi pedagogik, sehingga
belum bisa menggambarkan kompetensi guru secara utuh. Sementara dalam
penelitian ini memfokuskan pada penilaian kompetensi mahasiswa PPG
mencakup kompetensi pedagogik, kompetensi kepribadian dan kompetensi sosial.
139
Penelitian lain yang dilakukan oleh Büyükkidik and Anil (2015) yang
membandingkan penilaian menggunakan rubrik holistik dan rubrik analitik
berdasarkan teori G (generability theory). Mereka menemukan bahwa rubrik
analitik memiliki keandalan yang lebih tinggi dibandingkan dengan penilaian
menggunakan rubrik holistik. Selanjutnya Metruk (2018) hasil penelitiannya
menunjukkan bahwa secara statistik ada perbedaan yang signifikan antara
penilaian yang menggunakan rubrik holistik dan analitis dengan p-value sebesar
0.001 (p < 0.05). Oleh karena itu, disarankan bahwa untuk menggunakan kedua
rubrik tersebut dalam proses penilaian yang mungkin dianggap tepat ketika
keduanya digunakan untuk saling melengkapi, dan bersama-sama memberikan
kontribusi terhadap penilaian lebih objektif. Kedua penelitian tersebut
memfokuskan pada perbandingan penilaian yang menggunakan rubrik penilaian
holistik dan rubrik penilaian analitik yang menunjukkan ada perbedaan keduanya
jika diterapkan dalam proses penilaian. Sementara dalam penelitian ini
mengembangkan model penilaian PPG dengan penskoran parsial dan holistik.
Model penilaian PPG yang dikembangkan berisi instrumen-instrumen penilaian
yang menilai capaian penguasaan kompetensi pedagogik, penilaian kompetensi
sosial dan penilaian kompetensi kepribadian.
Penelitian sebelumnya di Indonesia telah mengembangkan instrumen
kompetensi bidang keguruan mahasiswa calon guru oleh Suparji (2008) yang
difokuskan pada pengembangan instrumen kompetensi pedagogik, kepribadian
dan sosial. Penelitian Retnawati and Munadi (2013) mengestimasi parameter butir
dan kemampuan guru menggunakan model parsial kredit dan parsial kredit
140
tergeneralisasi dan membandingkan keduanya. Hasil penelitian menunjukkan
bahwa model parsial kredit merupakan model yang sesuai (cocok) digunakan
untuk mengestimasi parameter butir dan kemampuan guru.
Penelitian Hidayah (2013) yang mereview pelaksanaan Pendidikan Profesi
Guru (PPG) sebagai fungsi pelaksanaan manajemen mutu yang difokuskan pada
Program Studi PGSD ditemukan penilaian kualitas pelaksanaan PPG baik oleh
peserta memberikan hasil dengan kriteria “baik”, namun peningkatan mutunya
harus dilakukan secara terus menerus dan berkesinambungan. Penelitian Hasli
(2016) mengembangkan instrumen kompetensi pedagogik guru kelas sekolah
dasar, namun untuk pembuktian validitasnya hanya fokus pada validitas isi oleh
expert judgement dari segi materi yaitu menunjukkan instrumen valid.
Penelitian Sadtyadi and Kartowagiran (2014) mengembangkan instrumen
penilaian kinerja guru sekolah dasar dengan maksud untuk memperoleh
komponen, indikator dan instrumen penilaian kinerja guru sekolah dasar dengan
hasil analisis diperoleh instrumen tersebut valid dan reliabel serta menunjukkan fit
model yang cukup baik yaitu instrumen penilaian tersebut terdiri dari lima
komponen yakni mengajar, mendidik, melatih dan mengarahkan, membimbing,
serta menilai dan mengevaluasi. Selain itu, masing-masing komponen instrumen
tersebut dapat dijabarkan menjadi beberapa indikator yang relevan. Sementara
dalam penelitian ini memfokuskan pada model penilaian PPG yang
dikembangkan dengan penskoran parsial dan holistik dalam menilai kemampuan
peserta PPG menyusun rencana pelaksanaan pembelajaran, melaksanakan
pembelajaran dan menilai penguasaan kompetensi sosial dan kepribadian.
141
Penelitian Widiati and Hayati (2015) tentang Program PPG di Indonesia
yang memfokuskan pada Program Studi Bahasa Inggris ditemukan bahwa
program ini telah memberikan manfaat bagi peserta dalam hal mengembangkan
keterampilan praktik mengajar dalam merancang rencana pembelajaran, materi
pembelajaran dan media, dan prosedur penilaian sesuai dengan kurikulum sekolah
menengah. Selain itu ada juga yang mengembangkan instrumen bakat keguruan
oleh Wasidi and Mardapi (2016) hasil confirmatory factor analysis menunjukkan
bahwa instrumen bakat keguruan fit. Koefisien reliabilitas gabungan tinggi,
analisis multi trait multi method menunjukkan bahwa korelasi antara skor
kreativitas pedagogi dengan skor IQ rendah. Penelitian Hotimah and Suyanto
(2017) mendeskripsikan gambaran tentang bagaimana strategi pendidikan profesi
guru (PPG) di LPTK Universitas Negeri Surabaya dalam mengembangkan
kompetensi pedagogik dan profesional peserta PPG pasca SM3T.
Penelitian Disas (2017) tentang analisis kebijakan pendidikan mengenai
pengembangan dan peningkatan profesi guru yang menunjukan bahwa dengan
adanya kebijakan pendidikan mengenai pengembangan dan peningkatan profesi
guru, posisi guru semakin dinaungi oleh sumber hukum serta dengan adanya
Pendidikan Profesi Guru, guru menjadi lebih memiliki pengetahuan dan
profesionalitas menjadi seorang guru. Prasojo et al. (2017) menganalisis
manajemen kurikulum program profesi guru untuk program Sarjana Mendidik di
daerah Terdepan, Terluar, dan Tertinggal (SM3T) yang diselenggarakan di
Universitas Negeri Yogyakarta, yang mencakup perencanaan, pengorganisasian,
pelaksanaan, dan pengawasan kurikulum.
142
Penelitian Suparji (2008) hanya fokus pada pengembangan instrumen
kompetensi pedagogik, kepribadian dan sosial, sementara kompetensi profesional
tidak masuk dalam wilayah penelitian ini. Kompetensi profesional diasumsikan
telah dikuasai dengan baik oleh mahasiswa karena dari jumlah SKS untuk mata
kuliah bidang studi sudah cukup memadai. Selain itu, karena begitu banyak dan
spesifiknya masing-masing mata bidang studi yang diajarkan sehingga perlu ada
penelitian tersendiri untuk membuat instrumen dari masing-masing bidang studi
untuk mengukur kompetensi profesional. Demikian halnya cakupan mahasiswa
calon guru yang dimaksud belum spesipik mengarah pada bidang keahlian mata
pelajaran yang diajarkan, sementara dalam penelitian ini difokuskan kepada
model penilaian PPG yang mampu untuk menilai capaian penguasaan kompetensi
mahasiswa/peserta yaitu kompetensi pedagogik, kompetensi sosial, dan
kompetensi kepribadian. Penelitian ini juga tidak menilai capaian penguasaan
kompetensi profesional, karena pelaksanaan penilaiannya secara tertulis
menggunakan soal dari Panitia Nasional Uji Kompetensi Mahasiswa Program
PPG (Panas UKMPPG) yang terjadwal secara nasional dan tentunya item-item
pada soal tersebut telah melalui tahapan-tahapan pengembangan soal yang baku.
Penelitian Retnawati dan Munadi (2013) memfokuskan pada hasil estimasi
parameter butir dan kemampuan guru menggunakan model parsial kredit, hasil
estimasi parameter butir dan kemampuan guru menggunakan model parsial kredit
tergeneralisasi, dan melakukan perbandingan antara kecocokan model estimasi
parameter butir dan kemampuan guru menggunakan model parsial kredit.
Sementara dalam penelitian ini difokuskan pada model penilaian PPG dengan
143
penskoran parsial dan holistik. Demikian halnya pada penelitian Hasli hanya
fokus pada pengembangan instrumen pedagogik dengan subjeknya pada guru
sekolah dasar dan penelitian Wasidi & Mardapi hanya fokus kepada
pengembangan instrumen bakat keguruan dengan model fit.
Terkait dengan kajian penelitian yang relevan dengan PPG dilakukan oleh
Hidayah mereview PPG sebagai fungsi pelaksanaan manajemen mutu yang
difokuskan pada Program Studi PGSD. Widiawati & Hayati hanya memfokuskan
pada kebermanfaatan PPG pada Program Studi Bahasa Inggris. Hotimah &
Suyanto yang memfokuskan strategi penyelenggaraan Program PPG di
Universitas Negeri Surabaya dalam mengembangkan kompetensi pedagogik dan
profesional peserta PPG pasca SM3T. Penelitian Disas hanya menganalisis
kebijakan pendidikan mengenai pengembangan dan peningkatan Program PPG
dan Prasojo et.al., hanya menganalisis manajemen kurikulum Program PPG untuk
Program SM3T yang diselenggarakan di Universitas Negeri Yogyakarta.
Penelitian-penelitian tersebut terbatas pada pengembangan kompetensi dan
bakat keguruan mahasiswa calon guru secara umum dan mengkaji tentang
pelaksanaan PPG dari segi manfaat dan aspek manajemen atau pengelolaannya
pada kebijakan dan kurikulum. Pengembangan instrumen penilaian kompetensi
bidang keguruan telah banyak dilakukan, namun pengembangan model penilaian
PPG dengan penskoran parsial dan holistik belum pernah ada, sehingga penelitian
ini memenuhi unsur kebaharuan. Dengan demikian secara garis besar disimpulkan
bahwa penelitian ini berbeda dengan penelitian-penelitian sebelumnya yang ada
di Indonesia terutama yang memfokuskan pada kajian PPG sebagai isu penelitian
144
terbaru, karena dari berbagai penelitian yang telah dipaparkan lebih fokus
mengkaji efektivitas pelaksanaan Program PPG dan deskripsi profil kompetensi
lulusan serta manajemennya. Sementara penelitian ini bertujuan untuk
mengembangkan model penilaian Program PPG dengan penskoran parsial dengan
penskoran holistik.
Pengembangan model penilaian Program PPG dengan penskoran parsial
dan holistik ini sangat penting dan perlu dilakukan untuk menilai capaian
penguasaan kompetensi mahasiswa/peserta PPG yang dipersyaratkan menjadi
guru yaitu kompetensi pedagogik, kompetensi sosial, dan kompetensi kompetensi
kepribadian. Pengembangan model penilaian ini, difokuskan pada penilaian
kompetensi pedagogik yang menilai kemampuan peserta PPG dalam menyusun
Rencana Pelaksanaan Pembelajaran (RPP) dan melaksanakan pembelajaran,
penilaian kompetensi sosial dan kepribadian. Item-item yang ada dalam instrumen
yang dikembangkan menyesuaikan dengan item-item yang sudah dikembangkan
oleh Kemenristekdikti dan melengkapi item-item yang tidak ternilai. Tujuan akhir
dari penelitian ini untuk menggali informasi keakuratan model penilaian dengan
penskoran parsial dan holistik melalui fungsi informasi dan kesalahan baku
estimasi sehingga mampu mengestimasi kemampuan mahasiswa/peserta PPG
secara akurat dan terpercaya.
C. Kerangka Pikir
Model penilaian yang baik setidaknya memenuhi persyaratan sesuai
dengan prosedur pengembangan. Oleh karena itu, harapan yang tinggi untuk
mengembangkan model penilaian PPG yang ada, sesuai dengan prosedur
145
pengembangannya menjadi sebuah kebutuhan utama dan dianggap penting, agar
objektivitas dalam menilai dapat dicapai dan subjektivitas dapat diminimalisir.
Penelitian ini bertujuan untuk merumuskan konstruk instrumen model penilaian
PPG, menyusun instrumen penilaian kompetensi peserta PPG dengan penskoran
parsial dan holistik yang valid dan reliabel, mendeskripsikan karakteristik
instrumen model penilaian PPG, serta mendeskripsikan hasil penskoran parsial
dan holistik dalam pengembangan model penilaian PPG pada praktik mengajar.
Selain itu, mendeskripsikan hasil penilaian kepraktisan model penilaian PPG yang
telah dikembangkan berdasarkan survey terhadap pengguna atau penilai PPG
yang telah menggunakan model penilaian ini sebagaimana disajikan pada
kerangka pikir dalam penelitian ini pada Gambar 19.
146
Kepraktisan
Model
Penilaian
PPG
Model Penilaian:
- Sistem penilaian
- Mekanisme penilaian
- Penskoran dan interpretasi
hasil penilaian
Gambar 19. Kerangka Pikir
147
D. Pertanyaan Penelitian
Berdasarkan kajian teori dan kerangka berpikir yang telah dikonstruksi
dalam mendukung pengembangan model penilaian PPG dengan penskoran parsial
dan holistik dalam penelitian, maka selanjutnya dapat dirumuskan pertanyaan
penelitian sebagai berikut.
1. Bagaimana konstruk model penilaian PPG dengan penskoran parsial dan
peserta PPG?
2. Bagaimana bukti validitas isi model penilaian PPG dengan penskoran parsial
dan holistik?
3. Bagaimana bukti validitas konstruk model penilaian PPG dengan penskoran
parsial dan holistik?
4. Bagaimana estimasi reliabilitas model penilaian PPG dengan penskoran
parsial dan holistik?
5. Bagaimana karakteristik model penilaian PPG dengan penskoran parsial dan
peserta PPG?
6. Bagaimana perbandingan akurasi antara model penilaian melalui penskoran
parsial dengan model penilaian melalui penskoran holistik yang dapat
digunakan dalam mengestimasi penguasaan kompetensi peserta PPG?
7. Bagaimana kepraktisan model penilaian PPG dengan penskoran parsial dan
holistik berdasarkan penilaian oleh pengguna?
148
BAB III
METODE PENELITIAN
A. Model Pengembangan
Penelitian ini bertujuan untuk mengembangkan model penilaian Program
PPG dengan penskoran parsial dan holistik. Model penilaian Program PPG yang
dikembangkan menghasilkan produk berupa instrumen dan panduan model
penilaian Program PPG dengan penskoran parsial dan holistik. Oleh karena pada
penelitian ini terdapat kegiatan pengembangan yang menghasilkan produk dan
menguji efektivitas dari produk yang dihasilkan tersebut, maka jenis penelitian ini
termasuk penelitian dan pengembangan Research and Development yang
disingkat R & D.
Model R & D yang digunakan dalam penelitian ini berdasarkan tahapan R
& D yang dikemukakan Borg and Gall (1989: 781-802) yaitu: 1) research and
information collecting (studi pendahuluan: kaji pustaka dan survei awal), 2)
planning (perencanaan penelitian), 3) develop preliminary form of product
(pengembangan produk awal), 4) preliminary field testing (uji lapangan terbatas),
5) main product revision (revisi hasil uji lapangan terbatas), 6) main field testing
(uji lapangan lebih luas), 7) operational product revision (revisi hasil uji lapangan
lebih luas), 8) operational field testing (uji kelayakan), 9) final product revision
(revisi hasil uji kelayakan), 10) dissemination and implementation (diseminasi dan
sosialisasi produk akhir).
149
Berdasarkan tahapan model R & D yang dikemukakan Borg and Gall
tersebut, berikut ini digambarkan alur pengembangannya dalam penelitian ini
sebagaimana disajikan pada Gambar 20.
Research and Planning and Preliminary field

R&D information develop preliminary testing and main
Starting collecting form of product product revision
Studi pendahuluan: Tahap merencanakan Tahap ujicoba lapangan

1. Identifikasi masalah dan mengembangkan terbatas dan revisi:
di lapangan draft produk: 1. Valididasi isi oleh
2. Pengumpulan 1. Draft Instrumen validator
informasi (need 2. Draft Panduan 2. Revisi masukan
assessment) validator
3. Kajian pustaka dan 3. Ujicoba terbatas
regulasi/kebijakan 4. Analisis data
4. Kajian penelitian (validitas konstruk,
yang relevan reliabilitas)
5. Revisi produk
ujicoba terbatas
Dissemination Operational field Main field testing

and testing and final and operational
implementation product revision product revision
Tahap ujicoba Tahap ujicoba diperluas

operasional dan revisi dan revisi:
final terhadap model 1. Ujicoba diperluas
produk berdasarkan 2. Analisis data
hasil uji lapangan (validitas konstruk,
sebelumnya reliabilitas)
3. Revisi produk
ujicoba
Gambar 20. Alur Pengembangan Model R & D (Borg & Gall, 1989)
Berdasarkan model R & D pada Gambar 20, maka prosedur
pengembangan model penilaian PPG ini juga mengacu pada prosedur
150
pengembangan yang disarankan oleh Mardapi (2017: 132) dan Retnawati (2014:
3) yaitu: 1) menentukan spesifikasi/tujuan penyusunan instrumen, 2) mencari
teori yang relevan atau cakupan materi, 3) menyusun indikator item instrumen, 4)
menyusun item instrumen dan panduan penilaian dengan menggunakan penskoran
parsial dan holistik, 5) validasi isi/telaah instrumen dan panduan penilaian dengan
penskoran parsial dan holistik, 6) revisi berdasarkan masukan validator, 7)
melakukan ujicoba kepada responden yang bersesuaian untuk memperoleh data
respons peserta (uji terbatas), 8) melakukan analisis (validitas konstruk dan
reliabilitas), (9) revisi berdasarkan hasil analisis data uji coba terbatas, 10) uji
coba diperluas dan analisis datanya, 11) merakit instrumen final, 12) menafsirkan
hasil pengukuran.
Komponen penilaian capaian penguasaan kompeteni Program PPG
diadaptasi dari teori Cooper (2013: 4) yang menyatakan bahwa wilayah umum
kompetensi seorang guru meliputi pengetahuan dan keterampilan tentang
pembelajaran (kompetensi pedagogik), sikap (kompetensi sosial dan kepribadian),
dan penguasaan bidang studinya (kompetensi profesional). Hal ini juga relevan
dengan Standar capaian kompetensi Program PPG di Indonesia yang mengacu
pada tuntutan empat kompetensi guru sebagaimana dipersyaratkan dalam Undang-
Undang Nomor 14 Tahun 2005 tentang Guru dan Dosen serta tertuang pada
Permendiknas Nomor 16 Tahun 2017 tentang standar kualifikasi akademik dan
kompetensi guru, serta Permenristekdikti Nomor 55 Tahun 2017 Tentang Standar
Pendidikan Guru.
151
Model penilaian PPG yang dikembangkan difokuskan pada instrumen
penilaian kompetensi pedagogik yang menilai kemampuan peserta PPG dalam
menyusun rencana pelaksanaan pembelajaran, melaksanakan pembelajaran, dan
penguasaan kompetensi sosial dan kepribadian. Selain itu, menyusun panduan
penilaian yang mencakup sistem penilaian PPG yang menjelaskan pengertian,
prinsip, acuan penilaian serta teknik penilaian. Mekanisme penilaian Program
PPG yang meliputi lingkup penilaian berisi cakupan komponen-komponen yang
dinilai dan perumusan indikator, teknik penilaian dan bentuk instrumen.
Selanjutnya penskoran dan interpretasi hasil penilaian yang mencakup pengertian
penskoran, model penskoran, interpretasi hasil penilaian, contoh penilaian dan
tindak lanjut, skoring dan pemanfaatan hasil penilaian.
B. Prosedur Pengembangan
Penelitian ini bertujuan untuk merumuskan konstruk instrumen dari model
penilaian Program PPG, menyusun instrumen penilaian kompetensi
mahasiswa/peserta PPG dengan penskoran parsial dan holistik yang akurat dan
terpercaya, mendeskripsikan karakteristik model penilaian PPG, serta
mendeskripsikan hasil penskoran parsial dan holistik. Adapun prosedur
pengembangan yang dilakukan dikelompokkan dalam tiga tahapan besar.
Pertama, tahap penyusunan perangkat penilaian yang difokuskan pada
capaian penguasaan kompetensi pedadgogik mahasiswa/peserta PPG dalam
menyusun rencana pelaksanaan pembelajaran dan melaksanakan pembelajaran,
serta penilaian kompetensi sosial dan kepribadian, observasi dan focus group
discussion dengan dosen pengajar workshop/pembimbing lapangan/penguji UKIN
152
dan guru pamong/penguji UKIN untuk mendapat data yang lengkap dan
komprehensif. Langkah ini menghasilkan draft 1 rancangan model penilaian.
Kemudian naskah ini dikonsultasikan dengan promotor dan kopromotor, sebelum
disebarkan secara tertulis kepada expert judgment melalui metode Delphi dan
menghasilkan draft awal dari model penilaian PPG. Untuk membuktikan
sejauhmana rancangan model ini dapat dipahami oleh penilai, maka diadakan
ujicoba keterbacaan untuk memperoleh masukan untuk perbaikan. Setelah direvisi
dan dikonsultasikan dengan expert judgment, promotor dan kopromotor, maka
dihasilkan rancangan model yang siap untuk diujicoba secara terbatas.
Tahap kedua adalah tahap ujicoba terbatas (prelemininary field testing),
dimana model penilaian ini akan dipakai oleh dosen pengajar
workshop/pembimbing lapangan/penguji UKIN dan guru pamong/penguji UKIN
pada penilaian praktik mengajar. Tahap ketiga adalah penerapan model secara
luas (main field testing) dengan prosedur pengembangan seperti disajikan pada
Gambar 21.
153
Model Dissemination
and
Praktis implementation
Research and
information
collecting
Operational
field testing
and final
Identifikasi masalah product
di lapangan revision
Pengumpulan
informasi (need
assessment)
Main field
testing and
Planning and operational
develop preliminary product
form of product revision
Preliminary field
testing and main
product revision
Gambar 21. Prosedur Pengembangan Model Penilaian PPG
154
C. Desain Uji Coba Produk
Uji coba produk dilakukan untuk mengumpulkan data yang digunakan
sebagai dasar dalam menetapkan kelyakan produk yang dikembangkan meliputi:
1) Desain uji coba, 2) Subjek coba, 3) Instrumen pengumpulan data, 4) Teknik
analisis data.
1. Desain Uji Coba
Desain uji coba dilakukan melalui tahapan yaitu: tahap pertama setelah
melalui kajian teoritis, telaah Permendikbud, telaah Buku Pedoman
Penyelenggaraan PPG dan instrumen penilaian PPG yang digunakan selama ini.
Hasil dari penelaahan teori dan masalah lapangan disusunlah draf awal. Draf ini
berisi rumusan komponen beserta indikator yang telah tersusun lengkap dengan
kisi-kisi dan item didiskusikan dengan expert judgment beserta sistem
penskorannya.
Tahapan pengembangan ini terdapat dua kegiatan yang dilakukan secara
bersamaan yaitu pengembangan instrumen penilaian beserta sistem penskoran
dengan menggunakan penskoran parsial dan holistik serta dilengkapi dengan
panduan penilaian. Pengembangan instrumen penilaian berisi kisi-kisi instrumen
dan petunjuk pengerjaan atau pemberian respons, instrumen penilaian dan
pedoman penskoran. Instrumen penilaian yang dikembangkan yaitu: 1) instrumen
penilaian rencana pelaksanaan pembelajaran (IP-RPP) terdiri dari instrumen
penilaian rencana pelaksanaan pembelajaran parsial (IP-RPP/P-01) dan instrumen
penilaian rencana pelaksanaan pembelajaran holistik (IP-RPP/H-01), 2) instrumen
155
penilaian pelaksanaan pembelajaran (IP-PP) terdiri dari instrumen penilaian
pelaksanaan parsial (IP-PP/P-02) dan instrumen penilaian pelaksanaan holistik
(IP-PP/H-02), 3) instrumen penilaian kompetensi sosial dan kepribadian (IP-
KSKK) terdiri dari instrumen penilaian kompetensi sosial dan kepribadian parsial
(IP-KSKK/P-03) dan instrumen penilaian kompetensi sosial dan kepribadian
holistik (IP-KSKK/H-03). Selanjutnya untuk penyusunan panduan penilaian berisi
komponen-komponen yang dinilai, mekanisme penilaian yang dilakukan beserta
instrumennya, penskoran yang digunakan, analisis dan interpretasi hasil penilaian.
Draft instrumen dan panduan penilaian yang telah dikembangkan direviu oleh 7
orang pakar (expert judgment) yang relevan dengan bidang yang dikembangkan,
yaitu:
1. Prof. Anik Gufron, M.Pd., guru besar di Universitas Negeri Yogyakarta pada
bidang pengembangan kurikulum, sekaligus sebagai Ketua Lembaga
Pengembangan dan Penjaminan Mutu Pendidikan di Universitas Negeri
Yogyakarta.
2. Prof. Sudji Munadi., guru besar di Universitas Negeri Yogyakarta pada
bidang penelitian dan evaluasi pendidikan, sekaligus sebagai Kepala Pusat
Studi Sistem Pengujian Pendidikan di Universitas Negeri Yogyakarta.
3. Prof. Mansyur, M.Si., guru besar di Universitas Negeri Makassar pada bidang
penelitian dan evaluasi pendidikan, sekaligus sebagai penggagas Testing
Centre Universitas Negeri Makassar (TC-UNM) dalam layanan pengukuran
dan pengujian seperti: merancang dan mengembangkan instrumen tes
maupun nontes, membuat bank soal, merancang dan mengembangkan
156
instrumen kinerja, memberikan pelayanan tes, merancang system pengujian
dan pengukuran berbasis Computer Adaptive Testing (CAT), memberikan
layanan pelatihan dan pengembanan evaluasi, asesmen, pengukuran dan
pengujian dan sebagainya.
4. Prof. Ruslan, M.Pd., guru besar di Universitas Negeri Makassar pada bidang
penelitian dan evaluasi pendidikan.
5. Prof. Patta Bundu, M.Pd., guru besar di Universitas Negeri Makassar pada
bidang penelitian dan evaluasi pendidikan, sekaligus sebagai reviewer
instrumen pemantauan kinerja guru BSNP, reviewer panduan pembelajaran
tematik terpadu SD-MI, reviuwer standar pengelolaan pendidikan nasional.
6. Dr. Hermanto, M.Pd., pakar pendidikan di Universitas Negeri Yogyakarta
pada bidang manajemen pendidikan konsentrasi supervisi pembelajaran,
sekaligus sebagai Ketua Pusat Layanan Praktik Pengalaman Lapangan dan
Praktik Kerja Lapangan di Universitas Negeri Yogyakarta.
7. Dr. Paidi, M.Pd., pakar pendidikan di Universitas Negeri Yogyakarta pada
bidang pendidikan biologi dengan keahlian metodologi penelitian pendidikan
sains, lesson study, teknologi pembelajaran, evaluasi proses dan evaluasi hasil
belajar, sekaligus sebagai tim penyusun buku Pedoman PPG
Kemenristekdikti.
Tim ahli yang dilibatkan kesemuanya berlatar belakang keahlian yang
relevan yaitu ahli pendidikan, ahli penilaian dan pengukuran, ahli psikologi dan
psikometri, selain itu juga melibatkan dosen pembimbing dan guru pamong untuk
melihat keterbacaan instrumen. Untuk membuktikan validitas isi ditentukan
157
menggunakan kesepakatan ahli dengan menggunakan indeks validitas oleh Aiken
(Retnawati, 2014: 18). Indeks Aiken dipilih untuk melihat indeks kesepakatan
rater terhadap kesesuaian item (atau sesuai tidaknya item) dengan indikator yang
diukur menggunakan item tersebut.
Penskoran yang digunakan untuk melihat relevansi butir dengan indikator
mengacu format penilaian ahli untuk mengetahui kesesuaian butir dan indikator
yang dikemukakan Retnawati (2016a: 30) menggunakan 5 kriteria yaitu, skor 1=
tidak relevan, skor 2= kurang relevan, skor 3= cukup relevan, skor 4= relevan dan
skor 5=sangat relevan. Selanjutnya hasil penilaian tersebut dihitung dengan
formula Aiken dari masing-masing item untuk mendapatkan indeks kesepakatan
ahli mengenai validitas item, dari hasil tersebut diinterpretasikan. Tahap awal ini
menghasilkan kisi-kisi dan item instrumen yang lebih baik dan bersesuaian
dengan instrumen penilaian PPG yang mampu menilaian capaian penguasaan
kompetensi mahasiswa/peserta PPG sesuai dengan instrumen penilaian yang
dikembangkan.
Selanjutnya dilakukan perakitan instrumen berdasarkan kisi-kisi dan
keterbacaan oleh expert judgment dilanjutkan dengan mengestimasi reliabilitas
instrumen menggunakan reliabilitas inter-rater. Menurut Mardapi (2017: 78)
reliabilitas inter-rater atau konsistensi antar penilai pada dasarnya menggunakan
teknik analisis varians, salah satunya menggunakan koefisien kesepakatan
penilaian atau korelasi intrakelas (correlation intraclass) dengan mencari varians
skor tampak dan varians skor murni dengan analisis varians. Nilai harapan rerata
kuadrat antar ratees (MSRS) adalah varians antar ratees, sedang nilai harapan
158
rerata kuadrat kesalahan (MS e) adalah varians skor kesalahan, dimana varians kor
murni bisa dicari bila varians antar ratees dan varians kesalahan (reminder)
diketahui. Adapun korelasi intraklas dihitung dengan formula berikut.
MSRrs  MSe
 ……………………………………………… (21)
MSr  (k  1) MSe
Keterangan:
MSrs : rerata kuadrat antar baris, tiap baris ada satu orang
MSe : rerata kuadrat residu atau kesalahan
k : jumlah kolom atau jumlah penilai
(Sumber: Mardapi, 2017: 79)
Selanjutnya hasil instrumen yang sudah didapat dilakukan uji coba terbatas
untuk menghasilkan indikator yang kuat untuk mengukur masing-masing
komponen sebagai pembentuk penilaian PPG yang digunakan. Data hasil uji coba
terbatas dianalisis dengan menggunakan analisis faktor Confirmatory Factor
analysis (CFA) dengan model Second Order Confirmatory Factor Analysis
sampai memeroleh model yang fit.
Analisis CFA dengan model Second Order Confirmatory Factor Analysis
dipilih karena model teori yang ada dapat diuji dan keterkaitan antar faktor dapat
dilihat, peneliti dapat memeroleh muatan faktor (factor loading) tiap indikator
yang menyusun instrumen (λ) dan indeks kesalahan unik dari tiap indikator (δ).
Artinya untuk meyakini model penilaian PPG yang dikembangkan mengukur
capaian penguasaan kompetensi mahasiswa/peserta PPG, perlu adanya
pembuktian validitas konstruk instrumen untuk menguji apakah indikator-
indikator yang sudah dikelompokkan berdasarkan variabel latennya (konstruknya)
159
konsisten berada dalam konstruknya tersebut atau tidak. Selanjutnya untuk
mengestimasi reliabilitas konstruk menggunakan estimasi CR (construct
reliability) muatan faktor (factor loading) tiap indikator menyusun instrumen (λ)
dan indeks kesalahan unik dari tiap indikator (δ) (Geldhof, Preacher, & Zyphur,
2014). Untuk mengestimasi reliabilitas konstruk dalam penelitian ini
menggunakan estimasi dengan reliabilitas  sebagaimana dinyatakan Retnawati
(2016: 93) estimasi dengan reliabilitas  dilakukan hanya dengan menggunakan
muatan faktor (λ) saja.
2. Subjek Uji Coba
Subjek uji coba dalam penelitian adalah sesuai lingkup PPG yang diteliti
yaitu Lingkup PPG yang diteliti yaitu PPG Prajabatan bersubsidi dan PPG Dalam
Jabatan tahun akademik 2018/2019 yang diselenggarakan Rayon LPTK
Universitas Negeri Yogyakarta (UNY), LPTK Universitas Negeri Gorontalo
(UNG), dan LPTK Universitas Islam Negeri Alauddin Makassar (UINAM) yaitu
sebanyak 236 orang peserta PPG pada uji coba tahap I (uji coba terbatas) dan 516
orang peserta PPG pada uji coba tahap II (uji coba diperluas) menggunakan teknik
purposive sampling dengan pertimbangan jumlah peserta yang diambil
bersesuaian dan pada uji coba tahap II dua kali lebih banyak dari uji coba
sebelumnya. Lingkup Program Studi PPG yang diteliti disesuaikan dengan
program studi yang ada pada saat penyelenggaraan PPG Prajabatan bersubsidi dan
PPG Dalam Jabatan tahun akademik 2018/2019 di Rayon LPTK UNY, LPTK
UNG, dan LPTK UINAM.
160
Mekanisme penelitian di lapangan dilakukan dengan cara memberikan
instrumen yang telah dikembangkan kepada penilai yaitu: 1) dosen (Dosen
Pengajar Workshop (DPW)/Dosen Pembimbing Lapangan (DPL)/Dosen Penguji
UKIN, DPU) dengan kode instrumen IP-RPP/P-01/DPW/DPL/DPU (instrumen
penilaian rencana pelaksanaan pembelajaran parsial), IP-RPP/H-01/
DPW/DPL/DPU (instrumen penilaian rencana pelaksanaan pembelajaran
holistik), IP-PP/P-02/DPW/DPL/DPU (instrumen penilaian pelaksanaan
pembelajaran parsial), IP-PP/H-02/DPW/DPL/DPU (instrumen penilaian
pelaksanaan pembelajaran holistik), dan IP-KSKK/P-03/DPW/DPL/DPU
(instrumen penilaian kompetensi sosial dan kepribadian parsial), IP- KSKK /H-
03/ DPW/DPL/DPU (instrumen penilaian kompetensi sosial dan kepribadian
holistik) yang dilengkapi dengan rubrik dan petunjuk penilaian untuk masing-
masing instrumen, (2) guru (Guru Pamong (GP)/Guru Penguji UKIN, GPU)
dengan kode instrumen IP-RPP/P-01/GP/GPU (instrumen penilaian rencana
pelaksanaan pembelajaran parsial), IP-RPP/H-01/GP/GPU (instrumen penilaian
rencana pelaksanaan pembelajaran holistik), IP-PP/P-02/GP/GPU (instrumen
penilaian pelaksanaan pembelajaran parsial), IP-PP/H-02/GP/GPU (instrumen
penilaian pelaksanaan pembelajaran holistik), dan IP-KSKK/P-03/GP/GPU
(instrumen penilaian kompetensi sosial dan kepribadian parsial), IP-KSKK/H-
03/GP/GPU (instrumen penilaian kompetensi sosial dan kepribadian holistik)
yang juga dilengkapi dengan rubrik dan petunjuk penilaian.
Pelaksanaan penelitian uji coba tahap I (uji coba terbatas) dari bulan
Desember 2018 sampai bulan Pebruari 2019 pada peserta PPG Prajabatan
161
bersubsidi pada P4TKN UNY tahun akademik 2018/2019 dengan Program Studi
PGSD, Pendidikan Matematika, Pendidikan Bahasa Inggris, dan Pendidikan
Teknik Otomotif. Selanjutnya penyelenggaraan PPG di UNG tahun 2018 pada
peserta PPG Prajabatan bersubsidi Program Studi Bahasa Inggris, PPG Dalam
Jabatan Program Studi PGSD, Bahasa Inggris, dan PJKR. Untuk penyelenggaraan
PPG di UINAM tahun 2018/2019 PPG Dalam Jabatan dengan Program
Studi/Mata Pelajaran diantaranya: Fikih, Qur’an Hadis, Akidah Akhlak, Bahasa
Arab, Sejarah Kebudayaan Islam dan Guru Kelas Madrasah Ibtidaiyah (MI).
Pelaksanaan uji coba tahap II (uji coba diperluas) dilaksanakan pada bulan
Maret 2019 sampai bulan Awal Mei 2019 pada penyelenggaraan PPG UNY tahun
2019 yaitu PPG Dalam Jabatan tahap 1 pada Program Studi PGSD, PJKR,
Pendidikan IPA, Pendidikan IPS, Pendidikan Matematika, Pendidikan Bahasa
Inggris, Pendidikan Bahasa Indonesia dan Pendidikan Guru PAUD.
Penyelenggaraan PPG UNG yaitu PPG Dalam Jabatan tahap I pada Prodi PGSD,
Bahasa Inggris, dan PJKR, dan penyelenggaraan PPG UINAM yaitu PPG Dalam
Jabatan dengan Program Studi/Mata Pelajaran diantaranya: Fikih, Qur’an Hadis,
Akidah Akhlak, Bahasa Arab, Sejarah Kebudayaan Islam dan Guru Kelas
Madrasah Ibtidaiyah (MI). Adapun jumlah peserta PPG pada pelaksanaan uji coba
tahap I dan uji coba tahap II disajikan pada Tabel 9.
162
Tabel 9. Subjek Uji Coba
Tahap Kelompok PPG/Pogram Pelaksanaan Jumlah

No LPTK Total
Uji Coba Studi Penilaian Peserta
1 Tahap I UNY PPG Prajabatan Bersubsidi:
- PGSD
- Pendidikan Bahasa Inggris
- Pendidikan Matematika PPL 48
- Pendidikan Teknik
Otomotif
UNG PPG Prajabatan bersubsidi: Praktik Mengajar

- Pendidikan Bahasa Inggris UKIN
PPG Dalam Jabatan
Program Studi: 85 236
- PGSD
- PJKR
UINAM PPG Dalam Jabatan Workshop 103
Bersubsidi: PPL
- Fikih
- Qur’an Hadis
- Akidah Akhlak
- Bahasa Arab
- Sejarah Kebudayaan Islam
- Guru Kelas MI
2 Tahap II UNY PPG Dalam Jabatan Tahap 1 PPL
Tahun 2019: Praktik Mengajar
- PGSD UKIN 158
- Pendidikan Matematika
- PJKR
UNG PPG Dalam Jabatan Tahap 1 Praktik Mengajar
Tahun 2019: PPL
- PGSD 119
516
- PJKR
UINAM PPG Dalam Jabatan Praktik Mengajar
Bersubsidi: UKIN
- Fikih
- Qur’an Hadis
239
- Akidah Akhlak
- Bahasa Arab
- Sejarah Kebudayaan Islam
- Guru Kelas MI
163
Pelaksanaan Uji Coba I di LPTK UNY tahun akademik 2018/2019
dilakukan pada 48 peserta PPG Prajabatan bersubsidi dengan Program Studi
PGSD, Pendidikan Matematika, Pendidikan Bahasa Inggris, dan Pendidikan
Teknik Otomotif. Pelaksanaan penilaian dilakukan pada saat peserta PPG
Prajabatan bersubsidi melaksanakan PPL di lokasi sekolah yang ditunjuk P4TKN
UNY. Pelaksanaan penilaian ini melibatkan 21 dosen pembimbing lapangan dan
22 guru pamong pada 13 sekolah yang menjadi lokasi PPL yaitu: SDN 1 Jarakan,
SDN Giwangan Yogyakarta, SDN Bantul Timur, SDN Percobaan 2, SMPN 1
Yogyakarta, SMPN 6 Yogyakarta, SMAN 1 Yogyakarta, SMAN 2 Yogyakarta,
SMAN 6 Yogyakarta, SMKN 2 Depok, SMKN 2 Yogyakarta dan SMKN 3
Yogyakarta.
Pelaksanaan Uji Coba I di LPTK UNG tahun akademik 2018 dilakukan
pada 85 peserta PPG Prajabatan bersubsidi Program Studi Bahasa Inggris, PPG
Dalam Jabatan Program Studi PGSD, Bahasa Inggris, dan PJKR. Pelaksanaan
penilaian dilakukan pada saat peserta PPG Prajabatan bersubsidi melaksanakan
Praktik Mengajar UKIN. Pelaksanaan penilaian ini melibatkan 10 dosen penguji
UKIN dan 12 guru Penguji UKIN pada Sekolah Binaan LPTK UNG yaitu: SDN
84 Kota Tengah, SDN 85 Kota Tengah, SD Laboratorium UNG, SDN 30 Kota
Selatan, SDN 29 Kota Selatan, SMPN 1 Gorontalo, SMPN 2 Gorontalo dan
SMAN 3 Gorontalo.
Selanjutnya pelaksanaan Uji Coba I di Rayon LPTK UINAM tahun
2018/2019 pada 103 Peserta PPG Dalam Jabatan dengan Program Studi/Mata
Pelajaran diantaranya: Fikih, Qur’an Hadis, Akidah Akhlak, Bahasa Arab, Sejarah
164
Kebudayaan Islam dan Guru Kelas Madrasah Ibtidaiyah (MI). Pelaksanaan
penilaian dilakukan pada saat peserta PPG melaksanakan workshop dan PPL.
Pelaksanaan penilaian ini melibatkan 8 dosen pengajar lokakarya/workshop dan
12 guru pamong pada lokasi yang ditunjuk LPTK UINAM yaitu: MIN 1
Makassar, MI Madani Alauddin Pao-Pao, MI Ash-Shalihin, MTs Guppi Samata,
MTs Madani Alauddin Pao-Pao, MA Guppi Samata, MI Ash-Shalihin, MAS
Nadhlatul Wathan.
Hasil Uji Coba I kemudian menjadi dasar untuk menerapkan model
penilaian PPG pada Uji Coba II dengan subjek skala besar dengan jumlah 516
peserta PPG. Pelaksanaan Uji Coba II di LPTK UNY tahun 2019 dilakukan pada
158 peserta PPG Dalam Jabatan dengan Program Studi PGSD, Pendidikan
Matematika, PJKR. Pelaksanaan penilaian dilakukan pada saat peserta PPG PPL
dan UKIN. Pelaksanaan penilaian uji coba tahap II ini melibatkan 21 dosen
pembimbing lapangan dan 22 guru pamong pada 13 sekolah yang menjadi lokasi
PPL yaitu: SD Muh. Karangkajen, SDN Keputran 1, SDN Keputran 2, SD,
Suryodiningratan 3, SDN I Padokan, SDN Giwangan, SDN Jarakan, SDN Bantul
Timur, SDIT Lukman Al-Hakim, SDN Percobaan 2, SDN Surakarsan, SDN
Monggang, SDN Model Sleman, SMPN 2 Mlati, SMPN 7 Yogyakarta, dan
SMPN 8 Yogyakarta.
Pelaksanaan Uji Coba II di LPTK UNG tahun akademik 2019 dilakukan
pada 119 peserta PPG Dalam Jabatan Program Studi Bahasa Inggris, PPG Dalam
Jabatan Program Studi PGSD, Bahasa Inggris, dan PJKR. Pelaksanaan penilaian
dilakukan pada saat peserta PPG melaksanakan PPL. Pelaksanaan penilaian ini
165
melibatkan 10 dosen penguji UKIN dan 12 guru Penguji UKIN pada Sekolah
Binaan LPTK UNG yaitu: SDN 84 Kota Tengah, SDN 85 Kota Tengah, SD
Laboratorium UNG, SDN 30 Kota Selatan, SDN 29 Kota Selatan, SMPN 1
Gorontalo, SMPN 2 Gorontalo dan SMAN 3 Gorontalo.
Pelaksanaan Uji Coba II di Rayon LPTK UINAM tahun 2018/2019 pada
239 Peserta PPG Dalam Jabatan dengan Program Studi/Mata Pelajaran
diantaranya: Fikih, Qur’an Hadis, Akidah Akhlak, Bahasa Arab, Sejarah
Kebudayaan Islam dan Guru Kelas Madrasah Ibtidaiyah (MI). Pelaksanaan
penilaian dilakukan pada saat peserta PPG melaksanakan UKIN. Pelaksanaan
penilaian ini melibatkan 13 dosen pengajar lokakarya/workshop dan 13 guru
penguji UKIN pada lokasi yang ditunjuk LPTK UINAM yaitu: MI Bahrul Ulum,
MI Al-Bashira, MI Insan Cendekia, MI Al-Abrar, MTs Negeri 1 Kota Makassar,
MTs Madani Alauddin PaoPao, MTs Negeri Gowa, MAN 2 Kota Makassar.
3. Teknik dan Instrumen Pengumpulan Data
Jenis data dalam penelitian ini terdiri atas data kuantitatif dan data
kualitatif. Data utama dalam penelitian ini adalah data kuantitatif, sementara data
kualitatif digunakan sebagai data penunjang. Data kuantitatif meliputi data
tentang penilaian capaian kompetensi pedagogik, kompetensi profesional,
kompetensi kepribadian, dan kompetensi sosial peserta PPG yang diperoleh
dengan menggunakan instrumen penilaian dari masing-masing kompetensi yang
dinilai. Selain itu, data kuantitatif didasarkan atas penskoran yang telah
166
ditetapkan pada instrumen penilaian PPG yang dikembangkan dengan
menggunakan penskoran parsial dan holistik.
Data kualitatif adalah data yang diperoleh dari Focus Group Discussion,
uji keterbacaan instrumen dari expert judgment serta hasil konsultasi dari
promotor dan kopromtor. Data kualitatif digunakan untuk mengembangkan
konstruk penilaian PPG dari kompetensi pedagogik, kompetensi sosial dan
kompetensi kepribadian peserta PPG, dan validitas isi dari expert judgement.
Teknik pengumpulan data menggunakan Focus Group Discussion, teknik
observasi, dan dokumentasi melalui analisis dokumen. Focus Group Discussion
untuk mengidentifikasi permasalahan yang dihadapi dalam penilaian PPG serta
apa yang diharapkan untuk mengatasi permasalahan tersebut. Teknik observasi
digunakan untuk menilai capaian penguasaan kompetensi pedagogik, kompetensi
sosial dan kompetensi kepribadian mahasiswa/peserta PPG berdasarkan instrumen
yang telah dikembangkan. Dokumentasi digunakan untuk menelaah instrumen
penilaian PPG yang digunakan selama ini. Selain itu, teknik ini digunakan untuk
menelaah rencana pelaksanaan pembelajaran (RPP) yang disusun
mahasiswa/peserta PPG pada saat lokakarya, PPL dan UKIN.
4. Teknik Analisis Data
Analisis yang digunakan dalam penelitian ini terbagi dalam tiga tahap.
Tahap pertama adalah teknik analisis untuk menilai model penskoran parsial dan
holistik yang dikembangkan dari sisi validitas isi dan reliabilitas.
167
Tahap kedua adalah analisis hasil uji coba instrumen berdasarkan
penskoran yang digunakan. Tahap ketiga adalah analisis deskriptif atau analisis
profil terhadap hasil penilaian untuk mendeskripsikan capaian penguasaan
kompetensi mahasiswa/peserta PPG berdasarkan kemampuan dengan penskoran
parsial dan holistik.
a. Tahap Pertama
Tahap ini digunakan menjawab permasalahan ke-1 yaitu konstruk model
penilaian PPG dengan penskoran parsial dan holistik yang dapat digunakan dalam
mengestimasi penguasaan kompetensi peserta PPG. Analisis dilakukan secara
kualitatif dengan mendeskripsikan prosedur/cara mengembangkan model
penilaian dengan penskoran parsial dan holistik berdasarkan kajian teoritis, telaah
Permendikbud, telaah Buku Pedoman Penyelenggaraan PPG dan instrumen
penilaian PPG yang digunakan selama ini, yang menghasilkan draft pertama
konstruk instrumen yang dikemas dalam kisi-kisi dan sistem penskorannya.
b. Tahap Kedua
Tahap ini digunakan menjawab permasalahan ke-2 tentang bagaimana
validitas dan reliabilitas model penilaian PPG dengan penskoran parsial dan
peserta PPG. Untuk membuktikan validitas model penilaian PPG melalui validitas
isi dan validitas konstruk. Validitas isi diperlukan untuk meyakini model penilaian
yang dikembangkan mengukur penguasaan kompetensi peserta PPG yang
didefinisikan dalam domain ataupun konstruk yang diukur dengan melibatkan 7
expert judgment. Hasil penilaian dari expert judgment tersebut, kemudian
168
dianalisis menggunakan indeks Aiken atau yang diusulkan oleh Aiken (Aiken,
1980, Retnawati, 2016a: 18) dengan formula berikut.
V
s ……………………………………………… (22)
n(c  1)
dengan,
V : Indeks kesepakatan rater mengenai validitas butir

s : Skor yang ditetapkan setiap rater dikurangi skor terendah kategori yang
dipakai (s = r – l) dengan r skor kategori pilihan rater dan l skor terendah
dalam kategori
n : Banyaknya rater/ahli
c : Banyaknya kategori yang dapat dipilih rater.
Untuk memaknai hasil perhitungan dengan menggunakan Aiken V, Aiken
(1985) memberi panduan dengan menggunakan tabel koefisien validitas Aiken’s
V untuk menentukan apakah suatu item tersebut diterima atau tidak setelah
dilakukan perhitungan dan menghasilkan indeks V, pada tabel tersebut
menunjukkan untuk jumlah rater yang berbeda, nilai minimum indeks V juga
berbeda sehingga semakin banyak rater yang digunakan, maka semakin kecil
indeks V yang disyaratkan. Pada tabel juga memberikan dua pilihan nilai p yang
ditetapkan yaitu baris pertama p<0,01 dan baris kedua p<0,05, jika menetapkan
nilai p<0,01 yang artinya peluang error sebesar 1%, maka indeks V dilihat pada
baris pertama tiap jumlah rater. Namun jika menetapkan nilai p<0,05 yang
artinya peluang error sebesar 5%, maka indeks V dilihat pada baris kedua tiap
jumlah rater. Berdasarkan format penelaahan expert judgment dengan 5
kriteria/kategori yaitu, skor 1= tidak relevan, skor 2= kurang relevan, skor 3=
169
cukup relevan, skor 4= relevan dan skor 5=sangat relevan yang dinilai oleh 7
expert judgment dengan p<0,05, jika merujuk pada tabel Aiken’s V sebagaimana
terlampir pada Lampiran 1, maka diperoleh indeks Aiken V=0,75, sehingga setiap
item dinyatakan valid jika memenuhi indeks Aiken yang dipersyaratkan (>0,75),
sebaliknya item instrumen dinyatakan tidak valid jika dibawah dari nilai indeks
Aiken yang dipersyaratkan (<0,75). Hal ini juga didukung oleh pendapat
Retnawati (2016a: 19) yaitu: V ≤ 0.4 untuk validitas kurang, 0.4 – 0.8 untuk
validitas sedang serta V > 0.8 untuk kategori sangat valid. Proses ini menghasilkan
draft instrumen penilaian dan buku panduan penilaian yang sudah siap diujicoba
Selanjutnya untuk membuktikan validitas konstruk digunakan analisis
konfirmatori (confirmatory factor analysis, CFA) untuk memeroleh informasi
apakah faktor/komponen yang terbentuk didukung oleh data dengan teknik
Second Order Confirmatory Factor Analysis sampai memeroleh model yang fit.
Terkait dengan analisis CFA menggunakan Structural Equation Modeling (SEM)
yang dioperasikan melalui software Lisrel versi 8.70 (Ghozali & Fuad, 2014;
Joreskog & Sorbom, 2006) . Model standar mengacu pada Retnawati (2016a: 64)
merupakan model yang diharapkan, karena menunjukkan muatan faktor (koefisien
jalur dari variabel ke variabel). Beberapa ahli mengatakan, bahwa koefisien
memiliki arti jika besarnya tidak kurang dari 0,4 dan signifikan yang ditunjukkan
t-value tidak berwarna merah (untuk taraf signifikansi 0,05, t-value < 1,96).
Penentuan goodness of fit model, dilakukan dengan cara melihat besarnya indeks
chi-Square empiris <2 df; signifikansi (p) ≥ 0.05; dan Root Mean Square
Approximation (RMSEA) ≤ 0,08.
170
Selanjutnya untuk mengestimasi reliabilitas penilaian dari expert
judgement menggunakan reliabilitas inter-rater, instrumen dikatakan reliabel jika
memenuhi kriteria ≥ 0,70 (Gronlund & Linn, 1965; Nunnally, 1994). Sementara
untuk mengestimasi reliabilitas konstruk yang menjelaskan besarnya proporsi
indikator dalam menjelaskan konstruk ukur yang diestimasi menggunakan
reliabilitas  . Adapun formula untuk mendapatkan koefisien reliabilitas konstruk
dengan reliabilitas  adalah:

2
 i 
  i  ………………………………… (23)
  i 1 
2
 i   i 2 
  i    1  i 
 i 1   i 1 
Keterangan
 = Koefisien reliabilitas,
i = Faktor loading terstandarisasi (Retnawati, 2016a: 93)
c. Tahap Ketiga
Tahap ini dilakukan untuk menjawab permasalahan ke-3, ke-4 dan
permasalahan ke-5. Untuk menjawab permasalahan ke-3 tentang bagaimana
karakteristik model penilaian dengan penskoran parsial dan holistik yang dapat
digunakan untuk mengestimasi penguasaan kompetensi peserta PPG dianalisis
dengan menggunakan pendekatan politomus item response theory yaitu untuk
model penskoran parsial diestimasi dengan metode partial credit model (PCM)
melalui Program R dengan Extended Rasch Modeling (eRm) package, sedangkan
penskoran holistik diestimasi dengan metode graded response model (GRM)
melalui Program R dengan latent trait model (ltm) package.
171
Selanjutnya untuk menjawab permasalahan ke-4 tentang bagaimana
deskripsi hasil penskoran parsial dan holistik dalam model penilaian PPG
terhadap akurasi estimasi kemampuan peserta PPG dilakukan dengan
membandingkan nilai fungsi informasi (item information function) yang
dihubungkan dengan kesalahan baku pengukuran (Standard Error of
Measurement, SEM). Hambleton et al., 1991: 94; Retnawati (2014: 19)
menyatakan bahwa nilai fungsi informasi memiliki hubungan yang berbanding
terbalik dengan SEM, semakin besar nilai informasi maka SEM akan semakin
kecil atau sebaliknya. Jika nilai fungsi informasi telah diketahui, maka secara
langsung SEM dapat diperoleh,
^ 1
SEM ( )  ………………………………… (24)
I ( )
dengan,
I ( ) : Nilai fungsi informasi
(Hambleton et al., 1991: 94; Retnawati, 2014: 19).
Menjawab permasalahan ke-5 tentang bagaimana kepraktisan model
penilaian PPG dengan penskoran parsial dan holistik berdasarkan penilaian oleh
pengguna, analisisnya dilakukan melalui analisis statistik deskriptif berdasarkan
kategorisasi hasil penilaian dan efektifitas penggunaan model penilaian PPG dari
indikator yang dinilai. Adapun indikator yang dinilai yaitu: mampu dipahami
oleh pengguna, dapat diterapkan di lapangan, relevansi dengan Program PPG,
memberi manfaat pada kegiatan PPG.
172
BAB IV
HASIL PENELITIAN DAN PENGEMBANGAN
A. Hasil Pengembangan Produk Awal
Penelitian ini mengembangkan model penilaian PPG dengan penskoran
parsial dan holistik. Pada model penilaian PPG yang telah dikembangkan terdapat
tiga komponen yang diukur yaitu: Rencana Pelaksanaan Pembelajaran (RPP),
Pelaksanaan Pembelajaran (PP), serta Kompetensi Sosial dan Kompetensi
Kepribadian (KSKK). Model penilaian PPG yang dikembangkan berupa
instrumen dan panduan penilaian PPG dengan penskoran parsial dan holistik.
Pada bab ini diuraikan hasil pengembangan model penilaian penilaian PPG
yang diterapkan pada Rayon LPTK Universitas Negeri Yogyakarta (UNY), LPTK
Universitas Negeri Gorontalo (UNG), dan LPTK Universitas Islam Negeri
Alauddin Makassar (UINAM) dengan lingkup Program Studi PPG Prajabatan
bersubsidi dan PPG Dalam Jabatan tahun akademik 2018/2019. Hasil penelitian
terkait fase-fase pengembangan model penilaian PPG dideskripsikan berikut.
1. Konstruk Model Penilaian PPG
Model penilaian PPG yang telah dikembangkan pada penelitian ini secara
konstruk mencakup instrumen penilaian Rencana Pelaksanaan Pembelajaran
(IPRPP) diukur oleh empat indikator yaitu: perumusan indikator pencapaian
kompetensi dan capaian pembelajaran (PIPKC), pengorganisasian materi, metode,
media dan sumber belajar (PMMMS), pengorganisasian proses, penilaian dan
173
evaluasi pembelajaran (PPPEP), serta penerapan prinsip techno pedagogical
content knowledge (PTPCK).
Indikator perumusan indikator pencapaian kompetensi dan capaian
pembelajaran (PIPKC) diukur dengan 6 item, yaitu kelengkapan penulisan
identitas RPP, kelengkapan penulisan KI, kesesesuaian dan kejelasan rumusan
indikator pencapaian kompetensi dengan kompetensi dasar (KD), kejelasan
rumusan indikator pencapaian kompetensi menggunakan kata kerja yang dapat
diukur dan/atau diamati, kesesuaian dan kejelasan rumusan tujuan pembelajaran
dengan indikator pencapaian kompetensi, serta kelengkapan rumusan tujuan
pembelajaran memenuhi kriteria ABCD (Audience, Behavior, Condition, Degree).
Indikator pengorganisasian materi, metode, media dan sumber belajar
(PMMMS) diukur dengan 6 item, yaitu: kesesuaian dan kejelasan materi dengan
tujuan pembelajaran, ketepatan dan kelengkapan penyusunan materi dan bahan
ajar, kesesuaian pemilihan metode pembelajaran dengan KD, karakteristik materi
dan karakteristik peserta didik, kesesuaian langkah-langkah/sintaks pembelajaran
dengan strategi pembelajaran dan materi yang diajarkan, kesesuaian media dan
sumber belajar dengan tujuan pembelajaran, materi, kondisi kelas dan ketepatan
pemilihan spesifikasinya, kelayakan media dan sumber belajar yang digunakan.
Indikator pengorganisasian proses, penilaian dan evaluasi pembelajaran
(PPPEP) diukur dengan 6 item, yaitu: kelengkapan dan kejelasan langkah-langkah
kegiatan pembelajaran, kejelasan skenario pembelajaran menggambarkan active
learning, kejelasan skenario pembelajaran mencerminkan saintific learning,
kesesuaian teknik penilaian dengan indikator pencapaian kompetensi dan
174
kejelasan lingkup penilaian, kelengkapan komponen penilaian yang digunakan,
serta kejelasan rencana kegiatan pengayaan dan/atau remedial.
Indikator penerapan prinsip techno pedagogical content knowledge
(PTPCK) diukur dengan 7 item, yaitu: kejelasan technological knowledge,
pedagogical knowledge, content knowledge, technological pedagogical
knowledge, technological content knowledge, pedagogical content knowledge,
serta kejelasan technological pedagogical content knowledge. Berikut ini konstruk
penilaian RPP pada model penilaian PPG dapat digambarkan sebagai berikut.
Gambar 22. Konstruk Penilaian Rencana Pelaksanaan Pembelajaran (RPP)
175
Keterangan:
PIPKC : Perumusan indikator pencapaian kompetensi dan capaian
pembelajaran
PMMMS : Pengorganisasian materi, metode, media dan sumber belajar
PPPEP : Pengorganisasian proses, penilaian dan evaluasi pembelajaran
PTPCK : Penerapan prinsip techno pedagogical content knowledge
Berdasarkan konstruk yang disajikan pada Gambar 22, maka dapat
dijelaskan bahwa pada komponen penilaian rencana pelaksanaan pembelajaran
RPP diukur melalui 4 indikator serta 25 item. IndIkator perumusan indikator
pencapaian kompetensi dan capaian pembelajaran (PIPKC) sebanyak 6 item (item
1-6), indikator pengorganisasian materi, metode, media dan sumber belajar
(PMMMS) sebanyak enam item (item 7-12), indikator pengorganisasian proses,
penilaian dan evaluasi pembelajaran (PPPEP) sebanyak enam item (item 13-18),
serta indikator penerapan prinsip techno pedagogical content knowledge (PTPCK)
sebanyak tujuh item (item19-25) yang terlampir pada Lampiran 1 halaman 457.
Komponen kedua dalam model penilaian PPG yang dikembangkan ialah
komponen penilaian pelaksanaan pembelajaran (PP). Komponen ini diukur
melalui empat indikator yaitu: melaksanakan pembelajaran yang mendidik
(MPMD), melaksanakan pembelajaran yang mencerdaskan (MPMC),
memfasilitasi pengembangan potensi diri dan karakter peserta didik (MPDK),
serta menilai dan mengevaluasi pembelajaran (MDMP). Indikator melaksanakan
pembelajaran yang mendidik (MPMD) diukur oleh empat item yaitu: menyiapkan
peserta didik secara fisik dan mental, memotivasi peserta didik, melakukan
kegiatan appersepsi, menyampaikan tujuan pembelajaran dan cakupan materi.
176
Indikator melaksanakan pembelajaran yang mencerdaskan (MPMC)
diukur oleh tujuh item. Item tersebut antara lain: menunjukkan penguasaan materi
pembelajaran, mengaitkan materi dengan sains, lingkungan, teknologi dan realitas
kehidupan, melaksanakan pembelajaran yang menggambarkan pendekatan active
learning, melaksanakan pembelajaran yang mencerminkan pendekatan saintific
learning, melaksanakan pembelajaran yang mencerminkan pendekatan problem
based learning, Menggunakan alat/bahan, media dan TIK secara efektif dan
efisien, serta menggunakan alat/bahan, media dan TIK yang menghasilkan pesan
menarik. Indikator memfasilitasi pengembangan potensi diri dan karakter peserta
didik (MPDK) diukur oleh empat item. Item tersebut antara lain: menunjukkan
sikap terbuka dan respon terhadap peserta didik, menunjukkan hubungan yang
kondusif dan kerjasama antar peserta didik, menggunakan bahasa yang santun,
serta menyampaikan pesan dengan gaya (gesture) yang sesuai.
Indikator menilai dan mengevaluasi pembelajaran (MDMP) diukur dengan
lima item. Item tersebut antara lain: memantau kemajuan belajar peserta didik
selama proses pembelajaran, melakukan penilaian proses dan hasil sesuai rencana
dan tujuan pembelajaran, menindaklanjuti hasil penilaian selama pembelajaran,
melakukan refleksi, serta melakukan tindak lanjut. Dengan demikian konstruk
penilaian pelaksanaan pembelajaran pada penilaian PPG digambarkan berikut.
177
Gambar 23. Konstruk Penilaian Pelaksanaan Pembelajaran (PP)
Keterangan:
MPMD : Melaksanakan pembelajaran yang mendidik
MPMC : Melaksanakan pembelajaran yang mencerdaskan
MPDK : Memfasilitasi pengembangan potensi diri dan karakter
MDMP : Menilai dan mengevaluasi pembelajaran
dijelaskan bahwa pada komponen penilaian pelaksanaan pembelajaran PP diukur
melalui 4 indikator serta 20 item. Indikator melaksanakan pembelajaran yang
mendidik (MPMD) diukur oleh empat item (item 1-4), indikator melaksanakan
pembelajaran yang mencerdaskan (MPMC) diukur oleh tujuh item (item 5-11),
178
indikator memfasilitasi pengembangan potensi diri dan karakter peserta didik
(MPDK) diukur oleh empat item (item 12-15), serta indikator menilai dan
mengevaluasi pembelajaran (MDMP) diukur dengan lima item (item16-20) yang
terlampir pada Lampiran 1 halaman 457.
Komponen ketiga dalam model penilaian PPG yang dikembangkan ialah
komponen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK).
Komponen ini diukur melalui empat indikator yaitu: bekerjasama dan memiliki
jiwa kepemimpinan (BMJK), bersikap inklusif, toleran dan peduli (BITP),
berkomunikasi dengan sesama (BKDS), bersikap sopan/ santun, mandiri, kreatif
dan disiplin (BSMKD). Indikator bekerjasama dan memiliki jiwa kepemimpinan
(BMJK) diukur oleh lima item. Item tersebut antara lain: menunjukkan sikap
bekerjasama, menunjukkan sikap berpartisipasi aktif, menunjukkan sikap dapat
mengatur dan mau diatur orang lain, menunjukkan sikap aktif dan bijaksana, serta
menunjukkan perilaku yang demokratis.
Indikator bersikap inklusif, toleran dan peduli (BITP) diukur oleh lima
item. Item tersebut antara lain: menunjukkan sikap menghargai perbedaan,
menunjukkan sikap empati terhadap sesama, menunjukkan sikap adil dan objektif,
menunjukkan sikap respon cepat tanggap, serta menunjukkan sikap suka
menolong. Indikator berkomunikasi dengan sesama (BKDS) diukur oleh lima
item. Item tersebut antara lain: menunjukkan sikap santun dalam berkomunikasi,
menunjukkan sikap lemah lembut dalam berbicara, menunjukkan kemampuan
berbicara yang efektif, menunjukkan sikap supel dalam pergaulan, serta
menunjukkan sikap ramah dalam pergaulan.
179
Indikator bersikap sopan/ santun, mandiri, kreatif dan disiplin (BSMKD)
diukur oleh lima item. Item tersebut antara lain: menunjukkan kesopanan
berpakaian dan berpenampilan, menunjukkan kesantunan berperilaku dengan
sesama, menunjukkan kemandirian dalam pembelajaran, menunjukkan kreativitas
dalam pembelajaran, serta menunjukkan kedisiplinan dalam pembelajaran.
Adapun konstruk penilaian pada kompetensi ini tampak pada Gambar 24 berikut.
Gambar 24. Konstruk Penilaian Kompetensi Sosial Kepribadian (KSKK)

Keterangan:
BMJK : Bekerjasama dan memiliki jiwa kepemimpinan
BITP : Bersikap inklusif, toleran dan peduli
BKDS : Berkomunikasi dengan sesama
BSMKD : Bersikap sopan/ santun, mandiri, kreatif dan disiplin
180
dijelaskan bahwa pada komponen penilaian kompetensi sosial dan kompetensi
kepribadian (KSKK) diukur melalui 4 indikator serta 20 item. Indikator
bekerjasama dan memiliki jiwa kepemimpinan (BMJK) diukur oleh lima item
(item 1-5), indikator bersikap inklusif, toleran dan peduli (BITP) diukur oleh lima
item (item 6-10), indikator berkomunikasi dengan sesama (BKDS) diukur oleh
lima item (item 11-15), serta indikator bersikap sopan/ santun, mandiri, kreatif
dan disiplin (BSMKD) diukur oleh lima item (item16-20) yang terlampir pada
Lampiran 1 halaman 458.
2. Hasil Penilaian Model Oleh Ahli/Pakar
Penilaian model oleh ahli atau expert judgment yang dimaksud dalam
penelitian ini adalah model yang telah ditentukan konstruknya pada fase
sebelumnya kemudian diberikan kepada expert judgment untuk dinilai. Penilaian
tersebut dilakukan untuk membuktikan validitas isi (content validity) dari
konstruk yang telah dikembangkan secara teoretik. Pada penelitian ini terdapat 7
expert judgment dipilih secara purposive sampling berdasarkan pertimbangan
keahlian dimiliki sesuai bidang penelitian yang dikembangkan.
Tahapan pembuktian validitas isi yang telah dilakukan pada penelitian ini
mengacu pada saran atau pandangan Retnawati (2016a: 27) yang meliputi
beberapa tahapan. Tahapan pertama yang telah dilakukan dalam pembuktian
validitas ini instrumen penilaian PPG pada penelitian ini adalah memberikan kisi-
kisi dan item instrumen, berikut rubrik penskorannya kepada ke-7 ahli atau pakar
181
yang telah dipilih sesuai dengan bidang yang diteliti untuk memohon masukan
tekait pendapat keahliannya. Tahapan selanjutnya adalah masukan yang
diharapkan dari ahli berupa kesesuaian komponen instrumen dengan indikator,
indikator dengan itemnya, benarnya substansi item, kalimat, format penulisan,
simbol dan hal lain yang dianggap subtansial oleh ahli. Proses ini disebut dengan
telaah kualitatif yang meliputi aspek subtansi, bahasa dan budaya. Berdasarkan
masukan ahli tersebut, instrumen kemudian diperbaiki.
Hasil pembuktian validitas isi oleh 7 expert judgment diuraikan
berdasarkan ketiga komponen instrumen yaitu: instrumen penilaian rencana
pelaksanaan pembelajaran (RPP), instrumen penilaian pelaksanaan pembelajaran
(PP), dan instrumen penilaian kompetensi sosial dan kepribadian (KSKK), serta
panduan penilaian. Terkait dengan hasil penilaian expert judgment serta analisis
validitas isi berdasarkan Aiken V pada 25 item yang terdapat pada instrumen
penilaian rencana pelaksanaan pembelajaran (RPP) yang terlampir pada Lampiran
2 halaman 459 diperoleh beberapa koefisien V, maka interpretasi koefisien
tersebut dibuat pengkategorian sebagaimana disajikan pada Tabel 10:
Tabel 10. Pengkategorian Validitas Isi Instrumen Penilaian RPP
Tabel Aiken V
Indikator
Valid Tidak Valid
(> 0,75) (< 0,75)
PIPCK A1, A2, A3, A4, A5, A6 -
PMMMS B7, B8, B9, B10,B11, B12 -
PPPEP C13,C14, C15, C16, C17, C18 -
PTPCK D19, D20, D21, D22, D23, D24 D25 -
Total / % 25/100% 0 / 0%
182
Berdasarkan data Tabel 10, dapat dijelaskan bahwa secara umum validitas
isi instrumen penilaian RPP jika mengacu pada tabel Aiken’s V menunjukkan
semua item yang dikembangkan dalam instrumen penilaian RPP dengan
penskoran parsial dan holistik dinyatakan valid karena memenuhi indeks Aiken
yang dipersyaratkan yaitu > 0,75 (Aiken, 1985). Selanjutnya jika mengacu pada
saran Retnawati (2016a: 19) instrumen penilaian RPP yang berada pada kategori
sangat valid yaitu terdapat 15 item atau 75% yang memiliki nilai validitas > 0.8,
dan selebihnya ada 10 item atau 25% berada pada kategori sedang. Hal ini
menunjukkan bahwa instrumen penilaian RPP telah akurat memenuhi syarat dari
aspek validitas isi, meskipun masih terdapat beberapa item yang diperbaiki
berdasarkan saran atau masukan dari expert judgment pada aspek materi, konstruk
dan bahasa yang digunakan, diantaranya pembetulan beberapa tulisan yang
kurang lengkap pada instrumen dan panduan penilaian, mengkombinasikan
dengan instrumen penilaian RPP yang digunakan Ditjen Belama terhadap
beberapa item yang belum ternilai, serta memperbaiki item/butir yang menilai
aspek penilaian dengan mempertimbangkan penilaian proses dan hasil sebagai
kegiatan penilaian yang berbeda.
Komponen kedua yang dibuktikan validitas isinya adalah instrumen
penilaian pelaksanaan pembelajaran (PP). Pada instrumen ini memuat empat
indikator dengan sebaran item sebanyak 20 item. Terkait dengan hasil penilaian
ketujuh expert judgment serta analisis validitas isi berdasarkan Aiken V pada 20
item yang terdapat pada instrumen penilaian pelaksanaan pembelajaran (PP) yang
terlampir pada Lampiran 2 halaman 460 diperoleh beberapa koefisien V, maka
183
interpretasi koefisien tersebut dibuat pengkategorian sebagaimana disajikan pada
Tabel 11 sebagai berikut.
Tabel 11. Pengkategorian Validitas Isi Instrumen Penilaian PP
Tabel Aiken V
Indikator Valid Tidak Valid
(> 0,75) (< 0,75)
MPMD A1, A2, A3, A4 -
MPMC B5,B6,B7,B8 B9, B10, B11 -
MPDK C12, C13 C14, C15 -
MDMP D16,D17,D18D19, D20 -
Total / % 20/100% 0 / 0%
Berdasarkan data pada Tabel 11, maka dapat dijelaskan bahwa secara
umum validitas isi yang dinilai oleh expert judgment pada instrumen penilaian
pelaksanaan pembelajaran (PP) jika mengacu pada pada tabel Aiken’s V
menunjukkan semua item yang dikembangkan dalam instrumen penilaian
pelaksanaan pembelajaran (PP) dengan penskoran parsial dan holistik dinyatakan
valid. Hal ini menunjukkan bahwa instrumen penilaian pelaksanaan pembelajaran
(PP) telah akurat memenuhi syarat dari aspek validitas isi, meskipun masih
terdapat beberapa item yang diperbaiki berdasarkan saran atau masukan dari
expert judgment diantaranya perlu menyederhanakan beberapa butir pada
instrumen dengan memperhatikan skor setiap butir disesuaikan dengan deskriptor
dari aspek yang dinilai dan deskriptor setiap butir disarankan sebaiknya yang
dapat diamati serta disesuaikan dengan teori-teori yang mendasarinya.
Komponen ketiga pada model penilaian PPG yang dibuktikan validitas
isinya adalah instrumen penilaian kompetensi sosial dan kompetensi kepribadian
(KSKK). Pada instrumen ini memuat empat indikator dengan sebaran item
184
sebanyak 20 item. Terkait dengan hasil penilaian ketujuh expert judgment serta
analisis validitas isi berdasarkan Aiken V pada 20 item yang terdapat pada
instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) yang
terlampir pada Lampiran 2 halaman 461 diperoleh beberapa koefisien V, maka
interpretasi koefisien tersebut dibuat pengkategorian pada Tabel 12.
Tabel 12. Pengkategorian Validitas Isi Instrumen Penilaian KSKK
Tabel Aiken V
(> 0,75) (< 0,75)
BMJK A1, A2, A3, A4, A5 -
BITP B6, B7 B8, B9, B10 -
BKDS C11, C12, C13, C14, 15 -
BSMKD D16,D17,D18 D19, D20 -
Total / % 20/100% 0 / 0%
Berdasarkan data yang disajikan pada Tabel 12, maka dapat dijelaskan
bahwa secara umum validitas isi yang dinilai oleh expert judgment pada instrumen
penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) jika mengacu
pada pada tabel Aiken’s V menunjukkan semua item yang dikembangkan dalam
instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)
dengan penskoran parsial dan holistik dinyatakan valid. Hal ini menunjukkan
bahwa instrumen penilaian kompetensi sosial dan kompetensi kepribadian
(KSKK) telah akurat memenuhi syarat dari aspek validitas isi, meskipun masih
terdapat beberapa item yang diperbaiki berdasarkan saran atau masukan dari
expert judgment diantaranya perlu penyelarasan dari aspek bahasa, masih banyak
huruf yang hilang pada sejumlah kata, dan deskripsi pilihan jawaban dari masing-
185
masing item dibuat singkat, jelas dan menyesuaikan dengan komponen dan
indikator yang diharapkan ternilai dari kompetensi ini.
Komponen keempat pada model penilaian PPG yang dibuktikan validitas
isinya adalah buku panduan model penilaian dengan penskoran parsial dan
holistik. Pada instrumen ini memuat tujuh indikator dengan sebaran item
sebanyak 46 item dengan rincian indikator menilai komponen pendahuluan
dengan sebaran item sebanyak 6 item dari item 1.1 - 1.6, menilai sistem penilaian
Program PPG dengan sebaran item sebanyak 4 item dari item 2.1 - 2.4, menilai
mekanisme penilaian Program PPG dengan sebaran item sebanyak 5 item dari
item 3.1 - 2.5, menilai penskoran dan interpretasi hasil penilaian Program PPG
dengan sebaran item sebanyak 13 item dari item 4.1 - 4.13, menilai komponen
pendukung penyajian panduan penilaian dengan sebaran item sebanyak 5 item
dari item 5.1-5.5, menilai akurasi dan kemutakhiran panduan penilaian dengan
sebaran item sebanyak 6 item dari item 6.1 - 6.6, dan menilai komponen bahasa
dari panduan penilaian dengan sebaran item sebanyak 7 item dari item 7.1 - 7.7.
Terkait dengan hasil penilaian ketujuh expert judgment serta analisis validitas isi
berdasarkan Aiken V pada 46 item yang terdapat pada format penelaahan panduan
model penilaian dengan penskoran parsial dan holistik dengan hasil penilaian
sebagaimana terlampir pada Lampiran 2 halaman 462 diperoleh beberapa
koefisien V, maka interpretasi koefisien tersebut dibuat pengkategorian
sebagaimana disajikan pada Tabel 13 sebagai berikut.
186
Tabel 13. Pengkategorian Validitas Isi Panduan Model Penilaian PPG
Tabel Aiken V
(> 0,75) (< 0,75)
Pendahuluan 1.1,1.2,1.3, 1.4,1.5,1.6 -
Sistem Penilaian Program PPG 2.1, 2.2, 2.3, 2.4 -
Mekanisme Penilaian Program PPG 3.1,3.2,3.3, 3.4,3.5 -
Penskoran dan Interpretasi Hasil 4.1,4.2,4.3, 4.4,4.5,4.6, 4.7
-
Penilaian Program PPG 4.8,4.9,4.10,4.11, 4.12,4.13
Pendukung Penyajian 5.1,5.2,5.3, 5.4,5.5
Akurasi dan kemutakhiran 6.1,6.2,6.3, 6.4,6.5,6.6
Bahasa 7.1,7.2,7.3, 7.4,7.5,7.6,7.7
Total / % 46/100% 0 / 0%
Berdasarkan data pada Tabel 13, dapat dijelaskan bahwa secara umum
validitas isi yang dinilai oleh expert judgment pada panduan model penilaian
dengan penskoran parsial dan holistik jika mengacu pada pada tabel Aiken’s V
menunjukkan semua item pada komponen panduan model penilaian dengan
penskoran parsial dan holistik dinyatakan valid. Hal ini menunjukkan bahwa
panduan model penilaian dengan penskoran parsial dan holistik telah akurat
memenuhi syarat dari aspek validitas isi berdasarkan penilaian expert judgment,
meskipun masih terdapat beberapa saran atau masukan diantaranya panduan
penilaian perlu disederhanakan, dibuat contoh penilaian yang menggambarkan
penguasaan kompetensi peserta PPG dengan penskoran parsial dan holistik.
Selanjutnya untuk melihat konsistensi atau reliabilitas penilaian dari
ketujuh expert judgment, dilakukan estimasi reliabilitas dengan menggunakan
teknik reliabilitas inter-rater terhadap hasil penilaian ketujuh expert judgment pada
instrumen penilaian rencana pelaksanaan pembelajaran (RPP), instrumen
penilaian pelaksanaan pembelajaran (PP), instrumen penilaian kompetensi sosial
187
dan kepribadian (KSKK) dan panduan model penilaian. Berikut ini disajikan hasil
estimasi reliabilitas inter-rater pada Tabel 14.
Tabel 14. Hasil Estimasi Reliabilitas dengan Inter-Rater
Koefisien
Instrumen Kriteria Keterangan
Reliabilitas
Rencana Pelaksanaan
≥ 0,70 0,84 Reliabel
Pembelajaran (RPP)
Pelaksanaan Penilaian
(PP)
Kompetensi Sosial dan
Kepribadian (KSKK)
Panduan Penilaian ≥ 0,70 0,86 Reliabel
Berdasarkan data pada Tabel 14 tersebut, maka dapat dijelaskan bahwa
secara umum semua instrumen yang ditanggapi oleh rater telah memiliki koefisien
inter-klas yang reliabel. Hal ini didasari pada semua koefisien telah melebihi
kriteria ≥ 0,70 instrumen dikatakan reliabel (Gronlund & Linn, 1965; Nunnally,
1994). Dengan demikian hasil estimasi reliabilitas dengan inter-rater tersebut
bermakna bahwa pengukuran yang dilakukan oleh rater pada instrumen penilaian
rencana pelaksanaan pembelajaran (RPP), instrumen penilaian pelaksanaan
pembelajaran (PP), instrumen penilaian kompetensi sosial dan kepribadian
(KSKK) serta buku panduan model penilaian konsisten/ajeg. Lebih jelasnya hasil
pembuktian relibilitas inter-rater dapat diamati pada Lampiran 2 halaman 463.
B. Hasil Ujicoba Produk
Pelaksanaan uji coba dimaksudkan untuk memperoleh informasi dan
membuktikan kualitas model penilaian PPG secara empirik melalui hasil uji coba
lapangan. Kualitas secara empirik yang dimaksud meliputi: validitas konstruk
188
instrumen, Goodness of Fit Model, karakteristik item dan tes berdasarkan
politomus item response theory, serta reliabilitas instrumen. Pada uji coba pertama
penggunaan subjek masih skala kecil yaitu sebanyak 236 peserta. Pembuktian
kualitas model penilaian PPG secara empirik pada uji coba I sebagai berikut.
1. Pembuktian Validitas Konstruk
Pembuktian validitas konstruk pada instrumen penilaian PPG dilakukan
melalui analisis faktor konfirmatori atau confirmatory factor analysis (CFA).
Pengujian CFA dilakukan untuk semua komponen penilaian yaitu: instrumen
penilaian rencana pelaksanaan pembelajaran (RPP), instrumen penilaian
pelaksanaan pembelajaran (PP), instrumen serta penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK). Ketiga komponen instrumen terbagi atas dua
metode penskoran yaitu penskoran parsial dan penskoran holistik. Selain itu, data
penilaian dikelompokkan menjadi dua kelompok yaitu data hasil penilaian oleh
dosen dan data hasil penilaian oleh guru pamong/penguji UKIN. Hasil analisis
pembuktian validitas konstruk dikemukakan sebagai berikut.
a. Validitas Konstruk Instrumen Penilaian Rencana Pelaksanaan
Pembelajaran (RPP)
Instrumen penilaian rencana pelaksanaan pembelajaran (RPP) diukur
melalui empat indikator dengan sebaran item sebanyak 25 item. Keempat indkator
tersebut adalah indkator perumusan indikator pencapaian kompetensi dan capaian
pembelajaran (PIPKC) sebanyak 6 item (item 1-6), indikator pengorganisasian
materi, metode, media dan sumber belajar (PMMMS) sebanyak enam item (item
7-12), indikator pengorganisasian proses, penilaian dan evaluasi pembelajaran
189
(PPPEP) sebanyak enam item (item 13-18), serta indikator penerapan prinsip
techno pedagogical content knowledge (PTPCK) sebanyak tujuh item (item19-
25). Penyajian hasil pembuktian validitas konstruk instrumen penilaian rencana
pelaksanaan pembelajaran (RPP) dikelompokkan berdasarkan dua kelompok data
ditinjau dari penskorannya, yaitu kelompok parsial dan kelompok holistik.
1) Validitas Konstruk Pada Instrumen Penilaian RPP dengan Penskoran
Parsial
Hasil pembuktian validitas konstruk instrumen penilaian rencana
pelaksanaan pembelajaran (RPP) melalui analisis faktor konfirmatori dengan
penskoran parsial untuk penilai dosen diperoleh informasi bahwa koefisien Barlet
dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet
menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang lebih
dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi
(Retnawati, 2016a: 47). Lebih lanjut sebanyak 25 item menunjukkan muatan
faktor masing-masing berdasarkan indikatornya. Dari 25 item tersebut
menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut
dikonfirmasikan dengan saran Retnawati (2016a: 64) yang menyatakan bahwa
koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya tidak
kurang dari 0,4. Hasil analisis menunjukkan bahwa semua variabel observable
memberikan sumbangan berarti untuk mengukur variabel latennya. Hal tersebut
bermakna bahwa ke-25 item pada instrumen penilaian rencana pelaksanaan
pembelajaran (RPP) penskoran parsial untuk penilai dosen telah valid secara
konstruk. Hal lain yang dapat dijelaskan bahwa model konstruk yang dirancang
190
telah memenuhi Goodness of Fit Model. Hal ini ditunjukkan melalui koefisien p-
value sebesar 0,104 yang melebih cut-of value 0,05 serta koefisien RMSEA
sebesar 0,022 yang lebih kecil dari cut-of value 0,08. Hal tersebut diperoleh
setelah mengkorelasikan eror antara item 7 dan item 14, serta item 22 dan item 25
sebagaimana terlampir pada Lampiran 3 halaman 466. Adanya korelasi error
tersebut disebabkan karena item-item tersebut secara empirik mengukur konstruk
yang tidak tunggal, sehingga untuk memperoleh model yang fit maka error dalam
item-tem tersebut harus dikorelasikan. Hal ini sesuai dengan pendapat Pan, Ip, &
Dubé (2017) bahwa mengoperasionalkan model pengukuran dalam analisis faktor
konfirmatori memerlukan asumsi yang kuat untuk menemukan kecocokan antara
model dengan data empirik. Untuk itu, pendekatan modifikasi merupakan cara
untuk meningkatkan kecocokan (fit) CFA melalui penggunaan indeks modifikasi
dengan mengkorelasikan antara kesalahaan pengukuran yang signifikan
Selain data dari instrumen penilaian rencana pelaksanaan pembelajaran
(RPP) penskoran parsial untuk penilai dosen, dilakukan pula pembuktian validitas
konstruk dengan menggunakan kelompok data dari penilai guru pamong/penguji
UKIN yang diperoleh informasi bahwa koefisien Barlet dengan nilai p 0,000 serta
KMO sebesar 0,9. Jika hasil pengujian Barlet menunjukkan nilai p yang lebih
kecil dari 0,01 serta koefisien KMO yang lebih dari 0,05 maka kecukupan sampel
untuk analisis faktor telah terpenuhi. Lebih lanjut sebanyak 25 item menunjukkan
muatan faktor masing-masing berdasarkan indikatornya. Dari 25 item tersebut
dikonfirmasikan dengan saran Retnawati (2016a: 64) koefisien jalur muatan
191
faktor akan memiliki arti (meaningful) jika besarnya tidak kurang dari 0,4. Artinya
semua variabel observable memberikan sumbangan berarti untuk mengukur
variabel latennya. Hal tersebut bermakna sama seperti analisis sebelumnya bahwa
ke-25 item pada instrumen penilaian rencana pelaksanaan pembelajaran (RPP)
penskoran parsial untuk penilai guru pamong/penguji UKIN telah valid secara
konstruk. Hal lain yang dapat dijelaskan pada aspek Goodness of Fit Model
diperoleh informasi bahwa model konstruk yang dirancang telah memenuhi
Goodness of Fit Model. Hal ini ditunjukkan melalui koefisien p-value sebesar
0,055 yang melebih cut-of value 0,05 serta koefisien RMSEA sebesar 0,025 yang
lebih kecil dari cut-of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan
error antara item 6 dan item 18 serta item 7 dan item 14 sebagaimana terlampir
pada Lampiran 3 halaman 465.
Berdasarkan beberapa hasil analisis yang telah dikemukakan, baik yang
berasal dari data penilaian dosen, maupun data yang berasal dari penilaian guru
pamong/penguji UKIN, maka dapat disimpulkan bahwa instrumen penilaian
rencana pelaksanaan pembelajaran (RPP) dengan penskoran parsial yang
digunakan pada uji coba I telah valid secara konstruk. Begitu pula ke-25 item
instrumen tersebut telah memenuhi aspek validitas secara konstruk.
2) Validitas Konstruk Instrumen Penilaian RPP dengan Penskoran Holistik
Seperti halnya pada penskoran parsial, hasil pembuktian validitas konstruk
konstruk instrumen penilaian rencana pelaksanaan pembelajaran (RPP) pada
kelompok penskoran holistik dibagi atas dua kelompok data yaitu data dari hasil
penilai dosen dan data dari hasil penilai guru pamong/penguji UKIN. Hasil
192
analisis validitas konstruk melalui analisis faktor konfirmatori untuk penilai dosen
diperoleh informasi bahwa koefisien Barlet dengan nilai p 0,000 serta KMO
sebesar 0,9. Jika hasil pengujian Barlet menunjukkan nilai p yang lebih kecil dari
0,01 serta koefisien KMO yang lebih dari 0,05 maka kecukupan sampel untuk
analisis faktor telah terpenuhi. Lebih lanjut sebanyak 25 item menunjukkan
dikonfirmasikan dengan saran Retnawati (2016a: 64) koefisien jalur muatan
faktor akan memiliki arti (meaningful) jika besarnya tidak kurang dari 0,4. Artinya
semua variabel observable memberikan sumbangan berarti untuk mengukur
variabel latennya. Hal tersebut bermakna bahwa ke-25 item pada instrumen
penilaian rencana pelaksanaan pembelajaran (RPP) penskoran holistik untuk
penilai dosen telah valid secara konstruk. Hal lain yang dapat dijelaskan adalah
pada aspek Goodness of Fit Model diperoleh informasi bahwa model konstruk
yang dirancang juga telah memenuhi Goodness of Fit Model yang dibuktikandarii
koefisien p-value sebesar 0,067 yang melebih cut-of value 0,05 serta koefisien
RMSEA sebesar 0,024 yang lebih kecil dari cut-of value 0,08. Hal tersebut
diperoleh setelah mengkorelasikan eror antara item 16 dan item 17 serta item 19
dan item 24 sebagaimana terlampir pada Lampiran 3 halaman 466.
(RPP) penskoran holistik untuk penilai dosen, dilakukan pula pembuktian
validitas konstruk dengan menggunakan kelompok data dari penilai guru
pamong/penguji UKIN. Hasil analisis faktor konfirmatori dari instrumen penilaian
193
rencana pelaksanaan pembelajaran (RPP) penskoran holistik untuk penilai guru
pamong/penguji UKIN. Pada dasarnya instrumen yang digunakan adalah sama,
begitu pula subjek yang dinilai adalah orang yang sama, hanya penilainya saja
yang berbeda yaitu dosen dan guru pamong/penguji UKIN. Berdasarkan
penyajian tersebut, diperoleh informasi bahwa koefisien Barlet dengan nilai p
0,000 serta KMO sebesar 0,9. Jika mengacu pada saran Retnawati (2016a: 47)
hasil pengujian Barlet menunjukkan nilai p yang lebih kecil dari 0,01 serta
koefisien KMO yang lebih dari 0,05 maka kecukupan sampel untuk analisis faktor
telah terpenuhi. Lebih lanjut sebanyak 25 item menunjukkan muatan faktor
masing-masing berdasarkan indikatornya dan menunjukkan seluruh koefisien
muatan faktor lebih dari 0,4. Jika hal tersebut dikonfirmasikan dengan saran
Retnawati (2016a: 64) koefisien jalur muatan faktor akan memiliki arti
(meaningful) jika besarnya tidak kurang dari 0,4. Artinya semua variabel
observable memberikan sumbangan berarti untuk mengukur variabel latennya.
Hal tersebut bermakna sama seperti analisis sebelumnya bahwa ke-25 item pada
instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran holistik
untuk penilai guru pamong/penguji UKIN telah valid secara konstruk. Selain itu,
berdasarkan hasil analisis diperoleh informasi bahwa model konstruk yang
dirancang telah memenuhi Goodness of Fit Model ditunjukkan melalui koefisien
p-value sebesar 0,07 yang melebih cut-of value 0,05 serta koefisien RMSEA
setelah mengkorelasikan eror antara item 1 dan item 7 serta item 13 dan item 14
sebagaimana terlampir pada Lampiran 3 halaman 467.
194
rencana pelaksanaan pembelajaran (RPP) dengan penskoran holistik yang
digunakan pada uji coba I telah valid secara konstruk. Begitu pula ke-25 item
b. Validitas Konstruk Instrumen Pelaksanaan pembelajaran (PP)
Instrumen penilaian pelaksanaan pembelajaran (PP) diukur melalui empat
indikator dengan sebaran item sebanyak 20 item. Seperti halnya pembuktian
validitas konstruk pada instrumen penilaian RPP, penyajian hasil pembuktian
validitas konstruk instrumen penilaian pelaksanaan pembelajaran (PP)
dikelompokkan berdasarkan dua kelompok data ditinjau dari penskorannya, yaitu
kelompok data dengan penskoran parsial dan kelompok penskoran holistik.
1) Validitas Konstruk Pada Instrumen Penilaian Pelaksanaan Pembelajaran
(PP) dengan Penskoran Parsial
Hasil pembuktian validitas konstruk instrumen penilaian pelaksanaan
pembelajaran (PP) pada kelompok penskoran parsial dibagi atas dua kelompok
data yaitu data dari hasil penilai dosen dan data dari hasil penilai guru
pamong/penguji UKIN. Hasil analisis faktor konfirmatori dari instrumen penilaian
pelaksanaan pembelajaran (PP) dengan penskoran parsial untuk penilai dosen
sebesar 0,9. Jika mengacu pada kriteria Retnawati (2016a: 47) hasil pengujian
Barlet menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang
195
lebih dari 0,05, maka kecukupan sampel untuk analisis faktor telah terpenuhi.
Lebih lanjut sebanyak 20 item menunjukkan muatan faktor masing-masing
berdasarkan indikatornya yang menunjukkan seluruh koefisien muatan faktor
lebih dari 0,4. Jika hal tersebut dikonfirmasikan dengan saran Retnawati (2016a:
64) koefisien jalur muatan faktor besarnya tidak kurang dari 0,4. Artinya semua
variabel observable memberikan sumbangan berarti untuk mengukur variabel
latennya. Hal tersebut bermakna bahwa ke-20 item pada instrumen penilaian
pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai dosen telah valid
secara konstruk. Berdasarkan hasil analisis diperoleh informasi bahwa model
konstruk yang dirancang telah memenuhi Goodness of Fit Model yang
ditunjukkan oleh koefisien p-value sebesar 0,065 yang melebih cut-of value 0,05
serta koefisien RMSEA sebesar 0,027 yang lebih kecil dari cut-of value 0,08. Hal
tersebut diperoleh setelah mengkorelasikan eror antara item 8 dan item 12
Selain data dari instrumen penilaian pelaksanaan pembelajaran (PP)
penskoran parsial untuk penilai dosen, dilakukan pula pembuktian validitas
UKIN. Berdasarkan hasil analisis diperoleh informasi bahwa koefisien Barlet
dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet mengacu
pada kriteria Retnawati (2016a: 47) menunjukkan nilai p yang lebih kecil dari
muatan faktor masing-masing berdasarkan indikatornya yang ditunjukkan oleh
196
seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut dikonfirmasikan
dengan saran Retnawati (2016a: 64) koefisien jalur muatan faktor tidak kurang
dari 0,4. Artinya semua variabel observable memberikan sumbangan berarti untuk
mengukur variabel latennya. Hal tersebut bermakna sama seperti analisis
sebelumnya bahwa ke-20 item pada instrumen penilaian pelaksanaan
pembelajaran (PP) penskoran parsial untuk penilai guru pamong/penguji UKIN
telah valid secara konstruk. Hal lain yang dapat dijelaskan bahwa model konstruk
yang dirancang telah memenuhi Goodness of Fit Model yang ditunjukkan
diperoleh setelah mengkorelasikan error antara item 14 dan item 15 terlampir
pada Lampiran 3 halaman 471.
pelaksanaan pembelajaran (PP) dengan penskoran parsial yang digunakan pada uji
coba I telah valid secara konstruk. Begitu pula ke-20 item instrumen tersebut telah
memenuhi aspek validitas secara konstruk.
2) Validitas Konstruk Pada Instrumen Penilaian Pelaksanaan
Pembelajaran (PP) dengan Penskoran Holistik
instrumen penilaian pelaksanaan pembelajaran (PP) pada model penskoran
holistik juga dibagi atas dua kelompok data yaitu data dari hasil penilai dosen dan
197
data dari hasil penilai guru pamong/penguji UKIN. Hasil analisis faktor
konfirmatori dari instrumen penilaian pelaksanaan pembelajaran (PP) dengan
penskoran holistik untuk penilai dosen diperoleh informasi bahwa koefisien Barlet
dengan nilai p 0,000 serta KMO sebesar 0,9. Jika mengacu pada kriteria pengujian
Retnawati (2016a: 47) hasil pengujian Barlet menunjukkan nilai p yang lebih kecil
dari 0,01 serta koefisien KMO yang lebih dari 0,05 maka kecukupan sampel untuk
muatan faktor masing-masing berdasarkan indikatornya dan menunjukkan seluruh
koefisien muatan faktor lebih dari 0,4. Jika hal tersebut dikonfirmasikan dengan
saran Retnawati (2017: 64) koefisien jalur muatan faktor akan memiliki arti
(meaningful) jika besarnya tidak kurang dari 0,4.
Hasil analisis menunjukkan bahwa semua variabel observable memberikan
sumbangan berarti untuk mengukur variabel latennya. Hal tersebut bermakna
bahwa ke-20 item pada instrumen penilaian pelaksanaan pembelajaran (PP)
penskoran holistik untuk penilai dosen telah valid secara konstruk. Hal lain yang
dapat dijelaskan bahwa model konstruk yang dirancang telah memenuhi Goodness
of Fit Model yang ditunjukkan koefisien p-value sebesar 0,11 melebih cut-of value
0,05 serta koefisien RMSEA sebesar 0,024 yang lebih kecil dari cut-of value 0,08.
Hal tersebut diperoleh setelah mengkorelasikan error antara item 7 dan item 10
serta item 14 dan item 15 terlampir pada Lampiran 3 halaman 468.
Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian
pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai guru
pamong/penguji UKIN diperoleh informasi bahwa koefisien Barlet dengan nilai p
198
0,000 serta KMO sebesar 0,9. Jika mengacu pada kriteria pengujian Retnawati
(2016a: 47) bahwa nilai p yang lebih kecil dari 0,01 serta koefisien KMO yang
lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi.
berdasarkan indikatornya dan seluruh koefisien muatan faktor lebih dari 0,4. Jika
hal tersebut dikonfirmasikan dengan kriteria Retnawati (2016a: 64) koefisien jalur
muatan faktor tidak kurang dari 0,4 menunjukkan semua variabel observable
bermakna sama seperti analisis sebelumnya bahwa ke-20 item pada instrumen
penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai guru
pamong/penguji UKIN telah valid secara konstruk. Hal lain yang dapat dijelaskan
bahwa model konstruk yang dirancang telah memenuhi Goodness of Fit Model
yang ditunjukkan melalui koefisien p-value sebesar 0,07 melebihi cut-of value
Hal tersebut diperoleh setelah mengkorelasikan eror antara item 7 dan 10 serta
item 8 dan item 12 sebagaimana terlampir pada Lampiran 3 halaman 469.
pelaksanaan pembelajaran (PP) dengan penskoran holistik yang digunakan pada
uji coba I telah valid secara konstruk. Begitu pula ke-20 item instrumen tersebut
telah memenuhi aspek validitas secara konstruk.
199
c. Validitas Konstruk Instrumen Kompetensi Sosial dan Kompetensi
Kepribadian (KSKK)
Instrumen penilaian kompetensi sosial dan kompetensi kepribadian
(KSKK) diukur melalui empat indikator dengan sebaran item sebanyak 20 item.
Seperti halnya pembuktian validitas konstruk pada instrumen penilaian RPP dan
pelaksanaan pembelajaran, penyajian hasil pembuktian validitas konstruk
dikelompokkan berdasarkan data penilaian dengan penskoran parsial dan holistik.
1) Kompetensi Kepribadian (KSKK) dengan Penskoran Parsial
kompetensi sosial dan kompetensi kepribadian (KSKK) dengan penskoran parsial
untuk penilai dosen, diperoleh informasi bahwa koefisien Barlet dengan nilai p
hasil tersebut dikonfirmasikan dengan kriteria Retnawati (2016a: 64) koefisien
jalur muatan faktor tidak kurang dari 0,4 menunjukkan bahwa semua variabel
observable memberikan sumbangan berarti untuk mengukur variabel latennya.
Hal tersebut bermakna bahwa ke-20 item pada instrumen penilaian kompetensi
sosial dan kompetensi kepribadian (KSKK) penskoran parsial untuk penilai dosen
telah valid secara konstruk. Hal lain yang dapat dijelaskan dari hasil analisis
200
Goodness of Fit Model diperoleh informasi bahwa model konstruk yang dirancang
telah memenuhi Goodness of Fit Model. Hal ini ditunjukkan melalui koefisien p-
value sebesar 0,071 yang melebih cut-of value 0,05 serta koefisien RMSEA
setelah mengkorelasikan eror antara item 2 dan item 14, item 5 dan item 20, serta
item 12 dan item 15 sebagaimana terlampir pada Lampiran 3 halaman 474.
kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran parsial untuk
penilai guru pamong/penguji UKIN, diperoleh informasi bahwa koefisien Barlet
dengan nilai p 0,000 serta KMO sebesar 0,9. Jika mengacu pada kriteria pengujian
Retnawati (2016a: 47) bahwa nilai p yang lebih kecil dari 0,01 serta koefisien
KMO yang lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah
terpenuhi. Lebih lanjut sebanyak 20 item menunjukkan muatan faktor masing-
masing berdasarkan indikatornya dan seluruh koefisien muatan faktor lebih dari
0,4. Jika dikonfirmasikan dengan saran Retnawati (2017: 64) koefisien jalur
besarnya tidak kurang dari 0,4 menunjukkan semua variabel observable
penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran
parsial untuk penilai guru pamong/penguji UKIN telah valid secara konstruk. Hal
lain yang dapat dijelaskan bahwa model konstruk yang dirancang telah memenuhi
Goodness of Fit Model yang ditunjukkan melalui koefisien p-value sebesar 0,14
melebihi cut-of value 0,05 serta koefisien RMSEA sebesar 0,022 yang lebih kecil
201
dari cut-of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan error
antara item 2 dan item 14 serta item 5 dan item 20 sebagaimana terlampir pada
yang digunakan pada uji coba I telah valid secara konstruk. Begitu pula ke-20
item instrumen tersebut telah memenuhi aspek validitas secara konstruk.
2) Validitas Konstruk Pada Instrumen Kompetensi Sosial dan Kompetensi
Kepribadian (KSKK) dengan Penskoran Holistik
kompetensi sosial dan kompetensi kepribadian (KSKK) dengan penskoran holistik
untuk penilai dosen, diperoleh informasi bahwa koefisien Barlet dengan nilai p
dikonfirmasikan dengan saran Retnawati (2017: 64) koefisien jalur besarnya tidak
kurang dari 0,4 sehingga hasil analisis menunjukkan semua variabel observable
bermakna bahwa ke-20 item pada instrumen penilaian kompetensi sosial dan
202
kompetensi kepribadian (KSKK) penskoran holistik untuk penilai dosen telah
valid secara konstruk. Hal lain yang dapat dijelaskan bahwa model konstruk yang
dirancang telah memenuhi Goodness of Fit Model yang ditunjukkan melalui
koefisien p-value sebesar 0,14 yang melebihi cut-of value 0,05 serta koefisien
diperoleh setelah mengkorelasikan error antara item 2 dan item 14 serta item 5
dan item 20 sebagaimana terlampir pada Lampiran 3 halaman 476.
kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran holistik untuk
penilai guru pamong/penguji UKIN, diperoleh informasi bahwa sebanyak 20 item
menunjukkan muatan faktor masing-masing berdasarkan indikatornya dan seluruh
koefisien muatan faktor lebih dari 0,4. Jika dikonfirmasikan dengan saran
Retnawati (2017: 64) koefisien jalur besarnya tidak kurang dari 0,4, maka hasil
analisis menunjukkan semua variabel observable memberikan sumbangan berarti
untuk mengukur variabel latennya. Hal tersebut bermakna sama seperti analisis
sebelumnya bahwa ke-20 item pada instrumen penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK) penskoran holistik untuk penilai guru
pamong/penguji UKIN telah valid secara konstruk. Hal lain yang dapat dijelaskan
bahwa model konstruk yang dirancang telah memenuhi Goodness of Fit Model
yang ditunjukkan melalui koefisien p-value sebesar 0,28 yang melebihi cut-of
value 0,05 serta koefisien RMSEA sebesar 0,016 yang lebih kecil dari cut-of value
0,08. Hal tersebut diperoleh setelah mengkorelasikan error antara item 10 dan
203
item 15, item 11 dan item13 serta item 11 dan item 16 terlampir pada Lampiran 3
halaman 476.
yang digunakan pada uji coba I telah valid secara konstruk. Begitu pula ke-20
2. Reliabilitas Instrumen
Selain hasil pembuktian validitas konstruk melalui analisis faktor
konfirmatori, pada uji coba I ini juga dilakukan estimasi reliabilitas instrumen
untuk melihat keajegan instrumen model penilaian PPG yang telah dikembangkan
dalam menjelaskan konstruk ukur untuk semua komponen instrumen. Estimasi
reliabilitas instrumen untuk komponen dimaksud diuraikan sebagai berikut.
a. Reliabilitas Instrumen Penilaian RPP
Reliabilitas instrumen penilaian RPP dibagi menjadi empat kelompok data,
yaitu instrumen penilaian RPP dengan penskoran parsial untuk penilai dosen,
penilai guru pamong/penguji UKIN, instrumen penilaian RPP dengan penskoran
holistik untuk penilai dosen, dan penilai guru pamong/penguji UKIN. Uraian
keempat kelompok data tersebut dikemukakan sebagai berikut.
1) Reliabilitas Instrumen Penilaian RPP Penskoran Parsial Penilai Dosen
Reliabilitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP)
penskoran parsial untuk penilai dosen dianalisis menggunakan reliabilitas 
204
koefisien muatan faktor untuk semua variabel observasi terhadap variabel
latennya sebagaimana terlampir pada Lampiran 4 halaman 478.

RPP Penskoran Parsial Penilai Dosen
Item i i 2 1  i
2
A1 0,76 0,5776 0,4224

A2 0,74 0,5476 0,4524
A3 0,75 0,5625 0,4375
A4 0,72 0,5184 0,4816
A5 0,77 0,5929 0,4071
A6 0,77 0,5929 0,4071
B7 0,84 0,7056 0,2944
B8 0,75 0,5625 0,4375
B9 0,77 0,5929 0,4071
B10 0,80 0,6400 0,3600
B11 0,70 0,4900 0,5100
B12 0,78 0,6084 0,3916
C13 0,72 0,5184 0,4816
C14 0,78 0,6084 0,3916
C15 0,76 0,5776 0,4224
C16 0,74 0,5476 0,4524
C17 0,73 0,5329 0,4671
C18 0,83 0,6889 0,3111
D19 0,81 0,6561 0,3439
D20 0,78 0,6084 0,3916
D21 0,82 0,6724 0,3276
D22 0,85 0,7225 0,2775
D23 0,78 0,6084 0,3916
D24 0,80 0,6400 0,3600
D25 0,80 0,6400 0,3600
∑ 19,35 9,98
Tabel 15 menunjukkan informasi tentang muatan faktor valiabel observasi
atau item instrumen penilaian RPP penskoran parsial untuk penilai dosen serta
koefisien muatan faktor yang dikuadratkan. Hal ini digunakan untuk melakukan
i
perhitungan koefisien reliabilitas  . Pada tabel tersebut dapat diketahui 
i 1
i
205
i
1  
2
sebesar 19,35, serta i sebasar 9,98. Hasil perhitungan reliabilitas
i 1
diperoleh koefisien omega (  ) yang menunjukkan koefisien reliabilitas instrumen
sebesar 0,97. Jika didasari pada pendapat Mehrens and Lehmann (1973) dan
Retnawati (2016a: 87) menyatakan untuk dapat diterima koefisien reliabilitas
harus memiliki kriteria minimal sebesar 0,85. Dengan demikian dapat
disimpulkan bahwa instrumen penilaian RPP dengan penskoran parsial untuk
penilai dosen reliabel.
2) Reliabilitas Instrumen Penilaian RPP Penskoran Parsial untuk Penilai
Guru pamong/penguji UKIN
Hasil analisis reliabilitas instrumen penilaian rencana pelaksanaan
pembelajaran (RPP) dengan penskoran parsial untuk penilai guru pamong/penguji
UKIN juga dianalisis menggunakan reliabilitas  dengan koefisien muatan faktor
untuk semua variabel observasi terhadap variabel latennya sebagaimana terlampir
pada Lampiran 4 halaman 484 disajikan pada Tabel 16 berikut.
206
RPP Penskoran Parsial Penilai Guru pamong/penguji UKIN
Item i i 2 1  i
2
A1 0,76 0,5776 0,4224

A2 0,74 0,5476 0,4524
A3 0,75 0,5625 0,4375
A4 0,72 0,5184 0,4816
A5 0,77 0,5929 0,4071
A6 0,76 0,5776 0,4224
B7 0,84 0,7056 0,2944
B8 0,75 0,5625 0,4375
B9 0,77 0,5929 0,4071
B10 0,79 0,6241 0,3759
B11 0,78 0,6084 0,3916
B12 0,77 0,5929 0,4071
C13 0,72 0,5184 0,4816
C14 0,77 0,5929 0,4071
C15 0,76 0,5776 0,4224
C16 0,74 0,5476 0,4524
C17 0,73 0,5329 0,4671
C18 0,82 0,6724 0,3276
D19 0,81 0,6561 0,3439
D20 0,77 0,5929 0,4071
D21 0,83 0,6889 0,3111
D22 0,84 0,7056 0,2944
D23 0,79 0,6241 0,3759
D24 0,80 0,6400 0,3600
D25 0,78 0,6084 0,3916
∑ 19,36 9,9792
serta koefisien muatan faktor yang dikuadratkan. Hasil perhitungan reliabilitas
diperoleh koefisien omega (  )sebesar 0,97. Jika didasari pada kriteria minimal
koefisien reliabilitas sebesar 0,85 yang disarankan oleh Mehrens and Lehmann
(1973) dan Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian
RPP dengan penskoran parsial untuk penilai guru pamong/penguji UKIN reliabel.
207
3) Reliabilitas Instrumen Penilaian RPP Penskoran Holistik Penilai Dosen
penskoran holistik penilai dosen sebagaimana terlampir pada Lampiran 4 halaman
481, diperoleh hasil analisis reliabilitas seperti tersaji pada Tabel 17.

RPP Penskoran Holistik untuk Penilai Dosen
Item i i 2 1  i
2
A1 0,65 0,4225 0,5775

A2 0,60 0,3600 0,6400
A3 0,60 0,3600 0,6400
A4 0,55 0,3025 0,6975
A5 0,61 0,3721 0,6279
A6 0,63 0,3969 0,6031
B7 0,72 0,5184 0,4816
B8 0,58 0,3364 0,6636
B9 0,62 0,3844 0,6156
B10 0,68 0,4624 0,5376
B11 0,55 0,3025 0,6975
B12 0,62 0,3844 0,6156
C13 0,57 0,3249 0,6751
C14 0,61 0,3721 0,6279
C15 0,61 0,3721 0,6279
C16 0,61 0,3721 0,6279
C17 0,59 0,3481 0,6519
C18 0,72 0,5184 0,4816
D19 0,85 0,7225 0,2775
D20 0,79 0,6241 0,3759
D21 0,82 0,6724 0,3276
D22 0,83 0,6889 0,3111
D23 0,76 0,5776 0,4224
D24 0,82 0,6724 0,3276
D25 0,78 0,6084 0,3916
∑ 16,77 13,52
Berdasarkan Tabel 17 diperoleh informasi koefisien muatan faktor serta
koefisien muatan faktor yang dikuadratkan. Hasil perhitungan reliabilitas
diperoleh koefisien omega (  ) sebesar 0,95. Jika didasari pada kriteria minimal
208
RPP penskoran holistik untuk penilai dosen reliabel.
4) Reliabilitas Instrumen Penilaian RPP Penskoran Holistik untuk Penilai
Reliabilitas instrumen penilaian rencana RPP penskoran holistik untuk
penilai guru pamong/penguji UKIN diperoleh hasil analisis sebagaimana disajikan
pada Tabel 18.

RPP Penskoran Holistik Penilai Guru pamong/penguji UKIN
Item i i 2 1  i
2
A1 0,66 0,4356 0,5644

A2 0,64 0,4096 0,5904
A3 0,64 0,4096 0,5904
A4 0,60 0,3600 0,6400
A5 0,63 0,3969 0,6031
A6 0,59 0,3481 0,6519
B7 0,73 0,5329 0,4671
B8 0,67 0,4489 0,5511
B9 0,74 0,5476 0,4524
B10 0,63 0,3969 0,6031
B11 0,67 0,4489 0,5511
B12 0,64 0,4096 0,5904
C13 0,63 0,3969 0,6031
C14 0,64 0,4096 0,5904
C15 0,56 0,3136 0,6864
C16 0,58 0,3364 0,6636
C17 0,56 0,3136 0,6864
C18 0,71 0,5041 0,4959
D19 0,75 0,5625 0,4375
D20 0,69 0,4761 0,5239
D21 0,77 0,5929 0,4071
D22 0,66 0,4356 0,5644
D23 0,76 0,5776 0,4224
D24 0,60 0,3600 0,6400
D25 0,69 0,4761 0,5239
∑ 16,44 14,1004
209
atau item instrumen penilaian RPP penskoran holistik untuk penilai guru
i i
 i sebesar 16,44, serta 1  

2
pamong/penguji UKIN, diketahui i sebasar
i 1 i 1
14,1. Berdasarkan hasil perhitungan reliabilitas diperoleh koefisien omega (  )
yang menunjukkan koefisien reliabilitas instrumen sebesar 0,95. Jika didasari
pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan oleh
Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan
bahwa instrumen penilaian RPP penskoran holistik untuk penilai guru
pamong/penguji UKIN reliabel.
b. Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
Seperti halnya pada reliabilitas instrumen penilaian RPP, pada reliabilitas
instrumen penilaian pelaksanaan pembelajaran (PP) juga dikelompokkan
berdasarkan model penskoran untuk penilai dosen dan penilai guru
pamong/penguji UKIN dengan deskripsi sebagai berikut.
a) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
Penskoran Parsial untuk Penilai Dosen
Reliabilitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran
parsial untuk penilai dosen juga dianalisis menggunakan pendekatan Reliabilitas
 dengan koefisien muatan faktor untuk semua variabel observasi terhadap
variabel latennya sebagaimana terlampir pada Lampiran 4 halaman 479. Berikut
ini disajikan hasil analisisnya pada Tabel 19:
210
Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai Dosen
Item i i 2 1  i
2
A1 0,75 0,5625 0,4375

A2 0,76 0,5776 0,4224
A3 0,80 0,6400 0,3600
A4 0,80 0,6400 0,3600
B5 0,77 0,5929 0,4071
B6 0,77 0,5929 0,4071
B7 0,75 0,5625 0,4375
B8 0,82 0,6724 0,3276
B9 0,78 0,6084 0,3916
B10 0,78 0,6084 0,3916
B11 0,70 0,4900 0,5100
C12 0,76 0,5776 0,4224
C13 0,81 0,6561 0,3439
C14 0,81 0,6561 0,3439
C15 0,82 0,6724 0,3276
D16 0,79 0,6241 0,3759
D17 0,76 0,5776 0,4224
D18 0,79 0,6241 0,3759
D19 0,77 0,5929 0,4071
D20 0,78 0,6084 0,3916
∑ 15,57 7,8631
Berdasarkan Tabel 19 diperoleh hasil perhitungan reliabilitas koefisien
omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar 0,96. Jika
didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan
oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan
bahwa instrumen instrumen penilaian pelaksanaan pembelajaran (PP) penskoran
parsial untuk penilai dosen reliabel.
211
b) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN
Berikut ini disajikan hasil analisis reliabilitas instrumen penilaian
pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai guru
pamong/penguji UKIN sebagaimana terlampir pada Lampiran 4 halaman 485.

Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai Guru
Pamong/Penguji UKIN
Item i i 2 1  i
2
A1 0,75 0,5625 0,4375

A2 0,75 0,5625 0,4375
A3 0,79 0,6241 0,3759
A4 0,79 0,6241 0,3759
B5 0,77 0,5929 0,4071
B6 0,77 0,5929 0,4071
B7 0,75 0,5625 0,4375
B8 0,81 0,6561 0,3439
B9 0,78 0,6084 0,3916
B10 0,78 0,6084 0,3916
B11 0,70 0,4900 0,5100
C12 0,77 0,5929 0,4071
C13 0,82 0,6724 0,3276
C14 0,82 0,6724 0,3276
C15 0,82 0,6724 0,3276
D16 0,77 0,5929 0,4071
D17 0,75 0,5625 0,4375
D18 0,78 0,6084 0,3916
D19 0,77 0,5929 0,4071
D20 0,78 0,6084 0,3916
∑ 15,52 7,9404
212
bahwa instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial
untuk penilai guru pamong/penguji UKIN reliabel.
c) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
Penskoran Holistik untuk Penilai Dosen
pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen
sebagaimana terlampir pada Lampiran 4 halaman 482.

Pelaksanaan Pembelajaran (PP) Penskoran Holistik Penilai Dosen
Item i i 2 1  i
2
A1 0,75 0,5625 0,4375

A2 0,77 0,5929 0,4071
A3 0,81 0,6561 0,3439
A4 0,80 0,6400 0,3600
B5 0,79 0,6241 0,3759
B6 0,78 0,6084 0,3916
B7 0,80 0,6400 0,3600
B8 0,81 0,6561 0,3439
B9 0,78 0,6084 0,3916
B10 0,77 0,5929 0,4071
B11 0,77 0,5929 0,4071
C12 0,78 0,6084 0,3916
C13 0,81 0,6561 0,3439
C14 0,81 0,6561 0,3439
C15 0,83 0,6889 0,3111
D16 0,80 0,6400 0,3600
D17 0,75 0,5625 0,4375
D18 0,77 0,5929 0,4071
D19 0,78 0,6084 0,3916
D20 0,78 0,6084 0,3916
∑ 15,74 7,604
213
bahwa instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik
untuk penilai dosen reliabel.
d) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN
pelaksanaan pembelajaran (PP) dengan penskoran holistik untuk penilai guru
pamong/penguji UKIN sebagaimana terlampir pada Lampiran 4 halaman 488.

Pelaksanaan Pembelajaran (PP) Penskoran Holistik untuk Penilai
Item i i 2 1  i
2
A1 0,75 0,5625 0,4375

A2 0,77 0,5929 0,4071
A3 0,81 0,6561 0,3439
A4 0,80 0,6400 0,3600
B5 0,79 0,6241 0,3759
B6 0,78 0,6084 0,3916
B7 0,80 0,6400 0,3600
B8 0,81 0,6561 0,3439
B9 0,78 0,6084 0,3916
B10 0,77 0,5929 0,4071
B11 0,76 0,5776 0,4224
C12 0,79 0,6241 0,3759
C13 0,80 0,6400 0,3600
C14 0,78 0,6084 0,3916
C15 0,80 0,6400 0,3600
D16 0,79 0,6241 0,3759
D17 0,76 0,5776 0,4224
D18 0,77 0,5929 0,4071
D19 0,78 0,6084 0,3916
D20 0,78 0,6084 0,3916
∑ 15,67 7,7171
214
omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar sebesar
0,96. Jika didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85 yang
disarankan oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87) dapat
disimpulkan bahwa instrumen penilaian pelaksanaan pembelajaran (PP)
penskoran holistik untuk penilai guru pamong/penguji UKIN reliabel.
c. Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian
Reliabilitas instrumen penilaian penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK) juga dibagi menjadi empat kelompok data. Data
pertama adalah instrumen penilaian KSKK dengan penskoran parsial untuk
penilai dosen. Data kedua adalah instrumen penilaian KSKK dengan penskoran
parsial untuk penilai guru pamong/penguji UKIN. Data ketiga adalah instrumen
penilaian KSKK dengan penskoran holistik untuk penilai dosen, dan data keempat
adalah instrumen penilaian KSKK dengan penskoran holistik untuk penilai guru
pamong/penguji UKIN. Uraian dari keempat kelompok data tersebut
dikemukakan sebagai berikut.
a) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian Penskoran Parsial untuk Penilai Dosen
penilai dosen pada Tabel 23:
215
KSKK Penskoran Parsial Penilai Dosen
Item i i 2 1  i
2
A1 0,70 0,4900 0,5100

A2 0,78 0,6084 0,3916
A3 0,73 0,5329 0,4671
A4 0,75 0,5625 0,4375
A5 0,81 0,6561 0,3439
B6 0,76 0,5776 0,4224
B7 0,82 0,6724 0,3276
B8 0,85 0,7225 0,2775
B9 0,76 0,5776 0,4224
B10 0,81 0,6561 0,3439
C11 0,79 0,6241 0,3759
C12 0,69 0,4761 0,5239
C13 0,79 0,6241 0,3759
C14 0,83 0,6889 0,3111
C15 0,72 0,5184 0,4816
D16 0,75 0,5625 0,4375
D17 0,75 0,5625 0,4375
D18 0,72 0,5184 0,4816
D19 0,76 0,5776 0,4224
D20 0,77 0,5929 0,4071
∑ 15,34 8,1984
penskoran parsial untuk penilai dosen reliabel.
216
b) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian Penskoran Parsial Penilai Guru pamong/penguji UKIN
kompetensi sosial dan kompetensi kepribadian penskoran parsial (KSKK) untuk
penilai guru pamong/penguji UKIN sebagaimana terlampir pada Lampiran 4
halaman 486.

KSKK Penskoran Parsial Penilai Guru pamong/penguji UKIN
Item i i 2 1  i
2
A1 0,70 0,4900 0,5100

A2 0,78 0,6084 0,3916
A3 0,74 0,5476 0,4524
A4 0,74 0,5476 0,4524
A5 0,82 0,6724 0,3276
B6 0,76 0,5776 0,4224
B7 0,82 0,6724 0,3276
B8 0,86 0,7396 0,2604
B9 0,77 0,5929 0,4071
B10 0,82 0,6724 0,3276
C11 0,78 0,6084 0,3916
C12 0,71 0,5041 0,4959
C13 0,78 0,6084 0,3916
C14 0,83 0,6889 0,3111
C15 0,74 0,5476 0,4524
D16 0,74 0,5476 0,4524
D17 0,73 0,5329 0,4671
D18 0,72 0,5184 0,4816
D19 0,76 0,5776 0,4224
D20 0,77 0,5929 0,4071
∑ 15,37 8,1523
217
(KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN reliabel.
c) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian Penskoran Holistik untuk Penilai Dosen
Hasil analisis reliabilitas instrumen penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK) penskoran holistik untuk penilai dosen
sebagaimana terlampir pada Lampiran 4 halaman 483 disajikan pada Tabel 25.

KSKK Penskoran Holistik untuk Penilai Dosen
Item i i 2 1  i
2
A1 0,54 0,2916 0,7084

A2 0,63 0,3969 0,6031
A3 0,6 0,36 0,64
A4 0,59 0,3481 0,6519
A5 0,72 0,5184 0,4816
B6 0,78 0,6084 0,3916
B7 0,81 0,6561 0,3439
B8 0,84 0,7056 0,2944
B9 0,75 0,5625 0,4375
B10 0,83 0,6889 0,3111
C11 0,67 0,4489 0,5511
C12 0,57 0,3249 0,6751
C13 0,63 0,3969 0,6031
C14 0,72 0,5184 0,4816
C15 0,59 0,3481 0,6519
D16 0,61 0,3721 0,6279
D17 0,59 0,3481 0,6519
D18 0,54 0,2916 0,7084
D19 0,61 0,3721 0,6279
D20 0,63 0,3969 0,6031
∑ 13,25 11,0455
218
(KSKK) penskoran holistik untuk penilai dosen reliabel.
d) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian Penskoran Holistik Penilai Guru pamong/penguji UKIN
Hasil analisis reliabilitas instrumen penilaian KSKK penskoran holistik
untuk penilai guru pamong/penguji UKIN sebagaimana terlampir pada Lampiran
4 halaman 489 disajikan pada Tabel 26 sebagai berikut.

KSKK Penskoran Holistik Penilai Guru pamong/penguji UKIN
Item i i 2 1  i
2
A1 0,54 0,2916 0,7084

A2 0,60 0,3600 0,6400
A3 0,58 0,3364 0,6636
A4 0,63 0,3969 0,6031
A5 0,74 0,5476 0,4524
B6 0,68 0,4624 0,5376
B7 0,76 0,5776 0,4224
B8 0,72 0,5184 0,4816
B9 0,68 0,4624 0,5376
B10 0,79 0,6241 0,3759
C11 0,73 0,5329 0,4671
C12 0,51 0,2601 0,7399
C13 0,55 0,3025 0,6975
C14 0,52 0,2704 0,7296
C15 0,59 0,3481 0,6519
D16 0,58 0,3364 0,6636
D17 0,53 0,2809 0,7191
D18 0,51 0,2601 0,7399
D19 0,64 0,4096 0,5904
D20 0,74 0,5476 0,4524
∑ 12,62 11,874
219
(KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN reliabel.
3. Karakteristik Item Berdasarkan Politomus Item Response Theory (Uji
Coba I)
Karakteristik item merupakan salah satu fase penting dalam
pengembangan model penilaian PPG. Melalui karakterisitk item, dapat dikenali
kualitas item baik ditinjau dari aspek instrumen maupun ditinjau dari aspek
kemampuan peserta. Model penilaian PPG telah dirancang untuk penskoran
politomi dengan penskoran parsial dan instrumen dengan penskoran holistik
sehingga dalam menganalisis karakteristik itemnya digunakan pendekatan
politomus item response theory. Penskoran parsial diestimasi dengan metode
partial credit model (PCM), sedangkan penskoran holistik diestimasi dengan
metode graded response model (GRM). Selain itu setiap instrumen tersebut
memiliki dua kelompok penilai yaitu dosen dan guru pamong/penguji UKIN.
Berikut ini karakteristik item pada model penilaian PPG.
a. Karakteristik Penilaian RPP
Pada karakteristik instrumen penilaian RPP dibagi dalam kelompok data
instrumen penilaian RPP dengan penskoran parsial untuk penilai dosen dan
220
penilai guru pamong/penguji UKIN. Data instrumen penilaian RPP dengan
penskoran holistik untuk penilai dosen dan penilai guru pamong/penguji UKIN
dengan deskripsi sebagai berikut.
1) Karakteristik Penilaian RPP Penskoran Parsial Penilai Dosen
Instrumen penilaian rencana pelaksanaan pembelajaran penskoran parsial
dengan penilai dosen dianalisis menggunakan pendekatan partial credit model
(PCM) dengan penskoran 0, 1, 2, 3, dan 4. Melalui Program R dengan Extended
Rasch Modeling (eRm) package diperoleh karakteristik item pada Tabel 27.

Penskoran Pasial untuk Penilai Dosen
Item Location Threshold ᵟ1 Threshold ᵟ2 Threshold ᵟ3 Threshold ᵟ4

A1 0,36 -0,79 -0,24 0,85 1,66
A2 0,51 -0,60 -0,37 0,92 2,12
A3 0,15 -1,82 -0,05 0,59 1,92
A4 0,26 -1,41 -0,06 1,02 1,53
A5 0,38 -1,54 0,04 0,70 2,32
A6 0,36 -1,35 0,12 0,56 2,12
B7 0,37 -1,12 0,28 0,29 2,04
B8 0,37 -1,17 -0,18 1.00 1,83
B9 0,36 -1,30 0,20 0,54 2,00
B10 0,47 -0,94 -0,08 0,71 2,22
B11 0,36 -0,67 -0,42 0,76 1,79
B12 0,45 -1,09 0,14 0,97 1,78
C13 0,58 -0,93 0,06 1,08 2,13
C14 0,50 -1,33 0,16 0,83 2,34
C15 0,53 -0,96 0,01 0,94 2,12
C16 0,44 -1,64 0,23 0,78 2,39
C17 0,47 -1,24 0,05 1,28 1,81
C18 0,43 -0,97 0,31 0,61 1,79
D19 0,71 -0,36 0,51 0,91 1,78
D20 0,51 -1,01 -0,05 1,09 2,03
D21 0,76 -0,19 0,29 1,08 1,86
D22 0,55 -0,86 0,06 1,09 1,92
D23 0,81 -0,03 0,31 0,83 2,12
D24 0,69 -0,29 0,15 0,84 2,07
D25 0,56 -0,73 0,41 0,82 1,75
221
Berdasarkan data hasil analisis yang disajikan pada Tabel 27 diperoleh
informasi bahwa parameter lokasi setiap item bervariasi dari 0,15 hingga 0,81.
Selain itu parameter threshold ᵟi sebanyak empat kelompok atau empat
perpotongan. Hal tersebut merupakan parameter tingkat kesulitan peserta
memperoleh skor tertentu ketika merespon butir i. Ditinjau dari peluang
pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap kategori
berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi koefisien
threshold ᵟi.. Hal tersebut dijelaskan oleh Embretson and Reise (2000) bahwa item
location mencerminkan tentang tingkat kemudahan atau kesukaran item tersebut,
sementara threshold merupakan ambang batas antar kategori tertentu yang akan
dicapai. Hal ini berarti bahwa semakin tinggi koefisien location maka semakin
sulit item tersebut dengan sebaran threshold yang merupakan kategori tingkat
pencapaiannya. Semakin tinggi threshold maka semakin sulit dicapai ambang
batas tersebut, sehingga peserta PPG yang memiliki kemampuan rendah tentu
hanya mampu mencapai threshold (ambang kategori) yang rendah pula, peserta
yang memiliki kemampuan menengah hanya mampu mencapai threshold (ambang
kategori) yang menengah hingga pada peserta yang berkemampuan tinggi tentu
mampu mencapai kategori ambang batas yang tinggi pula.
Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan
partial credit model adalah kurva karakteristik item. Kurva karakteristik item
digambarkan untuk memudahkan memahami hubungan antara setiap threshold ᵟi
yang merupakan tingkat kesulitan dengan kemampuan peserta untuk mencapai
skor atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva
222
karakteristik item dari instrumen penilaian rencana pelaksanaan pembelajaran
(RPP) penskoran parsial untuk penilai dosen.

Gambar 25 adalah salah satu contoh kurva karakteristik item dari
instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran parsial
untuk penilai dosen yaitu pada item 10. Jika dikaitkan dengan hasil kaliberasi item
pada Tabel 27, dapat dijelaskan bahwa pada dasarnya item 10 ini memiliki
parameter lokasi sebesar 0,47 dengan parameter threshold ᵟ1 sebesar -0,94,
threshold ᵟ2 sebesar -0,08, threshold ᵟ3 sebesar 0,71, serta threshold ᵟ4 sebesar
2,22. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai perpotongan kurva
setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai
kategori 2 atau untuk memperoleh skor 2 pada item 10 maka diperlukan
kemampuan (  ) sekitar -0,08 hingga 0,71. Untuk lebih jelasnya kurva
karakteristik untuk semua item pada instrumen penilaian rencana pelaksanaan
pembelajaran (RPP) penskoran parsial untuk penilai dosen disajikan pada Gambar
26 berikut.
223
Gambar 26. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai Dosen
Gambar 26 menyajikan kurva fungsi informasi dari akumulasi 25 item
pada instrumen penilaian RPP penskoran parsial untuk penilai dosen. Hal lain
yang dapat dijelaskan adalah nilai fungsi informasi instrumen sebesar 17,8 pada
skala kemampuan (  ) -0,6. Jika dihubungkan dengan Standard Error of
Measurement mengacu pada pendapat Hambleton, Swaminathan & Rogers
(1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai fungsi informasi (NIF)
memiliki hubungan yang berbanding terbalik dengan Standard Error of
Measurement (SEM), semakin besar nilai informasi maka SEM akan semakin
kecil atau sebaliknya, maka dapat dijelaskan bahwa dengan diketahuinya nilai
fungsi informasi sebesar 17,8, maka koefisien kesalahan pengukuran diperoleh
sebesar 0,23 yang menunjukkan nilai informasi lebih tinggi dibanding kesalahan
pengukuran sebagaimana disajikan pada Gambar 27:
224
Penilaian RPP Penskoran Parsial Penilai Dosen
Gambar 27 menunjukkan hubungan timbal balik antara NIF dengan SEM
dari penilaian RPP penskoran parsial yang dinilai oleh dosen. Kedua grafik fungsi
ini bertemu pada skala kemampuan -3 dan 1,9. Di antara dua kemampuan ini,
instrumen memiliki nilai informasi yang lebih tinggi dibandingkan dengan
kesalahan pengukurannya. Sebaliknya, ketika skala kemampuan kurang dari -3
dan lebih dari 1,9, maka instrumen ini memiliki kesalahan pengukuran yang lebih
besar dibandingkan dengan informasi yang diberikannya.
2) Karakteristik Penilaian RPP Penskoran Parsial Penilai Guru Pamong/
Penguji UKIN
Berikut ini disajikan karakteristik item penilaian rencana pelaksanaan
pembelajaran (RPP) penskoran parsial untuk penilai guru pamong/penguji UKIN
yang dianalisis dengan menggunakan pendekatan partial credit model (PCM)
melalui Program R dengan Extended Rasch Modeling (eRm) package pada Tabel
28 sebagai berikut.
225
Penskoran Pasial untuk Penilai Guru pamong/penguji UKIN

A1 0,35 -0,77 -0,16 0,71 1,67
A2 0,50 -0,43 -0,39 0,91 1,94
A3 0,16 -1,73 -0,01 0,54 1,88
A4 0,27 -1,41 0,07 0,99 1,44
A5 0,37 -1,51 0,16 0,60 2,24
A6 0,36 -1,32 0,18 0,52 2,08
B7 0,34 -1,05 0,29 0,15 1,97
B8 0,33 -1,07 -0,24 0,90 1,75
B9 0,33 -1,22 0,19 0,42 1,96
B10 0,43 -0,85 -0,15 0,62 2,11
B11 0,33 -0,61 -0,43 0,64 1,74
B12 0,43 -1,06 0,18 0,87 1,75
C13 0,56 -0,94 0,17 0,95 2,08
C14 0,52 -1,11 0,17 0,70 2,35
C15 0,50 -0,95 0,11 0,81 2,04
C16 0,43 -1,59 0,31 0,64 2,36
C17 0,45 -1,24 0,17 1,14 1,72
C18 0,41 -0,96 0,38 0,54 1,70
D19 0,65 -0,32 0,46 0,78 1,70
D20 0,47 -0,95 -0,08 0,97 1,96
D21 0,71 -0,16 0,23 0,96 1,81
D22 0,51 -0,80 0,02 0,97 1,85
D23 0,75 -0,00 0,27 0,70 2,05
D24 0,64 -0,25 0,11 0,72 2,00
D25 0,51 -0,68 0,38 0,70 1,67
Berdasarkan data Tabel 28 diperoleh informasi bahwa parameter lokasi
setiap item bervariasi dari 0,16 hingga 0,71. Selain itu parameter threshold ᵟi
sebanyak empat kelompok atau empat perpotongan. Hal tersebut merupakan
parameter tingkat kesulitan peserta memperoleh skor tertentu ketika merespon
butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien parameter
threshold ᵟi untuk setiap kategori berbeda-beda. Semakin tinggi kategori
pencapaian maka semakin tinggi koefisien threshold ᵟi. Hal ini berarti bahwa pada
instrumen penilaian RPP semakin tinggi koefisien location maka semakin sulit
226
item tersebut dengan sebaran threshold yang merupakan kategori tingkat
batas tersebut, sehingga peserta yang memiliki kemampuan rendah tentu hanya
mampu mencapai threshold (ambang kategori) yang rendah pula, sebaliknya
peserta yang berkemampuan tinggi tentu mampu mencapai kategori ambang batas
yang tinggi pula. Untuk memudahkan memahami hubungan antara setiap
threshold ᵟi yang merupakan tingkat kesulitan dengan kemampuan peserta untuk
mencapai skor atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva
karakteristik item 20 dari instrumen penilaian rencana pelaksanaan pembelajaran
(RPP) penskoran parsial untuk penilai guru pamong/penguji UKIN.

Gambar 28 adalah kurva karakteristik item 20 dari instrumen penilaian
rencana pelaksanaan pembelajaran (RPP) penskoran parsial untuk penilai guru
pamong/penguji UKIN, jika dikaitkan dengan hasil kaliberasi item pada Tabel 28
dapat dijelaskan bahwa pada dasarnya item 20 ini memiliki parameter lokasi
sebesar 0,47 dengan parameter threshold ᵟ1 sebesar -0,95, threshold ᵟ2 sebesar -
227
0,08, threshold ᵟ3 sebesar 0,97, serta threshold ᵟ4 sebesar 1,96. Secara grafis
threshold ᵟi dapat diinterpretasikan sebagai perpotongan kurva setiap kategori.
Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2 atau
untuk memperoleh skor 2 pada item 20 maka diperlukan kemampuan (  ) sekitar -
0,08 hingga 0,97. Untuk lebih jelasnya kurva karakteristik untuk semua item pada
untuk penilai guru pamong/penguji UKIN disajikan pada Gambar 29.
Gambar 29. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai Guru
Pamong/Penguji UKIN
pada instrumen penilaian RPP penskoran parsial untuk penilai guru
pamong/penguji UKIN yang menunjukkan nilai fungsi informasi maksimum
instrumen sebesar 17,8 pada skala kemampuan (  ) -0,6. Jika dihubungkan dengan
Standard Error of Measurement mengacu pada pendapat Hambleton,
Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai
fungsi informasi (NIF) memiliki hubungan yang berbanding terbalik dengan
228
Standard Error of Measurement (SEM), semakin besar nilai informasi maka SEM
akan semakin kecil atau sebaliknya, maka dapat dijelaskan bahwa dengan
diketahuinya nilai fungsi informasi sebesar sebesar 17,8, maka koefisien
kesalahan pengukuran (SEM) diperoleh sebesar 0,23 yang menunjukkan nilai
informasi lebih tinggi dibanding kesalahan pengukuran sebagaimana disajikan
pada Gambar 30 sebagai berikut.
Gambar 30. Hubungan timbal balik antara NIF dengan SEM Instrumen Penilaian
RPP Penskoran Parsial Penilai Guru pamong/penguji UKIN
Gambar 30 menunjukkan grafik nilai informasi (NIF) dan kesalahan
pengukuran (SEM) dimana kedua grafik fungsi ini bertemu pada skala
kemampuan -3 dan 1,9. Di antara dua kemampuan ini, instrumen memiliki nilai
informasi yang lebih tinggi dibandingkan dengan kesalahan pengukurannya.
Sebaliknya, ketika skala kemampuan kurang dari -3 dan lebih dari 1,9, maka
instrumen ini memiliki kesalahan pengukuran yang lebih besar dibandingkan
dengan informasi yang diberikannya.
229
3) Karakteristik Instrumen Penilaian Rencana Pelaksanaan Pembelajaran
(RPP) Penskoran Holistik untuk Penilai Dosen
Berikut ini hasil analisis karakteristik item instrumen penilaian RPP
dengan penskoran holistik untuk penilai dosen dianalisis dengan menggunakan
pendekatan graded response modeling (GRM) dengan penskoran 1, 2, 3, dan 4
melalui Program R dengan latent trait model (ltm) package seperti tersaji pada
Tabel 29 berikut.

Item a b1 b2 b3
A1 1,46 -2,35 -0,44 0,93
A2 1,32 -2,38 -0,29 1,37
A3 1,42 -3,05 -0,56 1,07
A4 1,24 -2,97 -0,48 1,00
A5 1,24 -3,05 -0,32 1,52
A6 1,53 -2,55 -0,39 1,17
B7 1,55 -2,39 -0,46 1,06
B8 1,33 -2,70 -0,22 1,17
B9 1,31 -2,73 -0,40 1,18
B10 1,42 -2,44 -0,26 1,31
B11 1,11 -2,75 -0,45 1,22
B12 1,41 -2,44 -0,24 1,09
C13 1,03 -2,85 -0,13 1,70
C14 1,30 -2,74 -0,16 1,52
C15 1,20 -2,64 -0,15 1,48
C16 1,22 -3,08 -0,23 1,62
C17 1,25 -2,73 -0,05 1,31
C18 1,65 -2,17 -0,32 0,92
D19 2,07 -1,62 -0,13 0,92
D20 2,02 -2,05 -0,08 1,06
D21 1,77 -1,63 -0,05 1,06
D22 2,38 -1,85 -0,07 0,94
D23 1,84 -1,58 -0,16 1,14
D24 2,05 -1,67 -0,19 1,03
D25 2,13 -1,79 -0,22 0,86
230
Berdasarkan hasil analisis pada Tabel 29 diperoleh informasi bahwa
parameter ai setiap item bervariasi dari 1,11 hingga 2,05. Selain itu parameter bi
sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut merupakan parameter
tingkat kesulitan peserta memperoleh skor tertentu ketika merespon butir i.
Ditinjau dari peluang pencapaian skornya, maka koefisien parameter bi untuk
setiap kategori berbeda-beda. Semakin tinggi kategori pencapaian maka semakin
tinggi koefisien bi. Berikut ini disajikan salah satu contoh kurva karakteristik item
dari instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran
holistik untuk penilai dosen.

Gambar 31 adalah salah satu contoh kurva karakteristik item dari item 23.
Jika dikaitkan dengan hasil kaliberasi item pada Tabel 29, dapat dijelaskan bahwa
pada dasarnya item 23 ini memiliki parameter daya beda ai sebesar 1,84 dengan
parameter b1 sebesar -1,58, b2 sebesar -0,16, serta b3 sebesar 1,14. Secara grafis bi
atau tingkat kesulitan dapat diinterpretasikan sebagai perpotongan kurva setiap
231
kategori. Dari gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2
atau untuk memperoleh skor 2 pada item 23 maka diperlukan kemampuan (  )
sekitar -1,58 hingga -0,16. Pada bagian ini hanya diberikan contoh untuk item 23.
Untuk lebih jelasnya kurva karakteristik untuk semua item pada instrumen
penilai dosen dapat diamati pada Lampiran 5 halaman 503 dan karakteristik
instrumen disajikan dalam bentuk fungsi informasi sebagai berikut.
Gambar 32. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai Dosen
pada instrumen penilaian RPP penskoran holistik untuk penilai dosen yang
diperoleh nilai fungsi informasi instrumen sebesar 12,1 pada skala kemampuan
(  ) -0,4. Jika dihubungkan dengan Standard Error of Measurement mengacu
pada pendapat Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014:
19) menyatakan bahwa nilai fungsi informasi (NIF) memiliki hubungan yang
berbanding terbalik dengan Standard Error of Measurement (SEM), semakin
besar nilai informasi maka SEM akan semakin kecil atau sebaliknya, maka dapat
dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 12,1, maka
232
koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,28 yang menunjukkan
nilai informasi lebih tinggi dibanding kesalahan pengukuran sebagaimana
disajikan pada Gambar 33 berikut
Gambar 33 menyajikan hubungan timbali balik antara fungsi informasi
dari akumulasi 25 item pada instrumen penilaian RPP penskoran holistik untuk
penilai dosen dan kesalahan pengukuran (SEM) dimana kedua grafik fungsi ini
bertemu pada skala kemampuan -2,7 dan 1,8. Di antara dua kemampuan ini,
instrumen memiliki nilai informasi yang lebih tinggi dibandingkan dengan
kesalahan pengukurannya. Sebaliknya, ketika skala kemampuan kurang dari -2,7
dan lebih dari 1,8, maka kesalahan pengukuran instrumen ini lebih besar
dibandingkan informasi yang diberikannya
4) Karakteristik Penilaian Rencana Pelaksanaan Pembelajaran (RPP)
Berikut ini hasil analisis bkarakteristik item penilaian rencana pelaksanaan
pembelajaran (RPP) dengan penskoran holistik untuk penilai guru
233
pamong/penguji UKIN dianalisis dengan menggunakan pendekatan graded
response modeling (GRM) melalui Program R dengan latent trait model (ltm)
package seperti tersaji pada Tabel 30:

Item a b1 b2 b3
A1 1,31 -2,43 -0,45 1,16
A2 1,26 -2,37 -0,24 1,60
A3 1,31 -3,14 -0,71 1,32
A4 1,15 -3,07 -0,42 1,22
A5 1,20 -3,03 -0,36 1,39
A6 1,20 -2,87 -0,66 1,39
B7 1,54 -2,32 -0,79 1,00
B8 1,30 -2,68 -0,41 1,15
B9 1,79 -2,26 -0,58 1,00
B10 1,26 -2,53 -0,48 1,32
B11 1,25 -2,49 -0,86 0,89
B12 1,49 -2,31 -0,28 1,11
C13 1,30 -2,49 -0,17 1,36
C14 1,42 -3,12 -0,16 1,18
C15 1,06 -2,79 -0,39 1,13
C16 1,16 -3,08 -0,40 1,19
C17 0,99 -3,11 -0,34 1,49
C18 1,59 -2,14 -0,15 0,93
D19 1,67 -1,76 0,00 1,03
D20 1,36 -2,71 -0,26 1,13
D21 1,48 -1,79 -0,02 1,23
D22 1,16 -2,73 -0,48 1,22
D23 1,65 -1,63 -0,15 1,11
D24 1,07 -2,40 -0,37 1,39
D25 1,37 -2,36 -0,54 0,86
Berdasarkan hasil analisis pada Tabel 30 diperoleh informasi bahwa
parameter ai setiap item bervariasi dari 0,99 hingga 1,79. Selain itu, parameter bi
234
tinggi koefisien bi. Hal lain yang dapat dijelaskan berdasarkan hasil analisis item
dengan graded response model adalah kurva karakteristik item. Berikut ini
disajikan salah satu contoh kurva karakteristik item dari instrumen penilaian
rencana pelaksanaan pembelajaran (RPP) penskoran holistik penilai guru
pamong/penguji UKIN.

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran Holistik
untuk penilai guru pamong/penguji UKIN yaitu item 21. Jika dikaitkan dengan
hasil kaliberasi item pada Tabel 30, dapat dijelaskan bahwa pada dasarnya item 21
ini memiliki parameter daya beda ai sebesar 1,48 dengan parameter b1 sebesar -
1,79, b2 sebesar -0,02, serta b3 sebesar 1,23. Secara grafis bi atau tingkat kesulitan
dapat diinterpretasikan sebagai perpotongan kurva setiap kategori. Dari gambar
tersebut dapat dijelaskan bahwa untuk mencapai kategori 2 atau untuk
memperoleh skor 2 pada item 21 maka diperlukan kemampuan (  ) sekitar -1,79
hingga -0,02. Pada bagian ini hanya diberikan contoh untuk item 21. Secara lebih
235
jelasnya kurva karakteristik untuk semua item pada instrumen penilaian rencana
pelaksanaan pembelajaran (RPP) penskoran holistik untuk penilai guru
pamong/penguji UKIN dapat diamati pada Lampiran 5 halaman 507. Lebih lanjut
karakteristik instrumen disajikan dalam kurva fungsi informasi sebagai berikut.
Gambar 35. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai Guru
Pamong/Penguji UKIN
Gambar 35 menyajikan kurva fungsi informasi dari akumulasi semua item
pada instrumen penilaian RPP penskoran holistik untuk penilai untuk Penilai
Guru pamong/penguji UKIN diperoleh nilai fungsi informasi maksimum
instrumen sebesar 12,1 pada skala kemampuan (  ) -0,4. Jika dihubungkan dengan
Standard Error of Measurement mengacu pada pendapat Hambleton,
diketahuinya nilai fungsi informasi sebesar 12,1, maka koefisien kesalahan
236
pengukuran (SEM) diperoleh sebesar 0,28 yang menunjukkan nilai informasi
lebih tinggi dibanding kesalahan pengukuran sebagaimana pada Gambar 36:
Gambar 36. Fungsi Informasi Instrumen Penilaian RPP Penskoran Holistik

Penilai Guru pamong/penguji UKIN
Gambar 36 menunjukkan hubungan timbal balik antara NIF dengan SEM
dari penilaian RPP penskoran holistik untuk penilai guru pamong/penguji UKIN
dimana kedua grafik fungsi ini bertemu pada skala kemampuan -2,7 dan 1,8. Di
antara dua kemampuan ini, instrumen memiliki nilai informasi yang lebih tinggi
dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala
kemampuan kurang dari -2,7 dan lebih dari 1,8, maka instrumen ini memiliki
kesalahan pengukuran yang lebih besar dibandingkan dengan informasi yang
diberikannya.
b. Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
Karakteristik instrumen penilaian pelaksanaan pembelajaran (PP) juga
dikelompokkan berdasarkan penskoran dan penilai yaiyu data instrumen penilaian
pelaksanaan pembelajaran (PP) dengan penskoran parsial penilai dosen dan guru
237
pamong/penguji UKIN, dan data instrumen penilaian pelaksanaan pembelajaran
(PP) dengan penskoran holistik penilai dosen dan guru pamong/penguji UKIN
sebagaimana dideskripsikan sebagai berikut.
1) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
Berikut ini disajikan karakteristik instrumen penilaian pelaksanaan
pembelajaran (PP) penskoran parsial untuk penilai dosen dianalisis menggunakan
pendekatan partial credit model (PCM) untuk penskoran 0, 1, 2, 3, dan 4 dengan
bantuan Program R melalui Extended Rasch Modeling (eRm) package
sebagaimana tampak pada Tabel 31 berikut.

Pembelajaran (PP) Penskoran Pasial untuk Penilai Dosen

A1 0,45 -1,45 0,05 0,74 2,45
A2 0,68 -1,27 0,24 0,68 3,06
A3 0,70 -1,51 0,53 0,90 2,91
A4 0,58 -1,31 0,20 0,96 2,48
B5 0,64 -1,35 0,35 0,73 2,84
B6 0,54 -1,68 0,43 0,66 2,77
B7 0,60 -1,67 0,29 0,93 2,86
B8 0,67 -1,60 0,75 0,78 2,76
B9 0,69 -1,16 0,45 0,70 2,78
B10 0,73 -1,18 -0,00 0,94 3,16
B11 0,72 -1,40 0,20 1,31 2,76
C12 0,67 -1,48 0,52 0,82 2,82
C13 0,70 -0,95 0,00 1,01 2,74
C14 0,58 -0,71 -0,14 0,63 2,58
C15 0,69 -1,30 0,11 1,10 2,86
D16 0,62 -1,39 0,37 0,83 2,69
D17 0,73 -1,35 0,40 0,60 3,29
D18 0,64 -1,18 0,01 0,94 2,78
D19 0,72 -1,43 0,24 1,34 2,72
D20 0,61 -1,43 0,53 0,61 2,74
238
Berdasarkan Tabel 31 diperoleh informasi bahwa parameter lokasi setiap
item bervariasi dari 0,45 hingga 0,73. Selain itu parameter threshold ᵟi sebanyak
empat kelompok atau empat perpotongan. Hal ini menunjukkan parameter tingkat
kesulitan peserta memperoleh skor tertentu ketika merespon butir i. Ditinjau dari
peluang pencapaian skornya, maka koefisien parameter threshold ᵟi untuk setiap
kategori berbeda-beda. Semakin tinggi kategori pencapaian maka semakin tinggi
koefisien threshold ᵟi. yang berarti item location mencerminkan tentang tingkat
kemudahan atau kesukaran item tersebut. Hal ini berarti bahwa pada instrumen
penilaian pelaksanaan pembelajaran semakin tinggi koefisien location maka
semakin sulit item tersebut dengan sebaran threshold yang merupakan kategori
tingkat pencapaiannya. Semakin tinggi threshold maka semakin sulit dicapai
ambang batas tersebut, sehingga peserta yang berkemampuan tinggi tentu mampu
mencapai kategori ambang batas yang tinggi pula. Berikut ini disajikan salah satu
contoh kurva karakteristik item dari instrumen penilaian pelaksanaan
pembelajaran (PP) penskoran parsial untuk penilai dosen.
Gambar 37. Kurva Karakteristik Item 4 dari Instrumen Penilaian Pelaksanaan

Pembelajaran Penskoran Parsial untuk Penilai Dosen
239
instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk
penilai dosen yaitu item 4. Jika dikaitkan dengan hasil kaliberasi item pada Tabel
31, dapat dijelaskan bahwa pada dasarnya item 4 ini memiliki parameter lokasi
sebesar 0,58 dengan parameter threshold ᵟ1 sebesar -1,31, threshold ᵟ2 sebesar
untuk memperoleh skor 2 pada item 4 maka diperlukan kemampuan (  ) sekitar
0,20 hingga 0,96. Pada bagian ini hanya diberikan contoh untuk item 4. Secara
lebih jelasnya kurva karakteristik untuk semua item pada instrumen penilaian
pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai dosen dapat
diamati pada Lampiran 5 halaman 510. Lebih lanjut karakteristik instrumen
disajikan dalam kurva fungsi informasi sebagai berikut.
Gambar 38. Fungsi Informasi Instrumen PP Penskoran Parsial Penilai Dosen
Gambar 38 menyajikan kurva fungsi informasi keselurahan item pada
instrumen penilaian PP penskoran parsial untuk penilai dosen dengan nilai fungsi
240
informasi maksimum instrumen sebesar 14,27 pada skala kemampuan ( ) -1,3.
Jika dihubungkan dengan Standard Error of Measurement mengacu pada
pendapat Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19)
menyatakan bahwa nilai fungsi informasi (NIF) memiliki hubungan yang
besar nilai informasi maka SEM akan semakin kecil atau sebaliknya, maka dapat
koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,26 yang menunjukkan
nilai informasi lebih tinggi dibanding kesalahan pengukuran sebagaimana
disajikan pada Gambar 39:
Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai Dosen
pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk
penilai dosen dimana kedua grafik fungsi ini bertemu pada skala kemampuan -3,6
dan 1,2. Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang
241
lebih tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika
skala kemampuan kurang dari -3,6 dan lebih dari 1,2, maka instrumen ini
memiliki kesalahan pengukuran yang lebih besar dibandingkan dengan informasi
yang diberikannya.
Instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial
untuk penilai guru pamong/penguji UKIN yang dianalisis menggunakan
pendekatan partial credit model (PCM) melalui diperoleh hasil analisis berupa
karakteristik item seperti terlihat pada Tabel 32 berikut.
Tabel 32. Hasil Analisis Karakteristik Item Penilaian Pelaksanaan

Pembelajaran (PP) Penskoran Pasial Penilai Guru
pamong/penguji UKIN

A1 0,42 -1,23 -0,04 0,65 2,31
A2 0,63 -1,12 0,15 0,58 2,94
A3 0,66 -1,33 0,37 0,82 2,79
A4 0,54 -1,16 0,13 0,81 2,40
B5 0,59 -1,20 0,25 0,63 2,69
B6 0,50 -1,47 0,36 0,52 2,63
B7 0,57 -1,46 0,19 0,83 2,74
B8 0,63 -1,46 0,65 0,67 2,67
B9 0,64 -1,02 0,28 0,62 2,66
B10 0,69 -0,98 -0,16 0,84 3,10
B11 0,68 -1,26 0,11 1,19 2,70
C12 0,62 -1,34 0,45 0,66 2,73
C13 0,65 -0,84 -0,09 0,90 2,65
C14 0,54 -0,60 -0,21 0,47 2,52
C15 0,65 -1,15 0,02 0,99 2,77
D16 0,58 -1,24 0,27 0,72 2,60
D17 0,69 -1,20 0,30 0,49 3,20
D18 0,60 -1,03 -0,07 0,83 2,69
D19 0,68 -1,29 0,15 1,23 2,63
D20 0,58 -1,28 0,44 0,50 2,68
242
Berdasarkan Tabel 23 diperoleh informasi bahwa parameter lokasi setiap
item bervariasi dari 0,42 hingga 0,69. Selain itu parameter threshold ᵟi sebanyak
empat kelompok atau empat perpotongan. Hal tersebut merupakan parameter
Ditinjau dari peluang pencapaian skornya, maka koefisien parameter threshold ᵟi
untuk setiap kategori berbeda-beda. Semakin tinggi kategori pencapaian maka
semakin tinggi koefisien threshold ᵟi. Hal ini berarti bahwa pada instrumen
pelaksanaan pembelajaran semakin tinggi koefisien location maka semakin sulit
pencapaiannya. Berikut ini disajikan salah satu contoh kurva karakteristik item
dari instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk
penilai guru pamong/penguji UKIN.
Gambar 40. Kurva Karakteristik Item 15 dari Instrumen Penilaian PP Penskoran

Parsial Penilai Guru pamong/penguji UKIN
penilai guru pamong/penguji UKIN yaitu item 15. Jika dikaitkan dengan hasil
243
kaliberasi item pada Tabel 32, dapat dijelaskan bahwa pada dasarnya item 15 ini
memiliki parameter lokasi sebesar 0,65 dengan parameter threshold ᵟ1 sebesar -
1,15, threshold ᵟ2 sebesar 0,02, threshold ᵟ3 sebesar 0,99, serta threshold ᵟ4 sebesar
kemampuan (  ) sekitar 0,02 hingga 0,99. Pada bagian ini hanya diberikan contoh
untuk item 15. Secara lebih jelasnya kurva karakteristik untuk semua item pada
penilai guru pamong/penguji UKIN dapat diamati pada Lampiran 5 halaman 516.
Lebih lanjut karakteristik instrumen disajikan dalam fungsi informasi berikut.
Gambar 41. Fungsi Informasi Instrumen Pelaksanaan Pembelajaran Penskoran

Parsial Penilai Guru Pamong/Penguji UKIN
Gambar 41 menyajikan kurva fungsi informasi dari akumulasi seluruh
item pada instrumen penilaian RPP penskoran parsial untuk guru pamong/penguji
UKIN yang menunjukkan nilai fungsi informasi instrumen sebesar 14,27 pada
skala kemampuan (  ) -1,3. Jika dihubungkan dengan Standard Error of
244
Measurement mengacu pada pendapat Hambleton, Swaminathan & Rogers
(1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai fungsi informasi (NIF)
kecil atau sebaliknya, maka dapat dijelaskan bahwa dengan diketahuinya nilai
fungsi informasi sebesar 14,27, maka koefisien kesalahan pengukuran diperoleh
pengukuran sebagaimana disajikan pada Gambar 42 berikut.
Pelaksanaan Pembelajaran Penskoran Parsial Penilai Guru
pamong/penguji UKIN
penilai guru pamong/penguji UKIN yang dihubungkan dengan kesalahan
kemampuan -3,6 dan 1,2. Di antara dua kemampuan ini, instrumen memiliki nilai
245
Sebaliknya, ketika skala kemampuan kurang dari -3,6 dan lebih dari 1,2, maka
3) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran Penskoran
Holistik untuk Penilai Dosen
Instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik
untuk penilai dosen dianalisis menggunakan pendekatan graded response
modeling (GRM) dengan penskoran 1, 2, 3, dan 4. Melalui Program R dengan
latent trait model (ltm) package diperoleh karakteristik item sebagai berikut.

Pembelajaran Penskoran Holistik untuk Penilai Dosen
Item a b1 b2 b3
A1 1,32 -2,18 0,55 1,32
A2 1,38 -1,97 0,95 1,38
A3 1,64 -1,61 0,82 1,64
A4 1,71 -1,76 0,56 1,71
B5 1,92 -1,70 0,71 1,92
B6 1,97 -1,68 0,65 1,97
B7 2,05 -1,48 0,70 2,05
B8 2,02 -1,48 0,67 2,02
B9 2,00 -1,59 0,66 2,00
B10 2,19 -1,71 0,86 2,19
B11 1,73 -1,63 0,74 1,73
C12 1,75 -1,59 0,72 1,75
C13 1,70 -1,84 0,71 1,70
C14 1,60 -2,08 0,57 1,60
C15 1,91 -1,70 0,76 1,91
D16 1,77 -1,68 0,64 1,77
D17 1,66 -1,76 1,01 1,66
D18 1,83 -1,80 0,71 1,83
D19 1,57 -1,58 0,76 1,57
D20 1,89 -1,64 0,66 1,89
246
informasi bahwa parameter ai setiap item bervariasi dari 1,32 hingga 2,19. Selain
itu parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut
merupakan parameter tingkat kesulitan peserta memperoleh skor tertentu ketika
merespon butir i. Ditinjau dari peluang pencapaian skornya, maka koefisien
parameter bi untuk setiap kategori berbeda-beda. Semakin tinggi kategori
pencapaian maka semakin tinggi koefisien bi. Hal lain yang dapat dijelaskan
berdasarkan hasil analisis item dengan graded response model adalah kurva
karakteristik item yang dicontohkan pada item 10 dari instrumen penilaian
pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen.

Pembelajaran (PP) Penskoran Holistik untuk Penilai Dosen
Gambar 43 menunjukkan kurva karakteristik item 10 dari instrumen
penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen,
jika dikaitkan dengan hasil kaliberasi item pada Tabel 33, dapat dijelaskan bahwa
parameter b1 sebesar -1,71, b2 sebesar 0,86, serta b3 sebesar 2,19. Secara grafis bi
247
sekitar -1,71 hingga 0,86. Pada bagian ini hanya diberikan contoh untuk item 10.
Secara lebih jelasnya kurva karakteristik untuk semua item pada instrumen
penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen
dapat diamati pada Lampiran 5 halaman 519. Lebih lanjut karakteristik instrumen
disajikan dalam fungsi informasi sebagai berikut.

Holistik Penilai Dosen
pada instrumen penilaian PP penskoran holistik untuk penilai dosen yang
diperoleh nilai fungsi informasi maksimum instrumen sebesar 12,88 pada skala
kemampuan (  ) -0,7. Jika dihubungkan dengan Standard Error of Measurement
mengacu pada pendapat Hambleton, Swaminathan & Rogers (1991: 94);
Retnawati (2014: 19) menyatakan bahwa nilai fungsi informasi (NIF) memiliki
hubungan yang berbanding terbalik dengan Standard Error of Measurement
248
(SEM), semakin besar nilai informasi maka SEM akan semakin kecil atau
sebaliknya, sehingga dapat dijelaskan bahwa dengan diketahuinya nilai fungsi
informasi sebesar 12,88, maka koefisien kesalahan pengukuran (SEM) diperoleh
pengukuran sebagaimana disajikan pada Gambar 45 berikut.
pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk
penilai dosen dimana kedua grafik fungsi ini bertemu pada skala kemampuan -3
dan 1,7. Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang
lebih tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika
skala kemampuan kurang dari -3 dan lebih dari 1,7, maka instrumen ini memiliki
diberikannya.
249
untuk penilai guru pamong/penguji UKIN dianalisis menggunakan pendekatan
graded response modeling (GRM) diperoleh karakteristik item berikut.
Tabel 34. Hasil Analisis Karakteristik Item Instrumen Penilaian PP

Item a b1 b2 b3
A1 1,37 -2,08 -0,83 0,50
A2 1,42 -1,89 -0,74 0,84
A3 1,70 -1,53 -0,48 0,77
A4 1,71 -1,69 -0,65 0,54
B5 2,08 -1,59 -0,65 0,62
B6 1,93 -1,62 -0,66 0,59
B7 2,24 -1,38 -0,61 0,66
B8 1,96 -1,42 -0,54 0,67
B9 2,11 -1,50 -0,59 0,62
B10 2,24 -1,63 -0,48 0,80
B11 1,87 -1,53 -0,50 0,73
C12 1,74 -1,54 -0,55 0,64
C13 1,71 -1,77 -0,59 0,63
C14 1,54 -2,06 -0,96 0,49
C15 1,91 -1,65 -0,56 0,71
D16 1,79 -1,62 -0,73 0,56
D17 1,65 -1,71 -0,76 0,94
D18 1,86 -1,73 -0,64 0,70
D19 1,73 -1,48 -0,47 0,68
D20 1,88 -1,58 -0,77 0,57
itu, parameter bi sebanyak tiga kelompok atau tiga perpotongan. Hal tersebut
250
karakteristik item yang dicontohkan pada item 2 dari instrumen penilaian
pelaksanaan pembelajaran penskoran holistik penilai guru pamong/penguji UKIN.
Gambar 46. Kurva Karakteristik Item 2 dari Penilaian Pelaksanaan Pembelajaran

Penskoran Holistik Penilai Guru pamong/penguji UKIN
pamong/penguji UKIN. Jika dihubungkan dengan hasil kaliberasi item pada Tabel
34, dapat dijelaskan bahwa pada dasarnya item 2 ini memiliki parameter daya
beda ai sebesar 1,42 dengan parameter b1 sebesar -1,89, b2 sebesar -0,74, serta b3
sebesar 0,84. Secara grafis bi atau tingkat kesulitan dapat diinterpretasikan sebagai
perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan bahwa
untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 2 maka
diperlukan kemampuan (  ) sekitar -1,89 hingga -0,74. Pada bagian ini hanya
diberikan contoh untuk item 2. Secara lebih jelasnya kurva karakteristik untuk
251
semua item pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran
holistik untuk penilai guru pamong/penguji UKIN dapat diamati pada Lampiran 5
halaman 522. Lebih lanjut disajikan dalam fungsi informasi sebagai berikut.

Holistik Penilai Guru Pamong/Penguji UKIN
pada instrumen penilaian pelaksanaan pembelajaran (PP) dengan penskoran
parsial untuk penilai guru pamong/penguji UKIN diperoleh nilai fungsi informasi
instrumen sebesar 12,88 pada skala kemampuan (  ) -0,7. Jika dihubungkan
dengan Standard Error of Measurement mengacu pada pendapat Hambleton,
252
PP Penskoran Holistik Penilai Guru pamong/penguji UKIN
Gambar 48 menyajikan hubungan kurva fungsi informasi dari akumulasi
20 item pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran
holistik untuk penilai guru pamong/penguji UKIN dengan kesalahan pengukuran
(SEM) dimana kedua grafik fungsi ini bertemu pada skala kemampuan -3 dan 1,7.
Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang lebih
tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala
kemampuan kurang dari -3 dan lebih dari 1,7, maka instrumen ini memiliki
kesalahan pengukuran yang lebih besar dibanding informasi yang diberikannya.
c. Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian (KSKK)
Karakteristik instrumen penilaian kompetensi sosial dan kompetensi
kepribadian (KSKK) juga dikelompokkan berdasarkan model penskoran dari hasil
penilaian baik dosen maupun guru pamong/penguji UKIN dengan deskripsi
sebagai berikut.
253
1) Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian (KSKK) Penskoran Parsial untuk Penilai Dosen
(KSKK) penskoran parsial untuk penilai dosen dianalisis dengan menggunakan
pendekatan partial credit model (PCM) dengan penskoran 0, 1, 2, 3, dan 4.
Melalui Program R dengan Extended Rasch Modeling (eRm) package diperoleh
hasil analisis berupa karakteristik item sebagai berikut.
Tabel 35. Hasil Analisis Karakteristik Item Instrumen Penilaian KSKK


A1 0,59 -0,93 0,07 1,10 2,14
A2 0,51 -1,33 0,17 0,85 2,35
A3 0,54 -0,96 0,03 0,96 2,14
A4 0,48 -1,25 0,07 1,30 1,82
A5 0,44 -0,97 0,32 0,63 1,80
B6 0,52 -1,02 -0,04 1,11 2,04
B7 0,77 -0,19 0,31 1,10 1,87
B8 0,56 -0,86 0,07 1,11 1,93
B9 0,82 -0,03 0,33 0,85 2,13
B10 0,70 -0,29 0,16 0,87 2,08
C11 0,48 -0,95 -0,07 0,73 2,23
C12 0,37 -0,68 -0,41 0,78 1,80
C13 0,46 -1,09 0,15 1,00 1,79
C14 0,38 -1,13 0,29 0,31 2,05
C15 0,38 -1,17 -0,17 1,02 1,84
D16 0,52 -0,60 -0,36 0,94 2,14
D17 0,16 -1,83 -0,04 0,61 1,93
D18 0,27 -1,41 -0,05 1,04 1,54
D19 0,39 -1,54 0,05 0,72 2,33
D20 0,37 -1,36 0,13 0,58 2,14
254
perpotongan. Ditinjau dari peluang pencapaian skornya, maka koefisien parameter
threshold ᵟi untuk setiap kategori berbeda-beda. Semakin tinggi kategori
pencapaian maka semakin tinggi koefisien threshold ᵟi. Hal ini berarti bahwa pada
instrumen penilaian kompetensi sosial dan kompetensi kepribadian semakin tinggi
koefisien location maka semakin sulit item tersebut dengan sebaran threshold
yang merupakan kategori tingkat pencapaiannya, misalnya peserta yang memiliki
kemampuan menengah hanya mampu mencapai threshold yang menengah dan
pada peserta yang berkemampuan tinggi tentu mampu mencapai kategori ambang
batas yang tinggi pula. Sebagaimana dicontohkan pada salah satu kurva
karakteristik item 17 dari instrumen penilaian kompetensi sosial dan kompetensi
kepribadian penskoran parsial untuk penilai dosen.
Gambar 49. Kurva Karakteristik Item 17 dari Instrumen Penilaian Kompetensi

Sosial dan Kompetensi Kepribadian (KSKK) Penskoran Parsial
Penilai Dosen
penskoran parsial untuk penilai dosen yaitu item 17. Jika dikaitkan dengan hasil
255
1,83, threshold ᵟ2 sebesar -0,04, threshold ᵟ3 sebesar 0,61, serta threshold ᵟ4
sebesar 1,93. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai
diperlukan kemampuan (  ) sekitar -0,04 hingga 0,61. Pada bagian ini hanya
semua item pada instrumen penilaian kompetensi sosial dan kompetensi
kepribadian (KSKK) dengan penskoran parsial untuk penilai dosen dapat diamati
pada Lampiran 5 halaman 528. Lebih lanjut karakteristik instrumen disajikan
berdasarkan fungsi informasi sebagai berikut.
Gambar 50. Fungsi Informasi Instrumen KSKK Penskoran Parsial Penilai Dosen
Gambar 50 menyajikan kurva fungsi informasi dari keseluruhan item pada
dengan penskoran parsial untuk penilai dosen diperoleh nilai fungsi informasi
256
akan semakin kecil atau sebaliknya, sehingga dapat dijelaskan dengan
lebih tinggi dibanding kesalahan pengukuran seperti tampak pada Gambar 51:
KSKK Penskoran Parsial Penilai Dosen
257
(KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN dengan
pendekatan partial credit model (PCM) melalui Program R dengan Extended
Rasch Modeling (eRm) package diperoleh karakteristik item sebagai berikut.

Penskoran Pasial Penilai Guru pamong/penguji UKIN

A1 0,48 -0,81 0,00 0,88 1,86
A2 0,43 -1,26 0,25 0,62 2,13
A3 0,48 -0,91 0,26 0,69 1,87
A4 0,43 -1,14 0,20 1,08 1,59
A5 0,39 -0,92 0,55 0,42 1,50
B6 0,42 -0,93 -0,00 0,84 1,77
B7 0,65 -0,17 0,30 0,86 1,63
B8 0,48 -0,80 0,25 0,87 1,62
B9 0,73 -0,00 0,39 0,60 1,94
B10 0,62 -0,31 0,41 0,57 1,82
C11 0,38 -0,86 -0,02 0,52 1,91
C12 0,32 -0,66 -0,24 0,56 1,63
C13 0,39 -1,01 0,34 0,74 1,51
C14 0,34 -1,02 0,44 0,19 1,76
C15 0,34 -1,10 0,06 0,82 1,58
D16 0,41 -0,53 -0,31 0,74 1,78
D17 0,12 -1,69 0,01 0,50 1,67
D18 0,24 -1,31 0,17 0,85 1,26
D19 0,35 -1,40 0,23 0,54 2,06
D20 0,35 -1,26 0,32 0,47 1,89
258
threshold ᵟi. Hal ini berarti bahwa pada instrumen penilaian kompetensi sosial dan
kompetensi kepribadian semakin tinggi koefisien location, maka semakin sulit
batas tersebut, sehingga peserta yang memiliki kemampuan rendah tentu hanya
mampu mencapai threshold (ambang kategori) yang rendah pula, demikian pula
sebaliknya seperti dicontohkan pada kurva karakteristik item 11 pada Gambar 51.

penskoran parsial untuk penilai guru pamong/penguji UKIN yaitu item 11. Jika
dikaitkan dengan hasil kaliberasi item pada Tabel 36, dapat dijelaskan bahwa pada
dasarnya item 11 ini memiliki parameter lokasi sebesar 0,38 dengan parameter
259
threshold ᵟ1 sebesar -0,86, threshold ᵟ2 sebesar -0,02, threshold ᵟ3 sebesar 0,52,
serta threshold ᵟ4 sebesar 1,91. Secara grafis threshold ᵟi dapat diinterpretasikan
sebagai perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan
bahwa untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 11
maka diperlukan kemampuan (  ) sekitar -0,02 hingga 0,52 Pada bagian ini hanya
diberikan contoh untuk item 11. Kurva karakteristik untuk semua item pada
instrumen penilaian ini dapat diamati pada Lampiran 5 halaman 531. Lebih lanjut
karakteristik instrumen disajikan berdasarkan fungsi informasi sebagai berikut.

Gambar 53 menyajikan kurva fungsi informasi dari keseluruhan item pada
instrumen penilaian kompetensi sosial dan kompetensi kepribadian dengan
penskoran parsial untuk penilai guru pamong/penguji UKIN diperoleh nilai fungsi
informasi maksimum instrumen sebesar 13,46 pada skala kemampuan ( ) -0,6.
Jika dihubungkan dengan Standard Error of Measurement mengacu pada
pendapat Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19)
menyatakan bahwa nilai fungsi informasi (NIF) memiliki hubungan yang
260
besar nilai informasi maka SEM akan semakin kecil atau sebaliknya, sehingga
dapat dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 13,46,
maka koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,27 yang
menunjukkan nilai informasi lebih tinggi dibanding kesalahan pengukuran
sebagaimana disajikan pada Gambar 54 berikut.
KSKK Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN
Gambar 54 menunjukkan hubungan grafik nilai informasi dan kesalahan
pengukuran yaitu kedua grafik fungsi ini bertemu pada skala kemampuan -2,9 dan
1,8. Di antara dua kemampuan ini, instrumen memiliki nilai informasi yang lebih
diberikannya.
261
Kepribadian (KSKK) Penskoran Holistik untuk Penilai Dosen
(KSKK) penskoran holistik untuk penilai dosen dianalisis dengan menggunakan
pendekatan graded response modeling (GRM) dengan penskoran 1, 2, 3, dan 4.
Melalui Program R dengan latent trait model (ltm) package diperoleh hasil
analisis berupa karakteristik item sebagai berikut.

Pembelajaran Penskoran Holistik untuk Penilai Dosen
Item a b1 b2 b3
A1 1,06 -2,81 0,00 1,74
A2 1,52 -2,56 -0,06 1,52
A3 1,30 -2,56 0,00 1,30
A4 1,33 -2,67 0,02 1,33
A5 1,76 -2,16 -0,16 1,76
B6 1,97 -2,15 0,07 1,97
B7 1,76 -1,69 0,09 1,76
B8 2,21 -1,96 0,07 2,21
B9 1,56 -1,72 -0,02 1,56
B10 2,05 -1,72 -0,04 2,05
C11 1,33 -2,57 -0,12 1,33
C12 1,05 -2,89 -0,25 1,05
C13 1,43 -2,47 -0,08 1,43
C14 1,49 -2,49 -0,33 1,49
C15 1,21 -2,90 -0,15 1,21
D16 1,30 -2,44 -0,00 1,30
D17 1,17 -3,51 -0,32 1,17
D18 1,20 -3,08 -0,34 1,20
D19 1,27 -3,04 -0,10 1,27
D20 1,48 -2,65 -0,20 1,48
Berdasarkan data hasil analisis pada Tabel 37 diperoleh informasi bahwa
parameter ai setiap item bervariasi dari 1,06 hingga 2,21. Selain itu parameter bi
262
tinggi koefisien bi. Berikut ini disajikan salah satu contoh kurva karakteristik item
9 dari instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)
penskoran holistik untuk penilai dosen.

holistik untuk penilai dosen. Jika dikaitkan dengan hasil kaliberasi item pada
Tabel 37, dapat dijelaskan bahwa pada dasarnya item 9 ini memiliki parameter
daya beda ai sebesar 1,56 dengan parameter b1 sebesar -1,56, b2 sebesar -0,02,
serta b3 sebesar 1,56. Secara grafis bi atau tingkat kesulitan dapat diinterpretasikan
sebagai perpotongan kurva setiap kategori. Dari gambar tersebut dapat dijelaskan
bahwa untuk mencapai kategori 2 atau untuk memperoleh skor 2 pada item 9
maka diperlukan kemampuan (  ) sekitar -1,56 hingga -0,02. Secara lebih jelasnya
263
kurva karakteristik untuk semua item pada instrumen penilaian kompetensi sosial
dan kompetensi kepribadian (KSKK) dengan penskoran holistik untuk penilai
dosen dapat diamati pada Lampiran 5 halaman 535. Labih lanjut karakteristik
instrumen disajikan berdasarkan fungsi informasi sebagai berikut.
Gambar 56. Fungsi Informasi Instrumen KSKK Penskoran Holistik Penilai Dosen
pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)
dengan penskoran holistik untuk penilai dosen diperoleh nilai fungsi informasi
264
Kompetensi Sosial dan Kepribadian Penskoran Holistik Penilai
Dosen
Gambar 57 menunjukkan hubungan nilai informasi (NIF) dan kesalahan
instrumen ini memiliki kesalahan pengukuran lebih besar dibandingkan dengan
informasi diberikannya.
4) Karakteristik Instrumen Penilaian Kompetensi Sosial Kepribadian
(KSKK) Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN
penskoran holistik untuk penilai guru pamong/penguji UKIN dianalisis dengan
menggunakan pendekatan graded response modeling (GRM) dengan penskoran 1,
265
2, 3, dan 4. Melalui Program R dengan latent trait model (ltm) package diperoleh

Item a b1 b2 b3
A1 1,37 -2,08 -0,83 0,50
A2 1,42 -1,89 -0,74 0,84
A3 1,70 -1,53 -0,48 0,77
A4 1,71 -1,69 -0,65 0,54
A5 2,08 -1,59 -0,65 0,62
B6 1,93 -1,62 -0,66 0,59
B7 2,24 -1,38 -0,61 0,66
B8 1,96 -1,42 -0,54 0,67
B9 2,11 -1,50 -0,59 0,62
B10 2,24 -1,63 -0,48 0,80
C11 1,87 -1,53 -0,50 0,73
C12 1,74 -1,54 -0,55 0,64
C13 1,71 -1,77 -0,59 0,63
C14 1,54 -2,06 -0,96 0,49
C15 1,91 -1,65 -0,56 0,71
D16 1,79 -1,62 -0,73 0,56
D17 1,65 -1,71 -0,76 0,94
D18 1,86 -1,73 -0,64 0,70
D19 1,73 -1,48 -0,47 0,68
D20 1,88 -1,58 -0,77 0,57
pencapaian maka semakin tinggi koefisien bi. Berikut ini disajikan salah satu
266
contoh kurva karakteristik item 5 dari instrumen penilaian ini dengan penilai guru

Penskoran Holistik Penilai Guru pamong/penguji UKIN
penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) dengan
penskoran holistik untuk penilai guru pamong/penguji UKIN. Apabila
dihubungkan dengan hasil kaliberasi item pada Tabel 38, dapat dijelaskan bahwa
sekitar -1,59 hingga -0,65. Secara lebih jelasnya kurva karakteristik untuk semua
item pada instrumen penilaian kompetensi sosial dan kompetensi kepribadian
(KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN dapat
267
disajikan berdasarkan fungsi informasi sebagai berikut.
Gambar 59. Fungsi Informasi Instrumen KSKK Penskoran Holistik Penilai Guru
Pamong/Penguji UKIN
penskoran holistik untuk penilai guru pamong/penguji UKIN diperoleh nilai
fungsi informasi instrumen sebesar 10,72 pada skala kemampuan (  ) -0,3. Jika
dihubungkan dengan Standard Error of Measurement mengacu pada pendapat
Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19) menyatakan
bahwa nilai fungsi informasi (NIF) memiliki hubungan yang berbanding terbalik
dengan Standard Error of Measurement (SEM), semakin besar nilai informasi
maka SEM akan semakin kecil atau sebaliknya, maka dapat dijelaskan bahwa
dengan diketahuinya nilai fungsi informasi sebesar 10,72, maka koefisien
kesalahan pengukuran (SEM) diperoleh sebesar 0,30 yang menunjukkan nilai
informasi lebih tinggi dibanding kesalahan pengukuran sebagaimana disajikan
pada Gambar 60 berikut.
268
Kompetensi Sosial Kepribadian (KSKK) Penskoran Holistik Penilai
C. Revisi Produk
Pelaksanaan uji coba II dimaksudkan untuk memperoleh informasi dan
membuktikan kualitas model penilaian PPG secara empirik melalui hasil uji coba
lapangan II, seperti halnya yang telah dilakukan pada uji coba I. Kualitas secara
empirik yang dimaksud meliputi: validitas konstruk instrumen, Goodness of Fit
269
Model, karakteristik item dan tes berdasarkan politomus item response theory,
serta reliabilitas instrumen. Pada uji coba tahap II penggunaan subjek telah
diperluas yaitu sebanyak 516 peserta/mahasiswa PPG. Pembuktian model
penilaian PPG secara empirik pada uji coba II diuraikan sebagai berikut.
1. Pembuktian Validitas Konstruk Instrumen Uji Coba II
Pembuktian validitas konstruk pada uji coba II, seperti halnya pada uji
coba I, dilakukan melalui analisis faktor konfirmatori atau confirmatory factor
analysis (CFA). Pengujian CFA dilakukan untuk semua komponen penilaian
yaitu: instrumen penilaian rencana pelaksanaan pembelajaran (RPP), instrumen
penilaian pelaksanaan pembelajaran (PP), instrumen serta penilaian kompetensi
sosial dan kompetensi kepribadian (KSKK). Ketiga komponen instrumen terbagi
atas dua metode penskoran yaitu penskoran parsial dan penskoran holistik. Selain
itu, data penilaian dikelompokkan menjadi dua kelompok yaitu data hasil
penilaian oleh dosen dan data hasil penilaian oleh guru pamong/penguji UKIN.
Hasil analisis untuk pembuktian validitas konstruk pada uji coba II untuk model
penilaian PPG dikemukakan sebagai berikut.
a. Validitas Konstruk Instrumen Penilaian Rencana Pelaksanaan
Pembelajaran (RPP)
Instrumen penilaian rencana pelaksanaan pembelajaran (RPP) pada uji
coba II, sama halnya pada ujicoba I diukur melalui empat indikator dengan
sebaran item sebanyak 25 item. Keempat indkator tersebut adalah indkator
perumusan indikator pencapaian kompetensi dan capaian pembelajaran (PIPKC)
sebanyak 6 item (item 1-6), indikator pengorganisasian materi, metode, media dan
270
sumber belajar (PMMMS) sebanyak enam item (item 7-12), indikator
pengorganisasian proses, penilaian dan evaluasi pembelajaran (PPPEP) sebanyak
enam item (item 13-18), serta indikator penerapan prinsip techno pedagogical
content knowledge (PTPCK) sebanyak tujuh item (item19-25). Penyajian hasil
pembuktian validitas konstruk instrumen penilaian rencana pelaksanaan
pembelajaran (RPP) dikelompokkan berdasarkan dua kelompok data ditinjau dari
penskorannya, yaitu kelompok parsial dan kelompok holistik.
Parsial
Hasil pembuktian validitas konstruk konstruk instrumen penilaian rencana
pelaksanaan pembelajaran (RPP) pada kelompok penskoran parsial dibagi atas
dua kelompok data yaitu data dari hasil penilai dosen dan data dari hasil penilai
guru pamong/penguji UKIN. Berdasarkan hasil analisis faktor konfirmatori dari
instrumen penilaian rencana pelaksanaan pembelajaran (RPP) dengan penskoran
parsial untuk penilai dosen pada uji coba II, diperoleh informasi bahwa koefisien
Barlet dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet
271
kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua
rencana pelaksanaan pembelajaran (RPP) penskoran parsial untuk penilai dosen
telah valid secara konstruk.
Hal lain yang dapat dijelaskan dari analisis faktor konfirmatori tersebut
adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis diperoleh
informasi bahwa model konstruk yang dirancang telah memenuhi Goodness of Fit
Model. Hal ini ditunjukkan melalui koefisien p-value sebesar 0,052 yang melebih
cut-of value 0,05 serta koefisien RMSEA sebesar 0,017 yang lebih kecil dari cut-
of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan error antara item 4
dan item 15 serta item 11 dan item 19 yang dapat diamati pada Lampiran 6
halaman 542.
(RPP) penskoran parsial untuk penilai dosen, dilakukan pula pembuktian validitas
UKIN. Pada dasarnya instrumen yang digunakan adalah sama, begitu pula subjek
yang dinilai adalah orang yang sama, hanya penilainya saja yang berbeda yaitu
dosen dan guru pamong/penguji UKIN.
pamong/penguji UKIN uji coba tahap II, diperoleh informasi bahwa koefisien
Barlet dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian Barlet
272
(Retnawati, 2016: 47). Lebih lanjut sebanyak 25 item menunjukkan muatan faktor
masing-masing berdasarkan indikatornya. Dari 25 item tersebut menunjukkan
seluruh koefisien muatan faktor lebih dari 0,4. Jika hal tersebut dikonfirmasikan
dengan saran Retnawati (2016a: 64) yang menyatakan bahwa koefisien jalur
muatan faktor akan memiliki arti (meaningful) jika besarnya tidak kurang dari 0,4.
Dengan demikian, hasil analisis menunjukkan bahwa semua variabel observable
penilaian rencana pelaksanaan pembelajaran (RPP) penskoran parsial untuk
penilai guru pamong/penguji UKIN telah valid secara konstruk. Hal lain yang
dapat dijelaskan dari analisis faktor konfirmatori tersebut adalah pada aspek
Goodness of Fit Model. Berdasarkan hasil analisis diperoleh informasi bahwa
model konstruk yang dirancang telah memenuhi Goodness of Fit Model. Hal ini
ditunjukkan melalui koefisien p-value sebesar 0,13 yang melebih cut-of value 0,05
tersebut diperoleh setelah mengkorelasikan eror antara item 11 dan item 19 serta
item 16 dan item 22 yang dapat diamati pada Lampiran 6 halaman 548.
rencana pelaksanaan pembelajaran (RPP) dengan penskoran parsial yang
273
digunakan pada uji coba II telah valid secara konstruk. Begitu pula ke-25 item
Holistik
Hasil pembuktian validitas konstruk konstruk instrumen penilaian rencana
pelaksanaan pembelajaran (RPP) pada kelompok penskoran holistik, seperti
halnya pada penskoran parsial dibagi atas dua kelompok data yaitu data dari hasil
penilai dosen dan data dari hasil penilai guru pamong/penguji UKIN. Berdasarkan
hasil analisis faktor konfirmatori dari instrumen penilaian rencana pelaksanaan
pembelajaran (RPP) dengan penskoran holistik untuk penilai dosen uji coba II,
sebesar 0,9. Jika hasil pengujian Barlet menunjukkan nilai p yang lebih kecil dari
analisis faktor telah terpenuhi (Retnawati, 2016a: 47). Lebih lanjut sebanyak 25
item menunjukkan muatan faktor masing-masing berdasarkan indikatornya. Dari
25 item tersebut menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika
hal tersebut dikonfirmasikan dengan saran Retnawati (2016a: 64) yang
menyatakan bahwa koefisien jalur muatan faktor akan memiliki arti (meaningful)
jika besarnya tidak kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan
bahwa semua variabel observable memberikan sumbangan berarti untuk
mengukur variabel latennya. Hal tersebut bermakna bahwa ke-25 item pada
instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran holistik
untuk penilai dosen telah valid secara konstruk. Hal lain yang dapat dijelaskan
274
dari analisis faktor konfirmatori tersebut adalah pada aspek Goodness of Fit
Model. Berdasarkan hasil analisis diperoleh informasi bahwa model konstruk
yang dirancang telah memenuhi Goodness of Fit Model. Hal ini ditunjukkan
melalui koefisien p-value sebesar 0,19 yang melebih cut-of value 0,05 serta
koefisien RMSEA sebesar 0,012 yang lebih kecil dari cut-of value 0,08. Hal
tersebut diperoleh setelah mengkorelasikan eror antara item 12 dan item 18 serta
(RPP) penskoran holistik untuk penilai dosen, dilakukan pula pembuktian
validitas konstruk dengan menggunakan kelompok data dari penilai guru
pamong/penguji UKIN. Pada dasarnya instrumen yang digunakan adalah sama,
begitu pula subjek yang dinilai adalah orang yang sama, hanya penilainya saja
yang berbeda yaitu dosen dan guru pamong/penguji UKIN.
rencana pelaksanaan pembelajaran (RPP) penskoran holistik untuk penilai guru
pamong/penguji UKIN uji coba II, diperoleh informasi bahwa koefisien Barlet
dikonfirmasikan dengan saran Retnawati (2016b: 64) yang menyatakan bahwa
275
latennya. Hal tersebut bermakna sama seperti analisis sebelumnya bahwa ke-25
item pada instrumen penilaian rencana pelaksanaan pembelajaran (RPP)
penskoran holistik untuk penilai guru pamong/penguji UKIN telah valid secara
konstruk. Hal lain yang dapat dijelaskan dari analisis faktor konfirmatori tersebut
adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis diperoleh
informasi bahwa model konstruk yang dirancang telah memenuhi Goodness of Fit
Model. Hal ini ditunjukkan melalui koefisien p-value sebesar 0,19 yang melebih
cut-of value 0,05 serta koefisien RMSEA sebesar 0,012 yang lebih kecil dari cut-
of value 0,08. Hal tersebut diperoleh setelah mengkorelasikan error antara item 4
dan item 15 serta item 16 dan item 22 yang dapat diamati pada Lampiran 6
halaman 551.
rencana pelaksanaan pembelajaran (RPP) dengan penskoran holistik yang
digunakan pada uji coba II telah valid secara konstruk. Begitu pula ke-25 item
b. Validitas Konstruk Instrumen Pelaksanaan pembelajaran (PP)
Instrumen penilaian pelaksanaan pembelajaran (PP) pada uji coba II
diukur melalui empat indikator dengan sebaran item sebanyak 20 item. Keempat
276
indkator tersebut adalah melaksanakan pembelajaran yang mendidik (MPMD),
melaksanakan pembelajaran yang mencerdaskan (MPMC), memfasilitasi
pengembangan potensi diri dan karakter peserta didik (MPDK), serta menilai dan
mengevaluasi pembelajaran (MDMP). Seperti halnya pembuktian validitas
konstruk pada instrumen penilaian RPP, penyajian hasil pembuktian validitas
konstruk instrumen penilaian pelaksanaan pembelajaran (PP) dikelompokkan
berdasarkan dua kelompok data ditinjau dari penskorannya, yaitu kelompok
parsial dan kelompok holistik.
(PP) dengan Penskoran Parsial
Hasil pembuktian validitas konstruk instrumen penilaian pelaksanaan
pembelajaran (PP) pada uji coba II untuk kelompok penskoran parsial dibagi atas
dua kelompok data yaitu data dari hasil penilai dosen dan data dari hasil penilai
guru pamong/penguji UKIN. Berdasarkan hasil analisis faktor konfirmatori dari
instrumen penilaian pelaksanaan pembelajaran (PP) dengan penskoran parsial
untuk penilai dosen uji coba II, diperoleh informasi bahwa koefisien Barlet
277
pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai dosen telah valid
secara konstruk. Hal lain yang dapat dijelaskan dari analisis faktor konfirmatori
tersebut adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis
eror antara item 8 dan item 15 yang dapat diamati pada Lampiran 6 halaman 543.
penskoran parsial untuk penilai dosen, dilakukan pula pembuktian validitas
UKIN. Pada dasarnya instrumen yang digunakan adalah sama, begitu pula subjek
dosen dan guru pamong/penguji UKIN. Berdasarkan hasil analisis faktor
konfirmatori dari instrumen penilaian pelaksanaan pembelajaran (PP) penskoran
parsial untuk penilai guru pamong/penguji UKIN uji coba II, diperoleh informasi
bahwa koefisien Barlet dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil
pengujian Barlet menunjukkan nilai p yang lebih kecil dari 0,01 serta koefisien
KMO yang lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah
278
terpenuhi (Retnawati, 2016a: 47). Lebih lanjut sebanyak 20 item menunjukkan
item pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial
untuk penilai guru pamong/penguji UKIN telah valid secara konstruk. Hal lain
yang dapat dijelaskan dari analisis faktor konfirmatori tersebut adalah pada aspek
tersebut diperoleh setelah mengkorelasikan error antara item 6 dan item 10 serta
pelaksanaan pembelajaran (PP) dengan penskoran parsial yang digunakan pada uji
coba II telah valid secara konstruk. Begitu pula ke-20 item instrumen tersebut
279
(PP) dengan Penskoran Holistik
instrumen penilaian pelaksanaan pembelajaran (PP) pada uji coba II untuk
kelompok penskoran holistik dibagi atas dua kelompok data yaitu data dari hasil
penilai dosen dan data dari hasil penilai guru pamong/penguji UKIN. Berdasarkan
hasil analisis faktor konfirmatori dari instrumen penilaian pelaksanaan
pembelajaran (PP) dengan penskoran holistik untuk penilai dosen pada uji coba II,
diperoleh informasi bahwa sebanyak koefisien Barlet dengan nilai p 0,000 serta
untuk analisis faktor telah terpenuhi (Retnawati, 2016a: 47). Lebih lanjut 20 item
menunjukkan muatan faktor masing-masing berdasarkan indikatornya. Dari 20
item tersebut menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal
tersebut dikonfirmasikan dengan saran Retnawati (2017: 64) yang menyatakan
bahwa koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya
tidak kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua
pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen telah valid
secara konstruk. Hal lain yang dapat dijelaskan dari analisis faktor konfirmatori
tersebut adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis
280
error antara item 1 dan item 20 serta item 13 dan item 16 yang dapat diamati pada
penskoran holistik untuk penilai dosen, dilakukan pula pembuktian validitas
UKIN. Pada dasarnya instrumen yang digunakan juga sama, begitu pula subjek
dosen dan guru pamong/penguji UKIN. Berdasarkan hasil analisis faktor
konfirmatori dari instrumen penilaian pelaksanaan pembelajaran (PP) penskoran
holistik untuk penilai guru pamong/penguji UKIN pada uji coba II, diperoleh
informasi bahwa koefisien Barlet dengan nilai p 0,000 serta KMO sebesar 0,9.
Jika hasil pengujian Barlet menunjukkan nilai p yang lebih kecil dari 0,01 serta
koefisien KMO yang lebih dari 0,05 maka kecukupan sampel untuk analisis faktor
telah terpenuhi (Retnawati, 2016a: 47). Lebih lanjut sebanyak 20 item
menunjukkan muatan faktor masing-masing berdasarkan indikatornya. Dari 20
item tersebut menunjukkan seluruh koefisien muatan faktor lebih dari 0,4. Jika hal
tersebut dikonfirmasikan dengan saran Retnawati (2017: 64) yang menyatakan
bahwa koefisien jalur muatan faktor akan memiliki arti (meaningful) jika besarnya
tidak kurang dari 0,4. Dengan demikian, hasil analisis menunjukkan bahwa semua
281
item pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik
untuk penilai guru pamong/penguji UKIN telah valid secara konstruk. Hal lain
yang dapat dijelaskan dari analisis faktor konfirmatori tersebut adalah pada aspek
tersebut diperoleh setelah mengkorelasikan error antara item 8 dan item 15 serta
pelaksanaan pembelajaran (PP) dengan penskoran holistik yang digunakan pada
uji coba II telah valid secara konstruk. Begitu pula ke-20 item instrumen tersebut
c. Validitas Konstruk Instrumen Kompetensi Sosial dan Kompetensi
Kepribadian (KSKK)
Pada uji coba II, instrumen penilaian kompetensi sosial dan kompetensi
kepribadian (KSKK) diukur melalui empat indikator dengan sebaran item
sebanyak 20 item. Keempat indkator tersebut adalah bekerjasama dan memiliki
jiwa kepemimpinan (BMJK), bersikap inklusif, toleran dan peduli (BITP),
berkomunikasi dengan sesama (BKDS), bersikap sopan/ santun, mandiri, kreatif
282
dan disiplin (BSMKD). Seperti halnya pembuktian validitas konstruk pada
instrumen penilaian RPP dan pelaksanaan pembelajaran, penyajian hasil
pembuktian validitas konstruk instrumen penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK) dikelompokkan berdasarkan dua kelompok data
ditinjau dari penskorannya, yaitu kelompok parsial dan kelompok holistik.
1) Validitas Konstruk Pada Instrumen Penilaian Kompetensi Sosial dan
Kompetensi Kepribadian (KSKK) dengan Penskoran Parsial
Hasil pembuktian validitas konstruk instrumen penilaian kompetensi
sosial dan kompetensi kepribadian (KSKK) pada uji coba II untuk kelompok
penskoran parsial dibagi atas dua kelompok data yaitu data dari hasil penilai
dosen dan data dari hasil penilai guru pamong/penguji UKIN. Berdasarkan hasil
analisis faktor konfirmatori dari instrumen penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK) dengan penskoran parsial untuk penilai dosen uji
coba II, diperoleh informasi bahwa koefisien Barlet dengan nilai p 0,000 serta
untuk analisis faktor telah terpenuhi (Retnawati, 2016a: 47). Lebih lanjut
sebanyak 20 item menunjukkan muatan faktor masing-masing berdasarkan
indikatornya. Dari 20 item tersebut menunjukkan seluruh koefisien muatan faktor
lebih dari 0,4. Jika hal tersebut dikonfirmasikan dengan saran Retnawati (2016a:
64) yang menyatakan bahwa koefisien jalur muatan faktor akan memiliki arti
(meaningful) jika besarnya tidak kurang dari 0,4. Dengan demikian, hasil analisis
menunjukkan bahwa semua variabel observable memberikan sumbangan berarti
283
untuk mengukur variabel latennya. Hal tersebut bermakna bahwa ke-20 item pada
penskoran parsial untuk penilai dosen telah valid secara konstruk. Hal lain yang
dapat dijelaskan dari hasil analisis faktor konfirmatori adalah pada aspek
ditunjukkan melalui koefisien p-value sebesar 0,056 yang melebih cut-of value
Hal tersebut diperoleh setelah mengkorelasikan error antara item 4 dan item 8
serta item 4 dan item 18 yang dapat diamati pada Lampiran 6 halaman 544.
Selain data dari instrumen penilaian kompetensi sosial dan kompetensi
kepribadian (KSKK) penskoran parsial untuk penilai dosen, dilakukan pula
pembuktian validitas konstruk dengan menggunakan kelompok data dari penilai
guru pamong/penguji UKIN. Pada dasarnya instrumen yang digunakan adalah
sama, begitu pula subjek yang dinilai adalah orang yang sama, hanya penilainya
saja yang berbeda yaitu dosen dan guru pamong/penguji UKIN.
penilai guru pamong/penguji UKIN pada uji coba II, diperoleh informasi bahwa
koefisien Barlet dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian
lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi
284
(KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN telah valid
secara konstruk. Hal lain yang dapat dijelaskan dari hasil analisis faktor
konfirmatori adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis
eror antara item 8 dan item 11 yang dapat diamati pada Lampiran 6 halaman 552.
yang digunakan pada uji coba II telah valid secara konstruk. Begitu pula ke-20
285
2) Validitas Konstruk Pada Instrumen Kompetensi Sosial dan Kompetensi
Kepribadian (KSKK) dengan Penskoran Holistik
instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK) pada
uji coba II untuk kelompok penskoran holistik dibagi atas dua kelompok data
yaitu data dari hasil penilai dosen dan data dari hasil penilai guru pamong/penguji
UKIN. Berdasarkan hasil analisis faktor konfirmatori dari instrumen penilaian
untuk penilai dosen pada uji coba II, diperoleh informasi bahwa koefisien Barlet
penilai dosen telah valid secara konstruk. Hal lain yang dapat dijelaskan dari hasil
analisis faktor konfirmatori adalah pada aspek Goodness of Fit Model.
286
Berdasarkan hasil analisis diperoleh informasi bahwa model konstruk yang
dirancang telah memenuhi Goodness of Fit Model. Hal ini ditunjukkan melalui
diperoleh setelah mengkorelasikan eror antara item 4 dan item 8, serta item 5 dan
item 12 yang dapat diamati pada Lampiran 6 halaman 547.
penskoran holistik untuk penilai dosen, dilakukan pula pembuktian validitas
UKIN. Pada dasarnya instrumen yang digunakan juga sama, begitu pula subjek
dosen dan guru pamong/penguji UKIN.
penilai guru pamong/penguji UKIN pada uji coba II, diperoleh informasi bahwa
koefisien Barlet dengan nilai p 0,000 serta KMO sebesar 0,9. Jika hasil pengujian
lebih dari 0,05 maka kecukupan sampel untuk analisis faktor telah terpenuhi
dikonfirmasikan dengan saran Retnawati (2016b: 64) yang menyatakan bahwa
287
(KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN telah valid
secara konstruk. Hal lain yang dapat dijelaskan dari hasil analisis faktor
konfirmatori adalah pada aspek Goodness of Fit Model. Berdasarkan hasil analisis
error antara item 4 dan item 8 yang dapat diamati pada Lampiran 6 halaman 553.
yang digunakan pada uji coba II telah valid secara konstruk. Begitu pula ke-20
2. Reliabilitas Instrumen
Selain hasil pembuktian validitas konstruk melalui analisis faktor
konfirmatori dan karakteristik item instrumen berdasarkan politomus item
response theory, pada uji coba II ini juga dilakukan pembuktian reliabilitas
288
instrumen. Pembuktian reliabilitas instrumen tersebut dilakukan untuk melihat
keajegan instrumen model penilaian PPG yang telah dikembangkan berdasarkan
hasil pengukuran pada uji coba II. Pembuktian reliabilitas pada uji coba II juga
dilakukan untuk semua komponen instrumen yang telah dikembangkan yaitu:
instrumen penilaian rencana pelaksanaan pembelajaran (RPP), instrumen
penilaian pelaksanaan pembelajaran (PP), serta instrumen penilaian kompetensi
sosial dan kompetensi kepribadian (KSKK). Pembuktian reliabilitas instrumen
untuk semua komponen instrumen yang dimaksud diuraikan sebagai berikut.
a. Reliabilitas Instrumen Penilaian RPP
Reliabilitas instrumen penilaian RPP dibagi menjadi empat kelompok data,
seperti pada validitas dan karakteristik instrumen. Data pertama adalah instrumen
penilaian RPP dengan penskoran parsial untuk penilai dosen. Data kedua adalah
instrumen penilaian RPP dengan penskoran parsial untuk penilai guru
pamong/penguji UKIN. Data ketiga adalah instrumen penilaian RPP dengan
penskoran holistik untuk penilai dosen, dan data keempat adalah instrumen
penilaian RPP dengan penskoran holistik untuk penilai guru pamong/penguji
UKIN. Uraian keempat kelompok data tersebut dikemukakan sebagai berikut.
1) Reliabilitas Instrumen Penilaian RPP Penskoran Parsial Penilai Dosen
penskoran parsial untuk penilai dosen pada uji coba II dianalisis dengan
menggunakan pendekatan reliabilitas  dengan menggunakan koefisien muatan
faktor untuk semua variabel observasi terhadap variabel latennya. Berikut ini
289
disajikan hasil analisis reliabilitas instrumen penilaian RPP penskoran parsial
untuk penilai dosen sebagaimana terlampir pada Lampiran 7 halaman 554.
Tabel 39. Muatan Faktor Variabel Observasi pada Instrumen Penilaian RPP
Penskoran Parsial untuk Penilai Dosen pada Uji Coba II
Item i i 2 1  i
2
A1 0,61 0,3721 0,6279

A2 0,66 0,4356 0,5644
A3 0,53 0,2809 0,7191
A4 0,62 0,3844 0,6156
A5 0,58 0,3364 0,6636
A6 0,65 0,4225 0,5775
B7 0,56 0,3136 0,6864
B8 0,54 0,2916 0,7084
B9 0,56 0,3136 0,6864
B10 0,54 0,2916 0,7084
B11 0,58 0,3364 0,6636
B12 0,49 0,2401 0,7599
C13 0,59 0,3481 0,6519
C14 0,57 0,3249 0,6751
C15 0,57 0,3249 0,6751
C16 0,61 0,3721 0,6279
C17 0,57 0,3249 0,6751
C18 0,58 0,3364 0,6636
D19 0,53 0,2809 0,7191
D20 0,53 0,2809 0,7191
D21 0,58 0,3364 0,6636
D22 0,50 0,2500 0,7500
D23 0,52 0,2704 0,7296
D24 0,52 0,2704 0,7296
D25 0,54 0,2916 0,7084
∑ 14,13 16,9693
atau item instrumen penilaian RPP penskoran parsial untuk penilai dosen pada uji
coba II. Berdasarkan tabel tersebut diperoleh informasi koefisien muatan faktor
i
serta koefisien muatan faktor yang dikuadratkan, diketahui 
i 1
i sebesar 14,13,
290
i
1  
2
serta i sebasar 16,96. Berdasarkan hasil perhitungan reliabilitas diperoleh
i 1
koefisien omega (  ) yang menunjukkan koefisien reliabilitas instrumen sebesar
disimpulkan bahwa instrumen penilaian RPP penskoran parsial untuk penilai
dosen pada uji coba II reliabel.
2) Reliabilitas Instrumen Penilaian RPP Penskoran Parsial untuk Penilai
penskoran parsial untuk penilai guru pamong/penguji UKIN pada uji coba II
dianalisis menggunakan pendekatan reliabilitas  dengan koefisien muatan faktor
untuk semua variabel observasi terhadap variabel latennya. Berikut ini disajikan
hasil analisis reliabilitas instrumen penilaian rencana pelaksanaan pembelajaran
(RPP) penskoran parsial untuk penilai guru pamong/penguji UKIN sebagaimana
291
RPP Penskoran Parsial Penilai Guru pamong/penguji UKIN Uji
Coba II
Item i i 2 1  i
2
A1 0,69 0,4761 0,5239

A2 0,71 0,5041 0,4959
A3 0,61 0,3721 0,6279
A4 0,72 0,5184 0,4816
A5 0,67 0,4489 0,5511
A6 0,72 0,5184 0,4816
B7 0,64 0,4096 0,5904
B8 0,62 0,3844 0,6156
B9 0,62 0,3844 0,6156
B10 0,61 0,3721 0,6279
B11 0,63 0,3969 0,6031
B12 0,58 0,3364 0,6636
C13 0,65 0,4225 0,5775
C14 0,64 0,4096 0,5904
C15 0,64 0,4096 0,5904
C16 0,68 0,4624 0,5376
C17 0,64 0,4096 0,5904
C18 0,65 0,4225 0,5775
D19 0,62 0,3844 0,6156
D20 0,62 0,3844 0,6156
D21 0,65 0,4225 0,5775
D22 0,6 0,36 0,64
D23 0,61 0,3721 0,6279
D24 0,63 0,3969 0,6031
D25 0,64 0,4096 0,5904
∑ 16,09 14,6121
atau item instrumen penilaian RPP penskoran parsial untuk penilai guru
pamong/penguji UKIN pada uji coba II, berdasarkan hasil perhitungan reliabilitas
diperoleh koefisien omega (  ) yang menunjukkan koefisien reliabilitas instrumen
sebesar 0,94. Jika didasari pada kriteria minimal koefisien reliabilitas sebesar 0,85
yang disarankan oleh Mehrens and Lehmann (1973) dan Retnawati (2016a: 87)
292
dapat disimpulkan bahwa instrumen penilaian RPP penskoran parsial untuk
penilai guru pamong/penguji UKIN pada uji coba II reliabel.
3) Reliabilitas Instrumen Penilaian RPP Penskoran Holistik Penilai Dosen
pembelajaran (RPP) penskoran holistik untuk penilai dosen pada uji coba II
sebagaimana terlampir pada Lampiran 7 halaman 557 disajikan pada Tabel 41.
Penskoran Holistik untuk Penilai Dosen pada Uji Coba II
Item i i 2 1  i
2
A1 0,67 0,4489 0,5511

A2 0,72 0,5184 0,4816
A3 0,61 0,3721 0,6279
A4 0,72 0,5184 0,4816
A5 0,67 0,4489 0,5511
A6 0,72 0,5184 0,4816
B7 0,62 0,3844 0,6156
B8 0,62 0,3844 0,6156
B9 0,62 0,3844 0,6156
B10 0,63 0,3969 0,6031
B11 0,65 0,4225 0,5775
B12 0,60 0,3600 0,6400
C13 0,65 0,4225 0,5775
C14 0,63 0,3969 0,6031
C15 0,63 0,3969 0,6031
C16 0,67 0,4489 0,5511
C17 0,63 0,3969 0,6031
C18 0,65 0,4225 0,5775
D19 0,60 0,3600 0,6400
D20 0,63 0,3969 0,6031
D21 0,66 0,4356 0,5644
D22 0,63 0,3969 0,6031
D23 0,63 0,3969 0,6031
D24 0,67 0,4489 0,5511
D25 0,67 0,4489 0,5511
∑ 16,2 14,4736
293
atau item instrumen penilaian RPP penskoran holistik untuk penilai dosen pada uji
i i
 i sebesar 16,2, serta 1  

2
coba II, diketahui i sebasar 14,47. Berdasarkan
i 1 i 1
hasil perhitungan reliabilitas diperoleh koefisien omega (  ) yang menunjukkan
koefisien reliabilitas instrumen sebesar 0,94. Jika didasari pada kriteria minimal
RPP penskoran holistik untuk penilai dosen pada uji coba II telah reliabel.
4) Reliabilitas Instrumen Penilaian RPP Penskoran Holistik untuk Penilai
pembelajaran (RPP) penskoran holistik untuk penilai guru pamong/penguji UKIN
pada uji coba II dianalisis menggunakan pendekatan Reliabilitas  dengan
latennya disajikan pada Tabel 42.
294
Penskoran Holistik Penilai Guru pamong/penguji UKIN pada Uji
Coba II
Item i i 2 1  i
2
A1 0,67 0,4489 0,5511

A2 0,72 0,5184 0,4816
A3 0,61 0,3721 0,6279
A4 0,72 0,5184 0,4816
A5 0,67 0,4489 0,5511
A6 0,71 0,5041 0,4959
B7 0,62 0,3844 0,6156
B8 0,61 0,3721 0,6279
B9 0,61 0,3721 0,6279
B10 0,60 0,3600 0,6400
B11 0,62 0,3844 0,6156
B12 0,56 0,3136 0,6864
C13 0,64 0,4096 0,5904
C14 0,63 0,3969 0,6031
C15 0,63 0,3969 0,6031
C16 0,67 0,4489 0,5511
C17 0,63 0,3969 0,6031
C18 0,65 0,4225 0,5775
D19 0,61 0,3721 0,6279
D20 0,61 0,3721 0,6279
D21 0,64 0,4096 0,5904
D22 0,60 0,3600 0,6400
D23 0,59 0,3481 0,6519
D24 0,63 0,3969 0,6031
D25 0,63 0,3969 0,6031
∑ 15,88 14,8752
atau item instrumen penilaian RPP penskoran holistik untuk penilai guru
i
pamong/penguji UKIN pada uji coba II, diketahui 
i 1
i sebesar 15,88, serta
1  
2
i sebasar 14,87. Berdasarkan hasil perhitungan reliabilitas diperoleh
i 1
295
disimpulkan bahwa instrumen penilaian RPP penskoran holistik untuk penilai
guru pamong/penguji UKIN pada uji coba II telah reliabel.
b. Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
Reliabilitas instrumen penilaian pelaksanaan pembelajaran (PP) juga
dibagi menjadi empat kelompok data. Data pertama adalah instrumen penilaian
pelaksanaan pembelajaran dengan penskoran parsial untuk penilai dosen. Data
kedua adalah instrumen penilaian pelaksanaan pembelajaran dengan penskoran
parsial untuk penilai guru pamong/penguji UKIN. Data ketiga adalah instrumen
penilaian pelaksanaan pembelajaran dengan penskoran holistik untuk penilai
dosen, dan data keempat adalah instrumen penilaian pelaksanaan pembelajaran
dengan penskoran holistik untuk penilai guru pamong/penguji UKIN. Uraian dari
keempat kelompok data tersebut dikemukakan sebagai berikut.
a) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
parsial untuk penilai dosen pada uji coba II dianalisis menggunakan pendekatan
reliabilitas  dengan koefisien muatan faktor untuk semua variabel observasi
terhadap variabel latennya. Berikut ini disajikan hasil analisis reliabilitas
instrumen tersebut pada Tabel 58.
296
Pelaksanaan Pembelajaran Penskoran Parsial Penilai Dosen Uji
Coba II
Item i i 2 1  i
2
A1 0,69 0,4761 0,5239

A2 0,73 0,5329 0,4671
A3 0,73 0,5329 0,4671
A4 0,73 0,5329 0,4671
B5 0,72 0,5184 0,4816
B6 0,73 0,5329 0,4671
B7 0,74 0,5476 0,4524
B8 0,74 0,5476 0,4524
B9 0,68 0,4624 0,5376
B10 0,76 0,5776 0,4224
B11 0,73 0,5329 0,4671
C12 0,79 0,6241 0,3759
C13 0,75 0,5625 0,4375
C14 0,72 0,5184 0,4816
C15 0,72 0,5184 0,4816
D16 0,76 0,5776 0,4224
D17 0,75 0,5625 0,4375
D18 0,7 0,49 0,51
D19 0,75 0,5625 0,4375
D20 0,64 0,4096 0,5904
∑ 14,56 9,3802
atau item instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial
i
untuk penilai dosen pada uji coba II, diketahui 
i 1
1  
2
i 1
297
disimpulkan bahwa instrumen penilaian pelaksanaan pembelajaran penskoran
parsial untuk penilai dosen pada uji coba II telah reliabel.
b) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
Pada uji coba II, reliabilitas instrumen penilaian pelaksanaan pembelajaran
(PP) penskoran parsial untuk penilai guru pamong/penguji UKIN dianalisis
menggunakan pendekatan reliabilitas  dengan koefisien muatan faktor untuk
semua variabel observasi terhadap variabel latennya. Berikut ini disajikan hasil
analisis reliabilitas instrumen penilaian tersebut.

Pelaksanaan Pembelajaran (PP) Penskoran Parsial Penilai Guru
pamong/penguji UKIN pada Uji Coba II
Item i i 2 1  i
2
A1 0,73 0,5329 0,4671

A2 0,73 0,5329 0,4671
A3 0,68 0,4624 0,5376
A4 0,74 0,5476 0,4524
B5 0,69 0,4761 0,5239
B6 0,75 0,5625 0,4375
B7 0,75 0,5625 0,4375
B8 0,76 0,5776 0,4224
B9 0,73 0,5329 0,4671
B10 0,76 0,5776 0,4224
B11 0,72 0,5184 0,4816
C12 0,77 0,5929 0,4071
C13 0,74 0,5476 0,4524
C14 0,73 0,5329 0,4671
C15 0,72 0,5184 0,4816
D16 0,77 0,5929 0,4071
D17 0,78 0,6084 0,3916
D18 0,70 0,4900 0,5100
D19 0,73 0,5329 0,4671
D20 0,69 0,4761 0,5239
∑ 14,67 9,2245
298
atau item instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial
i
untuk penilai guru pamong/penguji UKIN pada uji coba II, diketahui 
i 1
i
1  
2
sebesar 14,67, serta i sebasar 9,22. Berdasarkan hasil perhitungan
i 1
reliabilitas diperoleh koefisien omega (  ) yang menunjukkan koefisien
reliabilitas instrumen sebesar 0,95. Jika didasari pada kriteria minimal koefisien
reliabilitas sebesar 0,85 yang disarankan oleh Mehrens and Lehmann (1973) dan
Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian pelaksanaan
pembelajaran (PP) penskoran parsial untuk penilai guru pamong/penguji UKIN
pada uji coba II reliabel.
c) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
holistik untuk penilai dosen pada uji coba II dianalisis menggunakan pendekatan
reliabilitas  dengan koefisien muatan faktor untuk semua variabel observasi
terhadap variabel latennya. Berikut ini disajikan hasil analisis reliabilitas
penilai dosen sebagaimana terlampir pada Lampiran 7 halaman 558.
299
Pelaksanaan Pembelajaran Penskoran Holistik Penilai Dosen Uji
Coba II
Item i i 2 1  i
2
A1 0,73 0,5329 0,4671

A2 0,73 0,5329 0,4671
A3 0,71 0,5041 0,4959
A4 0,71 0,5041 0,4959
B5 0,72 0,5184 0,4816
B6 0,74 0,5476 0,4524
B7 0,74 0,5476 0,4524
B8 0,74 0,5476 0,4524
B9 0,70 0,4900 0,5100
B10 0,75 0,5625 0,4375
B11 0,73 0,5329 0,4671
C12 0,78 0,6084 0,3916
C13 0,75 0,5625 0,4375
C14 0,72 0,5184 0,4816
C15 0,72 0,5184 0,4816
D16 0,75 0,5625 0,4375
D17 0,76 0,5776 0,4224
D18 0,69 0,4761 0,5239
D19 0,73 0,5329 0,4671
D20 0,69 0,4761 0,5239
∑ 14,59 9,3465
atau item instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik
i
untuk penilai dosen pada uji coba II, diketahui 
i 1
1  
2
i 1
300
penskoran holistik untuk penilai dosen pada uji coba II telah reliabel.
d) Reliabilitas Instrumen Penilaian Pelaksanaan Pembelajaran Penskoran
Holistik Penilai Guru pamong/penguji UKIN
holistik untuk penilai guru pamong/penguji UKIN pada uji coba II dianalisis
menggunakan pendekatan reliabilitas  sebagaimana terlampir pada Lampiran 7
halaman 564 dan disajikan pada Tabel 46.

Pelaksanaan Pembelajaran Penskoran Holistik Penilai Guru
Pamong/penguji UKIN Uji Coba II
Item i i 2 1  i
2
A1 0,73 0,5329 0,4671

A2 0,74 0,5476 0,4524
A3 0,72 0,5184 0,4816
A4 0,73 0,5329 0,4671
B5 0,73 0,5329 0,4671
B6 0,74 0,5476 0,4524
B7 0,75 0,5625 0,4375
B8 0,75 0,5625 0,4375
B9 0,72 0,5184 0,4816
B10 0,74 0,5476 0,4524
B11 0,72 0,5184 0,4816
C12 0,79 0,6241 0,3759
C13 0,74 0,5476 0,4524
C14 0,72 0,5184 0,4816
C15 0,72 0,5184 0,4816
D16 0,76 0,5776 0,4224
D17 0,77 0,5929 0,4071
D18 0,69 0,4761 0,5239
D19 0,73 0,5329 0,4671
D20 0,70 0,4900 0,5100
∑ 14,69 9,2003
301
atau item instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik
i
untuk penilai guru pamong/penguji UKIN, diketahui 
i 1
1  
2
i 1
penskoran holistik untuk penilai guru pamong/penguji UKIN pada uji coba II
telah reliabel.
c. Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian
Seperti halnya pada reliabilitas instrumen penilaian RPP dan pelaksanaan
pemblajaran (PP), pada uji coba II reliabilitas instrumen penilaian penilaian
kompetensi sosial dan kompetensi kepribadian (KSKK) dibagi menjadi empat
kelompok data. Data pertama adalah instrumen penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK) dengan penskoran parsial untuk penilai dosen.
Data kedua adalah instrumen penilaian kompetensi sosial dan kompetensi
kepribadian (KSKK) dengan penskoran parsial untuk penilai guru
pamong/penguji UKIN. Data ketiga adalah instrumen penilaian kompetensi sosial
dan kompetensi kepribadian (KSKK) dengan penskoran holistik untuk penilai
302
dosen, dan data keempat adalah instrumen penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK) dengan penskoran holistik untuk penilai guru
pamong/penguji UKIN dengan deskripsi sebagai berikut.
a) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian Penskoran Parsial untuk Penilai Dosen
Pada uji coba II, reliabilitas instrumen penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK) penskoran parsial untuk penilai dosen dianalisis
menggunakan pendekatan reliabilitas  sebagaimana terlampir pada Lampiran 7
halaman 556 disajikan pada Tabel 47 berikut.

Parsial Penilai Dosen pada Uji Coba II
Item i i 2 1  i
2
A1 0,72 0,5184 0,4816

A2 0,71 0,5041 0,4959
A3 0,73 0,5329 0,4671
A4 0,70 0,4900 0,5100
A5 0,71 0,5041 0,4959
B6 0,73 0,5329 0,4671
B7 0,74 0,5476 0,4524
B8 0,71 0,5041 0,4959
B9 0,72 0,5184 0,4816
B10 0,75 0,5625 0,4375
C11 0,71 0,5041 0,4959
C12 0,72 0,5184 0,4816
C13 0,71 0,5041 0,4959
C14 0,66 0,4356 0,5644
C15 0,73 0,5329 0,4671
D16 0,75 0,5625 0,4375
D17 0,72 0,5184 0,4816
D18 0,70 0,4900 0,5100
D19 0,76 0,5776 0,4224
D20 0,74 0,5476 0,4524
∑ 14,42 9,5938
303
atau item instrumen penilaian kompetensi sosial dan kompetensi kepribadian
i
(KSKK) penskoran parsial untuk penilai dosen pada uji coba II, diketahui 
i 1
i
1  
2
i 1
Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian kompetensi
sosial dan kompetensi kepribadian (KSKK) penskoran parsial untuk penilai dosen
pada uji coba II telah reliabel.
b) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Reliabilitas instrumen penilaian kompetensi sosial dan kompetensi
kepribadian (KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN
pada uji coba II dianalisis menggunakan pendekatan Reliabilitas  sebagaimana
terlampir pada Lampiran 7 halaman 562 disajikan pada Tabel 48.
304
Parsial Penilai Guru pamong/penguji UKIN
Item i i 2 1  i
2
A1 0,72 0,5184 0,4816

A2 0,72 0,5184 0,4816
A3 0,71 0,5041 0,4959
A4 0,71 0,5041 0,4959
A5 0,72 0,5184 0,4816
B6 0,72 0,5184 0,4816
B7 0,74 0,5476 0,4524
B8 0,71 0,5041 0,4959
B9 0,73 0,5329 0,4671
B10 0,75 0,5625 0,4375
C11 0,71 0,5041 0,4959
C12 0,70 0,4900 0,5100
C13 0,67 0,4489 0,5511
C14 0,66 0,4356 0,5644
C15 0,72 0,5184 0,4816
D16 0,75 0,5625 0,4375
D17 0,72 0,5184 0,4816
D18 0,70 0,4900 0,5100
D19 0,79 0,6241 0,3759
D20 0,74 0,5476 0,4524
∑ 14,39 9,6315
atau item instrumen penilaian penilaian kompetensi sosial dan kompetensi
i i
 1  
2
pada uji coba II, diketahui i sebesar 14,39, serta i sebesar 9,63.
i 1 i 1
Berdasarkan hasil perhitungan reliabilitas diperoleh koefisien omega (  ) yang
menunjukkan koefisien reliabilitas instrumen sebesar 0,95. Jika didasari pada
kriteria minimal koefisien reliabilitas sebesar 0,85 yang disarankan oleh Mehrens
and Lehmann (1973) dan Retnawati (2016a: 87) dapat disimpulkan bahwa
305
penskoran parsial untuk penilai guru pamong/penguji UKIN pada uji coba II telah
reliabel.
c) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian Penskoran Holistik untuk Penilai Dosen
kepribadian (KSKK) penskoran holistik untuk penilai dosen pada uji coba II,
dianalisis menggunakan pendekatan reliabilitas  sebagaimana terlampir pada
Lampiran 7 halaman 559 disajikan pada Tabel 49 berikut

Item i i 2 1  i
2
A1 0,73 0,5329 0,4671

A2 0,70 0,4900 0,5100
A3 0,73 0,5329 0,4671
A4 0,70 0,4900 0,5100
A5 0,72 0,5184 0,4816
B6 0,74 0,5476 0,4524
B7 0,74 0,5476 0,4524
B8 0,71 0,5041 0,4959
B9 0,72 0,5184 0,4816
B10 0,77 0,5929 0,4071
C11 0,70 0,4900 0,5100
C12 0,72 0,5184 0,4816
C13 0,70 0,4900 0,5100
C14 0,66 0,4356 0,5644
C15 0,74 0,5476 0,4524
D16 0,75 0,5625 0,4375
D17 0,72 0,5184 0,4816
D18 0,72 0,5184 0,4816
D19 0,79 0,6241 0,3759
D20 0,74 0,5476 0,4524
∑ 14,5 9,4726
306
i
(KSKK) penskoran holistik untuk penilai dosen pada uji coba II, diketahui 
i 1
i
1  
2
i 1
Retnawati (2016a: 87) dapat disimpulkan bahwa instrumen penilaian kompetensi
sosial dan kompetensi kepribadian (KSKK) penskoran holistik untuk penilai
dosen pada uji coba II telah reliabel.
d) Reliabilitas Instrumen Penilaian Kompetensi Sosial dan Kompetensi
kepribadian (KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN
pada uji coba II dianalisis dengan pendekatan reliabilitas  menggunakan
latennya. Berikut ini disajikan hasil analisis reliabilitas instrumen penilaian
penilai guru pamong/penguji UKIN sebagaimana terlampir pada Lampiran 7
halaman 565.
307
Holistik Penilai Guru pamong/penguji UKIN
Item i i 2 1  i
2
A1 0,73 0,5329 0,4671

A2 0,71 0,5041 0,4959
A3 0,73 0,5329 0,4671
A4 0,70 0,4900 0,5100
A5 0,73 0,5329 0,4671
B6 0,74 0,5476 0,4524
B7 0,74 0,5476 0,4524
B8 0,71 0,5041 0,4959
B9 0,73 0,5329 0,4671
B10 0,77 0,5929 0,4071
C11 0,72 0,5184 0,4816
C12 0,72 0,5184 0,4816
C13 0,71 0,5041 0,4959
C14 0,66 0,4356 0,5644
C15 0,74 0,5476 0,4524
D16 0,76 0,5776 0,4224
D17 0,73 0,5329 0,4671
D18 0,72 0,5184 0,4816
D19 0,79 0,6241 0,3759
D20 0,75 0,5625 0,4375
∑ 14,59 9,3425
(KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN pada uji
i i
 1  
2
coba II, diketahui i sebesar 14,59, serta i sebasar 9,34. Berdasarkan
i 1 i 1
hasil perhitungan reliabilitas diperoleh koefisien omega (  ) yang menunjukkan
koefisien reliabilitas instrumen sebesar 0,95. Jika didasari pada kriteria minimal
308
holistik untuk penilai guru pamong/penguji UKIN pada uji coba II telah reliabel.
3. Karakteristik Item Berdasarkan Politomus Item Response Theory (Uji
Coba II)
Seperti halnya pada uji coba I, karakteristik item pada uji coba II juga
merupakan salah satu fase penting dalam pengembangan model penilaian ini.
Model penilaian PPG telah dirancang untuk penskoran politomi sehingga dalam
menganalisis karakteristik itemnya pada penelitian ini digunakan pendekatan
politomus item response theory. Penskoran parsial diestimasi dengan metode
partial credit model (PCM), sedangkan penskoran holistik diestimasi dengan
metode graded response model (GRM). Selain itu setiap instrumen tersebut
memiliki dua kelompok penilai yaitu penilai untuk dosen serta penilai untuk guru
pamong/penguji UKIN. Berikut ini diuraikan karakteristik item pada model
penilaian PPG.
a. Karakteristik Instrumen Penilaian RPP
Pada uji coba II, karakteristik instrumen penilaian RPP dibagi menjadi
empat kelompok data. Data pertama adalah instrumen penilaian RPP dengan
penskoran parsial untuk penilai dosen. Data kedua adalah instrumen penilaian
RPP dengan penskoran parsial untuk penilai guru pamong/penguji UKIN. Data
ketiga adalah instrumen penilaian RPP dengan penskoran holistik untuk penilai
dosen, dan data keempat adalah instrumen penilaian RPP dengan penskoran
holistik untuk penilai guru pamong/penguji UKIN. Uraian keempat kelompok
data tersebut dikemukakan sebagai berikut.
309
1) Karakteristik Instrumen Penilaian RPP Penskoran Parsial Penilai Dosen
Seperti halnya pada uji coba I, pada uji coba II instrumen penilaian
rencana pelaksanaan pembelajaran (RPP) penskoran parsial untuk penilai dosen
dianalisis menggunakan pendekatan partial credit model (PCM) dengan
penskoran 0, 1, 2, 3, dan 4. Melalui Program R dengan Extended Rasch Modeling
(eRm) package diperoleh hasil analisis berupa karakteristik item sebagai berikut.


A1 0,77 -1,54 0,54 1,33 2,75
A2 0,62 -1,96 0,45 1,54 2,47
A3 0,70 -1,95 0,48 1,34 2,94
A4 0,61 -1,66 -0,03 1,51 2,62
A5 0,61 -1.83 0,29 1,39 2,60
A6 0,79 -1,06 0,19 1,60 2,43
B7 0,73 -1,35 0,23 1,33 2,71
B8 0,60 -1,67 0,02 1,38 2,69
B9 0,70 -1,31 0,15 1,42 2,57
B10 0,67 -1,02 -0,31 1,51 2,52
B11 0,72 -1,36 0,16 1,61 2,50
B12 0,74 -1,06 -0,27 1,47 2,84
C13 0,81 -1,34 0,09 1,64 2,85
C14 0,78 -1,43 0,32 1,37 2,85
C15 0,82 -1,35 0,15 1,47 3,02
C16 0,81 -1,41 0,25 1,49 2,93
C17 0,77 -1,40 0,26 1,41 2,82
C18 0,65 -1,75 0,08 1,54 2,74
D19 0,57 -1,68 0,09 1,27 2,62
D20 0,66 -1,19 0,02 1,22 2,61
D21 0,67 -1,30 0,18 1,26 2,54
D22 0,52 -1,54 -0,06 1,13 2,56
D23 0,51 -1,68 0,19 1,03 2,50
D24 0,49 -1,57 0,08 0,88 2,59
D25 0,65 -1,05 -0,15 1,19 2,63
310
threshold ᵟi. Hal tersebut dijelaskan oleh Embretson (2000) bahwa item location
mencerminkan tentang tingkat kemudahan atau kesukaran item tersebut,
dicapai. Hal ini berarti bahwa pada instrumen RPP semakin tinggi koefisien
location maka semakin sulit item tersebut dengan sebaran threshold yang
merupakan kategori tingkat pencapaiannya. Semakin tinggi threshold maka
semakin sulit dicapai ambang batas tersebut, sehingga peserta yang memiliki
kemampuan rendah tentu hanya mampu mencapai threshold (ambang kategori)
yang rendah pula, peserta yang memiliki kemampuan menengah hanya mampu
mencapai threshold (ambang kategori) yang menengah hingga pada peserta yang
berkemampuan tinggi tentu mampu mencapai kategori ambang batas yang tinggi.
Selanjutnya hal lain yang dapat dijelaskan berdasarkan hasil analisis item
dengan partial credit model adalah kurva karakteristik item. Kurva karakteristik
item digambarkan untuk memudahkan memahami hubungan antara setiap
threshold ᵟi yang merupakan tingkat kesulitan dengan kemampuan peserta untuk
mencapai skor atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva
311
(RPP) penskoran parsial untuk penilai dosen.

untuk penilai dosen yaitu item 4 pada uji coba II. Jika dikaitkan dengan hasil
1,66, threshold ᵟ2 sebesar -0,03, threshold ᵟ3 sebesar 1,51, serta threshold ᵟ4
sebesar 2,62. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai
diperlukan kemampuan (  ) sekitar -0,03 hingga 1,51. Pada bagian ini hanya
diberikan contoh untuk item 4. Lebih jelasnya kurva karakteristik untuk semua
item pada instrumen penilaian ini dapat diamati pada Lampiran 8 halaman 566.
Untuk karakteristik instrumen disajikan berdasarkan fungsi informasi berikut.
312
Gambar 62. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai Dosen
Selain kurva karakteristik item, maka hal lain yang dapat dijelaskan dari
kualitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran
parsial untuk penilai dosen adalah nilai fungsi informasi instrumen. Berikut ini
disajikan fungsi informasi (NIF) instrumen penilaian rencana pelaksanaan
pembelajaran (RPP) penskoran parsial untuk penilai dosen yang dihubungkan
dengan Standard Error of Measurement (SEM).
RPP Penskoran Parsial untuk Penilai Dosen
313
pada instrumen penilaian RPP penskoran parsial untuk penilai dosen. Gambar
tersebut menunjukkan grafik nilai informasi (NIF) dan kesalahan pengukuran
(SEM) dimana pada kurva untuk NIF ditunjukkan oleh garis melengkung ke atas
dan SEM ditunjukkan oleh garis putus-putus. Kedua grafik fungsi ini bertemu
pada skala kemampuan -4,3 dan 0,7. Di antara dua kemampuan ini, instrumen
memiliki nilai informasi yang lebih tinggi dibandingkan dengan kesalahan
pengukurannya. Sebaliknya, ketika skala kemampuan kurang dari -4,3 dan lebih
dari 0,7, maka instrumen ini memiliki kesalahan pengukuran yang lebih besar
dibandingkan dengan informasi yang diberikannya.
Hal lain yang dapat dijelaskan dari Gambar 50 tersebut adalah nilai fungsi
informasi instrumen sebesar 16,36 pada skala kemampuan (  ) -1,8. Hambleton,
fungsi informasi memiliki hubungan yang berbanding terbalik dengan Standard
Error of Measurement (SEM), semakin besar nilai informasi maka SEM akan
semakin kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka dapat
dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 16,36 maka
koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,24.
2) Karakteristik Instrumen Penilaian RPP Penskoran Parsial untuk Penilai
Seperti yang telah dilakukan pada uji coba I, instrumen penilaian rencana
pelaksanaan pembelajaran (RPP) penskoran parsial untuk penilai guru
pamong/penguji UKIN pada uji coba II dianalisis dengan menggunakan
314
pendekatan partial credit model (PCM) dengan penskoran 0, 1, 2, 3, dan 4.
Melalui Program R dengan Extended Rasch Modeling (eRm) package diperoleh


A1 0,77 -1,74 0,96 1,21 2,72
A2 0,63 -2,06 0,66 1,47 2,45
A3 0,71 -2,05 0,69 1,28 2,92
A4 0,62 -1,81 0,23 1,44 2,62
A5 0,62 -1,98 0,58 1,31 2,58
A6 0,79 -1,19 0,43 1,54 2,41
B7 0,72 -1,33 0,22 1,30 2,69
B8 0,59 -1,65 0,01 1,37 2,65
B9 0,69 -1,30 0,14 1,40 2,55
B10 0,66 -1,00 -0,32 1,49 2,50
B11 0,71 -1,35 0,14 1,59 2,47
B12 0,73 -1,04 -0,28 1,45 2,81
C13 0,79 -1,33 0,08 1,60 2,83
C14 0,77 -1,41 0,31 1,35 2,82
C15 0,81 -1,33 0,14 1,45 3,00
C16 0,80 -1,40 0,24 1,47 2,91
C17 0,76 -1,38 0,25 1,38 2,80
C18 0,64 -1,73 0,08 1,51 2,72
D19 0,56 -1,67 0,08 1,24 2,60
D20 0,65 -1,17 0,02 1,20 2,58
D21 0,66 -1,28 0,18 1,23 2,54
D22 0,51 -1,52 -0,07 1,11 2,54
D23 0,50 -1,66 0,19 1,01 2,48
D24 0,48 -1,55 0,07 0,86 2,57
D25 0,64 -1,04 -0,16 1,17 2,60
315
dicapai. Hal ini berarti bahwa pada instrumen RPP semakin tinggi koefisien
berkemampuan tinggi tentu mampu mencapai kategori ambang batas yang tinggi
pula.
(RPP) penskoran parsial untuk penilai guru pamong/penguji UKIN.
316
untuk penilai guru pamong/penguji UKIN yaitu item 7. Jika dikaitkan dengan
hasil kaliberasi item pada Tabel 52, dapat dijelaskan bahwa pada dasarnya item 7
ini memiliki parameter lokasi sebesar 0,72 dengan parameter threshold ᵟ1 sebesar -
1,33, threshold ᵟ2 sebesar 0,22, threshold ᵟ3 sebesar 1,30, serta threshold ᵟ4 sebesar
kemampuan (  ) sekitar 0,22 hingga 1,30. Pada bagian ini hanya diberikan contoh
untuk item 7. Untuk lebih jelasnya kurva karakteristik untuk semua item pada
untuk penilai guru pamong/penguji UKIN dapat diamati pada Lampiran 8
halaman 572. Lebih lanjut karakteristik instrumen disajikan berdasarkan fungsi
informasi sebagai berikut.
317
Gambar 65. Fungsi Informasi Instrumen RPP Penskoran Parsial Penilai Penguji
UKIN
parsial untuk penilai guru pamong/penguji UKIN adalah nilai fungsi informasi
instrumen. Berikut ini disajikan fungsi informasi (NIF) instrumen penilaian
pamong/penguji UKIN yang dihubungkan dengan Standard Error of
Measurement (SEM).
318
RPP Penskoran Parsial untuk Penilai Guru pamong/penguji UKIN
pada instrumen penilaian RPP penskoran parsial untuk penilai guru
pamong/penguji UKIN. Gambar tersebut menunjukkan grafik nilai informasi dan
kesalahan pengukuran. Kedua grafik fungsi ini bertemu pada skala kemampuan -
4,3 dan 0,7. Di antara dua kemampuan ini, instrumen memiliki nilai informasi
yang lebih tinggi dibandingkan dengan kesalahan pengukurannya. Sebaliknya,
ketika skala kemampuan kurang dari -4,3 dan lebih dari 0,7, maka instrumen ini
memiliki kesalahan pengukuran yang lebih besar dibandingkan dengan informasi
yang diberikannya. Hal lain yang dapat dijelaskan dari Gambar 52 tersebut adalah
nilai fungsi informasi maksimum instrumen sebesar 16,36 pada skala kemampuan
(  ) -1,8. Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19)
terbalik dengan Standard Error of Measurement (SEM), semakin besar nilai
informasi maka SEM akan semakin kecil atau sebaliknya. Jika berdasar pada
pendapat tersebut, maka dapat dijelaskan bahwa dengan diketahuinya nilai fungsi
sebesar 0,24.
3) Karakteristik Instrumen Penilaian RPP Penskoran Holistik Penilai Dosen
Instrumen penilaian RPP penskoran holistik untuk penilai dosen pada uji
coba II dianalisis dengan menggunakan pendekatan graded response modeling
(GRM) dengan penskoran 1, 2, 3, dan 4. Melalui Program R dengan latent trait
model (ltm) package diperoleh hasil analisis karakteristik item sebagai berikut.
319
Item a b1 b2 b3
A1 1,30 -2,18 -1,03 0,72
A2 1,38 -2,23 -0,89 0,52
A3 1,06 -2,70 -1,15 0,97
A4 1,28 -2,67 -1,00 0,67
A5 1,13 -2,71 -1,17 0,65
A6 1,28 -2,64 -0,96 0,53
B7 0,93 -3,46 -1,33 0,76
B8 0,92 -3,68 -1,33 0,77
B9 0,94 -3,23 -1,31 0,63
B10 0,98 -3,23 -1,26 0,63
B11 0,94 -3,17 -1,17 0,61
B12 0,88 -3,60 -1,31 0,92
C13 1,21 -2,87 -0,83 0,89
C14 1,19 -2,83 -1,02 0,83
C15 1,22 -2,84 -0,88 0,99
C16 1,12 -2,94 -0,96 0,96
C17 1,11 -2,99 -1,05 0,86
C18 1,31 -2,81 -0,87 0,75
D19 1,31 -2,94 -1,13 0,61
D20 1,18 -2,90 -1,24 0,60
D21 1,38 -2,60 -1,06 0,56
D22 1,20 -2,85 -1,32 0,56
D23 1,16 -2,89 -1,42 0,51
D24 1,34 -2,76 -1,42 0,50
D25 1,32 -2,65 -1,15 0,59
pencapaian maka semakin tinggi koefisien bi.
320
graded response model adalah kurva karakteristik item. Berikut ini disajikan salah
satu contoh kurva karakteristik item dari instrumen penilaian rencana pelaksanaan
pembelajaran (RPP) penskoran holistik untuk penilai dosen pada uji coba II.

instrumen penilaian rencana pelaksanaan pembelajaran (RPP) pada uji coba II
penskoran holistik untuk penilai dosen yaitu item 14. Jika dikaitkan dengan hasil
memiliki parameter daya beda ai sebesar 1,19 dengan parameter b1 sebesar -2,83,
b2 sebesar -1,02, serta b3 sebesar 0,83. Secara grafis bi atau tingkat kesulitan dapat
diinterpretasikan sebagai perpotongan kurva setiap kategori. Dari gambar tersebut
dapat dijelaskan bahwa untuk mencapai kategori 2 atau untuk memperoleh skor 2
pada item 23 maka diperlukan kemampuan (  ) sekitar -2,83 hingga -1,02. Pada
bagian ini hanya diberikan contoh untuk item 14. Untuk lebih jelasnya kurva
321
karakteristik untuk semua item pada instrumen penilaian rencana pelaksanaan
pembelajaran (RPP) penskoran holistik untuk penilai dosen dapat diamati pada
Lampiran 8 halaman 577. Lebih lanjut karakteristik instrumen disajikan
berdasarkan fungsi informasi sebagai berikut.
Gambar 68. Fungsi Informasi Instrumen RPP Penskoran Holistik Penilai Dosen
holistik untuk penilai dosen adalah nilai fungsi informasi instrumen. Fungsi
informasi pada dasarnya menunjukkan sejauhmana instrumen yang telah
dikembangkan dapat memberi informasi maksimal jika dikenakan pada
kemampuan (  ) tertentu. Berikut ini disajikan fungsi informasi (NIF) instrumen
penilai dosen yang dihubungkan dengan Standard Error of Measurement (SEM).
322
dengan informasi yang diberikannya. Hal lain yang dapat dijelaskan dari Gambar
54 tersebut adalah nilai fungsi informasi instrumen sebesar 14,15 pada skala
kemampuan (  ) -1,1. Hambleton, Swaminathan & Rogers (1991: 94); Retnawati
(2014: 19) menyatakan bahwa nilai fungsi informasi memiliki hubungan yang
besar nilai informasi maka SEM akan semakin kecil atau sebaliknya. Jika berdasar
pada pendapat tersebut, maka dapat dijelaskan bahwa dengan diketahuinya nilai
fungsi informasi sebesar 14,15, maka koefisien kesalahan pengukuran (SEM)
323
diperoleh sebesar 0,26. Hal ini dapat diinterpretasikan bahwa koefisien kesalahan
pengukuran sebesar 0,26.
4) Karakteristik Instrumen Penilaian RPP Penskoran Holistik untuk Penilai
Instrumen penilaian RPP penskoran holistik untuk penilai guru
pamong/penguji UKIN pada uji coba II dianalisis dengan GRM penskoran 1, 2, 3,
dan 4. Melalui Program R dengan latent trait model (ltm) package diperoleh hasil

Item a b1 b2 b3
A1 1,29 -2,18 -1,03 0,71
A2 1,40 -2,22 -0,88 0,53
A3 1,06 -2,70 -1,14 0,99
A4 1,30 -2,64 -0,98 0,66
A5 1,15 -2,68 -1,16 0,65
A6 1,29 -2,62 -0,95 0,53
B7 0,96 -3,40 -1,30 0,81
B8 0,93 -3,66 -1,32 0,80
B9 0,98 -3,38 -1,26 0,67
B10 1,08 -3,50 -1,14 0,62
B11 0,96 -3,34 -1,14 0,67
B12 0,91 -3,94 -1,27 1,01
C13 1,21 -2,89 -0,83 0,90
C14 1,19 -2,83 -1,02 0,84
C15 1,25 -2,81 -0,87 0,99
C16 1,15 -2,90 -0,95 0,96
C17 1,13 -2,97 -1,05 0,86
C18 1,33 -2,78 -0,86 0,75
D19 1,31 -2,98 -1,13 0,61
D20 1,17 -3,23 -1,28 0,62
D21 1,35 -2,82 -1,09 0,56
D22 1,16 -3,38 -1,37 0,56
D23 1,11 -3,33 -1,48 0,51
D24 1,29 -3,18 -1,47 0,50
D25 1,28 -3,17 -1,20 0,60
324
graded response model adalah kurva karakteristik item. Kurva karakteristik item
digambarkan untuk memudahkan memahami hubungan antara setiap bi yang
merupakan tingkat kesulitan dengan kemampuan peserta untuk mencapai skor
atau kategori tertentu. Berikut ini disajikan salah satu contoh kurva karakteristik
item dari instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran
holistik penilai guru pamong/penguji UKIN pada uji coba II.

325
instrumen penilaian rencana pelaksanaan pembelajaran (RPP) penskoran Holistik
untuk penilai guru pamong/penguji UKIN pada uji coba II yaitu item 2. Jika
dasarnya item 2 ini memiliki parameter daya beda ai sebesar 1,40 dengan
Lebih lanjut karakteristik instrumen disajikan berdasarkan fungsi informasi
sebagai berikut.
Gambar 71. Fungsi Informasi Instrumen RPP Penskoram Holistik Penilai Guru
Pamong/Penguji UKIN
326
kualitas instrumen penilaian rencana pelaksanaan pembelajaran (RPP) pada uji
coba II penskoran holistik untuk penilai guru pamong/penguji UKIN adalah nilai
fungsi informasi instrumen. Fungsi informasi pada dasarnya menunjukkan
sejauhmana instrumen yang telah dikembangkan dapat memberi informasi
maksimal jika dikenakan pada kemampuan (  ) tertentu. Berikut ini disajikan
fungsi informasi (NIF) instrumen penilaian rencana pelaksanaan pembelajaran
(RPP) penskoran holistik untuk penilai guru pamong/penguji UKIN yang
dihubungkan dengan Standard Error of Measurement (SEM).
RPP Penskoran Holistik untuk Penilai Guru pamong/penguji UKIN
pada instrumen penilaian RPP penskoran holistik untuk penilai guru
pamong/penguji UKIN. Gambar tersebut menunjukkan grafik nilai informasi
(NIF) dan kesalahan pengukuran (SEM) dimana pada kurva untuk NIF
ditunjukkan oleh garis melengkung ke atas dan SEM ditunjukkan oleh garis
327
putus-putus. Kedua grafik fungsi ini bertemu pada skala kemampuan -3,5 dan 1,3.
diberikannya.
Berdasarkan beberapa penyajian hasil karakteristik item dan kurva
karakteristik item untuk instrumen penilaian RPP penskoran parsial dan
penskoran holistik dapat dijelaskan bahwa untuk instrumen penilaian RPP lebih
baik untuk menggunakan penskoran parsial. Hal ini terlihat pada kurva
karakteristik item untuk penskoran parsial yang lebih condong pada theta positif
(lihat Gambar 50) dibandingkan dengan kurva karakteristik item pada penskoran
holistik (lihat Gambar 53). Hal ini juga diperkuat dengan fungsi informasi butir
yang menunjukkan bahwa penskoran parsial lebih memiliki informasi yang tinggi
dan SEM yang lebih rendah dibanding dengan dengan penskoran holistik.
328
b. Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran (PP)
Pada uji coba II karakteristik instrumen penilaian pelaksanaan
pembelajaran (PP) dibagi menjadi empat kelompok data. Data pertama adalah
instrumen penilaian pelaksanaan pembelajaran (PP) dengan penskoran parsial
untuk penilai dosen. Data kedua adalah instrumen penilaian pelaksanaan
pembelajaran (PP) dengan penskoran parsial untuk penilai guru pamong/penguji
UKIN. Data ketiga adalah instrumen penilaian pelaksanaan pembelajaran (PP)
dengan penskoran holistik untuk penilai dosen, dan data keempat adalah
instrumen penilaian pelaksanaan pembelajaran (PP) dengan penskoran holistik
untuk penilai guru pamong/penguji UKIN. Uraian keempat kelompok data
tersebut pada uji coba II dikemukakan sebagai berikut.
Instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial
untuk penilai dosen dianalisis dengan menggunakan pendekatan partial credit
model (PCM) dengan penskoran 0, 1, 2, 3, dan 4. Melalui Program R dengan
Extended Rasch Modeling (eRm) package diperoleh hasil analisis berupa
karakteristik item sebagai berikut.
329
Pembelajaran (PP) Penskoran Pasial untuk Penilai Dosen

A1 0,75 -1,50 0,59 0,95 2,97
A2 0,58 -1,27 -0.10 0,87 2,86
A3 0,65 -1,00 -0,15 0,88 2,91
A4 0,69 -1,17 -0,01 1,16 2,79
B5 0,63 -1,44 0,07 1,03 2,88
B6 0,60 -1,26 -0,22 1,14 2,75
B7 0,73 -1,23 0,04 1,22 2,89
B8 0,71 -1,52 0,14 1,13 3,08
B9 0,70 -1,10 -0,12 1,18 2,85
B10 0,68 -1,07 -0,13 1,07 2,87
B11 0,68 -0,90 -0,37 1,09 2,90
C12 0,62 -1,45 0,19 0,77 2,99
C13 0,58 -1,39 0,10 0,78 2,84
C14 0,64 -1,04 -0,13 0,97 2,77
C15 0,64 -1,36 -0,13 1,29 2,78
D16 0,62 -1,26 -0,19 1,05 2,91
D17 0,65 -1,18 0,02 1,10 2,68
D18 0,67 -1,25 0,19 0,93 2,84
D19 0,64 -1,21 -0,30 1,16 2,95
D20 0,85 -0,91 0,17 1,09 3,07
330
dicapai. Hal ini berarti bahwa pada instrumen PP semakin tinggi koefisien
berkemampuan tinggi tentu mampu mencapai kategori ambang batas yang tinggi.
karakteristik item dari instrumen penilaian pelaksanaan pembelajaran (PP)
penskoran parsial untuk penilai dosen.

Pembelajaran Penskoran Parsial untuk Penilai Dosen
331
55, dapat dijelaskan bahwa pada dasarnya item 15 ini memiliki parameter lokasi
sebesar 0,64 dengan parameter threshold ᵟ1 sebesar -1,36, threshold ᵟ2 sebesar -
untuk memperoleh skor 2 pada item 15 maka diperlukan kemampuan (  ) sekitar -
0,13 hingga 1,29. Pada bagian ini hanya diberikan contoh untuk item 15. Secara
lebih jelasnya kurva karakteristik untuk semua item pada instrumen penilaian
pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai dosen dapat
disajikan berdasarkan fungsi informasi sebagai berikut.

Parsial Penilai Dosen
332
kualitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial
pada uji coba II untuk penilai dosen adalah nilai fungsi informasi instrumen.
Fungsi informasi pada dasarnya menunjukkan sejauhmana instrumen yang telah
penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk penilai dosen
yang dihubungkan dengan Standard Error of Measurement (SEM).
Gambar 75. Fungsi Informasi Instrumen Penilaian Pelaksanaan Pembelajaran

(PP) Penskoran Parsial untuk Penilai Dosen
pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial uji
coba II untuk penilai dosen. Gambar tersebut menunjukkan grafik nilai informasi
dan kesalahan pengukuran. Kedua grafik fungsi ini bertemu pada skala
333
58 tersebut adalah nilai fungsi informasi maksimum instrumen sebesar 13,3 pada
skala kemampuan (  ) -0,6. Hambleton, Swaminathan & Rogers (1991: 94);
Retnawati (2014: 19) menyatakan bahwa nilai fungsi informasi memiliki
hubungan yang berbanding terbalik dengan Standard Error of Measurement
(SEM), semakin besar nilai informasi maka SEM akan semakin kecil atau
sebaliknya. Jika berdasar pada pendapat tersebut, maka dapat dijelaskan bahwa
dengan diketahuinya nilai fungsi informasi sebesar 13,3, maka koefisien
kesalahan pengukuran (SEM) diperoleh sebesar 0,27.
Pada uji coba II, instrumen penilaian pelaksanaan pembelajaran (PP)
penskoran parsial untuk penilai guru pamong/penguji UKIN dianalisis dengan
menggunakan pendekatan partial credit model (PCM) dengan penskoran 0, 1, 2,
3, dan 4. Melalui Program R dengan Extended Rasch Modeling (eRm) package
diperoleh hasil analisis berupa karakteristik item sebagai berikut.
334
Pembelajaran (PP) Penskoran Pasial untuk Penilai Guru
pamong/penguji UKIN

A1 0,69 -1,24 0,28 0,80 2,91
A2 0,63 -0,86 -0,27 0,78 2,90
A3 0,62 -1,17 -0,15 0,85 2,96
A4 0,63 -1,26 -0,09 1,08 2,81
B5 0,65 -1,36 0,05 1,05 2,89
B6 0,60 -1,12 -0,29 1,05 2,76
B7 0,67 -1,33 -0,03 1,15 2,89
B8 0,70 -1,32 -0,01 1,07 3,10
B9 0,66 -1,01 -0,11 0,93 2,87
B10 0,67 -1,01 -0,13 0,98 2,85
B11 0,66 -0,80 -0,44 1,01 2,89
C12 0,61 -1,32 0,13 0,70 2,95
C13 0,62 -0,99 -0,05 0,70 2,83
C14 0,57 1,13 -0,21 0,90 2,73
C15 0,67 -1,11 -0,00 1,04 2,76
D16 0,62 -1,04 -0,38 0,98 2,94
D17 0,64 -1,05 -0,09 1,01 2,71
D18 0,66 -1,09 0,02 0,85 2,88
D19 0,69 -0,80 -0,48 1,08 2,99
D20 0,69 -0,81 -0,40 0,90 3,08
335
dicapai. Hal ini berarti bahwa pada instrumen PP semakin tinggi koefisien
pula. Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan partial
credit model adalah kurva karakteristik item. Kurva karakteristik item
karakteristik item dari instrumen penilaian pelaksanaan pembelajaran (PP)
penskoran parsial pada uji coba II untuk penilai guru pamong/penguji UKIN.

Pembelajaran Penskoran Parsial Penilai Guru pamong/penguji UKIN
336
penilai guru pamong/penguji UKIN yaitu item 10. Jika dikaitkan dengan hasil
kaliberasi item pada Tabel 56, menunjukkan bahwa item 10 ini memiliki
parameter lokasi sebesar 0,67 dengan parameter threshold ᵟ1 sebesar -1,01,
threshold ᵟ2 sebesar -0,13, threshold ᵟ3 sebesar 0,98, serta threshold ᵟ4 sebesar
kemampuan (  ) sekitar -0,13 hingga 0,98. Pada bagian ini hanya diberikan contoh
untuk item 10. Secara lebih jelasnya kurva karakteristik untuk semua item pada
Selanjutnya karakteristik instrumen disajikan dalam fungsi informasi berikut.

Parsial Penilai Penguji UKIN
337
kualitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial
untuk penilai guru pamong/penguji UKIN pada uji coba II adalah nilai fungsi
informasi instrumen. Fungsi informasi pada dasarnya menunjukkan sejauhmana
instrumen yang telah dikembangkan dapat memberi informasi maksimal jika
dikenakan pada kemampuan (  ) tertentu. Berikut ini disajikan fungsi informasi
(NIF) instrumen penilaian pelaksanaan pembelajaran (PP) penskoran parsial untuk
penilai guru pamong/penguji UKIN yang dihubungkan dengan Standard Error of
Measurement (SEM).
Pelaksanaan Pembelajaran Penskoran Parsial Penilai Guru
pamong/penguji UKIN
penilai guru pamong/penguji UKIN. Gambar tersebut menunjukkan grafik nilai
informasi (NIF) dan kesalahan pengukuran (SEM) dimana pada kurva untuk NIF
338
diberikannya. Hal lain yang dapat dijelaskan dari Gambar 60 tersebut adalah nilai
fungsi informasi maksimum instrumen sebesar 13,3 pada skala kemampuan (  ) -
0,6. Hambleton, Swaminathan & Rogers (1991: 94); Retnawati (2014: 19)
terbalik dengan Standard Error of Measurement (SEM), semakin besar nilai
informasi maka SEM akan semakin kecil atau sebaliknya. Jika berdasar pada
pendapat tersebut, maka dapat dijelaskan bahwa dengan diketahuinya nilai fungsi
sebesar 0,27.
3) Karakteristik Instrumen Penilaian Pelaksanaan Pembelajaran Penskoran
Holistik untuk Penilai Dosen
Pada uji coba II, instrumen penilaian pelaksanaan pembelajaran (PP)
penskoran holistik untuk penilai dosen dianalisis dengan menggunakan
pendekatan graded response modeling (GRM) dengan penskoran 1, 2, 3, dan 4.
Melalui Program R dengan latent trait model (ltm) package diperoleh hasil
339
Pelaksanaan Pembelajaran Penskoran Holistik untuk Penilai
Dosen
Item a b1 b2 b3
A1 1,33 -2,63 -1,33 0,68
A2 1,31 -2,89 -1,36 0,59
A3 1,23 -3,02 -1,43 0,65
A4 1,23 -2,86 -1,24 0,60
B5 1,64 -2,48 -1,11 0,59
B6 1,69 -2,58 -1,08 0,51
B7 1,72 -2,36 -0,93 0,61
B8 1,72 -2,35 -0,97 0,72
B9 1,62 -2,90 -1,18 0,57
B10 1,98 -2,41 -0,99 0,55
B11 1,74 -2,63 -1,05 0,60
C12 1,37 -2,68 -1,35 0,68
C13 1,22 -2,95 -1,51 0,60
C14 1,17 -3,07 -1,41 0,58
C15 1,22 -3,43 -1,32 0,59
D16 1,59 -2,69 -1,16 0,60
D17 1,58 -2,48 -1,12 0,45
D18 1,31 -2,68 -1,31 0,59
D19 1,45 -2,79 -1,13 0,67
D20 1,40 2,84 -1,25 0,75
340
item dari instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik
untuk penilai dosen pada uji coba II.

Pembelajaran (PP) Penskoran Holistik untuk Penilai Dosen
instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk
48, dapat dijelaskan bahwa pada dasarnya item 19 ini memiliki parameter daya
beda ai sebesar 1,45 dengan parameter b1 sebesar -2,79, b2 sebesar -1,13, serta b3
sebesar 0,67. Secara grafis bi atau tingkat kesulitan dapat diinterpretasikan sebagai
341
semua item pada instrumen penilaian pelaksanaan pembelajaran (PP) penskoran
holistik untuk penilai dosen dapat diamati pada Lampiran 8 halaman 596. Lebih
lanjut karakteristik instrumen dapat disajikan dalam fungsi informasi sebagai
berikut.

kualitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik
pada uji coba II untuk penilai dosen adalah nilai fungsi informasi instrumen.
penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai dosen
yang dihubungkan dengan Standard Error of Measurement (SEM).
342
penilai dosen. Gambar tersebut menunjukkan grafik nilai informasi (NIF) dan
kesalahan pengukuran (SEM) dimana pada kurva untuk NIF ditunjukkan oleh
garis melengkung ke atas dan SEM ditunjukkan oleh garis putus-putus. Kedua
grafik fungsi ini bertemu pada skala kemampuan -3,3 dan 1,2. Di antara dua
kemampuan ini, instrumen memiliki nilai informasi yang lebih tinggi
dibandingkan dengan kesalahan pengukurannya. Sebaliknya, ketika skala
fungsi informasi instrumen sebesar 11,4 pada skala kemampuan (  ) -1,1.
bahwa nilai fungsi informasi memiliki hubungan yang berbanding terbalik dengan
343
akan semakin kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka
maka koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,29.
untuk penilai guru pamong/penguji UKIN pada uji coba II diperoleh hasil analisis
berupa karakteristik item sebagai berikut.

Pembelajaran Penskoran Holistik Penilai Guru pamong/penguji
UKIN
Item a b1 b2 b3
A1 1,35 -2,63 -1,33 0,70
A2 1,34 -2,89 -1,34 0,61
A3 1,26 -3,01 -1,41 0,66
A4 1,28 -2,82 -1,21 0,61
B5 1,66 -2,50 -1,11 0,60
B6 1,74 -2,58 -1,07 0,53
B7 1,76 -2,36 -0,93 0,63
B8 1,77 -2,35 -0,96 0,74
B9 1,66 -2,91 -1,17 0,58
B10 1,96 -2,44 -1,01 0,58
B11 1,71 -2,68 -1,07 0,62
C12 1,38 -2,71 -1,36 0,69
C13 1,23 -2,97 -1,53 0,62
C14 1,18 -3,09 -1,42 0,59
C15 1,24 -3,44 -1,32 0,61
D16 1,63 -2,70 -1,15 0,61
D17 1,62 -2,47 -1,11 0,47
D18 1,33 -2,69 -1,31 0,60
D19 1,50 -2,79 -1,12 0,67
D20 1,43 -2,84 -1,24 0,76
344
item dari instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik
penilai guru pamong/penguji UKIN pada uji coba II.

Pembelajaran Penskoran Holistik Penilai Guru pamong/penguji
UKIN
345
instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik untuk
penilai guru pamong/penguji UKIN pada uji coba II yaitu item 8. Jika dikaitkan
dengan hasil kaliberasi item pada Tabel 57, dapat dijelaskan bahwa pada dasarnya
item 8 ini memiliki parameter daya beda ai sebesar 1,72 dengan parameter b1
sebesar -2,35, b2 sebesar -0,96, serta b3 sebesar 0,74. Secara grafis bi atau tingkat
kesulitan dapat diinterpretasikan sebagai perpotongan kurva setiap kategori. Dari
gambar tersebut dapat dijelaskan bahwa untuk mencapai kategori 2 atau untuk
memperoleh skor 2 pada item 2 maka diperlukan kemampuan (  ) sekitar -2,35
hingga -0,96. Pada bagian ini hanya diberikan contoh untuk item 8. Secara lebih
jelasnya kurva karakteristik untuk semua item pada instrumen penilaian
pelaksanaan pembelajaran (PP) penskoran holistik untuk penilai guru
pamong/penguji UKIN dapat diamati pada Lampiran 8 halaman 599. Lebih lanjut
karakteristik insrtrumen dapat disajikan dalam fungsi informasi sebagai berikut.

holistik Penilai Penguji UKIN
346
kualitas instrumen penilaian pelaksanaan pembelajaran (PP) penskoran holistik
untuk penilai guru pamong/penguji UKIN adalah nilai fungsi informasi instrumen.
pamong/penguji UKIN pada uji coba II yang dihubungkan dengan Standard Error
of Measurement (SEM).
PP Penskoran Holistik Penilai Guru pamong/penguji UKIN
penilai guru pamong/penguji UKIN. Gambar tersebut menunjukkan grafik nilai
347
diberikannya.
karakteristik item untuk instrumen penilaian pelaksanaan pembelajaran penskoran
parsial dan penskoran holistik dapat dijelaskan bahwa untuk instrumen penilaian
pelaksanaan pembelajaran lebih baik untuk menggunakan penskoran parsial. Hal
ini terlihat pada kurva karakteristik item untuk penskoran parsial yang lebih
condong pada theta positif (lihat Gambar 57) dibandingkan dengan kurva
karakteristik item pada penskoran holistik (lihat Gambar 61). Hal ini juga
diperkuat dengan fungsi informasi butir yang menunjukkan bahwa penskoran
348
parsial lebih memiliki informasi yang tinggi dan SEM yang lebih rendah
dibanding dengan dengan penskoran holistik.
c. Karakteristik Instrumen Penilaian Kompetensi Sosial dan Kompetensi
Kepribadian (KSKK)
Pada uji coba II, karakteristik instrumen penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK) dibagi menjadi empat kelompok data. Data
pertama adalah instrumen KSKK dengan penskoran parsial untuk penilai dosen.
Data kedua adalah instrumen KSKK dengan penskoran parsial untuk penilai guru
pamong/penguji UKIN. Data ketiga adalah instrumen penilaian KSKK dengan
penskoran holistik untuk penilai dosen, dan data keempat adalah instrumen
penilaian KSKK dengan penskoran holistik penilai guru pamong/penguji UKIN.
Uraian keempat kelompok data tersebut pada uji coba II dikemukakan berikut.
Kepribadian (KSKK) Penskoran Parsial untuk Penilai Dosen
(KSKK) penskoran parsial untuk penilai dosen pada uji coba II dianalisis dengan
menggunakan pendekatan partial credit model (PCM) dengan penskoran 0, 1, 2,
3, dan 4. Melalui Program R dengan Extended Rasch Modeling (eRm) package
diperoleh hasil analisis berupa karakteristik item sebagai berikut.
349
Penilai Dosen

A1 0,59 -1,41 0,45 0,96 2,39
A2 0,59 -1,44 0,49 0,95 2,39
A3 0,57 -1,30 0,29 0,93 2,37
A4 0,51 -1,55 0,27 1,02 2,31
A5 0,60 -1,34 0,34 0,94 2,47
B6 0,65 -1,58 0,63 1,14 2,40
B7 0,66 -1,43 0,37 1,20 2,50
B8 0,62 -1,22 0,03 1,25 2,43
B9 0,67 -1,60 0,66 1,19 2,45
B10 0,61 -1,52 0,52 1,23 2,24
C11 0,58 -1,39 0,39 1,01 2,32
C12 0,55 -1,54 0,24 1,02 2,48
C13 0,60 -1,44 0,50 0,92 2,43
C14 0,54 -1,11 0,16 0,60 2,52
C15 0,56 -1,42 0,44 1,04 2,19
D16 0,64 -1,56 0,59 1,19 2,34
D17 0,66 -1,56 0,65 1,01 2,54
D18 0,57 -1,29 0,23 1,05 2,33
D19 0,67 -1,53 0,47 1,33 2,42
D20 0,65 -1,42 0,43 1,98 2,64
350
dicapai. Hal ini berarti bahwa pada instrumen SK semakin tinggi koefisien
pula. Hal lain yang dapat dijelaskan berdasarkan hasil analisis item dengan partial
credit model adalah kurva karakteristik item. Kurva karakteristik item
karakteristik item dari instrumen penilaian kompetensi sosial dan kompetensi
kepribadian (KSKK) penskoran parsial untuk penilai dosen pada uji coba II.

Sosial dan Kompetensi Kepribadian Penskoran Parsial Penilai Dosen
351
penskoran parsial untuk penilai dosen pada uji coba II yaitu item 7. Jika dikaitkan
dengan hasil kaliberasi item pada Tabel 58, dapat dijelaskan bahwa pada dasarnya
item 7 ini memiliki parameter lokasi sebesar 0,66 dengan parameter threshold ᵟ1
sebesar -1,43, threshold ᵟ2 sebesar 0,37, threshold ᵟ3 sebesar 1,20, serta threshold
ᵟ4 sebesar 2,50. Secara grafis threshold ᵟi dapat diinterpretasikan sebagai
diperlukan kemampuan (  ) sekitar 0,37 hingga 1,20. Pada bagian ini hanya
kepribadian (KSKK) penskoran parsial untuk penilai dosen dapat diamati pada
Lampiran 8 halaman 603. Lebih lanjut karakteristik instrumen disajikan dalam
fungsi informasi sebagai berikut.
Gambar 86. Fungsi Informasi Instrumen Kompetensi Sosial dan Kompetensi

kepribadian Penskoran Parsial Penilai Dosen
352
kualitas instrumen penilaian kompetensi sosial dan kompetensi kepribadian
(KSKK) penskoran parsial pada uji coba II untuk penilai dosen adalah nilai fungsi
informasi instrumen. Fungsi informasi pada dasarnya menunjukkan sejauhmana
instrumen yang telah dikembangkan dapat memberi informasi maksimal jika
dikenakan pada kemampuan (  ) tertentu. Berikut ini disajikan fungsi informasi
(NIF) instrumen penilaian kompetensi sosial dan kompetensi kepribadian (KSKK)
penskoran parsial untuk penilai dosen yang dihubungkan dengan Standard Error
of Measurement (SEM).
Kompetensi Sosial dan Kompetensi Kepribadian Penskoran Parsial
Penilai Dosen
penskoran parsial untuk penilai dosen. Gambar tersebut menunjukkan grafik nilai
informasi dan kesalahan pengukuran. Kedua grafik fungsi ini bertemu pada skala
353
66 tersebut adalah nilai fungsi informasi instrumen sebesar 12,9 pada skala
kemampuan (  ) -1,4. Hambleton, Swaminathan & Rogers (1991: 94); Retnawati
(2014: 19) menyatakan bahwa nilai fungsi informasi memiliki hubungan yang
besar nilai informasi maka SEM akan semakin kecil atau sebaliknya. Jika berdasar
pada pendapat tersebut, maka dapat dijelaskan bahwa dengan diketahuinya nilai
fungsi informasi sebesar 12,9, maka koefisien kesalahan pengukuran (SEM)
diperoleh sebesar 0,27.
dianalisis dengan menggunakan pendekatan partial credit model (PCM) dengan
penskoran 0, 1, 2, 3, dan 4. Melalui Program R dengan Extended Rasch Modeling
(eRm) package diperoleh hasil analisis berupa karakteristik item sebagai berikut.
354
untuk Penilai Guru pamong/penguji UKIN

A1 0,61 -1,36 0,50 0,86 2,45
A2 0,55 -1,63 0,53 0,91 2,41
A3 0,60 -1,41 0,57 0,88 2,39
A4 0,58 -1,24 0,25 1,00 2,33
A5 0,60 -1,24 0,32 0,83 2,51
B6 0,60 -1,78 0,73 1,00 2,44
B7 0,67 -1,38 0,38 1,18 2,52
B8 0,58 -1,42 0,06 1,23 2,46
B9 0,62 -1,81 0,74 1,06 2,50
B10 0,63 -1,45 0,49 1,22 2,27
C11 0,59 -1,35 0,49 0,84 2,38
C12 0,57 -1,51 0,29 1,00 2,51
C13 0,57 -0,97 -0,03 0,79 2,49
C14 0,56 -1,05 0,16 0,60 2,54
C15 0,52 -1,61 0,46 1,04 2,21
D16 0,59 -1,69 0,50 1,21 2,37
D17 0,68 -1,47 0,58 1,03 2,57
D18 0,60 -1,28 0,30 1,05 2,35
D19 0,71 -1,69 0,88 1,24 2,41
D20 0,68 -1,43 0,55 0,96 2,65
355
dicapai. Hal ini berarti bahwa pada instrumen penilaian kompetensi sosial dan
kepribadian semakin tinggi koefisien location maka semakin sulit item tersebut
dengan sebaran threshold yang merupakan kategori tingkat pencapaiannya.
Semakin tinggi threshold maka semakin sulit dicapai ambang batas tersebut,
sehingga peserta yang memiliki kemampuan rendah tentu hanya mampu mencapai
threshold (ambang kategori) yang rendah pula, peserta yang memiliki kemampuan
menengah hanya mampu mencapai threshold (ambang kategori) yang menengah
hingga pada peserta yang berkemampuan tinggi tentu mampu mencapai kategori
ambang batas yang tinggi pula. Hal lain yang dapat dijelaskan berdasarkan hasil
analisis item dengan partial credit model adalah kurva karakteristik item. Kurva
karakteristik item digambarkan untuk memudahkan memahami hubungan antara
setiap threshold ᵟi yang merupakan tingkat kesulitan dengan kemampuan peserta
untuk mencapai skor atau kategori tertentu. Berikut ini disajikan salah satu contoh
kurva karakteristik item dari instrumen penilaian tersebut untuk penilai guru

Penskoran Parsial Penilai Guru pamong/penguji UKIN
356
penskoran parsial untuk penilai guru pamong/penguji UKIN pada uji coba II yaitu
item 18. Jika dikaitkan dengan hasil kaliberasi item pada Tabel 59, dapat
dijelaskan bahwa pada dasarnya item 18 ini memiliki parameter lokasi sebesar
0,60 dengan parameter threshold ᵟ1 sebesar -1,28, threshold ᵟ2 sebesar 0,30,
threshold ᵟ3 sebesar 1,05, serta threshold ᵟ4 sebesar 2,41. Secara grafis threshold ᵟi
dapat diinterpretasikan sebagai perpotongan kurva setiap kategori. Dari gambar
tersebut dapat dijelaskan bahwa untuk mencapai kategori 2 atau untuk
memperoleh skor 2 pada item 18 maka diperlukan kemampuan (  ) sekitar 0,30
hingga 1,05 Pada bagian ini hanya diberikan contoh untuk item 18. Secara lebih
jelasnya kurva karakteristik untuk semua item pada instrumen penilaian rencana
kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran parsial penilai
guru pamong/penguji UKIN dapat diamati pada Lampiran 8 halaman 608. Lebih
lanjut karakteristik instrumen disajikan dalam fungsi informasi sebagai berikut.
Gambar 89. Fungsi Informasi Instrumen kompetensi sosial dan kepribadian

penskoran parsial Penilai Penguji UKIN
357
(KSKK) penskoran parsial untuk penilai guru pamong/penguji UKIN pada uji
coba II adalah nilai fungsi informasi instrumen. Fungsi informasi pada dasarnya
menunjukkan sejauhmana instrumen yang telah dikembangkan dapat memberi
informasi maksimal jika dikenakan pada kemampuan (  ) tertentu. Berikut ini
disajikan fungsi informasi (NIF) instrumen penilaian kompetensi sosial dan
kompetensi kepribadian (KSKK) penskoran parsial untuk penilai guru
pamong/penguji UKIN yang dihubungkan dengan SEM.
Gambar 90. Fungsi Informasi Instrumen Penilaian Kompetensi Sosial

Kepribadian (KSKK) Penskoran Parsial Penilai Guru
pamong/penguji UKIN
penskoran parsial untuk penilai guru pamong/penguji UKIN. Gambar tersebut
menunjukkan grafik nilai informasi dan kesalahan pengukuran. Kedua grafik
fungsi ini bertemu pada skala kemampuan -3,8 dan 0,9. Di antara dua kemampuan
358
ini, instrumen memiliki nilai informasi yang lebih tinggi dibandingkan dengan
besar dibandingkan dengan informasi yang diberikannya. Hal lain yang dapat
dijelaskan dari Gambar 67 tersebut adalah nilai fungsi informasi instrumen
sebesar 12,9 pada skala kemampuan (  ) -1,4. Hambleton, Swaminathan & Rogers
(1991: 94); Retnawati (2014: 19) menyatakan bahwa nilai fungsi informasi
kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka dapat dijelaskan
bahwa dengan diketahuinya nilai fungsi informasi sebesar 12,9, maka koefisien
kesalahan pengukuran (SEM) diperoleh sebesar 0,27.
Kepribadian (KSKK) Penskoran Holistik untuk Penilai Dosen
kepribadian (KSKK) penskoran holistik untuk penilai dosen dianalisis dengan
menggunakan pendekatan graded response modeling (GRM) dengan penskoran 1,
2, 3, dan 4. Melalui Program R dengan latent trait model (ltm) package diperoleh
359
Sosial dan Kompetensi Kepribadian (KSKK) Pembelajaran
Item a b1 b2 b3
A1 1,31 -2,26 -1,04 0,60
A2 1,19 -2,39 -1.14 0,41
A3 1,38 -2,16 -1,05 0,57
A4 1,22 -2,47 -1,10 0,57
A5 1,17 -2,32 -1,14 0,69
B6 1,19 -2,19 -0,93 0,69
B7 1,25 -2,28 -0,90 0,75
B8 1,18 -2,61 -0,97 0,72
B9 1,17 -2,18 -0,89 0,75
B10 1,55 -1,74 -0,79 0,51
C11 1,51 -2,08 -0,93 0,53
C12 1,48 -2,19 -0,94 0,65
C13 1,27 -2,26 -1,07 0,64
C14 1,30 -2,56 -1,34 0,63
C15 1,57 -2,04 -0,92 0,45
D16 1,72 -1,81 -0,74 0,55
D17 1,54 -1,91 -0,84 0,69
D18 1,53 -1,88 -0,93 0,54
D19 1,72 -1,61 -0,64 0,64
D20 1,61 -1,92 -0,88 0,73
karakteristik item. Kurva karakteristik item digambarkan untuk memudahkan
memahami hubungan antara setiap bi yang merupakan tingkat kesulitan dengan
360
kemampuan peserta untuk mencapai skor atau kategori tertentu. Berikut ini
penilai dosen pada uji coba II.

Sosial Kepribadian (KSKK) Penskoran Holistik untuk Penilai Dosen
penskoran holistik untuk penilai dosen pada uji coba II yaitu item 16. Jika
dasarnya item 16 ini memiliki parameter daya beda ai sebesar 1,72 dengan
361
holistik untuk penilai dosen dapat diamati pada Lampiran 8 halaman 612. Lebih
lanjut karakteristik instrumen dapat disajikan dalam fungsi informasi sebagai
berikut.
Gambar 92. Fungsi Informasi Instrumen Kompetensi Sosial dan Kompetensi

Kepribadian Penskoran Holistik Penilai Dosen
kualitas instrumen kompetensi sosial dan kompetensi kepribadian (KSKK)
penskoran holistik untuk penilai dosen adalah nilai fungsi informasi instrumen.
holistik untuk penilai dosen pada uji coba II yang dihubungkan dengan Standard
Error of Measurement (SEM).
362
Penilaian KSKK Penskoran Holistik Penilai Dosen
penskoran holistik untuk penilai dosen. Gambar tersebut menunjukkan grafik nilai
fungsi informasi instrumen sebesar 10,7 pada skala kemampuan (  ) -0,9.
bahwa nilai fungsi informasi memiliki hubungan yang berbanding terbalik dengan
363
akan semakin kecil atau sebaliknya. Jika berdasar pada pendapat tersebut, maka
maka koefisien kesalahan pengukuran (SEM) diperoleh sebesar 0,3.
dianalisis dengan menggunakan pendekatan graded response modeling (GRM)
dengan penskoran 1, 2, 3, dan 4. Melalui Program R dengan latent trait model
(ltm) package diperoleh hasil analisis berupa karakteristik item sebagai berikut.

Sosial dan Kompetensi Kepribadian Penskoran Holistik untuk
Penilai Guru pamong/penguji UKIN
Item a b1 b2 b3
A1 1,33 -2,25 -1,12 0,60
A2 1,21 -2,37 -1,14 0,64
A3 1,38 -2,16 -1,06 0,57
A4 1,22 -2,48 -1,12 0,57
A5 1,21 -2,33 -1,15 0,69
B6 1,19 -2,20 -1,03 0,69
B7 1,25 -2,28 -0,91 0,75
B8 1,18 -2,61 -0,98 0,72
B9 1,21 -2,14 -0,95 0,74
B10 1,56 -1,73 -0,79 0,52
C11 1,57 -2,05 -1,00 0,53
C12 1,47 -2,20 -0,95 0,65
C13 1,25 -2,41 -1,27 0,65
C14 1,30 -2,56 -1,35 0,64
C15 1,56 -2,05 -0,94 0,45
D16 1,71 -1,81 -0,75 0,56
D17 1,55 -1,91 -0,84 0,70
D18 1,53 -1,88 -0,94 0,55
D19 1,72 -1,61 -0,65 0,64
D20 1,61 -1,92 -0,89 0,73
364
karakteristik item. Kurva karakteristik item digambarkan untuk memudahkan
memahami hubungan an+tara setiap bi yang merupakan tingkat kesulitan dengan
kemampuan peserta untuk mencapai skor atau kategori tertentu. Berikut ini
kompetensi sosial dan kompetensi kepribadian (KSKK) penskoran holistik penilai
guru pamong/penguji UKIN pada uji coba II.

Sosial Kepribadian Penskoran Holistik Penilai Guru pamong/penguji
UKIN
365
penskoran holistik untuk penilai guru pamong/penguji UKIN pada uji coba II
yaitu item 12. Jika dikaitkan dengan hasil kaliberasi item pada Tabel 53, dapat
dijelaskan bahwa pada dasarnya item 12 ini memiliki parameter daya beda ai
sebesar 1,47 dengan parameter b1 sebesar -2,20, b2 sebesar -0,95, serta b3 sebesar
0,65. Secara grafis bi atau tingkat kesulitan dapat diinterpretasikan sebagai
dapat diamati pada Lampiran 8 halaman 615. Lebih lanjut karakteristik instrumen
dapat disajikan dalam fungsi niformasi sebagai berikut.
Gambar 95. Fungsi Informasi Instrumen kompetensi sosial dan kompetensi

kepribadian Penskoran Holistik Penilai Guru Pamong/Penguji UKIN
366
(KSKK) penskoran holistik untuk penilai guru pamong/penguji UKIN adalah nilai
fungsi informasi instrumen. Fungsi informasi pada dasarnya menunjukkan
sejauhmana instrumen yang telah dikembangkan dapat memberi informasi
maksimal jika dikenakan pada kemampuan (  ) tertentu. Berikut ini disajikan
fungsi informasi (NIF) instrumen penilaian kompetensi sosial dan kompetensi
pada uji coba II yang dihubungkan dengan SEM.
KSKK Penskoran Holistik Penilai Guru pamong/penguji UKIN
penskoran holistik untuk penilai guru pamong/penguji UKIN pada uji coba II.
Gambar tersebut menunjukkan grafik nilai informasi (NIF) dan kesalahan
pengukuran (SEM) dimana pada kurva untuk NIF ditunjukkan oleh garis
367
melengkung ke atas dan SEM ditunjukkan oleh garis putus-putus. Kedua grafik
fungsi ini bertemu pada skala kemampuan -3,1 dan 1,2. Di antara dua kemampuan
ini, instrumen memiliki nilai informasi yang lebih tinggi dibandingkan dengan
besar dibandingkan dengan informasi yang diberikannya.
dijelaskan bahwa dengan diketahuinya nilai fungsi informasi sebesar 10, maka
karakteristik item untuk instrumen penilaian kompetensi sosial kepribadian
penskoran parsial dan penskoran holistik dapat dijelaskan bahwa untuk instrumen
penilaian kompetensi sosial kepribadian lebih baik untuk menggunakan penskoran
parsial. Hal ini terlihat pada kurva karakteristik item untuk penskoran parsial yang
lebih condong pada theta positif (lihat Gambar 65) dibandingkan dengan kurva
karakteristik item pada penskoran holistik (lihat Gambar 68). Hal ini juga
diperkuat dengan fungsi informasi butir yang menunjukkan bahwa penskoran
368
parsial lebih memiliki informasi yang tinggi dan SEM yang lebih rendah
dibanding dengan dengan penskoran holistik.
D. Kajian Produk Akhir
Pada sub-bab sebelumnya telah diuraikan hasil penelitian ini secara detil.
Untuk memaknai hasil penelitian tersebut, maka pada sub-bab ini dilakukan
pembahasan hasil penelitian. Pembahasan hasil penelitian ini juga mengacu pada
permasalahan yang telah dirumuskan dibagian awal penelitian ini. Permasalahan
tersebut terkait dengan konstruk instrumen model penilaian PPG dengan
penskoran parsial dan holistik, validitas dan reliabilitas dari model penilaian PPG
dengan penskoran parsial dan holistik, instrumen model penilaian PPG dengan
penskoran parsial dan holistik, serta hasil penskoran parsial dan holistik dalam
pengembangan model penilaian PPG pada praktik mengajar. Pembahasan terkait
hasil penelitian tersebut diuraikan sebagai berikut.
1. Konstruk Model Penilaian PPG dengan Penskoran Parsial dan Holistik
Hasil penelitian ini telah mendeskripsikan bahwa terdapat tiga instrumen
yang telah dikembangkan pada model penilaian PPG. Ketiga instrumen tersebut
antara lain: instrumen penilaian RPP, instrumen penilaian pelaksanaan
pembelajaran, serta instrumen penilaian kompetensi sosial dan kompetensi
kepribadian. Pada instrumen penilaian RPP telah menghasilkan konstruk dengan
empat indikator yang diukur oleh 25 buah item penilaian.
Indikator perumusan indikator pencapaian kompetensi dan capaian
pembelajaran (PIPKC) diukur oleh enam item. Item tesebut terdiri atas:
369
kelengkapan penulisan identitas RPP, kelengkapan penilisan KI, kesesesuaian dan
kejelasan rumusan indikator pencapaian kompetensi dengan kompetensi dasar
(KD), Kejelasan rumusan indikator pencapaian kompetensi menggunakan kata
kerja yang dapat diukur dan/atau diamati, kesesuaian dan kejelasan rumusan
tujuan pembelajaran dengan indikator pencapaian kompetensi, serta kelengkapan
rumusan tujuan pembelajaran memenuhi kriteria ABCD (Audience, Behavior,
Condition, Degree).
Hasil penelitian ini relevan dengan pendapat Archer & Hughes (2011)
bahwa secara eksplisit guru perlu memiliki kemampuan memilih materi belajar
yang harus diajarkan serta menetapkan kriteria keberhasilan pembelajaran dan
memberitahukan kriteria tersebut kepada peserta didik. Pandangan ini
menunjukkan bahwa salah satu kemampuan yang harus dimiliki oleh guru adalah
kemampuan dalam merumuskan kompetensi serta menetapkan capaian
pembelajaran. Hal ini bermakna bahwa untuk mengetahui kualitas perencanaan
pembelajaran yang dilakukan oleh guru, maka perlu mengukur kemampuan guru
dalam merumuskan kompetensi serta menetapkan capaian pembelajaran.
Indikator pengorganisasian materi, metode, media dan sumber belajar
(PMMMS) diukur oleh enam item. Item tersebut terdiri atas: kesesuaian dan
kejelasan materi dengan tujuan pembelajaran, ketepatan dan kelengkapan
penyusunan materi dan bahan ajar, kesesuaian pemilihan metode pembelajaran
dengan KD, karakteristik materi dan karakteristik peserta didik, kesesuaian
langkah-langkah/sintaks pembelajaran dengan strategi pembelajaran dan materi
yang diajarkan, kesesuaian media dan sumber belajar dengan tujuan pembelajaran,
370
materi, kondisi kelas dan ketepatan pemilihan spesifikasinya, serta kelayakan
media dan sumber belajar yang digunakan.
Hasil penelitian tersebut didukung oleh Orazbayeva (2016) bahwa
idealnya guru harus memiliki kemampuan effective teaching practices yaitu
melaksanakan praktik mengajar yang efektif dengan cara: 1) mengidentifikasi,
memilih dan menerapkan berbagai strategi mengajar yang dapat membantu
peserta didik terlibat aktif dalam pembelajaran, 2) melakukan aktivitas
pembelajaran secara bervariasi atau tidak monoton, 3) mengidentifikasi masalah
yang dihadapi peserta didik dan membantunya dalam memecahkannya, 4)
membantu peserta didik menggunakan sumber belajar, 5) memberikan banyak
kesempatan kepada peserta didik untuk bertanya, mempraktekkan dan berinterkasi
dengan peserta didik lainnya. Kedua dimensi ini memiliki keterkaitan satu sama
lain dalam menunjang keberhasilan pembelajaran yang dilaksanakan guru.
Pandangan tersebut menunjukkan pentingnya pengorganisasian materi,
metode, media dan sumber belajar. Guru yang ideal adalah mereka yang mampu
mengorganisasikan materi dengan baik, memilih metode pembelajaran dengan
tepat serta menentukan sumber belajara yang dapat mendukung ketercapaian
tujuan pembelajaran. Oleh karena itu, untuk mengetahui kualitas perencanaan
pembelajaran yang dilakukan oleh guru, maka perlu mengukur kemampuannya
dalam mengorganisasikan materi , memilih metode pembelajaran serta menetukan
sumber belajar secara tepat.
Indikator pengorganisasian proses, penilaian dan evaluasi pembelajaran
(PPPEP) diukur oleh enam item. Item tersebut terdiri atas: kelengkapan dan
371
kejelasan langkah-langkah kegiatan pembelajaran, kejelasan skenario
pembelajaran menggambarkan active learning, kejelasan skenario pembelajaran
mencerminkan saintific learning, kesesuaian teknik penilaian dengan indikator
pencapaian kompetensi dan kejelasan lingkup penilaian, kelengkapan komponen
penilaian yang digunakan, serta kejelasan rencana kegiatan pengayaan dan/atau
remedial.
Secara teoretik hasil penelitian tersebut didukung oleh pandangan Sanders,
et. al., (1990) mengemukakan bahwa menurut American Federation of Teachers
(AFT), National Council on Measurement in Education (NCME), dan National
Education Association (NEA) terdapat 7 (tujuh) standar lingkup peran dan
tanggung jawab guru dalam penilaian peserta didik yaitu: 1) terampil dalam
memilih metode penilaian, 2) terampil dalam mengembangkan metode penilaian,
3) terampil dalam merancang dan menafsirkan hasil penilaian, 4) terampil
menggunakan hasil penilaian, 5) terampil dalam mengembangkan prosedur
penilaian, 6) terampil dalam mengkomunikasikan atau menyampaikan hasil
penilaian, 7) terampil dalam mengenali metode penilaian yang tidak pantas, tidak
etis, illegal, dan menggunakan informasi penilaian.
Secara ringkas, pandangan Sanders, et. al., (1990) tersebut menegaskan
pentingnya pengorganisasian proses, penilaian dan evaluasi pembelajaran dalam
sebuah perencanaan pembelajaran. Hal ini sangat penting karena pengorganisasian
penilaian yang tepat tentu akan melahirkan hasil, informasi dan keputusan yang
tepat pula. Jika sejak awal pengorganiasasian penilaian sudah keliru, maka
keputusan terkait hasil penilaian yang dilakukan oleh guru juga suda pasti akan
372
keliru. Hal tersebut mendasari pentingnya pengorganisasian penilaian dan evaluasi
untuk menjadi indikator ukur dalam sebuah penilaian kualitas perencanaan
pembelajaran yang dikembangkan oleh guru.
Indikator lain pada konstruk instrumen penilaian RPP adalah penerapan
prinsip techno pedagogical content knowledge (PTPCK) diukur oleh tujuh item.
Item tersebut terdiri atas: kejelasan technological knowledge, kejelasan
pedagogical knowledge, kejelasan content knowledge, kejelasan technological
pedagogical knowledge, kejelasan technological content knowledge, kejelasan
pedagogical content knowledge, serta kejelasan technological pedagogical
content knowledge.
Hasil penelitian ini relevan dengan pandangan Widiawati & Hayati (2015);
Kemenristekdikti (2017b: 9) bahwa salah satu prinsip yang harus dipenuhi dalam
dalam perencanaan pembelajaran adalah berorientasi pada TPACK
(Technological Pedagogical and Content Knowledge) yaitu integrasi teknologi
informasi, pedagogi, dan content knowledge dalam proses pembelajaran. Selama
pengembangan perangkat pembelajaran perlu memastikan guru menerapkan
TPACK, ketika memilih dan menetapkan strategi, pendekatan ataupun model dan
media pembelajaran, harus memperhatikan karakteristik peserta didik, materi, dan
tujuan pembelajaran (Kemenristekdikti, 2017b: 12-13). Dosen juga perlu
memastikan mahasiswa untuk memanfaatkan IT untuk meningkatkan efektivitas
pembelajaran. Dosen perlu memberikan contoh bagaimana mengakomodasi
TPACK dalam pembelajaran. Untuk melaksanakan sistem pembelajaran tersebut
perlu memperhatikan prinsip-prinsip pembelajaran yang mendasarinya yaitu
373
belajar dengan melakukan, keaktifan, berpikir tingkat tinggi, dampak pengiring,
mekanisme balikan secara teratur, pemanfaatan teknologi informasi, pembelajaran
kontekstual, penggunaan multistrategi dan aneka sumber belajar, serta berorientasi
pada TPACK. Jika sistem dan prinsip-prinsip pembelajaran pada PPG
dilaksanakan secara sistematis dan teratur, maka kompetensi capaian
pembelajaran program PPG akan tercapai.
Pandangan tersebut, maka dapat dijelaskan bahwa integrasi teknologi
informasi, pedagogi, dan content knowledge dalam proses pembelajaran memiliki
peranan yang sangat penting sehingga hal tersebut harus dituangkan dalam
perencanaan pembelajaran. Oleh karena itu untuk mengetahui kualitas
perencanaan pembelajaran yang dikembangkan oleh guru, maka perlu mengukur
indikator Technological Pedagogical and Content Knowledge.
Berdasarkan beberapa uraian sebelumnya menunjukkan bahwa baik secara
empirik dalam hasil penelitian ini, maupun secara teoretik atau konsep yang telah
dirumuskan oleh temuan relevan sebelumnya maka dapat disimpulkan bahwa
untuk melakukan penilaian perencanaan pembelajaran maka konstruk indikator
ukur yang digunakan antara lain: perumusan indikator pencapaian kompetensi dan
capaian pembelajaran (PIPKC), pengorganisasian materi, metode, media dan
sumber belajar (PMMMS), pengorganisasian proses, penilaian dan evaluasi
pembelajaran (PPPEP), serta penerapan prinsip techno pedagogical content
knowledge (PTPCK).
Temuan lainnya yang diperoleh dalam pelaksanaan penelitian ini adalah
instrumen penilaian pelaksanaan pembelajaran. Secara empirik hasil penelitian ini
374
telah diperoleh instrumen penilaian pelaksanaan pembelajaran yang diukur oleh
empat indikator antara lain: melaksanakan pembelajaran yang mendidik (MPMD),
melaksanakan pembelajaran yang mencerdaskan (MPMC), memfasilitasi
pengembangan potensi diri dan karakter peserta didik (MPDK), serta menilai dan
mengevaluasi pembelajaran (MDMP).
Indikator melaksanakan pembelajaran yang mendidik (MPMD) diukur
oleh empat item. Item tersebut antara lain: menyiapkan peserta didik secara fisik
dan mental, memotivasi peserta didik, melakukan kegiatan appersepsi, serta
menyampaikan tujuan pembelajaran dan cakupan materi. Indikator melaksanakan
pembelajaran yang mencerdaskan (MPMC) diukur oleh tujuh item. Item tersebut
antara lain: menunjukkan penguasaan materi pembelajaran, mengaitkan materi
dengan sains, lingkungan, teknologi dan realitas kehidupan, melaksanakan
pembelajaran yang menggambarkan pendekatan active learning, melaksanakan
pembelajaran yang mencerminkan pendekatan saintific learning, melaksanakan
pembelajaran yang mencerminkan pendekatan problem based learning,
Menggunakan alat/bahan, media dan TIK secara efektif dan efisien, serta
menggunakan alat/bahan, media dan TIK yang menghasilkan pesan menarik.
Temuan penelitian tersebut didukung oleh pandangan Archer & Hughes
(2011) bahwa salah satu kemampuan yang harus dimiliki oleh guru ialah
menunjukkan kepada peserta didik belajar menggunakan pengetahuan dan
keterampilannya melalui pemodelan. Pandangan ini pada dasarnya mendukung
bahwa pelaksanaan pembelajaran harus mendidik dan mencerdaskan bagi peserta
didik. Temuan tersebut juga didukung oleh Orazbayeva (2016) bahwa guru harus
375
memiliki technology skill yaitu memiliki keterampilan dalam menggunakan
teknologi. Guru harus mengetahui kapan dan bagaimana menggunakan teknologi
pendidikan saat ini, serta mampu mengidentifikasi dan memilih yang paling
sesuai dengan materi yang diajarkan dan mampu memaksimalkan dengan waktu
pembelajaran yang ada. Hal ini menunjukkan bahwa menjadi seorang guru yang
berkualitas harus mampu menggunakan teknologi dalam pembelajaran.
Temuan penelitian selanjutnya pada instrumen penilaian pelaksanaan
pembelajaran adalah indikator memfasilitasi pengembangan potensi diri dan
karakter peserta didik (MPDK) yang diukur oleh empat item. Item tersebut antara
lain: menunjukkan sikap terbuka dan respon terhadap peserta didik, menunjukkan
hubungan yang kondusif dan kerjasama antar peserta didik, menggunakan bahasa
yang santun, serta menyampaikan pesan dengan gaya (gesture) yang sesuai.
Temuan tersebut didukung oleh Robinson & Campbell (2010); Yasin (2011); Nur,
(2014) bahwa kompetensi pedagogik secara khas mencirikan dan membedakan
profesi guru dengan profesi lainnya yaitu fokus pada penguasaan terhadap teori
perkembangan (termasuk memahami perkembangan peserta didik) dan teori-teori
belajar mutlak ada pada guru. Artinya untuk menjadi seorang guru yang memiliki
kompetensi pedagogik harus menyadari tujuan dalam pembelajaran dan mampu
mengelola proses pembelajaran. Beberapa padangan tersebut mendasari
pentingnya indikator memfasilitasi pengembangan potensi diri dan karakter
peserta didik (MPDK) diukur dalam aspek pelaksanaan pembelajaran.
Indikator terakhir pada instrumen pelaksanaan pembelajaran adalah
menilai dan mengevaluasi pembelajaran (MDMP). Hal tersebut tidak bisa
376
dinafikkan lagi bahwa salah satu komponen penting dalam pelaksanaan
pembelajaran adalah penilaian dan evaluasi pembelajaran. Indikator ini diukur
dengan lima item. Item tersebut antara lain: memantau kemajuan belajar peserta
didik selama proses pembelajaran, melakukan penilaian proses dan hasil sesuai
rencana dan tujuan pembelajaran, menindaklanjuti hasil penilaian selama
pembelajaran, melakukan refleksi, serta melakukan tindak lanjut.
Temuan tersebut didukung oleh Archer & Hughes (2011) bahwa secara
eksplisit guru perlu memiliki kemampuan melakukan evaluasi terhadap peserta
didik serta memberikan kesempatan perbaikan untuk memperoleh
pengetahuan/keterampilan jika diperlukan. Pandangan serupa juga didukung oleh
Orazbayeva (2016) yang mengemukakan bahwa idealnya guru harus menguasai
dimensi effective assessment yaitu melaksanakan penilaian yang efektif dengan
cara: 1) menyusun alat penilaian yang sesuai dengan tujuan pembelajaran, 2)
melaksanakan penilaian dengan berbagai jenis dan teknik penilaian, 3) melibatkan
peserta didik dalam kegiatan penilaian untuk membantu mereka menjadi sadar
akan kekuatan dan kelemahan mereka, 4) mendorong peserta didik memiliki
keinginan prestasi belajar yang tinggi, 5) memanfaatkan hasil penilaian dari
peserta didik dan merefleksikannya untuk meningkatkan pembelajaran
selanjutnya.
Berdasarkan beberapa uraian sebelumnya menunjukkan bahwa baik secara
empirik dalam hasil penelitian ini, maupun secara teoretik atau konsep yang telah
dirumuskan oleh temuan relevan sebelumnya maka dapat disimpulkan bahwa
untuk melakukan penilaian pelaksanaan pembelajaran maka konstruk indikator
377
ukur yang digunakan antara lain: melaksanakan pembelajaran yang mendidik
(MPMD), melaksanakan pembelajaran yang mencerdaskan (MPMC),
memfasilitasi pengembangan potensi diri dan karakter peserta didik (MPDK),
serta menilai dan mengevaluasi pembelajaran (MDMP).
Instrumen ke-tiga yang menjadi temuan pada penelitian ini adalah
instrumen penilaian kompetensi sosial dan kompetensi kepribadian. Berdasarkan
hasil penelitian ini, secara empirik telah diperoleh instrumen penilaian kompetensi
sosial dan kompetensi kepribadian yang diukur oleh empat indikator antara lain:
bekerjasama dan memiliki jiwa kepemimpinan (BMJK), bersikap inklusif, toleran
dan peduli (BITP), berkomunikasi dengan sesama (BKDS), bersikap sopan/
santun, mandiri, kreatif dan disiplin (BSMKD).
Secara konstruk berdasarkan temuan penelitian ini bahwa indikator
bekerjasama dan memiliki jiwa kepemimpinan (BMJK) diukur oleh lima item.
Item tersebut antara lain: menunjukkan sikap bekerjasama, menunjukkan sikap
berpartisipasi aktif, menunjukkan sikap dapat mengatur dan mau diatur orang lain,
menunjukkan sikap aktif dan bijaksana, serta menunjukkan perilaku yang
demokratis. Temuan tersebut didukung oleh Pahrudin, et.al., (2016) bahwa
kompetensi sosial adalah kompetensi yang berkaitan dengan hubungan antara
guru dan lingkungan atau kepentingan umum, orang-orang yang di sekolah atau
di luar sekolah, berkomunikasi dan berinteraksi dengan warga sekolah dan
memiliki nilai, perilaku dan etika. Ini berarti bahwa guru seharusnya memiliki
jiwa kepemimpinan yang berlandaskan pada nilai, perilaku dan etika. Hal tersebut
mendasari bahwa salah satu indikator penting dalam penilaian kompetensi sosial
378
kepribadian guru adalah kerjasama dan jiwa kepemimpinan yang telah
dikembangkan dan diuji dalam penelitian ini.
Indikator bersikap inklusif, toleran dan peduli (BITP) diukur oleh lima
item. Item tersebut antara lain: menunjukkan sikap menghargai perbedaan,
menunjukkan sikap empati terhadap sesama, menunjukkan sikap adil dan objektif,
menunjukkan sikap respon cepat tanggap, serta menunjukkan sikap suka
menolong. Indikator ini menitik beratkan pada inklusif, toleran dan kepedulian
guru. Temuan penelitian ini sejalan dengan temuan Piri et.al., (2016) bahwa
terdapat hubungan yang signifikan antara kompetensi kepribadian guru dengan
kinerja peserta didik. Jika guru ramah, perhatian, baik, teliti, terbuka, dan tidak
mudah emosi dapat meningkatkan kinerja belajar peserta didik. Dengan demikian
kompetensi kepribadian (termasuk inklusif, toleran dan peduli) menjadi sangat
penting untuk dinilai pada penguasaan kompetensi lulusan PPG. Adanya penilaian
pada kompetensi ini akan mampu membekali mereka memiliki kemampuan yang
berhubungan dengan sikap dan kepribadian yang harus dimiliki sebagai calon
guru.
Indikator lainnya yang menjadi temuan pada instrumen penilaian
kompetensi sosial kepribadian adalah berkomunikasi dengan sesama (BKDS)
diukur oleh lima item. Item tersebut antara lain: menunjukkan sikap santun dalam
berkomunikasi, menunjukkan sikap lemah lembut dalam berbicara, menunjukkan
kemampuan berbicara yang efektif, menunjukkan sikap supel dalam pergaulan,
serta menunjukkan sikap ramah dalam pergaulan. Temuan penelitian ini didukung
oleh pandangan Russian Federation Education Act dalam konsep Federal
379
Education Development Target Program for 2011-2015 disebutkan
perkembangan tuntutan pada guru meningkat, terutama kepribadian dari seorang
guru, tanggung jawab dan memiliki kemampuan yang komunikatif ditetapkan
sebagai prioritas dari pendidikan guru yang profesional (Olesova & Borisova,
2016). Hal serupa didukung oleh Cooper & Sawaf (1998: 227) bahwa
kemampuan guru ditentukan oleh cara berinteraksi dengan lingkungan melalui
komunikasi. Komunikasi sangat penting untuk bersosialisasi dan beradaptasi
dengan lingkungan sekitar dan situasi sosial. Temuan tersebut menunjukkan
bahwa guru yang ideal adalah mereka yang memiliki kemampuan berkomunikasi
dengan baik.
Indikator terakhir dalam instrumen penilaian kompetensi sosial
kepribadian adalah bersikap sopan/ santun, mandiri, kreatif dan disiplin
(BSMKD) diukur oleh lima item. Item tersebut antara lain: menunjukkan
kesopanan dalam berpakaian dan berpenampilan, menunjukkan kesantunan dalam
berperilaku dengan sesama, menunjukkan kemandirian dalam pembelajaran,
menunjukkan kreativitas dalam pembelajaran, serta menunjukkan kedisiplinan
dalam pembelajaran. Temuan penelitian ini sejalan dengan pendapat Pahrudin,
et.al., (2016) bahwa dalam melaksanakan tugasnya guru harus menjunjung nilai,
perilaku dan etika yang baik. Hal ini berarti bahwa perilaku, etika dan
kedisiplinan adalah komponen yang sangat penting diukur dalam kompetensi
sosial kepribadian guru.
Model penilaian PPG yang telah dikembangkan dalam penelitian ini
dituangkan dalam bentuk buku pedoman penilaian. Buku panduan penilaian ini
380
memuat 5 bab dan 1 set lampiran. Bab I membahas tentang pendahuluan. Pada
pendahuluan ini diuraikan latar belakang pentingnya penilaian PPG, landasan
hukum PPG, tujuan dan manfaat PPG, ruang lingkup penilaian PPG, dan sasaran
pengguna model yang dikembangkan.
Pada Bab II membahas tentang sistem penilaian program PPG. Pada
bagian ini diuraikan tentang konsep penilaian, prinsip penilaian, acuan penilaian,
dan teknik penilaian yang digunakan. Pembahasan konsep ini dimaksudkan untuk
memberi pemahaman kepada sasaran pengguna terkait dengan konsep sistem
penilaian yang ideal dalam pelaksanaan pengukuran dan penilaian.
Hal selanjutnya adalah Bab III yang membahas tentang mekanisme
penilaian. Bagian ini lebih banyak membahas tentang bagaimana menerapkan
model penilaian PPG secara praktis. Untuk memberikan pemahaman kepada
sasaran pengguna, maka pada bagian ini diuraikan tentang lingkup penilaian,
teknik penilaian, bentuk penilaian, dan kelulusan peserta. Bab ini yang menjadi
pedoman bagaimana menerapkan model ini di lapangan dari proses hingga akhir.
Bab IV membahas tentang penskoran dan interpretasi. Penskoran adalah
sala satu bagian yang paling penting dalam sebuah pelaksanaan penilaian, karena
pada penskoran penilai mulai melakukan kuantifikasi. Untuk memaknai hasil
penskoran tersebut maka dibutuhkan pedoman interpretasi. Pada bagian ini
disajikan tentang penskoran parsial. Selain itu, di bab ini juga disajikan tentang
penskoran holistik. Dua bentuk penskoran tersebut yang mendasari model
penilaian PPG ini secara umum.
381
Bagian terakhir adalah Bab V. Pada bagian ini diuraikan pernyataan secara
umum tentang penilaian PPG, serta saran pengembang model terhadap sasaran
pengguna untuk menggunakan model penilaian PPG yang telah dikembangkan
ini. Selain itu, untuk memudahkan pengguna memahami model penilaian yang
telah dikembangkan, maka disertakan contoh lampiran instrumen penilaian yang
dapat dipelajari dan digunakan oleh pengguna. Secara umum inti dari buku
panduan ini adalah untuk memudahkan pengguna untuk menerapkan model
penilaian ini meskipun tidak bertemu langsung dengan pengembang model.
Secara keseluruhan model ini telah diberikan kepada expert untuk dinilai
relevansi dan kelayakannya. Expert atau ahli yang dilibatkan untuk menilai model
ini secara keseluruhan sebanyak 7 orang yang telah dipilih secara purposive
berdasarkan keahliannya. Indikator penilaian meliputi ketepatan pendahuluan,
relevansi sistem penilaian program PPG, kejelasan mekanisme penilaian program
PPG, ketepatan penskoran dan interpretasi, kejelasan hasil penilaian program
PPG, pendukung penyajian, akurasi dan kemutakhiran. Hasil penilaian terkait
dengan kelayakan model penilaian PPG disajikan sebagai berikut.
382
Gambar 97. Hasil Penilaian Buku Panduan Model Penilaian PPG
Keterangan:
Indikator 1 : Ketepatan pendahuluan
Indikator 2 : Relevansi sistem penilaian program PPG
Indikator 3 : Kejelasan mekanisme penilaian program PPG
Indikator 4 : Ketepatan penskoran dan interpretasi
Indikator 5 : Kejelasan hasil penilaian program PPG
Indikator 6 : Pendukung penyajian
Indikator 7 : Akurasi dan kemutakhiran
Gambar 97 menyajikan informasi bahwa dari tujuh pakar menunjukkan
kecenderungan untuk sepakat pada tujuh indikator penilaian dan menyimpulkan
bahwa buku panduan yang telah dikembangkan sebagai bagian yang tidak
terpisahkan dari model penilaian PPG yang telah dikembangkan telah memenuhi
unsur relevansi dan kelayakan. Hal ini dapat dilihat dari rata-rata penilaian pakar
berada pada skor 4 ke atas. Temuan empirik tersebut menjadi dasar untuk
menyatakan bahwa model penilaian PPG yang telah dikembangkan baik dari
aspek instrumen, maupun dari aspek buku panduan telah layak digunakan dan
disebarkan pada sasaran pengguna.
383
Berdasarkan pembahasan penelitian terkait dengan konstruk model
penilaian PPG, maka dapat dijelaskan bahwa baik secara empirik maupun secara
teoretik pada penelitian ini dapat mendukung asumsi pengembangan yang telah
dirumuskan sebelumnya yakni jika teori yang relevan digunakan untuk membuat
konstruk, indikator yang dinilai dapat diukur dan diamati, maka model penilaian
PPG dengan penskoran parsial dan holistik yang dikembangkan telah memiliki
acuan kerangka teoretik yang cocok dan sesuai dengan kebutuhan.
2. Validitas dan Reliabilitas Model Penilaian PPG dengan Penskoran
Parsial dan Holistik
Salah satu hal yang menjadi kajian dalam pengembangan model penilaian
PPG pada penelitian ini adalah validitas dan reliabilitas dari model penilaian PPG.
Validitas yang dimaksud adalah validitas isi yang diperoleh dari penilaian ahli
melalui perhitungan Aiken Index serta validtas konstruk melalui analisis faktor
konfirmatori. Adapun reliabilitas diperoleh dengan reliabilitas  dengan berbasis
pada muatan faktor.
Temuan penelitian ini menunjukkan bahwa ditinjau dari aspek validitas isi
semua item-item untuk instrumen penilaian RPP, instrumen penilaian pelaksanaan
pembelajaran dan instrumen penilaian kompetensi sosial dan kompetensi
kepribadian telah valid secara isi berdasarkan penilaian oleh ahli/pakar. Hal ini
menunjukkan bahwa seluruh item yang adalah dalam instrumen pada model
penilaian PPG telah mengukur kontennya atau item-item tersebut telah mengukur
indikator-indikatornya berdasarkan penilaian pakar melalui pertimbangan
keahliannya.
384
Validitas isi secara teoretis, menunjukkan ketepatan sampling butir dapat
mengukur isi (content) pengujiannya, mengukur derajat kesepakatan para ahli dari
satu item yang dapat menggambarkan tingkat validitas isi melalui (Lawshe, 1975).
Artinya, jika item memenuhi validitas isi, maka item tersebut dapat dikatakan
sudah mengukur aspek isi substansi secara tepat. Hal serupa dijelaskan oleh
Nunally (1978); Fernandes (1984); Retnawati (2017) yang mengemukakan bahwa
validitas isi suatu instrumen menunjukkan sejauh mana butir-butir instrumen
mewakili komponen-komponen dalam kawasan isi objek yang hendak diukur dan
sejauh mana butir-butir itu mencerminkan ciri perilaku yang hendak diukur.
Jika pandangan tersebut dikaitkan dengan temuan hasil penelitian ini,
maka dapat disimpulkan bahwa instrumen pada model penilaian PPG telah
memiliki butir-butir yang dapat mewakili komponen-komponen dalam kawasan
kemampuan yang hendak diukur yang meliputi: kemampuan merencanakan
pembelajaran, kemampuan melaksanakan pembelajaran, serta komptensi sosial
dan kompetensi kepribadian. Selain itu juga dapat dijelaskan bahwa insrumen
pada model penilaian PPG telah mencerminkan perilaku guru yang hendak diukur.
Aspek selanjutnya yang menjadi unit analisis pada penelitian ini adalah
kualitas instrumen model penilaian PPG ditinjau berdasarkan validitas konstruk.
Hasil penelitian ini menunjukkan bahwa seluruh item-item dalam instrumen yang
dikembangkan, baik instrumen penilaian RPP, instrumen penilaian pelaksanaan
pembelajaran, maupun instrumen penilaian kompetensi sosial dan kompetensi
kepribadian telah valid secara konstruk berdasarkan kriteria-kriteria validitas
konstruk suatu instrumen. Secara konseptual Nunally (1978); Fernandes (1984);
385
Retnawati (2017) mengemukakan bahwa validitas konstruk menunjukkan sejauh
mana instrumen mengungkap suatu kemampuan atau konstruk teoretis tertentu
yang hendak diukur. Jika pandangan tersebut dikaitkan dengan temuan penelitian
ini maka dapat dijelaskan bahwa instrumen model penilaian PPG yang telah
dikembangkan ini telah mampu mengungkap konstruk teoretis dari kemampuan
PPG yang hendak diukur.
Temuan penelitian ini juga didukung oleh pendapat Furr & Bacharach
(2013: 221) mengemukakan bahwa validitas konstruk mengacu pada sejauh mana
skor hasil pengukuran mencerminkan konstruk psikologis yang diukur. Artinya
jika suatu instrumen telah terbukti valid secara konstruk, maka instrumen tersebut
telah mencerminkan konstruk psikologi yang ingin diukur. Pada kaitannya dengan
penelitian ini, maka instrumen pada model PPG sudah mampu mencerminkan
kemampuan guru atau peserta PPG yang hendak diukur seperti kemampuan
merencanakan pembelajaran, kemampuan melaksanakan pembelajaran serta
kompetensi sosial dan kompetensi kepribadian yang diharapkan.
Aspek lain yang menjadi unit analisis pada model penilaian PPG adalah
reliabilitas instrumen. Berdasarkan hasil penelitian ini menunjukkan temuan
bahwa seluruh instrumen yang telah dikembangkan pada penelitian ini (instrumen
penilaian RPP, instrumen penilaian pelaksanaan pembelajaran, maupun instrumen
penilaian kompetensi sosial dan kompetensi kepribadian) telah reliabel. Temuan
ini didukung oleh pendapat Ziegler and Detje (2013) menjelaskan bahwa
reliabilitas menggambarkan konsistensi keseluruhan pengukuran meskipun
diberikan beberapa kali. Pengukuran yang memiliki realibilitas tinggi dikatakan
386
sebagai pengukuran yang reliabel. Reliabilitas sendiri mempunyai nama lain
seperti keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi, dan
sebagainya. Namun demikian, ide pokok yang terkandung dalam konsep
realibilitas adalah sejauhmana hasil suatu pengukuran dapat dipercaya.
Hal serupa didukung oleh Mehrens & Lehmann (1973) dan Retnawati
(2017) bahwa alat ukur yang reliabel akan memberikan hasil pengukuran yang
stabil dan konsisten. Artinya suatu alat ukur dikatakan memiliki koefisien
reliabilitas tinggi manakala digunakan digunakan untuk mengukur hal yang sama
pada waktu berbeda dan hasilnya sama atau mendekati sama. Berdasarkan temuan
penelitian ini dapat dijelaskan bahwa koefisien reliabilitas untuk semua instrumen
berada pada rentang sekitar 0,93 hingga 0,97. Hal tersebut menjadi bukti bahwa
instrumen yang telah dikembangkan telah menunjukkan suatu kestabilan serta
konsistensi hasil pengukuran.
Lebih lanjut Retnawati (2017) berpendapat bahwa reliabilitas juga terkait
dengan kesalahan pengukuran. Reliabilitas tinggi menunjukkan kesalahan
pengukuran yang kecil dalam memperoleh hasil pengukuran. Semakin besar
reliabilitas suatu instrumen, akan semakin kecil kesalahan pengukurannya
demikian pula sebaliknya. Jika pendapat tersebut dikaitkan dengan hasil penelitian
ini yang menunjukkan koefisien reliabilitas untuk semua instrumen berada pada
rentang sekitar 0,93 hingga 0,97, maka dapat disimpulkan bahwa reliabilitas
instrumen model penilaian PPG cukup tinggi sehingga kesalahan pengukurannya
pun sangat kecil. Ini menunjukkan suatu hal yang positif dalam hal
pengembangan instrumen serta hal ini salah satu yang mendasari peneliti untuk
387
menyimpulkan bahwa instrumen telah baku dan layak digunakan lebih lanjut
dengan kualitas yang baik.
Berdasarkan pembahasan tersebut yakni melalui hubungan antara hasil
penelitian secara empirik serta dukungan-dukungan konsep secara teoretik maka
asumsi pengembangan sebelumnya pada penelitian ini semakin terbukti bahwa
jika model penilaian PPG dengan penskoran parsial dan holistik yang
dikembangkan dari penelitian ini dapat dibuktikan validitas dan diestimasi
reliabilitas instrumennya, maka model penilaian PPG tersebut mampu menilai
penguasaan kemampuan akademik dan penguasaan kemampuan profesional
peserta yaitu kompetensi pedagogik, kompetensi profesional, kompetensi
kepribadian dan kompetensi sosial.
3. Karakteristik Model Penilaian PPG dengan Penskoran Parsial dan
Holistik
Hasil penelitian ini telah mengembangkan instrumen model penilaian
PPG berdasarkan pada dua teknik penskoran. Kedua teknik penskoran tersebut
yang dimaksud adalah instrumen dengan penskoran parsial dan instrumen dengan
penskoran holistik. Pada penskoran parsial menggunakan skala penilaian 0, 1, 2,
3, dan 4, sementara untuk penskoran holistik menggunakan skala penilaian 1, 2, 3,
dan 4. Lebih lanjut pada penskoran parsial dianalisis dengan menggunakan
pendekatan partial credit model, sementara untuk holistik dianalisis dengan
menggunakan graded response model.
Temuan penelitian ini secara empirik dibahas berdasarkan karakteristik
setiap item berdasarkan kelompok instrumen. Karakteristik yang dimaksud
388
tersebut yaitu tingkat kesukaran dan fungsi informasi. Selain itu pembahasan juga
ditinjau dari ketiga kelompok instrumen yaitu: instrumen penilaian perencanaan
pembelajaran, instrumen penilaian pelaksanaan pembelajaran, serta instrumen
penilaian kompetensi sosial dan kompetensi kepribadian.
Temuan penelitian pada tingkat kesukaran item diperoleh tingkat
kesukaran yang bervariasi disetiap item dan disetiap kategori. Pada instrumen
penilaian RPP untuk penskoran parsial temuan penelitian menunjukkan bahwa
terdapat empat kategori atau empat perpotongan yang merupakan tingkat
kesukaran. Temuan penelitian menunjukkan bahwa kategori yang paling mudah
berada pada skala kemampuan -2,06 (kategori 1 pada item 2) sedangkan kategori
yang paling sulit berada pada skala kemampuan 3,0 (kategori 4 pada item 15). Hal
ini menunjukkan bahwa tingkat kesukaran pada instrumen penilaian RPP ini
bergerak pada rentang kemampuan tersebut.
Temuan penelitian pada instrumen penilaian pelaksanaan pembelajaran
untuk penskoran parsial menunjukkan bahwa terdapat empat kategori atau empat
perpotongan yang merupakan tingkat kesukaran. Temuan penelitian menunjukkan
bahwa kategori yang paling mudah berada pada skala kemampuan -1,52 (kategori
1 pada item 8) sedangkan kategori yang paling sulit berada pada skala
kemampuan 3,1 (kategori 4 pada item 8). Hal ini menunjukkan bahwa tingkat
kesukaran pada instrumen penilaian pelaksanaan pembelajaran ini bergerak pada
rentang kemampuan tersebut.
Temuan penelitian pada instrumen penilaian kompetensi sosial dan
kompetensi kepribadian untuk penskoran parsial menunjukkan bahwa terdapat
389
empat kategori atau empat perpotongan yang merupakan tingkat kesukaran.
Temuan penelitian menunjukkan bahwa kategori yang paling mudah berada pada
skala kemampuan -1,78 (kategori 1 pada item 6) sedangkan kategori yang paling
sulit berada pada skala kemampuan 2,65 (kategori 4 pada item 20). Hal ini
menunjukkan bahwa tingkat kesukaran pada instrumen penilaian kompetensi
sosial dan kompetensi kepribadian ini bergerak pada rentang kemampuan tersebut.
Berdasarkan pandangan Verhelst and Verstralen (2008) bahwa parameter
item dalam parsial kredit model ditafsirkan sebagai kesulitan di setiap langkah-
langkah yang harus diselesaikan. Semakin tinggi langkah tersebut, maka semakin
sulit pula langkah tersebut atau semakin besar kemampuan yang diperlukan untuk
mencapainya. Hasil penelitian ini juga terkait dengan pandangan Masters and
Wright (1997) bahwa penskoran parsial kredit model didesain untuk memahami
berbagai kemampuan peserta serta membedakan atau mengelompokkan peserta
berdasarkan tingkat respon mereka terhadap item. Artinya melalui parsial kredit
model yang digunakan dalam instrumen model penilaian PPG ini, penilai dapat
membedakan dan mengelompokkan secara jelas peserta PPG berdasarkan
responnya di setiap tahapan yang dinilai.
Pandangan tersebut juga didukung oleh Retnawati (2014) yang
menjelaskan bahwa skor kategori pada partial credit model menunjukkan
banyaknya langkah untuk menyelesaikan item dengan benar. Mengingat pada
penelitian ini terdapat empat kategori, maka dapat dijelaskan bahwa terdapat
empat langkah dalam setiap item tersebut untuk mencapai skor tertinggi. Lebih
lanjut, Retnawati (2014) menjelaskan bahwa skor kategori yang lebih tinggi
390
membutuhkan kemampuan yang lebih besar untuk mencapainya, begitu pula
sebalikanya pada skor kategori yang rendah hanya membutuhkan kemampuan
yang rendah pula untuk mencapainya. Jika sebuah butir mengikuti pola parsial
kredit model, maka kemampuan individu lebih tinggi diharapkan memiliki skor
yang lebih tinggi daripada individu yang memiliki kemampuan rendah.
Jika temuan penelitian tersebut dikaitkan dengan konsep teoretik serta
temuan sebelumnya, maka dapat dijelaskan bahwa instrumen penilaian PPG yang
diskor dengan parsial telah dapat kita gunakan untuk mengukur kemampuan
peserta PPG baik dari segi perencanaan pembelajaran, pelaksanaan pembelajaran
serta kompetensi sosial dan kompetensi kepribadian.Melalui penskoran parsial
instrumen ini dapat kita gunakan untuk membedakan serta mengelompokkan
capaian peserta PPG berdasarkan kemampuannya masing-masing. Misalnya jika
ingin mencapai tahapan tinggi atau kategori tinggi dalam sebuah item tentu
dibutuhkan pula kemampuan yang tinggi untuk mencapainya, begitu pula
sebaliknya. Hasil penelitian ini telah menguraikan secara jelas pengelompokan
tingkat kesulitan disetiap kategori pada setiap item untuk semua instrumen dalam
penilaian PPG.
Selain instrumen penskoran parsial, pada penelitian ini dihasilkan pula
instrumen dengan penskoran holistik Penskoran holistik ini dianalisis dengan
menggunakan pendekatan graded response model (GRM). Hasil penelitian secara
empirik dari instrumen penilaian RPP dengan penskoran holistik diperoleh
temuan bahwa peskoran terdapat tiga tingkat kesukaran item bervasiasi di setiap
item dengan -3,9 sebagai tingkat kesukaran langkah yang termudah serta 1,01
391
untuk tahapan yang paling sulit. Selain itu pada instrumen penilaian pelaksanaan
pembelajaran juga diperoleh temuan tingkat kesukaran bervariasi antara -3,44
sebagai tingkat kesukaran tahapan yang termudah hingga 0,76 sebagai tinggkat
kesukaran yang tersulit. Temuan lainnya pada instrumen penilaian kompetensi
sosial dan kompetensi kepribadian diperoleh tingkat kesukaran antara -2,61
sebagai tahapan yang termudah hingga 0,75 pada tahapan yang tersulit.
Jika temuan tersebut dikaitkan dengan konsep teoretik yang
dikemukakan oleh Retnawati (2014) bahwa pada graded response model skor
kategori yang merupakan banyaknya langkah atau tahapan yang diminta oleh item
tersebut mengandung indeks kesukaran dalam setiap langkah yang berurutan.
Artinya jika pandangan ini dikaitkan dengan temuan penelitian ini, maka dapat
dijelaskan bahwa pada instrumen model penilaian PPG yang telah dikembangkan
terkhusus pada penskoran holistik, indeks kesukaran di setiap kategori berurutan
mulai dari -3,9 hingga 1,01. Pada dasarnya temuan penelitian ini menunjukkan
bahwa instrumen model penilaian PPG dengan penskoran holistik lebih cocok
untuk peserta yang berkemampuan menengah ke bawah.
Temuan penelitian ini juga memiliki keterkaitan dengan pandangan
Kubiszyn & Borich (2003: 154) bahwa penskoran holistik digunakan ketika
penilai lebih tertarik dalam memperkirakan kualitas keseluruhan dari kinerja dan
menetapkan angka nilai pada kualitas tersebut daripada menerapkan penambahan
atau pengurangan poin atas aspek kinerja tertentu. Instrumen penilaian PPG
dengan penskoran holistik yang telah dikembangkan ini akan digunakan untuk
memperkirakan kualitas kinerja peserta PPG yang ditinjau dari aspek kualitas
392
perencanaan pembelajarannya, kualitas pelaksanaan pembelajarannya hingga
kualitas kompetensi sosial dan kepribadiannya. Dengan demikian, melalui
instrumen holistik yang dikembangkan ini pengguna dapat menerapkan instrumen
yang telah dikembangkan pada penelitian ini.
Lebih lanjut Brookhart (2013: 6) menyatakan penskoran holistik
merupakan rubrik yang menerapkan semua kriteria pada waktu yang sama dan
memungkinkan penilaian keseluruhan tentang kualitas pekerjaan. Penskoran
holistik merupakan penetapan atau pemberian angka untuk menilai berdasarkan
kesan keseluruhan atau kombinasi semua kriteria dari aspek atau objek yang
dinilai. Pandangan tersebut sangat relevan dengan hasil penelitian ini, dimana
salah satu fokus utama pada instrumen holistik ini adalah kualitas rubrik
penilaian. Rubrik penilaian merupakan hal yang sangat penting dalam instrumen
karena erat kaitannya dengan konsistensi penilaian. Suatu penilaian akan
konsisiten jika ditunjang dengan rubrik penilaian yang berkualitas yang mampu
mencerminkan kompetensi yang ingin diukur secara jelas.
Temuan penelitian ini menunjukkan bahwa semua produk instrumen
yang dihasilkan baik untuk instrumen perencanaan pembelajaran, pelaksanaan
pembelajaran serta kompetensi sosial dan kompetensi kepribadian telah
dibuktikan memenuhi asumsi unidimensi (lihat Lampiran Hasil Analisis Scree
Plot). Temuan tersebut sesuai dengan pernyataan Retnawati (2014: 1) bahwa pada
praktiknya asumsi unidimensi tidak dapat dipenuhi secara ketat karena adanya
berbagai faktor yang turut mempengaruhi seperti kognitif, kepribadian,
kecemasan, motivasi dan faktor lainnya, sehingga asumsi unidimensi dapat
393
ditunjukkan hanya jika instrumen mengandung satu saja komponen dominan yang
mengukur kemampuan subjek. Jika pandangan tersebut dikaitkan dengan temuan
penelitian ini maka model penilaian PPG yang telah dikembangkan melalui
penelitian ini telah memenuhi asumsi unidimensi yang dapat diartikan setiap item
hanya mengukur satu kemampuan.
Lebih lanjut pendekatan item response theory harus memenuhi asumsi
independensi lokal. Independensi lokal terpenuhi jika respon peserta pada suatu
item tidak mempengaruhi respon peserta pada item lainnya. Hanya saja jika
merujuk pada pernyataan DeMars (2000); Retnawati (2014) bahwa independensi
lokal dapat terdeksi jika asumsi unidimensi terpenuhi. Oleh karena itu dapat
dijelaskan bahwa model penilaian PPG yang telah dikembangkan memenuhi
asumsi independensi lokal.
Selain aspek tingkat kesukaran pada penskoran holistik, temuan
penelitian ini juga menunjukkan hasil terkait daya beda. Pada instrumen penilaian
perencanaan pembelajaran, pelaksanaan pembelajaran serta kompetensi sosial dan
kompetensi kepribadian diperoleh temuan daya beda setiap item untuk semua
penilai menunjukkan hasil yang positif. Artinya baik instrumen yang dinilai oleh
dosen maupun instrumen yang dinilai oleh guru pamong/penguji UKIN semuanya
menunjukkan koefisien daya beda yang positif. Hal tersebut dapat di lihat pada
gambar 89 berikut ini.
394
Gambar 98. Sebaran Daya Beda Item Instrumen Penilaian RPP
Gambar 98 tersebut menujukkan sebaran daya beda item berdasarkan
hasil penelitian pada instrumen RPP. Pada dasarnya hal ini menunjukkan
konsistensi dan invariansi intrumen penilaian RPP. Artinya karateristik item tidak
bergantung pada siapa yang meresponnya. Pada kasus ini karakteristik item tidak
menunjukkan perbedaan meskipun direspon oleh orang yang berbeda yaitu dosen
dan guru penilai ukin. Selain itu, temuan penelitian ini menunjukkan bahwa pada
penilaian RPP yang dikembangkan telah memiliki daya beda yang positif yang
terletak antara 0,8 hingga 1,4. Secara konseptual Retnawati (2014) menjelaskan
bahwa parameter daya beda merupakan kemiringan (slope) pada kurva di titik
tingkat kesukaran pada skala kemampuan tertentu. Temuan penelitian ini
didukung oleh Hambleton dan Swaminathan (1985: 37) yang menjelaskan bahwa
daya beda item yang baik terletak antara 0 s/d 2. Oleh karena itu, dapat
dikemukakan bahwa seluruh item yang dikembangkan dalam instrumen penilaian
RPP telah memiliki daya beda yang baik.
395
Hal lain yang dapat dijelaskan bahwa pada Gambar 82 tersebut terlihat
daya beda instrumen untuk data yang dinilai oleh dosen dan data yang dinilai oleh
guru pamong/penguji UKIN cenderung sama dan tidak menunjukkan perbedaan
yang signifikan. Hal tersebut menunjukkan bahwa adanya konsistensi antar
penilai baik untuk dosen maupun untuk guru pamong/penguji UKIN. Selain
instrumen penilaian RPP, hal serupa juga dilakukan pada instrumen penilaian
pelaksanaan pembalajaran. Berikut ini disajikan sebaran daya beda untuk
instrumen pelaksanaan pembelajaran.
Gambar 99. Sebaran Daya Beda Instrumen Penilaian Pelaksanaan Pembelajaran
Gambar 99 menunjukkan hal yang sama dengan instrumen penilaian RPP.
Pada dasarnya gambar tersebut menunjukkan konsistensi dan invariansi intrumen
penilaian pelaksanaan pembelajaran. Artinya karateristik item tidak bergantung
pada siapa yang meresponnya. Pada kasus ini karakteristik item tidak
menunjukkan perbedaan meskipun direspon oleh orang yang berbeda yaitu dosen
dan guru penilai ukin. Selain itu, pada instrumen penilaian pelaksanaan
pembelajaran juga tidak menunjukkan kofisien daya beda yang positif dan terletak
antara 1,2 hingga 1,9. Temuan penelitian ini didukung oleh Hambleton,
396
Swaminathan dan Rogers, (1991: 37) bahwa koofisien daya beda (a i) yang negatif
menunjukkan bahwa butir tersebut memiliki daya beda buruk, begitupula
sebaliknya bahwa koefisien daya beda (ai) yang positif menunjukkan bahwa butir
tersebut memiliki daya beda baik. Hal tersebut sebagai dasar untuk menjelaskan
bahwa seluruh item yang ada pada instrumen penilaian pelaksanaan pembelajaran
telah memiliki daya beda yang baik. Selain itu temuan penelitian ini menunjukkan
daya beda yang cenderung sama baik untuk penilai dosen maupun untuk penilai
guru pamong/penguji UKIN. Hal ini berarti bahwa adanya konsistensi antar
penilai baik oleh dosen maupun oleh guru pamong/penguji UKIN pada instrumen
penilaian pelaksanaan pembelajaran. Lebih lanjut pada instrumen penilaian
kompetensi sosial dan kepribadian. Berdasarkan hasil penelitian diperoleh temuan
sebagai berikut.
Gambar 100. Sebaran Daya Beda Instrumen Kompetensi Sosial Kepribadian
Gambar 100 menunjukkan temuan yang diperoleh pada instrumen
penilaian kompetensi sosial dan kompetensi kepribadian. Pada dasarnya gambar
tersebut menunjukkan konsistensi dan invariansi intrumen penilaian kompetensi
397
sosial dan kepribadian. Artinya karateristik item tidak bergantung pada siapa yang
meresponnya. Pada kasus ini karakteristik item tidak menunjukkan perbedaan
meskipun direspon oleh orang yang berbeda yaitu dosen dan guru penilai ukin.
Lebih lanjut temuan ini menunjukkan bahwa seluruh koefisien daya beda adalah
positif yang terletak antara 1,1 hingga 1,7. Temuan ini didukung oleh Hambleton,
Swaminathan dan Rogers, (1991: 37) bahwa koefisien daya beda yang terlalu
tinggi juga tidak dapat dijadikan tolok ukur untuk membedakan kemampuan
peserta. Koefisien daya beda yang baik atau ideal berkisar 0 s/d 2.
Jika temuan penelitian ini khususnya pada instrumen model penilaian PPG
dikaitkan dengan konsep secara teoretik maka dapat dijelaskan bahwa instrumen
model penilaian PPG telah memiliki daya beda yang baik. Hal ini dibuktikan
melalui koefisien daya beda item yang telah menunjukkan hasil positif. Hal ini
juga bermakna bahwa instrumen model penilaian PPG ini telah layak digunakan
karena telah memiliki kemampuan untuk membedakan peserta yang
berkemampuan tinggi dengan peserta yang berkemampuan rendah.
Lebih lanjut melalui penelitian ini diperoleh temuan bahwa pada
instrumen penilaian PPG untuk penskoran parsial (RPP, pelaksanaan
pembelajaran dan kompetensi sosial dan kepribadian) menunjukkan bahwa
berdasarkan fungsi karakteristik item terdapat empat kategori atau empat
perpotongan yang merupakan tingkat kesukaran dengan kategori yang paling
mudah berada pada skala kemampuan -2,06 sedangkan kategori yang paling sulit
berada pada skala kemampuan 3,1. Jika temuan tersebut dikaitkan dengan
pendapat Retnawati (2014: 38) bahwa skor kategori pada parsial model
398
menunjukkan banykanya langkah untuk menyelesaikan/melaksanakan item
tersebut. Skor kategori yang lebih tinggi menunjukkan kemampuan yang lebih
besar dari skor kategori yang lebih rendah. Oleh karena itu berdasarkan temuan
penelitian ini ada empat kategori sedangkan kemampuan maksimum yang
dibutuhkan untuk menyelesaikan setiap item adalah (theta) 3,1.
Hal serupa juga dilakukan pada instrumen dengan penskoran holistik.
Pada kasus tersebut diperoleh temuan empirik bahwa berdasarkan fungsi
karakteristik yang berbasis graded model terdapat tiga kategori tingkat kesukaran
item bervariasi di setiap item dengan -3,9 sebagai tingkat kesukaran atau langkah
yang termudah serta 1,01 untuk tahapan yang paling sulit. Menurut Retnawati
(2014: 34) bahwa respon peserta pada model graded merupakan banyaknya
langkah dalam menyelesaikan item dan langkah tersebut juga harus terurut. Jika
pandangan tersebut dikaitkan dengan temuan empirik penelitian ini maka dapat
dijelaskan bahwa pada instrumen penelitian PPG dengan penskoran holistik
melalui tiga kategori yang terurut dimulai dari kesukaran -3,9 sebagai langkah
termudah kemudian terurut hingga pada 1,01 sebagai langkah tersulit.
Selain temuan tentang karakteristik item pada penelitian ini diperoleh
pula temuan berdasarkan fungsi informasi instrumen. Secara empirik fungsi
informasi dari instrumen yang telah dikembangkan disajikan sebagai berikut.
399
Gambar 101. Fungsi Informasi Instrumen Model Penilaian PPG
Gambar 101 menyajikan informasi secara empirik pada temuan
penelitian ini dapat disimpulkan bahwa fungsi informasi instrumen penilaian PPG
dengan penskoran parsial lebih tinggi dibandingkan dengan fungsi informasi
instrumen penilaian PPG dengan penskoran holistik. Hal tersebut juga
berhubungan secara langsung dengan estimasi kesalahan pengukuran. Berikut ini
disajikan temuan penelitian ini ditinjau dari Standard Error of Measurement
instrumen penilaian PPG.
Gambar 102. Standard Error of Measurement Instrumen Model Penilaian PPG
400
Gambar 102 merupakan Standard Error of Measurement instrumen
model penilaian PPG yang memiliki keterkaitan dengan temuan sebelumnya. Hal
tersebut berbanding terbalik. Temuan penelitian ini menyimpulkan bahwa ditinjau
dari estimasi kesalahan pengukuran instrumen penilaian PPG dengan penskoran
parsial memiliki eror yang paling kecil.
Jika temuan empirik tersebut dikaitkan dengan pandangan Retnawati
(2014) bahwa fungsi informasi merupakan cara untuk menjelaskan kekuatan suatu
perangkat instrumen dalam mengungkap laten trait yang ingin diukur. Hal ini
bermakna bahwa jika ditinjau dari temuan fungsi informasi dapat disimpulkan
bahwa instrumen penilaian PPG dengan penskoran parsial memiliki kekuatan
yang lebih tinggi dalam mengungkap laten trait yang ingin diukur yaitu
kemampuan peserta PPG. Aspek lain yang memiliki keterkaitan dan menjadi
pertimbangan adalah Standard Error of Measurement, Hambleton, Swaminathan
& Rogers (1991) menjelaskan bahwa fungsi informasi dengan kesalahan
pengukuran memiliki hubungan yang berbanding terbalik, semakin besar nilai
fungsi informasi, maka semakin kecil nilai kesalahan pengukuran begitu pula
sebaliknya. Pandangan ini sejalan dengan temuan penelitian ini dimana nilai
informas yang paling tinggi yaitu instrumen penilaian PPG dengan penskoran
parsial, serta kesalahan pengukuran yang terkecil juga pada instrumen penilaian
PPG dengan penskoran parsial.
Untuk menentukan akurasi kedua bentuk penskoran dalam model
penilaian PPG yang telah dikembangkan, maka diperlukan perbandingan antara
keduanya ditinjau dari beberapa aspek atau karakteristik. Aspek yang
401
dibandingkan pada penelitian ini adalah aspek nilai fungsi informasi dan nilai
kesalahan pengukuran (Standard Error of Measurement). Berikut ini disajikan
perbandingan akurasi antara model penilaian dengan penskoran parsial dengan
model penilaian dengan penskoran holistik.
Tabel 62. Perbandingan Akurasi Model Penilaian dengan Penskoran Parsial

dengan Model Penilaian dengan Penskoran Holistik
Instrumen Parsial Holistik

Keterangan
Penilaian NIF SEM NIF SEM
Perencanaan
16,36 0,24 14,1 0,26 Parsial lebih akurat
Pembelajaran
Pelaksanaan
Pembelajaran
Kompetensi Sosial
Kepribadian
Tabel 62 menyajikan data perbandingan akurasi antara model penilaian
dengan penskoran parsial dengan model penilaian dengan penskoran holistik
ditinjau dari nilai fungsi informasi dan kesalahan pengukuran. Berdasarkan
informasi yang diproleh dari penyajian tersebut dapat dikemukakan bahwa secara
umum jika ditinjau dari aspek nilai fungsi informasi penilaian dengan penskoran
parsial lebih akurat dibandingkan dengan penskoran holistik. Hal tersebut didasari
atas temuan baik pada intrumen penilaian RPP, instrumen penilaian perencanaan
pembelajaran, serta instrumen penilaian kompetensi sosial kepribadian seluruhnya
menunjukkan bahwa penskoran parsial lebih akurat.
Hal serupa juga didukung pada aspek kesalahan pengukuran (Standard
Error of Measurement). Pada aspek ini menunjukkan kesalahan pengukuran pada
instrumen penilaian dengan penskoran parsial lebih kecil dibandingkan dengan
instrumen penilaian dengan penskoran holistik. Ini menunjukkan bahwa
402
penskoran parsial lebih akurat dibandingkan dengan penskoran holistik untuk
kasus penilaian peserta PPG yang dalam hal ini terdiri atas penilaian RPP,
pelaksanaan pembelajaran serta kompetensi sosial kepribadian.
4. Deskripsi Hasil Penilaian dengan Model Penilaian PPG dengan
Penskoran Parsial dan Holistik
Salah satu hal yang menjadi temuan pada pelaksanaan penelitian ini adalah
hasil penilaian dengan model penilaian PPG yang telah dikembangkan dengan
penskoran parsial dan holistik. Hal tersebut dilakukan untuk memperoleh hasil
penilaian atau gambaran kemampuan peserta PPG dengan menggunakan
instrumen model penilaian PPG yang telah dikembangkan pada penelitian ini.
Secara empirik hasil penilaian kemampuan peserta dengan menggunakan
instrumen pada model penilaian PPG menunjukkan bahwa kemampuan peserta
PPG pada hasil penilaian RPP dengan menggunakan penskoran parsial didominasi
pada kemampuan (theta) 1 hingga 3. Kemampuan peserta PPG pada hasil
penilaian RPP dengan menggunakan penskoran holistik didominasi pada
kemampuan (theta) -2 hingga 1. Kemampuan peserta PPG pada hasil penilaian
pelaksanaan pembelajaran dengan menggunakan penskoran parsial didominasi
pada kemampuan (theta) 1 hingga 3. Kemampuan peserta PPG pada hasil
penilaian pelaksanaan pembelajaran dengan menggunakan penskoran holistik
didominasi pada kemampuan (theta) -1 hingga 1. Kemampuan peserta PPG pada
hasil penilaian kompetensi sosial dan kompetensi kepribadian dengan
menggunakan penskoran parsial didominasi pada kemampuan (theta) 1 hingga 3.
Kemampuan peserta PPG pada hasil penilaian kompetensi sosial dan kompetensi
403
kepribadian dengan menggunakan penskoran holistik didominasi pada
kemampuan (theta) -1 hingga 1.
Jika hasil empirik tersebut dikaitkan dengan pandangan Baker (2001)
bahwa pada item response theory salah satu tujuan pengukuran adalah
menemukan posisi peserta berdasarkan skala kemampuan. Melalui informasi
tersebut penilai dapat mengetahui seberapa besar kemampuan peserta yang sedang
dinilai. Selain itu, penilai juga dapat membandingkan kemampuan antara peserta
satu dengan peserta lainnya dalam penentuan nilai berdasarkan skala kemampuan
tersebut (θ). Hal ini bermakna bahwa jika model penilaian PPG yang telah
dikembangkan ini diterapkan, penilai dapat secara langsung menentukan posisi
kemampuan peserta PPG melalui skala kemampuan baik dengan menggunakan
penskoran parsial, maupun dengan menggunakan penskoran holistik.
Lebih lanjut Retnawati & Munadi (2013) menyatakan bahwa parameter
kemampuan yang ideal adalah minimal 1 atau lebih, maka dapat disimpulkan
bahwa pada instrumen penilaian PPG untuk penskoran parsial kemampuan peserta
menunjukkan hasil yang baik. Namun hal berbeda ditemukan pada penskoran
holistik yang menunjukkan bahwa kemampuan peserta PPG masih rendah jika
diskor dengan pendekatan holistik sehingga masih perlu ditingkatkan.
Hasil penilaian yang dimaksudkan adalah berupa kemampuan (θ) peserta
PPG menyusun perencanaan pembelajaran, kemampuan melaksanakan
pembelajaran dan kemampuan terkait penguasaan kompetensi sosial kepribadian,
sebagaimana terlampir pada Lampiran 9 halam 618. Kemampuan pertama adalah
kemampuan yang terkait dengan penyusunan perencanaan pembelajaran. Setelah
404
menerapkan penilaan perencanaan pembelajaran, maka diperoleh parameter
kemampuan (θ). Berikut ini disajikan profil kemampuan peserta PPG berdasarkan
penskoran parsial dan penskoran holistik.
Gambar 103. Profil Kemampuan Menyusun RPP untuk Peserta LPTK UNY
Gambar 103 Menyajikan sebaran kemampuan peserta PPG dalam
menyusun RPP untuk peserta di LPTK UNY. Peserta di LPTK UNY berjumlah
158 peserta yang menjadi subjek uji coba II pada kelompok PPG Dalam Jabatan
tahap 1 tahun 2019 dengan Program Studi PGSD, Pendidikan Matematika, dan
PJKR. Berdasarkan temuan tersebut menunjukkan bahwa kemampuan peserta
PPG yang dinilai menggunakan instrumen penilaian dengan penskoran parsial
cenderung didominasi oleh kemampuan sekitar 1 hingga 3. Sebaliknya untuk
kemampuan peserta PPG yang dinilai menggunakan instrumen penilaian dengan
penskoran holistik didominasi oleh kemampuan -1 hingga 1. Data kemampuan
peserta PPG selanjutnya diperoleh dari LPTK UNG sebagai berikut.
405
Gambar 104. Profil Kemampuan Menyusun RPP untuk Peserta LPTK UNG
Peserta PPG yang menjadi subjek uji coba di LPTK UNG berjumlah 119
peserta yang menjadi subjek uji coba II pada Kelompok PPG Dalam Jabatan tahap
I tahun 2019 dengan Prodi PGSD, Bahasa Inggris, dan PJKR. Temuan yang
diperoleh menunjukkan bahwa pada penskoran parsial kemampuan peserta PPG
dalam menyusun RPP didominasi oleh kemampuan 1 hingga 3. Sedangkan pada
penskoran holistik kemampuan peserta didominasi oleh kemampuan -1 hingga 1.
Data kemampuan peserta PPG selanjutnya diperoleh dari lokasi ketiga yang
dilaksanakan LPTK UINAM. Berikut ini disajikan profil kemampuan tersebut.
406
Gambar 105. Profil Kemampuan Menyusun RPP untuk Peserta LPTK UINAM
Peserta PPG yang menjadi subjek uji coba II di LPTK UINAM berjumlah
239 orang pada kelompok PPG Dalam Jabatan Bersubsidi tahun 2018/2019
dengan Program Studi/Mata Pelajaran diantaranya: Fikih, Qur’an Hadis, Akidah
Akhlak, Bahasa Arab, Sejarah Kebudayaan Islam dan Guru Kelas Madrasah
Ibtidaiyah (MI). Pada Gambar 70 diperoleh informasi bahwa kemampuan
menyusun RPP untuk peserta di UIN Alaluddin Makassar bergerak antara 1
hingga 3. Selain itu untuk penskoran parsial diperoleh kemampuan yang
didominasi pada nilai -1 hingga 1. Berdasarkan temuan yang diperoleh di tiga
lokasi menunjukkan bahwa kemampuan peserta PPG cenderung lebih tinggi pada
penilaian dengan penskoran parsial.
Kemampuan kedua yang menjadi unit analisis adalah kemampuan
pelaksanaan pembelajaran. Seperti halnya kemampuan menyusun RPP, pada
kemampuan ini juga diperoleh nilai parameter kemampuan atau theta serta
dilaksanakan pada tiga lokasi yang berbeda. Berikut ini disajikan profil
kemampuan peserta dalam melaksanakan pembelajaran di LPTK UNY.
407
Gambar 106. Profil Kemampuan Pelaksanaan Pembelajaran Peserta LPTK UNY
Hasil penelitian yang disajikan pada Gambar 75 menunjukkan bahwa
kemampuan peserta dalam pelaksanaan pembelajaran di LPTK UNY memusat
pada kemampuan sekitar 2 hingga 3. Hal lain diperoleh pada instrumen penilaian
holistik menunjukkan kemampuan yang didominasi oleh nilai 0 hingga 1. Lebih
lanjut, hal serupa juga penilaian kemampuan peserta dalam pelaksanaan
pembelajaran dilaksanakan pada LPTK UNG sebagai berikut.
Gambar 107. Profil Kemampuan Pelaksanaan Pembelajaran Peserta LPTK UNG
408
Profil kemampuan peserta PPG dalam pelaksanaan pembelajaran yang
diperoleh di LPTK UNG menunjukkan hal yang tidak jauh berbeda dengan
sebelumnya. Temuan tersebut adalah adanya kecenderungan kemampuan peserta
PPG pada penilaian dengan penskoran parsial lebih tinggi dibandingkan dengan
penskoran holistik. Ini jelas terlihat pada Gambar 76 yang menunjukkan
kemampuan peserta berkisar 1 hingga 3 pada penskoran parsial. Sedangkan pada
penskoran holistik bergerak antara -1 hingga 1. Lebih lanjut hasil penilaian
kemampuan peserta PPG dalam pelaksanaan pembelajaran di LPTK UINAM
diuraikan sebagai berikut.

UINAM
Profil kemampuan peserta PPG dalam pelaksanaan pembelajaran yang
diperoleh di LPTK UINAM menunjukkan bahwa kemampuan peserta didominasi
pada nilai 1 hingga 3 pada penilaian dengan penskoran parsial. Selain itu, nilai
kemampuan yang bergerak antara -1 hingga 0 ditemukan pada hasil penilaian
409
dengan penskoran holistik. Inin menunjukkan kecenderungan tingginya
kemampuan pada penskoran parsial.
Kemampuan peserta PPG ketiga yang menjadi unit analisis adalah
penguasaan kompetensi sosial dan kompetensi kepribadian. Data ini juga
diperoleh berdasarkan instrumen parsial dan instrumen holistik. Selain itu, data ini
juga diterapkan di tiga lokasi yaitu LPTK UNY, LPTK UNG dan LPTK UINAM.
Berikut ini disajikan hasil yang diperoleh terkait penguasaan kompetensi sosial
dan kompetensi kepribadian peserta PPG di LPTK UNY.
Gambar 109. Profil Kompetensi Sosial Kepribadian untuk Peserta LPTK UNY
Gambar 109 menyajikan sebaran penguasaan kompetensi sosial
kepribadian peserta PPG di LPTK UNY yang berjumlah 158 peserta. Berdasarkan
temuan diperoleh bahwa kemampuan peserta PPG yang dinilai menggunakan
instrumen penilaian dengan penskoran parsial cenderung didominasi oleh
kemampuan sekitar 1 hingga 3. Sebaliknya untuk kemampuan peserta PPG yang
dinilai menggunakan instrumen penilaian dengan penskoran holistik didominasi
oleh kemampuan sekitar 0 dan 1. Data selanjutnya diperoleh dari lokasi kedua
410
yaitu penilaian penguasaan kompetensi sosial dan kompetensi kepribadian peserta
PPG di LPTK UNG sebagai berikut.
Gambar 110. Profil Kompetensi Sosial Kepribadian untuk Peserta LPTK UNG
Gambar 110 menyajikan sebaran penguasaan kompetensi sosial
kepribadian peserta PPG di LPTK UNG yang berjumlah 119 peserta. Hasil
penelitian yang diperoleh menunjukkan bahwa pada penskoran parsial
kemampuan peserta PPG dalam penguasaan kompetensi sosial kepribadian
didominasi oleh kemampuan 1 hingga 3. Sedangkan peserta PPG yang dinilai
dengan penskoran holistik kemampuan peserta didominasi oleh nilai -2 hingga 0.
Temuan tersebut adalah adanya kecenderungan kemampuan penguasaan
kompetensi sosial kepribadian peserta PPG pada penilaian dengan penskoran
parsial lebih tinggi dibandingkan dengan penskoran holistik. Data selanjutnya
diperoleh dari lokasi ketiga yaitu penilaian penguasaan kompetensi sosial dan
kompetensi kepribadian peserta PPG di LPTK UINAM dengan profil kemampuan
sebagai berikut.
411
Gambar 111. Profil Kompetensi Sosial Kepribadian untuk Peserta LPTK UINAM
Penyajian pada Gambar 81 tersebut adalah sebaran kompetensi sosial dan
kompetensi kepribadian peserta PPG LPTK UINAM yang berjumlah 239 peserta.
Berdasarkan penyajian tersebut diperoleh informasi bahwa kemampuan
penguasaan kompetensi sosial dan kompetensi kepribadian dari peserta PPG
untuk penskoran parsial didominasi pada rentang kemampuan 1 hingga 3. Hal
berbeda diperoleh pada penskoran holistik, kemampuan peserta PPG berada
diantara -1, 0 dan 1 atau didominasi pada kemampuan 0 hingga 1. Seperti halnya
pada kemampuan sebelumnya (menyusun RPP dan pelaksanaan pembelajaran)
pada penguasaan kompetensi sosial dan kompetensi kepribadian dari peserta PPG
ini, menunjukkan kemampuan peserta pada penskoran parsial menunjukkan nilai
yang lebih tinggi dibandingkan dengan penskoran holistik.
Secara deskriptif dapat dijelaskan bahwa kemampuan peserta dalam
menyusun RPP, melaksanakan pembelajaran serta kompetensi sosial dan
kompetensi kepribadian cenderung tinggi pada kelompok penilaian dengan
412
menggunakan instrumen penilaian penskoran parsial yang menggunakan 5
kategori dibandingkan penskoran holistik yang menggunakan 4 kategori.
Hasil penelitian ini mendukung temuan sebelumnya yang dilakukan oleh
Wasis (2011) bahwa semakin banyak jumlah kategori dalam penskoran partial
credit, semakin akurat estimasi kemampuan yang dihasilkan. Pandangan ini telah
dibuktikan oleh hasil penelitian empiris maupun simulasi. Jika kategori digunakan
lebih banyak, maka dihasilkan fungsi informasi tes yang lebih tinggi dan
kesalahan baku estimasi yang lebih kecil. Semakin banyak kategori yang
digunakan, semakin kecil simpangan baku yang diperoleh. Fungsi informasi tes
semakin tinggi, kesalahan baku estimasi semakin kecil, dan RMSE semakin kecil
menunjukkan bahwa estimasi kemampuan yang dihasilkan semakin akurat.
Hal tersebut juga didukung oleh Bond & Fox (2007: 221) bahwa
reliabilitas pengukuran dapat ditingkatkan dengan penambahan jumlah kategori
dalam penskoran akan, bila penambahan tersebut tidak dilakukan secara
sembarangan. Kategori baru yang ditambahkan harus menunjukkan perbedaan
tingkat kesukaran yang signifikan dengan kategori sebelumnya, sehingga tidak
tumpang tindih atau saling meniadakan. Pendapat Bond & Fox (2007: 221)
tersebut relevan dengan hasil penelitian ini yang menemukan bahwa penskoran
parsial menunjukkan nilai informasi yang lebih tinggi dibandingkan dengan
penskoran holistik berdasarkan banyaknya kategori yang digunakan pada saat
penskoran.
Berdasarkan hasil temuan yang diperoleh dalam mengembangkan model
penilaian PPG dengan penskoran parsial dan holistik menunjukkan kedua
413
penskoran tersebut dapat meningkatkan akurasi pengukuran capaian kompetensi
peserta PPG yaitu kompetensi pedagogik, kompetensi sosial dan kepribadian yang
dikuasai peserta PPG. Selain itu, dibuktikan dengan adanya keakuratan kedua
penskoran tersebut yang diukur dan fungsi informasi tes dan kesalahan baku
estimasi. Hal ini sejalan dengan pendapat dinyatakan Baker (2001: 105) jika dapat
memperkirakan parameter dengan teliti, maka akan dapat mengetahui informasi
tentang nilai parameter, dibandingkan dengan memperkirannya dengan kurang
teliti. Hal ini menjadi cukup penting untuk bagi pengembang instrumen atau tes,
karena presisi yang memperkirakan posisi kemampuan yang diperkirakan
tergantung dimana kemampuan peserta tes berada pada skala kemampuan. Oleh
karena itu, kecenderungan pengembangan model penilaian PPG harus diarahkan
pada model penskoran politimus baik penskoran parsial maupun penskoran
holistik dengan menggunakan banyak kategori, karena kemampuan peserta PPG
merentang sebagai suatu kontinum, mulai dari yang mudah hingga sulit. Bila
peserta PPG berusaha memahami atau menguasai kompetensi pedagogik, sosial
dan kompetensi kepribadian, maka penguasaanya akan berada pada satu posisi
diantara seluruh posisi yang ada dalam kontinum itu. Posisi kemampuan peserta
PPG tersebut, dapat berada dimanapun diantara rentangan kontinum, tidak
terbatas hanya pada posisi kemampuan terendah atau tertinggi. Oleh karena itu,
kemampuan peserta tersebut diukur, maka hasil pengukurannya sangat mungkin
kemampuan seorang peserta PPG berada diantara batas terendah dan tertinggi
dalam suatu kontinum.
414
Pertimbangan pemilihan penskoran parsial maupun penskoran holistik
dalam penilaian capaian kompetensi peserta PPG, setidaknya memperhatikan
bahwa setiap peserta PPG memiliki tingkat kesukaran yang tidak selalu sama
dalam menguasai capaian kompetensi yang diharapkan, baik kompetensi
pedagogik, kompetensi sosial maupun kompetensi kepribadian yang dinilai dalam
penelitian ini, karena ketika seorang peserta PPG menunjukkan kemampuannya
dalam penguasaan kompetensi tersebut, tentu saja respons yang diberikan
berbeda-beda tergantung pada tingkat kesulitan yang dihadapinya, sehingga bila
respons peserta PPG diskor dengan penskoran parsial maupun penskoran holistik,
maka skor yang diberikan harus memperhatikan tingkat kesukaran dari setiap
komponen yang dinilai dari masing-masing kompetensi. Mengingat setiap
komponen yang dinilai dalam mengukur capaian kompetensi peserta PPG
memiliki serangkaian tahapan dan skor seharusnya diberikan pada setiap tahapan
tersebut, sehingga jika kemampuan peserta PPG diukur dengan penskoran parsial
ataupun holistik, pengukurannya seharusnya tidak hanya memperhatikan hasil
akhir, melainkan harus memperhatikan seluruh tahapan-tahapan untuk
mendapatkan capaian penguasaan kompetensi yang dinilai dari peserta PPG
secara komprehensif. Selain itu, kenyataan di lapangan menunjukkan kebanyakan
respons peserta PPG bersifat partial corret, benar dilangkah tertentu, tetapi salah
di langkah lain. Untuk respons semacam ini, penskoran parsial merupakan pilihan
yang dianjutkan dan berpeluang menentukan batas-batas partial corret dalam
mengukur capaian kompetensi peserta PPG, karena penskoran parsial dibangun
dengan dua parameter, yaitu kemampuan dan tingkat kesukaran item serta tidak
415
mensyaratkan threshold yang semakin besar dari suatu kategori ke kategori
berikutnya.
Keberhasilan pengembangan model penilaian PPG dengan penskoran
parsial dan holistik dalam penelitian ini dipengaruhi oleh beberapa faktor, antara
lain: 1) Semua item yang terdapat pada instrumen penilaian rencana pelaksanaan
pembelajaran dan pelaksanaan pembelajaran saat workshop, PPL dan praktik
UKIN untuk mengukur capaian penguasaan kompetensi pedagogik serta semua
item yang ada pada instrumen penilaian kompetensi sosial dan kepribadian
dikembangkan berdasarkan prosedur pengembangan instrumen yang harus
dilakukan, 2) Semua item yang dikembangkan pada instrumen penilaian rencana
pelaksanaan pembelajaran, instrumen penilaian pelaksanaan pembelajaran, dan
instrumen penilaian kompetensi sosial dan kepribadian dikembangkan dari
indikator yang ada pada Buku Pedoman Penyelenggaraan Pendidikan Profesi
Guru Kemenristekdikti, 3) Instrumen penilaian rencana pelaksanaan
pembelajaran, instrumen penilaian pelaksanaan pembelajaran, dan instrumen
penilaian kompetensi sosial dan kepribadian dikembangkan dari instrumen
penilaian yang telah dikembangkan oleh Kemenristekdikti, 4) Instrumen penilaian
yang dikembangkan dilengkapi dengan buku panduan penilaian yang telah
melalui uji valitiditas isi oleh 7 expert judgment, 5) peserta PPG yang menjadi
subjek uji coba sungguh-sungguh dalam melaksanakan tahapan PPG mulai dari
workshop, PPL dan praktik UKIN karena melihatkan dosen dan guru
pamong/penguji UKIN/penguji UKIN, 6) berdasarkan fungsi informasi yang
diperoleh baik menggunakan penskoran parsial maupun holistik telah memiliki
416
informasi yang tinggi, sehingga instrumen penilaian yang dikembangkan dapat
digunakan untuk menggali informasi mengenai kemampuan peserta PPG dengan
tepat. Dengan demikian, model penilaian PPG yang dikembangkan dengan
penskoran parsial dan holistik ini, jika diterapkan dalam penilaian PPG akan
mampu mengukur capaian kompetensi peserta PPG, terutama penguasaan pada
kompetensi pedagogik, kompetensi sosial dan kepribadian. Selain itu, dapat
digunakan sebagai bahan evaluasi dalam melakukan perbaikan atau tindak lanjut
perbaikan penguasaan kompetensi peserta/mahasiswa Program PPG selama dan
setelah mengikuti program pembelajaran.
5. Kepraktisan Model Penilaian PPG dengan Penskoran Parsial dan
Holistik
Setelah menerapkan model penilaian PPG dengan penskoran parsial dan
holistik yang telah dikembangkan melalui prosedur pengembangan, maka pada
penelitian ini peneliti juga menilai kepraktisan model penilaian PPG yang telah
dikembangkan tersebut melalui respon dari pengguna/penilai (dosen/guru
pamong/penguji UKIN) yang telah menggunakan model penilaian PPG ini pada
saat pelaksanaan workshop/lokakarya, PPL dan UKIN Program PPG sebanyak 71
orang menggunakan teknik purposive sampling yaitu untuk penilai dosen
sebanyak 35 orang dengan rincian dosen penilai pada LPTK UNY sebanyak 12
orang, LPTK UNG sebanyak 10 orang dan LPTKI UINAM sebanyak 13 orang.
Selanjutnya untuk penilai guru pamong/penguji UKIN sebanyak 36 orang dengan
rincian guru pamong/penguji UKIN pada LPTK UNY sebanyak 12 orang, LPTK
417
UNG sebanyak 11 orang dan LPTKI UINAM sebanyak 13 orang. Untuk
keperluan tersebut diperlukan, setelah pengguna menggunakan model penilaian
PPG yang dikembangkan diberikan instrumen untuk mengukur kepraktisan model
penilaian PPG tersebut.
Kepraktisan model penilaian PPG yang dimaksud dalam penelitian ini
adalah pencapaian tujuan model penilaian PPG secara tepat atau keberhasilan
model penilaian PPG dengan penskoran parsial dan holistik yang dikembangkan
dalam pencapaian tujuan-tujuannya dan dapat digunakan dengan baik oleh
pengguna (dosen/guru pamong/penguji UKIN). Untuk mengukur kepraktisan
model Penilaian PPG ini, maka dilakukan survey terhadap pengguna atau penilai
PPG yang telah menggunakan model penilaian ini. Adapun indikator yang
digunakan antara lain: mampu dipahami oleh pengguna, dapat diterapkan di
lapangan, relevansi dengan Program PPG, memberi manfaat pada kegiatan PPG,
efisien dalam penggunaannya. Berdasarkan hasil penelusuran survey dari
pengguna diperoleh data hasil penilaian kepraktisan model penilaian PPG
sebagaimana disajikan pada Gambar 112 berikut:
418
Gambar 112. Hasil Penilaian Kepraktisan Model Penilaian Oleh Pengguna
Keterangan:
Indikator_1: Mampu dipahami oleh pengguna
Indikator_2: Dapat diterapkan di lapangan
Indikator_3: Relevansi dengan Program PPG
Indikator_4: Memberi manfaat pada peserta PPG
Indikator_5: Efektif dan efisien dalam penggunaannya
Berdasarkan data yang disajikan pada Gambar 112 tersebut, maka dapat
dijelaskan bahwa pada dasarnya kelima indikator yang digunakan berada pada
rentang antara Setuju hingga Sangat Setuju. Hal tersebut menunjukkan bahwa
secara umum pengguna model penilaian PPG dengan penskoran parsial dan
holistik di lapangan dapat memahami dengan baik maksud, tujuan dan isi model
penilaian PPG dan menerapkan pada pelaksanaan penilaian di lapangan. Selain
itu, tampak bahwa pengguna merasakan adanya manfaat dari model penilaian
PPG tersebut, memiliki relevansi dengan Program PPG dan relevan terhadap
penilaian kompetensi guru yang dikembangkan dalam Program PPG, serta
dipandang efektif karena mudah digunakan dan efisien dari segi waktu dan tenaga
419
untuk diterapkan secara berkesinambungan pada pelaksanaan penilaian Peserta
PPG.
Berdasarkan hasil penilaian tersebut, maka dapat disimpulkan bahwa
model penilaian PPG dengan penskoran parsial dan holistik yang telah
dikembangkan pada penelitian ini telah memenuhi aspek kepraktisan berdasarkan
penilaian oleh pengguna. Hal ini ditunjukkan dari kecenderungan pengguna
menyatakan bahwa model penilaian PPG mampu dipahami oleh pengguna, dapat
diterapkan di lapangan, relevansi dengan Program PPG, memberi manfaat pada
peserta PPG, efektif dan efisien dalam penggunaannya. Oleh karena itu model ini
dapat disarankan untuk diterapkan secara berkesinambungan pada penilaian
peserta PPG di masa yang akan datang.
Adapun kendala terkait dengan instrumen penilaian PPG yang berbasis
penskoran parsial dan holistik masih dirasakan oleh pengguna (Penilai UKIN)
berdasarkan temuan di lapangan. Kendala pertama kususnya pada instrumen
penskoran parsial. Pada dasarnya kendala pada instrumen penskoran parsial yang
dirasakan pengguna ada pada saat pelaksanaan penskoran. Hal tersebut
disebabklan karena pada penskoran parsial, skor berbasis pada kemunculan setiap
deskriptor yang menjadi aspek amatan oleh pengguna, sehingga pada saat
menskor penilai perlu mengingat semua deskriptor yang memungkinkan
muncul/tampak. Ternyata hal tersebut dirasa sebagai kendala oleh pengguna
sehingga memerlukan pembiasaan secara berkesinambungan dalam mengenali
setiap deskriptor dan menerapkan instrumen parsial tersebut agar dapat terbiasa
dengan dekriptor amatan yang menjadi dasar pemberian skor.
420
Kendala selanjutnya dirasakan pengguna pada instrumen model penskoran
holistik. Pada kasus ini, pengguna merasakan kendala pada urutan kriteria yang
menjadi dasar pemberian skor. Berbeda dengan penskoran parsial sebelumnya
yang berbasis pada kemunculan deskriptor, pada penskoran holistik ini
menekankan pada urutan kriteria yang dicapai dari objek penilaian (peserta PPG).
Hal tersebut sangat penting, karena kekeliruan dalam mengamati urutan kriteria
tentu akan berdampak pada pemberian skor yang kurang tepat sehingga
membutuhkan ketelitian dalam mengamati urutan kriteria-kriteria yang
ditampakkan oleh objek penilaian (mahasiswa PPG). Namun kembali lagi bahwa
semua kendala tersebut sama-sama berakar dari permasalahan pembiasaan.
Semakin dibiasakan dalam menggunakan model penilaian ini maka kendala-
kendala tersebut akan teratasi dengan baik.
Berdasarkan temuan di lapangan bahwa model penilaian dengan penskoran
parsial dan holistik ini merupakan hal baru bagi pengguna, maka tentu dibutuhkan
pemahaman terlebih dahulu terkait model penilaian PPG yang telah
dikembangkan utamanya pemahaman tentang konsep penskoran parsial dan
holistik. Oleh karena itu, dibutuhkan sosialisasi produk yang lebih mendalam
untuk mengenalkan produk yang telah dikembangkan ini termasuk sosialisasi
bagaimana cara menggunakannya agar produk yang telah dikembangkan dapat
digunakan oleh sasaran pengguna secara tepat.
421
E. Keterbatasan Penelitian
Pada dasarnya penelitian ini telah didesain dengan sebaik-baiknya, baik
dari segi perencanaan maupun pada tahap proses pelaksanaan. Namun peneliti
menyadari bahwa terdapat beberapa hal yang sebenarnya tercakup di dalam
keluasan lingkup penelitian tapi karena kesulitan-kesulitan jangkauan peneliti
ataupun prosedural tertentu sehingga tidak dapat dicakup di dalam penelitian ini.
Hal yang pertama yang dinyatakan sebagai keterbatasan penelitian ini adalah pada
penelitian ini telah melibatkan tiga lembaga penyelenggara PPG yaitu Universitas
Negeri Yogyakarta, Universitas Islam Negeri Alauddin Makassar, dan Universitas
Negeri Gorontalo. Peneliti menyadari untuk pengembangan hasil penelitian ini di
masa yang akan datang, produk penelitian ini juga perlu diterapkan di LPTK
lainnya agar informasi terkait kualitas Model Penilaian PPG yang telah
dikembangkan bisa dianalisis untuk kasus atau tempat lain.
Keterbatasan lainnnya adalah model penilaian PPG yang dikembangkan
dengan penskoran parsial dan holistik, belum mampu mengungkap penguasaan
kompetensi guru yang dipersyaratkan secara utuh dari peserta PPG, karena dalam
penelitian ini hanya mengembangkan tiga kompetensi yaitu kompetensi
pedagogik, kompetensi sosial dan kompetensi kepribadian yang difokuskan pada
performance assesment dari peserta PPG saat praktik mengajar pada kegiatan
lokakarya/workshop, PPL dan UKIN, sehingga untuk penilaian kompetensi
profesional tidak dikembangkan dan tidak dinilai dalam penelitian ini.
422
Rumusan capaian pembelajaran lulusan Program PPG dalam penelitian ini
meskipun hanya memuat penilaian yang mengestimasi capaian penguasaan
kompetensi pedagogik, kompetensi sosial dan kepribadian yang harus dimiliki
oleh peserta PPG beserta sub kompetensi dan indikatornya yang tertera dalam
Lampiran Permenristekdikti Nomor 55 tahun 2017 tentang StandarDikgu, namun
telah sesuai dengan capaian pembelajaran dalam KKNI memuat 7 capaian
pembelajaran yang harus dikuasai oleh guru sebagai pendidik profesional yang
berakhlak mulia dengan tugas mendidik, mengajar, membimbing, mengarahkan,
melatih, dan mengevaluasi peserta didik dengan kompetensi sebagai berikut.
Pertama, mampu melaksanakan tugas keprofesian sebagai pendidik yang
memesona, yang dilandasi sikap cinta tanah air, berwibawa, tegas, disiplin, penuh
panggilan jiwa, samapta, disertai dengan jiwa kesepenuhhatian dan
kemurahhatian. Kedua, mampu merumuskan indikator capaian pembelajaran,
berpikir tingkat tinggi yang harus dimiliki peserta didik mencakup pengetahuan,
keterampilan, dan sikap secara utuh dan berorientasi masa depan. Ketiga,
menguasai materi ajar termasuk advance materials bermakna yang dapat
menjelaskan aspek “apa” (konten), “mengapa” (filosofi), dan “bagaimana”
(penerapan) dalam kehidupan sehari-hari. Keempat, mampu merancang
pembelajaran dengan menerapkan prinsip yang memadukan pengetahuan materi
ajar, pedagogik, serta teknologi informasi dan komunikasi atau Technological
Pedagogical and Content Knowledge dan pendekatan lain yang relevan. Kelima,
mampu melaksanakan pembelajaran yang mendidik dengan menerapkan teknologi
informasi dan komunikasi untuk membangun pengetahuan, keterampilan, dan
423
sikap (karakter Indonesia) peserta didik dalam memecahkan masalah secara kritis
dan humanis, inovatif, kreatif, kolaboratif, dan komunikatif dengan menggunakan
model pembelajaran dan sumber belajar yang mendukung hasil penelitian.
Keenam, mampu mengevaluasi masukan, proses, dan hasil pembelajaran
mencakup sikap, pengetahuan, dan keterampilan peserta didik dengan
menerapkan asesmen otentik, serta memanfaatkan hasil evaluasi untuk perbaikan
kualitas pembelajaran. Ketujuh, mampu mengembangkan diri secara
berkelanjutan sebagai guru profesional melalui penelitian, refleksi diri, pencarian
informasi baru, dan inovasi. Oleh karena itu, dibutuhkan pengembangan model
penilaian PPG lebih lanjut dengan mengacu pada ketujuh rumusan capaian
pembelajaran tersebut baik dalam penyelenggaraan PPG Kemenristekdikti
maupun Kementerian Agama RI.
Hal lainnya yang dianggap sebagai keterbatasan penelitian ini adalah
model Penilaian PPG yang dikembangkan pada penelitian ini telah diterapkan
pada mahasiswa dengan profesi di jenjang SD, SMP, SMA/SMK, MI, MTs, dan
MA. Namun pada penelitian ini tidak dapat menjangkau pada mahasiswa PPG
dengan profesi di jenjang PAUD dan PIAUD. Hal tersebut disebabkan karena
adanya perbedaan komponen penilaian yang dituntut pada mahasiswa PPG di
jenjang PAUD dan PIAUD jika dibandingkan dengan mahasiswa dengan profesi
di jenjang SD, SMP, SMA/SMK, MI, MTs, dan MA secara umum.
Selain itu, keterbatasan jangkauan juga dinyatakan pada level SMK untuk
Prodi Teknik Elektro. Produk penelitian ini tidak diterapkan pada Prodi Teknik
Elektro tersebut disebabkan karena adanya kekhususan kompetensi pada Prodi
424
Teknik Elektro yang berbeda dengan prodi lainnya pada Program PPG. Untuk
mengukur kemampuan mahasiswa PPG pada Prodi Teknik Elektro diperlukan
penambahan komponen penilaian lain (khusus) yang tidak dijelaskan pada produk
yang telah dikembangkan di penelitian ini. Hal ini perlu mendapat perhatian pada
penerapan produk penelitian ini dan pengembangan hasil penelitian ini di masa
yang akan datang.
Selanjutnya hal utama yang perlu dijelaskan pada pelaksanaan penelitian
ini adalah kendala pengguna atau dalam hal ini guru (penguji ukin) yang
merupakan sasaran pengguna model penilaian ini. Berdasarkan temuan di
lapangan bahwa model penilaian dengan penskoran parsial dan holistik ini
merupakan hal baru bagi pengguna, maka tentu dibutuhkan pemahaman terlebih
dahulu. Namun jika dibandingkan dengan model penilaian yang ada saat ini,
model penilaian yang telah dikembangkan pada penelitian ini telah memenuhi
aspek kepraktisan berdasarkan penilaian oleh pengguna. Hal ini ditunjukkan dari
kecenderungan pengguna menyatakan bahwa model penilaian PPG mampu
dipahami oleh pengguna, dapat diterapkan di lapangan, relevansi dengan Program
PPG, memberi manfaat pada peserta PPG, efektif dan efisien dalam
penggunaannya. Oleh karena itu, dibutuhkan sosialisasi produk yang lebih
meluas untuk mengenalkan produk yang telah dikembangkan ini termasuk
sosialisasi bagaimana cara menggunakannya agar produk yang telah
dikembangkan dapat digunakan oleh sasaran pengguna secara luas.
425
BAB V
SIMPULAN DAN SARAN
A. Simpulan tentang Produk
Berdasarkan hasil penelitian dan pembahasan, maka dapat disimpulkan
beberapa hal sebagai berikut.
1. Konstruk instrumen model penilaian PPG dengan penskoran parsial dan
holistik yang dikembangkan dalam penelitian ini menghasilkan tiga instrumen
yaitu: a) instrumen penilaian RPP yang diukur oleh empat indikator (PIPKC,
PMMMS, PPPEP, dan PTPCK) dengan sebaran 25 item, b) instrumen
penilaian pelaksanaan pembelajaran yang diukur oleh empat indikator
(MPMD, MPMC, MPDK, MDMP) dengan sebaran 20 item, dan c) instrumen
penilaian kompetensi sosial dan kompetensi kepribadian yang diukur oleh
empat indikator (BMJK, BITP, BKDS, BSMKD) dengan sebaran 20 item.
2. Model penilaian PPG yang dikembangkan dengan penskoran parsial dan
holistik akurat dan terpercaya. Hal ini dibuktikan dari konstruk instrumen yang
dihasilkan, validitas isi berdasarkan penilaian ahli dan validitas konstruk
berdasarkan analisis faktor konfirmatori menunjukkan seluruh instrumen pada
model penilaian PPG valid. Selain itu, instrumen model penilaian PPG reliabel
berdasarkan muatan-muatan faktornya.
3. Model penilaian PPG pada penskoran parsial menggunakan skala penilaian 0,
1, 2, 3, dan 4, sementara untuk penskoran holistik menggunakan skala
penilaian 1, 2, 3, dan 4 dengan simpulan sebagai berikut.
426
a. Pada instrumen penilaian PPG (RPP, pelaksanaan pembelajaran dan
kompetensi sosial dan kepribadian) untuk penskoran parsial temuan
penelitian menunjukkan bahwa terdapat empat kategori atau empat
perpotongan yang merupakan tingkat kesukaran dengan kategori yang
paling mudah berada pada skala kemampuan -2,06 sedangkan kategori yang
paling sulit berada pada skala kemampuan 3,1.
b. Pada instrumen penilaian PPG (RPP, pelaksanaan pembelajaran dan
kompetensi sosial dan kepribadian) dengan penskoran holistik diperoleh
temuan bahwa peskoran terdapat tiga tingkat kesukaran item bervariasi di
setiap item dengan -3,9 sebagai tingkat kesukaran langkah yang termudah
serta 1,01 untuk tahapan yang paling sulit.
c. Instrumen model penilaian PPG baik untuk penskoran parsial maupun untuk
penskoran holistik telah memiliki nilai informasi yang bergerak antara 10,7
hingga 16,3 dengan estimasi kesalahan pengukuran yaitu sekitar 0,24 hingga
0,3.
4. Hasil penilaian dengan menggunakan instrumen model penilaian PPG
menunjukkan bahwa penilaian dengan penskoran parsial lebih akurat
dibandingkan dengan penilaian dengan penskoran holistik dalam
mengestimasi kemampuan peserta PPG.
5. Model penilaian PPG dengan penskoran parsial dan holistik yang telah
dikembangkan telah memenuhi aspek kepraktisan berdasarkan penilaian
oleh pengguna yaitu mampu dipahami oleh pengguna, dapat diterapkan di
427
lapangan, relevansi dengan Program PPG, memberi manfaat pada peserta
PPG, efektif dan efisien dalam penggunaannya.
B. Saran Pemanfaatan Produk
Berdasarkan kesimpulan penelitian yang diperoleh, maka disarankan
beberapa hal sebagai berikut.
1. Pada praktik penilaian peserta PPG, maka disarankan menggunakan model
instrumen yang telah dikembangkan pada penelitian ini, karena telah teruji baik
secara empirik maupun secara teoretik, serta telah memenuhi beberapa aspek
kelayakan model instrumen penilaian antara lain: valid, reliabel, goodness of fit
model serta telah diskalakan berdasarkan penskoran parsial dan holistik.
2. Model penilaian PPG dengan penskoran parsial dan holistik pada penelitian ini
diharapkan diterapkan secara berkesinambungan di masa yang akan datang
untuk melakukan penilaian kemampuan peserta PPG baik oleh LPTK/LPTKI
maupun lembaga lain yang relevan dan memiliki kepentingan serupa untuk
meningkatkan akurasi dan konsistensi penilaian pada Program PPG.
3. Model penilaian PPG dengan penskoran parsial dan holistik dilengkapi dengan
panduan penilaian diharapkan dapat membantu pengguna menguasai
pencapaian kompetensi peserta/mahasiswa Program PPG dengan penskoran
parsial dan holistik, baik konsep, pengembangan dan penerapannya sesuai
bidang studi. Selain itu, semoga pengguna mudah memahaminya dan mampu
menerapkannya untuk melakukan pelaporan hasil penilaian secara lebih rinci
dan detail.
428
4. Hasil penilaian ini dapat digunakan sebagai bahan evaluasi dalam melakukan
perbaikan model penilaian PPG yang ada selama ini dalam menilai penguasaan
kompetensi peserta Program PPG selama dan setelah mengikuti program
pembelajaran.
5. Model penilaian PPG yang telah dikembangkan dengan penskoran parsial dan
holistik praktis digunakan oleh pengguna/penilai, sehingga model ini dapat
disarankan untuk diterapkan secara berkesinambungan pada penilaian peserta
PPG di masa yang akan datang dalam mengestimasi capaian kompetensinya
secara utuh dan terpadu.
C. Diseminasi dan Pengembangan Produk Lebih Lanjut
Berdasarkan kesimpulan dan saran penelitian ini maka diperlukan
diseminasi serta pengembangan produk lebih lanjut sebagai penyempurnaan
produk dimasa yang akan datang. Pengembangan produk tersebut diuraikan
sebagai berikut.
1. Produk penelitian ini yaitu model penilaian PPG dengan penskoran parsial dan
holistik telah diterapkan pada mahasiswa/peserta PPG dengan profesi di
jenjang SD, SMP, SMA/SMK, MI, MTs, dan MA. Oleh karena itu, perlu
pengembangan hingga pada mahasiswa/peserta PPG dengan profesi di jenjang
PAUD dan PIAUD. Hal tersebut dirasa penting karena adanya kompetensi
tertentu yang tuntut khusus untuk mahasiswa/peserta PPG pada Program Studi
PAUD dan PIAUD.
429
2. Pengembangan produk lebih lanjut perlu dilakukan pada mahasiswa PPG
dengan profesi di jenjang SMK khususnya pada Program Studi Teknik Elektro.
Hal ini juga penting karena adanya kompetensi tertentu yang tuntut khusus
untuk mahasiswa PPG pada Program Studi Teknik Elektro.
3. Temuan produk penelitian ini telah disebarkan dan digunakan pada tiga
lembaga penyelenggara PPG yaitu Universitas Negeri Yogyakarta, Universitas
Islam Negeri Makassar, dan Universitas Negeri Gorontalo. Sebagai upaya
pengembangan produk lebih lanjut, maka Model Penilaian PPG ini perlu
disebarluaskan pada LPTK/LPTKI sehingga dapat memiliki nilai kemanfaatan
di masa yang akan datang dalam meningkatkan capaian penguasaan
kompetensi guru yang dipersyaratkan.
4. Temuan produk ini mampu mengungkap penguasaan kompetensi pedagogik,
kompetensi sosial dan kompetensi kepribadian dari mahasiswa/peserta PPG.
Sebagai upaya pengembangan produk lebih lanjut, maka model penilaian PPG
ini perlu dikembangkan untuk penilaian kompetensi profesional. Hal ini
merupakan prasyarat mutlak untuk melakukan penilaian PPG yang tidak hanya
mengukur sejauhmana penguasaan akademik mahasiswa/peserta Program PPG
terkuasai, tetapi sampai kepada capaian pembelajaran mahasiswa/peserta
Program PPG menguasai kompetensi yang dipersyaratkan sesuai dengan
ketentuan peraturan perundang-undangan yaitu kompetensi pedagogik,
kompetensi kepribadian, kompetensi sosial, dan kompetensi profesional.
430
DAFTAR PUSTAKA
Aburezeq, I. M., & Ishtaiwa, F. F. (2013). The impact of WhatsApp on interaction

in an Arabic language teaching course. International Journal of Arts &
Sciences, 6(3), 165–180.
Aiken, L. R. (1980). Content validity and reliability of single items or
questionnaires. Educational and psychological measurement, 40(4), 955-
959. doi: 10.1177/001316448004000419
Aiken, L. R. (1985). Three coefficients for analyzing the reliability and validity of
ratings. Educational and psychological measurement, 45(1), 131-142.
Allen, M., & Yen, W. (1979). Principles of test construction. Monterey, CA:
Brooks/Cole Publishing Company.
Amadi, M. N. (2013). In-service training and professional development of
teachers in Nigeria: Through open and distance education. Paper
presented at the Bulgarian Comparative Education Society, Paper
presented at the Annual Meeting of the Bulgarian Comparative Education
Society
American Educational Research Association, & National Council on
Measurement in Education. (2014). Standards for educational and
psychological testing: American Educational Research Association.
Anggraeni, A. A. (2019). Pembelajaran daring PPG dalam jabatan. Yogyakarta:
Tim Avenger SPADA Universitas Negeri Yogyakarta.
Anisa, A. A. (2017). Students’ literature achievement: Predictors investigation
research. REiD (Research and Evaluation in Education), 3(2), 144-151.
doi: 10.21831/reid.v3i2.17498
Anita, N., & Rahman, A. (2013). Penilaian peserta PPG SM-3T Prodi PPKN
Unesa terhadap pelaksanaan program pendidikan profesi guru (PPG) tahun
2013. Kajian Moral dan Kewarganegaraan, 3(1), 409-423.
Antoro, B. (2017). Gerakan literasi sekolah dari pucuk hingga akar: sebuah
refleksi. Jakarta: Direktorat Jenderal Pendidikan Dasar dan Menengah
Kementerian Pendidikan dan Kebudayaan.
Archer, A., & Hughes, C. (2011). Explicit instruction: Efficient and effective
teaching. New York: NY: Guilford Publications.
Athar, M. R., & Jamal, N. (2017). Academic achievement of students associated
with professional education of teacher. Journal of Research, 11(2), 94-99.
Azwar, S. (2017). Penyusunan skala psikologi. Yogyakarta: Pustaka pelajar.
Bahcivan, E., & Cobern, W. W. (2016). Investigating coherence among Turkish
elementary science teachers' teaching belief systems, pedagogical content
431
knowledge and practice. Australian Journal of Teacher Education
(Online), 41(10), 63-86. doi: 10.14221/ajte.2016v41n10.5
Bainer, D. L., & Porter, F. (1992). Teacher concerns with the implementation of
holistic scoring. Paper presented at the Paper presented at the Annual
Meeting of theMidwestern Educational Research Association Chicago, IL.
Baker, F. B. (2001). The basics of item response theory. ERIC: Clearinghouse on
Assessment and Evaluation.
Baker, F. B., & Kim, S.-H. (2017). The basics of item response theory using R.
Switzerland: Springer International Publishing.
Baswedan, A. R. (2014). Gawat darurat pendidikan di Indonesia. Paper presented
at the The Emergency of Indonesian Education. A paper delivered at the
meeting between Ministry and Head of Education Offices Indonesia-wide
in Jakarta, on December.
Bhakti, C. P., & Maryani, I. (2017). Peran LPTK dalam pengembangan
kompetensi pedagogik calon guru. Jurnal Pendidikan (Teori dan Praktik),
1(2), 98-106. doi: 10.26740/jp.v1n2.p98-106
Biktagirova, G. F., & Valeeva, R. A. (2014). Development of the teachers'
pedagogical reflection. Life Science Journal, 11(9), 60-63.
Bond, T. G., & Fox, C. M. (2007). Applying the Rasch model: Fundamental
measurement in the human sciences . Mahwah, NJ, US. Mahwah, New
Jersey: Lawrence Erlbaum Associates Publishers.
Borg, W. R., & Gall, M. (1989). Education Research: An Introduction (4th
Edition). New York: Longman publisher.
Borich, G. D., & Kubiszyn, T. (2003). Educational testing and measurement:
classroom application and practice. United States of America: John Wiley
& Sons, Inc.
Brennan, R. (2006). Educational measurement . Westport: An Imprint of
Greenwood Publishing Group (Vol. Imprint of Greenwood Publishing
Group. Inc). Westport: Inc.
Brookfield, S. (1984). Adult learners, adult education and the community. New
York: Teaches College Press.
Brookhart, S. M. (2013). How to create and use rubrics for formative assessment
and grading. Alexandria, Vriginia USA: ASCD.
Brookhart, S. M., & Nitko, A. J. (2008). Assessment and grading in classrooms.
Columbus, Ohio: Pearson Merrill Prentice Hall.
Bruce, C. D., Esmonde, I., Ross, J., Dookie, L., & Beatty, R. (2010). The effects
of sustained classroom-embedded teacher professional learning on teacher
efficacy and related student achievement. Teaching and Teacher
Education, 26(8), 1598-1608. doi: 10.1016/j.tate.2010.06.011
432
Büyükkidik, S., & Anil, D. (2015). Investigation of reliability in generalizability
theory with different designs on performance-based assessment. Egitim ve
Bilim, 40(177), 285-296. doi: 10.15390/EB.2015.2454
Caena, F. (2011). Literature review Quality in Teachers’ continuing professional
development. Education and training, 20, 2-20.
Calvert, L. (2016). Moving from compliance to agency: What teachers need to
make professional learning work. Oxford, OH, USA: Learning Forward
and NCTAF.
Chamorro-Premuzic, T., & Furnham, A. (2006). Intellectual competence and the
intelligent personality: A third way in differential psychology. Review of
General Psychology, 10(3), 251-267.
Chamorro-Premuzic, T., & Furnham, A. (2014). Personality and intellectual
competence. New York: Psychology Press.
Chan, S. (2010). Applications of andragogy in multi-disciplined teaching and
learning. Journal of adult education, 39(2), 25-35.
Chen, I.-J., Chang, C.-C., & Yen, J.-C. (2012). Effects of presentation mode on
mobile language learning: A performance efficiency perspective.
Australasian Journal of Educational Technology, 28(1), 122-137.
Cober, R., Tan, E., Slotta, J., So, H.-J., & Könings, K. D. (2015). Teachers as
participatory designers: Two case studies with technology-enhanced
learning environments. Instructional Science, 43(2), 203-228.
Cooper, J. M. (2013). Classroom teaching skills. Wadsworth: Cengage Learning.
Cooper, R. K., & Sawaf, A. (1998). Executive EQ: Emotional intelligence in
leadership and organizations. New York: Perigee Books.
Copriady, J. (2013). The implementation of lesson study programme for
developing professionalism in teaching profession. Asían social science,
9(12), 176.
Cranton, P. (2016). Continuing professional education for teachers and university
and college faculty. New directions for adult and continuing education,
2016(151), 43-52. doi: 10.1002/ace.20194
Creemers, B., Kyriakides, L., & Antoniou, P. (2012). Teacher professional
development for improving quality of teaching. New York: Springer
Science & Business Media.
Crocker, L., & Algina, J. (1986). Introduction to classical and modern test theory.
New York: Holt, Rinehart and Winston, Inc.
Darling-Hammond, L., Hyler, M. E., & Gardner, M. (2017). Effective teacher
professional development. Palo Alto, CA: Learning Policy Institute.
433
de Ayala, R. J. (2009). The theory and practice of item response theory. New
York: Guilford Publications.
DeMars, C. (2010). Item response theory. New York: Oxford University Press.
Departement of Education. (2016). Standard for teachers’ professional
development: Implementation guidance for school leaders, teachers, and
organisations that offer professional development for teachers. London:
The National Archives, Kew.
Dewey, J. (1997). Experience and education. New York: Simon & Schuster Inc.
Dewi, R. P. (2018). Analisis kesalahan penyusunan perangkat pembelajaran
Bahasa Indonesia mahasiswa Program Profesi Guru SM3T tahun 2018.
Paper presented at the Pertemuan Ilmiah Bahasa Dan Sastra Indonesia
(PIBSI) 2018, Yogyakarta.
Disas, E. P. (2017). Analisis kebijakan pendidikan mengenai pengembangan dan
peningkatan profesi guru. Jurnal Penelitian Pendidikan, 17(2), 158-166.
Dogan, C. D., & Uluman, M. (2017). A comparison of rubrics and graded
category rating scales with various methods regarding raters' reliability.
Educational Sciences: Theory and Practice, 17(2), 631-651.
Du Toit, M. (2003). IRT from SSI: Bilog-MG, multilog, parscale, testfact. North
Lincoln Avenue: Scientific Software International.
Dzheksembekova, M. I., Ibrayeva, K. E., Akhmetova, A. K., Urazalieva, M. A.,
Sultangaliyeva, E. S., & Issametova, K. I. (2016). Specific features of
social competence development in the future music teachers working at
universities. International Journal of Environmental and Science
Education, 11(9), 3001-3011. doi: 10.12973/ijese.2016.731a
Ebel, R. L. (1972). Essentials of educational measurement. Englewood Cliffts,
NJ: Prentice Hall Inc.
Embretson, S. E., & Reise, S. P. (2000). Item response theory for psychologists.
Maheah. Mahwah, New Jersey: Lawrence Erlbaum Associates, Publishers.
Fahdini, R., Mulyadi, E., Suhandani, D., & Julia, J. (2014). Identifikasi
kompetensi guru sebagai cerminan profesionalisme tenaga pendidik di
Kabupaten Sumedang. Mimbar Sekolah Dasar, 1(1), 33-42.
Fahmi, M., Maulana, A., & Yusuf, A. A. (2011). Teacher certification in
Indonesia: A confusion of means and ends. Center for Economics and
Development Studies (CEDS) Padjadjaran University, 3(1), 1-18.
Fauzan, F., & Bahrissalim, B. (2017). Curriculum analysis teacher Professional
Education Program (PPG) of Islamic Education in Indonesia. TARBIYA:
Journal of Education in Muslim Society, 4(2), 148-161. doi:
10.15408/tjems.v4i2.6400
434
Fernandes, H. (1984). Evaluation of educational programs. Jakarta: National
Education Planning, Evaluating and Curriculum Development.
French, D. (2017). The future is performance assessment. Voices in Urban
Education, 46, 6-13.
Fuadi, K., Sudjanto, B., & Kamaluddin, K. (2018). Studi evaluasi pelaksanaan
kebijakan sertifikasi guru di Kementerian Agama. Jurnal Akuntabilitas
Manajemen Pendidikan, 6(2), 139-149.
Furr, R., & Bacharach, V. (2013). Psychometrics and the importance of
psychological measurement. Thousand Oaks, CA: Sage Publications Inc.
Galih, A., & Iriani, C. (2018). Persepsi mahasiswa program pendidikan profesi
puru (PPG) Pendidikan Sejarah terhadap program PPG. Jurnal Pendidikan
Sejarah, 7(1), 66-83.
Gareis, C. R., & Grant, L. W. (2014). The efficacy of training cooperating
teachers. Teaching and Teacher Education, 39, 77-88. doi:
10.1016/j.tate.2013.12.007
Geldhof, G. J., Preacher, K. J., & Zyphur, M. J. (2014). Reliability estimation in a
multilevel confirmatory factor analysis framework. Psychological
methods, 19(1), 72-91.
Gerdeman, D., Garrett, R., & Monahan, B. (2018). Teacher professional learning
through teacher network programs: A multiple case study investigation.
American Institutes for Research, 1-28.
Gerritsen, S., Plug, E., & Webbink, D. (2017). Teacher quality and student
achievement: evidence from a sample of Dutch twins. Journal of applied
econometrics, 32(3), 643-660.
Ghozali, I., & Fuad. (2014). Structural equation modeling: Teori, konsep, dan
aplikasi dengan program Lisrel 9.10. Semarang: Badan Penerbit
Universitas Diponegoro.
Giannoukos, G., Besas, G., Galiropoulos, C., & Hioctour, V. (2015). The
andragogy, the social change and the transformative learning educational
approaches in adult education. Journal of Education and Practice, 6(10),
46-50.
Good, T. L. (2008). 21st century education: A reference handbook (Vol. 1).
California: Sage Publications.
Goodwin, A. L. (2010). Globalization and the preparation of quality teachers:
Rethinking knowledge domains for teaching. Teaching Education, 21(1),
19-32. doi: https://doi.org/10.1080/10476210903466901
Griffin, P., & Care, E. (2014). Assessment and teaching of 21st century skills:
Methods and approach. London New York: Springer Dordrecht
Heidelberg.
435
Gronlund, N. E., & Linn, R. L. (1965). Measurement and evaluation in teaching.
New York: Macmillan.
Hakim, A. (2015). Contribution of competence teacher (pedagogical, personality,
professional competence and social) on the performance of learning. The
International Journal Of Engineering And Science (IJES), 4(2), 1-12.
Hambleton, R. K. (2004). Theory, methods, and practices in testing for the 21st
century. Psicothema, 16(4), 696-701.
Hambleton, R. K., Jones, R. W., & Rogers, H. J. (1993). Influence of item
parameter estimation errors in test development. Journal of Educational
Measurement, 30(2), 143-155. doi: 10.1111/j.1745-3984.1993.tb01071.x
Hambleton, R. K., & Swaminathan, H. (1985). Item response theory: Principles
and applications. New York: Springer Science Business Media, LLC
Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of
item response theory. Newbury Park, CA: Sage Publication Inc.
Harsch, C., & Martin, G. (2013). Comparing holistic and analytic scoring
methods: Issues of validity and reliability. Assessment in Education:
Principles, Policy & Practice, 20(3), 281-307. doi:
10.1080/0969594X.2012.742422
Hasli, R. (2016). Pengembangan instrumen kompetensi pedagogik guru kelas
Sekolah Dasar di Kecamatan Marioriwawo Kabupaten Soppeng. Riset
Assesmen, 1(1), 1-7.
Hatton, M. J. (1997). Lifelong learning: Policies, practices, and programs.
Canada: APEC.
Hendriks, M. A., Luyten, H., Scheerens, J., Sleegers, P., & Steen, R. (2010).
Teachers' professional development: Europe in international comparison:
Europe in international comparison. University of Twente: Faculty of
Behavioural, Management and Social Sciences.
Henschke, J. A. (2011). Considerations regarding the future of andragogy. Adult
Learning, 22(1), 34-37.
Hidayah, I. (2013). Implementation review of professional education of teachers
(PPG) as the implementation of quality management function. Procedia-
Social and Behavioral Sciences, 103, 467-472. doi:
10.1016/j.sbspro.2013.10.361
Horby, A., & Cowie, A. (2000). Oxford advanced learner’s dictionary of current
English. Oxford: Oxford University Press.
Hotimah, H., & Suyanto, T. (2017). Strategi pendidikan profesi guru (PPG) Unesa
dalam mengembangkan kompetensi pedagogik dan profesional peserta
PPG Pasca SM-3T. Kajian Moral dan Kewarganegaraan, 5(01), 242-256.
436
Hu, B., Qin, L., Sullivan, M., & Templin, J. (2017). Contemporary approaches to
psychometrics: item response theory and diagnostic classification
models/enfoques contemporáneos sobre psicometría: los modelos de la
teoría de respuesta al ítem y los modelos de clasificación de diagnósticos.
Cultura y Educación, 29(3), 461-491.
Indriyani, S., & Ismandari, D. (2015). Persepsi mahasiswa kependidikan Fakultas
Ekonomi Universitas Negeri Yogyakarta terhadap Pendidikan Profesi
Guru (PPG). Pelita-Jurnal Penelitian Mahasiswa UNY, X(1), 1-10.
Istiyono, E., Mardapi, D., & Suparno, S. (2014a). Penerapan partial credit model
pada tes pilihan ganda termodifikasi merupakan model alternatif asesmen
fisika yang adil. Paper presented at the Prosiding Kongres dan Konferensi
Ilmiah Himpunan Evaluasi Pendidikan (HEPI) Tahun 2014, Bali.
Istiyono, E., Mardapi, D., & Suparno, S. (2014b). Pengembangan tes kemampuan
berpikir tingkat tinggi fisika (pysthots) peserta didik SMA. Jurnal
Penelitian dan Evaluasi Pendidikan, 18(1), 1-12.
Jarvis, P. (2004). Adult education and lifelong learning: Theory and practice.
London: Routledge Falmer.
Jones, M., & Vickers, D. (2011). Considerations for performance scoring when
designing and developing next generation assessments. The Assessment &
Information group of Pearson.
Jordan, M. E. (2011). Personality traits: Theory, testing and influences. New
York: Nova Science Publishers, Inc.
Joreskog, K. G., & Sorbom, D. (2006). LISREL 8.70 for windows (Computer
Software). Lincolnwood, IL: Scientific Software International.
Jurčić, M. (2014). Teacher’s competence–pedagogical and didactical dimensions.
Pedagogijska istraživanja, 11(1), 92-92.
Kamerilova, G. S., Kartavykh, M. A., Ageeva, E. L., Gordeeva, I. A., Astashina,
N. I., & Ruban, E. M. (2018). Communicative teaching models: The
formation of the professional pedagogical competence among health and
safety school teachers. Espacios, 39(29), 7.
Kane, T., Kerr, K., & Pianta, R. (2014). Designing teacher evaluation systems:
New guidance from the measures of effective teaching project. San
Francisco: John Wiley & Sons, Inc.
Kartowagiran, B. (2010). Uji kompetensi dalam PPG. Paper presented at the
Makalah disampaikan dalam Workshop Penyusunan Soal Uji Kompetensi
dalam PPG.
Kartowagiran, B. (2011). Kinerja guru profesional (Guru pasca sertifikasi). Jurnal
Cakrawala Pendidikan, 3(3).
437
Kartowagiran, B. (2012a). Model penilaian kinerja guru. Paper presented at the
Seminar Nasional HEPI Penelitian dan Evaluasi Pendidikan, Pascasarjana
Universitas Negeri Yogyakarta.
Kartowagiran, B. (2012b). Revitalisasi sertifikasi guru model penilaian kinerja
guru. Paper presented at the Prosiding Seminar Nasional Pendidikan
Teknik Mesin, Universitas Negeri Yogyakarta.
Kartowagiran, B., & Jaedun, A. (2016). Model asesmen autentik untuk menilai
hasil belajar siswa sekolah menengah pertama (SMP): Implementasi
asesmen autentik di SMP. Jurnal Penelitian dan Evaluasi Pendidikan,
20(2), 131-141. doi: 10.21831/pep.v20i2.10063
Kartowagiran, B., Jaedun, A., & Hamdi, S. (2017). Developing authentic
assessment design. Paper presented at the International Conference on
Ethics of Business, Economics, and Social Science (ICEBESS)
Proceeding.
Kartowagiran, B., & Maddini, H. (2015). Evaluation model for Islamic education
learning in junior high school and its significance to students’ behaviours.
American Journal of Educational Research, 3(8), 990-995. doi:
10.12691/education-3-8-7
Kartowagiran, B., & Retnawati, H. (2008). The probability difference indices and
empirical sampling distribution for DIF indices for identifying item bias in
multidimensional item response theory. Paper presented at the Paper on
International Conference on Matemathics 3th.
Keller, L. A., Swaminathan, H., & Sireci, S. G. (2003). Evaluating scoring
procedures for context-dependent item sets1. Applied Measurement in
Education, 16(3), 207-222. doi: 10.1207/S15324818AME1603_3
Kemenag. (2012). Panduan penyelenggaraan program pendidikan profesi guru
(PPG) dalam jabatan di Lingkungan Kementerian Agama RI. Jakarta:
Direktorat Pendidikan Tinggi Islam Direktorat Jenderal Pendidikan Islam.
Kemenristekdikti. (2017). Pedoman penyelenggaraan pendidikan profesi guru.
Jakarta: Direktorat Jenderal Pembelajaran dan Kemahasiswaan Direktorat
Jenderal Kelembagaan.
Kemenristekdikti. (2018a). Panduan LMS brightspace SPADA Indonesia. Jakarta:
Direktorat Jenderal Pembelajaran dan Kemahasiswaan Direktorat Jenderal
Kelembagaan.
Kemenristekdikti. (2018b). Pedoman penyelenggaraan pendidikan profesi guru
tahun 2018. Jakarta: Direktorat Jenderal Pembelajaran dan
Kemahasiswaan Direktorat Jenderal Kelembagaan.
Khaerudin. (2019). Persepsi guru tentang pendidikan profesi guru mode daring:
kasus di Indonesia (Teachers’ perceptions of the teacher profession
training of online mode: case in Indonesia). Paper presented at the
438
International Conference on Educational Technology, Universitas Negeri
Jakarta.
Kim, B.-H., & Kim, J. (2016). Development and validation of evaluation
indicators for teaching competency in STEAM education in Korea.
Eurasia Journal of Mathematics, Science & Technology Education, 12(7),
1909-1924. doi: 10.12973/eurasia.2016.1537a
Knowles, M. S., Holton, E., & Swanson, R. (2015). The adult learner: the
definitive classic in adult education and human resource development
(8th). New York: Routledge.
König, J., & Pflanzl, B. (2016). Is teacher knowledge associated with
performance? On the relationship between teachers’ general pedagogical
knowledge and instructional quality. European Journal of Teacher
Education, 39(4), 419-436.
Krahenbuhl, K. S. (2016). Student-centered education and constructivism:
Challenges, concerns, and clarity for teachers. The Clearing House: A
Journal of Educational Strategies, Issues and Ideas, 89(3), 97-105.
Krisna, F. N. a. (2017). Alternatif kebijakan permasalahan ketidakmerataan
penyebaran guru (Policy alternatives to address teacher distribussion
inequality). Jurnal Analisis Kebijakan, 1(2), 1-11.
Lacey, C. (2012). The socialization of teachers Londor: Routledge Library
Editions.
Lawshe, C. H. (1975). A quantitative approach to content validity 1. Personnel
psychology, 28(4), 563-575.
Le Cornu, R. (2016). Professional experience: Learning from the past to build the
future. Asia-Pacific Journal of Teacher Education, 44(1), 80-101. doi:
10.1080/1359866X.2015.1102200
Lewin, L., & Shoemaker, B. J. (2011). Great performances: Creating classroom-
based assessment tasks. Alexandria, VA: ASCD.
Liu, K. (2015). Critical reflection as a framework for transformative learning in
teacher education. Educational Review, 67(2), 135-157. doi:
10.1080/00131911.2013.839546
Liu, Y., & Thissen, D. (2014). Comparing score tests and other local dependence
diagnostics for the graded response model. British Journal of
Mathematical and Statistical Psychology, 67(3), 496-513.
Lord, F. M. (1190). Applications of item response theory to practical testing
problems. New Jersey: LawrenceErlbaum Associates, Publishers.
Lord, F. M. (2008). Application of item response theory to practical testing
problems. New York: Routledge.
439
Lord, F. M. (2012). Applications of item response theory to practical testing
problems. New York: Routledge Taylor and Francis Group.
Lutasari, S., & Kartowagiran, B. (2019). Developing instruments for student
performance assessment in physics practicum: A case study of state senior
high school of Magelang. International Online Journal of Education and
Teaching, 6(1), 104-114.
Mangkunegara, A. A. P., & Puspitasari, M. (2015). Kecerdasan emosi guru, stres
kerja, dan kinerja guru SMA. Jurnal Kependidikan: Penelitian Inovasi
Pembelajaran, 45(2), 142-155. doi: 10.21831/jk.v45i2.7491
Mardapi, D. (2017). Pengukuran, penilaian, dan evaluasi pendidikan.
Yogyakarta: Parama Publishing.
Martínez, F. L. (2010). Vocación docente versus profesión docente en las
organizaciones educativas. Revista electrónica interuniversitaria de
formación del profesorado, 13(4), 43-51.
Marzano, R. J., & Toth, M. D. (2013). Teacher evaluation that makes a
difference: A new model for teacher growth and student achievement.
Alexandria, Virginia USA: ASCD.
Masters, G., & Wright, B. (1997). The partial credit model. New York: Springer
Verlag.
Matthews, G., Deary, I. J., & Whiteman, M. C. (2009). Personality traits. New
York: Cambridge University Press.
McDiarmid, G. W., & Caprino, K. (2017). Lessons from the Teachers for a New
Era project: Evidence and accountability in teacher education. New York:
Routledge.
Mehrens, W. A., & Lehmann, I. J. (1973). Measurement and evaluation in
education and psychology. New York: Hold, Rinehart and Wiston, Inc.
Merkt, M. (2017). The importance of academic teaching competence for the
career development of university teachers: A comment from higher
education pedagogy. GMS journal for medical education, 34(4). doi:
10.3205/zma001125
Merriam, S. B. (2001). Andragogy and self‐directed learning: Pillars of adult
learning theory. New directions for adult and continuing education,
2001(89), 3-14. doi: 10.1002/ace.3
Merriam, S. B., & Bierema, L. L. (2013). Adult learning: Linking theory and
practice. San Fransisco: John Wiley & Sons.
Metruk, R. (2018). Comparing Holistic and Analytic Ways of Scoring in the
Assessment of Speaking Skills. Journal of Teaching English for Specific
and Academic Purposes, 6(1), 179-189. doi: 10.22190/JTESAP1801179M
440
Mirzagitova, A. L., & Akhmetov, L. G. (2015). Self-development of pedagogical
competence of future teacher. International Education Studies, 8(3), 114-
121.
Mizell, H. (2010). Why professional development matters (Vol. Learning
Forward). Oxford: ERIC.
Mkpanang, J. T. (2015). Personality profile of teachers and their students’
performance in post-basic modern physics. African Research Review, 9(1),
159-168.
Moore, T. W. (2010). Philosophy of education (International library of the
philosophy of education volume 14): An Introduction. London: Routledge.
Moskal, B. M. (2000). Scoring rubrics: How? ERIC Clearinghouse on Assessment
and Evaluation, 7(3), 1-5.
Naga, D. S. (2013). Teori sekor pada pengukuran mental. Jakarta: Nagarani
Citrayasa.
National Education Association. (2010). Teacher assessment and evaluation: The
national education association’s framework for transforming education
systems to support effective teaching and improve student learning.
Retrieved from National Education Association website:
http://www.nea.org/home/41858.htm.
Nering, M. L., & Ostini, R. (2011). Handbook of polytomous item response theory
models. New York: Taylor and Francis Group, LLC.
Nicholson, I. A. (2003). Inventing personality: Gordon Allport and the science of
selfhood. Washington, DC: American Psychological Association.
Ningrum, E. (2012). Membangun sinergi pendidikan akademik (S1) dan
pendidikan profesi guru (PPG). Jurnal Geografi Gea, 12(2), 49-55.
Ningsih, M. P., Fatchan, A., & Susilo, S. (2016). Program PPG untuk membangun
kompetensi guru Geografi (Studi kasus di Universitas Negeri Malang).
Jurnal Pendidikan: Teori, Penelitian, dan Pengembangan, 1(10), 2031-
2039.
Nunnally, J. C., Bernstein, Ira H (1994). Psychometric theory New Delhi: Tata
McGraw-Hill Education.
Nur, A. A. (2014). Meningkatkan kompetensi pedagogik guru di SD Yayasan
Mutiara Gambut. Jurnal Bahana Manajemen Pendidikan, 2(1), 65-72. doi:
https://doi.org/10.23036/bmp.v2i1.3735
Nurcahyo, F. A. (2016). Aplikasi IRT dalam analisis aitem tes kognitif. Buletin
Psikologi, 24(2), 64–75. doi: 10.22146/buletinpsikologi.25218
Nurmaliah, C. (2018). Analisis kemampuan peserta program pendidikan profesi
guru (PPG) dalam workshop subject specific pedagogy (SSP) di FKIP
Unsyiah. Paper presented at the Prosiding Seminar Nasional Biotik,
441
Program Studi Pendidikan Biologi Universitas Islam Negeri Ar-Raniry
Banda Aceh. .
O'Malley, J. M. (1977). Research perspective on social competence. Merrill-
Palmer Quarterly of Behavior and Development, 23(1), 29-44.
O’Meara, J. (2011). Australian teacher education reforms: reinforcing the problem
or providing a solution? Journal of Education for Teaching, 37(4), 423-
431.
Ofianto, O., & Suhartono, S. (2015). An assessment model of historical thinking
skills by means of the RASCH model. REiD (Research and Evaluation in
Education), 1(1), 73-83. doi: https://doi.org/10.21831/reid.v1i1.4899
Olesova, A. P., & Borisova, U. S. (2016). Formation of professional-
communicative competence of the future teachers in the conditions of the
Yakut-Russian Bilingualism. International Electronic Journal of
Mathematics Education, 11(10), 3435-3445.
Orazbayeva, K. O. (2016). Professional Competence of Teachers in the Age of
Globalization. International Journal of Environmental and Science
Education, 11(9), 2659-2672.
Ounis, M. (2017). A Comparison between holistic and analytic assessment of
speaking. Journal of Language Teaching and Research, 8(4), 679-690.
doi: 10.17507/jltr.0804.06
Oviyanti, F. (2016). Tantangan pengembangan pendidikan keguruan di era global.
Nadwa, 7(2), 267-282.
Ozuah, P. O. (2016). First, there was pedagogy and then came andragogy.
Einstein journal of Biology and Medicine, 21(2), 83-87. doi:
10.23861/EJBM20052190
P4TKN. (2018). Pendidikan profesi guru Universitas Negeri Yogyakarta.
Yogyakarta: Pusat Pengembangan Profesi Pendidik Tenaga Kependidikan
dan Non Kependidikan.
Pahrudin, P., Martono, T., & Murtini, W. (2016). The effect of pedagogic
competency, personality, professional and social competency teacher to
study achievement of economic lesson in state senior high school of east
Lombok district academic year 2015/2016. Paper presented at the
Proceeding of the International Conference on Teacher Training and
Education.
Pamungkas, A. S., Novalitasari, N., Setiani, Y., & Yuhana, Y. (2019). Kajian
persepsi, interaksi dan capaian mahasiswa PPG dalam jabatan ada
platform pembelajaran Brightspace. Paper presented at the Seminar
Nasional Matematika dan Pendidikan Matematika (4th SENATIK)
Program Studi Pendidikan Matematika FPMIPATI-Universitas PGRI
Semarang.
442
Paterson, R. W. K. (2010). Values, education and the adult. London: Routledge.
Peters, R. S. (2010). The concept of education (international library of the
philosophy of education volume 17) (Vol. 17). London: Routledge.
Petrie, K., & McGee, C. (2012). Teacher professional development: Who is the
learner? Australian Journal of Teacher Education, 37(2), 59-72.
Piri, E., Keshtiaray, N., & Saadatmand, Z. (2016). Designing a model of
personality traits desirable for teacher training courses for student teachers.
Turk Psikoloji Dergisi, 31(77), 125-133.
Pollard, A. (2014). Reflective teaching: in schools. London: Bloomsbury
Publishing.
Popham, W. J. (1999). Classroom assessment: What teachers need to know. Allyn
& Bacon: A Viacom Company.
Prasojo, L. D., Wibowo, U. B., & Hastutiningsih, A. D. (2017). Manajemen
kurikulum program profesi guru untuk daerah terdepan, terluar, dan
tertinggal di Universitas Negeri Yogyakarta. Jurnal Pendidikan dan
Kebudayaan, 2(1), 39-53.
Pring, R. (2005). Philosophy of education. London: Bookend, Ltd.
Rabadi-Raol, A. (2019). Quality of teacher education and learning: theory and
practice. Journal of Education for Teaching, 45(1), 115-117. doi:
10.1080/02607476.2018.1541342
Ratnaningrum, D. (2016). Persepsi siswa tentang kompetensi guru mahasiswa
peserta program pendidikan profesi guru (PPG) di SMA Negeri 1 Wates
Tahun 2015/2016. Universitas Negeri Yogyakarta, Yogyakarta.
Reise, S. P., & Revicki, D. A. (2014). Handbook of item response theory
modeling: Applications to typical performance assessment. New York:
Routledge.
Retnawati, H. (2011). Mengestimasi kemampuan peserta tes uraian Matematika
dengan pendekatan teori respons butir dengan penskoran politomus
dengan generalized partial credit model. Prosiding Semnas Penelitian
Pendidikan dan Penerapan MIPA. UNY, 53-62.
Retnawati, H. (2014). Teori respons butir dan penerapannya: untuk peneliti,
praktisi pengukuran dan pengujian, mahasiswa pascasarjana.
Yogyakarta: Nuha Medika.
Retnawati, H. (2016a). Analisis kuantitatif instrumen penelitian. Yogyakarta:
Parama publising.
Retnawati, H. (2016b). Validitas reliabilitas dan karakteristik butir. Yogyakarta:
Parama Publishing.
443
Retnawati, H. (2018). The Dif identification in constructed response items using
partial credit model. International Journal of Assessment Tools in
Education, 5(1), 73-90. doi: 10.21449/ijate.347956
Retnawati, H., Apino, E., & Anazifa, R. D. (2018). Impact of character education
implementation: A goal-free evaluation. Problems of Education in the 21st
Century, 76(6), 881-899.
Retnawati, H., Djidu, H., Apino, E., & Anazifa, R. D. (2018). Teachers'
knowledge about higher-order thinking skills and its learning strategy.
Problems of Education in the 21st Century, 76(2), 216-230.
Retnawati, H., Hadi, S., & Nugraha, A. C. (2016). Vocational high school
teachers' difficulties in implementing the assessment in curriculum 2013 in
Yogyakarta Province of Indonesia. International Journal of Instruction,
9(1), 33-48.
Retnawati, H., Kartowagiran, B., Arlinwibowo, J., & Sulistyaningsih, E. (2017).
Why are the mathematics national examination items difficult and what is
teachers' strategy to overcome It? International Journal of Instruction,
10(3), 257-276.
Retnawati, H., & Munadi, S. (2013). Mengestimasi parameter butir dan
kemampuan guru menggunakan model parsial kredit dan parsial kredit
tergeneralisasi. from Lumbung Pustaka Universitas Negeri Yogyakarta
http://eprints.uny.ac.id/id/eprint/22874
Retnawati, H., Munadi, S., Arlinwibowo, J., Wulandari, N. F., & Sulistyaningsih,
E. (2017). Teachers’ difficulties in implementing thematic teaching and
learning in elementary schools. The New Educational Review, 48, 201-
212. doi: 10.15804/tner.2017.48.2.16
Ridlo, S. (2012). Pengembangan tes pengetahuan praktikum biologi berdasarkan
Graded Response dan Generalized Partial Credit. Jurnal Penelitian dan
Evaluasi Pendidikan, 16, 166-182. doi: 10.21831/pep.v16i0.1111
RISE. (2018). Perkembangan hasil studi evaluasi program PPG prajabatan studi
tahun pertama (2018). from Research on Improving Systems of Education
http://rise.smeru.or.id/id/publikasi/perkembangan-hasil-studi-evaluasi-
program-ppg-prajabatan
Robertson, S. (2017). A class act: Changing teachers work, the state, and
globalisation. New York: Routledge.
Robinson, W., & Campbell, J. (2010). Effective teaching in gifted education:
Using a whole school approach. London: Routledge.
Rose‐Krasnor, L. (1997). The nature of social competence: A theoretical review.
Social development, 6(1), 111-135. doi: 10.1111/j.1467-
9507.1997.tb00097.x
444
Sadtyadi, H., & Kartowagiran, B. (2014). Pengembangan instrumen penilaian
kinerja guru sekolah dasar berbasis tugas pokok dan fungsi. Jurnal
Penelitian dan Evaluasi Pendidikan, 18(2), 290-304. doi:
10.21831/pep.v18i2.2867
Samejima, F. (1974). Normal ogive model on the continuous response level in the
multidimensional latent space. Psychometrika, 39(1), 111-121.
Sanders, J. R., Nitko, A. J., Merwin, J. C., Trice, C., Dianda, M., & Schneider, J.
(1999). Standars for teacher competence in educational assessment of
students: Collaborating Professional Associations: NCME, American
Association of Colleges for Teacher Education, American Federation of
Teachers, and National Education Association.
Sax, G. (1980). Principles of educational and psychological measurement and
evaluation. Belmont, CA: Wadsworth Publishing Co.inc.
Selvi, K. (2010). Teachers’ competencies. Cultura International Journal of
Philosophy of Culture and Axiology, 7(1), 167-175. doi:
10.5840/cultura20107133
Shulman, L. S. (2005). Signature pedagogies in the professions. Daedalus, 134(3),
52-59.
Smylie, M. A. (2014). Teacher evaluation and the problem of professional
development. Mid-Western Educational Researcher, 26(2), 98-111.
Steinberg, M. P., & Garrett, R. (2016). Classroom composition and measured
teacher performance: What do teacher observation scores really measure?
Educational Evaluation and Policy Analysis, 38(2), 293-317. doi:
10.3102/0162373715616249
Stiggins, R., & Chappuis, J. (2005). Using student-involved classroom assessment
to close achievement gaps. Theory into practice, 44(1), 11-18.
Stronge, J. H. (2018). Qualities of effective teachers. Alexandria: ASCD.
Suciu, A. I., & Mata, L. (2011). Pedagogical competences–The key to efficient
education. International online journal of educational sciences, 3(2), 411-
423.
Sudaryono, S. (2011). Implementasi teori responsi butir (item response theory)
pada penilaian hasil belajar akhir di sekolah. Jurnal Pendidikan dan
Kebudayaan, 17(6), 719-732.
Sulisworo, D., Nasir, R., & Maryani, I. (2017). Identification of teachers’
problems in Indonesia on facing global community. International Journal
of Research Studies in Education, 6(2), 81-90. doi:
10.5861/ijrse.2016.1519
445
Sumintono, B., & Widhiarso, W. (2014). Aplikasi model Rasch untuk penelitian
ilmu-ilmu sosial (edisi revisi). Cimahi: Trim Komunikata Publishing
House.
Suparji. (2008). Pengembangan instrumen kompetensi bidang keguruan
mahasiswa calon guru. Program Pascasarjana Universitas Negeri
Yogyakarta, Yogyakarta.
Surya, P. (2014). Model Program Pendidikan Guru Prajabatan: Dari Penghapusan
Akta IV Menuju Sertifikat Profesi. Dinamika Pendidikan, 21(01), 91-102.
Suryawati, E., & Osman, K. (2018). Contextual learning: innovative approach
towards the development of students’ scientific attitude and natural science
performance. Eurasia Journal of Mathematics, Science and Technology
Education, 14(1), 61-76.
Susongko, P. (2010). Perbandingan keefektifan bentuk tes uraian dan testlet
dengan penerapan graded response model (GRM). Jurnal Penelitian dan
Evaluasi Pendidikan, 14(2), 269-288. doi: 10.21831/pep.v14i2.1082
Suswantar, I. S. D., & Retnawati, H. (2016). Penilaian kinerja guru SMA swasta
di Kabupaten Sukoharjo dan faktor-faktor yang mempengaruhi. Jurnal
Evaluasi Pendidikan., 4(1), 36-44.
Suyata, P., Mardapi, D., Kartowagiran, B., & Retnawati, H. (2011). Model
pengembangan bank soal berbasis guru dan mutu pendidikan. Jurnal
Kependidikan: Penelitian Inovasi Pembelajaran, 41(2), 120-128. doi:
10.21831/jk.v41i2.2218
Tekkumru Kisa, M., & Stein, M. K. (2015). Learning to see teaching in new
ways: A foundation for maintaining cognitive demand. American
Educational Research Journal, 52(1), 105-136.
Templin, J., & Hoffman, L. (2013). Obtaining diagnostic classification model
estimates using MPlus. Educational Measurement: Issues and Practice,
32(2), 37-50.
The Teaching Council. (2012). The code of professional conduct for teachers. An
Chomhairle Mhúinteoireachta Teaching Council Acts.
Tyler, F. B. (1978). Individual psychosocial competence: A personality
configuration. Educational and psychological measurement, 38(2), 309-
323. doi: 10.1177/001316447803800212
Van Driel, J. H., & Berry, A. (2012). Teacher professional development focusing
on pedagogical content knowledge. Educational researcher, 41(1), 26-28.
doi: 10.3102/0013189X11431010
Vangrieken, K., Meredith, C., Packer, T., & Kyndt, E. (2017). Teacher
communities as a context for professional development: A systematic
review. Teaching and Teacher Education, 61, 47-59. doi:
10.1016/j.tate.2016.10.001
446
Verhelst, N. D., & Verstralen, H. (2008). Some considerations on the partial credit
model. Psicologica, 29(2), 229-254.
Villanueva, J. P. (2010). Personality traits: classifications, effects and changes.
New York: Nova Science Publishers, Inc.
Wahyudin, D. (2016). Manajemen Kurikulum dalam Pendidikan Profesi Guru
(Studi Kasus Di Universitas Pendidikan Indonesia). Jurnal Kependidikan:
Penelitian Inovasi Pembelajaran, 46(2), 259-270.
Wakhinuddin, S. (2012). Pengaruh pembobotan dan jenis penilai terhadap fungsi
informasi tes performansi. Jurnal Penelitian dan Evaluasi Pendidikan,
16(1), 384-406. doi: 10.21831/pep.v16i1.1123
Wardoyo, C. (2015). The measurement of teacher's personality competence and
performance using embedded model. Journal of Education and Practice,
6(26), 18-23.
Wasidi, W., & Mardapi, D. (2016). Pengembangan instrumen bakat keguruan.
Jurnal Penelitian dan Evaluasi Pendidikan, 20(1), 98-110. doi:
10.21831/pep.v20i1.7519
Widhiarso, W. (2010). Model politomi dalam teori respons butir. Yogyakarta:
Psikologi UGM.
Widiati, U., & Hayati, N. (2015). Teacher professional education in Indonesia and
ASEAN 2015: Lessons learned from English language teacher education
programs. Stroupe, R., & Kimura, K.(Eds.), ASEAN integration and the
role of English language teaching, 121-148.
Wilson, M. (2005). Constructing measures: An item response modeling approach.
Mahwah, New Jersey: Lawrence Erlbaum Associates, Inc.
Winch, C., Oancea, A., & Orchard, J. (2015). The contribution of educational
research to teachers’ professional learning: Philosophical understandings.
Oxford Review of Education, 41(2), 202-216. doi:
10.1080/03054985.2015.1017406
Wiseman, C. S. (2012). A comparison of the performance of analytic vs. holistic
scoring rubrics to assess L2 writing. Iranian Journal of Language Testing,
2(1), 59-92.
Yahya, M., Abdal, N. M., Setialaksana, W., & Putri, D. R. A. (2019). Evaluasi
tingkat prestasi belajar mahasiswa PPG Universitas Negeri Makassar.
Paper presented at the Prosiding Seminar Nasional Fakultas Teknik
Universitas Negeri Makassar.
Yasin, A. F. (2012). Pengembangan kompetensi pedagogik guru pendidikan
agama Islam di madrasah (studi kasus di MIN Malang I). el-Qudwah, 1(5),
157-181.
447
Yueh, H.-P., Lin, W., Jo-Yi, H., & Sheen, H.-J. (2012). Effect of student
engagement on multimedia-assisted instruction. Knowledge Management
& E-Learning, 4(3), 346.
Zenisky, A. L., Hambleton, R. K., & Sired, S. G. (2002). Identification and
evaluation of local item dependencies in the Medical College Admissions
Test. Journal of Educational Measurement, 39(4), 291-309. doi:
10.1111/j.1745-3984.2002.tb01144.x
Zhu, X., Goodwin, A. L., & Zhang, H. (2017). Quality of teacher education and
learning: Theory and practice. Singapore: Springer Nature.
Zięba, A. (2013). The item information function in one and two-parameter logistic
models–A comparison and use in the analysis of the results of school tests.
Didactics of Mathematics, 10(14), 87-96.
Ziegler, J., & Detje, F. (2013). Application of empirical methodology to evaluate
information fusion approaches. Paper presented at the Proceedings of the
16th International Conference on Information Fusion.
Zinn, B. (2017). Technology teachers and their professional competence–
peculiarities and starting points for subject-specific didactical research.
Journal of Technical Education (JOTED), 5(1), 1-13.
448

Disertasi Lian G.otaya 16701261002

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Disertasi Lian G.otaya 16701261002

Diunggah oleh

Hak Cipta:

Format Tersedia

MODEL PENILAIAN PENDIDIKAN PROFESI GURU (PPG)

DENGAN PENSKORAN PARSIAL DAN HOLISTIK

Disertasi ini ditulis untuk memenuhi sebagian persyaratan

PROGRAM STUDI PENELITIAN DAN EVALUASI PENDIDIKAN

LIAN G. OTAYA: Model Penilaian Pendidikan Profesi Guru (PPG) dengan

Penelitian ini bertujuan mengembangkan model penilaian PPG dengan

LIAN G. OTAYA: A Model of the Teaching Profession Education (TPE)

Keywords: TPE Assessment, Partial Scoring, Holistic Scoring

MODEL PENILAIAN PENDIDIKAN PROFESI GURU (PPG)

Dipertahankan di depan Dewan penguji Disertasi

Dr. Sugito, M.A.

Dr. Supnhar, M.Si.

Prof. Dr. Heri Retr*weti, M,Pd.

Prof. Sulistyo Saputro, M.Si., Ph.I)

Disertasi ini bertujuan mengembangkan model penilaian Pendidikan Profesi Guru

(PPG) dengan peskoran parsial dan holistik.

berbagai pihak. Dalam kesempatan ini, penulis menyampaikan ucapan terima

penyelesaian disertasi ini. Bimbingan, arahan dan masukan-masukan yang

membangun dan motivasi terus-menerus disertai dengan dukungan yang sangat

berharga telah memotivasi penulis menyelesaikan disertasi ini, sehingga secara

yang setinggi-tingginya teriring doa semoga kebaikan-kebaikannya selama

menyampaikan ucapan terima kasih kepada:

1. Prof. Dr. Marsigit, MA., selaku Direktur Pascasarjana Universitas Negeri

Yogyakarta yang telah memberikan pengarahan, dorongan, masukan sehingga

disertasi ini dapat selesai.

penanggung jawab Program PPG di LPTK Universitas Negeri Yogyakarta

Yogyakarta yang telah mengizinkan melakukan penelitian di P4TKN LPPMP

4. Drs. Suyud, M.Pd., selaku Kepala P4TKN Universitas Negeri Yogyakarta,

Keguruan Universitas Islam Negeri Makassar sekaligus penanggung jawab

5. Kementerian Agama RI pada Direktorat Jenderal Pendidikan Islam yang telah

memberikan penulis kesempatan sebagai penerima Program Beasiswa 5000

Doktor Kementerian Agama RI Tahun 2016 pada Program Studi Penelitian

dan Evaluasi Pendidikan Pascasarjana Universitas Negeri Yogyakarta.

memberikan kesempatan sangat berharga kepada penulis dapat melanjutkan

diberikan penulis ucapkan terima kasih yang mendalam.

Keguruan IAIN Sultan Amai Gorontalo, yang telah memfasilitasi dan

memberi dorongan moril kepada penulis mengikuti program doktor.

penelitian dalam penelitian disertasi ini.

10. Segenap teman-teman mahasiswa Program Studi Penelitian dan Evaluasi

Pendidikan Pascasarjana Universitas Negeri Yogyakarta angkatan 2016 yang

memberikan dorongan untuk penulisan disertasi ini bisa terwujud.

11. Segenap teman-teman mahasiswa penerima Program beasiswa 5000 Doktor

Pendidikan Pascasarjana Universitas Negeri Yogyakarta.

restu dan senantiasa mendoakan keberhasilan penulis menyelesaikan program

disebutkan namanya satu persatu.

Semoga amal kebaikan bapak/ibu, teman-teman semua, dan terutama

bermanfaat dalam pengembangan ilmu pengetahuan pada dunia akademik dan

masyarakat di masa kini dan masa datang.

Yogyakarta, Juli 2019

Yang bertanda tangan di bawah ini:

Nama Mahasiswa : Lian G. Otaya

Nomor Mahasiswa : 16701261002

Program Studi : Penelitian dan Evaluasi Pendidikan

Yogyakarta, Juli 2019

HALAMAN JUDUL ............................................................................................ i

ABSTRACT ....................................................................................................... iii

LEMBAR PENGESAHAN ................................................................................. iv

KATA PENGANTAR ......................................................................................... v

PERNYATAAN KEASLIAN ........................................................................... viii

DAFTAR ISI ...................................................................................................... ix

DAFTAR TABEL ............................................................................................. xii

DAFTAR GAMBAR ........................................................................................ xvi

DAFTAR LAMPIRAN ................................................................................... xxiii