Anda di halaman 1dari 23

Evaluasi

Pelatihan
Kelompok 11
Pengertian
● Kirkpatrick(1998) mengemukakan bahwa evaluasi suatu pelatihan
merupakan bagian yang tidak dapat dipisahkan dari pelatihan itu
sendiri dan evaluasi tersebut merupakan kegiatan yang harus
dilakukan untuk mengetahui apakah pelatihan secara keseluruhan
berlangsung secara efektif atau tidak.
● Evaluasi pelatihan menurut Moekijat adalah suatu proses untuk
menentukan kemajuan suatu program pelatihan dibandingkan dengan
tujuan yang ingin dicapai.
● Suryana mengemukakan bahwa evaluasi pelatihan adalah proses
mengumpulkan informasi untuk membuat keputusan tentang aktifitas
pelatihan (Suryana, 2004:11)
Jenis Evaluasi
• Evaluasi Formatif
Winkel menyatakan bahwa yang dimaksud dengan
evaluasi formatif adalah penggunaan tes-tes selama proses
pelatihan yang masih berlangsung dan dilakukan untuk
meningkatkan proses pelatihan.
• Evaluasi Sumatif
Evaluasi sumatif adalah evaluasi yang dilakukan pada
setiap akhir satu satuan waktu yang didalamnya tercakup
lebih dari satu pokok bahasan, dan dimaksudkan untuk
mengetahui sejauhmana peserta pelatihan telah berubah
sebagai hasil dari keikutsertaan dalam program pelatihan.
Tujuan
• Untuk mengidentifikasi kekuatan dan kelemahan program
• Untuk menilai apakah program training mendukung
proses belajar dan dapat digunakan di tempat kerja
• Untuk mengidentifikasi apakah peserta pelatihan
mendapatkan keuntungan atau tidak dari pelatihan
tersebut
• Untuk mengumpulkan data untuk membantu dalam
program pelatihan pemasaran
• Untuk menentukan keuntungan finansial dan biaya
program
• Untuk membandingkan biaya dan manfaat dari investasi
pelatihan versus non-pelatihan
• Untuk membandingkan biaya dan manfaat dari program
pelatihan yang berbeda untuk memilih program terbaik
Proses Evaluasi
1. Menentukan Aspek yang akan di
Evaluasi
2. Merancang Kegiatan Evaluasi
3. Pengumpulan Data Evaluasi
4. Analisis Data dan Pengolahannya
5. Pelaporan Hasil Evaluasi
Pengertian Kirkpatrick
Model evaluasi Kirkpatrick dibuat oleh Donald L Kirkpatrick, Ph.D untuk
menentukan empat tingkat evaluasi pelatihan. Donald Kirkpatrick
mengembangkan model evaluasi kirkpatrick untuk mengevaluasi
pelatihan selama tahun 1950-an. Model evaluasi ini telah mengalami
beberapa penyempurnaan, dan terakhir diperbaharui pada tahun 1998
dalam buku “Evaluating Training Program : The Four Levels”.

Model evaluasi empat level yang dikembangkan oleh Kirkpatrick


merupakan kerangka konseptual untuk membantu menentukan data apa
yang harus dijaring dalam evaluasi pengembangan sumber daya manusia.
Metode Kirkpatrick merupakan model evaluasi pelatihan yang
memiliki kelebihan karena sifatnya yang menyeluruh, sederhana
dan dapat diterapkan dalam berbagai situasi pelatihan. Menyeluruh
dalam artian model evaluasi ini mampu menjangkau semua sisi dari
suatu program pelatihan. Dikatakan sederhana karena model ini
memiliki alur logika yang sederhana dan mudah dipahami serta
kategorisasi yang jelas dan tidak berbelit-belit. Sementara dari sisi
penggunaan, model ini bisa digunakan untuk mengevaluasi
berbagai macam jenis pelatihan dengan berbagai macam situasi.
Walaupun demikian, model Kirkpatrick tidak mempertimbangkan
faktor individual dan kontekstual yang dapat mempengaruhi hasil
pelatihan dan hanya fokus pada reaksi peserta, pembelajaran yang
terjadi, perubahan perilaku, dan peningkatan kinerja organisasi.
Training Outcomes : Kirkpatrick’s 4
Level of Evaluation Criteria
Level Criteria Focus
1 Reactions Trainee satisfication
2 Learning Acquisition of knowledge, skills,
attitudes, and behavior
3 Behavior Improvement of behavior in the job

4 Results Business results achieved by


trainees
Outcomes Used in Evaluating Training Programs
• Cognitive outcomes
- Pengetahuan yang dipelajari
- Pemahaman terhadap pelatihan, meliputi prinsip, fakta, teknik,
prosedur, dan proses
• Skill based outcomes
- Penilaian keterampilan teknis, motorik, hard skill
- Perolehan hasil belajar dan penerapan keterampilan
• Affective outcomes
- Pelibatan emosi, sikap, dan motivasi
- Persepsi trainee terhadap program dan semua unsur di dalamnya
• Results
- Hasil training
• Return on Investment (RoI)
- Efektivitas manfaat moneter yang digunakan dengan biaya pelatihan,
langsung dan tidak langsung
- Manfaat yang didapatkan oleh perusahaan post-training
Kriteria Evaluasi
Level Kriteria Focus
1 Reactions Kepuasan Peserta Pelatihan
2 Learning Akuisisi pengetahuan,
keterampilan, sikap, perilaku
3 Behavior Perbaikan perilaku di tempat kerja
4 Results Hasil bisnis yang diraih oleh
peserta pelatihan
Threats To Validity
A. Validitas Internal
Validitas internal mengacu pada kemampuan desain penelitian untuk menyingkirkan atau membuat m
asuk akal penjelasan alternatif hasil/masuk akal dugaan sementara (Campbell, 1957; Kazdin, 2003c).
Delapan ancaman utama pada validitas internal adalah :
1. Sejarah / History : peristiwa yang terjadi pada waktu yang lalu kadang-kadang dapat
berpengaruh terhadap variabel keluaran (variabel terikat).
2. Kematangan / Maturitas : perubahan yang terjadi pada variabel terikat tidak hanya karena
adanya eksperimen, tetapi juga disebabkan proses kematangan pada subjek yang mendapatkan
perlakuan atau eksperimen.
3. Prosedur Tes /Testing : pengalaman pada pretes dapat mempengaruhi hasil postes karena
kemungkinan para subjek penelitian dapat mengingat kembali jawaban- jawaban yang salah pada
waktu pretes.
4. Instrumen  / Instrumentation : alat ukur atau alat pengumpul data (instrumen) pada pretes biasanya
digunakan lagi pada postes dan mempengaruhi variabel terikat.
5. Regresi ke Arah Nilai Rata-rata (Regressien Toward The Mean) : adanya nilai-nilai ekstrem dari hasil
pretes cenderung untuk tidak ekstrem lagi pada postes, namun biasanya melewati nilai rata-rata.
Perubahan yang terjadi pada variabel terikat tersebut bukan perubahan yang sebenarnya (perubahan
semu). Oleh sebab itu, regresi kearah nilai rata-rata ini juga disebut regresi semu (regression artifact).
6. Seleksi (Selection) : dalam memilih anggota kelompok eksperimen dan kelompok kontrol bisa terjadi
perbedaan ciri-ciri atau sifat-sifat anggota kelompok satu dengan kelompok yang lainnya.
7. Mortalitas (Mortality) : pada proses dilakukan eksperimen atau pada waktu antara pretes dan postes
sering terjadi subjek yang 'dropout' baik karena pindah, sakit, ataupun meninggal dunia. Hal ini juga
akan berpengaruh terhadap hasil eksperimen
8. Harapan Pelaksana : karena satu dan lain hal pelaksana eksperimen secara sadar atau tidak
sadar mempunyai pengharapan tertentu atas berhasilnya eksperimen. Akibatnya tanpa sadar yang
bersangkutan memberikan kunci-kunci keberhasilan kepada subjek eksperimen dan hasil
eksperimen akan dikotori oleh pengaruh harapan pelaksana eksperimen tersebut.
B. Validitas Eksternal
Validitas eksternal berkaitan dengan generalisasi hasil penelitian studi. Dalam semua bentuk desain
penelitian, hasil dan kesimpulan penelitian iniadalah terbatas kepada para peserta dan kondisi seperti
yang didefinisikan oleh kontur penelitian dan mengacu pada sejauh mana generalisasi hasil penelitian
untuk lain kondisi, peserta, waktu, dan tempat (Graziano & Raulin, 2004).
1. Efek pengujian reaktif atau interaksi : pretest dapat meningkatkan atau menurunkan
sensitivitas atau daya tanggap subjek terhadap variabel eksperimental. Memang, efek
pretes ke tes berikutnya telah dibuktikan secara empiris (Willson & Putnam, 1982, Lana,
1959).
2. Efek interaksi dari bias seleksi dan variabel eksperimental
3. Efek reaktif pengaturan eksperimental : sulit untuk menggeneralisasi pengaturan non-
eksperimental jika efek itu disebabkan oleh pengaturan eksperimental penelitian.
4. Gangguan perawatan ganda : karena beberapa perawatan diberikan pada subjek yang
sama, sulit untuk mengontrol efek perawatan sebelumnya.
Tipe Desain Evaluasi
• Posttest - only
• Pretest & Posttest
• Posttest - only with Comparison Group
• Pretest & Posttest with Comparison
Group
• Time Series
• Time Series with Comparison Group and
Reversal
• Solomon Four-Group
Perbandingan Desain Evaluasi
Perbandingan Desain Evaluasi
Faktor Pengaruh Desain Evaluasi
R = Random assignment (pemberian tugas secara acak)
T = Treatment (pemberian perlakuan)
M= Measurement (pengukuran)

1. The One-Shot Case Study (Desain yang terdiri dari satu studi kasus)

Skema dari desain ini terlihat seperti berikut:

T M One – Shot Case Study

• Desain ini hanya mengukur apa yang terjadi pada siswa setelah diberi perlakuan, karenanya subyek

yang dilibatkan hanya satu atau dua saja, sehingga hasilnya tidak bisa digunakan untuk mewakili

kelompok.
• Desain ini memiliki beberapa kelemahan ketika menerapkannya. Yang terutama adalah karena

kemungkinan beberapa dari kedelapan variabel, seperti sejarah, pematangan, seleksi, dan mortality,

mungkin masuk untuk mengacaukan interpretasi data.


2. The One-Group Pretest-Posttest Design (desain yang menggunakan pretes-posttes pada satu kelompok)
Desain lain yang mungkin memberikan hasil yang lemah adalah The One-Group Pretest-Posttest. Design
ini terdiri dari Pretest dan Posttest , yang di antaranya diberi sedikit perlakuan. Secara umum terlihat
seperti berikut :
M T M One-Group Pretest-Posttest Design
• Tehnik ini memiliki banyak kelemahan, karena variabel seperti sejarah, pematangan, testing, dan
instrumentasi mungkin masuk untuk mengacaukan hasil interpretasi data. Selain itu, karena tidak
ada pembanding, maka kita tidak bisa mengatakan bahwa hasil yang didapat adalah yang paling
benar.
• Untuk menghindari kehadiran variabel yang tidak diinginkan, maka desain ini dapat dimodifikasi
oleh evaluator. Misalnya untuk menghindari variabel sejarah dan pematangan, maka jangka waktu
penelitian dibuat pendek. Untuk menghindari variabel instrumentasi, maka pretes dan posttes
yang digunakan berasal dari jenis tes yang sama.
3. Desain kontrol grup non-ekivalen
Desain ini membutuhkan 2 atau lebih dari 2 kelompok, semuanya melalui tahapan pre-test, pemberian
perlakuan, lalu dilanjutkan dengan post-test. 1 kelompok dipisahkan sebagai kelompok kontrol,
sehingga tidak diberi perlakuan. Secara umum desainnya akan sebagai berikut:

Grup 1 : M → T → M

Grup 2 : M M


• Dalam pendidikan, evaluator selalu terlibat dalam analisis perbandingan (komparatif), maka
desainnya biasanya akan berbetuk seperti di bawah ini:

Grup 1 : M → T1 → M Grup 1 : M → T1 → M

Grup 2 : M → T2 → M Grup 2 : M → T2 → M

Grup 3 : M → T3 → M Grup 3 : M M


• Dalam desain di sebelah kiri, 3 perlakuan dibandingkan satu sama lain, sementara dalam
desain yang ada di sebelah kanan, 2 perlakuan dibandingkan satu sama lain dan juga
dibandingkan dengan grup kontrol.
• Desain ini dapat diterapkan pada keadaan yang tidak memungkinkan untuk melakukan
perbandingan antar grup secara acak (randomisasi). Sehingga, semakin mirip hasil yang
didapat dari perbandingan antar grup, maka interpretasi data melalui desain ini akan
semakin akurat dan mudah dilakukan.
4.  Desain kontrol grup menggunakan pre-test dan post-test
Desain ini tepat digunakan apabila keadaan acak dimungkinkan. Secara umum desainnya adalah:
Grup 1 : R M → T → M
Grup 2 : R M M
• Desain ini bisa divariasikan menggunakan beberapa perlakuan. Penggunaan kontrol grup
mungkin digunakan, bisa juga tidak. Kelemahan dari desain ini adalah apabila pretes yang
digunakan mempengaruhi respon subyek terhadap perlakuan yang diberikan.

5. Desain menggunakan kontrol grup dengan penggunaan post-tes


Desain ini diterapkan apabila keadaan acak dimungkinkan secara umum desainnya adalah sebagai
berikut:
Grup 1 : R T M
Grup 2 : R M
• Desain ini hampir sama dengan desain no.4, hanya saja pada desain ini tidak digunakan pretes.
Pengacakan subyek ke dalam kelompok akan membuat kelompok menjadi seimbang. Karena
evaluator pendidikan biasanya ingin membandingkan 2 atau lebih perlakuan, maka desainnya
dapat menajdi seperti ini:
Grup 1 : R T1 M
Grup 2 : R T2 M
Grup 3 : R M
• Tidak seperti desain multigrup sebelumnya, pada desain ini, penggunaan grup kontrol mutlak
dilakukan.
6. The Interrupted Time-Series Design
Desain yang terakhir dijabarkan adalah desain ini, yang memiliki perbedaan dengan desain-
desain sebelumnya. Secara umum desainnya adalah sebagai berikut:
M1 → M2 → M3 → T → M4 → M5
• Dalam desain ini, beberapa pengukuran diberikan sebelum dan sesudah perlakuan.
Semakin banyak pengukuran yang dilakuakn akan semakin baik. Analisis data
statistik menggunakan model ini agak sedikit rumit, namun data yang dihasilkan dari
desain ini lebih dapat diandalkan. Desain ini juga menyajikan pengaruh dari program
pendidikan yang diterapkan dalam jangka waktu tertentu, jadi bisa dilihat
pengaruhnya dari masa ke masa. Desain ini juga dapat digunakan sebagai alat
evaluasi terhadap program yang mmang direncanakan tidak memiliki grup
perbandingan.
• Dalam beberapa kondisi, desain ini bisa dimodifikasi menjadi 2 atau lebih grup,
bahkan randomisasi bisa diterapkan pada desain ini.
Kesimpulan
Daftar Pustaka
• Hartanto, S. (2018). Chapter 6 Training Evaluation. Slide player. https://slideplayer.info/slide/11989067/
. Diakses pada 13 Maret 2021
• Hastjarjo, T. D. 2011. Validitas Eksperimen. Buletin Psikologi, 19(2), 70-80.
https://jurnal.ugm.ac.id/buletinpsikologi/article/download/11558/8616 . Diakses 13 Maret 2021
• Macam-Macam Penilaian. File UPI edu.
http://file.upi.edu/Direktori/FIP/JUR._PEND._LUAR_SEKOLAH/196009261985031-UYU_WAHYUDIN/
Macam-macam_penilaian.pdf
. Diakses pada 13 Maret 2021
• Ohlund, B., & Chong-ho, Y. 2017. https://web.pdx.edu/~stipakb/download/PA555/ResearchDesign.html
(Diakses pada 13 Maret 2021).
• Putra. 2020. PENGERTIAN EVALUASI: Fungsi, Tujuan, Metode & Contoh Evaluasi.
https://salamadian.com/pengertian-evaluasi/. Diakses pada 13 Maret 2021
• Rukmi, H.S., Novirani, D., & Sahrul, A. (2014). Evaluasi Training dengan Menggunakan Model Kirkpatrick
(Studi Kasus Training Foreman Development Program di PT. Krakatau Industrial Estate Cilegon). 132
• Ritonga, R., Saepudin, A., & Wahyudin, U. (2019). Penerapan Model Evaluasi Kirkpatrick Empat Level
Dalam Mengevaluasi Program Diklat Di Balai Besar Pelatihan Pertanian (BBPP) Lembang. Jurnal
Pendidikan Nonformal, 14(1), 12-21. (Diakses 13 Maret 2021)
• Widiyastuti, umi, & Purwana ES., D. (2015). EVALUASI PELATIHAN (TRAINING) LEVEL II
BERDASARKAN TEORI THE FOUR LEVELS KIRKPATRICK. Jurnal Pendidikan Ekonomi Dan Bisnis
(JPEB), 3(2), 119-128. https://doi.org/10.21009/JPEB.003.2.1

Anda mungkin juga menyukai