Criteria Concepts, Measurements, and Evaluation

PENGEMBANGAN SUMBER DAYA MANUSIA
“Criteria: Concepts, Measurements, and

Evaluation”
Oleh:
Kelompok 2
Kelas A/2015
Ahmad Yusuf Tamin (13-085)

Syafira Balqis Lubis (15-047)
Fahira Dwianti Siregar (15-091)
Putri Raudhah (15-095)
Denise Allaya Pratomo (15-117)
Annisa Ulfahmeilia (15-123)
Wira Andhika (15-125)
FAKULTAS PSIKOLOGI
UNIVERSITAS SUMATERA UTARA
1
2017
DAFTAR ISI
At A
Glance..........................................................................................................................................
1
Definition.....................................................................................................................................
.........1
The Domain of Job

Performance.........................................................................................................2
Dimensionality Of
Criteria............................................................................................................3
Essentials of Criterion
Development....................................................................................................7
Performance And Situasional

Characteristics....................................................................................9
Steps In Criterion
Development.........................................................................................................11
Evaluating
Criteria…..........................................................................................................................12
Criterion
Contamination.....................................................................................................................13
Criterion
Equivalence.........................................................................................................................15
Composite Versus Multiple

Criteria..................................................................................................15
2
Research Design and Criterion
Theory..............................................................................................18
Daftar
Pustaka....................................................................................................................................21
KATA PENGANTAR
Puji syukur kami panjatkan ke hadirat Tuhan Yang Maha Esa, karena atas berkatnya
kami mampu menyelesaikan makalah ini.
Kami membuat makalah ini dengan tujuan supaya lebih memahami materi
pembahasan mata kuliah Pengembangan Sumber Daya Manusia mengenai Criteria: concept,
measurement, and evaluation.
Kami mengucapkan banyak terima kasih kepada Dosen pengampu Pengembangan
Sumber Daya Manusia yang telah mengizinkan kami membuat makalah ini dan kepada
semua teman-teman yang mendukung kami dalam menyelesaikan makalah ini.
Kami mengetahui bahwa makalah ini mungkin tidak sempurna, oleh karena itu, untuk
menyempurnakannya kritik dan saran kami terima. Atas perhatiannya kami ucapkan banyak
terima kasih.
3
AT A GLANCE
Pengukuran kriteria yang memadai dan akurat merupakan masalah mendasar dalam
personnel psychology. Meskipun kriteria kadang-kadang digunakan untuk tujuan prediktif
dan terkadang untuk tujuan evaluasi, dalam kedua kasus tersebut, hal tersebut mewakili apa
yang penting atau diinginkan. Kriteria adalah pernyataan operasional dari tujuan atau hasil
yang diinginkan.
Sebelum kita dapat mempelajari kinerja manusia dan memahaminya dengan lebih
baik, kita harus menghadapi empat masalah: keandalan kinerja, keandalan pengamatan
kinerja, dimensi kinerja, dan modifikasi kinerja berdasarkan karakteristik situasional.
Akhirnya, dalam mengevaluasi kriteria operasional, kita harus waspada terhadap kontaminan
tertentu, seperti faktor bias dalam peringkat. Selain itu, pengukuran kriteria operasional harus
relevan, handal, sensitif, dan praktis.
Secara umum, psikolog terapan dipandu oleh dua tujuan utama: (1) untuk
menunjukkan kegunaan prosedur dan program mereka, dan (2) untuk meningkatkan
pemahaman mereka tentang faktor-faktor penentu keberhasilan pekerjaan. Dalam upaya
mencapai ini, terkadang kriteria gabungan digunakan dan terkadang beberapa kriteria
digunakan. Meskipun ada kontroversi yang bertahan lama mengenai manfaat relatif dari
setiap pendekatan, kami akan menunjukkan bahwa kedua posisi berbeda dalam hal asumsi
dan tujuan akhir yang mendasarinya. Dengan demikian, satu atau keduanya mungkin sesuai
dalam keadaan tertentu. Di kesimpulan bagian bab ini, kami akan menawarkan beberapa
desain penelitian yang menjanjikan yang seharusnya terbukti menyelesaikan dilema kriteria
dan dengan demikian menguntungkan lapangan.
Pengembangan kriteria yang memadai dan tepat sekaligus merupakan batu sandungan
dan tantangan bagi spesialis HR. Ilmuwan behavioral mengeluhkan "masalah kriteria"
selama bertahun-tahun. Istilah ini mengacu pada kesulitan yang dihadapi dalam proses
konseptualisasi dan pengukuran konstruk kinerja yang bersifat multidimensi, dinamis, dan
tepat untuk tujuan yang berbeda.
DEFINITION
Terdapat berbagai definisi kriteria. Dari satu kriteria perspektif, kriteria adalah standar
yang bisa dijadikan tolak ukur untuk mengukur keberhasilan atau kegagalan karyawan.
4
Definisi ini cukup memadai dalam konteks pemilihan karyawan, penempatan, dan penilaian
kinerja. Ini berguna saat prediksi terlibat - yaitu, dalam pembentukan hubungan fungsional
antara variabel negatif, prediktor, dan variabel lain, kriteria. Namun, ada kalanya kita hanya
ingin mengevaluasi tanpa harus meramalkan. Misalkan, misalnya, departemen HR prihatin
dengan mengevaluasi efektivitas kampanye perekrutan yang ditujukan untuk menarik
pelamar minoritas. Berbagai kriteria harus digunakan untuk mengevaluasi program secara
memadai. Tujuan dalam kasus ini bukanlah prediksi, melainkan evaluasi. Satu perbedaan
antara prediktor dan kriteria adalah waktu. Misalnya, jika standar evaluatif seperti tes tertulis
atau kinerja dilakukan sebelum keputusan ketenagakerjaan dibuat (yaitu, untuk menyewa,
mempromosikan), standarnya adalah prediktor. Jika standar evaluatif diberikan setelah
keputusan ketenagakerjaan dibuat (yaitu, untuk mengevaluasi efektivitas kinerja), standar
adalah kriteria.
Dengan demikian, definisi yang lebih komprehensif diperlukan, karena apakah kita
memprediksi atau mengevaluasi, kriteria merupakan sesuatu yang penting atau diinginkan.
Ini adalah pernyataan operasional dari tujuan atau hasil yang diinginkan dari program yang
diteliti. Ini adalah standar evaluatif yang dapat digunakan untuk mengukur kinerja, sikap,
motivasi, dan sebagainya seseorang. Ada beberapa persyaratan kriteria selain keinginan dan
kepentingan, tapi sebelum memeriksanya, pertama-tama kita harus mempertimbangkan
dimensi konseptual tertentu.
THE DOMAIN OF JOB PERFORMANCE

Kinerja dapat didefinisikan sebagai hal-hal yang dapat diamati yang dilakukan orang-
orang yang sesuai dengan tujuan organisasi. Prestasi kerja itu sendiri multidimensi, dan
perilaku yang merupakan kinerja dapat diukur dari segi tingkat kinerja yang mereka
tunjukkan. Hal ini juga penting untuk membedakan kinerja dari hasil atau hasil kinerja, yang
terdiri dari keefektifan.
Istilah ultimate criterion (kriteria utama), menggambarkan domain kinerja penuh dan
mencakup semua hal yang pada akhirnya mendefinisikan kesuksesan dalam pekerjaan.
Kriteria semacam itu sangat penting dalam arti bahwa seseorang tidak dapat memandangnya
lebih jauh lagi untuk mendapatkan standar lebih lanjut untuk menilai hasil kinerja. Karena
kriteria utama benar-benar konseptual dan oleh karena itu tidak dapat diukur atau diamati, ini
mewujudkan pengertian "benar", "total", "jangka panjang", atau "nilai tertinggi" bagi
organisasi pengusaha.
5
Kriteria utama kinerja sales harus mencakup, misalnya, total volume penjualan
selama keseluruhan masa kerja individu dengan perusahaan; jumlah total akun baru masuk
selama karir individu; jumlah loyalitas pelanggan yang dibangun oleh tenaga penjual selama
perawatannya; jumlah pengaruhnya terhadap moral atau catatan penjualan salesman
perusahaan lainnya; dan efektivitas keseluruhan dalam kegiatan perencanaan dan panggilan,
pengendalian biaya, dan penanganan laporan dan catatan yang diperlukan. Singkatnya,
kriteria utama adalah konstruk yang bersifat konseptual.
Meskipun kriteria utama dinyatakan dalam istilah luas yang seringkali tidak rentan
terhadap evaluasi kuantitatif, ini adalah konstruksi yang penting karena relevansi pengukuran
kriteria operasional dan faktor-faktor yang mendasari pemilihannya lebih dipahami jika tahap
konseptual didokumentasikan dengan jelas dan terdokumentasi dengan baik.
DIMENSIONALITY OF CRITERIA
Ukuran-ukuran operasional dari kriteria konseptual dapat bervariasi dalam beberapa
dimensi. Termasuk didalamnya dimensi psikologis (misalnya, keterampilan perawat dalam
hubungan manusia); dimensi ekologi (yaitu, dalam hal hubungan antara seseorang dan
lingkungannya seperti kemampuan perakitan lini pekerja dalam berbagai kondisi panas,
kebisingan, dan cahaya); dimensi fisik (misalnya, biaya psikologis, kalori yang digunakan per
menit, dari berbagai jenis pekerjaan): atau dimensi ekonomi (misalnya, biaya dolar kesalahan,
memo dan mengolah kembali). Kriteria juga bervariasi sepanjang beberapa dimensi penting
lainnya, kita akan melihat dalam apa yang berikut.
Temporal Dimensionality
Setelah kita telah jelaskan kriteria konseptual, maka kita harus menentukan dan
memperbaiki ukuran-ukuran operasional atau kinerja kriteria (mis. kriteria sebenarnya yang
akan digunakan). Kapan waktu terbaik untuk pengukuran kriteria? Waktu yang optimal
sangat bervariasi dari situasi ke situasi, oleh karena itu kesimpulan harus ditulis ketika
pengukuran kriteria diambil. Hasil yang jauh berbeda mungkin terjadi tergantung pada waktu
pengukuran kriteria diambil (Weitz. 1961), dan kegagalan untuk mempertimbangkan dimensi
temporal dapat mengakibatkan salah penafsiran.
Dalam memprediksi keberhasilan penjualan dan kelangsungan hidup agen asuransi
jiwa, misalnya, kemampuan yang diukur dengan standarisasi signifikan dalam menentukan
keberhasilan awal, tetapi minat dan faktor kepribadian memainkan peran yang lebih penting
di kemudian hari (Ferguson, 1960). Keterampilan interpersonal dengan rekan dan klien lebih
6
penting daripada keahlian teknis murni untuk kesuksesan. Singkatnya, pengukuran kriteria
tidak tergantung pada waktu.
Sebelumnya telah tercatat bahwa kriteria utama mewujudkan ide efektivitas jangka
panjang. Kriteria utama tidak secara praktis untuk pengambilan keputusan sehari-hari atau
evaluasi. Oleh karena itu, kita harus menggunakan kriteria pengganti, immediate atau
intermediate (lihat Gambar. 4-1). Semua kriteria immediate dan intermediate akan berat
sebelah sejak mereka hanya memberikan sebuah perkiraan kriteria utama (Thorndike, 1949).
Gambar 4-1 kurang ketelitian dalam hal bahwa ada banyak kelonggaran dalam menentukan
ketika kriteria immediate menjadi kriteria intermediate. Kriteria immediate adalah ukuran
jangka pendek, seperti nilai tes pada hari terakhir dari kelas pelatihan atau pengukuran kinerja
pemain quarterback baru di pertandingan pertamanya. Kriteria intermediate diperoleh pada
lain waktu, biasanya sekitar 6 bulan setelah pengukuran awal (yaitu, penilaian pengawasan
kinerja, tes kinerja sampel pekerjaan, atau penilaian rekan efektivitas). Kriteria ringkasan
yang dinyatakan dalam rata-rata jangka panjang atau total. Kriteria ringkasan berguna karena
menghindari atau mengimbangi efek jangka pendek atau tren dan kesalahan pengamatan, dan
pengukuran. Kriteria ringkasan berkisar dari pengukuran yang dilakukan setelah kinerja tiga
bulan, 3 sampai 4 tahun tiga bulan kinerja, atau bahkan lebih lama.
immediate intermediate summary
To Time Tx
Dimensi Temporal adalah konsep yang luas, dan dalam dua bagian berikut kita akan
mempertimbangkan dua kasus khusus temporal dimensi: dimensi statis dan dimensi dinamis.
Static Dimensionality. Dalam sebuah artikel klasik Ghiselli (1956b) mengidentifikasi tiga
jenis kriteria dimensi: statis, dinamis, dan individu dimensi. Jika kita amati kinerja pekerjaan
di setiap titik waktu, kita menemukan bahwa sudah kodratnya performa kerja itu adalah
multidimensi (Campbell, 1990). Misalnya, Rush (1953) menemukan bahwa sejumlah
keterampilan yang relatif independen yang terlibat dalam penjualan, sehingga pada waktu
tertentu seorang tenaga penjualan mungkin berperforma tinggi pada satu karakteristik kinerja
dan sekaligus rendah pada yang lain. Dengan demikian, bakat belajar tenaga penjual (yang
diukur dengan nilai sekolah penjualan dan pengetahuan teknis) tidak berhubungan dengan
7
ukuran objektif prestasinya (seperti volume rata-rata bulanan dari penjualan atau persentase
kuota tercapai), yang pada akhirnya bergantung pada teknik penjualannya (misalnya,
perencanaan kerja, dinilai nilai potensial untuk perusahaan), yang pada gilirannya independen
dari nya teknik penjualan (pendekatan penjualan, minat dan antusiasme, dll). Demikian pula,
Fleishman dan Ornstein (1960) mengidentifikasi enam kemampuan komponen dalam
menggambarkan kinerja pilot. Kita bisa mengumpulkan banyak bukti tambahan untuk
mendukung gagasan bahwa prestasi kerja adalah multidimensional, tapi yang penting adalah
bahwa dimensi statis biasanya dipertimbangkan dalam penelitian kriteria. Sering kita
mengambil potret dari kinerja pada satu titik dalam waktu menggunakan kriteria tunggal, dan
kami menganggap bahwa kita telah "memotret" dan menggambarkan kinerja karyawan secara
memadai. Hal ini belum tentu demikian.
Dynamic Dimensionality. Akal sehat menunjukkan bahwa sebagai karyawan mendapatkan

pengalaman dan "learn the ropes" pada pekerjaan mereka, karena mereka lebih
mengembangkan kemampuan mereka dan potensi, dimensi kinerja yang tampaknya tepat dan
valid di awal karir mereka, mungkin tidak terkait dengan kinerja pekerjaan mereka pada
tahap berikutnya. Kriteria mungkin "dinamis," mengubah pentingnya dari waktu ke waktu.
Bahkan, kriteria dinamis mungkin menganggap salah satu dari tiga bentuk kemungkinan
(Barrett, Caldwell, dan Alexander, 1985): (a) perubahan dalam kelompok kinerja rata-rata
dari waktu ke waktu. (b) perubahan validitas dari waktu ke waktu, dan (c) perubahan dalam
urutan pemesanan skor pada kriteria dari waktu ke waktu.
Secara tradisional kriteria dinamisme telah dilihat sebagai masalah konseptual dan
operasional yang serius, tetapi basis penelitian yang dikutip untuk mendukung pandangan ini
tidak dianalisis secara kritis sampai sebuah studi oleh Barrett (1985). Pertimbangkan definisi
(a) di atas, misalnya. Ghiselli dan Haire (1960) diikuti kemajuan sekelompok salesman
selama 10 tahun. Selama masa ini mereka menemukan peningkatan 650 persen dalam rata-
rata produktifitas. Namun, kenaikan ini didasari pada salesman yang bertahan pada
pekerjaannya selama 10 tahun penuh. Untuk dapat membandingkan produktivitas salesman,
pengalaman mereka harus sama, atau yang lain harus menyamakan kedudukan dalam
beberapa cara (Ghiselli dan Brown; 1955). Penelitian lain yang dikutip oleh Barrett (1985)
tidak menunjukkan bahwa rata-rata produktivitas meningkatkan secara signifikan selama
rentang waktu yang panjang.
8
Changes in Validity over time. Kriteria mungkin juga bersifat dinamis, jika validitas prediksi
berfluktuasi dari waktu ke waktu. Bass (1962) menyelidiki ini menjadi kasus pada salesman
yang dinilai kinerjanya selama 42 bulan. Skor pada tiga tes kemampuan serta penilaian rekan
pada tiga dimensi dikumpulkan untuk menjadi sampel dari 99 salesman. Hasil penelitian
menunjukkan pola koefisien validitas baik untuk tes dan penilaian rekan yang tampak
berfluktuasi tak menentu dari waktu ke waktu. Namun, banyak kesimpulan yang berbeda
tercapai ketika koefisien validitas diuji secara statistik. Tidak ada perbedaan signifikan yang
ditemukan validitas dari tes kemampuan, dan ketika peringkat rekan digunakan sebagai
prediktor, koefisien validitas menunjukkan perbedaan yang signifikan secara statistik (Barrett
et al., 1985).
Para peneliti telah menyarankan dua hipotesis untuk menjelaskan mengapa validitas
mungkin berubah dari waktu ke waktu. Salah satunya changing task model, menunjukkan
bahwa ketika jumlah relatif kemampuan yang dimiliki oleh individual tetap stabil selama
waktu itu, kriteria untuk kinerja efektif mungkin berubah pada kepentingannya. Maka
validitas prediksi kinerja juga mungkin berubah. Model kedua, yang dikenal sebagai
changing subjects model, menunjukkan bahwa selama kemampuan khusus yang diperlukan
untuk kinerja yang efektif tetap konstan dari waktu ke waktu, tingkat kemampuan masing-
masing individu berubah dari waktu ke waktu, dan itulah sebabnya mengapa validitas
berfluktuasi (Henry dan Hulin, 1987).
Tak satu pun dari model-model di atas telah mendapat dukungan wajar tanpa
pengecualian. Memang, para pendukung pandangan, bahwa validitas cenderung menurun dari
waktu ke waktu (Henry dan Hulin, 1987; 1989) dan para pendukung pandangan, bahwa
validitas tetap stabil dari waktu ke waktu (Ackerman, 1989; Barrett dan Alexander, 1989)
setuju pada satu titik, kinerja awal cenderung menunjukkan beberapa kerusakan pada
korelasinya dengan kinerjanya nanti. Namun, ketika hanya studi longittudinal diperiksa
ditemukan, pandangan bahwa validitas berfluktuasi dari waktu ke waktu.
Changes in the Rank-ordering of scores on the Criterion over time. Untuk menguji definisi
kriteria dinamis sistematis, Barrett et al. (1985) mencari semua isu jurnal psikologi terapan
dan Psikologi Personel untuk studi yang dilaporkan korelasinya antara ukuran kriteria
dikumpulkan pada dua kesempatan. 276 koefisien diidentifikasi, hanya 8,7 persen yang tidak
signifikan. Meskipun tidak dapat disimpulkan dari hasil ini bahwa tidak ada perubahan di
urutan pemesanan telah terjadi, ada tidak muncul untuk stabilitas substansial di
measurements kriteria diulang. Penelitian selanjutnya terhadap kinerja 6-month dari 509
9
operator mesin jahit menemukan bahwa relatif kinerja tidak stabil dari waktu ke waktu
(Deadrick dan Madigan. 1990).
Austin, Humphreys, dan Hulin (1989) mengkritik penggunaan perbandingan
berpasangan korelasi Barrett (1985) untuk menguji keberadaan kriteria dinamis. Mereka
mendesak penggunaan regresi atau waktu analisis seri dengan distribusi kriteria tingkat-
individu dari waktu ke waktu.
Dua penelitian selanjutnya (Hofmann, Jacobs, dan Baratta 1993; Hofmann, Jacobs,
dan Gerras 1992) mengidentifikasi dan menguji perspektif baru pada topik, perspektif
difokuskan pada pola perubahan individu dan perbedaan dalam pola seperti seluruh individu.
Kedua studi (satu menggunakan pemain bisbol profesional dan lainnya agen penjualan
menggunakan asuransi) ditemukan perbedaan sistematis yang berarti dalam (a) pola kinerja
intra individu, dan (b) perubahan kinerja dalam pola intra individu seluruh individu.
Individual Dimensionality. Ada kemungkinan individu yang melakukan pekerjaan yang

sama dapat dianggap sama-sama baik, tapi kontribusi mereka berbeda-beda. Jadi, perbedaan
dimensi criteria harus digunakan untuk mengevaluasi mereka. Kingsbury (1933), menyadari
masalah ini sudah sejak 65 tahun yang lalu ketika dia mengatakan:
“beberapa eksekutif sukses karena mereka adalah perencana yang baik, meski bukan direktur
yang sukses, yang lain hebat dalam mengkoordinasikan dan mengarahkan namun rencana dan
program mereka tidak berfungsi”
Studi tentang dimensi individu berguna untuk menentukan apakah perbedaan posisi
dalam pekerjaan yang sama memiliki psikologis yang sama.
Essentials of Criterion Development
kriteria penelitian yang kompeten termasuk salah satu kebutuhan yang sangat
dibutuhkan dalam psikologi personalia (personnel psychology) seperti pada masa
sebelumnya. Sekita 50 tahun yang lalu Struit dan Wilson (1946) mendemonstrasikan bahwa
memerhatikan perkembangan tentang performa kerja menghasilkan prediksi performa kerja
yang lebih baik. Dalam bagian ini kita akan mempertimbangkan beberapa kriteria
persyaratan penting, mencari potensi kesulitan (pitfall) dalam penelitian kritera dan
menggambarkan skema logis untuk perkembangan criteria.
10
Dalam masa awal sangat penting untuk memasang ‘prioritas kronologis’ tertentu.
Pertama kita harus mengembangkan dan menganalisa kriteria, sehingga kita bisa membentuk
atau menyeleksi predictor sehingga bisa memperkirakan criteria yang relevan. Sayangnya,
seringkali para peneliti memilih predictor secara hati-hati dan melakukan pencarian yang
terburu-buru untuk criteria yang dapat di prediksi. Ketika kita mengganti criteria, validitas
predictor akan berubah, akan tetapi kebalikannya hampir tidak benar. Jika kita menggunakan
predictor tanpa ada criteria, kita tidak akan tahu jika kita telah memilih individu yang
berpeluang besar untuk berhasil.
Sebelum kita mempelajari dan memahami performa seseorang lebih baik, kita harus
memperhatikan 4 dasar masalah yaitu: masalah reliabilitas performa, reliabilitas pengamatan
kinerja, dimensi performa dan modifikasi kinerja berdasarkan karakteristik situasional.
Reliabilitas kinerja
Reliabilitas kinerja adalah pertimbangan mendasar dalam penelitian sumber daya,
dan asumsiny tersirat dalam semua penelitian prediktif. Reliabilitas dalam konteks ini adalah
konsistensi atau stabilitas kinerja pekerjaan saat lembur. Apakah karyawan terbaik (atau
terburuk) pada jam 1 juga karyawan terbaik (atau terburuk) pada jam 2? Belum tentu. Studi-
studi yang yang dilakukan selama 30 tahun oleh Rothe fokus terhadap pengukuran objektif
tentang reliabilitas kinerja pekerja di berbagai jabatan. Pada umumnya, Rothe menemukan
bahwa hasil individu tak menentu dan tidak spesifik. Tidak hanya rentang kinerja individu
yang hebat, tapi juga sangat tidak konsisten, terutama ketika tidak ada sistem insentif
keuangan yang beroperasi. Dalam satu studi misalnya, korelasi hasil individu selama 38
minggu berkisar dari -0,03 sampai 0,91. Di bawah rencana insentif, hasil karyawan
cenderung tinggi dan konsisten, dengan produksi minggu ke minggu yang berkorelasi diatas
0,65. Menambah semua pekerjaan yang ada, Rothe menggarisbawahi poin dimana reliabilitas
kinerja yang rendah dapat menyesatkan peneliti jika mereka hanya ingin memilih period dari
konsistensi yang tinggi ataupun konsistensi yang rendah.
Faktor apa yang menyebabkan variabilitas kinerja semacam itu? Thorndike (1949)
mengidentifikasi dua tipe ketidakreliabilitasan - intrinsic dan ekstrinsik. Intrinsic
unreliability adalah karena ketidakkonsistenan diri dalam kinerja sedangkan extrinsic
unreliability dikarenakan sumber-sumber variabilitas diluar tuntutan pekerjaan atau perilaku
individu. Contohnya seperti kondisi cuaca yang berbeda-beda, penundaan suplai, atau
informasi.
11
Dihadapkan dengan semua faktor potensial ini, apa yang bisa dilakukan? Satu solusi
yang bisa dilakukan adalah menggabungkan perilaku dalam beberapa situasi dan kejadian,
menghilangkan efek munculnya factor yang tidak dapat di kontrol. Untuk mengilustrasikan
ini, Epstein (1979;1980) membuat 4 studi, setiap sampel perilaku diulang selama beberapa
minggu. Data dalam 4 studi tersebut terdiri dari penilaian diri, penilaian oleh orang lain,
perilaku yang diukur secara objektif, respon terhadap inventori kepribadian dan pengukuran
psikofisiologis seperti detak jantung.
Reliabilitas Observasi kinerja pekerjaan

Isu ini sangat penting dalam memprediksi karena semua evaluasi kinerja bergantung
pada pengamatan satu sama lain, akan tetapi metode yang berbeda dalam mengobservasi
kinerja bisa mengarah ke kesimpulan yang berbeda. Dalam upaya memvalidasi prediksi pusat
penilaian potensi penjualan di masa mendatang, 78 laki-laki dipekerjakan sebagai salesman,
terlepas dari kinerjanya di pusat penilaian. Prediksi kemudian di hubungkan dengan kinerja di
lapangan 6 bulan kemudian. Kinerja lapangan dinilai dengan 2 cara. Metode pertama,
seorang auditor yang terlatih dan independen mendampingi setiap orang di lapangan untuk
menentukan apakah dia memenuhi atau tidak memenuhi standar dalam melakukan aktivitas
penjualannya. Reviewer lapangan tidak menyadari adanya penilaian yang dibuat dari
kandidat pada pusat penilaian. Metode yang kedua, setiap individu diberi nilai oleh
supervisor penjualan dan trainernya dari sekolah training. Kedua supervisor dan trainer juga
tidak menyadari dengan prediksi pusat asesmen.
Dimensionality of Job Performance

Bahkan pemeriksaan personil yang paling singkat sekalipun mengungkapkan
berbagai prediktor yang biasanya digunakan. Walaupun rating sering digunakan dalam
beberapa aspek performansi kerja, rating tersebut sering kali digabungkan dengan sebuah
skor global. Lent, Aurbach, dan Levin (1971) mendemonstrasikan ini dalam analisis mereka
yan menggunakan 406 penelitian dan dipublikasikan dalam Personnel Psychology. Dari
1.506 kriteria yang digunakan, “Evaluasi Supervisor” digunakan dalam 879 kasus.
Beberapa ulasan (J.P Campbell, 1990, Ronan dan Prien 1966, 1971) menyimpulkan
penegertian tentang ukuran pekerjaan tanpa dimensi (bahkan untuk pekerjaan tingkat rendah)
sama sekali tidak realistis. Analisa bahka ukurang tuggal dari kinerja pekerjaan (cth; sikap
terhadap perusahaan, ketidakhadiran) telah mengungkapkan bahwa mereka jauh lebih
kompleks dibandingkan dengan hanya melihat tampilan luarnya saja. Meskipun masalah
12
yang terkait dengan kriteria global, mereka tetap terlihat bekerja cukup baik dalam beberapa
situasi personil. Jika terdapat lebih dari satu masalah spesifik, maka dibutuhkan lebih dari
satu kriteria untuk menjelaskannya (Guion, 1987).
PERFORMANCE AND SITUATIONAL CHARACTERISTICS
Kebanyakan individu akan setuju bahwa tingkat kinerja seseorang dipengaruhi oleh
kondisi seputar kinerjanya. Pada bagian selanjutnya kita akan membahas beberapa aspek -
extra-individual yang mempengaruhi kinerja individu.
Organizational Characteristic
Peneliti telah mengkaitkan ketidakhadiran karyawan dan turnover dengan berbagai
karateristik lingkungan dan organisasional (Blau, 1985; Campion, 1991; Johns, 1994;
McEvoy and Cascio 1987). Ini termasuk faktor organisasi luas (cth; kebijakan pembayaran
dan promosi); faktor interpersonal (cth; kekohesivan grup, opurtunitas persahabatan,
kepuasan dengan teman kerja atau supervisor); faktor job-related (cth; tanggung jawab,
otonomi, kejelasan tugas, tugas-tugas yang diberikan); dan faktor personal (cth; usia, mood,
keluarga dan harta benda). Jelasnya, karakteristik organisasional memiliki dampak yang luas
dalam kinerja seorang individu.
Environmental Safety
Kecelakaan dan tidak adanya waktu juga cukup mempengaruhi kinerja kerja (Ginter,
1979). Faktor seperti suasana yang positif, komitemen manajemen yang tinggi, dan sebuah
komunikasi program yang jelas yang menggabungkan setting tujuan dengan pengetahuan
cenderung dapat meningkatkan perilaku aman pada pekerjaan (Reber and Wallin, 1984).
Variabel-variabel tersebut dapat diukur secara reliabel (Zohar, 1980) dan dapat dikaitkan
dengan kinerja individual.
Lifespace Variables
Variabel ruang hidup mengukur kondisi penting disekitar karyawan baik didalam
maupun diluar pekerjaan. Mereka menjelaskan interaksi individual karyawan dengan faktor
organisasional, tuntutan tugas, supervisor dan kondisi pekerjaan. Vicno dan Bass (1978)
menggunakan empat variabel ruang hidup – tantangan tugas pada tugas pertama pekerjaan,
stabilitas kehidupan, kecocokan kepribadian antara supervisor dengan bawahan, dan
keberhasilan atasan – untuk meningkatkan prediksi kesuksesan majemenen di Exxon.
13
Variabel ruang hidup lain, seperti orientasi personal, kepercayaan karir, kosmopolitas vs
orientasi lokal membutuhkan penelitian yang lebih lanjut (Cookeand Rousseau 1983).
Job and Location

Schneider dan Mitchel (1980) mengembangkan seperangkat enam fungsi perilaku
yang komprehensif untuk pekerjaan manajer di industri asuransi jiwa. Menggunakan 1.282
manajer dari 50 perusahaan, mereka kemudian meneliti hubungan antara aktifitas dalam
fungsi ini dengan lima faktor; asal agensi (baru vs yang telah ditetapkan), jenis agensi
(perusahaan independen vs perusahaan yang dikendalikan), jumlah agen, jumlah pengawas,
dan masa jabatan manajer agensi.
Extra-Individual Differences and Sales Performance

Cravens dan Woodruff (1973) menyadari kebutuhan untuk menyesuaikan standar
kriteria yang diluar kendali tenaga penjualan, dan mereka mencoba untuk menentukan
tingkatan dimana faktor-faktor tersebut menjelaskan variasi dalam kinerja wilayah. Dalam
analisis multiple regression mereka menggunakan dollar penjualan sebagai kriteria.
Penelitian ini tidak layak karena peneliti menghasilkan estimasi asli dari kinerja kerja
individu dan dengan menggabungkan dampak pengaruh extra individual (wilayah beban
kerja, market potential, pangsa pasar perusahaan dan usaha periklanan) dengan dua variabel
perbedaan individual (pengalaman sales dan usaha penjualan sales).
Leadership
Dampak kepemimpinan dan faktor situasional dalam semangat kerja dan kinerja telah
didokumentasikan dengan baik. Penelitian ini menggambarkan bahwa variasi pada kinerja
kerja karena adanya karakteristik individual (usia, jenis kelamin, pengalam kerja, dll),
kelompok (Dobbins, 1985) dan organisasi (ukuran, struktur, manajemen tingkah laku, dll).
Sampai kita memulai untuk membagi hasil keseluruhan variabilitad pada kinerja kerja
kedalam komponen intra-individual dan ekstra-individual.
STEPS IN CRITERION DEVELOPMENT

Guion (1961) menguraikan lima tahap prosedur untuk pengembangan kriteria, yaitu :
1. Analis kebutuha pekerjaan dan organisasi
14
2. Pengembangan pengukuran perilaku aktual terhadap perilaku yang diharapkan seperti
yang diidentifikasi dalam analisis pekerjaan dan kebutuhan.langkah ini harus
melengkapi pengukuran objektif hasil organisasi seperti omset, ketidakhadiran,
produksi dan yang lainnya.
3. Identifikasi dimensi kriteria yang mendasari tindakan dengan menggunakan analisis
faktor, analisis cluster atau analisis pola.
4. Pengembangan pengukuran yang reliabel, masing-masing dengan validitas konstruk
yang tinggi dari elemen yan telah teridentifikasi
5. Penentuan validitas prediktif dari masing-masing vaiabel independen (prediktor)
untuk masing-masing ukuran penilaian, dan mengambilnya satu persatu.
Pada tahap kedua, Guion membedakan data perilaku yang didapat dari result of
behavior data atau hasil organisasional, dan menyarankan data perilaku ditambahkan dengan
result of behavior data. Pada langkah 4, ia menganjurkan untuk membangun ukuran yang
benar menggunakan pengukuran validitas konstruk. Validitas konstruk pada dasarnya adalah
sebuah penilaian apakah sebuah tes atau perangkat perdiktif lainya mengukur atribut yang
dituju secara signifikan dan apakah tes atau perangkat prediktif tersebut dapat digunakan
untuk memprediksi perilaku (Messick, 1995; Landy 1989) kedua bagian ini, utilitas (cth;
peneliti mencoba untuk menemukan keofisien validitas tertinggi yang sangat berguna) vs
pemahaman (cth; berfokus pada validitas konstruk), telah membentuk kontroversi dalam
psikologi mengenai manfaat relatif dari dua pendekatan, yang akan dibahas lebih rinci pada
bagian selanjutnya.
EVALUATING CRITERIA
Relevance
Syarat dasar dari beberapa kriteria adalah dengan mempertimbangkan antar hubungan
(misalnya hal ini harus berhubungan secara logika pada hasil utama dalam sebuah
pertanyaan). Karena itu, hal ini pada dasarnya bahwa kekuasaan akan digambarkan secara
jelas.
Ada banyak kontroversi yang mengatakan perkiraan yang berbeda dari tes untuk
orang berkulit putih dan Afrika-Amerika yang mengurangi sifat dasar dari kriteria yang
digunakan dalam studi yang berbeda.
Kriteria pengukuran yang paling berhubungan tidak akan selalu menjadi yang berguna
atau yang paling rendah. Sebuah sampel tes pekerjaan atau sistem hasil penilaian yang baik
15
mungkin memerlukan sebuah persetujuan atau kepintaran, usaha, dan biaya untuk
menggagasnya (cf. Borman and Hallam, 1991).
Bagaimanapun, pengukuran objektif dan subjektif tidak bisa dipertukarkan., satu
dengan yang lainnya, mereka berkorelasi sekitar .39 (Bommer et al., 1995). Pengukuran
subjektif tidak dapat digunakan sebagai perwakilan dari pengukuran objektif, jika
pengukuran objektif adalah pengukuran yang menarik. Namun, menghiraukan seberapa
banyak kriteria yang digunakan, ketika mengingat semua dimensi dari hasil pekerjaan, yang
diingat di sana adalah sebuah aspek penting tidak menjadi penilaian, kemudian
menambahkan kriteria pengukuran yang dibutuhkan.
Sensitivity or Discriminability
Beberapa kriteria pengukuran juga harus menjadi sensitif yaitu, mampu membedakan
antara karyawan yang efektif dan yang tidak. Kegunaan utama dari sebuah kriteria
pengukuran adalah membenarkan hanya ketika hal tersebut disajikan pada pernyataan
diskriminasi yang berbeda pada hasil pekerjaan.
Hal ini penting untuk menjelaskan, bagaimanapun bahwa tidak ada kebutuhan
asosiasi antara variasi kriteria dan hubungan kriteria. Sebuah elemen kriteria sebagai
pengukuran mungkin memiliki varians yang rendah, tetapi maksudnya adalah sebuah
perbedaan skala dari pengukuran, seperti dolar. Intinya adalah perbedaan antara pengukuran
oprasional dan sebuah rumusan konseptual adalah yang terpenting untuk organisasi (Cascio
and Valenzi, 1978).
Practically
Hal ini penting bahwa dengan mengelola atau memimpin dapat menginformasikan
secara teliti mengenai keuntungan yang sebenarnya dari menggunakan perkembangan kriteria
secara berhati-hati. Pengelola bisa saja memiliki harapan untuk penilaian kekuatan dari
sebuah kriteria pengukuran atau rangkaiannya, tapi keobjektifan tentu saja akan hampir
terbangun ketika menyimpan catatan dan mengumpulkan data agar kriteria pengukuran
menjadi tidak praktis dan secara signifikan mengganggu dengan meneruskan operasi tersebut.
CRITERION CONTAMINATION
Ketika kriteria pengukuran disusun secara hati-hati dengan tanpa memeriksa nilainya
sebelum menggunakan salah satunya untuk tujuan penelitian atau perkembangan HR polisi,
mereka sering menjadi buruk. Maier (1988) mendemostrasikan sebuah evaluasi dari tes
16
ketangkasan yang digunakan untuk membuat keputusan penempatan mengenai perekrutan
tentara. Tes ini termasuk valid. Tes ini diadministrasikan oleh mayor yang berpengalaman.
Kriteria kontaminasi muncul ketika kriteria oprasional dan yang sebenarnya termasuk
varians yang tidak berhubungan dengan kriteria akhir. Kontaminasi sendiri mungkin akan
membagi lagi menjadi dua bagian yang berbeda, eror dan bias.
Error diartikan sebagai random varians dan tidak bisa berhubungan dengan apapun
kecuali dengan mengubahnya sendiri. Bias secara sistematik mewakili kriteria kontaminasi,
dan dapat berkorelasi dengan pengukuran prediktor.
Faktor bias sangat luas dalam efek penyimpangan, tapi secara umum penyimpangan ini
adalah fungsi persetujuan atas korelasinya dengan prediktor.
Bias Due to Knowledge of Predictor Information

Salah satu kontaminasi serius dari data kriteria, khususnya ketika data dalam formulir
penilaian, adalah terlebih dahulu pengetahuan atau pembukaan dari nilai prediktor.
Mungkin cara terbaik untuk mempertahankankan perbedaan tipe bias ini adalah
memperoleh semua data kriteria sebelum beberapa prediktor melepaskan data tersebut.
Demikian pula dalam usaha untuk menilai pusat prediksi, Bray and Grant (1966)
mengumpulkan data pada pusat penilaian eksperimental, tapi data tidak memiliki hasil pada
keputusan promosi berikutnya.
Bias Due to Group Membership

Sebuah sumber tambahan dari kriteria bias menghasilkan fakta bahwa individu
termasuk ke dalam kelompok-kelompok tertentu. Faktanya, terkadang jelas atau tidaknya
kepemerintaha polisi menyewa atau mempromosikan dari si individu itu sendiri.
Penelitian kemudian melakukan usaha untuk menghubungkan karakteristik biograpi
pada kesuksesan karir yang berikutnya yang akan diperlukan sebelahnya. Akibat yang sama
juga akan terjadi ketika sebuah kelompok mengatur batasan pada seberapa banyak itu akan
diproduksi.
Bias in Ratings
Rating atau penilaian seorang pengawas biasanya sering menggunakan kriteria yang
rentan untuk semua sumber bias dalam menunjukkan keobjektifan, sebaik-bainya adalah
peryimbangan yang sebjektif. Hal ini penting untuk menegaskan bahwa bias dalam rating
mungkin saja dapat baik atau buruk atau rater tidak cukup mengobservasi, kesempatan yang
17
tidak sama pada setiap bagian terbawah untuk menunjukkan keahlian, bias-bias personal atau
prejudice pada rater itu sendiri, atau ketidakmampuan untuk membedakan dan penilaian
yang reliabel berbeda dengan hasil kerja.
Mungkin faktor bias yang sering disebutkan dalam rating adalah halo effect, yang
menjadi maksud utama dari Thorndike pada dasar dari bukti eksperimental bahwa beberapa
ratermemiliki kecenderungan untuk menilai individu tinggi atau rendah pada banyak faktor
karena rater mengetahui faktor spesifik dari individu itu sendiri. Hasil dari halo effect adalah
bahwa rating diberbagai dimensi hasil pekerjaan cemderung memiliki interkorelasi yang
tinggi.
CRITERION EQUIVALENCE
Ketika dua kriteria berkorelasi sangat tinggi, dapat diasumsikan bahwa halo effect
berpengaruh, dan ketika keduanya berkorelasi tepat setelah dikoreksi untuk ketidak
reliabilitasannya, maka keduanya setara (equivalent). Criterion equivalence tidak dapat
diasumsikan, hal ini merupakan sesuatu yang langka pada sebuah penelitian HR. Ketika dua
kriteria setara equivalent, artinya keduanya mengandung elemen kerja yang sama, mengukur
karakteristik individu yang sama, dan memiliki porsi yang sama dalam lingkup kriteria
konseptual. Dua kriteria dikatakan equivalent ketika tidak ada perbedaan antar keduanya.
Namun jika korelasi antar keduanya tidak sempurna, maka keduanya tidak equivalent.
Dalam menganalisis kriteria dan menggunakannya untuk mengobservasi kinerja, seseorang
harus mempertimbangkan waktu pengukuran, tipe pengukuran, dan level dari kinerja yang
menggambarkan sukses atau tidak, dan usaha dalam mengestimasi efek dari level kinerja
yang dipilih dari kesimpulan yang diperoleh.
Peneliti dapat memakai kriteria yang sangat berkorelasi dengan beberapa cara. Ia dapat
melepaskan salah satu kriteria, melihatnya sebagai informasi. Banyak informasi yang dimiliki
semakin baik.
Strategi berikutnya mengumpulkan data yang relevan dengan yang diukur kedua
kriteria, mengubah semua data menjadi standard-score form, menghitung nilai rata-rata
individu, dan menggunakannya sebagai estimasi terbaik dalam dimensi gabungan. Namun hal
utama yang harus diperhatikan ialah strategi apapun yang digunakan oleh seorang peneliti
harus didasari oleh pemikiran teoritis dan rasional dan harus memahami sepenuhnya
implikasi dari strategi yang dipilih.
18
COMPOSITE VERSUS MULTIPLE CRITERIA
Psikologi terapan umumnya setuju bahwa performa kerja merupakan multidimensi
secara alamiah dan pengukuran yang cukup terhadap performa kerja membutuhkan kriteria
yang multidimensi. Pertanyaan selanjutnya tentang hal itu. Haruskah satu mengkombinasikan
beragam kriteria mengukur ke skor gabungan, atau seharusnya satu membuat masing-masing
kriteria mengukur secara terpisah? Jika investigator memilih untuk menggabungkan elemen-
elemen, apa aturan yang seharusnya digunakan? Seperti isu utilitas vs isu pemahaman,
keduanya membagikan tentang pendukung yang hebat sepanjang tahun.
Composite Criterion
Konteks dasar Toops (1944), Thorndike (1949), Brogden and Taylor (1950a), dan
Nagle (1953), adalah pendukung terkuat kriteria gabungan. Kriteria gabungan merupakan
kriteria yang seharusnya menyediakan sebuah patokan atau keseluruhan mengukur
“kesuksesan” atau “nilai organisasi” dari masing-masing individu. Misalnya indeks tunggal
merupakan hal yang sangat diperlukan dalam membuat keputusan dan perbandingan
individu, dan jika dimensi kriteria dibuat terpisah dalam validasi, investigator harus
mengetahui bagaimana mengkombinasikan gabungan ketika sebuah keputusan dibutuhkan.
Meskipun hal ini mungkin atau sering dilakukan secara subjektif, skema pembobotan
kuantitatif membuat tujuan pentingnya ditempatkan di masing-masing unsur kriteria.
Multiple Criteria
Pendukung multiple criteria berpendapat bahwa mengukur variabel yang terbukti
berbeda seharusnya tidak dikombinasikan. Seperti Cattel (1957) mengatakan “Sepuluh pria
dan dua botol bir tidak dapat ditambahkan untuk memberikan total yang sama seperti dua pria
dan sepuluh botol bir”.
Mempertimbangkan studi tentang perekrut militer (Pulakos, Borman, dan Hough,
1988). Dalam mengukur keefektifan perekrut, hal ini dilihat dari selling skills, human
relations skills, dan organizing skills yang merupakan hal penting dan berhubungan dengan
kesuksesan. Ada juga ditemukan bahwa tiga dimensi tersebut tidak saling berhubungan
misalnya perekrut dengan selling skills yang baik belum tentu memiliki human relations
skills atau organizing skills yang baik. Pada kondisi ini, menggabungkan tindakan-tindakan
mengarah ke sebuah gabungan bukan tidak hanya ambigu, tetapi juga omong kosong secara
psikologi.
19
Schmidt dan Kaplan (1971) kemudian menunjukkan bahwa menggabungkan berbagai
elemen kriteria menjadi komposit (gabungan) menyiratkan bahwa ada dimensi tunggal
dalam kinerja, tetapi tidak dalam dari dirinya sendiri. Berarti bahwa dimensi tunggal ini
merupakan perilaku atau sifat dasar psikologis. Composite criteria mungkin menunjukkan
dimensi pokok ekonomi, sementara pada saat yang sama menjadi kurang berarti ketika dilihat
dari sudut pandang behavioral. Dengan demikian, Brogden dan Taylor (1950a) berpendapat
bahwa ketika semua kriteria merupakan ukuran yang relevan dari variabel-variabel ekonomi
(dolar dan sen), mereka dapat dikombinasikan menjadi sebuah komposit, terlepas dari
interkorelasi mereka.
Differing Assumptions
Seperti Schmidt dan Kaplan (1971) dan Binning dan Barrett (1989) menyatat bahwa
ada dua posisi yang berbeda dalam hal:
 Sifat konstruksi yang mendasari pengukuran kriteria
Asumsi composite criterion bahwa kriteria seharusnya merepresentasikan konstruk
ekonomi daripada konstruk perilaku. Orientasi ekonomi diilustrasikan dalam Brogden dan
Taylor (1950a) “dollar criterion” : Kriteria harus mengukur semua kontribusi individu pada
organsisasi”. Brogden dan Taylor menyatakan bahwa keseluruhan efisiensi harusnya diukur
dalam hal dollar dengan cara menerapkan konsep harga dan prosedur untuk perilaku kerja
individu setiap karyawan. Masalah criterion berpusat utamanya pada kuantitas, kualitas, dan
harga dari produk yang diselesaikan.
Sebaliknya, pendukung multiple criteria (Dunnetter, 1963; Pulakos et al., 1988)
berpendapat bahwa kriteria seharusnya menunjukkan konstruk behavioral atau psikologis,
salah satunya perilaku homogen. Pulakos et al. menyatakan kebutuhan untuk
mengembangkan suatu kriteria gabungan ketika mengambil keputusan pekerjaan, tapi mereka
juga menekankan bahwa kriteria gabungan yang baik ketika komponen mereka dapat
dipahami dengan baik.
 Tujuan utama dari proses validasi

Pendukung composite criterion mengasumsikan bahwa proses validasi dipengaruhi
hanya karena alasan praktis dan ekonomis, dan tidak meningkatkan pemahaman yang lebih
tentang proses psikologis dan behavioral pada pekerjaan yang beragam. Jadi, Brogden dan
Taylor (1950a) dengan jelas membedakan produk akhir dari pekerjaan yang diberikan
20
(produk kerja) dengan proses kerja yang membuat produk akhir tersebut. Berkenaan dengan
proses pekerjaan, mereka berpendapat bahwa : “faktor-faktor seperti skill yang laten, efeknya
direalisasikan dalam produk akhir.” Mereka tidak puas dengan syarat logis dari kriteria yang
cukup.
Sebaliknya, pendukung pandangan multiple criteria menambahkan pemahaman
sebagai tujuan penting proses validasi, yang berhubungan dengan tujuan praktis dan ekonomi
: “Tujuan penelitian untuk pemahaman merupakan teori perilaku kerja, teori perilaku manusia
adalah cast dalam istilah konstruk psikologis dan behavioral, bukan pada konstruk ekonomi”
(Schmidt and Kaplan, 1971,p.424).
Resolving the Dilemma

Ada banyak kemungkinan penggunaan performa kerja dan kriteria evaluasi program.
Umumnya, hal tersebut digunakan untuk tujuan penelitian atau secara operasional sebagai
bantuan dalam pengambilan keputusan manajerial. Ketika kriteria digunakan untuk tujuan
penelitian, penekanannya pada pemahaman psikologis terhadap hubungan antara prediktor
yang beragam dengan dimensi kriteria yang terpisah, dimana dimensi-dimensi itu sendiri
merupakan perilaku yang alamiah. Ketika kriteria digunakan untuk tujuan pengambilan
keputusan manajerial seperti tugas kerja, promosi, besar penganggaran, evaluasi terhadap
cost-effectiveness perekrutan, pelatihan, dan program iklan, dimensi kriteria harus
dikombinasikan ke dalam suatu gabungan yang menunjukkan keseluruhan (ekonomi) harga
organisasi.
Resolusi composite criteria versus multiple criteria dilemma pada dasarnya
bergantung pada keobjektifan investigator. Kedua metode tersebut adalah sah dengan
tujuannya sendiri. Jika tujuannya untuk meningkatkan pemahaman psikologis hubungan
antara kriteria-prediktor, maka elemen kriteria sebaiknya dipisah. Jika tujuannya untuk
pengambilan keputusan yang objektif maka elemen kriteria seharusnya dihargai, tanpa
memperhatikan interkorelasi diantaranya, ke dalam composite menunjukkan konstruk
ekonomi yang secara keseluruhan berharga bagi organisasi.
Ukuran kriteria dengan teori yang relevan seharusnya tidak menggantikan praktik
yang relevan, tetapi seharusnya menambah atau menggunakannya terus. Oleh karena itu,
tujuannya adalah untuk meningkatkan utilitas dan pemahaman.
RESEARCH DESIGN AND CRITERION THEORY
21
Psikolog Personil dipandu oleh simple prediction model yang berusaha
menghubungkan kinerja pada satu atau lebih prediktor dengan criterion campuran. Model
criterion yang lengkap untuk menggambarkan kesimpulan yang dibutuhkan untuk
pengembangan criterion disampaikan oleh Binning dan Bamett (1989) pada gambar 4.3.
Manajer yang terlibat dalam keputusan ketenagakerjaan sangat memperhatikan sejauh mana
informasi penilaian akan mendapatkan prediksi yang akurat mengenai kinerja pekerjaan
berikutnya (Inferensi 9). Pendekatan yang membenarkan Inferensi 9 akan menghasilkan bukti
empiris langsung bahwa skor penilaian berhubungan dengan pengukuran kinerja pekerjaan
yang valid. Inferensi 5 menunjukkan keterkaitan ini, yang secara tradisional menjadi
perhatian paling pragmatis bagi psikolog personil. Untuk memiliki kepercayaan penuh pada
Inferensi 9, Inferensi 5 dan 8 harus dibenarkan. Artinya, prediktor harus dikaitkan dengan
ukuran criterion operasional (Inferensi 5), dan ukuran criterion operasional harus dikaitkan
dengan domain kinerja (Inferensi 8).
Domain kinerja terdiri dari unit hasil perilaku (Binning dan Barrett, 1989 ). Hasil
(volume penjualan dolar) dinilai oleh organisasi, dan perilaku (keterampilan menjual) adalah
alat untuk mencapai tujuan ini. Perilaku membawa nilai yang berbeda, tergantung pada nilai
hasil. Hal ini menyiratkan bahwa deskripsi optimal dari domain kinerja untuk pekerjaan
tertentu memerlukan representasi hasil, dinilai secara hati-hati, dan representasi lengkap dari
perilaku yang menyertainya. Model criterion komposit berfokus pada hasil, sedangkan
beberapa model criterion berfokus pada perilaku.
Inferensi 8 merupakan proses pengembangan criterion. Biasanya dibenarkan oleh
analisis rasional (dalam bentuk data analisis pekerjaan) yang menunjukkan bahwa semua
dimensi perilaku atau hasil pekerjaan utama telah diidentifikasi dan diwakili dalam ukuran
criterion operasional. Kenyataannya, analisis memberikan dasar evolusioner untuk
membenarkan Inferensi 7, 8, 10, dan 11.
Para ahli psikologi personalia yang memiliki tradisi oleh validitas pembuatan label
terkait dengan inferensi 6 dan 7. Artinya, jika dapat ditunjukkan bahwa tes (mis, pemahaman
bacaan) mengukur konstruk tertentu (Inferensi 6), seperti pemahaman bacaan, yang telah
ditentukan untuk menjadi kritis terhadap kinerja kerja (Inferensi 7), kemudian menyimpulkan
tentang kinerja dari nilai tes (Inferensi 9) adalah dengan dibenarkan implikasi logis.
Konstruksi hanyalah label untuk keteraturan perilaku yang mendasari perilaku yang dicontoh
oleh prediktor, dan dalam domain kinerja berdasarkan criterion.
Dalam konteks pemahaman dan validasi criterion, Inferensi 7, 8, 10, dan 11 sangat
penting. Inferensi 7 biasanya dibenarkan oleh gugatan, berdasarkan analisis pekerjaan, bahwa
22
konstruksi yang mendasari kinerja telah diidentifikasi. Proses ini biasa disebut sebagai
deriving job specification. Inferensi 10 juga menunjukkan sejauh mana tuntutan pekerjaan
aktual telah dianalisis secara memadai, menghasilkan deskripsi domain kinerja yang valid.
Proses ini biasa disebut sebagai job description. Inferensi 11 mewakili sejauh mana hubungan
antara perilaku kerja dan hasil kerja. telah diverifikasi. Analisis pekerjaan adalah proses yang
digunakan untuk menemukan dan menentukan tautan ini.
Kerangka kerja pada gambar 4,3 membantu mengidentifikasi criterion problem.
Masalah ini diakibatkan oleh kecenderungan mengabaikan pengembangan bukti yang
memadai untuk mendukung Inferensi 7, 8, dan 10. Hal ini juga mengarah pada dua
konsekuensi : (1) pengembangan ukuran criterion yang kurang ketat secara psikometri
daripada tindakan prediktor (2) kriteria kinerja yang kurang tertanam dalam jaringan
hubungan teoritis yang dibangun di sisi prediktor. Pengembangan bukti untuk mendukung
keterkaitan penting yang ditunjukkan pada gambar 4,3 akan menghasilkan keputusan
kepegawaian informasi yang lebih baik, keputusan pengembangan karir, dan pada akhirnya
organisasi lebih efektif.
Gambar 4.3
23
Daftar Pustaka:
Casio. Wayne F. (1998). Applied Psychology In Human Resource Management. 5th ed.
United States of America: Prentice-Hall, Inc.
24

Criteria Concepts, Measurements, and Evaluation

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Criteria Concepts, Measurements, and Evaluation

Diunggah oleh

Hak Cipta:

Format Tersedia

PENGEMBANGAN SUMBER DAYA MANUSIA

“Criteria: Concepts, Measurements, and

Ahmad Yusuf Tamin (13-085)

The Domain of Job

Performance And Situasional

Composite Versus Multiple

THE DOMAIN OF JOB PERFORMANCE

immediate intermediate summary

Dynamic Dimensionality. Akal sehat menunjukkan bahwa sebagai karyawan mendapatkan

Individual Dimensionality. Ada kemungkinan individu yang melakukan pekerjaan yang

Essentials of Criterion Development

Reliabilitas Observasi kinerja pekerjaan

Dimensionality of Job Performance

Job and Location

Extra-Individual Differences and Sales Performance

STEPS IN CRITERION DEVELOPMENT

Bias Due to Knowledge of Predictor Information

Bias Due to Group Membership

 Tujuan utama dari proses validasi

Resolving the Dilemma

RESEARCH DESIGN AND CRITERION THEORY

Anda mungkin juga menyukai