Oleh:
Kelompok 2
Kelas A/2015
FAKULTAS PSIKOLOGI
UNIVERSITAS SUMATERA UTARA
1
2017
DAFTAR ISI
At A
Glance..........................................................................................................................................
1
Definition.....................................................................................................................................
.........1
Dimensionality Of
Criteria............................................................................................................3
Essentials of Criterion
Development....................................................................................................7
Steps In Criterion
Development.........................................................................................................11
Evaluating
Criteria…..........................................................................................................................12
Criterion
Contamination.....................................................................................................................13
Criterion
Equivalence.........................................................................................................................15
2
Research Design and Criterion
Theory..............................................................................................18
Daftar
Pustaka....................................................................................................................................21
KATA PENGANTAR
Puji syukur kami panjatkan ke hadirat Tuhan Yang Maha Esa, karena atas berkatnya
kami mampu menyelesaikan makalah ini.
Kami membuat makalah ini dengan tujuan supaya lebih memahami materi
pembahasan mata kuliah Pengembangan Sumber Daya Manusia mengenai Criteria: concept,
measurement, and evaluation.
Kami mengucapkan banyak terima kasih kepada Dosen pengampu Pengembangan
Sumber Daya Manusia yang telah mengizinkan kami membuat makalah ini dan kepada
semua teman-teman yang mendukung kami dalam menyelesaikan makalah ini.
Kami mengetahui bahwa makalah ini mungkin tidak sempurna, oleh karena itu, untuk
menyempurnakannya kritik dan saran kami terima. Atas perhatiannya kami ucapkan banyak
terima kasih.
3
AT A GLANCE
Pengukuran kriteria yang memadai dan akurat merupakan masalah mendasar dalam
personnel psychology. Meskipun kriteria kadang-kadang digunakan untuk tujuan prediktif
dan terkadang untuk tujuan evaluasi, dalam kedua kasus tersebut, hal tersebut mewakili apa
yang penting atau diinginkan. Kriteria adalah pernyataan operasional dari tujuan atau hasil
yang diinginkan.
Sebelum kita dapat mempelajari kinerja manusia dan memahaminya dengan lebih
baik, kita harus menghadapi empat masalah: keandalan kinerja, keandalan pengamatan
kinerja, dimensi kinerja, dan modifikasi kinerja berdasarkan karakteristik situasional.
Akhirnya, dalam mengevaluasi kriteria operasional, kita harus waspada terhadap kontaminan
tertentu, seperti faktor bias dalam peringkat. Selain itu, pengukuran kriteria operasional harus
relevan, handal, sensitif, dan praktis.
Secara umum, psikolog terapan dipandu oleh dua tujuan utama: (1) untuk
menunjukkan kegunaan prosedur dan program mereka, dan (2) untuk meningkatkan
pemahaman mereka tentang faktor-faktor penentu keberhasilan pekerjaan. Dalam upaya
mencapai ini, terkadang kriteria gabungan digunakan dan terkadang beberapa kriteria
digunakan. Meskipun ada kontroversi yang bertahan lama mengenai manfaat relatif dari
setiap pendekatan, kami akan menunjukkan bahwa kedua posisi berbeda dalam hal asumsi
dan tujuan akhir yang mendasarinya. Dengan demikian, satu atau keduanya mungkin sesuai
dalam keadaan tertentu. Di kesimpulan bagian bab ini, kami akan menawarkan beberapa
desain penelitian yang menjanjikan yang seharusnya terbukti menyelesaikan dilema kriteria
dan dengan demikian menguntungkan lapangan.
Pengembangan kriteria yang memadai dan tepat sekaligus merupakan batu sandungan
dan tantangan bagi spesialis HR. Ilmuwan behavioral mengeluhkan "masalah kriteria"
selama bertahun-tahun. Istilah ini mengacu pada kesulitan yang dihadapi dalam proses
konseptualisasi dan pengukuran konstruk kinerja yang bersifat multidimensi, dinamis, dan
tepat untuk tujuan yang berbeda.
DEFINITION
Terdapat berbagai definisi kriteria. Dari satu kriteria perspektif, kriteria adalah standar
yang bisa dijadikan tolak ukur untuk mengukur keberhasilan atau kegagalan karyawan.
4
Definisi ini cukup memadai dalam konteks pemilihan karyawan, penempatan, dan penilaian
kinerja. Ini berguna saat prediksi terlibat - yaitu, dalam pembentukan hubungan fungsional
antara variabel negatif, prediktor, dan variabel lain, kriteria. Namun, ada kalanya kita hanya
ingin mengevaluasi tanpa harus meramalkan. Misalkan, misalnya, departemen HR prihatin
dengan mengevaluasi efektivitas kampanye perekrutan yang ditujukan untuk menarik
pelamar minoritas. Berbagai kriteria harus digunakan untuk mengevaluasi program secara
memadai. Tujuan dalam kasus ini bukanlah prediksi, melainkan evaluasi. Satu perbedaan
antara prediktor dan kriteria adalah waktu. Misalnya, jika standar evaluatif seperti tes tertulis
atau kinerja dilakukan sebelum keputusan ketenagakerjaan dibuat (yaitu, untuk menyewa,
mempromosikan), standarnya adalah prediktor. Jika standar evaluatif diberikan setelah
keputusan ketenagakerjaan dibuat (yaitu, untuk mengevaluasi efektivitas kinerja), standar
adalah kriteria.
Dengan demikian, definisi yang lebih komprehensif diperlukan, karena apakah kita
memprediksi atau mengevaluasi, kriteria merupakan sesuatu yang penting atau diinginkan.
Ini adalah pernyataan operasional dari tujuan atau hasil yang diinginkan dari program yang
diteliti. Ini adalah standar evaluatif yang dapat digunakan untuk mengukur kinerja, sikap,
motivasi, dan sebagainya seseorang. Ada beberapa persyaratan kriteria selain keinginan dan
kepentingan, tapi sebelum memeriksanya, pertama-tama kita harus mempertimbangkan
dimensi konseptual tertentu.
5
Kriteria utama kinerja sales harus mencakup, misalnya, total volume penjualan
selama keseluruhan masa kerja individu dengan perusahaan; jumlah total akun baru masuk
selama karir individu; jumlah loyalitas pelanggan yang dibangun oleh tenaga penjual selama
perawatannya; jumlah pengaruhnya terhadap moral atau catatan penjualan salesman
perusahaan lainnya; dan efektivitas keseluruhan dalam kegiatan perencanaan dan panggilan,
pengendalian biaya, dan penanganan laporan dan catatan yang diperlukan. Singkatnya,
kriteria utama adalah konstruk yang bersifat konseptual.
Meskipun kriteria utama dinyatakan dalam istilah luas yang seringkali tidak rentan
terhadap evaluasi kuantitatif, ini adalah konstruksi yang penting karena relevansi pengukuran
kriteria operasional dan faktor-faktor yang mendasari pemilihannya lebih dipahami jika tahap
konseptual didokumentasikan dengan jelas dan terdokumentasi dengan baik.
DIMENSIONALITY OF CRITERIA
Ukuran-ukuran operasional dari kriteria konseptual dapat bervariasi dalam beberapa
dimensi. Termasuk didalamnya dimensi psikologis (misalnya, keterampilan perawat dalam
hubungan manusia); dimensi ekologi (yaitu, dalam hal hubungan antara seseorang dan
lingkungannya seperti kemampuan perakitan lini pekerja dalam berbagai kondisi panas,
kebisingan, dan cahaya); dimensi fisik (misalnya, biaya psikologis, kalori yang digunakan per
menit, dari berbagai jenis pekerjaan): atau dimensi ekonomi (misalnya, biaya dolar kesalahan,
memo dan mengolah kembali). Kriteria juga bervariasi sepanjang beberapa dimensi penting
lainnya, kita akan melihat dalam apa yang berikut.
Temporal Dimensionality
Setelah kita telah jelaskan kriteria konseptual, maka kita harus menentukan dan
memperbaiki ukuran-ukuran operasional atau kinerja kriteria (mis. kriteria sebenarnya yang
akan digunakan). Kapan waktu terbaik untuk pengukuran kriteria? Waktu yang optimal
sangat bervariasi dari situasi ke situasi, oleh karena itu kesimpulan harus ditulis ketika
pengukuran kriteria diambil. Hasil yang jauh berbeda mungkin terjadi tergantung pada waktu
pengukuran kriteria diambil (Weitz. 1961), dan kegagalan untuk mempertimbangkan dimensi
temporal dapat mengakibatkan salah penafsiran.
Dalam memprediksi keberhasilan penjualan dan kelangsungan hidup agen asuransi
jiwa, misalnya, kemampuan yang diukur dengan standarisasi signifikan dalam menentukan
keberhasilan awal, tetapi minat dan faktor kepribadian memainkan peran yang lebih penting
di kemudian hari (Ferguson, 1960). Keterampilan interpersonal dengan rekan dan klien lebih
6
penting daripada keahlian teknis murni untuk kesuksesan. Singkatnya, pengukuran kriteria
tidak tergantung pada waktu.
Sebelumnya telah tercatat bahwa kriteria utama mewujudkan ide efektivitas jangka
panjang. Kriteria utama tidak secara praktis untuk pengambilan keputusan sehari-hari atau
evaluasi. Oleh karena itu, kita harus menggunakan kriteria pengganti, immediate atau
intermediate (lihat Gambar. 4-1). Semua kriteria immediate dan intermediate akan berat
sebelah sejak mereka hanya memberikan sebuah perkiraan kriteria utama (Thorndike, 1949).
Gambar 4-1 kurang ketelitian dalam hal bahwa ada banyak kelonggaran dalam menentukan
ketika kriteria immediate menjadi kriteria intermediate. Kriteria immediate adalah ukuran
jangka pendek, seperti nilai tes pada hari terakhir dari kelas pelatihan atau pengukuran kinerja
pemain quarterback baru di pertandingan pertamanya. Kriteria intermediate diperoleh pada
lain waktu, biasanya sekitar 6 bulan setelah pengukuran awal (yaitu, penilaian pengawasan
kinerja, tes kinerja sampel pekerjaan, atau penilaian rekan efektivitas). Kriteria ringkasan
yang dinyatakan dalam rata-rata jangka panjang atau total. Kriteria ringkasan berguna karena
menghindari atau mengimbangi efek jangka pendek atau tren dan kesalahan pengamatan, dan
pengukuran. Kriteria ringkasan berkisar dari pengukuran yang dilakukan setelah kinerja tiga
bulan, 3 sampai 4 tahun tiga bulan kinerja, atau bahkan lebih lama.
To Time Tx
Dimensi Temporal adalah konsep yang luas, dan dalam dua bagian berikut kita akan
mempertimbangkan dua kasus khusus temporal dimensi: dimensi statis dan dimensi dinamis.
Static Dimensionality. Dalam sebuah artikel klasik Ghiselli (1956b) mengidentifikasi tiga
jenis kriteria dimensi: statis, dinamis, dan individu dimensi. Jika kita amati kinerja pekerjaan
di setiap titik waktu, kita menemukan bahwa sudah kodratnya performa kerja itu adalah
multidimensi (Campbell, 1990). Misalnya, Rush (1953) menemukan bahwa sejumlah
keterampilan yang relatif independen yang terlibat dalam penjualan, sehingga pada waktu
tertentu seorang tenaga penjualan mungkin berperforma tinggi pada satu karakteristik kinerja
dan sekaligus rendah pada yang lain. Dengan demikian, bakat belajar tenaga penjual (yang
diukur dengan nilai sekolah penjualan dan pengetahuan teknis) tidak berhubungan dengan
7
ukuran objektif prestasinya (seperti volume rata-rata bulanan dari penjualan atau persentase
kuota tercapai), yang pada akhirnya bergantung pada teknik penjualannya (misalnya,
perencanaan kerja, dinilai nilai potensial untuk perusahaan), yang pada gilirannya independen
dari nya teknik penjualan (pendekatan penjualan, minat dan antusiasme, dll). Demikian pula,
Fleishman dan Ornstein (1960) mengidentifikasi enam kemampuan komponen dalam
menggambarkan kinerja pilot. Kita bisa mengumpulkan banyak bukti tambahan untuk
mendukung gagasan bahwa prestasi kerja adalah multidimensional, tapi yang penting adalah
bahwa dimensi statis biasanya dipertimbangkan dalam penelitian kriteria. Sering kita
mengambil potret dari kinerja pada satu titik dalam waktu menggunakan kriteria tunggal, dan
kami menganggap bahwa kita telah "memotret" dan menggambarkan kinerja karyawan secara
memadai. Hal ini belum tentu demikian.
8
Changes in Validity over time. Kriteria mungkin juga bersifat dinamis, jika validitas prediksi
berfluktuasi dari waktu ke waktu. Bass (1962) menyelidiki ini menjadi kasus pada salesman
yang dinilai kinerjanya selama 42 bulan. Skor pada tiga tes kemampuan serta penilaian rekan
pada tiga dimensi dikumpulkan untuk menjadi sampel dari 99 salesman. Hasil penelitian
menunjukkan pola koefisien validitas baik untuk tes dan penilaian rekan yang tampak
berfluktuasi tak menentu dari waktu ke waktu. Namun, banyak kesimpulan yang berbeda
tercapai ketika koefisien validitas diuji secara statistik. Tidak ada perbedaan signifikan yang
ditemukan validitas dari tes kemampuan, dan ketika peringkat rekan digunakan sebagai
prediktor, koefisien validitas menunjukkan perbedaan yang signifikan secara statistik (Barrett
et al., 1985).
Para peneliti telah menyarankan dua hipotesis untuk menjelaskan mengapa validitas
mungkin berubah dari waktu ke waktu. Salah satunya changing task model, menunjukkan
bahwa ketika jumlah relatif kemampuan yang dimiliki oleh individual tetap stabil selama
waktu itu, kriteria untuk kinerja efektif mungkin berubah pada kepentingannya. Maka
validitas prediksi kinerja juga mungkin berubah. Model kedua, yang dikenal sebagai
changing subjects model, menunjukkan bahwa selama kemampuan khusus yang diperlukan
untuk kinerja yang efektif tetap konstan dari waktu ke waktu, tingkat kemampuan masing-
masing individu berubah dari waktu ke waktu, dan itulah sebabnya mengapa validitas
berfluktuasi (Henry dan Hulin, 1987).
Tak satu pun dari model-model di atas telah mendapat dukungan wajar tanpa
pengecualian. Memang, para pendukung pandangan, bahwa validitas cenderung menurun dari
waktu ke waktu (Henry dan Hulin, 1987; 1989) dan para pendukung pandangan, bahwa
validitas tetap stabil dari waktu ke waktu (Ackerman, 1989; Barrett dan Alexander, 1989)
setuju pada satu titik, kinerja awal cenderung menunjukkan beberapa kerusakan pada
korelasinya dengan kinerjanya nanti. Namun, ketika hanya studi longittudinal diperiksa
ditemukan, pandangan bahwa validitas berfluktuasi dari waktu ke waktu.
Changes in the Rank-ordering of scores on the Criterion over time. Untuk menguji definisi
kriteria dinamis sistematis, Barrett et al. (1985) mencari semua isu jurnal psikologi terapan
dan Psikologi Personel untuk studi yang dilaporkan korelasinya antara ukuran kriteria
dikumpulkan pada dua kesempatan. 276 koefisien diidentifikasi, hanya 8,7 persen yang tidak
signifikan. Meskipun tidak dapat disimpulkan dari hasil ini bahwa tidak ada perubahan di
urutan pemesanan telah terjadi, ada tidak muncul untuk stabilitas substansial di
measurements kriteria diulang. Penelitian selanjutnya terhadap kinerja 6-month dari 509
9
operator mesin jahit menemukan bahwa relatif kinerja tidak stabil dari waktu ke waktu
(Deadrick dan Madigan. 1990).
Austin, Humphreys, dan Hulin (1989) mengkritik penggunaan perbandingan
berpasangan korelasi Barrett (1985) untuk menguji keberadaan kriteria dinamis. Mereka
mendesak penggunaan regresi atau waktu analisis seri dengan distribusi kriteria tingkat-
individu dari waktu ke waktu.
Dua penelitian selanjutnya (Hofmann, Jacobs, dan Baratta 1993; Hofmann, Jacobs,
dan Gerras 1992) mengidentifikasi dan menguji perspektif baru pada topik, perspektif
difokuskan pada pola perubahan individu dan perbedaan dalam pola seperti seluruh individu.
Kedua studi (satu menggunakan pemain bisbol profesional dan lainnya agen penjualan
menggunakan asuransi) ditemukan perbedaan sistematis yang berarti dalam (a) pola kinerja
intra individu, dan (b) perubahan kinerja dalam pola intra individu seluruh individu.
“beberapa eksekutif sukses karena mereka adalah perencana yang baik, meski bukan direktur
yang sukses, yang lain hebat dalam mengkoordinasikan dan mengarahkan namun rencana dan
program mereka tidak berfungsi”
Studi tentang dimensi individu berguna untuk menentukan apakah perbedaan posisi
dalam pekerjaan yang sama memiliki psikologis yang sama.
kriteria penelitian yang kompeten termasuk salah satu kebutuhan yang sangat
dibutuhkan dalam psikologi personalia (personnel psychology) seperti pada masa
sebelumnya. Sekita 50 tahun yang lalu Struit dan Wilson (1946) mendemonstrasikan bahwa
memerhatikan perkembangan tentang performa kerja menghasilkan prediksi performa kerja
yang lebih baik. Dalam bagian ini kita akan mempertimbangkan beberapa kriteria
persyaratan penting, mencari potensi kesulitan (pitfall) dalam penelitian kritera dan
menggambarkan skema logis untuk perkembangan criteria.
10
Dalam masa awal sangat penting untuk memasang ‘prioritas kronologis’ tertentu.
Pertama kita harus mengembangkan dan menganalisa kriteria, sehingga kita bisa membentuk
atau menyeleksi predictor sehingga bisa memperkirakan criteria yang relevan. Sayangnya,
seringkali para peneliti memilih predictor secara hati-hati dan melakukan pencarian yang
terburu-buru untuk criteria yang dapat di prediksi. Ketika kita mengganti criteria, validitas
predictor akan berubah, akan tetapi kebalikannya hampir tidak benar. Jika kita menggunakan
predictor tanpa ada criteria, kita tidak akan tahu jika kita telah memilih individu yang
berpeluang besar untuk berhasil.
Sebelum kita mempelajari dan memahami performa seseorang lebih baik, kita harus
memperhatikan 4 dasar masalah yaitu: masalah reliabilitas performa, reliabilitas pengamatan
kinerja, dimensi performa dan modifikasi kinerja berdasarkan karakteristik situasional.
Reliabilitas kinerja
Reliabilitas kinerja adalah pertimbangan mendasar dalam penelitian sumber daya,
dan asumsiny tersirat dalam semua penelitian prediktif. Reliabilitas dalam konteks ini adalah
konsistensi atau stabilitas kinerja pekerjaan saat lembur. Apakah karyawan terbaik (atau
terburuk) pada jam 1 juga karyawan terbaik (atau terburuk) pada jam 2? Belum tentu. Studi-
studi yang yang dilakukan selama 30 tahun oleh Rothe fokus terhadap pengukuran objektif
tentang reliabilitas kinerja pekerja di berbagai jabatan. Pada umumnya, Rothe menemukan
bahwa hasil individu tak menentu dan tidak spesifik. Tidak hanya rentang kinerja individu
yang hebat, tapi juga sangat tidak konsisten, terutama ketika tidak ada sistem insentif
keuangan yang beroperasi. Dalam satu studi misalnya, korelasi hasil individu selama 38
minggu berkisar dari -0,03 sampai 0,91. Di bawah rencana insentif, hasil karyawan
cenderung tinggi dan konsisten, dengan produksi minggu ke minggu yang berkorelasi diatas
0,65. Menambah semua pekerjaan yang ada, Rothe menggarisbawahi poin dimana reliabilitas
kinerja yang rendah dapat menyesatkan peneliti jika mereka hanya ingin memilih period dari
konsistensi yang tinggi ataupun konsistensi yang rendah.
Faktor apa yang menyebabkan variabilitas kinerja semacam itu? Thorndike (1949)
mengidentifikasi dua tipe ketidakreliabilitasan - intrinsic dan ekstrinsik. Intrinsic
unreliability adalah karena ketidakkonsistenan diri dalam kinerja sedangkan extrinsic
unreliability dikarenakan sumber-sumber variabilitas diluar tuntutan pekerjaan atau perilaku
individu. Contohnya seperti kondisi cuaca yang berbeda-beda, penundaan suplai, atau
informasi.
11
Dihadapkan dengan semua faktor potensial ini, apa yang bisa dilakukan? Satu solusi
yang bisa dilakukan adalah menggabungkan perilaku dalam beberapa situasi dan kejadian,
menghilangkan efek munculnya factor yang tidak dapat di kontrol. Untuk mengilustrasikan
ini, Epstein (1979;1980) membuat 4 studi, setiap sampel perilaku diulang selama beberapa
minggu. Data dalam 4 studi tersebut terdiri dari penilaian diri, penilaian oleh orang lain,
perilaku yang diukur secara objektif, respon terhadap inventori kepribadian dan pengukuran
psikofisiologis seperti detak jantung.
12
yang terkait dengan kriteria global, mereka tetap terlihat bekerja cukup baik dalam beberapa
situasi personil. Jika terdapat lebih dari satu masalah spesifik, maka dibutuhkan lebih dari
satu kriteria untuk menjelaskannya (Guion, 1987).
PERFORMANCE AND SITUATIONAL CHARACTERISTICS
Kebanyakan individu akan setuju bahwa tingkat kinerja seseorang dipengaruhi oleh
kondisi seputar kinerjanya. Pada bagian selanjutnya kita akan membahas beberapa aspek -
extra-individual yang mempengaruhi kinerja individu.
Organizational Characteristic
Peneliti telah mengkaitkan ketidakhadiran karyawan dan turnover dengan berbagai
karateristik lingkungan dan organisasional (Blau, 1985; Campion, 1991; Johns, 1994;
McEvoy and Cascio 1987). Ini termasuk faktor organisasi luas (cth; kebijakan pembayaran
dan promosi); faktor interpersonal (cth; kekohesivan grup, opurtunitas persahabatan,
kepuasan dengan teman kerja atau supervisor); faktor job-related (cth; tanggung jawab,
otonomi, kejelasan tugas, tugas-tugas yang diberikan); dan faktor personal (cth; usia, mood,
keluarga dan harta benda). Jelasnya, karakteristik organisasional memiliki dampak yang luas
dalam kinerja seorang individu.
Environmental Safety
Kecelakaan dan tidak adanya waktu juga cukup mempengaruhi kinerja kerja (Ginter,
1979). Faktor seperti suasana yang positif, komitemen manajemen yang tinggi, dan sebuah
komunikasi program yang jelas yang menggabungkan setting tujuan dengan pengetahuan
cenderung dapat meningkatkan perilaku aman pada pekerjaan (Reber and Wallin, 1984).
Variabel-variabel tersebut dapat diukur secara reliabel (Zohar, 1980) dan dapat dikaitkan
dengan kinerja individual.
Lifespace Variables
Variabel ruang hidup mengukur kondisi penting disekitar karyawan baik didalam
maupun diluar pekerjaan. Mereka menjelaskan interaksi individual karyawan dengan faktor
organisasional, tuntutan tugas, supervisor dan kondisi pekerjaan. Vicno dan Bass (1978)
menggunakan empat variabel ruang hidup – tantangan tugas pada tugas pertama pekerjaan,
stabilitas kehidupan, kecocokan kepribadian antara supervisor dengan bawahan, dan
keberhasilan atasan – untuk meningkatkan prediksi kesuksesan majemenen di Exxon.
13
Variabel ruang hidup lain, seperti orientasi personal, kepercayaan karir, kosmopolitas vs
orientasi lokal membutuhkan penelitian yang lebih lanjut (Cookeand Rousseau 1983).
Leadership
Dampak kepemimpinan dan faktor situasional dalam semangat kerja dan kinerja telah
didokumentasikan dengan baik. Penelitian ini menggambarkan bahwa variasi pada kinerja
kerja karena adanya karakteristik individual (usia, jenis kelamin, pengalam kerja, dll),
kelompok (Dobbins, 1985) dan organisasi (ukuran, struktur, manajemen tingkah laku, dll).
Sampai kita memulai untuk membagi hasil keseluruhan variabilitad pada kinerja kerja
kedalam komponen intra-individual dan ekstra-individual.
14
2. Pengembangan pengukuran perilaku aktual terhadap perilaku yang diharapkan seperti
yang diidentifikasi dalam analisis pekerjaan dan kebutuhan.langkah ini harus
melengkapi pengukuran objektif hasil organisasi seperti omset, ketidakhadiran,
produksi dan yang lainnya.
3. Identifikasi dimensi kriteria yang mendasari tindakan dengan menggunakan analisis
faktor, analisis cluster atau analisis pola.
4. Pengembangan pengukuran yang reliabel, masing-masing dengan validitas konstruk
yang tinggi dari elemen yan telah teridentifikasi
5. Penentuan validitas prediktif dari masing-masing vaiabel independen (prediktor)
untuk masing-masing ukuran penilaian, dan mengambilnya satu persatu.
Pada tahap kedua, Guion membedakan data perilaku yang didapat dari result of
behavior data atau hasil organisasional, dan menyarankan data perilaku ditambahkan dengan
result of behavior data. Pada langkah 4, ia menganjurkan untuk membangun ukuran yang
benar menggunakan pengukuran validitas konstruk. Validitas konstruk pada dasarnya adalah
sebuah penilaian apakah sebuah tes atau perangkat perdiktif lainya mengukur atribut yang
dituju secara signifikan dan apakah tes atau perangkat prediktif tersebut dapat digunakan
untuk memprediksi perilaku (Messick, 1995; Landy 1989) kedua bagian ini, utilitas (cth;
peneliti mencoba untuk menemukan keofisien validitas tertinggi yang sangat berguna) vs
pemahaman (cth; berfokus pada validitas konstruk), telah membentuk kontroversi dalam
psikologi mengenai manfaat relatif dari dua pendekatan, yang akan dibahas lebih rinci pada
bagian selanjutnya.
EVALUATING CRITERIA
Relevance
Syarat dasar dari beberapa kriteria adalah dengan mempertimbangkan antar hubungan
(misalnya hal ini harus berhubungan secara logika pada hasil utama dalam sebuah
pertanyaan). Karena itu, hal ini pada dasarnya bahwa kekuasaan akan digambarkan secara
jelas.
Ada banyak kontroversi yang mengatakan perkiraan yang berbeda dari tes untuk
orang berkulit putih dan Afrika-Amerika yang mengurangi sifat dasar dari kriteria yang
digunakan dalam studi yang berbeda.
Kriteria pengukuran yang paling berhubungan tidak akan selalu menjadi yang berguna
atau yang paling rendah. Sebuah sampel tes pekerjaan atau sistem hasil penilaian yang baik
15
mungkin memerlukan sebuah persetujuan atau kepintaran, usaha, dan biaya untuk
menggagasnya (cf. Borman and Hallam, 1991).
Bagaimanapun, pengukuran objektif dan subjektif tidak bisa dipertukarkan., satu
dengan yang lainnya, mereka berkorelasi sekitar .39 (Bommer et al., 1995). Pengukuran
subjektif tidak dapat digunakan sebagai perwakilan dari pengukuran objektif, jika
pengukuran objektif adalah pengukuran yang menarik. Namun, menghiraukan seberapa
banyak kriteria yang digunakan, ketika mengingat semua dimensi dari hasil pekerjaan, yang
diingat di sana adalah sebuah aspek penting tidak menjadi penilaian, kemudian
menambahkan kriteria pengukuran yang dibutuhkan.
Sensitivity or Discriminability
Beberapa kriteria pengukuran juga harus menjadi sensitif yaitu, mampu membedakan
antara karyawan yang efektif dan yang tidak. Kegunaan utama dari sebuah kriteria
pengukuran adalah membenarkan hanya ketika hal tersebut disajikan pada pernyataan
diskriminasi yang berbeda pada hasil pekerjaan.
Hal ini penting untuk menjelaskan, bagaimanapun bahwa tidak ada kebutuhan
asosiasi antara variasi kriteria dan hubungan kriteria. Sebuah elemen kriteria sebagai
pengukuran mungkin memiliki varians yang rendah, tetapi maksudnya adalah sebuah
perbedaan skala dari pengukuran, seperti dolar. Intinya adalah perbedaan antara pengukuran
oprasional dan sebuah rumusan konseptual adalah yang terpenting untuk organisasi (Cascio
and Valenzi, 1978).
Practically
Hal ini penting bahwa dengan mengelola atau memimpin dapat menginformasikan
secara teliti mengenai keuntungan yang sebenarnya dari menggunakan perkembangan kriteria
secara berhati-hati. Pengelola bisa saja memiliki harapan untuk penilaian kekuatan dari
sebuah kriteria pengukuran atau rangkaiannya, tapi keobjektifan tentu saja akan hampir
terbangun ketika menyimpan catatan dan mengumpulkan data agar kriteria pengukuran
menjadi tidak praktis dan secara signifikan mengganggu dengan meneruskan operasi tersebut.
CRITERION CONTAMINATION
Ketika kriteria pengukuran disusun secara hati-hati dengan tanpa memeriksa nilainya
sebelum menggunakan salah satunya untuk tujuan penelitian atau perkembangan HR polisi,
mereka sering menjadi buruk. Maier (1988) mendemostrasikan sebuah evaluasi dari tes
16
ketangkasan yang digunakan untuk membuat keputusan penempatan mengenai perekrutan
tentara. Tes ini termasuk valid. Tes ini diadministrasikan oleh mayor yang berpengalaman.
Kriteria kontaminasi muncul ketika kriteria oprasional dan yang sebenarnya termasuk
varians yang tidak berhubungan dengan kriteria akhir. Kontaminasi sendiri mungkin akan
membagi lagi menjadi dua bagian yang berbeda, eror dan bias.
Error diartikan sebagai random varians dan tidak bisa berhubungan dengan apapun
kecuali dengan mengubahnya sendiri. Bias secara sistematik mewakili kriteria kontaminasi,
dan dapat berkorelasi dengan pengukuran prediktor.
Faktor bias sangat luas dalam efek penyimpangan, tapi secara umum penyimpangan ini
adalah fungsi persetujuan atas korelasinya dengan prediktor.
Bias in Ratings
Rating atau penilaian seorang pengawas biasanya sering menggunakan kriteria yang
rentan untuk semua sumber bias dalam menunjukkan keobjektifan, sebaik-bainya adalah
peryimbangan yang sebjektif. Hal ini penting untuk menegaskan bahwa bias dalam rating
mungkin saja dapat baik atau buruk atau rater tidak cukup mengobservasi, kesempatan yang
17
tidak sama pada setiap bagian terbawah untuk menunjukkan keahlian, bias-bias personal atau
prejudice pada rater itu sendiri, atau ketidakmampuan untuk membedakan dan penilaian
yang reliabel berbeda dengan hasil kerja.
Mungkin faktor bias yang sering disebutkan dalam rating adalah halo effect, yang
menjadi maksud utama dari Thorndike pada dasar dari bukti eksperimental bahwa beberapa
ratermemiliki kecenderungan untuk menilai individu tinggi atau rendah pada banyak faktor
karena rater mengetahui faktor spesifik dari individu itu sendiri. Hasil dari halo effect adalah
bahwa rating diberbagai dimensi hasil pekerjaan cemderung memiliki interkorelasi yang
tinggi.
CRITERION EQUIVALENCE
Ketika dua kriteria berkorelasi sangat tinggi, dapat diasumsikan bahwa halo effect
berpengaruh, dan ketika keduanya berkorelasi tepat setelah dikoreksi untuk ketidak
reliabilitasannya, maka keduanya setara (equivalent). Criterion equivalence tidak dapat
diasumsikan, hal ini merupakan sesuatu yang langka pada sebuah penelitian HR. Ketika dua
kriteria setara equivalent, artinya keduanya mengandung elemen kerja yang sama, mengukur
karakteristik individu yang sama, dan memiliki porsi yang sama dalam lingkup kriteria
konseptual. Dua kriteria dikatakan equivalent ketika tidak ada perbedaan antar keduanya.
Namun jika korelasi antar keduanya tidak sempurna, maka keduanya tidak equivalent.
Dalam menganalisis kriteria dan menggunakannya untuk mengobservasi kinerja, seseorang
harus mempertimbangkan waktu pengukuran, tipe pengukuran, dan level dari kinerja yang
menggambarkan sukses atau tidak, dan usaha dalam mengestimasi efek dari level kinerja
yang dipilih dari kesimpulan yang diperoleh.
Peneliti dapat memakai kriteria yang sangat berkorelasi dengan beberapa cara. Ia dapat
melepaskan salah satu kriteria, melihatnya sebagai informasi. Banyak informasi yang dimiliki
semakin baik.
Strategi berikutnya mengumpulkan data yang relevan dengan yang diukur kedua
kriteria, mengubah semua data menjadi standard-score form, menghitung nilai rata-rata
individu, dan menggunakannya sebagai estimasi terbaik dalam dimensi gabungan. Namun hal
utama yang harus diperhatikan ialah strategi apapun yang digunakan oleh seorang peneliti
harus didasari oleh pemikiran teoritis dan rasional dan harus memahami sepenuhnya
implikasi dari strategi yang dipilih.
18
COMPOSITE VERSUS MULTIPLE CRITERIA
Psikologi terapan umumnya setuju bahwa performa kerja merupakan multidimensi
secara alamiah dan pengukuran yang cukup terhadap performa kerja membutuhkan kriteria
yang multidimensi. Pertanyaan selanjutnya tentang hal itu. Haruskah satu mengkombinasikan
beragam kriteria mengukur ke skor gabungan, atau seharusnya satu membuat masing-masing
kriteria mengukur secara terpisah? Jika investigator memilih untuk menggabungkan elemen-
elemen, apa aturan yang seharusnya digunakan? Seperti isu utilitas vs isu pemahaman,
keduanya membagikan tentang pendukung yang hebat sepanjang tahun.
Composite Criterion
Konteks dasar Toops (1944), Thorndike (1949), Brogden and Taylor (1950a), dan
Nagle (1953), adalah pendukung terkuat kriteria gabungan. Kriteria gabungan merupakan
kriteria yang seharusnya menyediakan sebuah patokan atau keseluruhan mengukur
“kesuksesan” atau “nilai organisasi” dari masing-masing individu. Misalnya indeks tunggal
merupakan hal yang sangat diperlukan dalam membuat keputusan dan perbandingan
individu, dan jika dimensi kriteria dibuat terpisah dalam validasi, investigator harus
mengetahui bagaimana mengkombinasikan gabungan ketika sebuah keputusan dibutuhkan.
Meskipun hal ini mungkin atau sering dilakukan secara subjektif, skema pembobotan
kuantitatif membuat tujuan pentingnya ditempatkan di masing-masing unsur kriteria.
Multiple Criteria
Pendukung multiple criteria berpendapat bahwa mengukur variabel yang terbukti
berbeda seharusnya tidak dikombinasikan. Seperti Cattel (1957) mengatakan “Sepuluh pria
dan dua botol bir tidak dapat ditambahkan untuk memberikan total yang sama seperti dua pria
dan sepuluh botol bir”.
Mempertimbangkan studi tentang perekrut militer (Pulakos, Borman, dan Hough,
1988). Dalam mengukur keefektifan perekrut, hal ini dilihat dari selling skills, human
relations skills, dan organizing skills yang merupakan hal penting dan berhubungan dengan
kesuksesan. Ada juga ditemukan bahwa tiga dimensi tersebut tidak saling berhubungan
misalnya perekrut dengan selling skills yang baik belum tentu memiliki human relations
skills atau organizing skills yang baik. Pada kondisi ini, menggabungkan tindakan-tindakan
mengarah ke sebuah gabungan bukan tidak hanya ambigu, tetapi juga omong kosong secara
psikologi.
19
Schmidt dan Kaplan (1971) kemudian menunjukkan bahwa menggabungkan berbagai
elemen kriteria menjadi komposit (gabungan) menyiratkan bahwa ada dimensi tunggal
dalam kinerja, tetapi tidak dalam dari dirinya sendiri. Berarti bahwa dimensi tunggal ini
merupakan perilaku atau sifat dasar psikologis. Composite criteria mungkin menunjukkan
dimensi pokok ekonomi, sementara pada saat yang sama menjadi kurang berarti ketika dilihat
dari sudut pandang behavioral. Dengan demikian, Brogden dan Taylor (1950a) berpendapat
bahwa ketika semua kriteria merupakan ukuran yang relevan dari variabel-variabel ekonomi
(dolar dan sen), mereka dapat dikombinasikan menjadi sebuah komposit, terlepas dari
interkorelasi mereka.
Differing Assumptions
Seperti Schmidt dan Kaplan (1971) dan Binning dan Barrett (1989) menyatat bahwa
ada dua posisi yang berbeda dalam hal:
Sifat konstruksi yang mendasari pengukuran kriteria
Asumsi composite criterion bahwa kriteria seharusnya merepresentasikan konstruk
ekonomi daripada konstruk perilaku. Orientasi ekonomi diilustrasikan dalam Brogden dan
Taylor (1950a) “dollar criterion” : Kriteria harus mengukur semua kontribusi individu pada
organsisasi”. Brogden dan Taylor menyatakan bahwa keseluruhan efisiensi harusnya diukur
dalam hal dollar dengan cara menerapkan konsep harga dan prosedur untuk perilaku kerja
individu setiap karyawan. Masalah criterion berpusat utamanya pada kuantitas, kualitas, dan
harga dari produk yang diselesaikan.
Sebaliknya, pendukung multiple criteria (Dunnetter, 1963; Pulakos et al., 1988)
berpendapat bahwa kriteria seharusnya menunjukkan konstruk behavioral atau psikologis,
salah satunya perilaku homogen. Pulakos et al. menyatakan kebutuhan untuk
mengembangkan suatu kriteria gabungan ketika mengambil keputusan pekerjaan, tapi mereka
juga menekankan bahwa kriteria gabungan yang baik ketika komponen mereka dapat
dipahami dengan baik.
20
(produk kerja) dengan proses kerja yang membuat produk akhir tersebut. Berkenaan dengan
proses pekerjaan, mereka berpendapat bahwa : “faktor-faktor seperti skill yang laten, efeknya
direalisasikan dalam produk akhir.” Mereka tidak puas dengan syarat logis dari kriteria yang
cukup.
Sebaliknya, pendukung pandangan multiple criteria menambahkan pemahaman
sebagai tujuan penting proses validasi, yang berhubungan dengan tujuan praktis dan ekonomi
: “Tujuan penelitian untuk pemahaman merupakan teori perilaku kerja, teori perilaku manusia
adalah cast dalam istilah konstruk psikologis dan behavioral, bukan pada konstruk ekonomi”
(Schmidt and Kaplan, 1971,p.424).
21
Psikolog Personil dipandu oleh simple prediction model yang berusaha
menghubungkan kinerja pada satu atau lebih prediktor dengan criterion campuran. Model
criterion yang lengkap untuk menggambarkan kesimpulan yang dibutuhkan untuk
pengembangan criterion disampaikan oleh Binning dan Bamett (1989) pada gambar 4.3.
Manajer yang terlibat dalam keputusan ketenagakerjaan sangat memperhatikan sejauh mana
informasi penilaian akan mendapatkan prediksi yang akurat mengenai kinerja pekerjaan
berikutnya (Inferensi 9). Pendekatan yang membenarkan Inferensi 9 akan menghasilkan bukti
empiris langsung bahwa skor penilaian berhubungan dengan pengukuran kinerja pekerjaan
yang valid. Inferensi 5 menunjukkan keterkaitan ini, yang secara tradisional menjadi
perhatian paling pragmatis bagi psikolog personil. Untuk memiliki kepercayaan penuh pada
Inferensi 9, Inferensi 5 dan 8 harus dibenarkan. Artinya, prediktor harus dikaitkan dengan
ukuran criterion operasional (Inferensi 5), dan ukuran criterion operasional harus dikaitkan
dengan domain kinerja (Inferensi 8).
Domain kinerja terdiri dari unit hasil perilaku (Binning dan Barrett, 1989 ). Hasil
(volume penjualan dolar) dinilai oleh organisasi, dan perilaku (keterampilan menjual) adalah
alat untuk mencapai tujuan ini. Perilaku membawa nilai yang berbeda, tergantung pada nilai
hasil. Hal ini menyiratkan bahwa deskripsi optimal dari domain kinerja untuk pekerjaan
tertentu memerlukan representasi hasil, dinilai secara hati-hati, dan representasi lengkap dari
perilaku yang menyertainya. Model criterion komposit berfokus pada hasil, sedangkan
beberapa model criterion berfokus pada perilaku.
Inferensi 8 merupakan proses pengembangan criterion. Biasanya dibenarkan oleh
analisis rasional (dalam bentuk data analisis pekerjaan) yang menunjukkan bahwa semua
dimensi perilaku atau hasil pekerjaan utama telah diidentifikasi dan diwakili dalam ukuran
criterion operasional. Kenyataannya, analisis memberikan dasar evolusioner untuk
membenarkan Inferensi 7, 8, 10, dan 11.
Para ahli psikologi personalia yang memiliki tradisi oleh validitas pembuatan label
terkait dengan inferensi 6 dan 7. Artinya, jika dapat ditunjukkan bahwa tes (mis, pemahaman
bacaan) mengukur konstruk tertentu (Inferensi 6), seperti pemahaman bacaan, yang telah
ditentukan untuk menjadi kritis terhadap kinerja kerja (Inferensi 7), kemudian menyimpulkan
tentang kinerja dari nilai tes (Inferensi 9) adalah dengan dibenarkan implikasi logis.
Konstruksi hanyalah label untuk keteraturan perilaku yang mendasari perilaku yang dicontoh
oleh prediktor, dan dalam domain kinerja berdasarkan criterion.
Dalam konteks pemahaman dan validasi criterion, Inferensi 7, 8, 10, dan 11 sangat
penting. Inferensi 7 biasanya dibenarkan oleh gugatan, berdasarkan analisis pekerjaan, bahwa
22
konstruksi yang mendasari kinerja telah diidentifikasi. Proses ini biasa disebut sebagai
deriving job specification. Inferensi 10 juga menunjukkan sejauh mana tuntutan pekerjaan
aktual telah dianalisis secara memadai, menghasilkan deskripsi domain kinerja yang valid.
Proses ini biasa disebut sebagai job description. Inferensi 11 mewakili sejauh mana hubungan
antara perilaku kerja dan hasil kerja. telah diverifikasi. Analisis pekerjaan adalah proses yang
digunakan untuk menemukan dan menentukan tautan ini.
Kerangka kerja pada gambar 4,3 membantu mengidentifikasi criterion problem.
Masalah ini diakibatkan oleh kecenderungan mengabaikan pengembangan bukti yang
memadai untuk mendukung Inferensi 7, 8, dan 10. Hal ini juga mengarah pada dua
konsekuensi : (1) pengembangan ukuran criterion yang kurang ketat secara psikometri
daripada tindakan prediktor (2) kriteria kinerja yang kurang tertanam dalam jaringan
hubungan teoritis yang dibangun di sisi prediktor. Pengembangan bukti untuk mendukung
keterkaitan penting yang ditunjukkan pada gambar 4,3 akan menghasilkan keputusan
kepegawaian informasi yang lebih baik, keputusan pengembangan karir, dan pada akhirnya
organisasi lebih efektif.
Gambar 4.3
23
Daftar Pustaka:
Casio. Wayne F. (1998). Applied Psychology In Human Resource Management. 5th ed.
United States of America: Prentice-Hall, Inc.
24