com
BAB 4
Penilaian Kinerja
BAB 4 GARIS
Bayangkan Anda adalah seorang manajer untuk sebuah organisasi besar dan Anda diberi tugas untuk menentukan
seberapa baik bawahan Anda melakukan pekerjaan mereka. Bagaimana Anda menilai kinerja pekerjaan mereka
untuk melihat siapa yang melakukan dan siapa yang tidak melakukan pekerjaan dengan baik? Apakah Anda akan
melihat setiap orang melakukan pekerjaannya? Jika Anda memang menonton orang, bagaimana Anda tahu apa yang
harus dicari? Beberapa orang mungkin tampak bekerja sangat keras tetapi pada kenyataannya hanya mencapai
sedikit yang berkontribusi pada tujuan organisasi. Untuk banyak pekerjaan, mungkin tidak langsung terlihat
seberapa baik seseorang melakukannya hanya dengan mengamatinya kecuali Anda memiliki gagasan yang baik
tentang apa yang merupakan kinerja pekerjaan yang baik. Kinerja paling baik dinilai dengan mengukur pekerjaan
seseorang terhadap kriteria atau standar perbandingan.
78
Mengapa Kami Menilai Karyawan? 79
Dalam bab ini, kita prihatin dengan isu-isu yang terlibat dalam penilaian kinerja pekerjaan
karyawan. Pertama, masalah kriteria atau standar perbandingan yang digunakan untuk menilai dan
mengukur kinerja. Sebelum kita dapat menilai kinerja, kita harus memiliki gagasan yang jelas tentang
apa itu kinerja yang baik. Setelah kita mengetahuinya, kita dapat mengatasi masalah kedua dalam
mengembangkan prosedur untuk menilainya. Penilaian kinerja adalah proses dua langkah pertama
mendefinisikan apa yang dimaksud dengan kinerja yang baik (pengembangan kriteria) diikuti dengan
penerapan prosedur untuk menilai karyawan dengan menentukan seberapa baik mereka memenuhi
kriteria. Sebelum kita membahas kriteria dan prosedur untuk menilai kinerja, kita melihat alasan
utama untuk terlibat dalam kegiatan yang berpotensi memakan waktu ini.
Diskusikan bagaimana melakukan penilaian kinerja yang dapat dipertahankan secara hukum.
Keputusan Administratif
Banyak keputusan administratif yang mempengaruhi karyawan didasarkan, setidaknya sebagian, pada kinerja
pekerjaan mereka. Sebagian besar organisasi besar menggunakan kinerja pekerjaan sebagai dasar untuk banyak
tindakan negatif dan positif. Tindakan negatif terhadap seorang karyawan mencakup penurunan pangkat dan
pemutusan hubungan kerja (pemecatan), dan beberapa organisasi memiliki kebijakan yang mengharuskan
pemecatan karyawan yang kinerjanya tidak memuaskan. Tindakan positif termasuk promosi dan kenaikan gaji, dan
banyak organisasi memiliki sistem pembayaran jasa yang mengikat kenaikan ke tingkat kinerja pekerjaan.
Dasar untuk menggunakan data kinerja pekerjaan untuk keputusan administratif dapat ditemukan baik
dalam kontrak maupun hukum. Kontrak serikat pekerja akan sering menentukan bahwa kinerja pekerjaan
adalah dasar untuk keputusan administratif tertentu, seperti kenaikan gaji. Sebuah kontrak juga dapat
menyatakan bahwa penilaian kinerja tidak akan dilakukan. Pegawai pegawai negeri (pemerintah) di Amerika
Serikat hanya dapat dipecat karena prestasi kerja yang tidak memuaskan atau pelanggaran aturan kerja.
Pelanggaran aturan termasuk menyerang rekan kerja, dihukum karena kejahatan, tertidur di tempat kerja,
dan tidak muncul untuk bekerja saat dijadwalkan. Meski begitu, banyak yang dipecat
Pegawai pemerintah AS telah dipekerjakan kembali karena catatan kinerja yang memuaskan dalam
pekerjaan. Amerika Serikat bukan satu-satunya negara yang memiliki undang-undang yang mewajibkan
80 Bab 4. Penilaian Kinerja
Agar karyawan dapat meningkatkan dan mempertahankan kinerja dan keterampilan kerja mereka, mereka membutuhkan umpan balik
kinerja pekerjaan dari supervisor mereka. Salah satu peran utama supervisor adalah memberikan informasi kepada bawahan mereka
tentang apa yang diharapkan dari pekerjaan dan seberapa baik mereka memenuhi harapan tersebut. Karyawan perlu mengetahui kapan
mereka berkinerja baik sehingga mereka akan terus melakukannya, serta kapan mereka tidak berkinerja baik sehingga mereka dapat
mengubah apa yang mereka lakukan. Bahkan karyawan yang berkinerja baik dalam pekerjaan dapat memperoleh manfaat dari umpan
balik tentang bagaimana berkinerja lebih baik lagi. Umpan balik juga dapat membantu dalam memberi tahu karyawan cara meningkatkan
keterampilan mereka untuk naik ke posisi yang lebih tinggi. Tren baru adalah bagi perusahaan untuk melampaui evaluasi setahun sekali
dalam merancang sistem manajemen kinerja yang komprehensif. Selain penilaian tahunan, sistem tersebut dapat mencakup penetapan
tujuan dan sesi pembinaan dan umpan balik berkala antara karyawan dan penyelia. Sementara tinjauan tahunan dapat digunakan untuk
tujuan administratif, tinjauan sementara hanya akan digunakan untuk umpan balik, sehingga mengurangi beberapa kecemasan dan sikap
defensif yang dialami karyawan saat dievaluasi untuk kenaikan gaji dan promosi. Sistem manajemen kinerja di Wachovia Bank dijelaskan
dalam kasus I/O Psychology in Practice dalam bab ini. sehingga mengurangi beberapa kecemasan dan sikap defensif yang dialami
karyawan saat dievaluasi untuk kenaikan gaji dan promosi. Sistem manajemen kinerja di Wachovia Bank dijelaskan dalam kasus I/O
Psychology in Practice dalam bab ini. sehingga mengurangi beberapa kecemasan dan sikap defensif yang dialami karyawan saat
dievaluasi untuk kenaikan gaji dan promosi. Sistem manajemen kinerja di Wachovia Bank dijelaskan dalam kasus I/O Psychology in
Riset
Banyak kegiatan praktik psikolog I/O menyangkut peningkatan prestasi kerja karyawan.
Upaya psikolog I/O dapat diarahkan untuk merancang peralatan yang lebih baik,
mempekerjakan orang yang lebih baik, memotivasi karyawan, dan melatih karyawan.
Data kinerja pekerjaan dapat berfungsi sebagai kriteria yang digunakan untuk
mengevaluasi kegiatan tersebut. Untuk itu, seseorang dapat melakukan penelitian.
Desain umum untuk studi semacam itu melibatkan membandingkan kinerja karyawan
sebelum dan sesudah implementasi program baru yang dirancang untuk
meningkatkannya. Sebuah desain yang lebih baik akan menjadi eksperimen di mana satu
kelompok karyawan menerima prosedur baru, sedangkan kelompok kontrol karyawan
tidak. Kedua kelompok dapat dibandingkan untuk melihat apakah kelompok yang
menerima prosedur baru memiliki kinerja yang lebih baik daripada kelompok kontrol
yang tidak.
KRITERIA KINERJA
Kriteria adalah standar yang dapat digunakan untuk menilai kinerja apa pun, termasuk seseorang. Ini
memungkinkan Anda untuk membedakan kinerja yang baik dari yang buruk. Mencoba menilai
kinerja tanpa kriteria seperti membantu seorang teman menemukan benda yang hilang ketika teman
itu tidak memberitahu Anda apa itu. Anda tidak dapat banyak membantu sampai Anda tahu apa yang
Anda cari. Dengan cara yang sama, Anda tidak dapat secara memadai mengevaluasi kinerja
pekerjaan seseorang sampai Anda mengetahui kinerja yang seharusnya.
Kriteria kinerja 81
Karakteristik Kriteria
TABEL 4.1 Contoh Kriteria Teoretis dan Aktual untuk Lima Pekerjaan
diri. Karena tidak ada standar objektif untuk kualitas seni, para ahli kemungkinan akan
tidak setuju satu sama lain ketika penilaian mereka adalah kriteria aktual untuk kinerja.
Ketidakandalan dalam kriteria aktual mengacu pada kesalahan dalam pengukuran yang terjadi
setiap kali kita mencoba menilai sesuatu. Seperti yang dibahas dalam Bab 2, kesalahan pengukuran
adalah bagian dari proses pengukuran dan terdiri dari kesalahan acak yang membuat pengukuran
kita tidak akurat. Hal ini tercermin dalam inkonsistensi dalam pengukuran dari waktu ke waktu. Jika
kita menilai kinerja pekerjaan seseorang berulang kali dari waktu ke waktu, ukuran kinerja akan
bervariasi dari pengujian ke pengujian bahkan jika kinerja (kriteria teoretis) tetap konstan. Ini berarti
bahwa ukuran kriteria kinerja aktual kami akan memiliki keandalan yang kurang dari sempurna.
Defisiensi kriteria berarti bahwa kriteria yang sebenarnya tidak cukup mencakup seluruh
kriteria teoritis. Dengan kata lain, kriteria yang sebenarnya adalah representasi yang tidak
lengkap dari apa yang kita coba untuk menilai. Konsep ini disebut dalam Bab 2 sebagai
validitas isi. Misalnya, nilai tes prestasi siswa dalam matematika dapat digunakan sebagai
kriteria kinerja yang sebenarnya untuk guru sekolah dasar. Ini akan menjadi kriteria yang
kurang, karena guru sekolah dasar mengajar lebih dari sekedar matematika. Kriteria yang
kurang memadai adalah nilai siswa pada baterai tes prestasi yang komprehensif, termasuk
matematika, membaca, sains, dan menulis.
Relevansi kriteria adalah sejauh mana kriteria aktual menilai kriteria teoretis yang
dirancang untuk diukur, atau validitas konstruknya (lihat Bab 2). Semakin dekat
korespondensi antara kriteria aktual dan teoritis, semakin besar relevansi kriteria aktual.
Semua kriteria aktual dalam Tabel 4.1 tampaknya memiliki beberapa tingkat relevansi
untuk menilai kriteria teoretis yang dimaksudkan. Kriteria teoretis bisa sangat abstrak,
seperti menghasilkan karya seni yang hebat; oleh karena itu, mungkin sulit untuk
menentukan relevansi suatu kriteria. Seperti halnya validitas perangkat penilaian apa
pun, relevansi menyangkut kesimpulan dan interpretasi yang dibuat tentang makna
pengukuran kinerja kami.
Kontaminasi kriteria, defisiensi, dan relevansi diilustrasikan pada Gambar 4.1.
Kriteria aktual diwakili dalam gambar oleh lingkaran bawah, dan kriteria teoritis diwakili
oleh lingkaran atas. Tumpang tindih antara dua lingkaran (area yang diarsir) mewakili
sejauh mana kriteria aktual menilai teoritis, yang
Kriteria Teoretis
Kekurangan
adalah relevansi kriteria. Bagian lingkaran bawah yang tidak tumpang tindih dengan kriteria teoritis
(area yang tidak diarsir) adalah kontaminasi karena kriteria sebenarnya menilai sesuatu yang lain,
yaitu kesalahan pengukuran. Bagian dari lingkaran atas yang tidak tumpang tindih dengan bagian
bawah (daerah yang tidak diarsir) adalah kekurangan kriteria karena bagian dari kriteria teoritis tidak
dinilai.
Tingkat Spesifisitas
Sebagian besar pekerjaan bersifat kompleks dan melibatkan banyak fungsi dan tugas yang berbeda. Kriteria
kinerja pekerjaan dapat dikembangkan untuk tugas individu atau untuk seluruh pekerjaan. Untuk beberapa
tujuan, mungkin lebih baik untuk menilai kinerja pada tugas individu, seperti melakukan penangkapan untuk
seorang petugas polisi atau menjual produk untuk seorang wiraniaga, sedangkan untuk tujuan lain kinerja
pekerjaan seluruh orang itu menarik. Untuk mengembangkan keterampilan karyawan, lebih baik fokus pada
tingkat tugas individu sehingga umpan balik bisa spesifik. Orang tersebut mungkin diberi tahu bahwa dia
mengetik terlalu lambat atau membuat terlalu banyak kesalahan. Umpan balik khusus semacam ini dapat
membantu karyawan yang ingin meningkatkan kinerja.
Untuk tujuan administrasi eh. NS
orang yang mendapat promosi terbaik.
Dibutuhkan pengamatan yang cermat untuk melihat seberapa baik seorang karyawan melakukan pekerjaan. (Arvind Garg/Foto
Peneliti)
84 Bab 4. Penilaian Kinerja
Metode tertentu yang digunakan untuk menilai kinerja harus didasarkan pada tujuan
informasi penilaian.
Kompleksitas Kriteria
Karena sebagian besar pekerjaan melibatkan banyak tugas dan sebagian besar tugas dapat
dievaluasi dari beberapa perspektif, kriteria dapat menjadi sangat kompleks. Kinerja pekerjaan
bahkan pada satu tugas biasanya dapat dinilai sepanjang dimensi kualitas (seberapa baik orang
tersebut melakukan tugas) dan dimensi kuantitas (seberapa banyak atau seberapa cepat orang
tersebut melakukan tugas). Kompleksitas kinerja pekerjaan berarti bahwa beberapa ukuran kriteria
diperlukan untuk menilai kinerja secara memadai. Ini mungkin hanya melibatkan kualitas, hanya
kuantitas, atau keduanya. Itu bisa pada tingkat kekhususan tugas tunggal atau pada tingkat seluruh
pekerjaan orang tersebut. Sifat pekerjaan dan tujuan informasi penilaian menentukan sifat kriteria
yang digunakan, serta tingkat kekhususannya.
Sifat beberapa pekerjaan mengharuskan kualitas menjadi fokus utama, sedangkan untuk
yang lain kuantitas mungkin menjadi prioritas. Dalam atletik, terkadang satu atau yang lain
berfungsi sebagai kriteria untuk memenangkan kompetisi. Dalam senam, kualitas adalah
kriteria yang digunakan. Juri menilai kinerja setiap pesenam sepanjang dimensi kualitas, dan
orang dengan skor tertinggi menang. Dalam acara lintasan dan lapangan, kriterianya
berkaitan dengan kuantitas—melompat terjauh, melompat paling tinggi, berlari paling cepat,
atau melempar terjauh. Kualitas bentuk lompat atau gaya lari tidak relevan, sehingga tidak ada
juri yang menilai performa dalam acara ini. Dengan pekerjaan, bisa ada penekanan pada
kualitas atau kuantitas, seringkali tergantung pada sifat tugas yang terlibat. Untuk pekerjaan
penjualan, penekanan biasanya pada kuantitas penjualan,
Ada banyak kemungkinan kriteria lain di luar kualitas dan kuantitas pekerjaan. Tabel 4.2
berisi formulir penilaian kinerja yang memiliki delapan kriteria umum yang relevan dengan
banyak pekerjaan. Misalnya, mempertahankan penampilan profesional di tempat kerja adalah
relevan ketika citra publik penting. Banyak organisasi mengharapkan karyawan yang bertemu
publik untuk menampilkan citra tertentu. Ini mungkin melibatkan aturan berpakaian yang
menentukan jenis pakaian yang sesuai untuk bekerja, seperti setelan bisnis. Pabrik bisa
Kategori Peringkat
memiliki aturan berpakaian yang tidak memperhatikan citra publik tetapi dengan keselamatan. Dasi
sering kali dilarang karena dapat tersangkut di mesin, yang mengakibatkan kecelakaan dan cedera
serius.
Ada dua cara untuk menangani sifat kriteria yang kompleks. NSpendekatan kriteria
komposit melibatkan menggabungkan kriteria individu menjadi skor tunggal. Jika karyawan
menerima nomor untuk mewakili kinerja pada masing-masing empat dimensi, komposit akan
menjadi rata-rata skor empat dimensi untuk setiap karyawan. Jika seseorang menerima skor
kinerja berikut pada skala 1-ke-5:
Kriteria Dinamis
Kriteria biasanya dianggap sebagai standar konstan atau statis dimana kinerja karyawan dapat
dinilai. Beberapa psikolog I/O percaya, bagaimanapun, bahwa kinerja pekerjaan itu sendiri
adalah variabel dari waktu ke waktu. Ini berarti bahwa pekerja terbaik dalam pekerjaan pada
satu titik waktu tidak akan menjadi yang terbaik pada titik waktu lain. Variabilitas kinerja
membuat penilaian menjadi sulit karena kinerja tidak akan sama sepanjang periode waktu
yang diukur. Jika seseorang berkinerja baik untuk sebagian tahun dan tidak baik untuk bagian
lain, bagaimana kinerjanya harus dinilai?
Variabilitas kinerja dari waktu ke waktu disebut sebagai kriteria dinamis, meskipun itu
adalah kinerja dan bukan standar yang berubah. Ide kriteria dinamis telah menghasilkan
beberapa kontroversi di antara psikolog I/O, dengan beberapa percaya kinerja stabil dan yang
lain menyarankan tidak (Schmitt & Chan, 1998). Di satu sisi, Deadrick dan Madigan (1990)
memberikan data untuk operator mesin jahit di sebuah pabrik pakaian yang menunjukkan
kinerja yang stabil selama periode waktu yang singkat (minggu) tetapi tidak terlalu konsisten
dalam jangka waktu yang lama (bulan). Di sisi lain, Vinchur, Schippmann, Smalley, dan Rothe
(1991) menemukan bahwa kinerja pekerjaan karyawan manufaktur cukup stabil selama
rentang waktu 5 tahun. Deadrick, Bennett, dan Russell
(1997) menunjukkan bahwa kinerja karyawan cenderung meningkat dari waktu ke waktu, setidaknya
di awal masa kerja karyawan, dan bahwa faktor-faktor yang menentukan kinerja karyawan baru tidak
harus sama dengan yang menentukan peningkatan kinerja di kemudian hari. Jadi, melihat kinerja
orang dari waktu ke waktu akan menunjukkan bahwa kinerjanya bervariasi dan bahwa yang
berkinerja terbaik belum tentu tetap berkinerja terbaik dalam jangka panjang.
86 Bab 4. Penilaian Kinerja
Kinerja Kontekstual
Kriteria untuk sebagian besar pekerjaan menyangkut tugas-tugas yang secara khusus diperlukan dan
tentu saja tercantum dalam analisis pekerjaan dari pekerjaan itu. Namun, telah diakui bahwa
karyawan melakukan lebih banyak untuk organisasi daripada yang diperlukan, dan perilaku ekstra ini
penting agar organisasi berfungsi dengan lancar.Kinerja kontekstual terdiri dari hal-hal sukarela
ekstra yang dilakukan karyawan untuk memberi manfaat bagi rekan kerja dan organisasi mereka,
seperti menjadi sukarelawan untuk melaksanakan tugas ekstra atau membantu rekan kerja (Borman,
Buck, Hanson, Motowidlo, Stark, & Drasgow, 2001). Meskipun tidak secara khusus diperlukan, kinerja
kontekstual diperhatikan dan dihargai oleh para manajer, dan penilaian mereka terhadap kinerja
bawahan akan terpengaruh olehnya (Johnson, 2001). Ini semua menunjukkan bahwa kinerja
kontekstual harus dipertimbangkan dalam mengembangkan kriteria untuk pekerjaan. Kami akan
kembali ke masalah kinerja kontekstual di Bab 10 ketika kita membahas perilaku kewargaan
organisasional.
PENELITIAN INTERNASIONAL
Isu penting dalam penilaian kinerja menyangkut sangat baik (5). Karena sifat setiap ukuran berbeda, masing-
keakuratan peringkat supervisor. Dalam studi ini, para masing distandarisasi menjadi rata-rata nol dan standar
peneliti tidak hanya menyediakan peringkat supervisor deviasi 1. Jadi, seorang tenaga penjualan dengan
tetapi juga data tentang kinerja objektif yang dapat produktivitas rata-rata harus memiliki skor nol, dan
digunakan untuk membandingkannya. peringkat supervisornya juga diharapkan menjadi nol.
Penelitian ini dilakukan di Finlandia pada sebuah Dengan membandingkan skor untuk setiap tenaga penjual,
perusahaan milik negara yang menyediakan jasa perbankan para peneliti dapat menentukan apakah penyelia itu
dan transportasi. Partisipan adalah 208 supervisor yang secara meremehkan, menilai berlebihan, atau secara akurat
bersama-sama menilai kinerja 268 tenaga penjual wanita. Untuk menilai tenaga penjual tersebut.
setiap tenaga penjualan, data dikumpulkan tentang Hasilnya menemukan bahwa kira-kira sepertiga dari peringkat
produktivitas penjualan aktual selama tahun sebelumnya. Selain jatuh ke dalam masing-masing kategori akurasi, meskipun ada sedikit
itu, setiap tenaga penjual dinilai oleh supervisornya pada skala lebih banyak penilaian daripada penilaian yang diremehkan. Ini
penilaian lima poin mulai dari buruk (1) seharusnya tidak mengejutkan karena kelonggaran peringkat
Metode untuk Menilai Prestasi Kerja 87
cukup umum. Supervisor memiliki kecenderungan untuk hasil—penjualan. Dalam kasus di mana tidak ada standar
melebih-lebihkan karyawan yang paling mereka kenal, mungkin seperti itu, kita mungkin mengharapkan akurasi lebih
menunjukkan ada beberapa favoritisme yang diungkapkan menderita. Selanjutnya, peringkat di sini dilakukan semata-
kepada bawahan yang telah mengembangkan hubungan kerja mata untuk tujuan penelitian dan cenderung lebih akurat
yang baik dengan supervisor mereka. Selanjutnya, mereka daripada peringkat yang dilakukan untuk tujuan
menemukan bahwa supervisor wanita memberikan penilaian administratif, di mana bawahan mungkin menderita
yang lebih akurat daripada supervisor pria. konsekuensi kurang dari evaluasi yang luar biasa.
Temuan ini menunjukkan bahwa sebagian besar
penilaian kinerja tidak akurat bila dibandingkan dengan Sumber: Dari “Akurasi Peringkat Kinerja: Konvergensi Antara
kinerja objektif dan bahwa hubungan yang dimiliki Penilaian Supervisor dan Produktivitas Penjualan,” oleh
L. Sundvik dan M. Lindeman, (1998), Jurnal Internasional Seleksi
seorang supervisor dengan bawahan mempengaruhi
dan Penilaian, 6, 9–15.
penilaian. Namun, harus diingat bahwa ini adalah kasus
di mana kinerja memiliki tujuan dan dapat diukur
Ukuran kehadiran berlaku untuk sebagian besar pekerjaan karena sebagian besar
memiliki jam kerja terjadwal. Untuk pekerjaan yang tidak terstruktur dalam hal jadwal
kerja (misalnya, profesor perguruan tinggi), kehadiran bukanlah kriteria untuk kinerja
pekerjaan. Tiga ukuran objektif lainnya khusus untuk pekerjaan tertentu. Misalnya jenis
Pertunjukan Ukuran
Pekerjaan Ukuran
insiden yang direkam adalah fungsi dari alam dari pekerjaan dan lingkungan kerja. Catatan
insiden penyerangan oleh siswa mungkin disimpan untuk guru sekolah umum perkotaan, tetapi
mereka tidak mungkin disimpan untuk profesor perguruan tinggi. Guru relatif sering diserang di
kota-kota besar Amerika, tetapi profesor perguruan tinggi jarang menjadi sasaran kekerasan. Ukuran
produktivitas yang dipilih harus sesuai dengan sifat pekerjaan yang dilakukan. Ukuran produktivitas
khusus untuk beberapa pekerjaan umum tercantum dalam Tabel 4.4. Seperti yang Anda lihat, sifat
produktivitas bisa sangat berbeda dari satu pekerjaan ke pekerjaan lain. Hal ini membuat sulit untuk
membandingkan kinerja orang-orang yang memegang pekerjaan yang berbeda.
Menggunakan ukuran objektif untuk menilai prestasi kerja memiliki beberapa keuntungan.
Pertama, dapat dengan mudah menginterpretasikan arti ukuran objektif dalam kaitannya dengan
kriteria prestasi kerja. Sebagai contoh, jelas bahwa tidak ada absen dalam satu tahun terakhir
merupakan indikator yang baik dari kehadiran yang memuaskan dan bahwa empat kecelakaan lalu
lintas terkait pekerjaan dalam 6 bulan sebelumnya merupakan indikator kinerja mengemudi yang
tidak memuaskan. Kedua, sifat kuantitatif dari ukuran objektif memudahkan untuk membandingkan
kinerja pekerjaan dari individu yang berbeda dalam pekerjaan yang sama. Untuk ukuran kehadiran,
perbandingan dapat dibuat dari individu di berbagai pekerjaan selama mereka semua
mengharuskan orang tersebut bekerja pada jadwal tertentu. Ketiga, ukuran objektif dapat dikaitkan
langsung dengan tujuan organisasi, seperti membuat produk atau menyediakan layanan. Akhirnya,
ukuran objektif sering dapat ditemukan dalam catatan organisasi, sehingga sistem penilaian kinerja
khusus tidak harus dimulai. Data ini sering dikumpulkan dan disimpan, seringkali di komputer, untuk
alasan selain penilaian kinerja karyawan, membuat penilaian kinerja menjadi tugas yang relatif
mudah untuk diselesaikan.
Sayangnya, ukuran kinerja objektif juga memiliki beberapa keterbatasan. Banyak dari
ukuran objektif tidak sesuai untuk semua pekerjaan. Ketika pekerjaan tidak melibatkan
keluaran yang dapat dihitung, produktivitas bukanlah ukuran kinerja yang layak. Juga, tidak
selalu jelas berapa angka yang dianggap kinerja memuaskan. Misalnya, berapa banyak absen
per tahun harus dianggap kinerja yang baik? Data yang diambil dari catatan dapat
terkontaminasi dan tidak akurat. Terkadang perilaku dan produktivitas dikaitkan dengan orang
yang salah atau tidak pernah dicatat. Orang juga dapat mendistorsi catatan dengan
menghilangkan insiden buruk bagi individu yang disukai, dan karyawan mungkin gagal
melaporkan kecelakaan dan cedera.
Ukuran objektif sering kali tidak memadai sebagai indikator kriteria kinerja pekerjaan. Mereka
cenderung fokus pada perilaku tertentu, yang mungkin hanya menjadi bagian dari kriteria, dan
mereka mungkin mengabaikan bagian yang sama pentingnya (Borman, Bryant, & Dorio, 2010).
Ukuran produktivitas berfokus pada kuantitas kerja daripada kualitas. Meskipun kuantitas mungkin
lebih penting dalam beberapa pekerjaan, sulit untuk membayangkan pekerjaan di mana kualitas juga
tidak terlalu penting. Akhirnya, apa yang tercermin dalam ukuran objektif belum tentu
Metode untuk Menilai Prestasi Kerja 89
di bawah kendali individu yang dinilai (Borman et al., 2010). Perbedaan produktivitas pekerja pabrik
dapat disebabkan oleh perbedaan mesin yang mereka gunakan, dan perbedaan kinerja penjualan
tenaga penjualan dapat disebabkan oleh perbedaan wilayah penjualan. Seseorang yang diserang di
tempat kerja mungkin tidak melakukan kesalahan apa pun dan mungkin tidak dapat menghindari
insiden tersebut. Seorang petugas polisi yang menggunakan senjatanya mungkin terpaksa
melakukannya karena keadaan dan bukan karena kinerjanya yang buruk. Dalam menggunakan
ukuran objektif untuk menilai individu, faktor-faktor lain ini harus diperhitungkan.
Gambar 4.2 Contoh BARS untuk profesor perguruan tinggi. DariPenilaian Kinerja: Menilai
Perilaku Manusia di Tempat Kerja , oleh HJ Bernardin dan RW Beatty, 1984, Boston, MA: Kent. Dicetak ulang dengan
izin.
Ketiga skala ini memberikan deskripsi perilaku atau kinerja daripada sifat, tetapi
mereka berbeda dalam cara mereka menyajikan deskripsi dan/atau tanggapan.
NS Skala Peringkat Berlabuh Perilaku (BARS) adalah skala penilaian di mana
pilihan respons didefinisikan dalam istilah perilaku. Contoh untuk pekerjaan profesor
perguruan tinggi ditunjukkan pada Gambar 4.2. Skala ini dirancang untuk menilai kinerja
pada dimensi Keterampilan Organisasi di Kelas. Penilai memilih perilaku yang paling
mendekati untuk menggambarkan kinerja orang yang bersangkutan. Perilaku diurutkan
dari bawah ke atas pada skala sepanjang kontinum efektivitas kinerja.
Formulir evaluasi kinerja BARS berisi beberapa skala individu, masing-masing dirancang untuk
menilai dimensi penting dari kinerja pekerjaan. BARS dapat digunakan untuk menilai dimensi yang
sama dengan formulir penilaian grafik. Perbedaan utama adalah bahwa BARS menggunakan pilihan
respons yang mewakili perilaku, sedangkan formulir penilaian grafik meminta peringkat seberapa
baik kinerja orang tersebut di sepanjang dimensi yang bersangkutan. Dengan demikian kedua jenis
formulir penilaian dapat digunakan untuk menilai dimensi kinerja yang sama untuk pekerjaan yang
sama.
Metode untuk Menilai Prestasi Kerja 91
NS Skala Standar Campuran (MSS) menyediakan penilai dengan daftar perilaku yang bervariasi dalam
keefektifannya. Untuk setiap pernyataan, penilai diminta untuk menunjukkan jika:
Ada beberapa dimensi kinerja dalam MSS, dan setiap dimensi memiliki beberapa perilaku
yang terkait dengannya. Contoh tiga pernyataan yang mencerminkan kinerja untuk dimensi
Hubungan dengan Orang Lain ditunjukkan pada Tabel 4.5. Tiga pernyataan mewakili kinerja
pekerjaan yang baik, memuaskan, dan buruk di sepanjang dimensi.
Dalam MSS, pernyataan untuk berbagai dimensi disajikan dalam urutan acak. Penilai tidak
diberitahu dimensi spesifik yang terkait dengan setiap perilaku, meskipun sifat dari perilaku tersebut
jelas. Ide asli dari Blanz dan Ghiselli (1972) adalah bahwa urutan penyajian pernyataan yang beragam
akan membuat penilai lebih sulit untuk membiaskan peringkat mereka daripada yang benar dari
jenis bentuk peringkat lainnya. Ketika Dickinson dan Glebocki (1990) membandingkan tanggapan
terhadap urutan campuran dan urutan (berdasarkan dimensi), mereka menemukan bahwa subjek
merespons dengan cara yang sama dalam penilaian mereka dengan kedua urutan. Dengan
demikian, tampaknya tidak masalah jika dimensinya diidentifikasi atau jika pernyataannya
dicampuradukkan.
NS Skala Pengamatan Perilaku (BOS) berisi item yang didasarkan pada insiden kritis,
membuatnya agak seperti MSS. Akejadian kritis (Flanagan, 1954) adalah peristiwa yang
mencerminkan perilaku efektif atau tidak efektif oleh seorang karyawan. Contoh insiden yang
buruk bagi seorang guru adalah “menampar seorang anak yang membuat komentar yang
tidak sopan.” Dengan BOS, penilai diminta untuk menunjukkan untuk setiap item jumlah waktu
karyawan terlibat dalam perilaku itu. Pengembang skala merekomendasikan untuk memiliki
TABEL 4.5 Tiga Item untuk SPM untuk Menilai Dimensi Hubungan Dengan Orang Lain
Performa Memuaskan
Bisa bergaul dengan kebanyakan orang. Hanya kadang-kadang dia memiliki konflik dengan orang
lain di tempat kerja, dan ini kemungkinan kecil.
Penampilan buruk
Memiliki kecenderungan untuk terlibat dalam konflik yang tidak perlu dengan orang lain.
Catatan: Setiap item dinilai pada skala berikut: Untuk setiap item pada skala, tunjukkan apakah karyawan tersebut:
Sumber: Dari “Skala Standar Campuran: Sistem Peringkat Baru,” oleh F. Blanz dan EE Ghiselli (1972),
Psikologi Personalia, 25, 185–199.
92 Bab 4. Penilaian Kinerja
0% hingga 64%
Skala ini berbeda dari SPM karena penilai menunjukkan frekuensi daripada membandingkan
perilaku karyawan dengan item tersebut. Secara teori, ini harus menunjukkan seberapa sering
karyawan terlibat dalam perilaku yang relevan dengan kinerja.
Penggunaan peringkat frekuensi telah dikritik oleh Kane dan Bernardin (1982). Mereka
menunjukkan bahwa frekuensi perilaku bukanlah indikator kinerja yang baik karena frekuensi yang
diberikan mungkin mencerminkan kinerja yang baik untuk satu perilaku dan kinerja yang buruk
untuk yang lain. Mereka memberikan contoh dua perilaku bagi petugas polisi. Sebuah 85% sampai
94% frekuensi kejadian akan luar biasa untuk mendapatkan surat perintah penangkapan tetapi buruk
untuk dibenarkan dalam penggunaan kekuatan mematikan. Jadi pertimbangan yang cukup dapat
diperlukan dalam menafsirkan arti peringkat frekuensi dengan BOS. Tentu saja, penilaian diperlukan
dalam menafsirkan banyak ukuran kinerja pekerjaan.
TABEL 4.6 Empat Langkah dalam Mengembangkan Formulir Penilaian Berfokus pada Perilaku untuk Menilai
Prestasi Kerja
Langkah 2: Kembangkan deskripsi kinerja pekerjaan yang efektif dan tidak efektif dari insiden kritis Langkah 3:
Minta hakim yang berpengetahuan menempatkan deskripsi ke dalam dimensi pekerjaan
Langkah 4: Minta juri yang berpengetahuan untuk menilai efektivitas deskripsi
Metode untuk Menilai Prestasi Kerja 93
skala untuk setiap dimensi, seperti pada Gambar 4.2. Dengan MSS, peringkat digunakan untuk
menempatkan pernyataan ke dalam tiga kategori baik, memuaskan, dan buruk.
Mengamati kinerja
Menyimpan informasi tentang kinerja
Mengambil informasi tentang kinerja dari memori
Menerjemahkan informasi yang diambil ke dalam peringkat
lebih mudah diinterpretasikan. Ada kemungkinan bahwa ini mengarah pada penilaian yang akurat tentang
kinerja karyawan (Lord & Maher, 1989).
Secara teori, seharusnya dimungkinkan untuk menggunakan model kognitif ini untuk membantu
penilai melakukan pekerjaan yang lebih akurat dalam mengevaluasi kinerja pekerjaan. Jelley dan Goffin
(2001) mencoba ini dengan eksperimen di mana mahasiswa diminta untuk menilai kinerja instruktur
perguruan tinggi yang direkam menggunakan BOS. Meskipun hasilnya agak tidak konsisten, penulis dapat
menemukan beberapa peningkatan akurasi setelah priming memori penilai. Ini dilakukan dengan meminta
mereka melakukan beberapa peringkat global awal yang dirancang untuk merangsang ingatan kinerja yang
diamati. Pendekatan ini menunjukkan beberapa janji dalam membantu meningkatkan peringkat, tetapi
penelitian lebih lanjut akan diperlukan untuk menentukan apakah model ini pada akhirnya akan terbukti
bermanfaat.
Bekerja keras
Bertanggung jawab
Menjadi terorganisir
Borman menyimpulkan bahwa dimensi ini mewakili karakteristik yang digunakan perwira untuk
menilai kinerja prajurit. Dia juga mencatat bahwa dalam sampel perwira berpengalamannya, ada
kesepakatan yang baik tentang apa yang merupakan prestasi kerja yang baik. Hasil ini menunjukkan
bahwa supervisor yang berpengalaman mungkin memiliki skema yang secara akurat mewakili kinerja
yang efektif. Keenam dimensi ini dapat digunakan sebagai dasar untuk salah satu bentuk penilaian
yang telah kita bahas sebelumnya.
Werner (1994) melakukan penelitian di mana ia meminta supervisor berpengalaman untuk
menilai kinerja sekretaris seperti yang dijelaskan dalam serangkaian insiden. Salah satu variabel yang
menarik dalam penelitian ini adalah jenis informasi yang digunakan supervisor dalam membuat
penilaian mereka. Werner menemukan bahwa dimensi berikut dianggap paling penting:
Halo Kesalahan
Halo kesalahan terjadi ketika seorang penilai memberikan penilaian yang sama kepada individu di semua
dimensi penilaian, meskipun ada perbedaan kinerja di seluruh dimensi. Dengan kata lain, jika orang tersebut
dinilai luar biasa di satu bidang, dia dinilai luar biasa di semua bidang, meskipun ia mungkin hanya rata-rata
atau bahkan miskin di beberapa bidang. Misalnya, seorang petugas polisi mungkin hebat dalam
menyelesaikan banyak penangkapan (jumlah besar) tetapi mungkin melakukan pekerjaan yang buruk dalam
urusan administrasi. Seorang supervisor mungkin menilai petugas ini tinggi pada semua dimensi, meskipun
tidak layak secara seragam. Demikian pula, jika seseorang dinilai buruk di satu bidang, peringkatnya buruk
untuk semua bidang, meskipun dia mungkin memuaskan pada beberapa dimensi kinerja. Kesalahan
penilaian ini terjadi dalam bentuk penilaian individu yang bertentangan dengan yang terjadi di seluruh
bentuk individu yang berbeda.
Tabel 4.7 menunjukkan pola respons yang mencerminkan kesalahan halo. Tabel
menunjukkan peringkat empat individu di lima dimensi kinerja. Peringkat berkisar dari 1
(kinerja paling buruk) hingga 5 (kinerja terbaik). Ini adalah pola halo karena peringkat untuk
setiap karyawan adalah sama di seluruh dimensi yang berbeda, meskipun setiap orang
menerima peringkat yang berbeda. Pola seperti itu menunjukkan bahwa penilai tidak dapat
membedakan antar dimensi. Orang tersebut dipandang seragam dalam kinerja lintas dimensi.
TABEL 4.7 Peringkat Kinerja Kerja untuk Empat Karyawan pada Lima Dimensi yang Mengilustrasikan Halo
Pola Kesalahan
Kehadiran 5 3 1 4
Komunikasi 5 3 1 4
Mengikuti arahan 5 3 1 4
Kualitas kerja 5 3 1 4
Kuantitas kerja 5 3 1 4
96 Bab 4. Penilaian Kinerja
"Dia bukan bos yang sempurna, tapi dia memberi Anda banyak umpan balik." (© 1995; Dicetak ulang atas izin Bunny Hoest dan
Parade Magazine.)
1997; Viswesvaran, Schmidt, & Ones, 2005). Bagian dari diskusi ini menyangkut bagaimana
memisahkan kesalahan dari halo "benar".halo sejati berarti bahwa seorang karyawan berkinerja
pada tingkat yang sama di semua dimensi.
Kekhawatiran lain dengan halo telah menjelaskan proses kognitif yang akan
menyebabkan penilai untuk menunjukkan kesalahan halo. Beberapa peneliti telah berteori
bahwa penilai mengandalkan kesan umum karyawan ketika membuat penilaian dimensi
(Lance, LaPointe, & Fisicaro, 1994; Nathan & Lord, 1983). Menurut pandangan ini, potongan
informasi yang menonjol digunakan untuk membentuk kesan umum dari seorang karyawan.
Kesan membentuk dasar penilaian kinerja. Hal ini menunjukkan bahwa penilai mungkin lebih
mampu memberikan informasi tentang kinerja global daripada dimensi kinerja.
Kesalahan Distribusi
Kesalahan distribusi terjadi ketika penilai cenderung menilai semua orang sama. Kesalahan kelonggaran
terjadi ketika penilai menilai semua orang pada akhir skala kinerja yang menguntungkan. Kesalahan
tingkat keparahan terjadi ketika penilai menilai semua orang di ujung skala kinerja yang tidak
menguntungkan. Tendensi sentral kesalahan terjadi ketika penilai menilai semua orang di tengah skala
kinerja. Pola kelonggaran dapat dilihat di seluruh peringkat orang yang berbeda. Tabel 4.8 menunjukkan
pola kelonggaran di mana keempat orang diberi peringkat pada akhir skala kinerja yang menguntungkan.
Setiap orang menerima peringkat 4 dan 5 pada skala lima poin. Ada kemungkinan, bagaimanapun, bahwa
pola kesalahan distribusi tidak mencerminkan kesalahan. Semua ratee mungkin telah melakukan hal yang
sama, yang mengarah ke rating yang sama.
TABEL 4.8 Peringkat Prestasi Kerja untuk Empat Karyawan pada Lima Dimensi yang Mengilustrasikan a
Pola Kesalahan Leniency
Kehadiran 4 5 5 5
Komunikasi 4 5 5 5
Mengikuti arahan 5 4 4 4
Kualitas kerja 4 5 4 5
Kuantitas kerja 5 4 5 5
masalah. Yang lainnya adalah melatih penilai untuk menghindari kesalahan penilaian. Meskipun kedua pendekatan telah
menunjukkan harapan, studi penelitian telah menghasilkan hasil yang bertentangan tentang kemampuan mereka untuk
mengurangi kesalahan (Bernardin & Beatty, 1984).
Pelatihan penilai juga telah dicoba dalam banyak penelitian, dengan hasil yang beragam (Hedge &
Kavanagh, 1988; Latham, 1986). Setidaknya beberapa perbedaan dalam temuan penelitian mungkin
disebabkan oleh perbedaan jenis pelatihan yang telah dipelajari. Mungkin pelatihan yang paling populer
adalahpelatihan kesalahan penilai atau MEMBASAHI. Tujuan RET adalah untuk membiasakan penilai
dengan kesalahan penilai dan mengajari mereka untuk menghindari pola penilaian ini. Meskipun sebagian
besar penelitian telah menemukan bahwa pelatihan semacam ini mengurangi kesalahan penilaian,
seringkali dengan mengorbankan akurasi penilaian (misalnya, Bernardin & Pence, 1980; Hedge & Kavanagh,
1988). Dengan kata lain, penilai dapat mengurangi jumlah pola halo dan kelonggaran dalam penilaian mereka
dengan memaksa penilaian bervariasi, apakah mereka secara akurat mencerminkan seberapa baik orang tersebut
telah melakukannya, tetapi penilaian tersebut kurang akurat dalam mencerminkan tingkat kinerja yang sebenarnya. .
dalam pembahasan ini, kesalahan penilai disimpulkan dari pola penilaian. Ada kemungkinan bahwa
kinerja individu serupa di seluruh dimensi kinerja yang berbeda (halo sejati) atau bahwa semua
individu di departemen penyelia melakukan pekerjaan mereka dengan sama baiknya. Melatih penilai
untuk menghindari penilaian yang sama di kedua dimensi atau orang akan menghasilkan
konsentrasi mereka untuk menghindari pola tertentu daripada menilai kinerja pekerjaan secara
akurat. Bernardin dan Pence (1980) menyarankan bahwa RET mungkin menggantikan satu rangkaian
kesalahan penilaian dengan yang lain.
Nathan dan Tippins (1990) menawarkan penjelasan yang berbeda tentang mengapa kesalahan halo
dikaitkan dengan akurasi yang lebih besar dalam peringkat kinerja pekerjaan. Mereka berspekulasi bahwa
penilai yang menunjukkan lebih sedikit halo dalam penilaian mereka mungkin memberi terlalu banyak bobot
pada peristiwa negatif yang tidak penting. Misalnya, seorang penyelia mungkin telah memberikan penilaian
kehadiran yang rendah kepada karyawan yang dapat diandalkan karena dia sakit selama satu minggu di
tahun sebelumnya. Penilai yang menunjukkan pola halo dalam penilaian mereka kurang memperhatikan
kejadian langka tersebut dan cenderung mempertimbangkan kinerja biasa orang tersebut. Ini mungkin
menghasilkan peringkat yang lebih akurat karena lebih dipengaruhi oleh kinerja umum daripada oleh
contoh langka kinerja baik atau buruk dalam satu atau lebih dimensi.
Hasil lebih menjanjikan dengan jenis pelatihan selain RET. Prosedur pelatihan tersebut
mengajarkan penilai bagaimana mengamati perilaku yang relevan dengan kinerja dan bagaimana
membuat penilaian berdasarkan pengamatan tersebut. Hedge dan Kavanagh (1988), misalnya,
menemukan bahwa pelatihan observasi ini meningkatkan akurasi penilaian tetapi tidak mengurangi
kesalahan penilaian (lihat kotak Penelitian secara Detail). Mungkin yang paling menjanjikan adalah
kerangka acuan pelatihan (Day & Sulsky, 1995), yang mencoba memberikan pemahaman umum
tentang tugas pemeringkatan. Penilai diberikan contoh spesifik dari perilaku yang akan mewakili
berbagai tingkat kinerja untuk setiap dimensi yang akan dinilai. Hasil dengan pelatihan semacam ini
sejauh ini terbukti menjanjikan dalam meningkatkan akurasi penilaian dan memberikan penilai
pemahaman yang lebih akurat tentang kriteria kinerja yang baik (Gorman & Rentsch, 2009). Salah
satu batasan pada penelitian ini adalah bahwa sebagian besar telah dilakukan di laboratorium
dengan mahasiswa, jadi tidak jelas seberapa baik hasil yang akan digeneralisasikan kepada manajer
untuk menilai karyawan mereka di lapangan.
PENELITIAN DETAIL
Beberapa studi menemukan bahwa penilai pelatihan untuk pelatihan dengan cara membuat penilaian yang tepat tentang kinerja
menghindari kesalahan penilaian dapat mengurangi akurasi berdasarkan perilaku yang diamati. Kelompok terakhir adalah
mereka dalam mengevaluasi kinerja pekerjaan. Hedge dan kelompok kontrol yang tidak mendapatkan pelatihan.
Kavanagh (1988) ingin melihat apakah jenis pelatihan lain akan Baik sebelum dan sesudah pelatihan, semua kelompok
lebih efektif dalam meningkatkan akurasi peringkat kinerja. menonton rekaman video seseorang yang melakukan
Lima puluh dua pengawas secara acak ditugaskan ke salah satu dari suatu pekerjaan. Mereka kemudian menilai kinerja orang
empat kelompok perlakuan. Kelompok pertama menerima pelatihan tersebut pada beberapa dimensi kinerja. Kinerja rekaman
kesalahan penilai yang dirancang untuk membiasakan penilai dengan video dinilai oleh panel ahli yang memberikan standar
kesalahan penilaian dan cara untuk menghindarinya. Kelompok kedua untuk perbandingan penilaian oleh anggota setiap
menerima pelatihan tentang cara mengamati perilaku yang relevan dengan kelompok dalam penelitian. Akurasi penilaian kinerja dinilai
kinerja pekerjaan. Kelompok ketiga menerima sebagai perbedaan antara penilaian penilai
Metode untuk Menilai Prestasi Kerja 99
penilaian rekaman video dan penilaian panel ahli atas mungkin tidak mewakili kesalahan. Sebaliknya, pola-pola ini
rekaman video. dapat secara akurat menunjukkan tingkat kinerja individu
Hasil penelitian menunjukkan bahwa mereka yang mendapatkan dalam pekerjaan. Misalnya, individu mungkin tampil pada
pelatihan rater error mengalami penurunan kesalahan rating dan tingkat yang sama untuk dimensi yang berbeda. Implikasi
akurasi. Temuan ini konsisten dengan penelitian sebelumnya tentang dari penelitian ini adalah bahwa berbagai jenis pelatihan
pelatihan semacam ini. Dua jenis pelatihan lainnya berhasil penilai dapat membantu organisasi mendapatkan penilaian
meningkatkan akurasi tetapi dengan biaya kesalahan penilaian yang kinerja yang lebih akurat.
termotivasi (ingin melakukan pekerjaan dengan baik untuk kepentingannya sendiri) dan termotivasi
secara ekstrinsik (bekerja keras untuk mendapatkan imbalan) dan kemudian menghubungkan
persepsi tersebut dengan peringkat kinerja pekerjaan. Manajer Amerika dan Latin menganggap
motivasi intrinsik lebih penting untuk kinerja daripada motivasi ekstrinsik, sedangkan manajer Asia
menganggap kedua jenis motivasi itu sama pentingnya.
Telah ditetapkan dengan baik bahwa karyawan kulit hitam rata-rata menerima peringkat penilaian kinerja yang
lebih rendah daripada karyawan kulit putih (McKay & McDaniel, 2006). Menariknya, ras penilai tampaknya tidak
berpengaruh pada peringkat untuk orang kulit putih, tetapi berpengaruh pada peringkat untuk orang kulit hitam.
Seperti yang ditunjukkan oleh Stauffer dan Buckley (2005), penilai Kulit Hitam dan Putih memberikan peringkat yang
sama kepada Orang Kulit Putih dan memberi peringkat Orang Kulit Hitam secara rata-rata lebih rendah daripada
Orang Kulit Putih. Namun, perbedaan antara peringkat itu jauh lebih besar untuk Putih daripada penilai Hitam. Jika
dianggap bahwa penilai kulit hitam akan memiliki bias yang lebih sedikit daripada penilai kulit putih terhadap
karyawan kulit hitam, temuan ini menunjukkan kemungkinan bahwa penilai kulit putih bias terhadap karyawan kulit
hitam. Tentu saja, penjelasan alternatifnya adalah bahwa penilai kulit hitam bias mendukung orang kulit hitam dan
menilai mereka terlalu tinggi dan bahwa penilai kulit hitam dan putih bias mendukung orang kulit putih dan menilai
mereka terlalu tinggi dibandingkan dengan orang kulit hitam. Saat ini, kami tidak tahu sejauh mana bias beroperasi
dalam peringkat ini baik untuk atau terhadap karyawan Hitam Putih.
Di sebagian besar organisasi, atasan langsung setiap karyawan bertanggung jawab untuk menilai
kinerja pekerjaan. Namun, akan sangat membantu untuk mendapatkan berbagai perspektif tentang
kinerja pekerjaan (Furnham & Stringfield, 1994), dan penggunaan berbagai perspektif menjadi
praktik standar dalam evaluasi manajer dan orang lain (Rowson, 1998). Peringkat oleh rekan kerja,
diri sendiri, dan bawahan (untuk supervisor) dapat menjadi pelengkap yang berguna untuk peringkat
supervisor dan dapat membantu dalam memberikan umpan balik untuk pengembangan karyawan
(Maurer, Mitchell, & Barbeite, 2002). Secara khusus, perbedaan antara penilaian oleh diri sendiri
(peringkat kinerja karyawan itu sendiri) dan orang lain dapat menunjukkan area di mana orang lain
melihat karyawan secara berbeda dari cara karyawan memandang dirinya sendiri.
Penggunaan berbagai perspektif untuk umpan balik manajer disebut Umpan balik 360 derajat (
Baldwin & Padgett, 1993). Seorang manajer dievaluasi oleh rekan-rekan, bawahan, dan supervisor
pada beberapa dimensi kinerja. Selain itu, manajer melengkapi penilaian kinerjanya sendiri.
Penelitian telah menunjukkan bahwa orang-orang di posisi yang berbeda ini hanya menunjukkan
persetujuan sederhana dalam penilaian mereka (Brett & Atwater, 2001; Carless, Mann, & Wearing,
1998; Fletcher & Baldry, 2000), menunjukkan bahwa mereka memberikan perspektif yang berbeda
tentang kinerja seseorang. Keuntungan lain menggunakan beberapa penilai adalah bahwa efek dari
bias individu dapat dikurangi. Sebagai contoh, telah ditunjukkan bahwa orang memberikan peringkat
yang lebih tinggi dalam evaluasi 360 derajat kepada orang yang mereka sukai (Antonioni & Park,
2001). Sebagai contoh, efek pilih kasih di pihak penyelia langsung berkurang ketika informasi
tambahan dari penilai lain ditambahkan ke penilaian. Hal ini dapat menyebabkan peningkatan
kepercayaan dan sikap yang lebih baik tentang sistem penilaian pada bagian dari mereka yang
dievaluasi (Mayer & Davis, 1999).
Tujuan dari sistem 360 derajat adalah untuk meningkatkan kinerja, terutama bagi
individu yang paling membutuhkan peningkatan kinerja. Sistem ini telah terbukti
memiliki efek positif bagi beberapa individu tetapi tidak semua. Berlawanan dengan ini
Masalah Hukum dalam Penilaian Kinerja 101
tujuan yang dimaksudkan sistem, itu adalah yang terbaik dan bukan yang berkinerja terburuk yang
tampaknya paling diuntungkan dari umpan balik 360 derajat (Bailey & Austin, 2006). Selanjutnya, Atwater
dan Brett (2005) menemukan bahwa individu-individu yang menerima penilaian rendah dari orang lain dan
menilai diri mereka sendiri juga rendah memiliki reaksi terburuk terhadap umpan balik, menunjukkan
bahwa jika seseorang mengetahui kinerjanya buruk, keyakinan tersebut dikuatkan oleh orang lain adalah
tidak membantu.
TABEL 4.9 Enam Poin Sistem Penilaian Kinerja yang Dapat Dipertahankan Secara Hukum
4. Miliki peringkat tinjauan manajemen yang lebih tinggi, dan izinkan karyawan untuk mengajukan banding atas evaluasi mereka.
6. Memberikan bantuan dan konseling kepada karyawan yang berkinerja buruk sebelum melakukan tindakan terhadap mereka
Sumber: Diadaptasi dari “Performance Appraisal and Terminations: A Review of Court Decisions Since Brito v. Zia
With Implications for Personnel Practices,” oleh GV Barrett dan MG Kernan, 1987, Psikologi Personalia, 40, 489-503.
Di Amerika Serikat, ada peningkatan jumlah tantangan pengadilan untuk tindakan karyawan
berbasis kinerja, seperti promosi dan pemutusan hubungan kerja (Latham et al., 1993). Organisasi
yang kalah dalam kasus seperti itu tidak dapat menunjukkan kepada pengadilan bahwa sistem
penilaian kinerja mereka tidak mendiskriminasi kelompok tertentu. Metode subjektif sangat mungkin
menimbulkan tantangan hukum karena memberikan ruang bagi supervisor untuk mengungkapkan
prasangka terhadap kelompok orang tertentu. Mungkin sulit bagi seorang supervisor untuk
membuktikan di pengadilan bahwa penilaiannya adil dan tidak memihak ketika, misalnya, orang kulit
hitam mendapatkan penilaian kinerja yang lebih rendah daripada orang kulit putih (McKay &
McDaniel, 2006), seperti disebutkan sebelumnya.
Barrett dan Kernan (1987) menyarankan enam komponen yang harus menjadi bagian dari sistem
penilaian kinerja yang dapat dipertahankan secara hukum. Seperti yang ditunjukkan pada Tabel 4.9, sistem
harus dimulai dengan analisis pekerjaan untuk memperoleh dimensi kinerja untuk pekerjaan tertentu.
Analisis pekerjaan akan memastikan bahwa dimensi yang dipilih relevan dengan pekerjaan. Penilai harus
menerima pelatihan tentang bagaimana formulir penilaian akan digunakan untuk menilai kinerja. Untuk
membantu meminimalkan bias pribadi, manajemen atas harus meninjau penilaian kinerja. Kinerja dan
alasan tindakan karyawan harus didokumentasikan dan dicatat. Lebih mudah untuk mengambil tindakan
terhadap seorang karyawan ketika kinerja, baik atau buruk, telah didokumentasikan untuk jangka waktu
yang lama. Ini menghilangkan kesan bahwa penilaian terakhir diberikan untuk membenarkan tindakan
tertentu yang mempengaruhi seorang karyawan. Akhirnya, ada baiknya untuk memberikan bantuan dan
konseling kepada karyawan yang kinerjanya kurang memuaskan. Hal ini menunjukkan bahwa organisasi
telah melakukan segala kemungkinan untuk karyawan yang tidak memuaskan sebelum mengambil tindakan
terhadapnya.
Werner dan Bolino (1997) menganalisis hasil dari 295 kasus pengadilan AS di mana penilaian
kinerja ditantang sebagai diskriminatif. Sistem penilaian kinerja yang didasarkan pada analisis
pekerjaan, memberikan instruksi tertulis kepada penilai, menawarkan kesempatan kepada karyawan
untuk mendapatkan masukan, dan menggunakan banyak penilai jauh lebih kecil kemungkinannya
untuk mengakibatkan kerugian organisasi. Misalnya, sementara organisasi secara keseluruhan
kehilangan 41% kasus, organisasi yang menggunakan banyak penilai hanya kehilangan 11% kasus.
Penggunaan keempat praktik ini digabungkan harus menghasilkan sistem penilaian kinerja yang
relatif aman dari perspektif hukum.
Membiarkan karyawan untuk memiliki masukan ke dalam penilaian kinerja juga memiliki manfaat di
luar masalah hukum. Penelitian telah menunjukkan bahwa memberi karyawan kesempatan untuk duduk
bersama supervisor dan mendiskusikan penilaian secara terbuka dapat menghasilkan sikap yang lebih baik
Ringkasan Bab 103
(Korsgaard & Roberson, 1995). Dalam satu penelitian, ini terjadi meskipun karyawan yang
diizinkan masukan sebenarnya memiliki peringkat lebih rendah daripada mereka yang tidak
(Taylor, Tracy, Renard, Harrison, & et al., 1995). Persepsi keadilan dalam penelitian ini bahkan
mengurangi niat karyawan untuk berhenti dari pekerjaan. Agar efektif dan dianggap adil,
sistem penilaian kinerja harus mencakup enam langkah Barrett dan Kernan (1987), serta
masukan dari karyawan.
RINGKASAN BAB
Data kinerja pekerjaan memiliki banyak kegunaan organisasi, termasuk pengambilan keputusan
administratif, pengembangan karyawan, umpan balik karyawan, dan penelitian. Langkah pertama dalam
mengevaluasi kinerja pekerjaan adalah mengembangkan kriteria kinerja yang mendefinisikan kinerja baik
dan buruk. Setelah kriteria ditetapkan, metode khusus untuk mengukurnya dapat dipilih.
Ukuran kinerja pekerjaan dapat diklasifikasikan sebagai objektif atau subjektif. Ukuran
objektif adalah jumlah output dari suatu pekerjaan, seperti jumlah penjualan untuk tenaga
penjual atau jumlah unit yang diproduksi untuk pekerja pabrik. Ukuran subjektif adalah
penilaian oleh penyelia (atau individu lain yang akrab dengan kinerja pekerjaan orang
tersebut). Ukuran subyektif lebih umum digunakan dari dua metode, tetapi mereka menderita
bias dan kesalahan yang disebabkan oleh penilaian manusia. Dua pendekatan berbeda telah
diambil untuk mengurangi kesalahan penilaian dalam ukuran subjektif: desain formulir
penilaian dan pelatihan penilai.
Beberapa jenis formulir penilaian telah dirancang untuk meningkatkan akurasi penilaian kinerja.
Behaviorally Anchored Rating Scale (BARS) meminta penilai untuk menunjukkan mana dari beberapa
perilaku yang paling mendekati untuk mewakili kinerja pekerjaan individu. Skala Standar Campuran
(MSS) meminta penilai untuk menunjukkan apakah kinerja individu lebih buruk dari, sebaik, atau
lebih baik dari masing-masing beberapa item perilaku kinerja. Behavior Observation Scale (BOS)
meminta penilai untuk menunjukkan seberapa sering penilai melakukan setiap perilaku yang
terdaftar. Penelitian yang membandingkan bentuk penilaian yang berfokus pada perilaku dengan
jenis ukuran lain telah gagal menemukan bukti yang konsisten untuk akurasi yang lebih besar.
Pelatihan penilai adalah pendekatan lain yang telah dicoba untuk mengurangi kesalahan. Penelitian
telah menyarankan bahwa pelatihan kesalahan penilai dapat mengurangi akurasi penilaian, bahkan jika
berhasil mengurangi kesalahan penilaian. Pelatihan observasi yang berfokus pada mengamati perilaku
terkait kinerja dan membuat penilaian kinerja telah menjanjikan dalam meningkatkan akurasi. Namun, pada
saat ini, terlalu dini untuk menyimpulkan bahwa pendekatan mana pun akan terbukti berguna dalam
membantu penyelia memberikan peringkat kinerja yang akurat.
Beberapa faktor telah terbukti berhubungan dengan peringkat kinerja pekerjaan, meskipun tidak
sepenuhnya jelas apakah mereka menghasilkan bias penilai atau tidak. Apakah penilai menyukai bawahan,
suasana hati penilai, motif yang dirasakan karyawan untuk kinerja, faktor budaya, dan ras penilai dan orang
yang dinilai semuanya mempengaruhi penilaian.
Umpan balik dari berbagai sumber dapat membantu karyawan yang ingin meningkatkan
kinerja mereka. Manajer menerima umpan balik 360 derajat dari perbandingan penilaian diri
mereka dengan penilaian rekan kerja, bawahan, dan penyelia.
Di Amerika Serikat dan banyak negara lain, penilaian kinerja adalah proses hukum
dan juga teknis. Organisasi diwajibkan oleh hukum AS untuk menghindari diskriminasi
dalam prosedur penilaian kinerja mereka. Kegagalan untuk mematuhi seperti itu
104 Bab 4. Penilaian Kinerja
persyaratan hukum dapat membuat organisasi tunduk pada tuntutan hukum. Sejumlah praktik khusus,
seperti mendasarkan sistem pada analisis pekerjaan dan memberikan pelatihan penilai, mengurangi
kemungkinan bahwa organisasi akan kalah di pengadilan jika ditentang.
I/O PSI CE
Menentukan Kriteria untuk Suatu Pekerjaan 4. Apa yang paling mencerminkan kinerja yang baik pada
tangani sendiri. Wawancarai dia tentang kriteria kinerja, ukuran kinerja pekerjaan. Kumpulkan 10 insiden kritis, setengah
buat catatan yang cermat. Anda harus bertanya tentang hal mencerminkan kinerja yang efektif dan setengah
berikut. mencerminkan kinerja yang tidak efektif. Mintalah orang yang
Anda kenal untuk memberikan contoh yang telah mereka amati.
1. Apa fungsi utama dari pekerjaan ini? Orang yang sama dapat memberi Anda insiden yang efektif dan
2. Untuk setiap fungsi, apa yang harus diselesaikan tidak efektif. Yang terbaik adalah mendapatkan insiden dari
oleh karyawan? beberapa orang. Gunakan insiden untuk menentukan satu atau
3. Untuk setiap fungsi, apa yang dimaksud dengan kinerja lebih dimensi kinerja pekerjaan yang mungkin dimasukkan
yang dapat diterima dan kinerja yang luar biasa? dalam skala penilaian kinerja.