Chapter 4 Performance Appraisal - En.id

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.
com
BAB 4
Penilaian Kinerja
BAB 4 GARIS
MENGAPA KITA MENGHARGAI KARYAWAN?

Keputusan Administratif
Pengembangan Karyawan dan Penelitian
Umpan Balik
KRITERIA KINERJA
Karakteristik Kriteria
Kriteria Kompleksitas
Kriteria Dinamis
Kinerja Kontekstual
METODE UNTUK MENILAI KINERJA PEKERJAAN
Ukuran Obyektif Kinerja Pekerjaan Ukuran
Subyektif Kinerja Pekerjaan Umpan Balik
360 Derajat
DAMPAK TEKNOLOGI TERHADAP MASALAH HUKUM PENILAIAN
KINERJA PADA PENILAIAN KINERJA
RINGKASAN BAB
PSIKOLOGI I/O DALAM PRAKTEK
LEARNING BY DOING
Bayangkan Anda adalah seorang manajer untuk sebuah organisasi besar dan Anda diberi tugas untuk menentukan
seberapa baik bawahan Anda melakukan pekerjaan mereka. Bagaimana Anda menilai kinerja pekerjaan mereka
untuk melihat siapa yang melakukan dan siapa yang tidak melakukan pekerjaan dengan baik? Apakah Anda akan
melihat setiap orang melakukan pekerjaannya? Jika Anda memang menonton orang, bagaimana Anda tahu apa yang
harus dicari? Beberapa orang mungkin tampak bekerja sangat keras tetapi pada kenyataannya hanya mencapai
sedikit yang berkontribusi pada tujuan organisasi. Untuk banyak pekerjaan, mungkin tidak langsung terlihat
seberapa baik seseorang melakukannya hanya dengan mengamatinya kecuali Anda memiliki gagasan yang baik
tentang apa yang merupakan kinerja pekerjaan yang baik. Kinerja paling baik dinilai dengan mengukur pekerjaan
seseorang terhadap kriteria atau standar perbandingan.
78
Mengapa Kami Menilai Karyawan? 79
Dalam bab ini, kita prihatin dengan isu-isu yang terlibat dalam penilaian kinerja pekerjaan
karyawan. Pertama, masalah kriteria atau standar perbandingan yang digunakan untuk menilai dan
mengukur kinerja. Sebelum kita dapat menilai kinerja, kita harus memiliki gagasan yang jelas tentang
apa itu kinerja yang baik. Setelah kita mengetahuinya, kita dapat mengatasi masalah kedua dalam
mengembangkan prosedur untuk menilainya. Penilaian kinerja adalah proses dua langkah pertama
mendefinisikan apa yang dimaksud dengan kinerja yang baik (pengembangan kriteria) diikuti dengan
penerapan prosedur untuk menilai karyawan dengan menentukan seberapa baik mereka memenuhi
kriteria. Sebelum kita membahas kriteria dan prosedur untuk menilai kinerja, kita melihat alasan
utama untuk terlibat dalam kegiatan yang berpotensi memakan waktu ini.
Tujuan: Siswa yang mempelajari bab ini harus dapat:
Buat daftar penggunaan informasi kinerja pekerjaan.

Diskusikan pentingnya kriteria untuk penilaian kinerja.
Jelaskan berbagai metode penilaian kinerja, serta kelebihan dan keterbatasannya.
Diskusikan bagaimana melakukan penilaian kinerja yang dapat dipertahankan secara hukum.
MENGAPA DOWE MENILAI KARYAWAN?

Pertanyaan pertama yang kami jawab adalah alasan bagi organisasi untuk menilai kinerja karyawan
mereka. Penilaian kinerja dapat menjadi tugas yang memakan waktu yang tidak disukai oleh
sebagian besar manajer dan bawahan mereka. Lalu mengapa sebagian besar organisasi besar
menilai kinerja pekerjaan karyawan setidaknya sekali per tahun? Alasannya adalah bahwa data
kinerja pekerjaan dapat bermanfaat baik bagi karyawan maupun organisasi. Data kinerja dapat
digunakan untuk keputusan administratif, pengembangan dan umpan balik karyawan, dan penelitian
untuk menentukan efektivitas praktik dan prosedur organisasi.
Keputusan Administratif
Banyak keputusan administratif yang mempengaruhi karyawan didasarkan, setidaknya sebagian, pada kinerja
pekerjaan mereka. Sebagian besar organisasi besar menggunakan kinerja pekerjaan sebagai dasar untuk banyak
tindakan negatif dan positif. Tindakan negatif terhadap seorang karyawan mencakup penurunan pangkat dan
pemutusan hubungan kerja (pemecatan), dan beberapa organisasi memiliki kebijakan yang mengharuskan
pemecatan karyawan yang kinerjanya tidak memuaskan. Tindakan positif termasuk promosi dan kenaikan gaji, dan
banyak organisasi memiliki sistem pembayaran jasa yang mengikat kenaikan ke tingkat kinerja pekerjaan.
Dasar untuk menggunakan data kinerja pekerjaan untuk keputusan administratif dapat ditemukan baik
dalam kontrak maupun hukum. Kontrak serikat pekerja akan sering menentukan bahwa kinerja pekerjaan
adalah dasar untuk keputusan administratif tertentu, seperti kenaikan gaji. Sebuah kontrak juga dapat
menyatakan bahwa penilaian kinerja tidak akan dilakukan. Pegawai pegawai negeri (pemerintah) di Amerika
Serikat hanya dapat dipecat karena prestasi kerja yang tidak memuaskan atau pelanggaran aturan kerja.
Pelanggaran aturan termasuk menyerang rekan kerja, dihukum karena kejahatan, tertidur di tempat kerja,
dan tidak muncul untuk bekerja saat dijadwalkan. Meski begitu, banyak yang dipecat
Pegawai pemerintah AS telah dipekerjakan kembali karena catatan kinerja yang memuaskan dalam
pekerjaan. Amerika Serikat bukan satu-satunya negara yang memiliki undang-undang yang mewajibkan
80 Bab 4. Penilaian Kinerja
keputusan administratif harus didasarkan pada prestasi kerja. Di Kanada, misalnya,

persyaratan hukum bahwa pemecatan karyawan harus didasarkan pada prestasi kerja telah
diperluas ke perusahaan swasta, serta pemerintah.
Pengembangan dan Umpan Balik Karyawan
Agar karyawan dapat meningkatkan dan mempertahankan kinerja dan keterampilan kerja mereka, mereka membutuhkan umpan balik
kinerja pekerjaan dari supervisor mereka. Salah satu peran utama supervisor adalah memberikan informasi kepada bawahan mereka
tentang apa yang diharapkan dari pekerjaan dan seberapa baik mereka memenuhi harapan tersebut. Karyawan perlu mengetahui kapan
mereka berkinerja baik sehingga mereka akan terus melakukannya, serta kapan mereka tidak berkinerja baik sehingga mereka dapat
mengubah apa yang mereka lakukan. Bahkan karyawan yang berkinerja baik dalam pekerjaan dapat memperoleh manfaat dari umpan
balik tentang bagaimana berkinerja lebih baik lagi. Umpan balik juga dapat membantu dalam memberi tahu karyawan cara meningkatkan
keterampilan mereka untuk naik ke posisi yang lebih tinggi. Tren baru adalah bagi perusahaan untuk melampaui evaluasi setahun sekali
dalam merancang sistem manajemen kinerja yang komprehensif. Selain penilaian tahunan, sistem tersebut dapat mencakup penetapan
tujuan dan sesi pembinaan dan umpan balik berkala antara karyawan dan penyelia. Sementara tinjauan tahunan dapat digunakan untuk
tujuan administratif, tinjauan sementara hanya akan digunakan untuk umpan balik, sehingga mengurangi beberapa kecemasan dan sikap
defensif yang dialami karyawan saat dievaluasi untuk kenaikan gaji dan promosi. Sistem manajemen kinerja di Wachovia Bank dijelaskan
dalam kasus I/O Psychology in Practice dalam bab ini. sehingga mengurangi beberapa kecemasan dan sikap defensif yang dialami
karyawan saat dievaluasi untuk kenaikan gaji dan promosi. Sistem manajemen kinerja di Wachovia Bank dijelaskan dalam kasus I/O
Psychology in Practice dalam bab ini. sehingga mengurangi beberapa kecemasan dan sikap defensif yang dialami karyawan saat
dievaluasi untuk kenaikan gaji dan promosi. Sistem manajemen kinerja di Wachovia Bank dijelaskan dalam kasus I/O Psychology in
Practice dalam bab ini.
Riset
Banyak kegiatan praktik psikolog I/O menyangkut peningkatan prestasi kerja karyawan.
Upaya psikolog I/O dapat diarahkan untuk merancang peralatan yang lebih baik,
mempekerjakan orang yang lebih baik, memotivasi karyawan, dan melatih karyawan.
Data kinerja pekerjaan dapat berfungsi sebagai kriteria yang digunakan untuk
mengevaluasi kegiatan tersebut. Untuk itu, seseorang dapat melakukan penelitian.
Desain umum untuk studi semacam itu melibatkan membandingkan kinerja karyawan
sebelum dan sesudah implementasi program baru yang dirancang untuk
meningkatkannya. Sebuah desain yang lebih baik akan menjadi eksperimen di mana satu
kelompok karyawan menerima prosedur baru, sedangkan kelompok kontrol karyawan
tidak. Kedua kelompok dapat dibandingkan untuk melihat apakah kelompok yang
menerima prosedur baru memiliki kinerja yang lebih baik daripada kelompok kontrol
yang tidak.
KRITERIA KINERJA
Kriteria adalah standar yang dapat digunakan untuk menilai kinerja apa pun, termasuk seseorang. Ini
memungkinkan Anda untuk membedakan kinerja yang baik dari yang buruk. Mencoba menilai
kinerja tanpa kriteria seperti membantu seorang teman menemukan benda yang hilang ketika teman
itu tidak memberitahu Anda apa itu. Anda tidak dapat banyak membantu sampai Anda tahu apa yang
Anda cari. Dengan cara yang sama, Anda tidak dapat secara memadai mengevaluasi kinerja
pekerjaan seseorang sampai Anda mengetahui kinerja yang seharusnya.
Kriteria kinerja 81
Karakteristik Kriteria
Kriteria Nyata versus Teoritis

Kriteria dapat diklasifikasikan sebagai aktual atau teoritis. Kriteria teoretis adalah definisi
kinerja yang baik daripada bagaimana kinerja itu diukur. Dalam terminologi penelitian,
kriteria teoritis adalah konstruksi teoretis. Ini adalah gagasan tentang kinerja yang baik.
NSkriteria sebenarnya adalah cara di mana kriteria teoritis dinilai atau
dioperasionalkan. Ini adalah teknik penilaian kinerja yang digunakan, seperti menghitung
penjualan tenaga penjual.
Tabel 4.1 berisi teori dan kriteria aktual yang sesuai untuk lima pekerjaan yang berbeda. Seperti yang
dapat dilihat, kedua kriteria bisa sangat berbeda untuk beberapa pekerjaan. Bagi yang lain, korespondensi
antara kriteria teoretis dan aktual cukup dekat. Misalnya, untuk tenaga penjual asuransi, kriteria teoretisnya
adalah menjual, dan kriteria sebenarnya adalah jumlah penjualan yang dilakukan orang tersebut. Untuk
seorang seniman, korespondensi tidak sedekat itu. Kriteria teoretis untuk menghasilkan karya seni yang
hebat dicocokkan dengan kriteria sebenarnya untuk meminta pendapat ahli seni tentang karya orang
tersebut. Dalam hal ini, ada ruang untuk subjektifitas tentang siapa yang dianggap sebagai ahli seni dan
tentang penilaian ahli tentang seni yang baik dan tidak baik. Seperti yang diilustrasikan oleh kasus-kasus ini,
kriteria untuk pekerjaan yang berbeda mungkin memerlukan pendekatan penilaian yang sangat berbeda.
Kontaminasi, Defisiensi, dan Relevansi

Kriteria aktual kami dimaksudkan untuk menilai kriteria teoritis yang mendasari minat. Namun,
dalam praktiknya, kriteria aktual kami adalah indikator yang tidak sempurna dari kriteria
kinerja teoretis yang dimaksudkan. Meskipun kriteria aktual mungkin menilai sebagian dari
kriteria teoretis yang dimaksudkan, kemungkinan ada beberapa bagian dari kriteria teoretis
yang ditinggalkan. Di sisi lain, kriteria yang sebenarnya dapat menjadi bias dan dapat menilai
sesuatu selain kriteria teoritis. Jadi, kriteria aktual seringkali hanya memberikan perkiraan
kasar dari kriteria teoretis yang seharusnya dinilai.
Tiga konsep membantu menjelaskan situasi ini: kontaminasi kriteria, kekurangan kriteria, dan
relevansi kriteria. Kontaminasi kriteria mengacu pada bagian dari kriteria aktual yang
mencerminkan sesuatu selain dari apa yang dirancang untuk diukur. Kontaminasi dapat timbul dari
bias dalam kriteria dan dari tidak dapat diandalkan. Bias sering terjadi ketika penilaian dan pendapat
orang digunakan sebagai kriteria yang sebenarnya. Misalnya, menggunakan penilaian ahli seni
sebagai kriteria aktual untuk kualitas karya seni seseorang dapat mengungkapkan sebanyak
mungkin tentang bias para juri seperti halnya tentang karya tersebut.
TABEL 4.1 Contoh Kriteria Teoretis dan Aktual untuk Lima Pekerjaan
Pekerjaan Kriteria Teoretis Kriteria Sebenarnya
Artis Ciptakan karya seni yang Penilaian ahli seni

Penjual asuransi hebat Jual asuransi Penjualan bulanan
petugas toko Memberikan pelayanan yang baik kepada Survei kepuasan pelanggan dengan layanan
Guru pelanggan Memberikan pengetahuan kepada Skor tes prestasi siswa
Peramal cuaca siswa Memprediksi cuaca dengan akurat Bandingkan prediksi dengan cuaca sebenarnya
diri. Karena tidak ada standar objektif untuk kualitas seni, para ahli kemungkinan akan
tidak setuju satu sama lain ketika penilaian mereka adalah kriteria aktual untuk kinerja.
Ketidakandalan dalam kriteria aktual mengacu pada kesalahan dalam pengukuran yang terjadi
setiap kali kita mencoba menilai sesuatu. Seperti yang dibahas dalam Bab 2, kesalahan pengukuran
adalah bagian dari proses pengukuran dan terdiri dari kesalahan acak yang membuat pengukuran
kita tidak akurat. Hal ini tercermin dalam inkonsistensi dalam pengukuran dari waktu ke waktu. Jika
kita menilai kinerja pekerjaan seseorang berulang kali dari waktu ke waktu, ukuran kinerja akan
bervariasi dari pengujian ke pengujian bahkan jika kinerja (kriteria teoretis) tetap konstan. Ini berarti
bahwa ukuran kriteria kinerja aktual kami akan memiliki keandalan yang kurang dari sempurna.
Defisiensi kriteria berarti bahwa kriteria yang sebenarnya tidak cukup mencakup seluruh
kriteria teoritis. Dengan kata lain, kriteria yang sebenarnya adalah representasi yang tidak
lengkap dari apa yang kita coba untuk menilai. Konsep ini disebut dalam Bab 2 sebagai
validitas isi. Misalnya, nilai tes prestasi siswa dalam matematika dapat digunakan sebagai
kriteria kinerja yang sebenarnya untuk guru sekolah dasar. Ini akan menjadi kriteria yang
kurang, karena guru sekolah dasar mengajar lebih dari sekedar matematika. Kriteria yang
kurang memadai adalah nilai siswa pada baterai tes prestasi yang komprehensif, termasuk
matematika, membaca, sains, dan menulis.
Relevansi kriteria adalah sejauh mana kriteria aktual menilai kriteria teoretis yang
dirancang untuk diukur, atau validitas konstruknya (lihat Bab 2). Semakin dekat
korespondensi antara kriteria aktual dan teoritis, semakin besar relevansi kriteria aktual.
Semua kriteria aktual dalam Tabel 4.1 tampaknya memiliki beberapa tingkat relevansi
untuk menilai kriteria teoretis yang dimaksudkan. Kriteria teoretis bisa sangat abstrak,
seperti menghasilkan karya seni yang hebat; oleh karena itu, mungkin sulit untuk
menentukan relevansi suatu kriteria. Seperti halnya validitas perangkat penilaian apa
pun, relevansi menyangkut kesimpulan dan interpretasi yang dibuat tentang makna
pengukuran kinerja kami.
Kontaminasi kriteria, defisiensi, dan relevansi diilustrasikan pada Gambar 4.1.
Kriteria aktual diwakili dalam gambar oleh lingkaran bawah, dan kriteria teoritis diwakili
oleh lingkaran atas. Tumpang tindih antara dua lingkaran (area yang diarsir) mewakili
sejauh mana kriteria aktual menilai teoritis, yang
Kriteria Teoretis
Kekurangan
Relevansi Gambar 4.1 Kontaminasi kriteria, relevansi, dan defisiensi. NS

lingkaran bawah mewakili kriteria aktual, dan lingkaran atas mewakili kriteria
teoretis. Kontaminasi adalah bagian dari kriteria yang sebenarnya (daerah
Kontaminasi yang tidak diarsir) yang tidak tumpang tindih dengan kriteria teoritis.
Kekurangan adalah bagian dari kriteria teoritis yang tidak tumpang tindih
dengan kriteria yang sebenarnya (daerah yang tidak diarsir). Relevansi
diwakili oleh tumpang tindih antara kriteria aktual dan teoritis (area yang
Kriteria Sebenarnya diarsir lebih gelap).
Kriteria kinerja 83
adalah relevansi kriteria. Bagian lingkaran bawah yang tidak tumpang tindih dengan kriteria teoritis
(area yang tidak diarsir) adalah kontaminasi karena kriteria sebenarnya menilai sesuatu yang lain,
yaitu kesalahan pengukuran. Bagian dari lingkaran atas yang tidak tumpang tindih dengan bagian
bawah (daerah yang tidak diarsir) adalah kekurangan kriteria karena bagian dari kriteria teoritis tidak
dinilai.
Tingkat Spesifisitas
Sebagian besar pekerjaan bersifat kompleks dan melibatkan banyak fungsi dan tugas yang berbeda. Kriteria
kinerja pekerjaan dapat dikembangkan untuk tugas individu atau untuk seluruh pekerjaan. Untuk beberapa
tujuan, mungkin lebih baik untuk menilai kinerja pada tugas individu, seperti melakukan penangkapan untuk
seorang petugas polisi atau menjual produk untuk seorang wiraniaga, sedangkan untuk tujuan lain kinerja
pekerjaan seluruh orang itu menarik. Untuk mengembangkan keterampilan karyawan, lebih baik fokus pada
tingkat tugas individu sehingga umpan balik bisa spesifik. Orang tersebut mungkin diberi tahu bahwa dia
mengetik terlalu lambat atau membuat terlalu banyak kesalahan. Umpan balik khusus semacam ini dapat
membantu karyawan yang ingin meningkatkan kinerja.
Untuk tujuan administrasi eh. NS
orang yang mendapat promosi terbaik.
Dibutuhkan pengamatan yang cermat untuk melihat seberapa baik seorang karyawan melakukan pekerjaan. (Arvind Garg/Foto
Peneliti)
Metode tertentu yang digunakan untuk menilai kinerja harus didasarkan pada tujuan
informasi penilaian.
Kompleksitas Kriteria
Karena sebagian besar pekerjaan melibatkan banyak tugas dan sebagian besar tugas dapat
dievaluasi dari beberapa perspektif, kriteria dapat menjadi sangat kompleks. Kinerja pekerjaan
bahkan pada satu tugas biasanya dapat dinilai sepanjang dimensi kualitas (seberapa baik orang
tersebut melakukan tugas) dan dimensi kuantitas (seberapa banyak atau seberapa cepat orang
tersebut melakukan tugas). Kompleksitas kinerja pekerjaan berarti bahwa beberapa ukuran kriteria
diperlukan untuk menilai kinerja secara memadai. Ini mungkin hanya melibatkan kualitas, hanya
kuantitas, atau keduanya. Itu bisa pada tingkat kekhususan tugas tunggal atau pada tingkat seluruh
pekerjaan orang tersebut. Sifat pekerjaan dan tujuan informasi penilaian menentukan sifat kriteria
yang digunakan, serta tingkat kekhususannya.
Sifat beberapa pekerjaan mengharuskan kualitas menjadi fokus utama, sedangkan untuk
yang lain kuantitas mungkin menjadi prioritas. Dalam atletik, terkadang satu atau yang lain
berfungsi sebagai kriteria untuk memenangkan kompetisi. Dalam senam, kualitas adalah
kriteria yang digunakan. Juri menilai kinerja setiap pesenam sepanjang dimensi kualitas, dan
orang dengan skor tertinggi menang. Dalam acara lintasan dan lapangan, kriterianya
berkaitan dengan kuantitas—melompat terjauh, melompat paling tinggi, berlari paling cepat,
atau melempar terjauh. Kualitas bentuk lompat atau gaya lari tidak relevan, sehingga tidak ada
juri yang menilai performa dalam acara ini. Dengan pekerjaan, bisa ada penekanan pada
kualitas atau kuantitas, seringkali tergantung pada sifat tugas yang terlibat. Untuk pekerjaan
penjualan, penekanan biasanya pada kuantitas penjualan,
Ada banyak kemungkinan kriteria lain di luar kualitas dan kuantitas pekerjaan. Tabel 4.2
berisi formulir penilaian kinerja yang memiliki delapan kriteria umum yang relevan dengan
banyak pekerjaan. Misalnya, mempertahankan penampilan profesional di tempat kerja adalah
relevan ketika citra publik penting. Banyak organisasi mengharapkan karyawan yang bertemu
publik untuk menampilkan citra tertentu. Ini mungkin melibatkan aturan berpakaian yang
menentukan jenis pakaian yang sesuai untuk bekerja, seperti setelan bisnis. Pabrik bisa
TABEL 4.2 Contoh Formulir Penilaian KinerjaDengan Delapan Dimensi Kriteria
Kategori Peringkat
Dimensi Miskin Adil Memadai Bagus Luar biasa
Kehadiran ______ ______ ______ ______ ______

Berkomunikasi dengan orang ______ ______ ______ ______ ______
lain Mengikuti petunjuk ______ ______ ______ ______ ______
Menginstruksikan orang lain ______ ______ ______ ______ ______
Memotivasi orang lain ______ ______ ______ ______ ______
Penampilan profesional ______ ______ ______ ______ ______
Kualitas kerja ______ ______ ______ ______ ______
Kuantitas kerja ______ ______ ______ ______ ______
Kriteria kinerja 85
memiliki aturan berpakaian yang tidak memperhatikan citra publik tetapi dengan keselamatan. Dasi
sering kali dilarang karena dapat tersangkut di mesin, yang mengakibatkan kecelakaan dan cedera
serius.
Ada dua cara untuk menangani sifat kriteria yang kompleks. NSpendekatan kriteria
komposit melibatkan menggabungkan kriteria individu menjadi skor tunggal. Jika karyawan
menerima nomor untuk mewakili kinerja pada masing-masing empat dimensi, komposit akan
menjadi rata-rata skor empat dimensi untuk setiap karyawan. Jika seseorang menerima skor
kinerja berikut pada skala 1-ke-5:
Kehadiran = 5 Kualitas kerja = 4

Penampilan profesional = 4 Kuantitas kerja = 5
skor kinerja gabungannya akan menjadi rata-rata skor dimensi, atau

4,5, dihitung sebagai (5 + 4 + 4 + 5)/4. Sebuah nilai rata-rata akan menjadi skor gabungan
untuk kinerja sekolah. NSpendekatan multidimensi tidak menggabungkan ukuran kriteria
individu. Dalam contoh sebelumnya, akan ada empat skor per karyawan.
Pendekatan komposit lebih disukai untuk membandingkan kinerja individu karyawan.
Lebih mudah untuk membandingkan karyawan ketika masing-masing memiliki skor kinerja
tunggal. Pendekatan multidimensi lebih disukai ketika umpan balik diberikan kepada
karyawan. Ini memberikan informasi spesifik tentang berbagai dimensi kinerja daripada
umpan balik umum tentang kinerja secara keseluruhan.
Kriteria Dinamis
Kriteria biasanya dianggap sebagai standar konstan atau statis dimana kinerja karyawan dapat
dinilai. Beberapa psikolog I/O percaya, bagaimanapun, bahwa kinerja pekerjaan itu sendiri
adalah variabel dari waktu ke waktu. Ini berarti bahwa pekerja terbaik dalam pekerjaan pada
satu titik waktu tidak akan menjadi yang terbaik pada titik waktu lain. Variabilitas kinerja
membuat penilaian menjadi sulit karena kinerja tidak akan sama sepanjang periode waktu
yang diukur. Jika seseorang berkinerja baik untuk sebagian tahun dan tidak baik untuk bagian
lain, bagaimana kinerjanya harus dinilai?
Variabilitas kinerja dari waktu ke waktu disebut sebagai kriteria dinamis, meskipun itu
adalah kinerja dan bukan standar yang berubah. Ide kriteria dinamis telah menghasilkan
beberapa kontroversi di antara psikolog I/O, dengan beberapa percaya kinerja stabil dan yang
lain menyarankan tidak (Schmitt & Chan, 1998). Di satu sisi, Deadrick dan Madigan (1990)
memberikan data untuk operator mesin jahit di sebuah pabrik pakaian yang menunjukkan
kinerja yang stabil selama periode waktu yang singkat (minggu) tetapi tidak terlalu konsisten
dalam jangka waktu yang lama (bulan). Di sisi lain, Vinchur, Schippmann, Smalley, dan Rothe
(1991) menemukan bahwa kinerja pekerjaan karyawan manufaktur cukup stabil selama
rentang waktu 5 tahun. Deadrick, Bennett, dan Russell
(1997) menunjukkan bahwa kinerja karyawan cenderung meningkat dari waktu ke waktu, setidaknya
di awal masa kerja karyawan, dan bahwa faktor-faktor yang menentukan kinerja karyawan baru tidak
harus sama dengan yang menentukan peningkatan kinerja di kemudian hari. Jadi, melihat kinerja
orang dari waktu ke waktu akan menunjukkan bahwa kinerjanya bervariasi dan bahwa yang
berkinerja terbaik belum tentu tetap berkinerja terbaik dalam jangka panjang.
Kinerja Kontekstual
Kriteria untuk sebagian besar pekerjaan menyangkut tugas-tugas yang secara khusus diperlukan dan
tentu saja tercantum dalam analisis pekerjaan dari pekerjaan itu. Namun, telah diakui bahwa
karyawan melakukan lebih banyak untuk organisasi daripada yang diperlukan, dan perilaku ekstra ini
penting agar organisasi berfungsi dengan lancar.Kinerja kontekstual terdiri dari hal-hal sukarela
ekstra yang dilakukan karyawan untuk memberi manfaat bagi rekan kerja dan organisasi mereka,
seperti menjadi sukarelawan untuk melaksanakan tugas ekstra atau membantu rekan kerja (Borman,
Buck, Hanson, Motowidlo, Stark, & Drasgow, 2001). Meskipun tidak secara khusus diperlukan, kinerja
kontekstual diperhatikan dan dihargai oleh para manajer, dan penilaian mereka terhadap kinerja
bawahan akan terpengaruh olehnya (Johnson, 2001). Ini semua menunjukkan bahwa kinerja
kontekstual harus dipertimbangkan dalam mengembangkan kriteria untuk pekerjaan. Kami akan
kembali ke masalah kinerja kontekstual di Bab 10 ketika kita membahas perilaku kewargaan
organisasional.
METODE UNTUK MENILAI KINERJA PEKERJAAN

Kinerja pekerjaan individu dapat dinilai dengan banyak cara. Prosedur yang paling umum
dapat dibagi menjadi dua kategori—ukuran kinerja objektif dan penilaian subjektif.Langkah-
langkah objektif adalah jumlah dari berbagai perilaku (misalnya, jumlah hari tidak masuk kerja)
atau hasil dari perilaku kerja (misalnya, total penjualan bulanan). Langkah-langkah subjektif
adalah penilaian oleh orang-orang yang seharusnya memiliki pengetahuan tentang kinerja
pekerjaan orang tersebut. Biasanya supervisor memberikan peringkat kinerja pekerjaan
bawahannya. Kedua jenis ukuran dapat berguna, tetapi penelitian telah menunjukkan bahwa
ketika keduanya digunakan untuk karyawan yang sama, mereka tidak selalu setuju pada
tingkat kinerja (Sundvik & Lindeman, 1998, lihat Penelitian Internasional), menunjukkan bahwa
mereka mungkin mencerminkan perbedaan aspek prestasi kerja. Baik ukuran objektif maupun
subjektif akan disajikan dalam pembahasan berikut.
PENELITIAN INTERNASIONAL
Isu penting dalam penilaian kinerja menyangkut sangat baik (5). Karena sifat setiap ukuran berbeda, masing-
keakuratan peringkat supervisor. Dalam studi ini, para masing distandarisasi menjadi rata-rata nol dan standar
peneliti tidak hanya menyediakan peringkat supervisor deviasi 1. Jadi, seorang tenaga penjualan dengan
tetapi juga data tentang kinerja objektif yang dapat produktivitas rata-rata harus memiliki skor nol, dan
digunakan untuk membandingkannya. peringkat supervisornya juga diharapkan menjadi nol.
Penelitian ini dilakukan di Finlandia pada sebuah Dengan membandingkan skor untuk setiap tenaga penjual,
perusahaan milik negara yang menyediakan jasa perbankan para peneliti dapat menentukan apakah penyelia itu
dan transportasi. Partisipan adalah 208 supervisor yang secara meremehkan, menilai berlebihan, atau secara akurat
bersama-sama menilai kinerja 268 tenaga penjual wanita. Untuk menilai tenaga penjual tersebut.
setiap tenaga penjualan, data dikumpulkan tentang Hasilnya menemukan bahwa kira-kira sepertiga dari peringkat
produktivitas penjualan aktual selama tahun sebelumnya. Selain jatuh ke dalam masing-masing kategori akurasi, meskipun ada sedikit
itu, setiap tenaga penjual dinilai oleh supervisornya pada skala lebih banyak penilaian daripada penilaian yang diremehkan. Ini
penilaian lima poin mulai dari buruk (1) seharusnya tidak mengejutkan karena kelonggaran peringkat
Metode untuk Menilai Prestasi Kerja 87
cukup umum. Supervisor memiliki kecenderungan untuk hasil—penjualan. Dalam kasus di mana tidak ada standar
melebih-lebihkan karyawan yang paling mereka kenal, mungkin seperti itu, kita mungkin mengharapkan akurasi lebih
menunjukkan ada beberapa favoritisme yang diungkapkan menderita. Selanjutnya, peringkat di sini dilakukan semata-
kepada bawahan yang telah mengembangkan hubungan kerja mata untuk tujuan penelitian dan cenderung lebih akurat
yang baik dengan supervisor mereka. Selanjutnya, mereka daripada peringkat yang dilakukan untuk tujuan
menemukan bahwa supervisor wanita memberikan penilaian administratif, di mana bawahan mungkin menderita
yang lebih akurat daripada supervisor pria. konsekuensi kurang dari evaluasi yang luar biasa.
Temuan ini menunjukkan bahwa sebagian besar
penilaian kinerja tidak akurat bila dibandingkan dengan Sumber: Dari “Akurasi Peringkat Kinerja: Konvergensi Antara
kinerja objektif dan bahwa hubungan yang dimiliki Penilaian Supervisor dan Produktivitas Penjualan,” oleh
L. Sundvik dan M. Lindeman, (1998), Jurnal Internasional Seleksi
seorang supervisor dengan bawahan mempengaruhi
dan Penilaian, 6, 9–15.
penilaian. Namun, harus diingat bahwa ini adalah kasus
di mana kinerja memiliki tujuan dan dapat diukur
Ukuran Objektif Kinerja Pekerjaan

Organisasi melacak banyak perilaku karyawan dan hasil perilaku. Departemen sumber daya
manusia mencatat jumlah ketidakhadiran, kecelakaan, insiden, dan keterlambatan untuk
setiap karyawan. Beberapa organisasi juga melacak produktivitas setiap karyawan. Data
produktivitas harus dikumpulkan jika organisasi memiliki sistem insentif yang membayar
karyawan untuk apa yang mereka hasilkan, seperti komisi atau upah per satuan.
Lima ukuran tujuan umum kinerja pekerjaan tercantum dalam Tabel 4.3. Masing-
masing adalah hitungan objektif dari jumlah perilaku atau jumlah pekerjaan yang
dihasilkan. Data tersebut biasanya ditemukan dalam catatan organisasi, tetapi mereka
dapat dikumpulkan secara khusus untuk menilai kinerja. Dua dari ukuran tersebut
berkaitan dengan kehadiran—berapa kali absen dan berapa kali terlambat masuk kerja.
Kecelakaan mencakup baik otomotif maupun non-otomotif, seperti terluka oleh mesin di
pabrik. Insiden adalah berapa kali individu terlibat dalam insiden kerja yang dianggap
penting untuk pekerjaan tertentu. Misalnya, dalam laporan insiden fasilitas rawat inap
psikiatri mencatat berapa kali seorang staf diserang oleh seorang pasien. Bagi seorang
polisi, laporan insiden penembakan menjadi bagian dari catatan karyawan.
Ukuran kehadiran berlaku untuk sebagian besar pekerjaan karena sebagian besar
memiliki jam kerja terjadwal. Untuk pekerjaan yang tidak terstruktur dalam hal jadwal
kerja (misalnya, profesor perguruan tinggi), kehadiran bukanlah kriteria untuk kinerja
pekerjaan. Tiga ukuran objektif lainnya khusus untuk pekerjaan tertentu. Misalnya jenis
TABEL 4.3 Contoh Ukuran Objektif Prestasi Kerja
Pertunjukan Ukuran
Absen Hari absen per tahun Jumlah

Kecelakaan kecelakaan per tahun Jumlah
Insiden di tempat kerja (misalnya, penyerangan) insiden per tahun Hari terlambat
Keterlambatan per tahun
Produktivitas (misalnya, penjualan) Jumlah penjualan dolar
TABEL 4.4 Contoh Ukuran Produktivitas Objektif untuk Beberapa Pekerjaan
Pekerjaan Ukuran
Pekerja lini perakitan Jumlah unit yang

Profesor perguruan tinggi diproduksi Jumlah publikasi
Pengacara Jumlah kasus yang dimenangkan
Pramuniaga Jumlah penjualan
Ahli bedah Jumlah operasi yang dilakukan
insiden yang direkam adalah fungsi dari alam dari pekerjaan dan lingkungan kerja. Catatan
insiden penyerangan oleh siswa mungkin disimpan untuk guru sekolah umum perkotaan, tetapi
mereka tidak mungkin disimpan untuk profesor perguruan tinggi. Guru relatif sering diserang di
kota-kota besar Amerika, tetapi profesor perguruan tinggi jarang menjadi sasaran kekerasan. Ukuran
produktivitas yang dipilih harus sesuai dengan sifat pekerjaan yang dilakukan. Ukuran produktivitas
khusus untuk beberapa pekerjaan umum tercantum dalam Tabel 4.4. Seperti yang Anda lihat, sifat
produktivitas bisa sangat berbeda dari satu pekerjaan ke pekerjaan lain. Hal ini membuat sulit untuk
membandingkan kinerja orang-orang yang memegang pekerjaan yang berbeda.
Menggunakan ukuran objektif untuk menilai prestasi kerja memiliki beberapa keuntungan.
Pertama, dapat dengan mudah menginterpretasikan arti ukuran objektif dalam kaitannya dengan
kriteria prestasi kerja. Sebagai contoh, jelas bahwa tidak ada absen dalam satu tahun terakhir
merupakan indikator yang baik dari kehadiran yang memuaskan dan bahwa empat kecelakaan lalu
lintas terkait pekerjaan dalam 6 bulan sebelumnya merupakan indikator kinerja mengemudi yang
tidak memuaskan. Kedua, sifat kuantitatif dari ukuran objektif memudahkan untuk membandingkan
kinerja pekerjaan dari individu yang berbeda dalam pekerjaan yang sama. Untuk ukuran kehadiran,
perbandingan dapat dibuat dari individu di berbagai pekerjaan selama mereka semua
mengharuskan orang tersebut bekerja pada jadwal tertentu. Ketiga, ukuran objektif dapat dikaitkan
langsung dengan tujuan organisasi, seperti membuat produk atau menyediakan layanan. Akhirnya,
ukuran objektif sering dapat ditemukan dalam catatan organisasi, sehingga sistem penilaian kinerja
khusus tidak harus dimulai. Data ini sering dikumpulkan dan disimpan, seringkali di komputer, untuk
alasan selain penilaian kinerja karyawan, membuat penilaian kinerja menjadi tugas yang relatif
mudah untuk diselesaikan.
Sayangnya, ukuran kinerja objektif juga memiliki beberapa keterbatasan. Banyak dari
ukuran objektif tidak sesuai untuk semua pekerjaan. Ketika pekerjaan tidak melibatkan
keluaran yang dapat dihitung, produktivitas bukanlah ukuran kinerja yang layak. Juga, tidak
selalu jelas berapa angka yang dianggap kinerja memuaskan. Misalnya, berapa banyak absen
per tahun harus dianggap kinerja yang baik? Data yang diambil dari catatan dapat
terkontaminasi dan tidak akurat. Terkadang perilaku dan produktivitas dikaitkan dengan orang
yang salah atau tidak pernah dicatat. Orang juga dapat mendistorsi catatan dengan
menghilangkan insiden buruk bagi individu yang disukai, dan karyawan mungkin gagal
melaporkan kecelakaan dan cedera.
Ukuran objektif sering kali tidak memadai sebagai indikator kriteria kinerja pekerjaan. Mereka
cenderung fokus pada perilaku tertentu, yang mungkin hanya menjadi bagian dari kriteria, dan
mereka mungkin mengabaikan bagian yang sama pentingnya (Borman, Bryant, & Dorio, 2010).
Ukuran produktivitas berfokus pada kuantitas kerja daripada kualitas. Meskipun kuantitas mungkin
lebih penting dalam beberapa pekerjaan, sulit untuk membayangkan pekerjaan di mana kualitas juga
tidak terlalu penting. Akhirnya, apa yang tercermin dalam ukuran objektif belum tentu
di bawah kendali individu yang dinilai (Borman et al., 2010). Perbedaan produktivitas pekerja pabrik
dapat disebabkan oleh perbedaan mesin yang mereka gunakan, dan perbedaan kinerja penjualan
tenaga penjualan dapat disebabkan oleh perbedaan wilayah penjualan. Seseorang yang diserang di
tempat kerja mungkin tidak melakukan kesalahan apa pun dan mungkin tidak dapat menghindari
insiden tersebut. Seorang petugas polisi yang menggunakan senjatanya mungkin terpaksa
melakukannya karena keadaan dan bukan karena kinerjanya yang buruk. Dalam menggunakan
ukuran objektif untuk menilai individu, faktor-faktor lain ini harus diperhitungkan.
Ukuran Subyektif Kinerja Pekerjaan

Ukuran subjektif adalah cara yang paling sering digunakan untuk menilai prestasi kerja karyawan.
Sebagian besar organisasi mengharuskan supervisor melengkapi formulir penilaian penilaian kinerja
pada masing-masing bawahan mereka setiap tahun. Ada banyak jenis formulir penilaian yang
digunakan berbagai organisasi untuk menilai kinerja karyawan mereka. Pada bagian ini, kita
membahas beberapa jenis yang berbeda.
Formulir Penilaian Grafis

Jenis ukuran subjektif yang paling populer adalah formulir peringkat grafik, yang digunakan untuk
menilai individu pada beberapa dimensi kinerja. Bentuk penilaian grafis berfokus pada karakteristik
atau ciri orang atau kinerja orang tersebut. Misalnya, sebagian besar formulir meminta peringkat
kualitas dan kuantitas pekerjaan. Banyak yang mencakup sifat-sifat pribadi seperti penampilan, sikap,
ketergantungan, dan motivasi.
Bentuk penilaian grafik, diilustrasikan pada Tabel 4.2, terdiri dari skala multipoint
dan beberapa dimensi. Skala mewakili kontinum kinerja dari rendah ke tinggi dan
biasanya berisi empat hingga tujuh nilai. Skala dalam tabel berisi lima poin skala, mulai
dari "buruk" hingga "luar biasa", dengan "memadai" di tengahnya. Formulir tersebut juga
berisi beberapa dimensi kinerja pekerjaan yang menjadi dasar penilaian karyawan.
Formulir ini mencakup kehadiran dan kualitas kerja. Untuk menggunakan formulir,
supervisor memeriksa peringkatnya untuk setiap dimensi.
Formulir Penilaian Berfokus pada Perilaku

Bentuk penilaian grafis baru saja membahas fokus pada dimensi yang berorientasi pada sifat, seperti
ketergantungan, atau pada aspek umum kinerja, seperti kehadiran. Bentuk-bentuk yang berfokus
pada perilaku berkonsentrasi pada perilaku yang telah dilakukan atau diharapkan dilakukan oleh
orang tersebut. Perilaku dipilih untuk mewakili tingkat kinerja yang berbeda. Untuk kehadiran,
contoh perilaku yang baik adalah “dapat diandalkan untuk berada di tempat kerja setiap hari tepat
waktu”, sedangkan perilaku yang buruk adalah “datang lembur beberapa kali dalam seminggu”.
Tugas penilai adalah menunjukkan perilaku mana yang merupakan karakteristik dari orang yang
dinilai. Cara penilaian formulir tergantung pada jenis formulir tertentu.
Ada beberapa jenis formulir penilaian yang berfokus pada perilaku. Kami akan membahas tiga
di antaranya:
Skala Penilaian Berlabuh Secara Perilaku (Smith & Kendall, 1963)

Skala Standar Campuran (Blanz & Ghiselli, 1972)
Skala Pengamatan Perilaku (Latham & Wexley, 1977)
Keterampilan organisasi: Urutan konstruksi materi yang baik meluncur dengan

lancar dari satu topik ke topik lainnya; desain tentu saja mengoptimalkan minat;
siswa dapat dengan mudah mengikuti strategi organisasi; kursus
garis besar diikuti.
10
Mengikuti silabus kursus; Instruktur ini dapat diharapkan
menyajikan kuliah dalam untuk mengasimilasi kuliah
urutan logis; mengikat setiap 9 sebelumnya ke kuliah sekarang
kuliah ke yang sebelumnya. sebelumnya
memulai kuliah.
8
Instruktur ini diharapkan

7 untuk mengumumkan di akhir
setiap kuliah materi yang akan
6 dibahas selama periode

Mempersiapkan kursus kelas berikutnya.
silabus tetapi hanya
mengikutinya sesekali; hadiah 5
kuliah tanpa urutan tertentu,
meskipun mengikat mereka
4 Instruktur ini bisa diharapkan
bersama-sama.
untuk teralihkan setidaknya
sekali seminggu dalam kuliah
3 dan tidak mencakup materi yang
dimaksudkan.
Tidak menggunakan silabus 2 Instruktur ini dapat

mata kuliah; kuliah tentang diharapkan untuk memberi
topik secara acak tanpa kuliah banyak waktu tentang
urutan logis. 1 mata pelajaran selain mata
pelajaran yang seharusnya dia
ajarkan.
Gambar 4.2 Contoh BARS untuk profesor perguruan tinggi. DariPenilaian Kinerja: Menilai
Perilaku Manusia di Tempat Kerja , oleh HJ Bernardin dan RW Beatty, 1984, Boston, MA: Kent. Dicetak ulang dengan
izin.
Ketiga skala ini memberikan deskripsi perilaku atau kinerja daripada sifat, tetapi
mereka berbeda dalam cara mereka menyajikan deskripsi dan/atau tanggapan.
NS Skala Peringkat Berlabuh Perilaku (BARS) adalah skala penilaian di mana
pilihan respons didefinisikan dalam istilah perilaku. Contoh untuk pekerjaan profesor
perguruan tinggi ditunjukkan pada Gambar 4.2. Skala ini dirancang untuk menilai kinerja
pada dimensi Keterampilan Organisasi di Kelas. Penilai memilih perilaku yang paling
mendekati untuk menggambarkan kinerja orang yang bersangkutan. Perilaku diurutkan
dari bawah ke atas pada skala sepanjang kontinum efektivitas kinerja.
Formulir evaluasi kinerja BARS berisi beberapa skala individu, masing-masing dirancang untuk
menilai dimensi penting dari kinerja pekerjaan. BARS dapat digunakan untuk menilai dimensi yang
sama dengan formulir penilaian grafik. Perbedaan utama adalah bahwa BARS menggunakan pilihan
respons yang mewakili perilaku, sedangkan formulir penilaian grafik meminta peringkat seberapa
baik kinerja orang tersebut di sepanjang dimensi yang bersangkutan. Dengan demikian kedua jenis
formulir penilaian dapat digunakan untuk menilai dimensi kinerja yang sama untuk pekerjaan yang
sama.
NS Skala Standar Campuran (MSS) menyediakan penilai dengan daftar perilaku yang bervariasi dalam
keefektifannya. Untuk setiap pernyataan, penilai diminta untuk menunjukkan jika:
1. Yang dinilai lebih baik dari pernyataan
2. Pernyataan itu sesuai dengan yang menilai
3. Nilainya lebih buruk dari pernyataan
Ada beberapa dimensi kinerja dalam MSS, dan setiap dimensi memiliki beberapa perilaku
yang terkait dengannya. Contoh tiga pernyataan yang mencerminkan kinerja untuk dimensi
Hubungan dengan Orang Lain ditunjukkan pada Tabel 4.5. Tiga pernyataan mewakili kinerja
pekerjaan yang baik, memuaskan, dan buruk di sepanjang dimensi.
Dalam MSS, pernyataan untuk berbagai dimensi disajikan dalam urutan acak. Penilai tidak
diberitahu dimensi spesifik yang terkait dengan setiap perilaku, meskipun sifat dari perilaku tersebut
jelas. Ide asli dari Blanz dan Ghiselli (1972) adalah bahwa urutan penyajian pernyataan yang beragam
akan membuat penilai lebih sulit untuk membiaskan peringkat mereka daripada yang benar dari
jenis bentuk peringkat lainnya. Ketika Dickinson dan Glebocki (1990) membandingkan tanggapan
terhadap urutan campuran dan urutan (berdasarkan dimensi), mereka menemukan bahwa subjek
merespons dengan cara yang sama dalam penilaian mereka dengan kedua urutan. Dengan
demikian, tampaknya tidak masalah jika dimensinya diidentifikasi atau jika pernyataannya
dicampuradukkan.
NS Skala Pengamatan Perilaku (BOS) berisi item yang didasarkan pada insiden kritis,
membuatnya agak seperti MSS. Akejadian kritis (Flanagan, 1954) adalah peristiwa yang
mencerminkan perilaku efektif atau tidak efektif oleh seorang karyawan. Contoh insiden yang
buruk bagi seorang guru adalah “menampar seorang anak yang membuat komentar yang
tidak sopan.” Dengan BOS, penilai diminta untuk menunjukkan untuk setiap item jumlah waktu
karyawan terlibat dalam perilaku itu. Pengembang skala merekomendasikan untuk memiliki
TABEL 4.5 Tiga Item untuk SPM untuk Menilai Dimensi Hubungan Dengan Orang Lain
Penampilan yang bagus

Berhubungan baik dengan semua orang. Bisa bergaul dengan orang-orang bahkan ketika dia tidak setuju
dengan mereka.
Performa Memuaskan
Bisa bergaul dengan kebanyakan orang. Hanya kadang-kadang dia memiliki konflik dengan orang
lain di tempat kerja, dan ini kemungkinan kecil.
Penampilan buruk
Memiliki kecenderungan untuk terlibat dalam konflik yang tidak perlu dengan orang lain.
Catatan: Setiap item dinilai pada skala berikut: Untuk setiap item pada skala, tunjukkan apakah karyawan tersebut:
Lebih baik dari barangnya
Sebagus barangnya Lebih
buruk dari barangnya
Sumber: Dari “Skala Standar Campuran: Sistem Peringkat Baru,” oleh F. Blanz dan EE Ghiselli (1972),
Psikologi Personalia, 25, 185–199.
penilai menunjukkan persentase waktu karyawan melakukan setiap perilaku dengan

menggunakan opsi persentase berikut:
0% hingga 64%
65% sampai 74%
75% hingga 84%
85% hingga 94%
95% hingga 100%
Skala ini berbeda dari SPM karena penilai menunjukkan frekuensi daripada membandingkan
perilaku karyawan dengan item tersebut. Secara teori, ini harus menunjukkan seberapa sering
karyawan terlibat dalam perilaku yang relevan dengan kinerja.
Penggunaan peringkat frekuensi telah dikritik oleh Kane dan Bernardin (1982). Mereka
menunjukkan bahwa frekuensi perilaku bukanlah indikator kinerja yang baik karena frekuensi yang
diberikan mungkin mencerminkan kinerja yang baik untuk satu perilaku dan kinerja yang buruk
untuk yang lain. Mereka memberikan contoh dua perilaku bagi petugas polisi. Sebuah 85% sampai
94% frekuensi kejadian akan luar biasa untuk mendapatkan surat perintah penangkapan tetapi buruk
untuk dibenarkan dalam penggunaan kekuatan mematikan. Jadi pertimbangan yang cukup dapat
diperlukan dalam menafsirkan arti peringkat frekuensi dengan BOS. Tentu saja, penilaian diperlukan
dalam menafsirkan banyak ukuran kinerja pekerjaan.
Pengembangan Bentuk Berfokus pada Perilaku

Pengembangan bentuk yang berfokus pada perilaku membutuhkan upaya yang cukup besar dari beberapa orang
dalam suatu organisasi. Karena formulir seperti itu berfokus pada perilaku tertentu, ia harus dikembangkan untuk
pekerjaan atau keluarga pekerjaan tertentu. Prosesnya melibatkan empat langkah dan bisa memakan waktu lama
untuk diselesaikan. Masing-masing dari empat langkah tercantum dalam Tabel 4.6.
Langkah 1 adalah analisis pekerjaan yang mengidentifikasi dimensi kinerja tertentu, seperti melakukan
penangkapan dan menulis laporan untuk petugas polisi. Langkah 2 melibatkan penulisan deskripsi perilaku
yang bervariasi dalam keefektifan atau ketidakefektifannya dalam pekerjaan. Hal ini dapat dilakukan dengan
mengumpulkan insiden kritis dari orang-orang yang memiliki pengetahuan tentang pekerjaan yang
bersangkutan, seperti karyawan yang melakukan pekerjaan atau supervisor mereka. Insiden kritis dapat
memberikan contoh yang bervariasi dari kinerja yang sangat efektif hingga yang sangat tidak efektif.
Langkah 3 melibatkan memiliki hakim (orang berpengetahuan) mengurutkan deskripsi perilaku

ke dalam dimensi untuk memverifikasi bahwa deskripsi mencerminkan dimensi yang dimaksudkan.
Langkah terakhir adalah meminta hakim menilai deskripsi perilaku sepanjang kontinum efektivitas.
Dengan BARS, peringkat ini memungkinkan penempatan deskripsi bersama
TABEL 4.6 Empat Langkah dalam Mengembangkan Formulir Penilaian Berfokus pada Perilaku untuk Menilai
Prestasi Kerja
Langkah 1: Lakukan analisis pekerjaan untuk menentukan dimensi pekerjaan
Langkah 2: Kembangkan deskripsi kinerja pekerjaan yang efektif dan tidak efektif dari insiden kritis Langkah 3:
Minta hakim yang berpengetahuan menempatkan deskripsi ke dalam dimensi pekerjaan
Langkah 4: Minta juri yang berpengetahuan untuk menilai efektivitas deskripsi
skala untuk setiap dimensi, seperti pada Gambar 4.2. Dengan MSS, peringkat digunakan untuk
menempatkan pernyataan ke dalam tiga kategori baik, memuaskan, dan buruk.
Proses Kognitif yang Mendasari Peringkat

Pengembangan metode penilaian kinerja yang baik mengharuskan kita memahami proses kognitif yang
memengaruhi perilaku penilaian. Psikolog I/O telah mempelajari proses ini dan telah merancang beberapa
model untuk menjelaskan peringkat. Beberapa model ini berfokus pada bagaimana orang memanfaatkan
informasi untuk membuat penilaian. Yang lain prihatin dengan bagaimana pandangan orang tentang kinerja
mempengaruhi evaluasi mereka terhadap seorang karyawan.
Model Proses Penilaian

Ada beberapa model bersaing dari proses kognitif yang mempengaruhi penilaian kinerja
(misalnya, DeNisi, Cafferty, & Meglino, 1984; Feldman, 1981). Model-model ini
menunjukkan bahwa proses penilaian melibatkan beberapa langkah (lihat Ilgen, Barnes-
Farrell, & McKellin, 1993), termasuk:
Mengamati kinerja
Menyimpan informasi tentang kinerja
Mengambil informasi tentang kinerja dari memori
Menerjemahkan informasi yang diambil ke dalam peringkat
Prosesnya dimulai dengan pengamatan karyawan oleh supervisor. Selanjutnya,

pengamatan kinerja disimpan dalam memori supervisor. Ketika diminta untuk menilai kinerja,
supervisor harus mengambil informasi tentang karyawan dari ingatannya. Informasi tersebut
kemudian digunakan dalam beberapa cara untuk memutuskan peringkat kinerja apa yang
akan diberikan untuk setiap dimensi kinerja pekerjaan.
Berbagai model menggambarkan bagaimana manusia memproses informasi pada setiap langkah. Satu ide
adalah bahwa orang menggunakanskema (kategori atau kerangka acuan) untuk membantu menafsirkan dan
mengatur pengalaman mereka (Borman, 1987). Mungkin skema yang paling terkenal adalah
stereotip—keyakinan tentang karakteristik anggota kelompok. Karakteristik tersebut dapat
menguntungkan atau tidak menguntungkan. Misalnya, satu stereotip mungkin bahwa manajer
sektor swasta adalah pekerja keras.
Jenis skema lainnya adalah prototipe, yang merupakan model dari beberapa karakteristik atau
tipe orang. Orang mungkin menganggap tokoh fiksi atau nyata tertentu sebagai prototipe manajer
yang baik. Beberapa orang mungkin menganggap Bill Gates, pendiri Microsoft, sebagai prototipe
manajer perusahaan yang baik. Seseorang yang memiliki karakteristik yang menonjol dari prototipe
mungkin dianggap sebagai manajer yang baik. Jika karakteristik yang menonjol dari prototipe adalah
rambut pirang (atau terlihat seperti Gates), manajer yang berambut pirang (atau terlihat seperti
Gates) mungkin terlihat lebih baik dalam kinerja daripada rekan-rekan mereka yang memiliki rambut
cokelat (atau tidak mirip Gates). Prototipe adalah standar yang digunakan untuk menetapkan orang
ke kategori manajer yang baik.
Skema mungkin mempengaruhi keempat langkah dalam proses evaluasi. Mereka mungkin memengaruhi
perilaku apa yang dipilih supervisor untuk diamati, bagaimana perilaku itu diatur dan disimpan dalam memori,
bagaimana perilaku itu diambil, dan bagaimana perilaku itu digunakan untuk memutuskan peringkat. Penggunaan
skema, bagaimanapun, tidak selalu menyiratkan bahwa mereka mengarah pada peringkat yang tidak akurat. Dalam
banyak hal, penggunaan skema dapat menyederhanakan pengalaman sehingga dapat
lebih mudah diinterpretasikan. Ada kemungkinan bahwa ini mengarah pada penilaian yang akurat tentang
kinerja karyawan (Lord & Maher, 1989).
Secara teori, seharusnya dimungkinkan untuk menggunakan model kognitif ini untuk membantu
penilai melakukan pekerjaan yang lebih akurat dalam mengevaluasi kinerja pekerjaan. Jelley dan Goffin
(2001) mencoba ini dengan eksperimen di mana mahasiswa diminta untuk menilai kinerja instruktur
perguruan tinggi yang direkam menggunakan BOS. Meskipun hasilnya agak tidak konsisten, penulis dapat
menemukan beberapa peningkatan akurasi setelah priming memori penilai. Ini dilakukan dengan meminta
mereka melakukan beberapa peringkat global awal yang dirancang untuk merangsang ingatan kinerja yang
diamati. Pendekatan ini menunjukkan beberapa janji dalam membantu meningkatkan peringkat, tetapi
penelitian lebih lanjut akan diperlukan untuk menentukan apakah model ini pada akhirnya akan terbukti
bermanfaat.
Isi Efektivitas Bawahan

Jika skema memengaruhi peringkat kinerja pekerjaan, penting bagi kita untuk memahami
skema orang yang menilai kinerja. Dengan kata lain, teknik penilaian dapat ditingkatkan jika
dirancang untuk memanfaatkan skema supervisor secara efektif. Jika dimensi pada formulir
penilaian cocok dengan dimensi dalam skema supervisor tentang kinerja, akan lebih mudah
bagi supervisor untuk melakukan penilaian mereka. Ada beberapa penelitian yang relevan
dengan masalah ini.
Borman (1987) mempelajari isi skemata perwira Angkatan Darat AS tentang kinerja pekerjaan
bawahan. Ketika diminta untuk menggambarkan perbedaan karakteristik antara tentara yang efektif
dan tidak efektif, petugas ini menghasilkan 189 item deskriptif. Borman kemudian menggunakan
analisis statistik kompleks untuk mereduksi 189 item menjadi enam dimensi yang bermakna. Prajurit
yang efektif dipandang memiliki karakteristik sebagai berikut:
Bekerja keras
Bertanggung jawab
Menjadi terorganisir
Mengetahui bagian teknis pekerjaan

Mengendalikan bawahan Menunjukkan
kepedulian terhadap bawahan
Borman menyimpulkan bahwa dimensi ini mewakili karakteristik yang digunakan perwira untuk
menilai kinerja prajurit. Dia juga mencatat bahwa dalam sampel perwira berpengalamannya, ada
kesepakatan yang baik tentang apa yang merupakan prestasi kerja yang baik. Hasil ini menunjukkan
bahwa supervisor yang berpengalaman mungkin memiliki skema yang secara akurat mewakili kinerja
yang efektif. Keenam dimensi ini dapat digunakan sebagai dasar untuk salah satu bentuk penilaian
yang telah kita bahas sebelumnya.
Werner (1994) melakukan penelitian di mana ia meminta supervisor berpengalaman untuk
menilai kinerja sekretaris seperti yang dijelaskan dalam serangkaian insiden. Salah satu variabel yang
menarik dalam penelitian ini adalah jenis informasi yang digunakan supervisor dalam membuat
penilaian mereka. Werner menemukan bahwa dimensi berikut dianggap paling penting:
Ketepatan kerja kehadiran

Pengetahuan pekerjaan Jumlah pekerjaan
Werner menyarankan bahwa keempat dimensi ini mungkin mewakili karakteristik

yang menentukan skema supervisornya. Dia juga menyarankan bahwa supervisor harus
memberi tahu bawahan tentang isi skema mereka. Bawahan cenderung berusaha untuk
berkinerja baik di area yang menurut supervisor penting untuk kinerja yang baik.
Bias dan Kesalahan Penilai

Sudah menjadi sifat penilaian manusia untuk tidak sempurna. Ketika supervisor atau orang lain
membuat penilaian kinerja, mereka cenderung menunjukkan bias penilaian dan kesalahan penilaian.
Bias dan kesalahan ini dapat dilihat dalam pola penilaian, baik dalam bentuk penilaian untuk individu
maupun lintas bentuk penilaian untuk orang yang berbeda. Pola-pola dalam-bentuk dan lintas-
bentuk ini masing-masing disebut kesalahan halo dan distribusi.
Halo Kesalahan
Halo kesalahan terjadi ketika seorang penilai memberikan penilaian yang sama kepada individu di semua
dimensi penilaian, meskipun ada perbedaan kinerja di seluruh dimensi. Dengan kata lain, jika orang tersebut
dinilai luar biasa di satu bidang, dia dinilai luar biasa di semua bidang, meskipun ia mungkin hanya rata-rata
atau bahkan miskin di beberapa bidang. Misalnya, seorang petugas polisi mungkin hebat dalam
menyelesaikan banyak penangkapan (jumlah besar) tetapi mungkin melakukan pekerjaan yang buruk dalam
urusan administrasi. Seorang supervisor mungkin menilai petugas ini tinggi pada semua dimensi, meskipun
tidak layak secara seragam. Demikian pula, jika seseorang dinilai buruk di satu bidang, peringkatnya buruk
untuk semua bidang, meskipun dia mungkin memuaskan pada beberapa dimensi kinerja. Kesalahan
penilaian ini terjadi dalam bentuk penilaian individu yang bertentangan dengan yang terjadi di seluruh
bentuk individu yang berbeda.
Tabel 4.7 menunjukkan pola respons yang mencerminkan kesalahan halo. Tabel
menunjukkan peringkat empat individu di lima dimensi kinerja. Peringkat berkisar dari 1
(kinerja paling buruk) hingga 5 (kinerja terbaik). Ini adalah pola halo karena peringkat untuk
setiap karyawan adalah sama di seluruh dimensi yang berbeda, meskipun setiap orang
menerima peringkat yang berbeda. Pola seperti itu menunjukkan bahwa penilai tidak dapat
membedakan antar dimensi. Orang tersebut dipandang seragam dalam kinerja lintas dimensi.
Meskipun pola penilaian serupa mungkin menunjukkan kesalahan penilaian, ada

kemungkinan bahwa kinerja karyawan konsisten di seluruh dimensi. Ini berarti bahwa pola
halo mungkin secara akurat menunjukkan bahwa dimensi kinerja aktual terkait. Kemungkinan
ini telah menyebabkan diskusi yang cukup besar dalam literatur I/O tentang arti halo
(misalnya, Balzer & Sulsky, 1992; Murphy, Jako, & Anhalt, 1993; Solomonson & Lance,
TABEL 4.7 Peringkat Kinerja Kerja untuk Empat Karyawan pada Lima Dimensi yang Mengilustrasikan Halo
Pola Kesalahan
Dimensi Karyawan 1 Karyawan 2 Karyawan 3 Karyawan 4
Kehadiran 5 3 1 4
Komunikasi 5 3 1 4
Mengikuti arahan 5 3 1 4
Kualitas kerja 5 3 1 4
Kuantitas kerja 5 3 1 4
"Dia bukan bos yang sempurna, tapi dia memberi Anda banyak umpan balik." (© 1995; Dicetak ulang atas izin Bunny Hoest dan
Parade Magazine.)
1997; Viswesvaran, Schmidt, & Ones, 2005). Bagian dari diskusi ini menyangkut bagaimana
memisahkan kesalahan dari halo "benar".halo sejati berarti bahwa seorang karyawan berkinerja
pada tingkat yang sama di semua dimensi.
Kekhawatiran lain dengan halo telah menjelaskan proses kognitif yang akan
menyebabkan penilai untuk menunjukkan kesalahan halo. Beberapa peneliti telah berteori
bahwa penilai mengandalkan kesan umum karyawan ketika membuat penilaian dimensi
(Lance, LaPointe, & Fisicaro, 1994; Nathan & Lord, 1983). Menurut pandangan ini, potongan
informasi yang menonjol digunakan untuk membentuk kesan umum dari seorang karyawan.
Kesan membentuk dasar penilaian kinerja. Hal ini menunjukkan bahwa penilai mungkin lebih
mampu memberikan informasi tentang kinerja global daripada dimensi kinerja.
Kesalahan Distribusi
Kesalahan distribusi terjadi ketika penilai cenderung menilai semua orang sama. Kesalahan kelonggaran
terjadi ketika penilai menilai semua orang pada akhir skala kinerja yang menguntungkan. Kesalahan
tingkat keparahan terjadi ketika penilai menilai semua orang di ujung skala kinerja yang tidak
menguntungkan. Tendensi sentral kesalahan terjadi ketika penilai menilai semua orang di tengah skala
kinerja. Pola kelonggaran dapat dilihat di seluruh peringkat orang yang berbeda. Tabel 4.8 menunjukkan
pola kelonggaran di mana keempat orang diberi peringkat pada akhir skala kinerja yang menguntungkan.
Setiap orang menerima peringkat 4 dan 5 pada skala lima poin. Ada kemungkinan, bagaimanapun, bahwa
pola kesalahan distribusi tidak mencerminkan kesalahan. Semua ratee mungkin telah melakukan hal yang
sama, yang mengarah ke rating yang sama.
Kontrol Bias dan Kesalahan Penilai

Dua pendekatan telah dikembangkan untuk mengontrol dan menghilangkan bias dan kesalahan penilai. Salah satu
pendekatannya adalah merancang bentuk penilaian kinerja yang lebih baik yang akan tahan terhadap ini
TABEL 4.8 Peringkat Prestasi Kerja untuk Empat Karyawan pada Lima Dimensi yang Mengilustrasikan a
Pola Kesalahan Leniency
Dimensi Karyawan 1 Karyawan 2 Karyawan 3 Karyawan 4
Kehadiran 4 5 5 5
Komunikasi 4 5 5 5
Mengikuti arahan 5 4 4 4
Kualitas kerja 4 5 4 5
Kuantitas kerja 5 4 5 5
masalah. Yang lainnya adalah melatih penilai untuk menghindari kesalahan penilaian. Meskipun kedua pendekatan telah
menunjukkan harapan, studi penelitian telah menghasilkan hasil yang bertentangan tentang kemampuan mereka untuk
mengurangi kesalahan (Bernardin & Beatty, 1984).
Formulir Tahan Kesalahan untuk Menilai Kinerja

Skala penilaian yang berfokus pada perilaku, seperti BARS dan MSS, pada awalnya dikembangkan
sebagian untuk menghilangkan kesalahan penilaian. Idenya adalah bahwa penilai akan dapat
membuat penilaian yang lebih akurat jika mereka berfokus pada perilaku tertentu daripada sifat.
Perilaku-perilaku ini lebih konkrit dan membutuhkan penilaian yang lebih sedikit tentang apa yang
mereka wakili. Misalnya, akan lebih mudah untuk menilai secara akurat seberapa sering seseorang
tidak masuk kerja daripada sifat ketergantungan yang agak abstrak.
Banyak penelitian telah membandingkan berbagai bentuk penilaian yang berfokus pada
perilaku dengan bentuk penilaian grafis, serta satu sama lain. Perbandingan ini telah
menemukan bahwa terkadang bentuk yang berfokus pada perilaku menghasilkan lebih sedikit
kesalahan (seperti halo dan keringanan hukuman) daripada skala penilaian grafis dan
terkadang tidak (Bernardin & Beatty, 1984; Latham, Skarlicki, Irvine, & Siegel, 1993). Selain itu,
skala yang hanya meminta penilai untuk memeriksa apakah individu telah terlibat dalam
perilaku tertentu dapat menghasilkan kelonggaran yang lebih sedikit daripada skala penilaian
grafis (Yun, Donahue, Dudley, & McFarland, 2005). Setelah meninjau literatur tentang formulir
penilaian, Borman et al. (2010) menyimpulkan bahwa ada sedikit keuntungan menggunakan
skala berbasis perilaku dibandingkan skala penilaian grafis.
Pelatihan Penilai untuk Mengurangi Kesalahan
Pelatihan penilai juga telah dicoba dalam banyak penelitian, dengan hasil yang beragam (Hedge &
Kavanagh, 1988; Latham, 1986). Setidaknya beberapa perbedaan dalam temuan penelitian mungkin
disebabkan oleh perbedaan jenis pelatihan yang telah dipelajari. Mungkin pelatihan yang paling populer
adalahpelatihan kesalahan penilai atau MEMBASAHI. Tujuan RET adalah untuk membiasakan penilai
dengan kesalahan penilai dan mengajari mereka untuk menghindari pola penilaian ini. Meskipun sebagian
besar penelitian telah menemukan bahwa pelatihan semacam ini mengurangi kesalahan penilaian,
seringkali dengan mengorbankan akurasi penilaian (misalnya, Bernardin & Pence, 1980; Hedge & Kavanagh,
1988). Dengan kata lain, penilai dapat mengurangi jumlah pola halo dan kelonggaran dalam penilaian mereka
dengan memaksa penilaian bervariasi, apakah mereka secara akurat mencerminkan seberapa baik orang tersebut
telah melakukannya, tetapi penilaian tersebut kurang akurat dalam mencerminkan tingkat kinerja yang sebenarnya. .
Bagaimana mungkin pengurangan kesalahan juga menghasilkan pengurangan akurasi? Satu

penjelasan yang mungkin terletak pada sifat kesalahan penilaian. Seperti yang disebutkan sebelumnya
dalam pembahasan ini, kesalahan penilai disimpulkan dari pola penilaian. Ada kemungkinan bahwa
kinerja individu serupa di seluruh dimensi kinerja yang berbeda (halo sejati) atau bahwa semua
individu di departemen penyelia melakukan pekerjaan mereka dengan sama baiknya. Melatih penilai
untuk menghindari penilaian yang sama di kedua dimensi atau orang akan menghasilkan
konsentrasi mereka untuk menghindari pola tertentu daripada menilai kinerja pekerjaan secara
akurat. Bernardin dan Pence (1980) menyarankan bahwa RET mungkin menggantikan satu rangkaian
kesalahan penilaian dengan yang lain.
Nathan dan Tippins (1990) menawarkan penjelasan yang berbeda tentang mengapa kesalahan halo
dikaitkan dengan akurasi yang lebih besar dalam peringkat kinerja pekerjaan. Mereka berspekulasi bahwa
penilai yang menunjukkan lebih sedikit halo dalam penilaian mereka mungkin memberi terlalu banyak bobot
pada peristiwa negatif yang tidak penting. Misalnya, seorang penyelia mungkin telah memberikan penilaian
kehadiran yang rendah kepada karyawan yang dapat diandalkan karena dia sakit selama satu minggu di
tahun sebelumnya. Penilai yang menunjukkan pola halo dalam penilaian mereka kurang memperhatikan
kejadian langka tersebut dan cenderung mempertimbangkan kinerja biasa orang tersebut. Ini mungkin
menghasilkan peringkat yang lebih akurat karena lebih dipengaruhi oleh kinerja umum daripada oleh
contoh langka kinerja baik atau buruk dalam satu atau lebih dimensi.
Hasil lebih menjanjikan dengan jenis pelatihan selain RET. Prosedur pelatihan tersebut
mengajarkan penilai bagaimana mengamati perilaku yang relevan dengan kinerja dan bagaimana
membuat penilaian berdasarkan pengamatan tersebut. Hedge dan Kavanagh (1988), misalnya,
menemukan bahwa pelatihan observasi ini meningkatkan akurasi penilaian tetapi tidak mengurangi
kesalahan penilaian (lihat kotak Penelitian secara Detail). Mungkin yang paling menjanjikan adalah
kerangka acuan pelatihan (Day & Sulsky, 1995), yang mencoba memberikan pemahaman umum
tentang tugas pemeringkatan. Penilai diberikan contoh spesifik dari perilaku yang akan mewakili
berbagai tingkat kinerja untuk setiap dimensi yang akan dinilai. Hasil dengan pelatihan semacam ini
sejauh ini terbukti menjanjikan dalam meningkatkan akurasi penilaian dan memberikan penilai
pemahaman yang lebih akurat tentang kriteria kinerja yang baik (Gorman & Rentsch, 2009). Salah
satu batasan pada penelitian ini adalah bahwa sebagian besar telah dilakukan di laboratorium
dengan mahasiswa, jadi tidak jelas seberapa baik hasil yang akan digeneralisasikan kepada manajer
untuk menilai karyawan mereka di lapangan.
PENELITIAN DETAIL
Beberapa studi menemukan bahwa penilai pelatihan untuk pelatihan dengan cara membuat penilaian yang tepat tentang kinerja
menghindari kesalahan penilaian dapat mengurangi akurasi berdasarkan perilaku yang diamati. Kelompok terakhir adalah
mereka dalam mengevaluasi kinerja pekerjaan. Hedge dan kelompok kontrol yang tidak mendapatkan pelatihan.
Kavanagh (1988) ingin melihat apakah jenis pelatihan lain akan Baik sebelum dan sesudah pelatihan, semua kelompok
lebih efektif dalam meningkatkan akurasi peringkat kinerja. menonton rekaman video seseorang yang melakukan
Lima puluh dua pengawas secara acak ditugaskan ke salah satu dari suatu pekerjaan. Mereka kemudian menilai kinerja orang
empat kelompok perlakuan. Kelompok pertama menerima pelatihan tersebut pada beberapa dimensi kinerja. Kinerja rekaman
kesalahan penilai yang dirancang untuk membiasakan penilai dengan video dinilai oleh panel ahli yang memberikan standar
kesalahan penilaian dan cara untuk menghindarinya. Kelompok kedua untuk perbandingan penilaian oleh anggota setiap
menerima pelatihan tentang cara mengamati perilaku yang relevan dengan kelompok dalam penelitian. Akurasi penilaian kinerja dinilai
kinerja pekerjaan. Kelompok ketiga menerima sebagai perbedaan antara penilaian penilai
penilaian rekaman video dan penilaian panel ahli atas mungkin tidak mewakili kesalahan. Sebaliknya, pola-pola ini
rekaman video. dapat secara akurat menunjukkan tingkat kinerja individu
Hasil penelitian menunjukkan bahwa mereka yang mendapatkan dalam pekerjaan. Misalnya, individu mungkin tampil pada
pelatihan rater error mengalami penurunan kesalahan rating dan tingkat yang sama untuk dimensi yang berbeda. Implikasi
akurasi. Temuan ini konsisten dengan penelitian sebelumnya tentang dari penelitian ini adalah bahwa berbagai jenis pelatihan
pelatihan semacam ini. Dua jenis pelatihan lainnya berhasil penilai dapat membantu organisasi mendapatkan penilaian
meningkatkan akurasi tetapi dengan biaya kesalahan penilaian yang kinerja yang lebih akurat.
meningkat. Penulis menyimpulkan bahwa kedua jenis pelatihan ini

Sumber: Dari “Meningkatkan Akurasi Evaluasi Kinerja:
menjanjikan untuk meningkatkan akurasi penilaian. Mereka juga Perbandingan Tiga Metode Pelatihan Penilai Kinerja,” oleh JW
menyimpulkan bahwa pola penilaian sering dianggap mencerminkan Hedge dan M. Kavanagh,
kesalahan penilaian (1988) Jurnal Psikologi Terapan, 73, 68–73.
Faktor-Faktor Lain yang Mempengaruhi Peringkat Kinerja Pekerjaan

Sejauh ini kita telah membahas bagaimana peringkat supervisor dapat dipengaruhi oleh
proses kognitif mereka dan oleh desain formulir peringkat (dan pelatihan tentang cara
menggunakannya). Faktor-faktor lain juga dapat mempengaruhi penilaian yang diberikan oleh
penyelia, termasuk perasaan penyelia tentang bawahan, suasana hati penyelia, persepsi
penyelia tentang motif kinerja bawahan, faktor budaya, dan ras dari penilai dan yang dinilai.
Gagasan bahwa supervisor memberikan peringkat yang lebih baik kepada bawahan yang mereka sukai
didukung oleh penelitian (misalnya, Ferris, Judge, Rowland, & Fitzgibbons, 1994). Hal ini membuat beberapa
orang khawatir bahwa penilaian mungkin bias dan mencerminkan pilih kasih. Namun, ada beberapa bukti
bahwa rasa suka dapat menjadi hasil kinerja pekerjaan yang baik, karena supervisor menyukai mereka yang
bekerja dengan baik untuk mereka (Robbins & DeNisi, 1994). Sangat penting bagi karyawan baru untuk
dilihat sebagai karyawan yang berkinerja baik karena persepsi tersebut kemungkinan besar akan
menyebabkan disukai oleh supervisor, yang dapat mengakibatkan penerimaan dukungan ekstra yang
mengarah pada kinerja yang lebih baik di masa depan (Lefkowitz, 2000).
Kelanjutan peringkat kinerja yang baik dapat dipengaruhi oleh harapan supervisor tentang
kinerja yang tidak tergantung pada keinginan. Murphy, Gannett, Herr, dan Chen (1986) menemukan
bahwa penilaian kinerja dipengaruhi oleh harapan penilai tentang kinerja orang yang dinilai. Orang
cenderung melupakan contoh perilaku yang tidak sesuai dengan pandangan mereka tentang orang
yang mereka evaluasi. Dengan demikian seseorang yang disukai dan berkinerja baik akan terus
dipandang sebagai berkinerja baik, meskipun kinerjanya belakangan ini merosot. Ini dapat
menghasilkan peringkat yang bias ketika kinerja berubah seiring waktu.
Suasana hati penilai pada saat penilaian dapat mempengaruhi penilaian. Dalam sebuah penelitian
laboratorium, Sinclair (1988) menugaskan peserta ke suatu kondisi di mana suasana hati mereka
dimanipulasi secara eksperimental untuk menjadi lebih tertekan atau gembira. Mereka kemudian diminta
untuk membaca deskripsi perilaku seorang profesor dan menilai kinerja profesor tersebut. Hasil penelitian
menunjukkan bahwa peserta dalam suasana hati yang tertekan menilai kinerja profesor lebih rendah
daripada subjek dalam kondisi suasana hati yang gembira. Peserta yang depresi juga lebih akurat dan
menunjukkan lebih sedikit halo. Sinclair menjelaskan hasil yang mencerminkan kemampuan pemrosesan
informasi yang lebih baik dari orang-orang ketika mereka berada dalam suasana hati yang tertekan.
Pandangan manajer tentang motivasi bawahan dapat menjadi faktor dalam penilaian kinerja pekerjaan
mereka, tetapi yang menarik, pandangan seperti itu dapat dipengaruhi oleh faktor budaya. DeVoe dan
Iyengar (2004) menilai persepsi manajer tentang karyawan mereka sebagai sesuatu yang intrinsik
termotivasi (ingin melakukan pekerjaan dengan baik untuk kepentingannya sendiri) dan termotivasi
secara ekstrinsik (bekerja keras untuk mendapatkan imbalan) dan kemudian menghubungkan
persepsi tersebut dengan peringkat kinerja pekerjaan. Manajer Amerika dan Latin menganggap
motivasi intrinsik lebih penting untuk kinerja daripada motivasi ekstrinsik, sedangkan manajer Asia
menganggap kedua jenis motivasi itu sama pentingnya.
Telah ditetapkan dengan baik bahwa karyawan kulit hitam rata-rata menerima peringkat penilaian kinerja yang
lebih rendah daripada karyawan kulit putih (McKay & McDaniel, 2006). Menariknya, ras penilai tampaknya tidak
berpengaruh pada peringkat untuk orang kulit putih, tetapi berpengaruh pada peringkat untuk orang kulit hitam.
Seperti yang ditunjukkan oleh Stauffer dan Buckley (2005), penilai Kulit Hitam dan Putih memberikan peringkat yang
sama kepada Orang Kulit Putih dan memberi peringkat Orang Kulit Hitam secara rata-rata lebih rendah daripada
Orang Kulit Putih. Namun, perbedaan antara peringkat itu jauh lebih besar untuk Putih daripada penilai Hitam. Jika
dianggap bahwa penilai kulit hitam akan memiliki bias yang lebih sedikit daripada penilai kulit putih terhadap
karyawan kulit hitam, temuan ini menunjukkan kemungkinan bahwa penilai kulit putih bias terhadap karyawan kulit
hitam. Tentu saja, penjelasan alternatifnya adalah bahwa penilai kulit hitam bias mendukung orang kulit hitam dan
menilai mereka terlalu tinggi dan bahwa penilai kulit hitam dan putih bias mendukung orang kulit putih dan menilai
mereka terlalu tinggi dibandingkan dengan orang kulit hitam. Saat ini, kami tidak tahu sejauh mana bias beroperasi
dalam peringkat ini baik untuk atau terhadap karyawan Hitam Putih.
Umpan Balik 360 Derajat
Di sebagian besar organisasi, atasan langsung setiap karyawan bertanggung jawab untuk menilai
kinerja pekerjaan. Namun, akan sangat membantu untuk mendapatkan berbagai perspektif tentang
kinerja pekerjaan (Furnham & Stringfield, 1994), dan penggunaan berbagai perspektif menjadi
praktik standar dalam evaluasi manajer dan orang lain (Rowson, 1998). Peringkat oleh rekan kerja,
diri sendiri, dan bawahan (untuk supervisor) dapat menjadi pelengkap yang berguna untuk peringkat
supervisor dan dapat membantu dalam memberikan umpan balik untuk pengembangan karyawan
(Maurer, Mitchell, & Barbeite, 2002). Secara khusus, perbedaan antara penilaian oleh diri sendiri
(peringkat kinerja karyawan itu sendiri) dan orang lain dapat menunjukkan area di mana orang lain
melihat karyawan secara berbeda dari cara karyawan memandang dirinya sendiri.
Penggunaan berbagai perspektif untuk umpan balik manajer disebut Umpan balik 360 derajat (
Baldwin & Padgett, 1993). Seorang manajer dievaluasi oleh rekan-rekan, bawahan, dan supervisor
pada beberapa dimensi kinerja. Selain itu, manajer melengkapi penilaian kinerjanya sendiri.
Penelitian telah menunjukkan bahwa orang-orang di posisi yang berbeda ini hanya menunjukkan
persetujuan sederhana dalam penilaian mereka (Brett & Atwater, 2001; Carless, Mann, & Wearing,
1998; Fletcher & Baldry, 2000), menunjukkan bahwa mereka memberikan perspektif yang berbeda
tentang kinerja seseorang. Keuntungan lain menggunakan beberapa penilai adalah bahwa efek dari
bias individu dapat dikurangi. Sebagai contoh, telah ditunjukkan bahwa orang memberikan peringkat
yang lebih tinggi dalam evaluasi 360 derajat kepada orang yang mereka sukai (Antonioni & Park,
2001). Sebagai contoh, efek pilih kasih di pihak penyelia langsung berkurang ketika informasi
tambahan dari penilai lain ditambahkan ke penilaian. Hal ini dapat menyebabkan peningkatan
kepercayaan dan sikap yang lebih baik tentang sistem penilaian pada bagian dari mereka yang
dievaluasi (Mayer & Davis, 1999).
Tujuan dari sistem 360 derajat adalah untuk meningkatkan kinerja, terutama bagi
individu yang paling membutuhkan peningkatan kinerja. Sistem ini telah terbukti
memiliki efek positif bagi beberapa individu tetapi tidak semua. Berlawanan dengan ini
Masalah Hukum dalam Penilaian Kinerja 101
tujuan yang dimaksudkan sistem, itu adalah yang terbaik dan bukan yang berkinerja terburuk yang
tampaknya paling diuntungkan dari umpan balik 360 derajat (Bailey & Austin, 2006). Selanjutnya, Atwater
dan Brett (2005) menemukan bahwa individu-individu yang menerima penilaian rendah dari orang lain dan
menilai diri mereka sendiri juga rendah memiliki reaksi terburuk terhadap umpan balik, menunjukkan
bahwa jika seseorang mengetahui kinerjanya buruk, keyakinan tersebut dikuatkan oleh orang lain adalah
tidak membantu.
DAMPAK TEKNOLOGI TERHADAP PENILAIAN KINERJA

Kemajuan teknologi, khususnya web, telah sangat memperluas apa yang praktis dalam penilaian
kinerja. Untuk perusahaan besar, jumlah data yang terlibat dalam pemantauan kinerja bisa sangat
mengejutkan. Misalnya, salah satu kesulitan dengan umpan balik 360 derajat adalah logistik untuk
mengatur tugas pemeringkatan besar ini. Setiap manajer target harus menominasikan beberapa
bawahan dan beberapa rekan untuk memberikan penilaian, melakukan penilaian sendiri, dan
mendapatkan penilaian atasannya. Di beberapa organisasi, ini mungkin mewakili 8 atau lebih
peringkat yang diselesaikan per manajer, dan jika ada 10.000 manajer, ada 80.000 peringkat yang
harus dilacak dan diproses. Ini adalah tugas yang mahal dan sulit bagi perusahaan untuk dilakukan
secara manual.
Ada dua tempat di mana kita melihat teknologi berdampak pada penilaian kinerja—pemantauan
produktivitas objektif dan penerapan sistem manajemen kinerja. Banyak karyawan saat ini bekerja
pada sistem komputer, seperti spesialis reservasi untuk maskapai penerbangan dan operator
telepon. Sistem yang memungkinkan mereka menyelesaikan tugas pekerjaan mereka juga mampu
melacak produktivitas, dan data semacam itu dikumpulkan secara rutin di banyak organisasi.
Penggunaan komputer memungkinkan analisis kinerja yang mudah di jutaan transaksi karyawan-
pelanggan, dan ini dapat menjadi fitur bawaan dari perangkat lunak tugas yang digunakan karyawan
untuk melakukan pekerjaan mereka setiap hari.
Sistem manajemen kinerja karyawan berbasis web yang terkomputerisasi membantu manajer
mengklarifikasi tujuan dan harapan, memberikan pelatihan dan umpan balik, dan mengevaluasi kinerja
(lihat studi kasus Praktik Psikologi I/O dalam bab ini). Sistem seperti itu mengotomatiskan seluruh proses,
membuat sistem umpan balik 360 derajat layak secara ekonomi untuk perusahaan besar. Setiap manajer
target dapat masuk ke sistem dan menominasikan rekan kerja, bawahan, dan orang lain yang akan
memberikan peringkat. Sistem memberi tahu individu untuk melakukan penilaian tersebut dan kemudian
mengumpulkan semua informasi penilaian ke dalam sebuah laporan. Perusahaan konsultan dapat
ditemukan yang mengkhususkan diri dalam menyediakan layanan komputer untuk melakukan proyek
umpan balik 360 derajat.
MASALAH HUKUM DALAM PENILAIAN KINERJA

Banyak negara memiliki undang-undang yang melarang diskriminasi terhadap minoritas dan
perempuan (serta kelompok lain) di tempat kerja. Undang-undang ini mencakup tindakan organisasi
yang memengaruhi status pekerjaan seseorang, seperti promosi dan pemutusan hubungan kerja.
Tindakan karyawan seperti itu sering kali didasarkan setidaknya sebagian pada kinerja orang
tersebut; Oleh karena itu, sistem penilaian kinerja suatu organisasi dapat menjadi sasaran tindakan
hukum. Di banyak negara, adalah ilegal untuk melakukan diskriminasi dalam penilaian kinerja
berdasarkan faktor-faktor tertentu yang tidak terkait dengan kinerja, seperti usia, jenis kelamin, cacat
mental atau fisik, atau ras.
TABEL 4.9 Enam Poin Sistem Penilaian Kinerja yang Dapat Dipertahankan Secara Hukum
1. Lakukan analisis pekerjaan untuk menentukan dimensi kinerja
2. Kembangkan formulir penilaian untuk menilai dimensi dari langkah 1
3. Latih penilai tentang cara menilai kinerja
4. Miliki peringkat tinjauan manajemen yang lebih tinggi, dan izinkan karyawan untuk mengajukan banding atas evaluasi mereka.
5. Dokumentasikan kinerja, dan pertahankan catatan terperinci
6. Memberikan bantuan dan konseling kepada karyawan yang berkinerja buruk sebelum melakukan tindakan terhadap mereka
Sumber: Diadaptasi dari “Performance Appraisal and Terminations: A Review of Court Decisions Since Brito v. Zia
With Implications for Personnel Practices,” oleh GV Barrett dan MG Kernan, 1987, Psikologi Personalia, 40, 489-503.
Di Amerika Serikat, ada peningkatan jumlah tantangan pengadilan untuk tindakan karyawan
berbasis kinerja, seperti promosi dan pemutusan hubungan kerja (Latham et al., 1993). Organisasi
yang kalah dalam kasus seperti itu tidak dapat menunjukkan kepada pengadilan bahwa sistem
penilaian kinerja mereka tidak mendiskriminasi kelompok tertentu. Metode subjektif sangat mungkin
menimbulkan tantangan hukum karena memberikan ruang bagi supervisor untuk mengungkapkan
prasangka terhadap kelompok orang tertentu. Mungkin sulit bagi seorang supervisor untuk
membuktikan di pengadilan bahwa penilaiannya adil dan tidak memihak ketika, misalnya, orang kulit
hitam mendapatkan penilaian kinerja yang lebih rendah daripada orang kulit putih (McKay &
McDaniel, 2006), seperti disebutkan sebelumnya.
Barrett dan Kernan (1987) menyarankan enam komponen yang harus menjadi bagian dari sistem
penilaian kinerja yang dapat dipertahankan secara hukum. Seperti yang ditunjukkan pada Tabel 4.9, sistem
harus dimulai dengan analisis pekerjaan untuk memperoleh dimensi kinerja untuk pekerjaan tertentu.
Analisis pekerjaan akan memastikan bahwa dimensi yang dipilih relevan dengan pekerjaan. Penilai harus
menerima pelatihan tentang bagaimana formulir penilaian akan digunakan untuk menilai kinerja. Untuk
membantu meminimalkan bias pribadi, manajemen atas harus meninjau penilaian kinerja. Kinerja dan
alasan tindakan karyawan harus didokumentasikan dan dicatat. Lebih mudah untuk mengambil tindakan
terhadap seorang karyawan ketika kinerja, baik atau buruk, telah didokumentasikan untuk jangka waktu
yang lama. Ini menghilangkan kesan bahwa penilaian terakhir diberikan untuk membenarkan tindakan
tertentu yang mempengaruhi seorang karyawan. Akhirnya, ada baiknya untuk memberikan bantuan dan
konseling kepada karyawan yang kinerjanya kurang memuaskan. Hal ini menunjukkan bahwa organisasi
telah melakukan segala kemungkinan untuk karyawan yang tidak memuaskan sebelum mengambil tindakan
terhadapnya.
Werner dan Bolino (1997) menganalisis hasil dari 295 kasus pengadilan AS di mana penilaian
kinerja ditantang sebagai diskriminatif. Sistem penilaian kinerja yang didasarkan pada analisis
pekerjaan, memberikan instruksi tertulis kepada penilai, menawarkan kesempatan kepada karyawan
untuk mendapatkan masukan, dan menggunakan banyak penilai jauh lebih kecil kemungkinannya
untuk mengakibatkan kerugian organisasi. Misalnya, sementara organisasi secara keseluruhan
kehilangan 41% kasus, organisasi yang menggunakan banyak penilai hanya kehilangan 11% kasus.
Penggunaan keempat praktik ini digabungkan harus menghasilkan sistem penilaian kinerja yang
relatif aman dari perspektif hukum.
Membiarkan karyawan untuk memiliki masukan ke dalam penilaian kinerja juga memiliki manfaat di
luar masalah hukum. Penelitian telah menunjukkan bahwa memberi karyawan kesempatan untuk duduk
bersama supervisor dan mendiskusikan penilaian secara terbuka dapat menghasilkan sikap yang lebih baik
Ringkasan Bab 103
(Korsgaard & Roberson, 1995). Dalam satu penelitian, ini terjadi meskipun karyawan yang
diizinkan masukan sebenarnya memiliki peringkat lebih rendah daripada mereka yang tidak
(Taylor, Tracy, Renard, Harrison, & et al., 1995). Persepsi keadilan dalam penelitian ini bahkan
mengurangi niat karyawan untuk berhenti dari pekerjaan. Agar efektif dan dianggap adil,
sistem penilaian kinerja harus mencakup enam langkah Barrett dan Kernan (1987), serta
masukan dari karyawan.
RINGKASAN BAB
Data kinerja pekerjaan memiliki banyak kegunaan organisasi, termasuk pengambilan keputusan
administratif, pengembangan karyawan, umpan balik karyawan, dan penelitian. Langkah pertama dalam
mengevaluasi kinerja pekerjaan adalah mengembangkan kriteria kinerja yang mendefinisikan kinerja baik
dan buruk. Setelah kriteria ditetapkan, metode khusus untuk mengukurnya dapat dipilih.
Ukuran kinerja pekerjaan dapat diklasifikasikan sebagai objektif atau subjektif. Ukuran
objektif adalah jumlah output dari suatu pekerjaan, seperti jumlah penjualan untuk tenaga
penjual atau jumlah unit yang diproduksi untuk pekerja pabrik. Ukuran subjektif adalah
penilaian oleh penyelia (atau individu lain yang akrab dengan kinerja pekerjaan orang
tersebut). Ukuran subyektif lebih umum digunakan dari dua metode, tetapi mereka menderita
bias dan kesalahan yang disebabkan oleh penilaian manusia. Dua pendekatan berbeda telah
diambil untuk mengurangi kesalahan penilaian dalam ukuran subjektif: desain formulir
penilaian dan pelatihan penilai.
Beberapa jenis formulir penilaian telah dirancang untuk meningkatkan akurasi penilaian kinerja.
Behaviorally Anchored Rating Scale (BARS) meminta penilai untuk menunjukkan mana dari beberapa
perilaku yang paling mendekati untuk mewakili kinerja pekerjaan individu. Skala Standar Campuran
(MSS) meminta penilai untuk menunjukkan apakah kinerja individu lebih buruk dari, sebaik, atau
lebih baik dari masing-masing beberapa item perilaku kinerja. Behavior Observation Scale (BOS)
meminta penilai untuk menunjukkan seberapa sering penilai melakukan setiap perilaku yang
terdaftar. Penelitian yang membandingkan bentuk penilaian yang berfokus pada perilaku dengan
jenis ukuran lain telah gagal menemukan bukti yang konsisten untuk akurasi yang lebih besar.
Pelatihan penilai adalah pendekatan lain yang telah dicoba untuk mengurangi kesalahan. Penelitian
telah menyarankan bahwa pelatihan kesalahan penilai dapat mengurangi akurasi penilaian, bahkan jika
berhasil mengurangi kesalahan penilaian. Pelatihan observasi yang berfokus pada mengamati perilaku
terkait kinerja dan membuat penilaian kinerja telah menjanjikan dalam meningkatkan akurasi. Namun, pada
saat ini, terlalu dini untuk menyimpulkan bahwa pendekatan mana pun akan terbukti berguna dalam
membantu penyelia memberikan peringkat kinerja yang akurat.
Beberapa faktor telah terbukti berhubungan dengan peringkat kinerja pekerjaan, meskipun tidak
sepenuhnya jelas apakah mereka menghasilkan bias penilai atau tidak. Apakah penilai menyukai bawahan,
suasana hati penilai, motif yang dirasakan karyawan untuk kinerja, faktor budaya, dan ras penilai dan orang
yang dinilai semuanya mempengaruhi penilaian.
Umpan balik dari berbagai sumber dapat membantu karyawan yang ingin meningkatkan
kinerja mereka. Manajer menerima umpan balik 360 derajat dari perbandingan penilaian diri
mereka dengan penilaian rekan kerja, bawahan, dan penyelia.
Di Amerika Serikat dan banyak negara lain, penilaian kinerja adalah proses hukum
dan juga teknis. Organisasi diwajibkan oleh hukum AS untuk menghindari diskriminasi
dalam prosedur penilaian kinerja mereka. Kegagalan untuk mematuhi seperti itu
persyaratan hukum dapat membuat organisasi tunduk pada tuntutan hukum. Sejumlah praktik khusus,
seperti mendasarkan sistem pada analisis pekerjaan dan memberikan pelatihan penilai, mengurangi
kemungkinan bahwa organisasi akan kalah di pengadilan jika ditentang.
I/O PSI CE
log ke sistem komputer perusahaan untuk melengkapi

Ini kasus penawaran dengan
formulir evaluasi. Bentuk-bentuk ini difokuskan pada
pengembangan com-
kesesuaian antara kompetensi karyawan, seperti yang
kinerja menyeluruh
ditampilkan untuk tahun tersebut, dan model kompetensi
menilai dan mengelola-
organisasi untuk posisi tersebut. Model ini, yang
sistem yang dirancang
diturunkan dari analisis pekerjaan, adalah spesifikasi
dan diterapkan oleh Dr.
kompetensi dan keterampilan yang dibutuhkan untuk
Amy Carver dan timnya
melakukan pekerjaan itu. Ketika karyawan dan supervisor
disebutkan untuk Wachovia
selesai, sebuah laporan dibuat secara otomatis yang
Bank. Dr. Carver
menyoroti area ketidaksepakatan, dan ini menjadi dasar
diterima Ph.D.nya dalam
(Kesopanan untuk diskusi tatap muka.
psikologi I/O pada tahun 1992
dari Amy Carver) Sekitar awal tahun, setiap supervisor bertemu dengan
dari Rice University. Pada
setiap bawahan untuk mendiskusikan kinerjanya dan
saat kasus ini, dia adalah Wakil Presiden Senior untuk menyepakati tujuan untuk tahun mendatang. Tujuan-tujuan ini
Efektivitas Organisasi untuk Wachovia Bank. tidak hanya menentukan apa yang harus dicapai tetapi juga
Sebelumnya, ia memiliki karir yang cukup bervariasi bagaimana hal itu dilakukan, sehingga memberikan penekanan
dan menarik, pernah bekerja di sebuah lembaga yang seimbang pada kualitas dan kuantitas kerja. Sistem
pemerintah (Pusat Penelitian dan Pengembangan berbasis web mengirimkan e-mail pengingat kepada setiap
Personel Angkatan Laut AS), sebuah perusahaan swasta supervisor pada interval triwulanan untuk melakukan sesi
(United Airlines), dan perusahaan konsultannya sendiri. pelatihan yang diperlukan dengan bawahan untuk memberikan
Dalam perannya saat ini untuk Wachovia, Dr. Carver umpan balik tentang kompetensi dan kemajuan tujuan hingga
terlibat dalam pemilihan karyawan, manajemen kinerja, saat itu dalam setahun. Sasaran untuk masa depan sistem ini
pembinaan eksekutif (lihat studi kasus untuk Bab 7), termasuk menghubungkan kenaikan gaji setiap tahun dengan
desain organisasi, dan survei karyawan, antara lain. kinerja dan menjadikan sistem penggajian sebagai bagian dari
Salah satu kekhawatiran Dr. Carver ketika dia tiba di manajemen kinerja. Seperti yang Anda lihat, sistem Wachovia
Wachovia adalah bahwa organisasi tersebut tidak memiliki lebih dari sekadar menyelesaikan “kartu rapor” biasa pada
penilaian kinerja dan sistem manajemen yang sama. Setiap setiap karyawan setiap tahun.
tahun supervisor mengisi evaluasi, tetapi tidak ada standar
yang konsisten, dan kenaikan gaji tidak terkait erat dengan Pertanyaan Diskusi
kinerja. Untuk mengatasi hal ini, Dr. Carver dan timnya 1. Apakah Anda pikir Anda ingin bekerja di perusahaan
menyusun sistem komprehensif yang menjadi bagian dari dengan sistem kinerja semacam ini? Mengapa atau
sistem manajemen/pengawasan organisasi. Sistem ini mengapa tidak?
mengikat tinjauan kinerja tahunan dengan penetapan 2. Mengapa perusahaan seperti Wachovia menginvestasikan
tujuan, pengembangan karyawan, dan pembinaan begitu banyak upaya dalam evaluasi kinerja?
supervisor. 3. Mengapa manajer diharuskan untuk memberikan sesi
Sistem ini berjalan pada siklus tahunan yang dimulai pada pelatihan triwulanan? Bukankah setahun sekali cukup?
bulan Desember. Bagian evaluasi, yang melibatkan penilaian 4. Apakah menurut Anda penetapan tujuan akan meningkatkan
diri karyawan dan peringkat supervisor, seluruhnya berbasis motivasi dan kinerja karyawan (lihat bagian Bab 8 tentang
web. Setiap pasangan karyawan-penyelia penetapan tujuan).
Ringkasan Bab 105
BELAJAR DENGAN MELAKUKAN
Menentukan Kriteria untuk Suatu Pekerjaan 4. Apa yang paling mencerminkan kinerja yang baik pada
Kriteria untuk suatu pekerjaan dapat ditentukan dengan pekerjaan ini?
mewawancarai karyawan yang memegangnya. Pilih orang

Insiden Kritis Kinerja
yang Anda kenal (kenalan, anggota keluarga, atau teman)
yang saat ini bekerja di pekerjaan yang belum pernah Anda Insiden kritis bisa sangat berguna dalam mengembangkan
tangani sendiri. Wawancarai dia tentang kriteria kinerja, ukuran kinerja pekerjaan. Kumpulkan 10 insiden kritis, setengah
buat catatan yang cermat. Anda harus bertanya tentang hal mencerminkan kinerja yang efektif dan setengah
berikut. mencerminkan kinerja yang tidak efektif. Mintalah orang yang
Anda kenal untuk memberikan contoh yang telah mereka amati.
1. Apa fungsi utama dari pekerjaan ini? Orang yang sama dapat memberi Anda insiden yang efektif dan
2. Untuk setiap fungsi, apa yang harus diselesaikan tidak efektif. Yang terbaik adalah mendapatkan insiden dari
oleh karyawan? beberapa orang. Gunakan insiden untuk menentukan satu atau
3. Untuk setiap fungsi, apa yang dimaksud dengan kinerja lebih dimensi kinerja pekerjaan yang mungkin dimasukkan
yang dapat diterima dan kinerja yang luar biasa? dalam skala penilaian kinerja.

Chapter 4 Performance Appraisal - En.id

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Chapter 4 Performance Appraisal - En.id

Diunggah oleh

Hak Cipta:

Format Tersedia

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

MENGAPA KITA MENGHARGAI KARYAWAN?

Tujuan: Siswa yang mempelajari bab ini harus dapat:

Buat daftar penggunaan informasi kinerja pekerjaan.

MENGAPA DOWE MENILAI KARYAWAN?

keputusan administratif harus didasarkan pada prestasi kerja. Di Kanada, misalnya,

Pengembangan dan Umpan Balik Karyawan

Practice dalam bab ini.

Kriteria Nyata versus Teoritis

Kontaminasi, Defisiensi, dan Relevansi

Pekerjaan Kriteria Teoretis Kriteria Sebenarnya

Artis Ciptakan karya seni yang Penilaian ahli seni

Relevansi Gambar 4.1 Kontaminasi kriteria, relevansi, dan defisiensi. NS

TABEL 4.2 Contoh Formulir Penilaian KinerjaDengan Delapan Dimensi Kriteria

Dimensi Miskin Adil Memadai Bagus Luar biasa

Kehadiran ______ ______ ______ ______ ______

Kehadiran = 5 Kualitas kerja = 4

skor kinerja gabungannya akan menjadi rata-rata skor dimensi, atau

METODE UNTUK MENILAI KINERJA PEKERJAAN

Ukuran Objektif Kinerja Pekerjaan

TABEL 4.3 Contoh Ukuran Objektif Prestasi Kerja

Absen Hari absen per tahun Jumlah

TABEL 4.4 Contoh Ukuran Produktivitas Objektif untuk Beberapa Pekerjaan

Pekerja lini perakitan Jumlah unit yang

Pramuniaga Jumlah penjualan

Ahli bedah Jumlah operasi yang dilakukan

Ukuran Subyektif Kinerja Pekerjaan

Formulir Penilaian Grafis

Formulir Penilaian Berfokus pada Perilaku

Skala Penilaian Berlabuh Secara Perilaku (Smith & Kendall, 1963)

Keterampilan organisasi: Urutan konstruksi materi yang baik meluncur dengan

Instruktur ini diharapkan

6 dibahas selama periode

Tidak menggunakan silabus 2 Instruktur ini dapat

1. Yang dinilai lebih baik dari pernyataan

2. Pernyataan itu sesuai dengan yang menilai

3. Nilainya lebih buruk dari pernyataan

Penampilan yang bagus

Lebih baik dari barangnya

Sebagus barangnya Lebih

buruk dari barangnya

penilai menunjukkan persentase waktu karyawan melakukan setiap perilaku dengan

65% sampai 74%

75% hingga 84%

85% hingga 94%

95% hingga 100%

Pengembangan Bentuk Berfokus pada Perilaku

Langkah 3 melibatkan memiliki hakim (orang berpengetahuan) mengurutkan deskripsi perilaku

Langkah 1: Lakukan analisis pekerjaan untuk menentukan dimensi pekerjaan

Proses Kognitif yang Mendasari Peringkat

Model Proses Penilaian

Prosesnya dimulai dengan pengamatan karyawan oleh supervisor. Selanjutnya,

Isi Efektivitas Bawahan

Mengetahui bagian teknis pekerjaan

Ketepatan kerja kehadiran

Werner menyarankan bahwa keempat dimensi ini mungkin mewakili karakteristik

Bias dan Kesalahan Penilai

Meskipun pola penilaian serupa mungkin menunjukkan kesalahan penilaian, ada

Dimensi Karyawan 1 Karyawan 2 Karyawan 3 Karyawan 4

Kontrol Bias dan Kesalahan Penilai

Dimensi Karyawan 1 Karyawan 2 Karyawan 3 Karyawan 4

Formulir Tahan Kesalahan untuk Menilai Kinerja

Pelatihan Penilai untuk Mengurangi Kesalahan

Kehadiran __