Anda di halaman 1dari 19

BAB 2

KINERJA JANGKA PANJANG DAN BIAS EVALUASI SUPERVISOR

Abstrak

Jurnal ini membahas bagaimana penggunaan evaluasi kinerja subyektif dan pengenalan penilaian
menengah untuk meningkatkan cakrawala waktu manajerial terkait dengan bias kelonggaran dan
bias terpusat. Kami menyelidiki insiden "bias evaluasi pengawas dalam sistem insentif dua tahunan
dalam administrasi publik Italia. Dengan menggunakan laporan kinerja untuk 106 karyawan selama
tiga periode evaluasi dua tahunan (2001-2006), kami menganalisis supervisor "bias evaluasi
intertemporal. Kami menemukan bukti untuk peringkat kinerja yang bagus dan terkompresi
terutama pada tahun kedua setiap periode evaluasi dua tahunan. Kami menjelaskan bias ini, dan
variasi intertemporal mereka, oleh supervisor "penekanan relatif pada metrik kinerja subjektif dan
objektif. Kami menganalisis lebih lanjut pengaruh kategorisasi kinerja dan menemukan bahwa
keringanan keringanan ditingkatkan untuk peringkat lebih dekat ke batas bawah setiap kategori
kinerja. Hasilnya memiliki implikasi penting untuk memahami pengawas trade-off saat meningkatkan
bawahan mereka "kinerja jangka panjang, dan akurasi pengukuran kinerja jangka pendek.

Kata kunci: evaluasi kinerja, bias kelonggaran, bias sentralitas, kinerja jangka panjang

2.1. Pengantar
Sistem pembayaran yang terkait dengan kinerja (PRP) biasanya dituduh menekankan kinerja
manajerial jangka pendek, dengan biaya kepada manajer "memperhatikan tujuan jangka panjang
(Laverty, 1996, 2004; Marginson and McAulay, 2008). Salah satu alasannya adalah bahwa kinerja
jangka pendek dapat diukur berdasarkan kriteria obyektif dan tepat waktu. Namun, pengenalan
penilaian subyektif meningkatkan keakuratan langkah-langkah objektif yang mengurangi ketepatan
waktu evaluasi. Dalam jangka panjang, ketika beberapa periode dilibatkan, kerugian dari hilangnya
ketepatan waktu dikompensasikan dengan peningkatan kualitas umpan balik. Dengan menggunakan
estimasi subjektif, dimungkinkan untuk menangkap usaha jangka panjang dan mengarahkan hasil
masa depan pada jalur jangka panjang. Oleh karena itu, ketika supervisor berusaha untuk
meningkatkan bawahan mereka "fokus pada kinerja jangka panjang, mereka menghadapi trade-off
antara efek positif potensial dengan memperkenalkan kriteria subjektif yang meningkatkan
cakrawala waktu manajerial (Baker et al., 1994; Baiman dan Rajan, 1995) , dan risiko untuk
memperkenalkan bias evaluasi seperti keringanan dan sentralitas (Prendergast dan Topel, 1993,
1996; Rynes et al., 2005).

Sebagai pengganti sistem bonus bank yang canggih (Van der Stede, 2009), sebuah organisasi dapat
menekankan fokus pada jangka panjang dengan memperpanjang cakrawala waktu melalui
pengenalan evaluasi menengah yang sesuai dengan insentif moneter akhir. Dalam kasus seperti itu,
jenis evaluasi dan tujuan yang dirasakannya, baik administratif maupun pembangunan,
mempengaruhi bias potensial dari penilaian subyektif (Bernardin dan Orban, 1990).
Untuk mendokumentasikan dampak trade-off antara efek positif potensial dari subjektivitas dan
risiko bias evaluasi, kami mempelajari laporan kinerja yang dikumpulkan selama periode enam tahun
(2001-2006) dari sampel 106 manajer dalam administrasi publik Italia (IPA ). Sistem PRP yang
diperkenalkan di IPA ini bertujuan untuk mendorong para manajer "upaya jangka panjang dan
memudahkan para supervisor" mengevaluasi upaya tersebut. Dengan demikian, sistem ini
menggabungkan penggunaan berbagai kuantitatif dan kualitatif target kinerja dan periode evaluasi
dua tahunan. Periode dua tahunan dengan evaluasi menengah dan penilaian akhir memungkinkan
penyelidikan tentang dampak berbeda dari bias subyektif. Kami percaya bahwa kombinasi ini
memberikan pengaturan lapangan yang menarik yang melengkapi desain penelitian eksperimental
tradisional, yang mungkin kurang valid pada waktu biasa (Merchant et al., 2010).

Jurnal ini memberikan kontribusi pada literatur mengenai sistem evaluasi kinerja dengan
mempertimbangkan bahwa penerapan tindakan subjektif memperkenalkan risiko bias evaluasi,
namun bias tersebut dapat berbeda sesuai dengan waktu evaluasi dan tujuan yang dirasakannya.
Secara khusus, kami mencoba menjawab seruan untuk data deret waktu yang memberikan bukti
tentang terus-menerus bias evaluasi selama periode yang lebih lama dan bagaimana pengaruhnya
berubah dari waktu ke waktu (Moers, 2005; Bol, 2011). Sepengetahuan kami, penelitian ini adalah
yang pertama menggunakan data dari beberapa tahun evaluasi kinerja untuk mengamati perubahan
perilaku evaluator di penggunaan subjektivitas mereka Kami memperluas literatur sebelumnya
dengan menganalisis sejauh mana variasi distorsi sesuai dengan horison waktu evaluasi. Temuan
kami menunjukkan bias kelonggaran yang lebih rendah dan bias sentralitas yang rendah dalam
evaluasi menengah dibandingkan dengan evaluasi akhir. Hasilnya menunjukkan bahwa supervisor
mengelola peran ganda mereka sebagai evaluator dan motivator, menyesuaikan penilaian secara
berbeda tergantung pada tahun evaluasi. Ada keuntungan untuk memiliki informasi tentang
peringkat yang diberikan oleh evaluator yang menggabungkan kedua peran ini dalam jendela waktu
yang sama untuk organisasi yang sama. Informasi ini memungkinkan perbaikan dari pekerjaan
sebelumnya, yang mempertimbangkan dua aspek evaluator "peran dengan menganalisis berbagai
organisasi secara bersamaan (Bernardin dan Orban, 1990) atau dengan mendorong dan
memaksakan evaluasi pada waktu tertentu (Greguras et al., 2003).

Sisa kertas disusun sebagai berikut. Bagian 2.2 menyajikan rangkaian penelitian kami dan
memberikan gambaran umum tentang perancangan sistem evaluasi kinerja dua tahunan. Bagian 2.3
mengulas literatur dan mengembangkan hipotesis khusus. Bagian 2.4 menjelaskan metode analisis,
dan Bagian 2.5 membahas hasilnya. Akhirnya, Bagian 2.6 merangkum tulisan ini, menyajikan
kesimpulan dari penelitian kami dan membahas kekuatan dan kelemahan relatifnya.

2.2. Pengaturan penelitian

Kami menganalisis sistem PRP dalam administrasi publik Italia (IPA) yang menggunakan siklus
evaluasi dua tahunan. Beberapa latar belakang organisasi dan perancangan dan pemikiran sistem
penilaian kinerja dua tahunannya disajikan di bawah ini. IPA dalam penelitian ini menyediakan
layanan pemerintah di wilayah sekitar 500.000 warga. Layanannya beragam, mulai dari perawatan
jalanan hingga perawatan kesehatan.
Ini terdiri dari dewan yang terpilih secara publik yang mengawasi beberapa departemen operasional.
Departemen ini dipimpin oleh seorang manajer umum yang mengawasi para manajer kantor pusat.
Analisis kami berfokus pada hubungan antara supervisor dan manajer (Gambar 1). Pada gilirannya,
manajer kantor pusat mengawasi serangkaian direktur yang bertanggung jawab atas kantor
fungsional. Jumlah departemen, kantor pusat dan kantor fungsional secara periodik tunduk pada
reorganisasi atau modifikasi yang diendapkan oleh perubahan politik. Selama periode analisis (2001-
2006), rata-rata ada 17 manajer umum, 67 manajer, dan 198 direktur. IPA, secara keseluruhan,
mempekerjakan lebih dari 4.000 karyawan.

Pengenalan sistem pembayaran terkait kinerja didasarkan pada peraturan nasional yang resmi yang
diperkenalkan di Italia pada tahun 1992 dan 1993 yang bertujuan mengalihkan perhatian dari
"tindakan" terhadap "hasil" di sektor publik dan untuk memperbaiki tanggung jawab manajerial.
Sementara legislator "tujuan keseluruhan adalah untuk meningkatkan efikasi, efisiensi, kualitas, dan
transparansi di dalam sektor publik, undang-undang tersebut memperkenalkan peraturan khusus
untuk pengelolaan sumber daya manusia dan gaji terkait kinerja. Secara khusus, ini mengamanatkan
"pemisahan antara tugas politik dan administratif" di tingkat manajerial, "evaluasi hasil yang
dilakukan oleh komite khusus yang disusun oleh para ahli dan manajer umum", dan penerapan
insentif "yang terkait dengan produktivitas individu dan kelompok yang ditentukan dengan prosedur
pengukuran dan evaluasi yang tepat "alih-alih" otomatisme "sebelumnya yang digunakan untuk
menetapkan penghargaan finansial (undang-undang 1992).
Pada tahun 1997, IPA mengakui undang-undang nasional dengan norma lokal tertentu. Berbeda
dengan administrasi publik lainnya, IPA ini mengikuti sesi berikut ini: "Evaluasi manajerial dilakukan
setiap dua tahun [...] dengan mengacu pada hasil yang dicapai" (undang-undang 1997). Motivasinya
ada dua. Pertama, periode dua tahun diyakini bisa mengurangi miopia karena akan
"mempertimbangkan tren kinerja dalam perspektif yang lebih panjang". Kedua, ini dimaksudkan
untuk meningkatkan kualitas evaluasi kinerja karena kinerja tahunan dianggap tunduk pada
"penilaian yang keliru karena kontingensi yang tidak biasa atau sementara".

IPA menerapkan sistem PRP yang kami pelajari pada tahun 2000, berdasarkan pengangkatan komite
evaluasi spesifik yang akan mengembangkan prosedur evaluasi kinerja sesuai dengan pedoman
legislatif dan membantu supervisor dalam melakukan evaluasi individual. Hasil evaluasi digunakan
untuk menetapkan insentif dan untuk mengkonfirmasi penugasan posisi manajerial. Sistem PRP
bekerja seperti dijelaskan di bawah ini, dengan beberapa perbedaan tergantung pada tahun di
bawah penilaian. Sejumlah langkah diambil selama tahun pertama periode evaluasi. Pertama, dewan
politik mendefinisikan rencana strategis dan, kemudian, bersama dengan manajer umum
menyiapkan tujuan dan target yang ingin dicapai. Kedua, menarik dari daftar tujuan, manajer umum
membuat formulir evaluasi kinerja untuk setiap manajer, menambahkan bobot yang sesuai. Formulir
evaluasi kemudian divalidasi oleh panitia evaluasi. Ketiga, pada akhir tahun, manajer umum
mengevaluasi kinerja melalui penetapan penilaian yang sesuai dengan tujuan (yaitu, evaluasi
menengah), dan formulirnya kemudian divalidasi. Pada titik ini, uang muka insentif diberikan pada
para manajer. Jumlahnya sama untuk semua orang dan terkait dengan tingkat kinerja rata-rata
semua manajer. Prosedur untuk tahun kedua agak berbeda karena dianggap kelanjutan dari tahun
sebelumnya. Pertama, tahun dimulai dengan revisi bentuk evaluasi oleh manajer umum, yang
diizinkan melakukan perubahan kecil, seperti mengganti beberapa indikator dan menyesuaikan
target sesuai dengan kontinjensi. Selanjutnya, pada akhir tahun kedua, penilaian dilakukan secara
analog ke tahun sebelumnya. Ketiga, peringkat antara dan akhir untuk setiap manajer dirata-ratakan
dan diklasifikasikan menurut kategori insentif yang telah diidentifikasi sebelumnya. Saldo insentif
dibayarkan kepada para manajer sesuai dengan kategori ini. Revisi rencana strategis yang lebih
dalam, redefinisi utama dari tujuan, dan perubahan prosedur dimungkinkan antara periode dua
tahunan, ketika evaluasi sebelumnya akhirnya ditutup. Gambar 2 menunjukkan garis waktu
keseluruhan siklus evaluasi kinerja.
Rencana insentif

Di IPA, selain gaji tetap, insentif diberikan kepada manajer berdasarkan hasil evaluasi kinerja.
Evaluasi tersebut menyangkut dua dimensi: hasil yang diperoleh selama periode dan perilaku
manajerial. Hasilnya dinilai dengan bobot tiga kelompok sasaran kualitatif dan kuantitatif. Indikator
kinerja untuk setiap manajer ditunjuk secara bersama oleh manajer umum dan dewan politik 1.
Terlepas dari kompetensi heterogen organisasi secara keseluruhan, masing-masing kantor pusat
difokuskan pada sektor tertentu dan wilayah tanggung jawab tertentu 2. Akibatnya, ukuran dan
target yang terlibat dalam evaluasi kinerja disesuaikan untuk setiap manajer. Evaluator memberikan
skor antara 1 dan 5 untuk setiap target kinerja, tergantung pada tingkat pencapaiannya, dan
kemudian, penilaian akhir diklasifikasikan dalam kategori insentif yang sesuai di antara enam
kemungkinan pilihan. Struktur bentuk evaluasi kinerja direproduksi pada Gambar 3.
Keseluruhan proses disintesis sebagai berikut:

Pada persamaan pertama, n, m, dan s adalah jumlah ukuran kinerja dalam kelompok A, B, dan C,
masing-masing, wA, wB, dan wC adalah bobot yang terkait dengan kelompok A, B, dan C, masing-
masing, dan Obji , Objj , dan Objk adalah tujuan yang termasuk dalam kelompok A, B, dan C. Pada
persamaan kedua, berat adalah bobot yang diterapkan pada setiap faktor yang dievaluasi. Pada
persamaan ketiga, w1 dan w2 adalah bobot yang terkait dengan hasil dan perilaku organisasi.

2.3. Latar belakang teoritis dan hipotesis

Teori agensi menunjukkan bahwa sistem PRP digunakan sebagai respons terhadap masalah
keagenan dan bahwa memilih ukuran kinerja yang informatif dan lengkap meningkatkan kinerja
sebuah organisasi melalui peningkatan usaha manajerial. Karena prinsip-prinsip keakuratan dan
kelengkapan tidak terpenuhi oleh penerapan ukuran kuantitatif (yaitu, tujuan) semata-mata dalam
kontrak insentif (Holmstrm, 1979), kontrak agen yang optimal juga mencakup tindakan kualitatif
(yaitu subyektif). Subjektivitas mempengaruhi penetapan insentif setidaknya dalam empat cara yang
berbeda: ukuran subjektif (Baker et al, 1994), bobot subjektif (Ittner et al., 2003), bonus subyektif
(Gibbs et al., 2004), dan penyesuaian subyektif ( Woods, 2009).

Namun, pengenalan subjektivitas datang dengan mengorbankan penilaian yang berpotensi tidak adil
dan bias oleh evaluator yang tidak hanya memiliki insentif untuk menerapkan penilaian semacam itu
tetapi juga dapat dikenai bias kognitif. Motivasi psikologis, seperti biaya untuk mengkomunikasikan
evaluasi yang buruk, kecenderungan untuk memilih karyawan tertentu karena pertimbangan politik,
dan preferensi untuk kesetaraan penghargaan di antara karyawan, mendistorsi peringkat pengawas
(Prendergast dan Topel, 1993). Dengan demikian, literatur tentang akuntansi manajemen
menggunakan teori psikologis dalam mempelajari faktor-faktor penentu dan dampak penilaian yang
bias.

Moers (2005) menemukan bahwa penerapan beberapa ukuran kinerja dan pengenalan penilaian
subyektif merupakan faktor penentu bias penilaian yang signifikan seperti keringanan dan
kewaspadaan. Bol (2011) memberikan bukti hubungan positif antara supervisor "biaya penilaian,
seperti pengumpulan informasi dan biaya konfrontasi, dan penilaian yang bias. Selain itu, penilaian
bias ini mempengaruhi kinerja dan insentif karyawan masa depan baik secara positif maupun
negatif. Bertolak belakang dengan mayoritas temuan, bias bias maupun bias sentralitas dari
peringkat subyektif muncul dalam studi Merchant et al. (2010). Namun, mereka merasa keringanan
dalam ukuran yang obyektif pada saat tekanan ekonomi.
Kesalahan yang paling umum adalah bias kelonggaran, bias sentralitas, dan batasan jangkauan. Bias
kelonggaran adalah kecenderungan evaluator untuk memberikan penilaian kinerja lebih tinggi
daripada yang dibenarkan oleh kinerja karyawan sedangkan bias sentralitas dan batasan jangkauan
muncul dari kecenderungan evaluator untuk memberikan penilaian kinerja terkompresi yang tidak
membedakan antara karyawan. Bias ini disebut kesalahan distribusi (Murphy dan Cleveland, 1995)
karena dapat diamati saat distribusi rating aktual berbeda dari distribusi yang diasumsikan untuk
kinerja pekerjaan. Misalnya, jika kita mengharapkan distribusi peringkat normal, penyimpangan dari
normalitas adalah bukti bias. Namun, perbandingan dengan distribusi hipotetis tidak sepenuhnya
dapat diandalkan mengingat sebuah organisasi berusaha untuk memiliki mayoritas pegawai
berprestasi, yang pada gilirannya menciptakan distribusi asimetris. Penelitian menunjukkan bahwa
evaluator lebih cenderung mendistorsi peringkat ketika mereka memiliki konsekuensi keuangan
langsung untuk bawahan mereka (Prendergast dan Topel, 1993).

Dalam penelitian ini, kami memberikan beberapa wawasan tentang bagaimana perancangan sistem
evaluasi kinerja yang bertujuan untuk meningkatkan bawahan "fokus pada tujuan jangka panjang
mengarah pada bias evaluasi. Secara khusus, pengenalan penilaian subyektif dan horison waktu
evaluasi merupakan elemen penting yang mempengaruhi perilaku manajer umum yang harus
meninjau kembali pekerjaan manajer. Kita mulai dengan memeriksa apakah penilaian subyektif
mengarah pada bias evaluasi kinerja sebagaimana telah dibuktikan dalam literatur. Kemudian, kami
berkontribusi dengan mempelajari bagaimana cakrawala waktu siklus evaluasi berpengaruh
terhadap perilaku evaluator dan evaluasi bias mereka.

Subyektivitas
Menurut literatur, dibandingkan dengan penggunaan mereka sebagai masukan kinerja, penggunaan
peringkat kinerja untuk tujuan insentif dan keputusan promosi mengarah pada penilaian yang
kurang dapat diandalkan. Ketika implikasi moneter atau promosi karir dilibatkan, faktor psikologis
merangsang sikap implisit supervisor untuk mengubah peringkat kinerja. Penerapan ukuran kinerja
discretionary memungkinkan supervisor untuk menyesuaikan penilaian sesuai dengan faktor
kontingen, tak terduga, atau tidak terkendali. Pada saat yang sama, penilaian subyektif adalah cara
untuk bias mengevaluasi pencapaian pencapaian dan diferensiasi antar karyawan. Oleh karena itu,
kami berharap dapat menemukan bukti peringkat bias ketika penilaian subjektif mengenai ukuran
kinerja kualitatif dibandingkan dengan peringkat yang ditetapkan secara objektif terhadap ukuran
kinerja kuantitatif. Secara formal, kami berhipotesis berikut ini:

HP 1A: Dibandingkan dengan evaluasi obyektif, penilaian subjektif menghasilkan peringkat kinerja
yang lunak.

HP 1B: Dibandingkan dengan evaluasi obyektif, penilaian subjektif mengarah pada penilaian kinerja
terkompresi.

Cakrawala waktu

Kecenderungan kelonggaran adalah karakteristik pengawas yang biasanya diamati dalam satu
periode evaluasi tunggal; hanya beberapa penelitian yang melaporkan bukti kecenderungan ini di
berbagai periode evaluasi. Guilford (1954) berhipotesis untuk pertama kalinya stabilitas perilaku
tersebut, dan Kane et al. (1995) mengkonfirmasi efek tersebut dalam tiga sampel dan situasi yang
berbeda. Atas dasar temuan ini, kami berharap bias terus berlanjut dari waktu ke waktu; Namun,
kami tidak mengharapkan tingkat besarnya yang sama di berbagai periode evaluasi. Jangka waktu
evaluasi dan frekuensi evaluasi adalah dua elemen yang mempengaruhi perilaku supervisor. Dalam
pengaturan evaluasi multi-periode, di mana trade-off antara efek positif dari tindakan subjektif
untuk meningkatkan fokus manajerial pada kinerja jangka panjang dan risiko untuk menerapkan bias
evaluasi ditekankan, kami mengharapkan bukti positif mengenai kelonggaran dan kewaspadaan
namun berbeda tingkat bias untuk setiap periode dalam putaran evaluasi yang sama.

Dapat dikatakan bahwa supervisor mempertimbangkan sifat evaluasi ganda. Di satu sisi, dari peran
evaluator, tingkat keparahan, keadilan dan objektivitas tertentu diharapkan oleh karyawan (Kahn et
al., 1964; Katz and Kahn, 1978). Di sisi lain, jumlah insentif yang memuaskan diharapkan oleh
individu untuk meningkatkan tingkat sasaran dan komitmen mereka untuk mencapai tujuan,
sehingga meningkatkan kinerjanya (Locke dan Latham, 1990, 2002). Kedua harapan ini sesuai
dengan berbagai tujuan evaluasi. Literatur penilaian kinerja telah menemukan bahwa pengawas
bersikap berbeda saat tujuan penilaian bersifat administratif dan bukan terkait pembangunan.
Taylor dan Wherry (1951) melakukan salah satu studi pertama yang meneliti hubungan antara
tujuan penilaian kinerja dan akurasi peringkat kinerja. Mereka memberikan bukti bahwa peringkat
yang ditugaskan pada tujuan pengembangan, seperti umpan balik dan penelitian, lebih akurat dan
kurang lunak daripada peringkat yang ditugaskan pada tujuan administratif, seperti kenaikan gaji,
promosi, dan bonus. Penelitian yang lebih baru telah mengkonfirmasi pengaruh tujuan penilaian
terhadap hasil evaluasi, khususnya, keringanan evaluasi yang lebih besar yang dilakukan untuk
insentif dan promosi dibandingkan dengan evaluasi yang dilakukan untuk umpan balik (Bernardin
dan Orban, 1990; Harris et al., 1995). Greguras dkk. (2003) mempertimbangkan tiga alasan utama
yang secara teoritis menjelaskan pengaruh tujuan pemeringkatan terhadap keakuratan evaluasi.
Pertama, motivasi atasan dipengaruhi oleh tujuan penilaian; Kedua, konflik bisa muncul antara peran
atasan dalam organisasi dan tujuan penilaian; dan ketiga, kemampuan dan proses kognitif pengawas
berubah, tergantung pada tujuan penilaian. Namun, tidak semua studi sesuai dengan kesimpulan
sebelumnya; misalnya, McIntyre dkk. (1984) tidak menemukan perbedaan yang signifikan antara
peringkat yang ditugaskan untuk tujuan yang berbeda. Untuk memperjelas alasan yang mendasari
ketidakkonsistenan dalam literatur, Jawahar dan Williams (1997) memberikan meta-analisis
ekstensif mengenai efek dari tujuan penilaian kinerja. Dengan memeriksa 22 studi, mereka
menyimpulkan bahwa peringkat administratif lebih ringan daripada penilaian umpan balik ketika
manajer dalam organisasi nyata mengevaluasi bawahan nyata. Ketidakkonsistenan muncul saat
siswa dilibatkan dalam evaluasi, saat setting adalah laboratorium, saat kertas atau rekaman video
orang menjadi subjek evaluasi, dan saat atasan dievaluasi alih-alih bawahan.

Menurut literatur, dua tujuan (umpan balik dan penetapan insentif) mengarah pada evaluasi yang
berbeda, dan supervisor menghadapi masalah untuk mengimbangi kedua kekuatan tersebut.
Biasanya, trade-off harus dipecahkan oleh manajer umum pada saat evaluasi, namun dalam konteks
periode evaluasi diperpanjang, dengan evaluasi menengah setelah tahun pertama, evaluator lebih
cenderung untuk membagi perilaku kontras antara dua tahun Di satu sisi, menurut literatur
sebelumnya (Taylor dan Wherry, 1951), peringkat yang ditetapkan pada akhir tahun terakhir
memiliki dampak langsung pada pembayaran karyawan. Pengawas "evaluasi memang lebih
cenderung meningkat untuk memotivasi subjek dan meningkatkan bonus mereka. Di sisi lain,
peringkat yang ditugaskan dalam evaluasi menengah tidak memiliki dampak langsung dan langsung
terhadap pembayaran insentif; mereka dianggap sebagai umpan balik yang menyoroti kontribusi
efektif karyawan terhadap kinerja perusahaan. Oleh karena itu, supervisor "kesadaran akan
kemungkinan besar kenaikan peringkat dalam evaluasi akhir meningkatkan kecenderungan mereka
untuk memberikan umpan balik yang parah dan untuk menghindari peningkatan penilaian antara.

Akhirnya, kesadaran akan potensi kenaikan peringkat pada tahun-tahun yang berbeda berdampak
pada supervisor "kecenderungan menuju sentralitas. Secara khusus, dalam evaluasi menengah,
supervisor lebih cenderung kurang sentral dan untuk meningkatkan diferensiasi di antara karyawan.
Selain itu, variasi rating lebih tinggi karena nilainya lebih realistis; Mereka tidak secara subjektif
meningkat seperti pada evaluasi akhir. Sebaliknya, dalam evaluasi akhir, distribusi peringkat yang
lebih sentral lebih mungkin untuk diverifikasi karena supervisor cenderung mengurangi kisaran
peringkat terhadap nilai-nilai tersebut di bagian atas skala evaluasi yang bertujuan untuk memberi
penghargaan kepada karyawan. Lebih khusus lagi, dalam setting dua tahun, kami memperkirakan
tingkat bias pengembalian yang rendah di antara peringkat dan penekanan penilaian yang lebih
rendah, yaitu bias sentralitas yang lebih rendah, di tahun pertama. Secara formal, kami berhipotesis
berikut ini:

HP 2A: Peringkat kinerja kurang lunak dalam evaluasi menengah daripada evaluasi akhir.

HP 2B: Peringkat kinerja kurang penting dalam evaluasi menengah daripada evaluasi akhir.

Masalah lain yang terkait dengan horison waktu evaluasi menyangkut pengaruh kategori kinerja
terhadap penetapan peringkat oleh manajer umum. Secara khusus, tingkat batas masing-masing
kategori berperan penting saat kelonggaran mendominasi, seperti pada evaluasi akhir.

Bila peringkat akhir dihitung, jumlah insentif dibayarkan secara proporsional ke tingkat pencapaian
atau menurut kategori kinerja diskrit. Namun, penggunaan ambang mempengaruhi supervisor untuk
berperilaku seolah-olah mereka adalah bagian dari sistem manajemen laba (Degeorge et al., 1999).
Batas kategori insentif dianggap sebagai target yang telah ditentukan untuk dipilih oleh individu
terpilih. Peringkat kinerja yang melampaui ambang kategori insentif oleh beberapa skor diharapkan
lebih ringan, dan karenanya lebih bias, dari pada Peringkat yang lebih dekat ke ambang atas namun
tidak mencapainya. Menurut pembahasan sebelumnya, kami berharap perilaku ini ditekankan lebih
banyak selama evaluasi akhir, ketika bias keringanan lebih tinggi daripada evaluasi menengah.
Secara formal, kami berhipotesis berikut ini:

HP 3: Peringkat kinerja akhir lebih dekat ke ambang bawah kategori insentif lebih lunak daripada
peringkat kinerja lainnya.

2.4. Desain penelitian

Sampel Untuk mempelajari dampak insentif multi tahun terhadap bias upaya dan evaluasi, kami
mengumpulkan laporan kinerja untuk 106 manajer selama tiga periode yang lengkap yang berkisar
antara tahun 2001 sampai 2006. Jumlah total laporan yang dikumpulkan adalah 404, dengan rata-
rata 67 manajer "melaporkan per tahun. Dengan mengumpulkan dokumen tambahan, seperti
resolusi dan pedoman metodologis, dan mengelola beberapa wawancara informal, kami
memperoleh pemahaman yang lebih dalam tentang rencana insentif yang diadopsi oleh IPA.
Misalnya, dengan menggunakan grid tertentu, rata-rata dua tahunan dihitung dan diberikan ke
masing-masing kategori insentif.
Seperti disebutkan sebelumnya, kombinasi tujuan kualitatif dan kuantitatif digunakan untuk menilai
hasilnya. Kehadiran kedua jenis tindakan sangat penting untuk membuat perbandingan antara
penilaian kinerja 3. Namun, beberapa manajer yang terlibat dalam sektor dan tugas tertentu
dievaluasi hanya dengan tindakan kualitatif dan dengan demikian dikecualikan dari sampel. Orang
yang bertanggung jawab atas prosedur evaluasi menjelaskan bahwa pengukuran kuantitatif dinilai
secara objektif oleh masing-masing evaluator dengan menerapkan aturan matematis penyimpangan
dari target. Idealnya, evaluator harus mengikuti peraturan yang sama untuk tindakan kualitatif,
namun secara realistis, subjektivitas sangat terlibat. Selanjutnya, dia memberikan beberapa contoh
dari kedua jenis tindakan tersebut untuk memudahkan pemahaman yang lebih baik mengenai
perbedaan di antara keduanya. Contoh ukuran kuantitatif mencakup "130.000 sertifikat yang
dikeluarkan", "72 proyek dibiayai", "meningkat 2 persen dari tingkat tahun sebelumnya" sementara
tindakan kualitatif mencakup "penyusunan proposal", "untuk memberikan dukungan kepada
konsultan eksternal", "Untuk melakukan analisis pasar dan laporan akhir". Dua peneliti independen
melanjutkan dengan klasifikasi target untuk membedakan antara ukuran kinerja kualitatif dan
kuantitatif. Pada akhir proses, peneliti ketiga mengadili beberapa kasus ketidaksetujuan,
memberikan bukti klasifikasi yang kuat. Hasil dari prosedur seleksi adalah sampel yang terdiri dari
257 laporan kinerja untuk 91 manajer. Selanjutnya, untuk melakukan perbandingan yang signifikan
antara penilaian, kami melakukan analisis kami yang berfokus pada bagian formulir evaluasi yang
didedikasikan untuk hasil manajerial.

Variabel

Variabel dependen

Perbandingan antara rata-rata peringkat kinerja yang ditetapkan pada ukuran kinerja kualitatif dan
kuantitatif untuk setiap manajer adalah langkah pertama analisis yang mendeteksi adanya bias
keringanan. Seperti yang dijelaskan sebelumnya, bias keringanan adalah kecenderungan evaluator
untuk memberikan peringkat lebih tinggi kepada karyawan daripada yang mereka dapatkan atas
dasar kinerjanya. Variabel RATING mencakup dua ukuran kinerja, kualitatif dan kuantitatif, dihitung
secara terpisah untuk setiap tahun dan untuk setiap manajer dalam sampel.

Untuk menentukan apakah penilaian kinerja bias, kita harus membandingkan peringkat rata-rata
yang ditetapkan dengan ukuran kinerja kualitatif dengan peringkat rata-rata yang ditetapkan untuk
ukuran kinerja kuantitatif. Jika subjektivitas dalam evaluasi tindakan kualitatif mengarah pada bias
kelonggaran dan bias sentralitas, kami berharap dapat menemukan, rata-rata, peringkat kualitatif
yang lebih besar dan kurang tersebar dibandingkan dengan peringkat kuantitatif.

Perbedaan antara manajer diukur dalam hal kompresi kinerja peringkat. Peringkat kualitatif yang
kurang terdistribusi dibandingkan dengan distribusi peringkat kuantitatif adalah bukti bias
sentralitas. Untuk membuat kelompok referensi untuk membandingkan kompresi peringkat, kami
menggunakan jumlah total manajer yang dipekerjakan setiap tahun dan jumlah total manajer yang
dipekerjakan di setiap departemen setiap tahunnya. Untuk dua kelompok referensi yang mungkin,
kami menghitung rasio antara penilaian kualitatif dan kuantitatif individu dan peringkat rata-rata
masing-masing kelompok referensi, dan kami memperoleh variabel dependen yang digunakan untuk
menemukan adanya bias sentralitas (RATIO_RAT dan RATIO_RAT_BYDPT).
Variabel independen dan kontrol

Untuk menguji hubungan antara bias dan subjektivitas, variabel dummy digunakan untuk
mengkodekan apakah penilaian terkait dengan target kualitatif atau target kuantitatif (D_SUB).

Untuk mengendalikan penjelasan alternatif mengenai perbedaan antara penilaian kualitatif dan
kuantitatif (selain bias evaluasi), kami memasukkan dalam model baik jumlah ukuran kinerja yang
digunakan untuk menghitung nilai rata-rata (N_PM) dan jumlah bobot yang ditetapkan dalam
ukuran ( W_SUM). Karakteristik lain dari pekerja dan lingkungan kerja yang mempengaruhi peringkat
dipertimbangkan dalam pengendalian kami: jenis kelamin manajer (GENDER), adanya evaluasi
sebelumnya di posisi manajerial (FIRST_EV), jumlah rekan di departemen (N_COLL ), dan
departemen itu sendiri (DEP). Pengaruh waktu cakrawala dikendalikan dalam hal tahun evaluasi
dalam periode (FIRST_Y) dan periode evaluasi (PERIOD).

2.5 Hasil

Statistik deskriptif

Statistik utama yang dihitung untuk keseluruhan sampel menunjukkan peringkat kinerja
keseluruhan yang tinggi dan terkompresi (rata-rata 3,99 dan standar deviasi 0,37). Perbedaan antara
penilaian kualitatif dan peringkat kuantitatif menunjukkan dominasi mantan anggota yang terakhir.

Peringkat target kualitatif secara signifikan lebih tinggi (rata-rata 4,12 vs 3,87) dan lebih banyak
dikompresi (standar deviasi 0,37 vs 0,60) daripada peringkat pengukuran kinerja kuantitatif. Jumlah
ukuran kinerja yang dipertimbangkan dalam evaluasi harus dibatasi untuk memfokuskan usaha yang
diberikan oleh manajer mengenai prioritas organisasi. Rata-rata, setiap individu dievaluasi pada 5,73
target kinerja, dengan target yang lebih kualitatif daripada kuantitatif (3,88 vs 1,84). Akhirnya,
jumlah manajer di setiap departemen bervariasi dari 1 sampai 8 dengan rata-rata sekitar tiga
individu. Ringkasan statistik deskriptif disajikan pada Tabel 1, dan korelasi antara variabel disajikan
pada Tabel 2.
Statistik deskriptif untuk setiap tahun mengkonfirmasi pola keseluruhan sampel (Tabel 3). Peringkat
kinerja keseluruhan konstan selama bertahun-tahun, dan peringkat kualitatif tetap lebih tinggi dan
lebih terkompresi daripada peringkat kualitatif. Satu-satunya perbedaan penting adalah penurunan
progresif dalam jumlah ukuran kinerja, dari lebih dari enam di tahun 2001 dan 2002 menjadi lima di
tahun 2006, dan sedikit peningkatan jumlah target kuantitatif mengenai target kualitatif. Misalnya,
selama lima tahun terakhir, rasio kuantitatif terhadap target kualitatif meningkat dari proporsi 30
sampai 70 persen menjadi 37 sampai 63 persen.
Subyektivitas

Kehadiran bias kelonggaran dan kewaspadaan diselidiki dengan memeriksa perbedaan antara
peringkat yang ditetapkan pada target kualitatif dan target penempatan kuantitatif. Konsisten
dengan literatur, kita asumsikan bahwa tugas yang dinilai menggunakan dua tipologi target dapat
dibandingkan dalam hal kompleksitas dan bahwa usaha yang dilakukan oleh manajer tidak berbeda
secara signifikan 4. Dengan tidak adanya bias, peringkat untuk ukuran kualitatif dan kuantitatif
diharapkan memiliki nilai rata-rata dan distribusi yang sama.

Untuk menguji terjadinya bias keringanan, kami menggunakan penilaian kualitatif dan kuantitatif
yang diberikan oleh evaluator sebagai variabel dependen (RATING), dan kami membedakan dua
tipologi untuk pengukuran ini menggunakan indikator dummy sebagai variabel independen (D_SUB).
Kami untuk pengaruh potensial pada tingkat kinerja dan peringkat. Model ini diestimasi dengan
menggunakan regresi OLS gabungan dengan kesalahan standar yang kuat yang dikelompokkan oleh
manajer. Hasilnya disajikan pada Tabel 4. Kami menemukan bukti bias kelonggaran karena koefisien
D_SUB (p <0,01) positif dan signifikan menunjukkan bahwa peringkat yang ditetapkan pada ukuran
kinerja kualitatif rata-rata lebih tinggi dari peringkat yang ditetapkan pada pengukuran kinerja
kuantitatif. . Selain itu, tingkat kinerja secara signifikan (negatif) terkait dengan jumlah ukuran
kinerja dan jumlah rekan kerja di departemen. Bila kinerja diukur dengan menggunakan banyak
target, tingkat cenderung lebih rendah karena usaha pekerja kurang terfokus dan karena lebih sulit
mencapai semua hasil yang diminta. Setelah mengendalikan variabel-variabel berpengaruh ini, data
kami memberikan dukungan untuk hipotesis 1A.

Kami menggunakan model yang sama dengan variabel dependen yang berbeda untuk memeriksa
apakah penilaian kualitatif lebih terkompresi daripada peringkat kuantitatif. Perbedaan yang
signifikan memberikan bukti bias sentralitas. Kami mendapatkan estimasi menggunakan regresi OLS
gabungan dan kelompok referensi yang berisi data untuk setiap tahun untuk semua manajer
(RATIO_RAT) atau manajer dari masing-masing departemen (RATIO_RAT_BYDPT).
RATING Peringkat kinerja kualitatif atau kuantitatif

Rasio RATIO_RAT antara penilaian kuantitatif individu (kualitatif) dan rata-rata penilaian
manajerial "kuantitatif (kualitatif) untuk setiap tahun: Max (rating / mean
rating; mean rating / rating)

RATIO_RAT_BYDPT Rasio antara peringkat kuantitatif individu (kualitatif) dan peringkat rata-rata
peringkat manajerial "kuantitatif (kualitatif) untuk setiap departemen dan
tahun: Max (rating / mean rating; mean rating / rating)

D_SUB Variabel Dummy sama dengan 1 jika pengamatan mengacu pada target
kualitatif dan sama dengan 0 sebaliknya

N_PM Jumlah ukuran kinerja kualitatif (kuantitatif)

W_SUM Jumlah bobot yang ditetapkan untuk pengukuran kinerja kualitatif


(kuantitatif)

GENDER Variabel Dummy sama dengan 1 jika manajer adalah laki-laki dan sama
dengan 0 sebaliknya

FIRST_EV Variabel dummy sama dengan 1 jika rating mengacu pada evaluasi pertama
manajer dan sama dengan 0 sebaliknya

N_COLL Jumlah rekan di departemen

FIRST_Y Dummy variable sama dengan 1 jika rating mengacu pada evaluasi
intermediate dan sama dengan 0 sebaliknya

Variabel dummy adalah variabel yang digunakan untuk mengkuantitatifkan variabel yang bersifat
kualitatif (misal: jenis kelamin, ras, agama, perubahan kebijakan pemerintah, perbedaan situasi dan
lain-lain).

Dalam model, istilah konstan dan variabel indikator departemen dan periode evaluasi disertakan
tetapi tidak dilaporkan.

Koefisien kolom pertama memberikan bukti peringkat kinerja yang lebih tinggi dari ukuran kualitatif
dibandingkan dengan ukuran kuantitatif baik dalam evaluasi tengah dan akhir.

Analisis istilah interaksi (D_SUB x FIRST_Y, p <0,01) menunjukkan bahwa peringkat kualitatif juga
lebih tinggi dalam evaluasi akhir daripada evaluasi antara yang menunjukkan tingkat kelonggaran
yang berbeda. Kolom kedua dan ketiga pada Tabel 5 memeriksa kompresi peringkat atau lebih
spesifik lagi adanya bias sentralitas setiap tahun (RATIO_RAT) dan menurut departemen dan tahun
(RATIO_RAT_BYDPT) seperti yang dijelaskan pada bagian sebelumnya. Semakin kecil rasio yang
digunakan sebagai variabel dependen semakin dekat adalah rating terhadap mean dan semakin
tinggi adalah sentralitasnya. Koefisien positif dan signifikan dari istilah interaksi menunjukkan bahwa
peringkat kinerja secara signifikan lebih penting dalam evaluasi akhir daripada dalam evaluasi
menengah (p <0,05). Temuan analisis regresi yang berfokus pada evaluasi antara dan akhir
mendukung hipotesis 2A dan 2B.
Konfirmasi lebih lanjut dilengkapi dengan perbandingan antara nilai kelonggaran dan standar deviasi
penilaian yang disajikan pada Tabel 6 dan Gambar 4. Untuk mengukur tingkat bias keringanan, kami
mengurangi peringkat yang sesuai yang ditetapkan pada ukuran kualitatif dari peringkat yang
ditetapkan dalam ukuran kuantitatif. Tingkat kelonggaran rata-rata di antara peringkat secara
signifikan lebih rendah pada tahun pertama setiap periode evaluasi dibandingkan dengan tahun
kedua periode yang sama (0,08 vs 0,45 pada periode pertama, 0,11 vs 0,40 pada periode kedua, dan
0,17 vs 0,60 di periode ketiga). Dengan uji tambahan, kami mengesampingkan kemungkinan
penjelasan alternatif bahwa tren tersebut disebabkan oleh regresi terhadap mean. Bahkan jika
nilainya selalu positif, peringkat evaluasi menengah kurang meningkat daripada evaluasi penutupan
karena evaluasi menengah lebih ditujukan untuk memberikan umpan balik kinerja daripada
memberi insentif kepada karyawan secara moneter. Namun, dalam evaluasi penutupan, evaluator
cenderung lebih lunak karena peringkat tersebut digunakan untuk menentukan jumlah insentif akhir.
Menurut hasil, hipotesis 2A sudah dikonfirmasi.

Seperti yang diverifikasi dalam hipotesis 2A mengenai kelalaian, evaluator "perilaku penilaian di
tahun pertama berbeda dengan tahun kedua, ketika harus membedakan manajer. Rasio standar
deviasi penilaian kualitatif antara tahun pertama dan kedua, selalu lebih tinggi daripada
rasio standar deviasi peringkat kuantitatif, , dalam semua periode yang dianalisis (1,49 vs 1,09
pada periode pertama, 1,40 vs 0,86 pada periode kedua, 1,53 vs 1,47 pada periode ketiga). Dengan
menerapkan rasio-rasio ini, kita menguraikan dua komponen utama variasi dalam kinerja manajer ":
variasi karena perubahan kinerja manajer yang efektif (data kuantitatif) dan variasi karena
evaluator" inflasi (data kualitatif). Perbedaan ini menunjukkan bahwa peringkat kinerja evaluasi
menengah kurang dikompres dari pada penilaian akhir. Rasio secara statistik signifikan untuk ketiga
periode tersebut. Dengan demikian, hipotesis 2B didukung.
Penentuan bias potensial lainnya adalah penggunaan kategori diskrit untuk pembayaran insentif dan
bukan sistem pembayaran proporsional berdasarkan tingkat kinerja yang dicapai. Penggunaan
ambang batas mendorong atasan untuk memilih di antara para manajer dan untuk mengendalikan
pencapaian tingkat kinerja. Dalam organisasi kami, ada enam kategori insentif yang saling berbeda
satu sama lain dalam hal nilai. Kategori terendah dan kategori tertinggi lebih luas karena masing-
masing residu di bawah dan di atas, pada tingkat tertentu. Untuk memeriksa apakah penggunaan
kategori mempengaruhi bias keringanan, kami menghitung nilai rata-ratanya di bawah dan di atas
jarak tertentu dari batas bawah. Kita menjatuhkan observasi pada kategori pertama karena batas
bawahnya nol dan karena perhitungan jarak tidak bisa diandalkan. Jika kita menggunakan jarak rata-
rata sebagai cut-off, tingkat kelonggaran rata-rata di bawah tingkat ini jauh lebih tinggi daripada
tingkat kelonggaran rata-rata di atas tingkat ini (0,34 vs 0,18; cut point 14). Jika kita mengurangi cut-
off menjadi lima, pola tersebut dikonfirmasi (0,46 vs 0,19). Selanjutnya, seperti yang ditunjukkan
pada Gambar 5, perbandingan antara evaluasi antara dan evaluasi akhir, mengingat kuartil pertama
sebagai titik potong, menunjukkan perbedaan yang tidak signifikan dalam keringanan dalam kasus
pertama (0,31 vs 0,15; cut point 9) dan a perbedaan yang signifikan pada kasus kedua (0,46 vs 0,21;
cut point 9). Oleh karena itu, hipotesis 3 didukung.
2.6. Diskusi dan kesimpulan

Penerapan perspektif perilaku terhadap studi akuntansi manajemen menyoroti isu-isu baru yang
terbengkalai oleh studi ekonomi tradisional. Pemahaman yang lebih baik tentang dampak pilihan
yang dibuat selama prosedur evaluasi dan perancangan kontrak insentif memungkinkan kontrol
manajerial lebih baik atas kinerja dan mengurangi konsekuensi tak terduga dan tidak diharapkan dari
sistem evaluasi yang tidak efisien. Keterlibatan penilaian subyektif dalam mengevaluasi kinerja
jangka panjang memiliki satu dampak positif dalam memusatkan upaya bawahan, namun di sisi lain
memperkenalkan bias evaluasi. Dengan menganalisis laporan kinerja enam tahun yang dikumpulkan
dari sebuah administrasi publik Italia, pertama-tama kami memeriksa bagaimana pemberian insentif
kepada manajer melalui prosedur evaluasi kinerja bias. Bila evaluasi subjektif digunakan untuk
tujuan insentif, kami mengkonfirmasi temuan dari literatur sebelumnya, yang menunjukkan bahwa
peringkat kinerja cenderung lebih lunak dan kurang tersebar di antara para manajer (Moers, 2005).

Kedua, ketersediaan data selama periode enam tahun membantu memperbaiki pengetahuan secara
terus-menerus bias evaluasi dari waktu ke waktu dan untuk memverifikasi bagaimana bias ini
dipengaruhi oleh insentif beberapa tahun. Dengan menekankan efek cakrawala waktu pada perilaku
individu, perkiraan kami menunjukkan bahwa evaluator berperilaku konsisten sepanjang periode
yang berbeda dan mempertahankan peringkat subjektif yang terus meningkat dan lebih terkompresi
bila dibandingkan dengan penilaian objektif. Selain itu, kami memverifikasi bahwa evaluasi
dipengaruhi oleh durasi periode evaluasi. Bila jumlah insentif ditentukan pada akhir tahun kedua,
kinerja yang dinilai pada evaluasi menengah kurang lunak daripada evaluasi akhir. Akhirnya,
kategorisasi insentif (bukan pembayaran proporsional) merupakan faktor penentu kelonggaran
lainnya. Kami menunjukkan bahwa peringkat kinerja akhir yang melampaui ambang batas kategori
minimal lebih ringan daripada peringkat di kategori bagian atas.

Hasil penelitian kami memiliki implikasi manajerial yang penting karena relevansinya yang praktis.
Jangka waktu evaluasi dan mekanisme pembayaran insentif merupakan aspek kunci yang harus
diperhatikan, tidak hanya dalam menyeimbangkan fleksibilitas evaluasi dan akurasi kinerja yang
diinginkan, namun juga dalam mengurangi miopia manajerial yang menekankan kinerja jangka
pendek. Penelitian di masa depan dapat meningkatkan relevansi praktis studi di bidang ini dengan
berfokus lebih khusus pada usaha manajerial daripada pada perilaku evaluator. Selain itu, semakin
kompleksnya sistem evaluasi semakin menuntut penerapan sistem evaluasi multisource atau
evaluasi 360 derajat. Dengan demikian, penelitian tentang kombinasi sistem multisource dengan
perspektif waktu-cakrawala yang diusulkan dapat membantu meningkatkan akurasi evaluasi dan
penilaian kinerja. Akhirnya, penyelidikan masa depan yang mengeksplorasi fenomena ini melampaui
batas-batas Italia dan yang menganalisis perbedaan nasional bisa bermanfaat.

Akhirnya, ada batasan untuk pekerjaan ini. Pertama, seperti yang diusulkan dalam literatur baru-
baru ini, kita mengasumsikan bahwa tindakan kuantitatif dinilai secara obyektif tanpa kesalahan dan
bias. Kedua, terlepas dari keuntungan memiliki informasi lengkap tentang satu organisasi,
kontinjensi operasional spesifiknya memiliki dampak dan dampak langsung pada hasil kami. Secara
khusus, kami tidak dapat memverifikasi dampak faktor lain yang dapat mempengaruhi hasil namun
tidak diidentifikasi dalam konteks khusus ini. Namun, karakteristik yang diperiksa cukup umum untuk
menghindari efek perancu akibat kekhasan organisasi. Akhirnya, kami mengumpulkan data dari
sebuah organisasi di sektor publik, berbeda dengan kebanyakan penelitian di bidang ini, yang
berfokus pada organisasi swasta. Menurut pendapat kami, seperti yang disarankan oleh analisis dan
literatur yang relevan, hasilnya tidak eksklusif untuk sektor publik karena kita tidak menggunakan
teori atau asumsi yang dimiliki secara khusus untuk literatur semacam itu. Selain itu, tujuan non-
profit dari administrasi publik tidak mewakili kendala generalisasi kesimpulan yang diajukan ke
konteks lain dan sektor swasta.

References

Baiman, S., Rajan, M.V., (1995). The informational advantage of discretionary bonus schemes, The
Accounting Review, 70, 557-579;
Baker, G.P., Gibbons, R., Murphy, K.J., (1994). Subjective performance measures in optimal incentive
contracts, Quarterly Journal of Economics, 109(4), 1125-1156;
Bernardin, H.J., Orban, J.A., (1990). Leniency effect as a function of rating format, purpose for
appraisal, and rater individual differences, Journal of Business and Psychology, 5(2), 197-211;
Bol, J. C., (2011). The determinants and performance effects of managers performance evaluation
biases, The Accounting Review, Accepted Manuscript, doi: 10.2308/accr-10099;
Bonner, S.E., Sprinkle, G.B., (2002). The effects of monetary incentives on effort and task
performance: theories, evidence, and a framework for research, Accounting, Organizations
and Society, 27, 303-345;
Degeorge, F., Patel, J., Zeckhauser, R., (1999). Earnings management to exceed thresholds, Journal of
Business, 72(1), 1-33;
Gibbs, M., Merchant, K. A., Van der Stede, W. A., Vargus, M. E., (2004). Determinants and effects of
subjectivity in incentives, The Accounting Review, 79(2), 409-436;
Greguras, G.J., Robie, C., Schleicher, D.J., Goff III, M., (2003). A field study of the effects of rating
purpose on the quality of multisource ratings, Personnel Psychology, 56(1), 1-21;
Guilford, J.P., (1954). Psychometric methods, McGraw-Hill, New York, NY;
Harris, M.M., Smith, D.E., Champagne, D., (1995). A field study of performance appraisal purpose:
Research- versus administrativebased ratings, Personnel Psychology, 48(1), 151-160;
Holmstrm, B. (1979). Moral hazard and observability, Bell Journal of Economics, 10, 74-91;
Ittner, C. D., Larcker, D. F., Meyer, M. W., (2003). Subjectivity and the weighting of performance
measures: evidence from a balanced scorecard, The Accounting Review, 78(3), 725-758;
Jawahar, I.M., Williams, C.R., (1997). Where all the children are above average: The performance
appraisal purpose effect, Personnel Psychology, 50(4), 905- 925;
Kahn, R., Wolfe, D., Quinn, R., Snoek, J., (1964). Organizational stress: studies in role conflict and
ambiguity, John Wiley, New York, NY;
Kane, J.S., Bernardin, H.J., Villanova, P., Peyrefitte, J., (1995). Stability of rater leniency: three studies,
Academy of Management Journal, 38(4), 1036-1051;
Katz, D., Kahn, R., (1978). The social psychology of organizations (2 nd ed.), John Wiley, New York,
NY;
Laverty, K.J., (1996). Economic short-termism: The debate, the unresolved issues, and the
implications for management practice and research, Academy of Management Review, 21(3),
825-860;
Laverty, K.J., (2004). Managerial myopia or systemic short-termism? The importance of managerial
systems in valuing the long term, Management Decision, 42(8), 949-962;
Locke, E.A., Latham, G.P., (1990). A theory of goal setting and task performance, Prentice-Hall,
Englewood Cliffs, NJ;
Locke, E.A., Latham, G.P., (2002). Building a practically useful theory of goal setting and task
motivation: a 35-Year Odyssey, American Psychologist, 57, 705-717;
Marginson, D., McAulay, L., (2008). Exploring the debate on shorttermism: A theoretical and
empirical analysis, Strategic Management Journal, 29(3), 273-292;
McIntyre, R.M., Smith, D.E., Hassett, C.E., (1984). Accuracy of performance ratings as affected by
rater training and perceived purpose of rating, Journal of Applied Psychology, 69(1), 147-156;
Merchant, K.A., Stringer, C., Theivananthampillai, P., (2010). Relationships between objective and
subjective performance measures, Working Paper, Department of Accountancy and Business
Law, University of Otago;
Moers, F., (2005). Discretion and bias in performance evaluation: the impact of diversity and
subjectivity, Accounting Organizations and Society, 30, 67-80;
Murphy, K.R., Cleveland, J.N., (1995). Understanding performance appraisal. Social, organizational
and goal-based perspectives, Sage Publications, Thousand Oaks, California;
Prendergast, C., Topel, R., (1993). Discretion and bias in performance evaluation, European
Economic Review, 37, 355-365;
Prendergast, C., Topel, R., (1996). Favoritism in organizations, Journal of Political Economy, 104(5),
958-978;
Rynes, S.L., Gerhart, B., Parks, L., (2005). Personnel psychology: performance evaluation and pay for
performance, Annual Review of Psychology, 56, 571-600;
Taylor, E.K., Wherry, R.J., (1951). A study of leniency in two rating systems, Personnel Psychology,
4(1), 39-47;
Van der Stede, W., (2009). Designing effective reward systems, Finance & Management, 170, 6-9;
Woods, A., (2009). Subjective adjustments to objective performance measures, Working Paper,
Mason School of Business.

Anda mungkin juga menyukai