Anda di halaman 1dari 20

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

PENELITIAN PERILAKU DALAM AKUNTANSI Asosiasi Akuntansi Amerika


Jil. 24, No.2 DOI: 10.2308/bria-50114
2012
hal.133-151

Pemeriksaan Pengaruh Positif dan


Kinerja Negatif pada Kerabat
Pembobotan Terhubung Secara
Strategis dan Non-Strategis Seimbang
Ukuran Kartu Skor
Steven E. Kaplan
Universitas Negeri Arizona

Michael J. Petersen
Universitas Negeri Utah

Janet A. Samuels
Sekolah Manajemen Global Thunderbird

ABSTRAK:Kaplan dan Norton (1992, 1996)mendukung bahwa ukuran kinerja dalam balanced
scorecard (BSC) harus dikaitkan dengan strategi. Namun, BSC dari banyak perusahaan mencakup
langkah-langkah yang terkait secara strategis dan yang tidak terkait secara strategis.Bankir dkk.
(2004)memberikan bukti awal tentang pembobotan evaluator untuk ukuran yang terkait secara
strategis (SL) dan yang tidak terkait secara strategis (NSL) saat mengevaluasi kinerja dalam
pengaturan di mana manajer selalu berkinerja lebih baik daripada tingkat target pada setiap
ukuran kinerja. Mereka menemukan bahwa ketika evaluator memiliki pemahaman yang cukup
tentang strategi perusahaan, mereka menilai ukuran SL lebih dari ukuran NSL ketika mengevaluasi
kinerja. Tujuan dari studi saat ini adalah untuk menguji evaluasi kinerja ketika, relatif terhadap
tingkat target kinerja, manajer menunjukkan kinerja yang menguntungkan pada beberapa ukuran
dan kinerja yang tidak menguntungkan pada ukuran lainnya. Kami berpendapat bahwa evaluator
akan menunjukkan bias negatif sehingga informasi kinerja negatif dibobot lebih berat daripada
informasi kinerja positif untuk ukuran SL dan NSL. Akibatnya,Bankir dkk. (2004)tidak akan berlaku
dalam pengaturan yang melibatkan kinerja yang tidak menguntungkan. Secara khusus, ketika
kinerja pada ukuran NSL tidak menguntungkan untuk satu manajer, kami menemukan bahwa
ukuran NSL lebih berbobot daripada ukuran SL. Implikasi dari temuan ini untuk teori dan praktek
dibahas.

Kata kunci:kartu skor berimbang; bias negatif; Ukuran kinerja.

Ketersediaan Data:Data tersedia berdasarkan permintaan.

Makalah ini mendapat manfaat dari komentar bermanfaat dari Kip Krumwiede, Monte Swain, Laurie Birney, Lynn
Hannan, peserta forum di Konferensi Penelitian MAS 2007, peserta lokakarya di Konferensi Penelitian MAS 2008 dan
Pertemuan Tahunan AAA 2009, dan peserta lokakarya di Arizona Universitas Negeri, Kampus Tempe dan Universitas
Negeri Arizona, Kampus Barat.
Diterbitkan Online: Desember 2011

133
134 Kaplan, Petersen, dan Samuels

PENGANTAR

M
sistem pengukuran kinerja ulti-atribut seperti balanced scorecard (BSC) (Kaplan dan
Norton 1992, 1996)semakin banyak digunakan dalam bisnis (Ittner dan Larcker 2003;
Kaplan dan Norton 2006). Sebuah BSC biasanya berisi sejumlah besar
ukuran kinerja dan digunakan, sebagian, untuk evaluasi kinerja.Kaplan dan Norton (1996, 2000, 2001)
menyarankan bahwa ukuran kinerja yang termasuk dalam BSC harus dikaitkan dengan tujuan strategis
unit bisnis. Sebagai contoh,Kaplan dan Norton (2001,97) menyatakan, ''Balanced Scorecard terbaik
mencerminkan strategi organisasi.'' Terlepas dari itu, penelitian telah menemukan bahwa perusahaan
benar-benar menggunakan beberapa kombinasi langkah-langkah yang terkait secara strategis (SL) dan
yang tidak terkait secara strategis (NSL) (misalnya, umum). pada BSC mereka (Bryant dkk. 2004; Burney
dan Widener 2007; Ittner dan Larcker 2003; Malina dan Selto 2001). Fokus penelitian kami adalah pada
bagaimana evaluator menimbang ukuran yang berbeda dalam balanced scorecard tanpa adanya
pedoman khusus. Agaknya, ketika BSC mencakup kombinasi ukuran SL dan NSL, ukuran SL lebih penting
dan harus diberi bobot lebih berat daripada ukuran NSL. Artinya, sejauh kinerja pada ukuran SL
mendorong hasil strategis, kinerja pada ukuran SL lebih penting dan harus lebih berbobot daripada
kinerja pada ukuran NSL. Selanjutnya, temuan dariIttner dan Larcker (1998), Rucci dkk. (1998),danBankir
dkk. (2000)menunjukkan bahwa ukuran SL dikaitkan dengan kinerja akuntansi masa depan, yang juga
menunjukkan bahwa ukuran SL harus lebih ditimbang daripada ukuran NSL.

Penelitian tentang apakah evaluator menempatkan bobot yang lebih besar pada ukuran SL daripada
ukuran NSL terbatas (Bankir dkk. 2004). Dalam kasus ini,Bankir dkk. (2004)memberikan bukti awal bahwa ketika
evaluator memiliki pemahaman yang kuat tentang strategi perusahaan (misalnya, peta strategi diberikan
kepada evaluator), mereka menempatkan bobot lebih pada SL daripada ukuran NSL. Namun, sesuai denganLipe
dan Salterio (2000), Banker et al. (2004)juga menemukan bahwa ukuran umum lebih berbobot daripada ukuran
SL ketika evaluator memiliki pemahaman yang lebih lemah tentang strategi perusahaan (misalnya, peta strategi
tidak diberikan kepada evaluator).Banker dkk (2004)temuan penting dan menghibur karena menunjukkan
bahwa ketika BSC mencakup ukuran SL dan NSL, evaluator yang memiliki pemahaman yang masuk akal tentang
strategi perusahaan, bobot SL mengukur lebih dari ukuran NSL.1Bahkan ketika BSC perusahaan mencakup
ukuran NSL, evaluator akan lebih menekankan pada ukuran SL, yang, pada gilirannya, harus lebih jauh memberi
sinyal dan memperkuat pentingnya manajer bawahan untuk mengarahkan lebih banyak waktu dan upaya
mereka menuju pencapaian ukuran SL dibandingkan dengan NSL. Pengukuran.
Tujuan dari studi saat ini adalah untuk menguji evaluasi kinerja ketika, relatif terhadap tingkat target
kinerja, manajer menunjukkan kinerja yang menguntungkan pada beberapa ukuran dan kinerja yang tidak
menguntungkan pada ukuran lainnya. Kami berpendapat bahwa temuan dariBankir dkk. (2004),di mana setiap
manajer sub-unit berkinerja lebih baik daripada tingkat target pada setiap ukuran kinerja di semua skenario,
tidak akan berlaku dalam pengaturan yang melibatkan kinerja yang tidak menguntungkan. Secara khusus,
ketika kinerja pada ukuran SL (penting) menguntungkan tetapi kinerja pada ukuran NSL (kurang penting) tidak
menguntungkan, kami memperkirakan bahwa ukuran NSL akan lebih berbobot daripada ukuran SL. Kami
mendasarkan prediksi kami pada penelitian psikologi, yang telah mendokumentasikan ''bias negatif'' di mana
individu kelebihan berat badan kinerja negatif (Baumeister dkk. 2001; Skowronski dan Carlston 1989). Kami
memprediksi dan menemukan bahwa bias berlaku bahkan dalam pengaturan yang melibatkan hasil yang
berbeda penting. Kami juga memperluas penelitian tentang bias negatif dengan memprediksi bahwa bias akan
lebih kuat ketika hasil negatif berhubungan dengan ukuran SL dibandingkan dengan ukuran NSL.
Dalam dua eksperimen BSC, kami memberikan informasi latar belakang kepada semua peserta
tentang perusahaan, peta strategi, dan informasi BSC tentang kinerja Manajer A dan Manajer B. BSC

1Penelitian olehFarrel dkk. (2010), Taylor (2010),danWebb (2004)juga memberikan bukti yang menunjukkan bahwa
individu menggunakan informasi tentang hubungan sebab akibat dalam pengambilan keputusan.

Penelitian Perilaku Dalam Akuntansi


Jilid 24, Nomor 2, 2012
Pengujian Pengaruh Kinerja Positif dan Negatif pada Pengukuran Kartu Skor 135

terdiri dari 16 ukuran di empat kategori BSC. Berdasarkan peta strategi dan narasi strategi,
delapan tindakan adalah SL dan delapan tindakan adalah NSL. Manajer B sedikit mengungguli
target pada semua 16 pengukuran untuk semua kondisi. Dalam percobaan pertama, kami
memanipulasi jenis ukuran di mana kinerja Manajer A mendominasi kinerja Manajer B (SL atau
NSL). Untuk membandingkan temuan kami denganBanker dkk (2004),kami juga memanipulasi
apakah Manajer A berkinerja buruk (misalnya, kinerja aktual kurang dari tingkat target) pada
beberapa ukuran (tidak ada atau ada hal negatif).2SepertiBankir dkk. (2004),kami menggunakan
skor perbedaan evaluasi (misalnya, evaluasi peserta Manajer A dikurangi evaluasi peserta Manajer
B) sebagai variabel dependen.
Konsisten denganBankir dkk. (2004),kami menemukan bahwa ukuran SL lebih berbobot daripada
ukuran NSL ketika kedua manajer selalu mengungguli target mereka. Namun, berbeda dengan Bankir
dkk. (2004),kami menemukan bahwa tindakan NSL lebih berat daripada tindakan SL ketika satu manajer
berkinerja buruk pada tindakan NSL. Kami juga menemukan bahwa bias negatif lebih kuat ketika satu
manajer berkinerja buruk pada pengukuran SL dibandingkan dengan pengukuran NSL. Dalam
percobaan kedua, ukuran BSC diidentifikasi sebagai SL atau NSL pada BSC itu sendiri. Hasil eksperimen
ini mengesampingkan penonjolan informasi negatif sebagai penjelasan alternatif.
Penelitian ini berimplikasi pada praktik dan teori. Pertama, sementara penelitian psikologi telah
menunjukkan bias negatif (di mana informasi negatif lebih berbobot daripada informasi non-negatif) (
Baumeister dkk. 2001; Skowronski dan Carlston 1989),penelitian ini belum menyelidiki apakah bias ini
berlaku dalam pengaturan yang melibatkan langkah-langkah penting yang berbeda. Kami memperluas
penelitian tentang bias negatif dengan memberikan bukti bahwa bias negatif terjadi bahkan dalam
pengaturan dengan langkah-langkah penting yang berbeda. Secara khusus, kami menemukan bahwa
kinerja negatif pada ukuran NSL lebih berbobot daripada kinerja positif pada ukuran SL, meskipun
ukuran SL lebih penting daripada ukuran NSL.
Dari sudut pandang praktik, studi ini mengidentifikasi masalah penting bagi perusahaan yang menggunakan BSC
yang mencakup ukuran SL dan NSL. Hasil kami menunjukkan bahwa manajer yang melakukan sedikit di bawah tingkat
target pada tindakan yang kurang penting tetapi mengimbangi dengan kinerja yang kuat pada tindakan yang lebih
penting akan dihukum relatif terhadap manajer yang tidak melakukan hampir sama baiknya pada tindakan yang lebih
penting tetapi melakukan di atas tingkat target pada semua tindakan. Dengan demikian, evaluasi kinerja dapat
memberi sinyal kepada manajer bahwa mereka harus selalu memenuhi atau melampaui semua target mereka, bahkan
jika ini berarti mengorbankan kinerja pada ukuran yang paling penting untuk menerapkan strategi perusahaan. Ketika
manajer menyadari efek negatif dari target NSL yang hilang, manajer cenderung mengalihkan upaya mereka dari
tindakan SL untuk memenuhi target tindakan NSL. Dengan demikian, hasil kami menunjukkan bahwa desainer BSC
perlu menyadari kecenderungan evaluator untuk mengukur kinerja kelebihan berat badan ketika target tidak terpenuhi,
dan untuk mempertimbangkan bias ini dalam memutuskan apakah dan berapa banyak ukuran NSL untuk dimasukkan
dalam BSC.
Sisa dari makalah ini disusun sebagai berikut. Pada bagian selanjutnya, kami mengembangkan hipotesis.
Kami kemudian menjelaskan desain dan metode untuk percobaan satu, percobaan utama kami, dan
mempresentasikan hasil percobaan utama dan mendiskusikan percobaan kedua. Pada bagian akhir, kami
merangkum dan menyimpulkan makalah.

LATAR BELAKANG, BIAS NEGATIF, DAN PENGEMBANGAN HIPOTESIS Latar


Belakang
BSC dikembangkan oleh:Kaplan dan Norton (1992, 1996),sebagian, untuk pengukuran
kinerja multidimensi. BSC biasanya berisi ukuran keuangan dan non-keuangan dari:

2''Underperformed''mengacu pada kinerja yang berada di bawah target yang ditetapkan. ''Mengungguli'' mengacu pada
kinerja yang berada di atas target yang ditetapkan.

Penelitian Perilaku Dalam Akuntansi


Volume 24, Nomor 2, 2012
136 Kaplan, Petersen, dan Samuels

empat perspektif: keuangan, pelanggan, proses internal, dan pembelajaran dan pertumbuhan.
Sementara sistem pengukuran kinerja multiatribut lain ada yang menggunakan berbagai ukuran
keuangan dan non-keuangan (misalnya, Kartu Skor KPI, Tableaux de Bord),Kaplan dan Norton (2001)
perhatikan bahwa sistem pengukuran kinerja lainnya ini tidak memilih ukuran yang terkait dengan
strategi. Dalam kasus ini,Kaplan dan Norton (1996,8) menunjukkan bahwa ukuran-ukuran pada BSC
''berasal dari visi dan strategi organisasi.'' Untuk serangkaian ukuran BSC tertentu, tingkat target kinerja
ditetapkan, kinerja aktual pada ukuran-ukuran tersebut dilacak untuk periode tersebut, dan evaluator
menilai kinerja manajerial.
Ketika bobot eksplisit tidak diberikan untuk setiap ukuran kinerja, evaluator yang menggunakan BSC
menggabungkan hasil dari berbagai ukuran ke dalam satu set evaluasi keseluruhan dan penilaian kompensasi
menggunakan proses subjektif. Saat menggunakan BSC,Kaplan dan Norton (1996) tampaknya mendukung
proses subjektif ketika mereka menyatakan bahwa sistem penghargaan subjektif '' lebih mudah dan lebih dapat
dipertahankan untuk dikelola . . . dan juga kurang rentan untuk bermain game'' (Kaplan dan Norton 1996,220).
Namun, penelitian telah menemukan bahwa bobot subjektif evaluator dari jenis ukuran BSC tertentu untuk
evaluasi kinerja adalah bias (Bankir dkk. 2004; Ittner dan Larcker 2003; Libby dkk. 2004; Lipe dan Salterio 2000,
2002; Roberts dkk. 2004). Sebagai contoh,Lipe dan Salterio (2000)menemukan bahwa evaluator memberi bobot
lebih pada ukuran umum dibandingkan dengan ukuran unik.

KetikaKaplan dan Norton (1996)menganjurkan hanya memasukkan ukuran SL dalam BSC, penelitian telah
menemukan bahwa perusahaan biasanya menggunakan beberapa kombinasi ukuran SL dan NSL pada BSC
mereka (Bryant dkk. 2004; Burney dan Widener 2007; Ittner dan Larcker 2003; Malina dan Selto 2001). Ittner dan
Larcker (2003,90) mendiskusikan hasil survei yang menunjukkan bahwa banyak manajer, dihadapkan dengan
tugas besar untuk memilih beberapa tindakan non-keuangan dari "ratusan, jika tidak ribuan" yang tersedia,
kembali pada tindakan "boilerplate", yang mungkin atau mungkin tidak terkait dengan strategi perusahaan.3

Bryant dkk. (2004)mengutip bukti survei bahwa manajer cenderung menggunakan ukuran umum dalam sistem
BSC mereka atau ukuran yang merupakan ukuran tingkat perusahaan atau terkait kontrol. Oleh karena itu, beberapa
tindakan BSC mungkin sebenarnya tidak terkait dengan strategi perusahaan saat ini. Baru-baru ini,Burney dan Widener
(2007)memberikan hasil survei tambahan yang menunjukkan bahwa manajer umumnya percaya bahwa sistem
pengukuran kinerja strategis perusahaan mereka (seperti BSC) mencakup ukuran terkait NSL. Oleh karena itu, berbeda
dengan konsep aslinya olehKaplan dan Norton (1992),dalam praktiknya, BSC biasanya mencakup campuran tindakan
yang kurang lebih selaras dengan tujuan strategis. Dalam menjelaskan mengapa langkah-langkah lemah atau NSL
termasuk dalam BSC,Luft (2004)mengamati bahwa manajer memiliki kepentingan yang bertentangan. Akibatnya,
manajer "melobi untuk menggunakan ukuran nonfinansial yang membuat mereka terlihat terbaik daripada ukuran
nonfinansial yang berkontribusi paling besar terhadap nilai perusahaan" (Luft 2004,963).

Bankir dkk. (2004)memberikan bukti awal apakah ukuran SL lebih berbobot daripada ukuran umum oleh
evaluator.Bankir dkk. (2004,2) berpendapat bahwa memahami strategi perusahaan '' adalah pendahulu penting
untuk mengandalkan ukuran kinerja yang terkait secara strategis'' dan bahwa evaluator akan menimbang
ukuran SL lebih dari ukuran NSL hanya ketika mereka memahami strategi perusahaan. Akibatnya, mereka
memprediksi dan menemukan bahwa evaluator bobot SL mengukur lebih dari ukuran NSL ketika informasi
strategi tambahan dalam bentuk peta strategi disediakan untuk evaluator. Bankir dkk. (2004)juga memprediksi
dan menemukan bahwa evaluator tidak mempertimbangkan ukuran terkait SL lebih dari NSL ketika evaluator
tidak diberikan informasi strategi tambahan. Dalam mempertimbangkan hasil dariBankir dkk. (2004),penting
untuk dicatat bahwa setiap manajer sub-unit bekerja

3
Dalam mendiskusikan temuan mereka,Ittner dan Larcker (2003,89) perhatikan bahwa ''bisnis sering gagal membangun hubungan seperti itu
sebagian karena kemalasan atau kesembronoan.''

Penelitian Perilaku Dalam Akuntansi


Jilid 24, Nomor 2, 2012
Pengujian Pengaruh Kinerja Positif dan Negatif pada Pengukuran Kartu Skor 137

lebih baik dari tingkat target pada setiap ukuran kinerja di semua skenario. Artinya, penelitian ini hanya
mencakup contoh kinerja positif di mana manajer melakukan lebih baik daripada tingkat yang ditargetkan pada
masing-masing dari 16 ukuran kinerja yang terpisah. Dengan demikian, tidak mungkin untuk menggeneralisasi
hasil dariBankir dkk. (2004)untuk kasus yang melibatkan kinerja negatif (misalnya, kinerja aktual lebih buruk
dari target).

Bias Negatif
Peneliti psikologi telah menyelidiki dampak relatif dari hasil bervalensi negatif dan positif
dari jenis dan besaran yang sama pada penilaian dan keputusan individu (Baumeister dkk.
2001; Rozin dan Royzman 2001; Skowronski dan Carlston 1989). Dalam meringkas temuan
penelitian tentang masalah ini,Baumeister dkk. (2001,323) menyatakan, ''Ketika ukuran yang
sama baik dan buruk hadir, bagaimanapun, efek psikologis dari yang buruk lebih besar
daripada yang baik.''
Literatur psikologi menyebut kecenderungan umum ini sebagaibias negatif (Skowronski dan
Carlston 1989; Kanouse dan Hanson 1972).Bias ini didefinisikan sebagai kecenderungan unit aktivasi
untuk menghasilkan perubahan output yang lebih besar dalam sistem motivasi negatif dibandingkan
dengan sistem motivasi positif (Cacioppo dkk. 1997). Dengan kata lain, ketika orang dihadapkan dengan
isyarat positif dan isyarat negatif yang besarnya setara, mereka cenderung memberi bobot lebih pada
isyarat negatif.
Peneliti psikologi menyarankan bahwa bias negatif beroperasi selama pemrosesan informasi
yang disengaja dan otomatis (Pratto dan John 1991). Tinjauan psikologi menunjukkan bahwa
informasi negatif mempengaruhi pemrosesan informasi yang disengaja dengan meningkatkan
jumlah perhatian sadar yang diarahkan pada informasi negatif dan meningkatkan ingatan
informasi negatif (Baumeister dkk. 2001; Rozin dan Royzman 2001; Ito dkk. 1998).Informasi negatif
juga mempengaruhi pemrosesan informasi yang disengaja melalui konstruksi interpretasi kognitif
yang lebih rumit dari informasi negatif.Rozin dan Royzman 2001; Baumeister dkk. 2001).Bukti lebih
lanjut dari pemrosesan informasi yang disengaja tercermin dalam temuan yang menunjukkan
bahwa relatif terhadap peristiwa positif, peristiwa negatif dianggap lebih kompleks (Peeters dan
Czapinski 1990)dan memicu lebih banyak atribusi kausal (Bohner dkk. 1988).
Selain efek pemrosesan informasi yang disengaja dari informasi negatif, penelitian psikologi juga
menunjukkan bahwa ada komponen otomatis atau bawah sadar pada bias negatif. Misalnya, penelitian
telah menemukan bahwa rangsangan negatif diidentifikasi lebih cepat dan menarik perhatian lebih
otomatis dibandingkan dengan rangsangan positif.Pratto dan John 1991; Smith dkk. 2006).

Peneliti manajemen pada tahun 1970-an awalnya mengeksplorasi pengaruh relatif dari informasi
positif dan negatif dalam evaluasi kinerja (Holman 1972; London dan Hakel 1974; London dan Poplawski
1976). Berdasarkan temuan awal tersebut,DeNisi dkk. (1984,386) mengusulkan bahwa informasi negatif ''
akan diberikan bobot lebih dari informasi positif, atau menguntungkan, dalam evaluasi keseluruhan. ''
Penelitian eksperimental selanjutnya olehBrannick dan Brannick (1989)dan penelitian lapangan oleh
Ganzach (1995)memberikan bukti lebih lanjut bahwa bias negatif memiliki pengaruh yang signifikan
terhadap evaluasi kinerja.

Hipotesis
Bankir dkk. (2004)menemukan bahwa ketika evaluator memiliki pemahaman yang kuat tentang strategi
perusahaan (misalnya, peta strategi diberikan kepada evaluator), mereka menempatkan bobot lebih pada SL
daripada ukuran NSL. Untuk meningkatkan komparabilitas temuan kami, kami awalnya mengusulkan, mirip
denganBankir dkk. (2004),bahwa ketika manajer hanya menunjukkan perbedaan kinerja yang positif, ukuran SL
akan lebih berbobot daripada ukuran NSL ketika evaluator memahami kinerja perusahaan.

Penelitian Perilaku Dalam Akuntansi


Volume 24, Nomor 2, 2012
138 Kaplan, Petersen, dan Samuels

strategi. Dalam hal ini, dua manajer hanya akan menunjukkan perbedaan kinerja positif jika keduanya
mencapai hasil di atas target pada masing-masing ukuran kinerja mereka. Namun, satu manajer bisa
mengungguli manajer lain dengan melebihi target ke tingkat yang lebih besar. Misalnya, satu manajer
mungkin melebihi target sebesar 20 persen sementara manajer lain mungkin melebihi target sebesar 10
persen. Hipotesis awal ini umumnya merupakan replikasi dariBankir dkk. (2004)dan dimaksudkan untuk
menguatkan hasil mereka menggunakan seperangkat ukuran kinerja BSC yang baru. Diskusi ini
mengarah pada hipotesis berikut:

H1:Ketika manajer selalu berkinerja lebih baik dari target mereka, evaluator akan menempatkan lebih banyak
bobot pada ukuran SL daripada ukuran NSL dalam evaluasi manajer.

Selanjutnya, kami mempertimbangkan pengaturan di mana perbedaan kinerja antara


dua manajer melibatkan contoh kinerja positif (misalnya, kinerja lebih baik dari target) dan
kinerja negatif (misalnya, kinerja lebih buruk dari target). Misalnya, satu manajer mungkin
melebihi target sebesar 5 persen (misalnya, kinerja di atas target) dan manajer lain mungkin
meleset dari target sebesar 5 persen (misalnya, kinerja di bawah target). Kinerja di bawah
target 5 persen merupakan kinerja negatif. Dibandingkan dengan situasi yang dijelaskan di
atas untuk H1, di mana dua manajer melebihi target sebesar 20 persen dan 10 persen,
perbedaan kinerja antara manajer dianggap konstan (misalnya, perbedaan kinerja 10
persen). Namun, dua situasi berbeda dalam satu yang hanya melibatkan kinerja positif,
Dalam kasus yang melibatkan kinerja di atas target dan di bawah target, kami berharap untuk
mengamati bias negatif. Secara khusus, kami berharap ukuran kinerja di bawah target akan lebih
berbobot daripada ukuran kinerja di atas target terlepas dari kepentingan strategis dari ukuran tersebut.

Berdasarkan tinjauan literatur kami (Baumeister dkk. 2001; Cacioppo dkk. 1997; Cacioppo dan
Bernston 1994; Ito dkk. 1998; Taylor 1991), kami berpendapat bahwa bias negatif sebagian besar
merupakan proses otomatis yang tidak disengaja. Sejauh bias negatif sebagian besar otomatis, kami
berharap bahwa evaluator akan mempertimbangkan ukuran yang melibatkan hasil di bawah target lebih
dari hasil di atas target, terlepas dari kepentingan strategis ukuran itu. Respon otomatis terhadap
informasi negatif diharapkan lebih kuat daripada pemrosesan kognitif yang disengaja tentang
pentingnya informasi SL/NSL. Diskusi ini mengarah pada hipotesis berikut:

H2:Ketika satu manajer tidak selalu berkinerja lebih baik dari target, evaluator akan menempatkan
bobot lebih pada ukuran SL atau NSL yang melibatkan kinerja buruk.

Di bawah H2, evaluator diharapkan menunjukkan bias negatif terlepas dari apakah kinerja yang
kurang baik melibatkan tindakan SL atau NSL. Selanjutnya, penelitian berbasis psikologi sebelumnya
belum mengeksplorasi faktor-faktor yang diharapkan dapat meningkatkan atau memperbesar bias
negatif. Kami berharap bahwa pembobotan ukuran kinerja akan dipengaruhi oleh proses yang disengaja
dan tidak disengaja. Meskipun kami mengharapkan banyak bias negatif menjadi proses otomatis, kami
berharap bahwa evaluator, yang menyadari dua jenis ukuran kinerja yang berbeda, akan dengan sengaja
menimbang ukuran SL negatif lebih dari ukuran NSL negatif. Dengan demikian, kami berharap bahwa
dibandingkan dengan ukuran NSL, bias negatif akan lebih menonjol ketika kinerja yang kurang baik
melibatkan ukuran SL dan bahwa evaluator akan mempertimbangkan ukuran SL negatif lebih dari
ukuran NSL negatif. Keseluruhan, kami berharap langkah-langkah SL akan memperburuk kekuatan bias
negatif. Diskusi ini mengarah pada hipotesis berikut:

H3:Ketika satu manajer tidak selalu berkinerja lebih baik dari target, bias negatif
akan lebih kuat ketika manajer hanya berkinerja buruk pada pengukuran SL dibandingkan
ketika manajer hanya berkinerja buruk pada pengukuran NSL.

Penelitian Perilaku Dalam Akuntansi


Jilid 24, Nomor 2, 2012
Pengujian Pengaruh Kinerja Positif dan Negatif pada Pengukuran Kartu Skor 139

DESAIN DAN METODE EKSPERIMENTAL


Kami melakukan dua eksperimen untuk menguji efek kinerja di bawah dan di atas target di seluruh
rangkaian ukuran BSC pada penilaian evaluasi. Untuk menguji pengaruh kinerja di bawah dan di atas
target, serupa dengan penelitian sebelumnya (Lipe dan Salterio 2000; Bankir dkk. 2004)tugas evaluator
adalah memberikan penilaian evaluasi untuk masing-masing dari dua manajer. Pada percobaan
pertama, kami menggunakan 232 desain eksperimental antara peserta dengan dominasi (Manajer A
mengungguli Manajer B pada tindakan SL atau tindakan NSL) dan negatif (kinerja buruk pada tindakan
tertentu ada atau tidak ada) sebagai manipulasi eksperimental. Percobaan kedua dibahas di bagian
berikutnya.

Bahan Kasus dan Prosedur


Materi yang dijelaskan Toko Smithson, yang memiliki beberapa rantai ritel dan banyak toko.4
Peserta menempati posisi evaluator dari dua manajer regional (Manajer A dan Manajer B) untuk
Divisi Toko Wanita. Untuk menghindari bias ukuran umum/unik dan potensi pembaur lainnya,
kedua manajer memiliki strategi, ukuran, dan target yang identik. Materi termasuk deskripsi
strategi untuk divisi, dan peta strategi yang menyoroti delapan ukuran kinerja dan bagaimana
mereka terhubung satu sama lain. Lampiran A menyajikan contoh narasi strategi dan peta strategi
yang diberikan kepada peserta. Peserta kemudian diberi sampel BSC yang mencantumkan delapan
SL dan delapan ukuran "umum" (NSL) yang mencakup deskripsi dan target. Materi tersebut
menunjukkan bahwa delapan tindakan "umum" (NSL) yang termasuk dalam BSC telah diidentifikasi
di tingkat perusahaan.5Sampel BSC yang diterima peserta menunjukkan bahwa masing-masing
dari empat kategori BSC termasuk dua ukuran SL dan dua NSL.
Selanjutnya, peserta diberikan BSC dengan kinerja aktual Manajer A dan B. Lampiran B
menyajikan contoh BSC yang menunjukkan hasil kinerja aktual untuk Manajer A dan B. Secara
desain, di seluruh kondisi, kinerja aktual setiap manajer selalu kira-kira ekivalen linier. Dengan
ekuivalen linier, kami maksudkan bahwa jumlah dari empat persentase penyimpangan dari empat
target dalam kategori BSC kira-kira sama. Misalnya, dengan menggunakan BSC yang disajikan
dalam Lampiran B, jumlah dari empat persentase deviasi di bawah kategori keuangan untuk
Manajer A, Chris Peters, adalah 20,76 persen (misalnya, -3,30%th-1,47%th
14,33%th11,20%) dan 20,79 persen (misalnya 1,38%th9,27%th3,60%th6,54%) untuk Manajer B,
Taylor Graham.6Jadi, jika masing-masing dari 16 ukuran BSC memiliki bobot yang sama, kedua
manajer akan menerima evaluasi kinerja yang sama. Menanggapi materi kasus, peserta
mengevaluasi kinerja masing-masing manajer dan menyelesaikan kuesioner pasca-eksperimen.

Variabel independen
Peserta dalam penelitian ini mengevaluasi satu kasus yang mencakup satu dari dua tingkat untuk masing-masing
dari dua variabel independen, Dominasi dan Negatif. Dengan demikian, desain penelitian dapat dicirikan sebagai 232
sedemikian rupa sehingga ada total empat sel percobaan yang berbeda. Gambar 1 menyajikan ringkasan dari keempat
sel ini. Kami selanjutnya membahas masing-masing dari dua variabel independen di bawah ini.

4Untuk penelitian ini, kami memodifikasi bahan dariBankir dkk. (2004),yang pada gilirannya memodifikasi materi dariLipe
dan Salterio (2000).Kami berterima kasih kepada mereka karena telah memasok kami dengan salinan instrumen.
5Untuk menghindari kebingungan karena tindakan NSL dianggap mengarah pada kinerja yang lebih baik di SL
ukuran, kami memilih ukuran NSL yang tampaknya tidak memengaruhi ukuran SL tingkat toko dengan cara yang umum dan logis.
Materi tidak memberikan penjelasan mengapa tindakan NSL dimasukkan, kecuali untuk mengatakan bahwa itu adalah tindakan
"umum" yang ditambahkan oleh perusahaan ke semua BSC SBU.
6Jumlahdari keempat ukuran tersebut adalah 21,95 persen, 23,87 persen, dan 22,42 persen, pada pelanggan, internal.
proses, dan pembelajaran dan kategori pertumbuhan, masing-masing, untuk Manajer A dan B di Lampiran B.

Penelitian Perilaku Dalam Akuntansi


Volume 24, Nomor 2, 2012
140 Kaplan, Petersen, dan Samuels

GAMBAR 1
Informasi Deskriptif tentang Variabel Independen
Perawatan Dominasi
negatif
Perlakuan Tertaut Strategis (SL) Tidak Terhubung Secara Strategis (NSL)

Tidak hadir 1. Semua Manajer melebihi target mereka. 1. Semua Manajer melebihi target mereka.
2. Secara total, Manajer A dan B memiliki kinerja 2. Secara total, Manajer A dan B memiliki kinerja
yang sama. yang sama.
3. Manajer A berkinerja lebih baik daripada Manajer B pada 3. Manajer A berkinerja lebih baik daripada
delapan pengukuran SL, tetapi berkinerja lebih buruk Manajer B pada delapan ukuran NSL, tetapi
daripada Manajer B pada delapan pengukuran NSL. berkinerja lebih buruk daripada Manajer B pada
delapan langkah SL.
Hadiah 1. Manajer A melebihi target SL, tetapi berkinerja 1. Manajer A melebihi target SL, tetapi berkinerja
buruk pada target NSL; Manajer B melampaui buruk pada target NSL; Manajer B melampaui
semua target. semua target.
2. Secara total, Manajer A dan B memiliki kinerja 2. Secara total, Manajer A dan B memiliki kinerja
yang sama. yang sama.
3. Manajer A berkinerja lebih baik daripada 3. Manajer A berkinerja lebih baik daripada
Manajer B pada delapan langkah SL; Manajer A Manajer B pada delapan ukuran NSL, tetapi
berkinerja lebih buruk daripada Manajer B pada berkinerja lebih buruk daripada Manajer B pada
delapan ukuran NSL. delapan langkah SL.

Dominasi
Dalam manipulasi antara peserta, peserta secara acak ditugaskan ke salah satu dari dua kondisi
dominasi. Dominasi mengacu pada kinerja aktual untuk serangkaian ukuran kinerja oleh satu manajer
relatif terhadap manajer lain. Pada kondisi dominan NSL, Manajer A mendominasi kinerja Manajer B
pada pengukuran NSL, tetapi Manajer B mendominasi kinerja Manajer A pada pengukuran SL. Misalnya,
seperti yang ditunjukkan pada Lampiran B, Manajer B mengungguli Manajer A dalam markup harga rata-
rata barang dagangan dan pertumbuhan penjualan dari toko yang ada, kedua ukuran SL termasuk
dalam kategori keuangan. Namun, Manajer A mengungguli Manajer B dalam hal perputaran persediaan
dan laba atas penjualan, kedua ukuran NSL termasuk dalam kategori keuangan. Pada kondisi dominan
SL, Manajer A mendominasi kinerja Manajer B pada ukuran SL, tetapi Manajer B mendominasi kinerja
Manajer A pada ukuran NSL. Kedua manipulasi ini dioperasionalkan dengan memodifikasi hasil kinerja
aktual untuk Manajer A.

negatif
Dalam manipulasi antara peserta, peserta secara acak ditugaskan ke salah satu dari dua kondisi negatif.
Dalam kondisi negatif saat ini, Manajer A secara substansial berkinerja lebih baik pada delapan pengukuran
kondisi dominan (SL atau NSL) dan sedikit berkinerja buruk pada delapan pengukuran lainnya.7Misalnya, seperti
yang ditunjukkan dalam Lampiran B, persentase atas Manajer A atas perputaran persediaan dan pengembalian
aset, dua ukuran yang termasuk dalam kategori keuangan, masing-masing adalah 14,33 persen dan 11,20
persen. Namun, untuk kenaikan harga rata-rata barang dagangan dan pertumbuhan penjualan dari toko yang
ada—dua ukuran lainnya yang termasuk dalam kategori keuangan—Manajer A berkinerja buruk masing-masing
sebesar 3,30 persen dan 1,47 persen. Kinerja Manajer B cukup di atas target untuk semua 16 ukuran. Misalnya,
juga seperti yang ditunjukkan pada

7Kinerja negatif berkisar dari meleset dari target 1 persen hingga 4 persen. Agaknya, sedikit
kinerja buruk, relatif terhadap kinerja buruk yang besar, bertentangan dengan hipotesis kami.

Penelitian Perilaku Dalam Akuntansi


Jilid 24, Nomor 2, 2012
Pengujian Pengaruh Kinerja Positif dan Negatif pada Pengukuran Kartu Skor 141

Lampiran B, persentase lebih untuk Manajer B pada empat ukuran keuangan adalah 1,38 persen,
9,27 persen, 3,60 persen, dan 6,54 persen. Dalam kondisi negatif saat ini, di seluruh 16 ukuran
kinerja, kinerja Manajer A relatif terhadap target berkisar dari -4 persen (misalnya, persentase
penjualan ke pelanggan baru) hingga 15 persen (misalnya, barang dagangan yang diiklankan
dalam stok) dengan total varians 0,70 persen. Kinerja Manajer B relatif terhadap target berkisar
dari 1,38 persen (misalnya, markup harga rata-rata barang dagangan) hingga 10,03 persen
(misalnya, komputerisasi toko) dengan total varians 0,09 persen.
Dalam kondisi absen negatif, kedua manajer mengungguli target pada semua ukuran kinerja.
Dibandingkan dengan kondisi negatif saat ini, lima persen ditambahkan ke persentase kelebihan/kekurangan
untuk masing-masing dari 16 ukuran untuk Manajer A dan B. Dengan demikian, Manajer A berkinerja sangat
baik pada delapan ukuran kondisi dominan (SL atau NSL) dan sedikit berkinerja lebih baik pada delapan langkah
yang tersisa. Misalnya, dibandingkan dengan BSC yang ditunjukkan dalam Lampiran B, persentase untuk
Manajer A atas perputaran persediaan dan pengembalian aset—dua ukuran yang termasuk dalam kategori
keuangan—masing-masing adalah 19,33 persen dan 16,20 persen. Untuk kenaikan harga rata-rata barang
dagangan dan pertumbuhan penjualan dari toko yang ada—dua ukuran lainnya yang termasuk dalam kategori
keuangan—Manajer A masing-masing mengungguli target sebesar 1,70 persen dan 3,53 persen. Manajer B
berkinerja cukup baik pada semua 16 pengukuran. Misalnya, dibandingkan dengan BSC yang ditunjukkan pada
Lampiran B, persentase atas Manajer B pada empat ukuran keuangan adalah 6,38 persen, 14,27 persen, 8,60
persen, dan 11,54 persen.
Dalam kondisi absen negatif, di 16 ukuran kinerja, kinerja Manajer A relatif terhadap target
berkisar dari 1 persen (misalnya, persentase penjualan ke pelanggan baru) hingga 20 persen
(misalnya, persediaan barang dagangan yang diiklankan) dengan total varians 0,70 persen. Kinerja
Manajer B relatif terhadap target berkisar dari 6,38 persen (misalnya, markup harga rata-rata
barang dagangan) hingga 15,03 persen (misalnya, komputerisasi toko) dengan total varians 0,09
persen. Oleh karena itu, baik untuk kondisi negatif maupun tidak ada, hasil kinerja Manajer A
memiliki varians yang jauh lebih besar daripada hasil kinerja Manajer B. Namun, varians dalam
hasil kinerja Manajer A dan Manajer B adalah sama untuk kondisi tidak hadir dan negatif saat ini.
Fitur desain ini mengontrol varians dalam hasil kinerja di dua kondisi negatif. Dengan
menggunakan fitur desain ini, kami dapat menghilangkan varians sebagai penjelasan alternatif
potensial dengan menjaga varians tetap konstan dalam kedua kondisi negatif.8

Ukuran tergantung

Setiap peserta memberi setiap manajer penilaian evaluasi dari 0 (menetapkan kembali) hingga 12 (sangat
baik), dengan angka yang lebih tinggi menunjukkan peringkat evaluasi yang lebih baik. Deskripsi singkat
ditunjukkan untuk setiap label (misalnya, Sangat Baik: jauh melampaui harapan, manajer unggul) untuk
meminimalkan kebingungan di antara peserta tentang arti setiap label. Skor perbedaan evaluasi dibangun
dengan mengurangkan evaluasi Manajer B dari evaluasi Manajer A. Ini adalah ukuran dependen yang sama
yang digunakan olehBankir dkk. (2004).Skor perbedaan evaluasi positif menunjukkan bahwa Manajer A
dievaluasi lebih tinggi dari Manajer B, sedangkan skor perbedaan evaluasi negatif menunjukkan bahwa Manajer
A dievaluasi lebih rendah dari Manajer B. Skor perbedaan evaluasi digunakan sebagai ukuran dependen untuk
menguji hipotesis kami.9

8
Jika varians tinggi mendorong hasil, kami akan berharap untuk menemukan Manajer A dinilai lebih rendah dari Manajer B
dalam kondisi absen negatif, terlepas dari dominasi ukuran SL. Karena kami tidak menemukan ini, kami dapat
mengesampingkan varians tinggi sebagai penjelasan alternatif untuk hasil kami ketika negatif hadir.
9Studi ini juga meminta peserta untuk mengalokasikan kumpulan bonus $20.000 antara Manajer A dan Manajer B, dan untuk
menunjukkan mana dari dua manajer yang harus dipromosikan menjadi wakil presiden. Analisis berdasarkan dua ukuran ini
secara kualitatif serupa dengan hasil yang dilaporkan untuk skor perbedaan evaluasi. Akibatnya, kami hanya melaporkan
hasil untuk skor perbedaan evaluasi.

Penelitian Perilaku Dalam Akuntansi


Volume 24, Nomor 2, 2012
142 Kaplan, Petersen, dan Samuels

Peserta

Sebanyak 103 mahasiswa MBA malam dari universitas metropolitan besar berpartisipasi dalam percobaan.
10Para siswa baru-baru ini mengambil kursus, termasuk tugas membaca dan kuliah, tentang BSC dan peta
strategi. Cakupan kelas BSC sebelum penelitian dimaksudkan untuk mengurangi kekhawatiran yang diajukan
olehDilla dan Steinbart (2005)tentang evaluator yang tidak memiliki pengetahuan yang cukup tentang BSC. Para
peserta menghabiskan sekitar 20-25 menit di kelas membaca dan mengisi kuesioner. Para peserta
menyelesaikan tugas ini sebagai kredit tambahan untuk kelas yang mereka ikuti, sehingga partisipasi adalah
100 persen siswa yang memenuhi syarat. Usia rata-rata peserta adalah 30,8 tahun dan pengalaman kerja rata-
rata adalah 9,0 tahun. Tujuh puluh persen adalah laki-laki dan 77 persen sebelumnya telah mengevaluasi
karyawan.

HASIL PERCOBAAN PERTAMA


Pemeriksaan Manipulasi dan Pengetahuan Umum Tentang BSC

Setelah menanggapi skenario, peserta menjawab pertanyaan pembekalan untuk menentukan apakah mereka
menyadari manipulasi negatif. Pertanyaan pertama berbunyi, ''Chris Peters (Wilayah A) melebihi targetnya pada semua
ukuran kinerja.'' Peserta diminta untuk memilih respons pada skala tujuh poin, di mana 1 adalah ''sangat tidak setuju''
dan 7 adalah ' 'sangat setuju'. Untuk peserta dalam kondisi negatif saat ini, Chris Peters (Manajer A) memiliki hasil di
bawah target, dan peserta yang merespons lebih besar dari titik tengah skala (titik tengah 4 adalah ''tidak setuju atau
tidak setuju. '') dijatuhkan. Untuk peserta dalam kondisi absen negatif, Chris Peters (Manajer A) tidak memiliki hasil di
bawah target, dan peserta yang merespons kurang dari titik tengah skala dijatuhkan. Pertanyaan kedua berbunyi,
''Taylor Graham (Wilayah B) melebihi targetnya pada semua ukuran kinerja.'' Peserta diminta untuk memilih respons
pada skala tujuh poin, di mana 1 ''sangat tidak setuju'' dan 7 ''sangat setuju''. ' Untuk semua peserta, Taylor Graham
(Manajer B) tidak memiliki hasil di bawah target, dan tanggapan yang kurang dari titik tengah skala dianggap salah. Dari
103 peserta, 21 (20 persen) menjawab salah setidaknya satu dari pertanyaan cek manipulasi dan dijatuhkan. dan
tanggapan kurang dari titik tengah skala dianggap salah. Dari 103 peserta, 21 (20 persen) menjawab salah setidaknya
satu dari pertanyaan cek manipulasi dan dijatuhkan. dan tanggapan kurang dari titik tengah skala dianggap salah. Dari
103 peserta, 21 (20 persen) menjawab salah setidaknya satu dari pertanyaan cek manipulasi dan dijatuhkan.11
Peserta yang menjawab ''salah'' terhadap salah satu dari dua item cek manipulasi negatif dibatalkan
karena kurangnya ''pentingnya penyertaan'' (Yates 1990,376). Dalam kasus ini,Tan dan Yates (1995,315)
berpendapat bahwa '' jika pembuat keputusan bahkan tidak pernah mengakui keberadaan dimensi
tertentu, pengambil keputusan tidak mungkin menanggapi dimensi itu.'' Dalam konteks penelitian saat
ini, kami membatasi sampel untuk peserta yang menghadiri dan ditafsirkan eksplisit

10Penelitian BSC sebelumnya (Bankir dkk. 2004; Dilla dan Steinbart 2005; Kaplan dan Wisner 2009; Liedtka dkk.
2008; Lipe dan Salterio 2000, 2002)umumnya menggunakan mahasiswa MBA sebagai peserta.
11Selain itu, satu peserta lain, yang tidak dikeluarkan dari analisis, tidak menjawab salah satu dari keduanya
tindakan manipulasi. Analisis terhadap peserta yang dijatuhkan mengungkapkan bahwa dalam kondisi absen negatif, enam peserta yang dijatuhkan berasal dari kondisi dominan SL

dan dua dari kondisi dominan NSL. Pada kondisi sekarang negatif, delapan peserta yang turun berasal dari kondisi dominan SL dan lima dari kondisi dominan NSL. Analisis chi-

kuadrat dari peserta yang dijatuhkan oleh sel mengembalikan nilai 2,79 (nilai p. 0,42), menunjukkan bahwa peserta yang dijatuhkan berasal dari sel acak. Analisis tambahan juga

menunjukkan bahwa peserta yang 'lulus' tidak berbeda secara signifikan dari peserta yang gugur dalam hal usia, pengalaman kerja, keakraban dan pemahaman BSC, serta

pemahaman dan kesulitan kasus. Akhirnya, kami membandingkan korelasi antara respons terhadap ukuran pemeriksaan manipulasi untuk setiap manajer dan peringkat kinerja

setiap manajer menggunakan 82 peserta yang ditahan dengan benar menjawab dua pertanyaan pemeriksaan manipulasi dengan 21 peserta yang dijatuhkan. Untuk Chris (Manajer

A), korelasinya masing-masing adalah 0,65 dan 0,45 untuk peserta yang dipertahankan dan yang dijatuhkan. Untuk Taylor (Manajer B), korelasinya masing-masing adalah 0,33 dan

0,26 untuk peserta yang ditahan dan yang dijatuhkan. Analisis ini menunjukkan bahwa dibandingkan dengan korelasi yang menggunakan peserta yang dipertahankan, korelasinya

lebih kecil dengan menggunakan peserta yang dibatalkan. korelasinya masing-masing adalah 0,65 dan 0,45 untuk peserta yang dipertahankan dan yang dijatuhkan. Untuk Taylor

(Manajer B), korelasinya masing-masing adalah 0,33 dan 0,26 untuk peserta yang ditahan dan yang dijatuhkan. Analisis ini menunjukkan bahwa dibandingkan dengan korelasi yang

menggunakan peserta yang dipertahankan, korelasinya lebih kecil dengan menggunakan peserta yang dibatalkan. korelasinya masing-masing adalah 0,65 dan 0,45 untuk peserta

yang dipertahankan dan yang dijatuhkan. Untuk Taylor (Manajer B), korelasinya masing-masing adalah 0,33 dan 0,26 untuk peserta yang ditahan dan yang dijatuhkan. Analisis ini

menunjukkan bahwa dibandingkan dengan korelasi yang menggunakan peserta yang dipertahankan, korelasinya lebih kecil dengan menggunakan peserta yang dibatalkan.

Penelitian Perilaku Dalam Akuntansi


Jilid 24, Nomor 2, 2012
Pengujian Pengaruh Kinerja Positif dan Negatif pada Pengukuran Kartu Skor 143

mencoba untuk memanipulasi kenegatifan (atau kekurangannya) dari Manajer A dan B sebagaimana
dimaksud. Analisis statistik berikut didasarkan pada tanggapan dari 82 peserta yang tersisa.12
Peserta diminta untuk menjawab pertanyaan tentang keakraban dan pemahaman
mereka tentang BSC dan pemahaman tentang peta strategi. Mereka diminta untuk
menggunakan skala tujuh poin, di mana 7 "sangat setuju" bahwa mereka memiliki
pemahaman yang baik atau cukup akrab dengan BSC (atau peta strategi) dan jawaban 4
adalah "tidak setuju atau tidak setuju.'' Respon rata-rata untuk keakraban dan
pemahaman BSC adalah 4,6 dan 5,0, masing-masing (standar deviasi 1,8 dan 1,3,
masing-masing). Tanggapan ini secara signifikan lebih tinggi dari tanggapan titik tengah
4.0 (p , 0,002 untuk setiap pertanyaan). Selain itu, tanggapan rata-rata untuk memahami
peta strategi adalah 4,7 (standar deviasi 1,4). Respon ini secara signifikan lebih tinggi
dari respon titik tengah dari 4,0 (p, 0,001). Dengan demikian, rata-rata,
Sebagai bagian dari kuesioner pasca-eksperimental, peserta menanggapi pernyataan, ''
Langkah-langkah yang terkait secara strategis lebih penting daripada langkah-langkah yang tidak
terkait secara strategis.'' Peserta kembali menanggapi dalam skala mulai dari 1 (''sangat tidak
setuju'') hingga 7 (''sangat setuju''). Sebuah respon dari 4 adalah netral (''tidak setuju atau setuju'').
Jika peserta percaya bahwa ukuran SL lebih penting daripada ukuran NSL, mereka seharusnya
merespons secara signifikan lebih besar daripada respons netral 4. Skor rata-rata pada pertanyaan
ini adalah 5,3 (standar deviasi ¼.1.52). Ini berbeda secara signifikan dari titik tengah netral 4 (t-
statistik¼.7,51, nilai p , 0,0001). Ini menunjukkan bahwa, rata-rata, peserta percaya bahwa ukuran
SL lebih penting daripada ukuran NSL. Kami juga mengkonfirmasi bahwa persepsi pentingnya
ukuran SL tidak secara signifikan terkait dengan variabel independen (semua nilai p adalah 0,18).
Persepsi pentingnya langkah-langkah SL juga tidak terkait dengan variabel dependen dari
perbedaan evaluasi kinerja (nilai-p. 0,55).
Tanggapan terhadap pertanyaan pembekalan dianalisis dalam upaya untuk mengidentifikasi kovariat. Tak satu
pun dari pertanyaan pembekalan ditemukan menjadi kovariat, dan akibatnya tidak ada yang termasuk dalam analisis
yang dilaporkan di bawah ini.

Uji Hipotesis
H1 memprediksi bahwa ketika hal negatif tidak ada, evaluator akan memberikan bobot lebih pada
pengukuran SL daripada pada pengukuran NSL. Sejauh evaluator menempatkan bobot yang relatif lebih besar
pada SL daripada ukuran NSL, manajer dengan kinerja yang lebih kuat pada ukuran SL akan dievaluasi lebih
tinggi daripada manajer dengan kinerja yang lebih kuat pada ukuran NSL. Karena kinerja aktual kedua manajer
relatif terhadap target secara linier setara, kita dapat menggunakan ukuran dependen untuk menyimpulkan
apakah ukuran SL lebih berbobot daripada ukuran NSL. Dalam hal ini, jika ukuran SL lebih berbobot daripada
ukuran NSL, manajer dengan kinerja yang lebih baik pada ukuran SL akan dievaluasi lebih tinggi.

Secara khusus, H1 memprediksi skor perbedaan evaluasi yang positif signifikan untuk kondisi
SL Dominates dan negatif signifikan untuk kondisi NSL Dominates. Statistik deskriptif untuk kondisi
ketidakhadiran negatif dirangkum dalam Tabel 1, Panel A. Signifikansi skor perbedaan diuji
menggunakan uji-t. Seperti yang ditunjukkan, skor perbedaan evaluasi untuk kondisi SL
Mendominasi adalah 1,15 dan secara signifikan lebih besar dari 0 (t-statistik¼.4,52, nilai satu sisi ,
0,001). Nilai selisih evaluasi untuk kondisi NSL Dominates adalah -0,70 dan secara signifikan lebih
kecil dari 0 (t-statistic-2,29, nilai p satu sisi , 0,017).

12Perhatikan bahwa beberapa tes hanya mencakup 80 atau 81 peserta, karena beberapa dari 82 peserta tidak menanggapi semua
pertanyaan.

Penelitian Perilaku Dalam Akuntansi


Volume 24, Nomor 2, 2012
144 Kaplan, Petersen, dan Samuels

TABEL 1
Statistik Deskriptif Skor Selisih EvaluasiSebuah

Panel A: Skor Selisih Evaluasi dalam Kondisi Absen Negativitas


DominasiB
SL Dominan NSL Dominan
n¼.20 n¼.23 Keseluruhan

1.15C - 0,70 0.16


(1.37) (1,46) (1.60)

Panel B: Skor Selisih Evaluasi dalam Kondisi Negatif Saat Ini


DominasiB
SL Dominan NSL Dominan
(n¼.18) (n¼.21) Keseluruhan

- 1,28C - 2.86 - 2.13


(1.64) (2.06) (2.01)

SebuahManajer A dan Manajer B masing-masing dievaluasi pada skala 13 poin, dengan 0 berlabel ''Tugaskan kembali'' dan 12 berlabel
''Sangat baik.'' Selisih evaluasi adalah ukuran dalam peserta dan dihitung sebagai evaluasi Manajer A dikurangi
evaluasi Manajer B. Oleh karena itu, angka positif menunjukkan bahwa Manajer A dievaluasi lebih baik daripada
Manajer B, dan angka negatif menunjukkan bahwa Manajer A dievaluasi kurang baik daripada Manajer B.
BDominasi dimanipulasi antara peserta di dua tingkat: NSL Mendominasi (Manajer A mendominasi di NSL
pengukuran dan Manajer B mendominasi pengukuran SL) dan SL Mendominasi (Manajer A mendominasi pengukuran SL dan
Manajer B mendominasi pengukuran NSL).
CNilai panel adalah sarananya. Standar deviasi ditunjukkan dalam tanda kurung di bawah rata-rata.

Hasil kami untuk H1 konsisten dengan dan memperluas temuan dariBankir dkk. (2004). Hasil kami
didasarkan pada kumpulan peserta yang berbeda dan hasil kinerja yang berbeda. Secara khusus, varians
kinerja untuk Manajer A lebih besar dari varians manajer setara dalam Banker dkk (2004)belajar. Hasil
kami menunjukkan bahwa temuan dariBankir dkk. (2004)meluas ke pengaturan yang melibatkan
manajer yang terlibat dalam kinerja varians tinggi. Penting untuk dicatat bahwa sementara varians
dalam kinerja untuk Manajer A di bawah kondisi absen negatif lebih besar dari manajer setara dariBankir
dkk. (2004),varians kinerja Manajer A dalam penelitian ini adalah sama di bawah kondisi negatif tidak ada
dan negatif saat ini. Dengan demikian, kami dapat mengecualikan varians tinggi dalam kinerja
manajerial sebagai penjelasan yang mungkin dalam pengujian H2.
H2 memprediksi bahwa ketika ada hal negatif, evaluator tidak akan memberi bobot lebih pada
ukuran SL daripada pada ukuran NSL, tetapi sebaliknya akan memberi bobot lebih pada ukuran yang
melibatkan kinerja buruk oleh satu manajer, bahkan ketika manajer hanya berkinerja buruk pada ukuran
NSL. Secara khusus, H2 memprediksi skor perbedaan evaluasi yang secara signifikan negatif untuk
kondisi SL Mendominasi dan NSL Mendominasi.
Statistik deskriptif untuk kondisi negatif saat ini disajikan pada Tabel 1, Panel B. Seperti yang
ditunjukkan, di bawah kondisi NSL Mendominasi di mana Manajer A berkinerja buruk pada semua
ukuran SL, skor perbedaan evaluasi rata-rata adalah -2,86, yang secara signifikan kurang dari 0
(statistik -6,37, nilai p satu sisi , 0,0001). Di bawah kondisi SL Mendominasi di mana Manajer A
berkinerja buruk pada semua ukuran NSL, skor perbedaan evaluasi rata-rata adalah -1,28, yang
secara signifikan kurang dari 0 (statistik t -3,31, nilai p satu sisi , 0,003). Ini menunjukkan bahwa

Penelitian Perilaku Dalam Akuntansi


Jilid 24, Nomor 2, 2012
Pengujian Pengaruh Kinerja Positif dan Negatif pada Pengukuran Kartu Skor 145

ketika informasi kinerja negatif hadir, manajer yang berkinerja buruk pada beberapa ukuran tetapi
sangat mengungguli beberapa ukuran menerima evaluasi kinerja yang lebih rendah daripada manajer
yang sedikit mengungguli semua ukuran. Oleh karena itu, kami menemukan bahwa ukuran yang
mencerminkan kinerja yang buruk lebih ditimbang daripada ukuran yang mencerminkan kinerja yang
berlebihan di kedua kondisi dominasi. Pola hasil ini mendukung H2.
H3 memprediksi bahwa bias negatif akan lebih kuat ketika manajer hanya berkinerja buruk pada
pengukuran SL dibandingkan ketika manajer hanya berkinerja buruk pada pengukuran NSL. Secara
khusus, H3 memprediksi skor perbedaan evaluasi yang secara signifikan lebih negatif di bawah kondisi
NSL Mendominasi dibandingkan dengan kondisi SL Mendominasi.
Sebuah t-test digunakan untuk menguji perbedaan rata-rata di dua kondisi dominasi.
Nilai selisih evaluasi untuk kondisi NSL Dominates adalah -2,86 dan secara signifikan lebih
negatif daripada nilai selisih evaluasi -1,28 untuk kondisi SL Dominates (t-statistic¼.
2,62, nilai p satu sisi , 0,01). Hasil ini mendukung H3.13

EKSPERIMEN DUA
Penjelasan potensial untuk hasil kami untuk H2 adalah bahwa informasi negatif lebih menonjol
daripada informasi yang menunjukkan ukuran mana yang SL. Untuk kondisi negatif saat ini, peserta
menerima hasil kinerja BSC yang sebenarnya, yang menunjukkan bahwa Manajer A memiliki kinerja
negatif pada beberapa ukuran tetapi BSC itu sendiri tidak menyertakan informasi tentang apakah suatu
ukuran adalah SL atau NSL (misalnya, lihat Lampiran B). Sebaliknya, informasi yang menunjukkan
langkah-langkah mana yang SL dimasukkan pada halaman terpisah yang menyajikan peta strategi. Oleh
karena itu, ada kemungkinan bahwa hasil untuk H2 dapat mencerminkan arti-penting diferensial dan
ketersediaan informasi negatif relatif terhadap informasi yang menunjukkan ukuran mana yang SL.14Ini
adalah, sementara H2 memprediksi bahwa pemrosesan otomatis informasi negatif akan mendominasi
pemrosesan yang disengaja dari pentingnya ukuran SL, hasilnya dapat didorong oleh informasi negatif
yang lebih menonjol daripada ukuran SL/NSL hanya karena informasi negatif ada di BSC yang ditinjau
manajer tetapi informasi SL/NSL ada di halaman sebelumnya. Eksperimen kedua dilakukan untuk
mengeksplorasi kemungkinan ini.
Kami menjalankan 132 desain eksperimental. Kehadiran negatif dipertahankan konstan dan
dominasi dimanipulasi (Manajer A dominan pada tindakan SL atau NSL). Pengaturan tugas identik
dengan sel yang sama dari percobaan sebelumnya dengan satu perubahan. Pada BSC yang
menunjukkan hasil kinerja aktual (termasuk kinerja negatif), kami menambahkan kolom untuk ''jenis
ukuran'' dan menunjukkan apakah ukuran itu ''strategis'' atau ''non-strategis.'' Desain ini memungkinkan
negativitas dan informasi strategis berada di halaman yang sama dan mengesampingkan arti-penting
tambahan dari informasi negatif sebagai penjelasan alternatif.
Tiga puluh satu mahasiswa MBA berpartisipasi dalam percobaan dan, mirip dengan percobaan satu, baru-
baru ini mengambil kursus tentang BSC dan peta strategi. Usia rata-rata adalah 35,8, dengan rata-rata 14,6
tahun pengalaman kerja. Tujuh puluh empat persen adalah laki-laki dan 84 persen sebelumnya telah
mengevaluasi karyawan.

13H1, H2, dan H3 diuji ulang menggunakan 103 peserta. Termasuk semua peserta tidak mengubah tanda-tanda
salah satu cara, tetapi, seperti yang diharapkan, melemahkan hasil statistik. Sehubungan dengan H1, skor
selisih evaluasi untuk kondisi SL Mendominasi adalah 0,50 (t-statistic¼.0.88, p , 0.19, one tailed) dan-0.52
untuk kondisi NSL Dominates (t-statistic-1,64, p , 0,06, satu sisi). Terhadap H2, nilai selisih evaluasi untuk
kondisi SL Mendominasi adalah -0,23 (t-statistic-0.56, p , 0.30, one tailed) dan -2.88 untuk kondisi NSL
Dominates (t-statistic-6,70, p , 0,01, satu ekor). Sehubungan dengan H3, skor perbedaan evaluasi untuk
kondisi NSL Dominates secara signifikan lebih negatif daripada untuk kondisi SL Dominates (statistik t-2,88,
p , 0,01, satu ekor).
14Kami berterima kasih kepada seorang rekan atas saran ini.

Penelitian Perilaku Dalam Akuntansi


Volume 24, Nomor 2, 2012
146 Kaplan, Petersen, dan Samuels

Peserta menanggapi pertanyaan manipulasi yang sama menanyakan apakah setiap manajer telah
mengungguli semua target mereka. Empat peserta gagal menjawab dengan benar kedua pertanyaan (13
persen) dan, konsisten dengan percobaan satu, dikeluarkan dari analisis. Dengan menggunakan 27
peserta yang tersisa, kami menemukan bahwa ketika ada hal negatif dan Manajer A mendominasi
pengukuran NSL, skor perbedaan evaluasi rata-rata adalah -3,39 (standar deviasi 1,56). Ini jauh di bawah
0 (statistik t -7,84, nilai p satu sisi , 0,001). Ketika negativitas hadir dan ukuran SL dominan, skor
perbedaan evaluasi rata-rata adalah-1,57 (standar deviasi 2,21), yang secara signifikan lebih kecil dari 0
(statistik-t -2,66, nilai p satu sisi , 0,01). Oleh karena itu, kami menemukan bahwa ketika seorang manajer
berkinerja buruk pada ukuran SL atau NSL, ukuran-ukuran tersebut diberi bobot lebih berat daripada
ukuran-ukuran lain yang menunjukkan kinerja di atas target. Hasil ini memberikan dukungan lebih lanjut
untuk H2 dan menghilangkan arti-penting sebagai penjelasan potensial untuk hasil kami.15

RINGKASAN DAN PEMBAHASAN

Kaplan dan Norton (1996, 2001)menganjurkan penggunaan BSC untuk menerapkan strategi dan
mengevaluasi kinerja, dan bahwa BSC hanya boleh menyertakan ukuran SL. Namun, bukti menunjukkan bahwa
perusahaan biasanya menyertakan ukuran NSL generik serta ukuran SL di BSC mereka (Bryant dkk. 2004;
Burney dan Widener 2007; Ittner dan Larcker 2003; Malina dan Selto 2001).Meskipun mungkin ada berbagai
alasan untuk memasukkan langkah-langkah NSL dalam BSC, ketika mereka disertakan,Bankir dkk. (2004)
berpendapat bahwa ukuran SL harus lebih berbobot daripada ukuran NSL ketika mengevaluasi kinerja
manajerial. Dalam kasus ini,Bankir dkk. (2004,4) berpendapat bahwa ''Semakin baik karyawan memahami
strategi perusahaan, semakin baik mereka akan dapat menggunakan ukuran kinerja yang terkait secara
strategis untuk memandu keputusan dan tindakan mereka.''Bankir dkk. (2004)memberikan bukti awal tentang
pembobotan evaluator dari ukuran terkait SL dan NSL ketika mengevaluasi kinerja manajerial dalam
pengaturan di mana kinerja aktual melebihi tingkat target kinerja pada setiap ukuran kinerja. Seperti yang
diharapkan, mereka menemukan bahwa ketika evaluator memiliki pemahaman yang cukup tentang strategi
perusahaan, evaluator memberikan bobot yang lebih besar untuk ukuran SL dibandingkan dengan ukuran NSL
ketika mengevaluasi kinerja manajerial. Kesimpulan implisit mereka adalah bahwa kekhawatiran atas evaluator
yang membebani ukuran kinerja NSL (misalnya, bobot ukuran NSL lebih dari ukuran SL) dikurangi ketika
evaluator memiliki pemahaman yang cukup tentang strategi perusahaan.

Tujuan dari studi saat ini adalah untuk memberikan bukti tambahan tentang bobot evaluator dari
ukuran SL dan NSL yang termasuk dalam BSC pada evaluasi kinerja manajerial. Kami memperpanjang
Bankir dkk. (2004)dalam beberapa cara. Pertama, menggunakan kelompok peserta yang berbeda dan
ukuran kinerja yang berbeda, kami juga menemukan bahwa ukuran SL lebih berbobot daripada ukuran
NSL saat mengevaluasi kinerja dalam pengaturan yang hanya melibatkan perbedaan kinerja positif.
Kedua, kami menemukan bahwa ukuran NSL lebih berbobot daripada ukuran SL ketika mengevaluasi
kinerja dalam pengaturan yang melibatkan perbedaan kinerja positif pada ukuran SL dan perbedaan
kinerja negatif pada ukuran NSL. Terakhir, kami menemukan bahwa dalam pengaturan yang melibatkan
perbedaan kinerja positif dan negatif, perbedaan kinerja negatif pada ukuran SL lebih berbobot daripada
perbedaan kinerja negatif pada ukuran kinerja NSL.
Dalam mempertimbangkan hasil untuk H1 dan H2, penting untuk dicatat bahwa varians dalam
kinerja manajerial dipertahankan konstan di kedua kondisi negatif dan tidak ada. Dalam hal ini,
mungkin tidak tepat untuk menyimpulkan bahwa perbedaan antara hal-hal negatif kita hadir

15H2 diuji ulang menggunakan semua 31 peserta. Termasuk semua peserta tidak mengubah tanda-tanda salah satu dari
berarti, tetapi, seperti yang diharapkan, melemahkan hasil statistik. Nilai selisih evaluasi untuk kondisi SL
Mendominasi adalah -3.00 (t-statistic-5.27, p , 0.01, one tailed) dan -0.94 untuk kondisi NSL Dominates (t-
statistic-1,39, p , 0,10, satu ekor).

Penelitian Perilaku Dalam Akuntansi


Jilid 24, Nomor 2, 2012
Pengujian Pengaruh Kinerja Positif dan Negatif pada Pengukuran Kartu Skor 147

hasil danBanker dkk (2004)hasil secara eksklusif disebabkan oleh perbedaan kinerja negatif. Hal ini
karena kedua studi juga berbeda dalam hal varians dalam perbedaan kinerja. Kami dapat
mengesampingkan potensi pembaur ini dengan menguji H1 dan H2 dengan mempertahankan varians
dalam kinerja manajerial yang konstan.
Dua keterbatasan harus dipertimbangkan mengenai penelitian kami. Pertama, peserta dalam penelitian ini
adalah mahasiswa MBA yang diminta untuk mengevaluasi kinerja manajerial dalam pengaturan BSC.
Umumnya, peserta memiliki pengalaman kerja profesional yang substansial, tampaknya memiliki latar belakang
yang kira-kira sebanding dengan yang digunakan dalam studi BSC sebelumnya (Bankir dkk. 2004; Libby dkk.
2004; Lipe dan Salterio 2000, 2002; Kaplan dan Wisner 2009; Liedtka dkk. 2008; Roberts dkk. 2004),dan sistem
pengukuran kinerja multi-dimensi dibahas dan dibahas di kelas sebelum eksperimen terjadi. Namun, peserta
mungkin memiliki pengalaman terbatas dengan sistem pengukuran multi-dimensi seperti BSC, dan ada
kemungkinan bahwa hasil kami mungkin tidak digeneralisasikan kepada mereka yang memiliki pengalaman
dan pengetahuan yang lebih besar tentang BSC. Kedua, penggunaan pendekatan eksperimental mengharuskan
pembatasan kumpulan informasi yang tersedia bagi peserta. Hal ini dilakukan untuk menjaga konstan informasi
yang tersedia untuk setiap peserta serta untuk membatasi tuntutan waktu ditempatkan pada peserta. Agaknya,
evaluator akan memiliki kumpulan informasi yang lebih kaya dalam praktik ketika mengevaluasi kinerja.
Selanjutnya, dalam mengoperasionalkan kondisi sekarang yang negatif, perbedaan rata-rata antara kinerja
berlebih dan kinerja buruk relatif besar, yang dapat membatasi generalisasi temuan kami. Ini tetap menjadi
masalah untuk penelitian lebih lanjut.

Studi ini memberikan dua kontribusi penting. Pertama, hasil kami menunjukkan bahwa dalam pengaturan yang melibatkan perbedaan kinerja positif dan negatif, evaluator menilai ukuran dengan

perbedaan kinerja negatif lebih dari perbedaan kinerja positif, terlepas dari kepentingan strategis dari tindakan tersebut. Temuan kami menunjukkan masalah yang sebelumnya tidak dikenali ketika ukuran

kinerja SL dan NSL disertakan dalam BSC. Mengingat kendala waktu dan ketidakpastian tugas, ketika manajer perlu melakukan trade-off, organisasi mungkin akan lebih baik ketika manajer sedikit berkinerja

buruk pada ukuran NSL jika memungkinkan mereka untuk melakukan pada tingkat tinggi pada ukuran SL. Dalam hal ini, perlu dicatat bahwa dalam percobaan kami, perbedaan kinerja negatif relatif kecil dan

tidak pernah melebihi 4 persen. Namun, hasil kami menunjukkan bahwa manajer kemungkinan akan dihukum bahkan untuk perbedaan kinerja yang sedikit negatif ini pada ukuran NSL. Artinya, ketika

dihadapkan dengan keputusan apakah akan mengarahkan upaya menuju pencapaian tinggi pada ukuran SL atau menuju pemenuhan target NSL, hasil kami menunjukkan bahwa manajer akan dievaluasi lebih

baik dengan menghindari kinerja yang kurang pada ukuran NSL, bahkan jika ini berarti kinerja yang jauh lebih rendah pada SL Pengukuran. Jika ukuran SL adalah ukuran penting yang mendorong keberhasilan

perusahaan, mengalihkan upaya dari ukuran SL dan menuju tindakan NSL hanya untuk menghindari kinerja di bawah ekspektasi pada ukuran NSL mungkin kurang optimal. Kecenderungan terjadinya jenis

perilaku sub-optimal ini mendukung Artinya, ketika dihadapkan dengan keputusan apakah akan mengarahkan upaya menuju pencapaian tinggi pada ukuran SL atau menuju pemenuhan target NSL, hasil kami

menunjukkan bahwa manajer akan dievaluasi lebih baik dengan menghindari kinerja yang kurang pada ukuran NSL, bahkan jika ini berarti kinerja yang jauh lebih rendah pada SL Pengukuran. Jika ukuran SL

adalah ukuran penting yang mendorong keberhasilan perusahaan, mengalihkan upaya dari ukuran SL dan menuju tindakan NSL hanya untuk menghindari kinerja di bawah ekspektasi pada ukuran NSL

mungkin kurang optimal. Kecenderungan terjadinya jenis perilaku sub-optimal ini mendukung Artinya, ketika dihadapkan dengan keputusan apakah akan mengarahkan upaya menuju pencapaian tinggi pada

ukuran SL atau menuju pemenuhan target NSL, hasil kami menunjukkan bahwa manajer akan dievaluasi lebih baik dengan menghindari kinerja yang kurang pada ukuran NSL, bahkan jika ini berarti kinerja

yang jauh lebih rendah pada SL Pengukuran. Jika ukuran SL adalah ukuran penting yang mendorong keberhasilan perusahaan, mengalihkan upaya dari ukuran SL dan menuju tindakan NSL hanya untuk

menghindari kinerja di bawah ekspektasi pada ukuran NSL mungkin kurang optimal. Kecenderungan terjadinya jenis perilaku sub-optimal ini mendukung hasil kami menunjukkan bahwa manajer akan

dievaluasi lebih baik dengan menghindari kinerja yang buruk pada ukuran NSL, bahkan jika ini berarti kinerja yang jauh lebih rendah pada ukuran SL. Jika ukuran SL adalah ukuran penting yang mendorong

keberhasilan perusahaan, mengalihkan upaya dari ukuran SL dan menuju tindakan NSL hanya untuk menghindari kinerja di bawah ekspektasi pada ukuran NSL mungkin kurang optimal. Kecenderungan

terjadinya jenis perilaku sub-optimal ini mendukung hasil kami menunjukkan bahwa manajer akan dievaluasi lebih baik dengan menghindari kinerja yang buruk pada ukuran NSL, bahkan jika ini berarti kinerja

yang jauh lebih rendah pada ukuran SL. Jika ukuran SL adalah ukuran penting yang mendorong keberhasilan perusahaan, mengalihkan upaya dari ukuran SL dan menuju tindakan NSL hanya untuk menghindari kinerja di bawah ekspekt

Kedua, penelitian kami memperluas penelitian tentang bias negatif. Sementara


banyak bukti mendukung bias negatif, kurang perhatian telah diberikan untuk
mengidentifikasi kondisi batas atau faktor mitigasi. Studi kami memberikan bukti bahwa
bias negatif berlaku dalam pengaturan dengan dimensi penting yang berbeda. Artinya,
bias negatif ada bahkan ketika hasil negatif melibatkan dimensi yang relatif tidak
penting. Sejauh bias negatif disebabkan oleh faktor yang disengaja, bias negatif tidak
boleh beroperasi ketika hasil negatif melibatkan dimensi yang relatif tidak penting.
Dengan demikian, temuan kami penting karena menunjukkan bahwa proses yang tidak
disengaja atau otomatis cukup kuat untuk mengamati bias negatif, dan akibatnya,

Penelitian Perilaku Dalam Akuntansi


Volume 24, Nomor 2, 2012
148 Kaplan, Petersen, dan Samuels

REFERENSI
Bankir, RD, G. Potter, dan D. Srinivasan. 2000. Investigasi empiris dari rencana insentif yang
termasuk ukuran kinerja non-keuangan.Tinjauan Akuntansi75 (1): 65–92.
Bankir, RD, H. Chang, dan MJ Pizzini. 2004. Balanced scorecard: Efek penilaian dari
ukuran kinerja yang terkait dengan strategi.Tinjauan Akuntansi79 (1): 1-23.
Baumeister, RF, E. Bratslavsky, C. Finkenauer, dan KD Vohs. 2001. Buruk lebih kuat dari baik.Tinjauan
Psikologi Umum5 (4): 323–370.
Bohner, G., H. Memberkati, N. Schwarz, dan F. Strack. 1988. Apa yang memicu atribusi kausal? Dampak dari
valensi dan probabilitas subjektif.Jurnal Psikologi Sosial Eropa18 (4): 335–345. Brannick, MT,
dan JP Brannick. 1989. Proses nonlinier dan nonkompensasi dalam kinerja
evaluasi.Perilaku Organisasi dan Proses Keputusan Manusia44: 97-122.
Bryant, L., DA Jones, dan SK Widener. 2004. Mengelola penciptaan nilai dalam perusahaan: Sebuah ujian
dari beberapa ukuran kinerja.Jurnal Riset Akuntansi Manajemen16: 107-131. Burney, L., dan
SK Widener. 2007. Sistem pengukuran kinerja strategis, relevan dengan pekerjaan
informasi, dan respon perilaku manajerial-peran stres dan kinerja.Penelitian Perilaku dalam
Akuntansi19: 43–69.
Cacioppo, JT, dan GG Bernston. 1994. Hubungan antara sikap dan ruang evaluasi: Sebuah kritis
review, dengan penekanan pada pemisahan substrat positif dan negatif.Buletin Psikologis 115:
401–423.
Cacioppo, JT, WL Gardner, dan GG Berntson. 1997. Di luar konseptualisasi bipolar dan
langkah-langkah: Kasus sikap dan ruang evaluatif.Review Psikologi Kepribadian dan Sosial1 (1): 3–
25.
DeNisi, AS, TP Cafferty, dan BM Meglino. 1984. Pandangan kognitif dari penilaian kinerja
proses: Sebuah model dan proposisi penelitian.Perilaku Organisasi dan Kinerja Manusia33: 360–
396.
Dilla, WN, dan PJ Steinbart. 2005. Pembobotan relatif dari balanced scorecard umum dan unik
tindakan oleh pembuat keputusan yang berpengetahuan.Penelitian Perilaku dalam Akuntansi17:
43–53. Farrell, AM, KK Kadous, dan KL Towry. 2010.Meliorasi dan Perfeksionisme: Efek Informasi
tentang Internalitas pada Alokasi Upaya Karyawan dalam Tugas Multi-Periode.Kertas kerja, Universitas
Emory.
Ganzach, Y. 1995. Negatif (dan positif) dalam evaluasi kinerja: Tiga studi lapangan.Jurnal dari
Psikologi Terapan80 (4): 491–499.
Hollman, TD 1972. Kesalahan pewawancara pekerjaan dalam memproses informasi positif dan negatif.
Jurnal Psikologi Terapan56: 130–134.
Ito, TA, JT Larson, NK Smith, dan JT Cacioppo. 1998. Informasi negatif lebih berbobot
di otak: Bias negatif dalam kategorisasi evaluatif.Jurnal Psikologi Kepribadian dan Sosial75
(4): 887–900.
Ittner, CD, dan DF Larcker. 1998. Apakah ukuran non-keuangan merupakan indikator utama keuangan?
pertunjukan? Sebuah analisis kepuasan pelanggan.Jurnal Riset Akuntansi36: 1–35. Ittner, CD,
dan DF Larcker. 2003. Menyusul pengukuran kinerja nonfinansial.Harvard
Ulasan Bisnis81 (11): 88–95.
Kanouse, DE, dan LR Hanson. 1972.Negatif dalam Evaluasi.New York, NY: Pers Pembelajaran Umum.
Kaplan, RS, dan DP Norton. 1992. Balanced scorecard—Ukuran yang mendorong kinerja.Harvard
Ulasan Bisnis70 (1): 71–79.
Kaplan, RS, dan DP Norton. 1996.The Balanced Scorecard: Menerjemahkan Strategi ke dalam Tindakan.Boston,
MA: Pers Sekolah Bisnis Harvard.
Kaplan, RS, dan DP Norton. 2000. Mengalami masalah dengan strategi Anda? Kemudian petakan.Bisnis Harvard
Tinjauan78 (5): 167–176.
Kaplan, RS, dan DP Norton. 2001. Transformasi balanced scorecard dari kinerja
pengukuran untuk manajemen strategis: Bagian I.Cakrawala Akuntansi15 (1): 87-104.
Kaplan, RS, dan DP Norton. 2006. Bagaimana menerapkan strategi baru tanpa mengganggu
organisasi.Ulasan Bisnis Harvard (Maret): 100–109.

Penelitian Perilaku Dalam Akuntansi


Jilid 24, Nomor 2, 2012
Pengujian Pengaruh Kinerja Positif dan Negatif pada Pengukuran Kartu Skor 149

Kaplan, SE, dan P. Wisner. 2009. Efek penilaian dari komunikasi manajemen dan yang kelima
kategori balanced scorecard pada evaluasi kinerja.Penelitian Perilaku dalam Akuntansi21 (2): 37–
56.
Libby, TS, S. Salterio, dan A. Webb. 2004. Balanced scorecard: Efek dari jaminan dan proses
pertanggungjawaban atas pertimbangan manajerial.Tinjauan Akuntansi79 (4): 1075–1094.
Liedtka, SL, Gereja BK, dan MR Ray. 2008. Variabilitas kinerja, intoleransi ambiguitas, dan
penilaian kinerja berbasis balanced scorecard.Penelitian Perilaku dalam Akuntansi20 (2): 73– 88.

Lipe, M., dan S. Salterio. 2000. Balanced scorecard: Efek penilaian yang umum dan unik
Ukuran kinerja.Tinjauan Akuntansi75 (3): 283–298.
Lipe, M., dan S. Salterio. 2002. Catatan tentang efek penilaian dari informasi balanced scorecard
organisasi.Akuntansi, Organisasi dan Masyarakat27 (6): 531–540.
London, M., dan MD Hakel. 1974. Pengaruh stereotip pelamar, urutan dan informasi pada wawancara
stereotip.Jurnal Psikologi Terapan59: 157-162.
London, M., dan JR Poplawski. 1976. Pengaruh informasi pada pengembangan stereotip dalam kinerja
konteks penilaian dan wawancara.Jurnal Psikologi Terapan61: 199–205.
Luft, JL 2004. Diskusi tentang 'manajer'; komitmen terhadap tujuan yang terkandung dalam kinerja strategis
sistem pengukuran.Riset Akuntansi Kontemporer21 (4): 959–964.
Malina, MA, dan FH Selto. 2001. Mengkomunikasikan dan mengendalikan strategi: Sebuah studi empiris tentang
efektivitas balanced scorecard.Jurnal Riset Akuntansi Manajemen13: 47–90. Peeters, G., dan J.
Czapinski. 1990. Asimetri positif-negatif dalam evaluasi: Perbedaan antara
efek negatif afektif dan informasional.Ulasan Eropa tentang Psikologi Sosial1: 33–60. Pratto, F., dan
OP John. 1991. Kewaspadaan otomatis: Kekuatan menarik perhatian dari sosial negatif
informasi.Jurnal Psikologi Kepribadian dan Sosial61 (3): 380–391.
Roberts, ML, TL Albright, dan AR Hibbets. 2004. Debiasing evaluasi balance scorecard.
Penelitian Perilaku dalam Akuntansi16: 75–88.
Rozin, P., dan EB Royzman. 2001. Bias negatif, dominasi dan penularan negatif.kepribadian dan
Ulasan Psikologi Sosial5 (4): 296–320.
Rucci, AJ, SP Kirn, dan RT Quinn. 1998. Rantai laba karyawan-pelanggan di Sears.Harvard
Ulasan Bisnis76: 82–97.
Skowronski, JJ, dan DE Carlston. 1989. Bias negatif dan ekstremitas dalam pembentukan kesan: A
ulasan penjelasan.Buletin Psikologis105: 131-142.
Smith, NK, JT Larsen, TL Chartrand, JT Cacioppo, HA Katafiasz, dan KE Moran. 2006. Menjadi
buruk tidak selalu baik: Konteks afektif memoderasi bias perhatian terhadap informasi negatif.
Jurnal Psikologi Kepribadian dan Sosial90 (2): 210–220.
Tan, HT, dan JF Yates. 1995. Sunk cost effects: Pengaruh instruksi dan pengembalian di masa depan
perkiraan.Perilaku Organisasi dan Proses Keputusan Manusia63 (3): 311–319.
Tayler, WB 2010. Balanced scorecard sebagai alat evaluasi strategi: Efek implementasi
keterlibatan dan fokus rantai kausal.Tinjauan Akuntansi85 (3): 1095–1117.
Taylor, SE 1991. Efek asimetris dari peristiwa positif dan negatif: Mobilisasi-minimalisasi
hipotesa.Buletin Psikologis110: 67–85.
Webb, RA 2004. Komitmen manajer terhadap tujuan yang terkandung dalam pengukuran kinerja strategis
sistem.Riset Akuntansi Kontemporer21 (4): 925–958.
Yates, JF 1990.Penghakiman dan Pengambilan Keputusan.Upper Saddle River, NJ: Prentice Hall.

LAMPIRAN A
STRATEGI NARRATIF DAN PETA STRATEGIS DIBERIKAN KEPADA PESERTA The
Women's Store

The Women's Store (TWS) adalah peritel khusus mapan yang melayani wanita profesional yang sadar
mode. Arus kas TWS yang kuat akan dibutuhkan untuk mendorong pertumbuhan di Smithson yang lebih muda

Penelitian Perilaku Dalam Akuntansi


Volume 24, Nomor 2, 2012
150 Kaplan, Petersen, dan Samuels

SBU. TWS akan menghasilkan arus kas untuk berkontribusi pada tujuan perusahaan dengan menggunakan jaringan
toko yang ada untuk lebih menembus target pasarnya, sementarameningkatkan markup hargadanmeningkatkan
penjualan toko yang ada (atau toko yang sama).TWS akan memanfaatkan citra mereknya yang khas untuk mendorong
penjualan pakaian baru dan pertumbuhan margin dalam target pasarnya, yang tidak terlalu sensitif terhadap harga.
Tujuan TWS adalah menjadi toko di mana wanita dapat berbelanja semua kebutuhan lemari pakaian mereka, mulai dari
pakaian, aksesori, hingga sepatu, di satu lokasi yang nyaman. Oleh karena itu, TWS akan meningkatkan penjualan di
toko yang ada dan meningkatkan markup harga denganmeningkatkan penjualan ke pelanggan barusebaik
meningkatkan kepuasan pelanggan.TWS akan fokus padapengenalan lini pakaian baru yang diidentifikasi sebagai ''
pemimpin pasar'' (seperti lini bisnis kasualnya) dan bantuan belanja di dalam toko yang sangat baik yang dirancang
untuk mengakomodasi pelanggan yang sadar akan gaya dan terbatas waktu. Inti dari strategi pertumbuhan TWS
adalahpenciptaan ''pengalaman berbelanja di dalam toko yang sempurna''yang akan menarik wanita sibuk untuk
mengunjungi toko, daripada berbelanja online atau melalui telepon. Olehmeningkatkan pengetahuan dan keterampilan
manajer merek,TWS akan mengembangkan manajer merek terampil yang dapat memperluas lini produknya untuk
mengakomodasi ''one-stop shopping''; dan dengan menawarkan bantuan belanja di dalam toko yang lebih besar, TWS
berharap dapat bersaing dengan pengecer katalog dan online. Juga,kepuasan dan moral karyawan yang luar biasa
merupakan komponen penting dari pengalaman di dalam toko yang luar biasa.
Berikut adalah representasi visual dari strategi utama The Women's Store.

Penelitian Perilaku Dalam Akuntansi


Jilid 24, Nomor 2, 2012
Pengujian Pengaruh Kinerja Positif dan Negatif pada Pengukuran Kartu Skor 151

LAMPIRAN B
Balanced Scorecard Digunakan dalam Eksperimen
(Disediakan untuk Peserta tanpa Catatan Kaki)
Chris Peters, Wilayah A Taylor Graham, Wilayah B

Persen Lebih/ Persen Lebih/


Ukuran Target SebenarnyaB (Di bawah) Target SebenarnyaC (Di bawah) Target

Keuangan:
1. Markup harga rata-rata barang 60% 58,02% (3,30%) 60,83% 1,38%
daganganSebuah
2. Pertumbuhan penjualan dari toko yang 15% 14,78% (1,47%) 16,39% 9,27%
adaSebuah
3. Perputaran persediaan 6.00 6.86 14,33% 6.22 3,60%
4. Pengembalian aset 20% 22,24% 11,20% 21,31% 6,54%
Pelanggan:
1. Harga relatif terhadap harga 7% 7,99% 14,14% 7,52% 7,43%
pesaing
2. Peringkat kepuasan pelangganSebuah 80% 78,32% (2,10%) 83,62% 4,53%
3. Persentase penjualan ke pelanggan 5.0% 4.8% (4,00%) 5,20% 4,00%
baruSebuah
4. Jumlah pelanggan kartu 8,000 9.113 13,91% 8.479 5,99%
kredit Smithson per toko
Proses Internal:
1. Persentase penjualan dari ''pemimpin 80% 78,30% (2,13%) 83,04% 3,80%
pasar''Sebuah
2. Barang dagangan yang diiklankan dalam stok 78% 89,70% 15,00% 85,08% 9,08%
3. Pengalaman di dalam Toko— Peringkat audit 85% 82,66% (2,75%) 93,07% 9,49%
''Pembelanja Misteri''Sebuah
4. Rata-rata jumlah item per 2.00 2.275 13,75% 2.03 1.50%
penjualan
Pembelajaran dan pertumbuhan:
1. Peringkat kepuasan karyawanSebuah 80% 77,86% (2,68%) 81,37% 1,71%
2. Saran karyawan per tahun 2.50 2.81 12,40% 2.57 2.80%
3. Komputerisasi toko 60% 68,52% 14,20% 66,02% 10,03%
4. Jam pelatihan yang diinvestasikan pada 80.0 78.8 (1,50%) 86.3 7,88%
manajer merek setiap tahunSebuah

SebuahLangkah-langkah ini diidentifikasi sebagai langkah-langkah ''terkait secara strategis'' dalam materi kasus.
BPerforma aktual Manajer A berubah berdasarkan kondisi Dominasi (SL Mendominasi atau NSL Mendominasi)
dan kondisi Negatif (Absent atau Present). Contoh yang ditampilkan di sini adalah ''NSL Mendominasi/Hadiah Negatif.''
CKinerja
sebenarnya Manajer B identik dalam dua kondisi Dominasi dengan Negativitas hadir (ditampilkan di sini).
Performanya lima poin persentase lebih tinggi untuk setiap hasil aktual dalam kondisi Absen Negativitas.

Penelitian Perilaku Dalam Akuntansi


Volume 24, Nomor 2, 2012
Hak Cipta Penelitian Perilaku dalam Akuntansi adalah milik American Accounting Association dan isinya tidak boleh
disalin atau diemail ke beberapa situs atau diposting ke listserv tanpa izin tertulis dari pemegang hak cipta. Namun,
pengguna dapat mencetak, mengunduh, atau mengirim email artikel untuk penggunaan individu.

Anda mungkin juga menyukai