Anda di halaman 1dari 10

Dosen Pengampu : Dr. Tahrir M.

Si
Nama : Ragil Fily Ramadhan
Mata Kuliah : Psikometrik
Kelas/Nim : 3D / 1216000165

Ringkasan Chapter 3 buku Psychological Testing

FORMAT PILIHAN ALTERNATIF


Item pilihan alternatif menyajikan pertanyaan dan satu set kemungkinan jawaban.
Karena peserta tes memilih jawaban dari set ini, item pilihan alternatif kadang-kadang disebut
item tipe seleksi (misalnya, Thorndike et al., 1991). Item pilihan alternatif diberi skor
menggunakan aturan objektif, membuat beberapa psikolog merujuknya sebagai item objektif
(misalnya, Aiken, 1991). Item pilihan alternatif berbeda terutama dalam jumlah alternatif atau
jawaban yang diberikan.
Faktor yang Perlu Dipertimbangkan Sebelum Menulis Butir Tes; Kesulitan barang, Fitur
stimulus dan respons item, Batas waktu.

Item Benar/Salah
Item benar/salah berguna untuk menilai pengetahuan tentang informasi faktual
kategoris. Benar/salah adalah format populer untuk pengujian kelas tetapi jarang digunakan
dalam tes kemampuan standar. Ini menarik karena item-item ini tampaknya relatif sederhana
untuk ditulis, dikelola, dan dinilai. Secara teori, lebih banyak item dapat menghasilkan sampel
yang lebih representatif dari domain konten. Pada kenyataannya, item benar/salah yang baik
lebih sulit untuk ditulis daripada yang dipikirkan kebanyakan orang, dan interpretasi skor pada
tes benar/salah itu sulit.
berikut untuk menghasilkan item yang baik:
1. Item benar/salah harus menghindari kualifikasi seperti "selalu", "kadang-kadang", atau
"tidak pernah". 2. Soal tes yang baik diambil dari elemen-elemen penting dari domain tes. 3.
Pertanyaan benar/salah harus menggunakan pernyataan singkat dan sederhana yang mencakup
satu hal. 4. Item benar/salah harus menggunakan struktur tata bahasa yang sederhana.

Item yang Cocok


Mencocokkan pertanyaan mencakup satu set item yang akan dicocokkan dan daftar
alternatif. Untuk setiap item, peserta tes memilih alternatif yang sesuai dari daftar pendamping.
Dalam pengertian ini, item yang cocok seperti serangkaian pertanyaan pilihan ganda yang
digabungkan menjadi satu set. Formatnya agak fleksibel; item dapat murni verbal atau dapat
menggabungkan grafik, peta, atau diagram. Meskipun kebanyakan orang mengakui bahwa
pencocokan adalah teknik yang efektif untuk menilai pengetahuan tentang fakta dan prinsip,
itu juga dapat digunakan untuk menentukan kemampuan untuk memahami atau menerapkan
informasi.
Ada beberapa panduan untuk menulis item yang cocok:
1. Setiap set item yang cocok harus diambil dari area spesifik do main. 2. Soal yang akan
dicocokkan mirip dengan batang pertanyaan pilihan ganda. 3. Yang terbaik adalah
memasukkan setidaknya satu alternatif yang salah yang tidak cocok dengan salah satu item. 4.
Arahan untuk satu set pencocokan harus menentukan apakah alternatif dapat digunakan di lebih
dari satu pertandingan.

Item Pilihan Ganda Berbagai Jenis Item Pilihan Ganda


Dari format pilihan alternatif, pertanyaan pilihan ganda adalah jenis yang paling populer untuk
tes kemampuan kelas dan standar. Soal pilihan ganda terdiri dari satu batang (bagian
pertanyaan) dan satu set alternatif (jawaban), termasuk jawaban yang benar dan satu set
pengecoh atau jawaban yang salah.
Popularitas item pilihan ganda secara langsung berkaitan dengan fleksibilitas mereka
Misalnya. item pilihan ganda dapat berupa verbal atau gambar atau dapat mencakup kombinasi
dari keduanya. Meskipun tes kelas dan tes prestasi standar yang familiar menggunakan item
verbal, ada banyak contoh jenis item pilihan ganda lainnya.

Membandingkan Item Pilihan Alternatif dan Tanggapan Bebas


setiap jenis item memiliki kelebihan dan kekurangan. Dua contoh nyata adalah penulisan butir
soal dan penilaian tanggapan. Item pilihan ganda lebih sulit untuk ditulis tetapi menawarkan
keunggulan penilaian yang berbeda. Di sisi lain, item esai mungkin lebih mudah untuk ditulis
tetapi lebih menantang untuk dinilai. Yang terpenting, perhatikan bahwa dengan penulis yang
terampil, kedua jenis item dapat digunakan untuk mengukur berbagai kemampuan dan
keterampilan yang canggih.

MEMILIH SISTEM SKOR


Koreksi untuk Menebak
Item pilihan alternatif menyajikan pertanyaan dan kemungkinan jawaban. Oleh karena itu,
mungkin saja peserta tes dapat memperoleh poin dengan memilih jawaban secara acak untuk
setiap pertanyaan. Tebakan acak mencemari nilai tes sebagai ukuran dari apa yang diketahui
atau dapat dilakukan orang. Untuk menghasilkan ukuran kemampuan yang lebih murni, skor
pada tes pilihan alternatif dapat disesuaikan dengan koreksi untuk rumus menebak. Agar rumus
tersusun secara statistik, dua syarat yang harus dipenuhi:
1. Semua tebakan harus tebakan acak, dengan setiap alternatif memiliki probabilitas
pemilihan yang sama
2. Semua jawaban yang salah harus merupakan hasil tebakan.
Asumsi yang sering terjadi dalam pemberian skor ketika menebak jawaban secara acak:
1. Peserta tes seringkali memiliki informasi yang cukup untuk menghilangkan setidaknya
satu alternatif.
2. Mengharuskan menebak menjadi sumber dari semua jawaban yang salah.
Pada akhirnya sebagian besar ahli setuju bahwa jumlah jawaban yang benar adalah ukuran
yang wajar dari pengetahuan dan keterampilan peserta tes

Skor dengan Referensi Norma


Penilaian yang mengacu pada norma biasanya digunakan pada tes bakat dan pencapaian
standar dan dirancang khusus untuk memberikan informasi tentang perbedaan individu dalam
kinerja. Proses menghasilkan nilai yang mengacu pada norma memiliki beberapa tahap dan
dapat menghasilkan salah satu dari berbagai jenis nilai acuan norma.

Proses Referensi Norma


Penilaian yang mengacu pada norma biasanya digunakan pada tes bakat dan pencapaian
standar dan dirancang khusus untuk memberikan informasi tentang perbedaan individu dalam
kinerja. Proses menghasilkan nilai yang mengacu pada norma memiliki beberapa tahap dan
dapat menghasilkan salah satu dari berbagai jenis nilai acuan norma. Keputusan yang harus
dibuat dalam proses referensi norma.
1. Pengembang tes harus mendefinisikan grup referensi (grup norma) yang akan
dibandingkan dengan pengambil tes.
2. Pengembang tes memutuskan jenis skor referensi norma mana yang akan digunakan.
Pengembang tes harus memilih jenis skor referensi norma yang akan digunakan. Proses
referensi norma melibatkan perubahan atau transformasi total poin yang diperoleh pada tes,
yaitu mengubah skor mentah ke skala pengukuran baru. Ada dua kategori dasar nilai acuan
norma:
1. Skor menggunakan skala pengukuran ordinal (peringkat)
Jenis dasar skor ordinal adalah peringkat persentil. Skor ordinal referensi norma lainnya adalah
transformasi peringkat persentil. label alternatif untuk set persentil yang berbeda.
2. Skor menggunakan skala pengukuran interval.
Jenis dasar skor interval adalah skor-z yang biasanya disebut sebagai skor standar. Skor interval
referensi norma lainnya adalah transformasi skor-z ke unit pengukuran yang berbeda.

Jenis Skor yang direferensikan oleh Norma


Skor skala ordinal
Peringkat persentil: Mengonversi skor mentah menjadi persentil berdasarkan frekuensi
perolehan setiap skor tes
Kuartil/desil: Transformasi peringkat persentil; membagi distribusi persentil menjadi
seperempat (kuartil) atau sepersepuluh (desil); setiap skor mentah ditetapkan ke kuartil atau
desil berdasarkan peringkat persentil skor mentah
Usia dan kelas yang setara: Transformasi peringkat persentil; membagi usia atau kelas tingkat
menjadi satu set skor bulan-demi-bulan; setiap skor mentah dikonversi ke usia atau setara kelas
berdasarkan skor pada persentil ke-50 untuk setiap bulan Hasil bagi: Transformasi peringkat
persentil; menciptakan rasio skor setara usia dengan usia kronologis yang sebenarnya.

Skor skala interval


z-skor: Mengonversi skor mentah menjadi skor standar berdasarkan rata-rata dan standar
deviasi distribusi.
T-skor: Transformasi 2-skor; mengkonversi z-skor ke skala interval baru yang menghilangkan
angka negatif.

Proses Referensi Kriteria


1. Dimulai dengan identifikasi kriteria-sesuatu yang akan dibandingkan dengan kinerja
2. Lakukan pengetesan dan total poin yang diperoleh dari skor mentah diubah menjadi
bentuk referensi kriteria.
Kriterianya bisa berupa sesuatu yang sederhana seperti penguasaan isi tes. Dalam hal ini, skor
Anda akan mencerminkan jumlah item tes yang dijawab dengan benar. Atau kriterianya bisa
berupa penguasaan daftar fakta, prinsip, dan/atau keterampilan tertentu yang harus dikuasai
oleh peserta tes. Dalam hal ini, skor Anda akan mencerminkan jumlah fakta, prinsip, dan
keterampilan yang telah Anda kuasai.

Jenis Skor yang direferensikan oleh Kriteria


Tidak seperti penilaian acuan norma, penilaian acuan kriteria tidak mewakili kinerja
sebagai perbandingan kinerja kita dengan kinerja orang lain. Sebaliknya, skor yang
direferensikan kriteria mewakili kinerja setiap orang secara independen. Namun, ada
perbandingan atau kerangka acuan. Kinerja setiap orang dibandingkan dengan standar kinerja
yang disebut kriteria. Kriteria tersebut digunakan baik untuk menghasilkan skor maupun untuk
memandu interpretasi skor tersebut. Misalnya, isi tes dapat digunakan sebagai kerangka acuan
untuk menilai kinerja tes. Kriteria dapat ditetapkan sebagai penguasaan konten tes (yaitu,
menjawab item dengan benar). Contohnya seseorang yang menghasilkan jawaban yang
berhubungan untuk setengah dari pertanyaan tes menunjukkan penguasaan setengah dari
konten tes. Skor referensi kriteria yang sesuai dalam kasus ini adalah 50%.
istilah referensi kriteria digunakan secara khusus untuk skenario di mana skor tes
mencerminkan pengetahuan tentang domain yang diwakili oleh tes. Sayangnya, terminologi di
bidang ini menjadi semakin kacau. Saat ini, istilah tersebut digunakan untuk menggambarkan
jenis skor tertentu dan kategori skor.
1. Skor yang direferensikan konten (content-referenced scores)
Dalam penilaian konten-direferensikan (Brown, 1983) kerangka acuannya adalah
konten tes, dan kriterianya adalah penguasaan konten itu (yaitu, semua jawaban benar). Jenis
skor referensi konten yang paling sederhana adalah persen benar.
2. Skor yang mengacu pada hal-hal objektif (Objective-referenced Scores)
Kriteria yang menjadi acuan adalah penguasaan tujuan tersebut, dan sistem penilaian
kami menunjukkan jumlah atau persentase tujuan yang dikuasai oleh setiap peserta tes. Dengan
kata lain, objective-referenced scores menggunakan kriteria penguasaan terhadap hal-hal
objektif yang spesifik.
3. Skor Lulus/Gagal atau Penguasaan (Pass/fail or Mastery Scores)
Dimungkinkan untuk mengubah salah satu konten acuan atau acuan tujuan ke dalam jenis nilai
lainnya. Kadang-kadang tes dengan acuan kriteria digunakan untuk mengurutkan peserta tes
ke dalam dua kategori:
- Lulus : peserta yang kinerja tesnya memenuhi kriteria tertentu
- Gagal : peserta yang kinerjanya tidak memenuhi kriteria tertentu

Membandingkan Skor yang direferensikan Norma dan Kriteria


1. Skor yang direferensikan norma dirancang untuk menunjukkan tingkat relatif
pengetahuan dan keterampilan yang dimiliki setiap peserta tes. Contohnya tes
kemampuan yang terstandarisasi dan tes yang digunakan untuk keputusan seleksi dan
penempatan.
2. Tes yang mengacu pada kriteria dirancang untuk mengidentifikasi tingkat absolut dari
pengetahuan dan keterampilan yang dimiliki oleh setiap peserta tes. Tes referensi
kriteria tiang ditemukan di lingkungan pendidikan. Tes ini digunakan terutama untuk
menilai siswa dan mengidentifikasi kekuatan dan kelemahan (fungsi diagnostik).
Perbedaan tujuan menjelaskan mengapa kedua jenis tes tersebut digunakan dalam
keadaan yang berbeda. Skor yang mengacu pada kriteria menentukan pengetahuan dan
keterampilan setiap peserta tes secara mandiri.

Ringkasan Chapter 4 buku Psychological Testing


TES TUJUAN: KEPRIBADIAN DAN MINAT
Tes objektif adalah kinerja yang setara dengan tes kemampuan pilihan alternatif. Tes
ini dapat dirancang untuk mengukur kepribadian dan/atau minat dan dapat mencakup satu
atribut atau beberapa atribut. Kebanyakan tes objektif cocok untuk administrasi individu atau
kelompok.
Tes kepribadian mengukur disposisi dan preferensi individu dan sering kali berfokus
pada konstruksi seperti kepemimpinan, kecemasan, atau pengendalian diri. Tes kepribadian
objektif juga disebut tes laporan diri.
Tes minat mengukur pola kesukaan individu. dan tidak suka, biasanya dengan
meminta peserta tes melaporkan preferensi untuk kegiatan.
Format Barang
Tes objektif menggunakan format pilihan independen atau pilihan paksa, Format
independen menghasilkan ukuran normatif yang mewakili kekuatan karakteristik secara
absolut atau keseluruhan. Format pilihan paksa menghasilkan ukuran ipsatif yang mewakili
kekuatan relatif dari setiap karakteristik.
Item Independen
Item independen berbeda terutama dalam jumlah opsi respons. Item paling sederhana
adalah item dikotomis, yang menyajikan dua kemungkinan tanggapan Respon dikotomis
yang umum adalah ya/tidak dan benar/salah.
Item pilihan paksa
Format pilihan paksa yang paling umum adalah pernyataan berpasangan, yang
mengharuskan peserta tes untuk memilih antara dua atribut yang disajikan sebagai kata, frasa,
atau pernyataan.
Sejauh ini kita telah membedakan antara format pilihan bebas dan pilihan paksa
berdasarkan skema pengukuran-normatif atau ipsutif. Formatnya juga berbeda dalam
pendekatan mereka terhadap masalah bias respons. Karena tes objektif mengajukan
pertanyaan langsung, peserta tes berpotensi dapat membiaskan atau mendistorsi tanggapan
mereka. Selain itu, karena tes objektif meminta peserta tes untuk memilih respons dari
serangkaian opsi, mereka dapat menghasilkan jawaban untuk item tes tanpa pernah
mempertimbangkan konten item. Mereka dapat memilih jawaban secara acak, selalu memilih
"benar" untuk pertanyaan bernomor genap-terlibat dalam segala macam strategi
menghasilkan jawaban yang aneh. Semua jenis distorsi sistematis atau bias respons
mengancam validitas hasil tes karena respons tidak akan mencerminkan karakteristik peserta
tes yang sebenarnya Kemampuan tes untuk mengontrol atau mengidentifikasi distorsi tersebut
bervariasi sebagai fungsi dari format item Bias Respons dan Format Item
Kemampuan tes untuk mengontrol atau mengidentifikasi distorsi tersebut bervariasi
sebagai fungsi dari format item Dua jenis bias respons atau disimulasi dimungkinkan. Peserta
tes dapat mendemonstrasikan serangkaian respons, memilih jawaban secara sistematis dalam
upaya menampilkan diri mereka dalam sudut pandang tertentu kumpulan respons adalah bias
yang bergantung pada konten. Pengambil tes mendistorsi tanggapan mereka secara sistematis
sesuai dengan isi setiap item.
Jenis distorsi kedua adalah gaya respons. Dalam hal ini, pengambil tes mengadopsi
strategi sistematis untuk menjawab item yang mereka tidak yakin. Strategi "Jika ragu, pilih
C" pada tes pencapaian pilihan ganda adalah gaya respons ketika pernyataan penilaian
(kecenderungan sentral) adalah gaya respons yang digunakan pada tes kepribadian. Berbeda
dengan kumpulan respons, gaya respons adalah bias bebas konten.

Pemilihan Item dan Konstruksi Skala Menghasilkan Skor dengan Referensi Norma
Pendekatan yang digunakan pada tes kepribadian awal, seperti Lembar Data Pribadi
Woodworth (Woodworth, 1917, 1920), adalah konten logis atau strategi rasional. Item dipilih
dan ditugaskan ke skala secara rasional. Fokusnya adalah pada apakah isi item tampak secara
logis terkait dengan karakteristik yang diukur. Meskipun pendekatan konten logis dapat
menjadi cara yang berguna untuk mulai menulis item, pendekatan ini tidak lagi populer untuk
menguji konstruksi. Pendekatan mengarah pada pemilihan item yang jelas terkait dengan
karakteristik yang diukur.
Strategi kedua, yang digunakan dalam pengembangan EPPS, bersifat teoritis.
Meskipun lebih "ilmiah" daripada strategi konten logis, pendekatan teoretis tetap menekankan
hubungan konten antara item dan atribut yang mereka ukur. Pendekatan yang lebih ketat
menggunakan analisis empiris dari tanggapan terhadap item sebagai dasar untuk memilih
item dan membangun skala. Dua jenis analisis empiris telah digunakan: (1) metode kelompok
kriteria dan (2) metode analisis faktor. Dalam metode kelompok kriteria atau kontras, item
disajikan ke berbagai kelompok referensi, dan tanggapan dianalisis untuk menentukan
bagaimana tipe orang yang berbeda menjawab setiap item. Fokus di sini adalah diskriminasi
item-kami ingin memilih item yang dijawab secara berbeda oleh kelompok orang yang
berbeda. Pendekatan kelompok kriteria digunakan dalam pengembangan tes minat pertama
Strong, Blank Minat Kejuruan Kuat

TES PROYEKTIF: KEPRIBADIAN Logika Pengujian Proyektif


Item tes proyektif adalah rangsangan ambigu untuk ditafsirkan oleh peserta tes.
Kebanyakan tes proyektif diberikan secara individual. Item proyektif dapat menggunakan
rangsangan lisan, tertulis, atau gambar dan memerlukan tanggapan lisan, tertulis, atau
gambar.
Meskipun tes proyektif dapat menghasilkan skor pada dimensi kepribadian yang
berbeda, tujuannya adalah untuk menyajikan gambaran kepribadian yang lebih terintegrasi
dan holistik. Ada lebih banyak penekanan pada evaluasi kepribadian dalam kerangka teoritis
dan pada memperoleh informasi dari berbagai tingkat kesadaran. Alasan teoritis asli untuk
pengujian proyektif adalah hipotesis proyektif (misalnya, Frank, 1939). Menurut hipotesis ini,
interpretasi stimulus ambigu memunculkan proyeksi, sebuah proses di mana kebutuhan,
perasaan, dan pengalaman tercermin dalam cara seseorang memahami dan menggambarkan
stimulus. Melalui proyeksi seseorang dapat mengungkapkan aspek kepribadian yang tidak
disadari atau laten yang tidak mungkin disadap oleh item tes objektif. Kunci untuk
memunculkan proyeksi adalah (1) menyajikan stimulus yang ambigu atau tugas yang tidak
terstruktur, seperti menggambarkan noda tinta atau menggambar seseorang, dan (2)
mengharuskan peserta tes untuk menghasilkan, bukan memilih, tanggapan.
Format Barang
Meskipun semua tes proyektif membutuhkan peserta tes untuk menanggapi
rangsangan yang ambigu. mereka dapat dikelompokkan ke dalam kategori menurut (1) jenis
rangsangan yang disajikan dan (2) tanggapan yang diperlukan dari peserta tes. Tiga format
item proyektif yang paling populer adalah teknik verbal, tugas menggambar, dan teknik
bergambar.
Teknik Verbal
Teknik verbal menggunakan rangsangan verbal dan respon verbal. Asumsi yang
mendasarinya adalah bahwa pemikiran kita diungkapkan oleh pilihan kata-kata kita. Tes
verbal dapat berupa lisan atau tertulis dan dapat disesuaikan untuk administrasi kelompok.
Dua teknik verbal yang paling populer adalah asosiasi kata dan kalimat tidak lengkap.
Tugas Menggambar
Meskipun teknik verbal menghadirkan rangsangan yang ambigu, tugas itu sendiri
cukup terstruktur dan jenis respons yang diperlukan cukup spesifik. Banyak psikolog melihat
teknik verbal sebagai terlalu terstruktur, membatasi kesempatan peserta tes untuk ekspresi
diri. Tugas menggambar kurang terstruktur, mengharuskan peserta tes menggambar orang
dan, terkadang, objek lain dengan arahan minimal dari penguji. Tes menggambar
mencerminkan psikoanalitik sebagai asumsi tentang cara karakteristik dan konflik
diekspresikan dalam aktivitas kreatif
Teknik Bergambar Pemilihan Item dan Konstruksi Skala
Teknik bergambar menyajikan gambar visual yang ambigu kepada pengambil tes.
Dua jenis yang berbeda telah muncul. Tes noda tinta mengharuskan peserta tes untuk
menggambarkan apa yang mereka lihat ketika mereka melihat serangkaian noda tinta hitam
putih atau berwarna. Tes cerita membutuhkan peserta tes untuk menggambarkan orang dan
peristiwa yang diwakili pada serangkaian kartu bergambar.
Seperti tes objektif, tes proyektif dapat dikembangkan dengan menggunakan
pendekatan teoritis, atau empiris. Namun, karena hubungan mereka yang kuat dengan teori
psikoanalitik, banyak tes proyektif menggunakan strategi teoretis
Tes Kepribadian Ditinjau Kembali
Proses pengujian kepribadian. Pertama, ingat aturan dasar tentang penggunaan tes dan
interpretasi nilai tes. Tes digunakan untuk memberikan perkiraan karakteristik peserta tes.
Hanya individu yang naif yang percaya bahwa nilai ujian adalah ukuran yang mutlak atau
sempurna. Tes kepribadian mungkin memiliki masalah, tetapi tes tersebut menyediakan
beberapa teknik standar untuk memeriksa karakteristik peserta tes. Kedua, karena mereka
adalah tes, mereka menggunakan sistem untuk mengevaluasi orang-orang yang dapat diteliti
untuk menentukan keefektifannya. Adalah mungkin untuk mengidentifikasi kekuatan dan
kelemahan teknis mereka. Ketiga, ratusan tes kepribadian saat ini tersedia. Kebanyakan
dokter menggunakan lebih dari satu tes dalam proses evaluasi.
Dengan menggunakan beberapa tes yang berbeda, dimungkinkan untuk meningkatkan
akurasi kesimpulan tentang karakteristik peserta tes. Dan, akhirnya, tes kepribadian hanyalah
salah satu mekanisme untuk mengeksplorasi kepribadian. Penilaian yang paling akurat
menggabungkan informasi dari tes, pengamatan perilaku, dan wawancara.
SKALA SIKAP
Sikap adalah kecenderungan untuk bereaksi positif atau negatif terhadap jenis objek,
orang, atau situasi tertentu. Meskipun sikap dapat dianggap sebagai elemen kepribadian,
konstruksi skala sikap melibatkan teknik yang agak berbeda. Seperti aspek kepribadian
lainnya, sikap adalah konstruksi yang tidak dapat diukur secara langsung. Kehadiran dan sifat
sikap harus disimpulkan dari perilaku yang dapat diamati, termasuk perilaku seperti
tanggapan terhadap serangkaian pertanyaan.
Format Barang
Skala sikap menyajikan pernyataan spesifik untuk dinilai oleh pengambil tes. Seperti
halnya tes kepribadian objektif, formatnya bervariasi dalam jumlah dan jenis kategori
respons. Item pada skala sikap menggunakan variasi struktur yang sama yang dibahas pada
bagian item independen
Pemilihan Item dan Konstruksi Skala
Perbedaan utama antara skala sikap dan tes kepribadian adalah proses pemilihan item
dan konstruksi skala. Diskusi lengkap tentang teknik penskalaan berada di luar cakupan buku
ini; seluruh volume telah ditulis hanya pada proses membangun skala sikap.

SKALA EVALUASI
Isi skala evaluasi ditentukan melalui prosedur yang dijelaskan dalam Bab 2. Jika skala
untuk mengevaluasi kinerja pekerjaan, isi ditentukan melalui proses tugas atau analisis
pekerjaan (hal. 49). Jika skalanya adalah untuk mengevaluasi ciri-ciri kepribadian, konten
ditentukan melalui penjelasan konstruk (hal. 51). Spesifikasi isi skala, bagaimanapun, tidak
menjamin bahwa proses evaluasi akan menghasilkan data yang dapat diandalkan, valid, atau
bahkan berguna. Oleh karena itu, bagian berikut membahas konstruksi skala dan struktur
tugas evaluasi.
Format Barang
Format untuk skala evaluasi terbagi dalam dua kategori. Satu set format, skala
penilaian standar, dirancang untuk mengevaluasi setiap orang secara independen. Skala
penilaian standar dapat digunakan untuk evaluasi kepribadian dan perilaku, serta untuk
evaluasi kinerja pekerjaan. Jenis kedua, skala penilaian komparatif, dirancang untuk menilai
orang secara relatif satu sama lain. Skala penilaian komparatif tidak memberikan informasi
tentang tingkat kinerja absolut.
Skala Peringkat Standar
Dua format item yang biasa digunakan sebagai skala penilaian standar adalah daftar
periksa dan sortir Q. Daftar periksa dapat mencakup daftar deskriptor (misalnya, kata sifat)
atau daftar perilaku. Pengamat kemudian memeriksa perilaku yang terjadi atau deskriptor
yang berlaku. Dalam teknik Q-sort, deskripsi diurutkan ke dalam tumpukan sesuai dengan
sejauh mana pernyataan cocok dengan apa yang telah diamat
Skala Peringkat Perbandingan
Semua skala sebelumnya adalah skala standar, yang dirancang untuk mengevaluasi
setiap orang secara mandiri. Terkadang berguna untuk menilai orang dengan membandingkan
mereka satu sama lain, terutama dalam situasi kinerja pekerjaan. Skala komparatif memberi
peringkat orang relatif satu sama lain pada satu atau lebih karakteristik dan paling sering
digunakan dalam situasi seperti keputusan tentang kenaikan gaji atau promosi.
Tiga jenis skala penilaian komparatif. Skala peringkat penuh secara harfiah memberi
peringkat memerintahkan semua orang dalam kelompok pada dimensi tertentu. Skala
distribusi paksa mengharuskan penilai untuk menetapkan sejumlah orang dalam setiap
kategori penilaian. Jenis skala komparatif ketiga adalah perbandingan berpasangan, juga
disebut skala man-10-man (misalnya, Brown, 1983).
Kesalahan Penilai dan Format Item
Agar data dari tugas evaluasi valid, pengamat harus menilai atau memeringkat orang
secara akurat dan objektif. Salah satu kesalahan penilai yang paling umum adalah efek halo,
kecenderungan penilai untuk mendasarkan penilaian mereka pada tayangan umum. Efek Halo
dapat diidentifikasi dengan memeriksa pola peringkat di seluruh karakteristik yang dinilai.
Meskipun tidak ada cara untuk menghilangkan efek halo, mereka cenderung tidak terjadi
ketika kategori peringkat didefinisikan dalam istilah perilaku yang konkret.
Serangkaian kesalahan lain terjadi ketika penilai terlalu sering menggunakan bagian
tertentu dari skala penilaian. Kesalahan tendensi sentral terjadi ketika penilai menggunakan
bagian tengah skala secara berlebihan, menghindari penggunaan peringkat yang ekstrim.
Kesalahan leniency terjadi ketika penilai terlalu sering menggunakan kategori tinggi dan
menghindari menggunakan kategori yang lebih rendah; kesalahan keparahan terjadi ketika
penilai terlalu sering menggunakan kategori rendah dan menghindari penggunaan kategori
atas. Salah satu cara untuk mengurangi kesalahan ini adalah dengan menggunakan skala
komparatif yang memaksa penilai untuk membedakan antara individu yang dievaluasi.
Meningkatkan Akurasi Rating
Pendekatan yang lebih baik adalah mengatasi penyebab kesalahan penilai dengan
merestrukturisasi tugas evaluasi itu sendiri. Skenario pemeringkatan yang paling sukses berisi
fitur-fitur berikut (Thorndike et al., 1991):
1. Penilai berkomitmen pada proses evaluasi. Tugas evaluasi harus disajikan sebagai sesuatu
yang berharga dan penting.
2. Penilai bersikap objektif..
3. Penilai memiliki kesempatan yang luas untuk mengamati orang yang akan dinilai.
4. Penilai diberikan deskripsi perilaku yang konkret dari karakteristik yang akan dinilai.

Anda mungkin juga menyukai