Si
Nama : Ragil Fily Ramadhan
Mata Kuliah : Psikometrik
Kelas/Nim : 3D / 1216000165
Item Benar/Salah
Item benar/salah berguna untuk menilai pengetahuan tentang informasi faktual
kategoris. Benar/salah adalah format populer untuk pengujian kelas tetapi jarang digunakan
dalam tes kemampuan standar. Ini menarik karena item-item ini tampaknya relatif sederhana
untuk ditulis, dikelola, dan dinilai. Secara teori, lebih banyak item dapat menghasilkan sampel
yang lebih representatif dari domain konten. Pada kenyataannya, item benar/salah yang baik
lebih sulit untuk ditulis daripada yang dipikirkan kebanyakan orang, dan interpretasi skor pada
tes benar/salah itu sulit.
berikut untuk menghasilkan item yang baik:
1. Item benar/salah harus menghindari kualifikasi seperti "selalu", "kadang-kadang", atau
"tidak pernah". 2. Soal tes yang baik diambil dari elemen-elemen penting dari domain tes. 3.
Pertanyaan benar/salah harus menggunakan pernyataan singkat dan sederhana yang mencakup
satu hal. 4. Item benar/salah harus menggunakan struktur tata bahasa yang sederhana.
Pemilihan Item dan Konstruksi Skala Menghasilkan Skor dengan Referensi Norma
Pendekatan yang digunakan pada tes kepribadian awal, seperti Lembar Data Pribadi
Woodworth (Woodworth, 1917, 1920), adalah konten logis atau strategi rasional. Item dipilih
dan ditugaskan ke skala secara rasional. Fokusnya adalah pada apakah isi item tampak secara
logis terkait dengan karakteristik yang diukur. Meskipun pendekatan konten logis dapat
menjadi cara yang berguna untuk mulai menulis item, pendekatan ini tidak lagi populer untuk
menguji konstruksi. Pendekatan mengarah pada pemilihan item yang jelas terkait dengan
karakteristik yang diukur.
Strategi kedua, yang digunakan dalam pengembangan EPPS, bersifat teoritis.
Meskipun lebih "ilmiah" daripada strategi konten logis, pendekatan teoretis tetap menekankan
hubungan konten antara item dan atribut yang mereka ukur. Pendekatan yang lebih ketat
menggunakan analisis empiris dari tanggapan terhadap item sebagai dasar untuk memilih
item dan membangun skala. Dua jenis analisis empiris telah digunakan: (1) metode kelompok
kriteria dan (2) metode analisis faktor. Dalam metode kelompok kriteria atau kontras, item
disajikan ke berbagai kelompok referensi, dan tanggapan dianalisis untuk menentukan
bagaimana tipe orang yang berbeda menjawab setiap item. Fokus di sini adalah diskriminasi
item-kami ingin memilih item yang dijawab secara berbeda oleh kelompok orang yang
berbeda. Pendekatan kelompok kriteria digunakan dalam pengembangan tes minat pertama
Strong, Blank Minat Kejuruan Kuat
SKALA EVALUASI
Isi skala evaluasi ditentukan melalui prosedur yang dijelaskan dalam Bab 2. Jika skala
untuk mengevaluasi kinerja pekerjaan, isi ditentukan melalui proses tugas atau analisis
pekerjaan (hal. 49). Jika skalanya adalah untuk mengevaluasi ciri-ciri kepribadian, konten
ditentukan melalui penjelasan konstruk (hal. 51). Spesifikasi isi skala, bagaimanapun, tidak
menjamin bahwa proses evaluasi akan menghasilkan data yang dapat diandalkan, valid, atau
bahkan berguna. Oleh karena itu, bagian berikut membahas konstruksi skala dan struktur
tugas evaluasi.
Format Barang
Format untuk skala evaluasi terbagi dalam dua kategori. Satu set format, skala
penilaian standar, dirancang untuk mengevaluasi setiap orang secara independen. Skala
penilaian standar dapat digunakan untuk evaluasi kepribadian dan perilaku, serta untuk
evaluasi kinerja pekerjaan. Jenis kedua, skala penilaian komparatif, dirancang untuk menilai
orang secara relatif satu sama lain. Skala penilaian komparatif tidak memberikan informasi
tentang tingkat kinerja absolut.
Skala Peringkat Standar
Dua format item yang biasa digunakan sebagai skala penilaian standar adalah daftar
periksa dan sortir Q. Daftar periksa dapat mencakup daftar deskriptor (misalnya, kata sifat)
atau daftar perilaku. Pengamat kemudian memeriksa perilaku yang terjadi atau deskriptor
yang berlaku. Dalam teknik Q-sort, deskripsi diurutkan ke dalam tumpukan sesuai dengan
sejauh mana pernyataan cocok dengan apa yang telah diamat
Skala Peringkat Perbandingan
Semua skala sebelumnya adalah skala standar, yang dirancang untuk mengevaluasi
setiap orang secara mandiri. Terkadang berguna untuk menilai orang dengan membandingkan
mereka satu sama lain, terutama dalam situasi kinerja pekerjaan. Skala komparatif memberi
peringkat orang relatif satu sama lain pada satu atau lebih karakteristik dan paling sering
digunakan dalam situasi seperti keputusan tentang kenaikan gaji atau promosi.
Tiga jenis skala penilaian komparatif. Skala peringkat penuh secara harfiah memberi
peringkat memerintahkan semua orang dalam kelompok pada dimensi tertentu. Skala
distribusi paksa mengharuskan penilai untuk menetapkan sejumlah orang dalam setiap
kategori penilaian. Jenis skala komparatif ketiga adalah perbandingan berpasangan, juga
disebut skala man-10-man (misalnya, Brown, 1983).
Kesalahan Penilai dan Format Item
Agar data dari tugas evaluasi valid, pengamat harus menilai atau memeringkat orang
secara akurat dan objektif. Salah satu kesalahan penilai yang paling umum adalah efek halo,
kecenderungan penilai untuk mendasarkan penilaian mereka pada tayangan umum. Efek Halo
dapat diidentifikasi dengan memeriksa pola peringkat di seluruh karakteristik yang dinilai.
Meskipun tidak ada cara untuk menghilangkan efek halo, mereka cenderung tidak terjadi
ketika kategori peringkat didefinisikan dalam istilah perilaku yang konkret.
Serangkaian kesalahan lain terjadi ketika penilai terlalu sering menggunakan bagian
tertentu dari skala penilaian. Kesalahan tendensi sentral terjadi ketika penilai menggunakan
bagian tengah skala secara berlebihan, menghindari penggunaan peringkat yang ekstrim.
Kesalahan leniency terjadi ketika penilai terlalu sering menggunakan kategori tinggi dan
menghindari menggunakan kategori yang lebih rendah; kesalahan keparahan terjadi ketika
penilai terlalu sering menggunakan kategori rendah dan menghindari penggunaan kategori
atas. Salah satu cara untuk mengurangi kesalahan ini adalah dengan menggunakan skala
komparatif yang memaksa penilai untuk membedakan antara individu yang dievaluasi.
Meningkatkan Akurasi Rating
Pendekatan yang lebih baik adalah mengatasi penyebab kesalahan penilai dengan
merestrukturisasi tugas evaluasi itu sendiri. Skenario pemeringkatan yang paling sukses berisi
fitur-fitur berikut (Thorndike et al., 1991):
1. Penilai berkomitmen pada proses evaluasi. Tugas evaluasi harus disajikan sebagai sesuatu
yang berharga dan penting.
2. Penilai bersikap objektif..
3. Penilai memiliki kesempatan yang luas untuk mengamati orang yang akan dinilai.
4. Penilai diberikan deskripsi perilaku yang konkret dari karakteristik yang akan dinilai.