Anda di halaman 1dari 9

Bab I

Prinsip dalam pengukuran psikologi

Pengertian pengukuran

Setiap orang memiliki pengalaman dengan tes. Tes adalah alat atau teknik pengukuran digunakan untuk
mengukur perilaku atau bantuan dalam pemahaman dan prediksi perilaku. Tes ejaan misalnya,
mengukur seberapa baik seseorang mengeja atau sejauh mana seseorang telah belajar mengeja daftar
kata tertentu. Di beberapa waktu selama berikutnya beberapa minggu, instruktur Anda mungkin ingin
mengukur seberapa baik Anda telah belajar

Tes psikologis atau tes pendidikan adalah serangkaian item yang dirancang untuk mengukur
karakteristik manusia yang berkaitan dengan perilaku. Beberapa tes psikologi berusaha mengukur
sejauh mana seseorang mungkin terlibat atau "memancarkan" perilaku terbuka tertentu. Tes lain
mengukur seberapa banyak yang dimiliki seseorang sebelumnya terlibat dalam beberapa perilaku
terbuka. Perilaku juga bisa terselubung — yaitu, itu terjadi dalam diri seseorang dan tidak dapat diamati
secara langsung. Misalnya, perasaan dan pikiran adalah jenis perilaku terselubung.

Norma ,arti skor dan statistik dasar untuk pengujian

Norma adalah kinerja normal atau rata-rata. Dengan demikian, jika anak-anak normal berusia 8 tahun
menyelesaikan 12 dari 50 masalah dengan benar pada tes penalaran aritmatika tertentu, maka norma 8
tahun pada tes ini sesuai dengan skor 12. Yang terakhir dikenal sebagai skor mentah. pada tes. Ini dapat
dinyatakan sebagai jumlah item yang benar, waktu yang dibutuhkan untuk menyelesaikan tugas, jumlah
kesalahan, atau beberapa ukuran obyektif lain yang sesuai dengan konten tes. Skor mentah seperti itu
tidak ada artinya sampai dievaluasi dalam hal seperangkat norma yang sesuai.

Dapat juga dicatat bahwa norma ditetapkan untuk tes kepribadian pada dasarnya dengan cara yang
sama seperti untuk tes bakat. Norma pada tes kepribadian tidak selalu merupakan kinerja yang paling
diinginkan atau "ideal", lebih dari skor sempurna atau tanpa kesalahan adalah norma pada tes bakat.
Pada kedua jenis tes, norma sesuai dengan kinerja individu tipikal atau rata-rata. Pada tes dominasi-
pengajuan, misalnya, norma jatuh pada titik menengah yang mewakili tingkat dominasi atau pengajuan
dimanifestasikan oleh individu rata-rata. Demikian pula, dalam inventaris penyesuaian emosional,
norma biasanya tidak sesuai dengan tidak adanya respons yang tidak menguntungkan atau maladaptif,
karena beberapa respons tersebut terjadi pada sebagian besar individu "normal" dalam sampel
standardisasi. Dengan demikian jelas bahwa tes psikologis, apa pun jenisnya, didasarkan pada norma-
norma yang ditetapkan secara empiris.

skor tes adalah bagian dari informasi yang diberikan kepada individu sebagai alat bantu untuk proses
pengambilan keputusannya sendiri. skor individu dievaluasi dengan membandingkannya dengan skor
yang diperoleh orang lain.
MENGAPA KITA MEMBUTUHKAN STATISTIK? Meskipun komitmennya terhadap metode ilmiah, psikologi
modern telah maju melampaui berabad-abad spekulasi tentang sifat manusia. Studi ilmiah
membutuhkan sistem pengamatan tematik dan estimasi sejauh mana pengamatan bisa telah
dipengaruhi secara kebetulan (Salkind, 2007). Metode statistik melayani dua tujuan penting dalam
pencarian pemahaman ilmiah.

Pertama, statistik digunakan untuk tujuan deskripsi. Nomor menyediakan ringkasan venient dan
memungkinkan kita untuk mengevaluasi beberapa pengamatan relatif terhadap yang lain (Cohen & Lea,
2004; Pagano, 2004; Th Thompson, 2006). Misalnya, jika Anda mendapatkannya skor 54 pada ujian
psikologi, Anda mungkin ingin tahu apa itu 54 artinya. Apakah lebih rendah dari skor rata-rata, atau
hampir sama? Mengetahui jawabannya dapat membuat umpan balik yang Anda dapatkan dari ujian
Anda lebih bermakna. Jika Anda menemukan bahwa 54 menempatkan Anda di 5% teratas kelas, maka
Anda mungkin berasumsi Anda memiliki peluang bagus untuk mendapat nilai A. Jika menempatkan
Anda di 5% terbawah, maka Anda akan merasakannya berbeda.

Kedua, kita bisa menggunakan statistik untuk membuat kesimpulan, yang merupakan deduksi logis
tentang peristiwa yang tidak dapat diamati secara langsung. Misalnya, Anda tidak tahu caranya banyak
orang menonton film televisi tertentu kecuali Anda bertanya kepada semua orang. Bagaimana pernah,
dengan menggunakan survei sampel ilmiah, Anda dapat menyimpulkan persentase orang yangmelihat
film. Pengumpulan dan analisis data dapat dianggap analog dengan kriminal investigasi dan penuntutan
(Cox, 2006; Regenwetter, 2006; Tukey, 1977).

Kolerasi dan Regresi

KORELASI

Dalam analisis korelasional, kami bertanya apakah dua variabel kovari. Dengan kata lain, Y menjadi lebih
besar karena X semakin besar? Misalnya, apakah pasien merasa pusing ketika dokter meningkatkan
dosis obat? Apakah orang mendapatkan lebih banyak penyakit ketika mereka berada lebih banyak stres?
Analisis korelasional dirancang terutama untuk menguji linear hubungan antar variabel. Meskipun
seseorang dapat menggunakan teknik korelasional untuk mempelajari hubungan-hubungan non-linier,
melakukannya terletak di luar ruang lingkup buku ini.2 Koefisien korelasi adalah indeks matematika yang
menggambarkan arah dan besarnya suatu hubungan. Gambar 3.3 menunjukkan tiga jenis hubungan
yang berbeda. dikirimkan antar variabel. Bagian (a) angka menunjukkan korelasi positif. Ini berarti
bahwa skor tinggi pada Y dikaitkan dengan skor tinggi pada X, dan rendah skor pada Y sesuai dengan
skor rendah pada X. Bagian (b) menunjukkan korelasi negatif. Kapan ada korelasi negatif, skor yang lebih
tinggi pada Y dikaitkan dengan skor yang lebih rendah pada

X, dan skor yang lebih rendah pada Y dikaitkan dengan skor yang lebih tinggi pada X. Hal ini mungkin
menggambarkan

hubungan antara penggunaan barbiturat dan jumlah aktivitas: semakin tinggi obat
dosis, semakin kurang aktif pasien. Bagian (c) dari Gambar 3.3 tidak menunjukkan korelasi, atau

situasi di mana variabel tidak terkait. Di sini, skor pada X tidak memberi kita

informasi tentang skor pada Y. Contoh hubungan semacam ini adalah kurangnya

korelasi antara ukuran sepatu dan IQ.

Ada banyak cara untuk menghitung koefisien korelasi. Semua melibatkan pasangan

pengamatan: Untuk setiap pengamatan pada satu variabel, ada pengamatan pada satu variabel

variabel lain untuk orang yang sama.3

Lampiran 3.1 (pada akhir bab ini) menawarkan

contoh perhitungan korelasi. Semua metode penghitungan correla

Regresi

Garis regresi Kami menggunakan korelasi untuk menilai besarnya dan arah hubungan. Sebuah teknik
terkait, dikenal sebagai regresi, digunakan untuk membuat prediksi tentang skor pada satu vari yang
mampu dari pengetahuan skor pada variabel lain. Prediksi ini diperoleh dari garis regresi, yang dianggap
sebagai garis lurus yang paling pas melalui serangkaian titik dalam diagram yang tersebar. Hal ini
ditemukan dengan menggunakan prinsip paling kotak, yang meminimalkan pergerakan kuadrat di
sekitar garis regresi. Mari kita jelaskan. Nilai rata-rata adalah titik yang paling kecil untuk satu variabel.
Ini berarti bahwa jumlah dari kuadrat deviasi sekitar rata-rata (mean) akan kurang dari nilai (mean)
selain nilai rata-rata (mean). Misalnya, perhatikan skor 5, 4, 3, 2, dan 1. Intinya, X/N = 15/5 = 3. Deviasi
kuadrat dari setiap nilai disekitar nilai rata-rata dapat ditemukan. Untuk skor 5, nilai deviasi kuadrat
adalah (5-3)2 = 4. Untuk skor 4, itu (4-3)2 = 1. Nilai 3 sama dengan nilai rata-rata, jadi nilai deviasi
kuadrat sekitar nilai rata-rata (3-3)2 = 0. Dalam definisi, nilai rata-rata ini akan selalu menjadi nilai yang
paling kecil daripada nilai kuadrat. Garis regresi adalah rata-rata berjalan atau garis paling kotak dalam
dua di di laki-laki atau di ruang yang diciptakan oleh dua variabel. Perhatikan situasi yang ditunjukkan
dalam diagram tersebarnya gambar 3.1. Untuk setiap level X(atau titik pada skala), ada distribusi skor
pada. Dengan kata lain, kita bisa FND sebuah mean of Ywhen Xis 3, lain rata-rata Ywhen Xis 4, dan
seterusnya. Metode persegi setidaknya dalam regresi menemukan garis lurus yang datang sedekat
mungkin dengan banyak ini Y berarti mungkin. Dengan kata lain, ini adalah garis dimana deviasi kuadrat
di sekitar garis tersebut berada Minimum. Sebelum kita sampai pada persamaan regresi, kita harus
mendefinisikan beberapa istilah yang tercakup. Istilah di sebelah kiri persamaan adalah Y". Ini adalah
nilai yang diprediksi dari Y. Ketika kita membuat persamaan, kita menggunakan nilai diamati dari Y dan
X. 'persamaan adalah hasil dari yang paling kecil kuadrat prosedur dan menunjukkan hubungan linear
terbaik
RegressionI mencoba untuk menentukan seberapa serupa varians antara dua variabel dengan membagi
kovariansi dengan rata-rata perbedaan setiap variabel. Ihe covariancei dihitung dari produk silang, atau
produk dari variasi di sekitar setiap nilai rata-rata.

Reliabilitas dan validitas

Reliabilitas/keandalan. Seberapa baik tes ini? Apakah ini berhasil? Pertanyaan-pertanyaan ini bisa —
dan kadang-kadang bisa — menghasilkan diskusi yang sia-sia selama berjam-jam. Pendapat subyektif,
firasat, dan bias pribadi dapat menyebabkan, di satu sisi, klaim berlebihan tentang apa yang dapat
dilakukan tes tertentu dan, di sisi lain, penolakan keras kepala. Satu-satunya pertanyaan wav seperti ini
dapat dijawab secara meyakinkan adalah dengan uji coba empiris. Evaluasi obyektif tes psikologis
terutama melibatkan penentuan keandalan dan validitas tes dalam situasi tertentu.

Seperti yang digunakan dalam psikometrik, istilah reliabilitas selalu berarti konsistensi. Uji reliabilitas
adalah konsistensi skor yang diperoleh oleh orang yang sama ketika diuji ulang dengan tes yang identik
atau dengan bentuk tes yang setara. Jika seorang anak menerima IQ 110 pada hari Senin dan IQ 80
ketika tes ulang pada hari Jumat, jelas bahwa sedikit atau tidak ada kepercayaan diri dapat dimasukkan
ke dalam skor baik. Demikian pula, jika dalam satu set 50 kata seseorang mengidentifikasi 40 dengan
benar, sedangkan di set lain, konon setara set ia mendapat skor hanya 20 benar, maka skor tidak dapat
diambil sebagai indeks yang dapat diandalkan dari pemahaman verbal. Yang pasti, dalam kedua ilustrasi
itu adalah mungkin bahwa hanya satu dari dua skor yang salah, tetapi ini hanya dapat ditunjukkan
dengan pengujian ulang selanjutnya. Dari data yang diberikan, kita dapat menyimpulkan bahwa kedua
skor tidak mungkin benar. Apakah satu atau tidak adalah perkiraan yang memadai dari kemampuan
individu dalam kosakata tidak dapat ditetapkan tanpa informasi tambahan.

Sebelum tes psikologi dirilis untuk penggunaan umum, pemeriksaan yang menyeluruh dan obyektif atas
keandalannya harus dilakukan. Berbagai jenis keandalan pengujian, serta metode pengukuran masing-
masing, akan dibahas dalam Bab 5. Keandalan dapat diperiksa dengan mengacu pada fluktuasi temporal,
pemilihan item tertentu atau sampel perilaku yang membentuk pengujian, peran penguji yang berbeda
atau pencetak gol, dan aspek lain dari situasi pengujian. Sangat penting untuk menentukan jenis
keandalan dan metode yang digunakan untuk menentukannya, karena tes yang sama dapat bervariasi
dalam aspek yang berbeda ini. Jumlah dan sifat individu yang diperiksa reliabilitasnya juga harus
dilaporkan. Dengan informasi seperti itu, pengguna tes dapat memperkirakan apakah tes akan sama-
sama andal untuk kelompok yang akan digunakannya, atau apakah akan lebih andal atau kurang andal.

Validitas/keabsahan. Tidak diragukan lagi pertanyaan paling penting yang harus ditanyakan tentang tes
psikologi menyangkut validitasnya, yaitu, sejauh mana tes tersebut benar-benar mengukur apa yang
hendak diukur. Validitas memberikan pemeriksaan langsung pada seberapa baik tes memenuhi
fungsinya. Penentuan validitas biasanya membutuhkan kriteria independen dan eksternal dari apa pun
yang dirancang untuk diukur oleh tes. Misalnya, jika tes bakat medis akan digunakan dalam memilih
pelamar yang menjanjikan untuk sekolah kedokteran, keberhasilan akhir di sekolah kedokteran akan
menjadi kriteria. Dalam proses memvalidasi tes semacam itu, akan diberikan kepada sekelompok besar
siswa pada saat masuk ke sekolah kedokteran. Beberapa ukuran kinerja di sekolah kedokteran pada
akhirnya akan diperoleh untuk setiap siswa berdasarkan nilai, penilaian oleh instruktur, keberhasilan
atau kegagalan dalam menyelesaikan pelatihan, dan sejenisnya. Ukuran gabungan seperti itu
merupakan kriteria yang dengannya skor tes awal masing-masing siswa harus dikorelasikan. Korelasi
yang tinggi, atau koefisien validitas, akan menandakan bahwa orang-orang yang mendapat nilai tinggi
pada tes relatif berhasil di sekolah kedokteran, sedangkan mereka yang mendapat skor rendah pada tes
tersebut memiliki kinerja yang buruk di sekolah kedokteran. Korelasi yang rendah akan menunjukkan
korespondensi kecil antara skor tes dan ukuran kriteria dan karenanya validitas yang buruk untuk tes.
Koefisien validitas memungkinkan kita untuk menentukan seberapa dekat kinerja kriteria dapat
diprediksi dari nilai tes.

Dengan cara yang sama, tes yang dirancang untuk tujuan lain dapat divalidasi dengan kriteria yang
sesuai. Tes kecakapan vokasional, misalnya, dapat divalidasi terhadap keberhasilan di tempat kerja dari
kelompok uji coba karyawan baru. Baterai pilot aptitude dapat divalidasi dengan pencapaian dalam
pelatihan penerbangan. Pengujian yang dirancang untuk penggunaan yang lebih luas dan lebih beragam
divalidasi berdasarkan sejumlah kriteria dan validitasnya hanya dapat ditetapkan dengan akumulasi data
secara bertahap dari berbagai jenis investigasi.

Pembaca mungkin telah memperhatikan paradoks yang jelas dalam konsep validitas tes. Jika perlu untuk
menindaklanjuti subjek atau dengan cara lain untuk memperoleh ukuran independen dari apa yang coba
diprediksi oleh tes, mengapa tidak membuang tes? Jawaban atas teka-teki ini dapat ditemukan dalam
perbedaan antara kelompok validasi di satu sisi dan kelompok di mana tes pada akhirnya akan
digunakan untuk keperluan operasional di sisi lain. Sebelum tes siap untuk digunakan, validitasnya harus
ditetapkan pada sampel subjek yang representatif. Skor dari orang-orang ini tidak dipekerjakan untuk
tujuan operasional tetapi hanya melayani dalam proses pengujian tes. Jika tes terbukti valid dengan
metode ini, maka dapat digunakan pada sampel lain dengan tidak adanya ukuran kriteria.

Mungkin masih diperdebatkan bahwa kita hanya perlu menunggu ukuran kriteria matang, tersedia, pada
kelompok mana pun untuk mendapatkan informasi yang coba diprediksi oleh tes. Tetapi prosedur
seperti itu akan sangat membuang waktu dan energi sehingga menjadi penghalang dalam banyak kasus.
Dengan demikian, kita dapat menentukan pelamar mana yang akan berhasil pada pekerjaan atau siswa
mana yang akan menyelesaikan kuliah dengan memuaskan dengan mengakui semua yang mendaftar
dan menunggu perkembangan selanjutnya! Sangat sia-sia dari prosedur ini — dan dampak
emosionalnya yang merugikan pada individu — yang dirancang untuk diminimalisasi. Melalui tes, tingkat
keterampilan prasyarat seseorang saat ini, pengetahuan, dan karakteristik terkait lainnya dapat dinilai
dengan margin kesalahan yang dapat ditentukan.

Semakin valid dan andal tes, semakin kecil margin kesalahan ini. Masalah khusus yang dihadapi dalam
menentukan validitas berbagai jenis tes, serta kriteria spesifik dan prosedur statistik yang digunakan,
akan dibahas dalam Bab 6 dan 7. Namun, satu poin lebih lanjut, harus dipertimbangkan pada saat ini.
Validitas memberi tahu kita lebih dari sejauh mana tes tersebut memenuhi fungsinya. Ini sebenarnya
memberitahu kita apa yang diukur tes. Dengan mempelajari data validasi, kita dapat menentukan secara
objektif apa yang diukur oleh tes ini. Dengan demikian akan lebih akurat untuk mendefinisikan validitas
sebagai sejauh mana kita tahu apa yang diukur oleh tes. Interpretasi skor tes tidak diragukan lagi akan
menjadi lebih jelas dan kurang ambigu jika tes secara teratur disebutkan dalam hal data kriteria yang
melaluinya mereka telah divalidasi. Kecenderungan ke arah ini dapat dikenali dalam label uji seperti "tes
kemampuan skolastik" dan "tes klasifikasi personel" menggantikan "tes kecerdasan" judul yang tidak
jelas.

Analisis butir soal

Kesulitan soal Untuk tes yang mengukur pencapaian atau kemampuan, kesulitan soal ditentukan oleh
jumlah orang yang mendapatkan soal tertentu dengan benar. Misalnya, jika 84% dari Orang yang
mengikuti tes tertentu mendapatkan item 24 yang benar, maka tingkat kesulitan untuk item tersebut
adalah 0,84. Beberapa orang telah menyarankan bahwa proporsi ini tidak benar-benar menunjukkan
"kesulitan" tetapi item "kemudahan." Semakin tinggi proporsi orang yang mendapatkan item dengan
benar, semakin mudah item tersebut. Seberapa sulit seharusnya item dalam tes yang baik? Ini
tergantung pada penggunaan tes dan jenis barang. Hal pertama yang perlu ditentukan oleh konstruktor
tes adalah probabilitas bahwa suatu item dapat dijawab dengan benar secara kebetulan. Item benar-
salah dapat dijawab dengan benar setengah dari waktu jika orang hanya menebak secara acak. Jadi,
item benar-salah dengan tingkat kesulitan 0,50 tidak akan menjadi item yang baik. Item pilihan ganda
dengan empat alternatif dapat dijawab dengan benar 25% dari waktu. Oleh karena itu, kami akan
membutuhkan kesulitan lebih besar dari 25% agar suatu barang dapat diterima dalam konteks ini. Batas
jelas lainnya adalah skala ekstrim. Item yang dijawab dengan benar oleh 100% responden menawarkan
sedikit nilai karena tidak membeda-bedakan individu. Tingkat kesulitan optimal untuk item biasanya
sekitar setengah antara 100% responden mendapatkan item yang benar dan tingkat keberhasilan yang
diharapkan secara kebetulan. Dengan demikian, tingkat kesulitan optimal untuk item empat pilihan
adalah sekitar 0,625. Untuk sampai pada nilai ini, kami mengambil tingkat keberhasilan 100% (1,00) dan
mengurangi dari itu tingkat kinerja kesempatan (0,25). Kemudian kami membagi hasilnya dengan 2
untuk menemukan titik tengah dan menambahkan nilai ini ke tingkat peluang yang diharapkan.

Membuat dan menguji item-item tes

Ketika seorang profesor mengumumkan bahwa akan ada ujian, salah satu pertanyaan pertama adalah
"Tes macam apa?" Apakah itu benar-salah, pilihan ganda, esai, atau fi-in-the blank? Seperti yang akan
Anda pelajari nanti dalam buku ini, tes kepribadian dan kecerdasan diperlukan berbagai macam
tanggapan. Pembuat tes harus menentukan format terbaik untuk mendapatkan tanggapan ini. Sebagian,
pilihan ini berasal dari maksud dan tujuan dari tes. Misalnya, jika tes membutuhkan jawaban benar atau
salah, maka tugas biasanya akan benar-salah, pilihan ganda, cocok, atau esai. Menulis soal-soal ujian
bisa sulit. DeVellis (DeVellis, 2003) menyediakan beberapa pedoman sederhana untuk penulisan item.
Inilah enam di antaranya:

1. Tentukan dengan jelas apa yang ingin Anda ukur. Untuk melakukan ini, gunakan teori substantif
sebagai panduan dan mencoba membuat item sespesifik mungkin.
2. Hasilkan kumpulan item. Secara teoritis, semua item dipilih secara acak dari a semesta konten barang.
Namun dalam praktiknya, kehati-hatian dalam memilih dan mengembangkan barang berharga. Hindari
item yang berlebihan. Pada fase awal, Anda bisa ingin menulis tiga atau empat item untuk masing-
masing yang pada akhirnya akan digunakan tes atau skala.

3. Hindari barang yang sangat panjang. Item panjang sering membingungkan atau menyesatkan.

4. Pertahankan tingkat kesulitan membaca yang sesuai bagi mereka yang akan menyelesaikannya skala.

5. Hindari item “berlaras dua” yang menyampaikan dua ide atau lebih secara bersamaan waktu.
Misalnya, pertimbangkan item yang meminta responden untuk menyetujui atau tidak setuju dengan
pernyataan, “Saya memilih Demokrat karena saya mendukung sosial program. " Ada dua pernyataan
berbeda yang dengannya orang tersebut bisa setuju: "Saya memilih Demokrat" dan "Saya mendukung
program sosial."

6. Pertimbangkan untuk mencampurkan barang-barang dengan kata-kata positif dan negatif. Terkadang,
responden mengembangkan "set respons persetujuan." Ini berarti bahwa responden akan cenderung
setuju dengan sebagian besar item. Untuk menghindari bias ini, Anda bisa memasukkan item yang
worded di arah yang berlawanan. Misalnya, dalam bertanya tentang depresi, CES-D (lihat Bab 2)
sebagian besar menggunakan item yang bernada negatif (seperti "Saya merasa tertekan"). Namun, CES-
D juga termasuk item yang worded dalam arah yang berlawanan ("Saya merasa berharap tentang masa
depan").

Administrasi tes

Dasar pemikiran pengujian melibatkan generalisasi dari sampel perilaku yang diamati dalam situasi
pengujian untuk perilaku yang dimanifestasikan dalam situasi lain yang tidak diuji. Skor tes harus
membantu kita untuk memprediksi bagaimana perasaan klien dan bertindak di luar klinik, bagaimana
siswa akan mencapainya di kursus perguruan tinggi, dan bagaimana pelamar akan melakukan pada
pekerjaan. Setiap pengaruh yang spesifik untuk situasi pengujian merupakan varians kesalahan dan
mengurangi validitas tes. Oleh karena itu penting untuk mengidentifikasi pengaruh terkait tes yang
dapat membatasi atau merusak generalisasi hasil tes.

Seluruh volume dapat dengan mudah dicurahkan untuk diskusi tentang prosedur administrasi tes yang
diinginkan. Tetapi survei semacam itu berada di luar cakupan buku ini. Selain itu, lebih praktis untuk
memperoleh teknik seperti itu dalam pengaturan tertentu, karena tidak ada orang yang biasanya peduli
dengan semua bentuk pengujian, dari pemeriksaan bayi hingga pengujian klinis pasien psikotik atau
administrasi program pengujian massal untuk militer. personil. Oleh karena itu, diskusi ini terutama akan
membahas dasar pemikiran umum dari administrasi tes daripada dengan pertanyaan spesifik
implementasi. Untuk saran terperinci mengenai prosedur pengujian, lihat Palmer (1970), Sattler (1974),
dan Terman dan Merrill (1960) untuk pengujian individu, dan Clemans (1971) untuk pengujian
kelompok.

persiapan awal ujian iners. Persyaratan paling penting untuk prosedur pengujian yang baik adalah
persiapan terlebih dahulu. Dalam pengujian tidak ada keadaan darurat. Karena itu, upaya khusus harus
dilakukan untuk melihat dan mencegah keadaan darurat. Hanya dengan cara ini keseragaman prosedur
dapat dipastikan. Persiapan awal untuk sesi pengujian mengambil banyak bentuk. Menghafal instruksi
verbal yang tepat sangat penting dalam sebagian besar pengujian individu. Bahkan dalam tes kelompok
di mana instruksi dibacakan kepada subjek, beberapa keakraban sebelumnya dengan pernyataan yang
akan dibaca mencegah kesalahan baca dan keragu-raguan dan memungkinkan cara yang lebih alami,
informal selama administrasi tes.

Persiapan bahan uji merupakan langkah awal penting lainnya. Dalam pengujian individual dan terutama
dalam administrasi pengujian kinerja, persiapan semacam itu melibatkan tata letak aktual dari bahan-
bahan yang diperlukan untuk memfasilitasi penggunaan selanjutnya dengan pencarian minimum atau
pencarian yang salah. Bahan-bahan umumnya harus diletakkan di atas meja dekat meja pengujian
sehingga mudah dijangkau penguji tetapi tidak mengalihkan perhatian subjek. Ketika peralatan
digunakan, pemeriksaan berkala dan kalibrasi mungkin diperlukan. Dalam pengujian kelompok, semua
blanko ujian, lembar jawaban, pensil khusus, atau bahan lainnyayang dibutuhkan harus dengan hati-hati
dihitung, diperiksa, dan diatur sebelum hari pengujian.

Keakraban menyeluruh dengan prosedur pengujian khusus adalah prasyarat penting lainnya dalam
pengujian individu dan kelompok. Untuk pengujian individu, pelatihan yang diawasi dalam administrasi
tes tertentu biasanya penting. Bergantung pada sifat tes dan jenis mata pelajaran yang akan diperiksa,
pelatihan semacam itu mungkin memerlukan beberapa sesi demonstrasi dan praktik hingga satu tahun
pengajaran. Untuk pengujian kelompok, dan terutama dalam proyek-proyek berskala besar, persiapan
semacam itu dapat mencakup pengarahan lebih lanjut tentang penguji dan pengawas, sehingga masing-
masing mendapat informasi lengkap tentang fungsi yang akan ia lakukan. Secara umum, pemeriksa
membaca instruksi, mengatur waktu, dan bertanggung jawab atas kelompok di salah satu ruang
pengujian. Proctor membagikan dan mengumpulkan bahan-bahan tes, memastikan bahwa subjek
mengikuti instruksi, menjawab pertanyaan individu dari subjek dalam batasan yang ditentukan dalam
manual, dan mencegah kecurangan.

Ket.

Item buku anne anastasi


Biru buku priciple aplication d isue

Anda mungkin juga menyukai