Anda di halaman 1dari 59

Bab 1 - Hakikat dan Kegunaan Tes Psikologi

Tes-tes pskilogi merupakan alat. Untuk mendapatkan manfaat yang dapat diberikan oleh
tes, seseorang perlu terus menerus mengingat hal ini. Para pengguna tes perlu mengetahui cara
mengevaluasi tes-tes.

 Penggunaan dan Ragam Tes Psikologi


Secara tradisional, fungsi tes-tes psikologi adalah untuk mengukur perbedaan
perbedaan antara individu atau perbedaan reaksi individu yang sama terhadap berbagai situasi
yang berbeda. Salah satu masalah awal yang mendorong pertumbuhan tes-tes psikologi adalah
identifikasi orang-orang yang terbelakang mental.
Seleksi dan klasifikasi sumber daya manusia untuk bidang industry merupakan
penerapan tes psikologis utama yang lain. Penerapan tes psikologis yang nyata dapat ditemukan
dalam seleksi klasifikasi personel militer.
Penggunaan tes-tes dalam konseling individu secara bertahap meluas dari
bimbingan yang berlingkup sempit menyangkut rencana pendidikan dan pekerjaan sampai
terlibatnya semua aspek kehidupan seseorang. Ketentraman emosi dan hubungan-hubungan
intrapersonal yang efektif kian lama kian menjadi sasaran utama konseling.
Aneka ragam tes yang dirancang untuk berbagai maksud ini, berbeda juga dalam
sifat-sifat utamanya. Tes-tes ini berbeda dalam hal cara pelaksanaannya, seperti dalam tes
perorangan atas setiap orang oleh seorang penguji terlatih, tes kelompok-kelompok besar
secara bersama-sama, atau penyelenggara tes oleh komputer.

 Apa Tes Psikologis Itu?


Tes psikologis pada dasarnya adalah alat ukur yang objektif dan dibakukan atas
sampel perilaku tertentu. Dalam hal ini, psikologi bekerja dengan cara yang sama seperti ahli
biokimia yang melakukan tes darah pasien atau suplai air masyarakat dengan menganalisis satu
sampel atau lebih dari satu.
Standarisasi. Perlu diingat bahwa dalam definisi awal, tes psikologis digambarkan
sebagai alat ukur yang dibakukan. Dalam memberika instruksi, atau menyajikan masalah-
masalah secara lisan, demontrasi awal, cara-cara menjawab menjawab pertanyaan dari peserta
tes, dan setiap rincian lain atas situasi tes.
Langkah penting lainnya dalam standarisasi tes adalah penetapan norma-norma.
Dalam proses menstandarisasikan tes, tes diselenggarakan pada sampel yang luas dan
representative atas jenis orang yang memang menjadi sasaran perancangan tes tersebut.
Norma-norma untuk tes kepribadian pada dasarnya ditetapkan dengan cara yang sama dengan
norma-norma pada tes kepribadian.
Pengukur Kesulitan yang Objektif. Penyelenggaraan, penilaian, dan interpretasi
skor adalah objektif sejauh skor-skor tak tergantung pada penilaian subjektif penguji tertentu.
Keandalan. Sebaik apakah tes ini? Apakah tes ini benar-benar efektif? Satu
satunya cara untuk menjawab pertanyaan-pertanyaan ini secara konklusif adalah lewat
pengujian empiris. Evaluasi objektif atas tes-tes psikologis, terutama mencakup keandalan dan
validitas tes dalam situasi-situasi khusus.
Validitas. Validitas memberikan pemeriksaan langsung pada sejauh mana tes
tertentu memenuhi fungsinya. Penentuan validitas biasanya memerlukan kriteria independen
dan eksternal tentang apapun yang menjadi sasaran pengukuran tes tersebut. Dengan
mempelajari data validasi, kita bisa secara objektif menetukan apa yang diukur oleh tes itu.

 Mengapa Penggunaan Tes-tes Psikologi Perlu Dikendalikan?


Penguji yang Memenuhi Syarat. Penguji yang memenuhi syarat, jelas diperlukan
dalam setiap aspek utama situasi tes: seleksi tes, administrasi dan penskoran, dan interpretasi
skor. Agar tes bisa berfungsi, diperlukan evaluasi atas segi-segi teknis berdasar karakteristik-
karakteristik semacam validitas, keandalan, tingkat kesulitan, dan norma.
Peran Pengguna Tes. Pengguna tes adalah siapa pun yang menggunakan skor tes
sebagai salah satu sumber informasi dalam usahanya mencapai keputusan-keputusan praktis.
Pengguna mungkin adalah penguji atau bukan penguji yang menyelenggarakan dan menskor
tes.
Pengamanan Isi Tes dan Pengkomunikasian Informasi Tes. Isi tes dengan jelas
harus dibatasi dalam rangka mecegah usaha-usaha yang disengaja untuk memalsukan skor-skor.
Memastikan amannya isi tes tertentu tidak perlu dan tidak harus mencapuri pengkomunikasian
secara efektif informasi tes itu kepada pengguna tes, professional yang berkepentingan dan
public umum.

 Penyelenggaraan Tes
Persiapan Sebelumnya bagi Para Penguji. Persiapan materi tes adalah langkah
awal, kemudian syarat lain yang harus dipenuhi adalah kekraban dengan prosedur tes tertentu,
baik pada tes perorangan maupun kelompok. Untuk tes perorangan, pelatihan yang diawasi
dalam penyelenggaraan tes tertentu amatlah penting.
Kondisi-kondisi Tes. Prosedur yang distandarisasi berlaku tak hanya pada
intruksi-intruksi verbal, penentuan waktu, bahan-bahan, dan aspek-aspek tes lainnya, tetapi
juga pada lingkungan tes.
Memperkenalkan Tes: Pemahaman dan Orientasi Peserta Tes. Dalam
penyelenggaraan tes, “rapor” mengacu pada upaya-upaya penguji membangkitkan minat
peserta tes pada tes itu, meningkatkan kerja sama mereka, dan mendorong mereka
memberikan respon secara tepat pada sasaran-sasaran tes.

 Penguji dan Variabel-Variabel Situasi


Meskipun sejumlah dampak tertentu telah dibuktikan melalui entah teknik
teknik projektif entah tes-tes kecerdasan perorangan. Faktor-faktor luar ini cenderung terjadi
pada stimuli yang tak terstruktur dan bersifat ambigu, dan juga pada tugas-tugas yang baru dan
berbeda, dibandingkan pada fungsi-fungsi yang didefinisikan secara jelas dan dipelajari dengan
baik.
 Pandangan Dari Sudut Peserta Tes
Kecemasan Tes. Diantara telaah paling dini tentang reaksi-reaksi peserta tes
terhadap situasi tes adalah telaah yang berhubungan dengan kecemasan tes. Dalam
penyelenggaraan tes, banyak praktik yang dirancang untuk meningkatkan rapor berfungsi juga
mengurangi kecemasan tes.
Sedikit kecemasan memberikan dampak yang baik, sementara kecemasan yang
tinggi bersifat membahayakan. Individu-individu yang terbiasa dengan kecemasan rendah bisa
mendapatkan manfaat dari kondisi-kondisi tes yang membangkitkan kecemasan, sementara
mereka yang terbiasa dengan kecemasan tinggi menunjukan kinerja lebih baik dalam kondisi-
kondisi lebih santai.
Penelitian Komprehensif atas Pandangan Peserta Tes. Sejumlah penulis
membahas reaksi para pelamar kerja terhadap kejujuran dan tes-tes yang terkait dengan
pekerjaan. Beberapa mengemukakan bab cara-cara untuk memerbaiki penyelenggaraan tes dan
lingkungan tes, sebagai hasil temuan mereka.

 Dampak Pelatihan Pada Kinerja Tes


Bimbingan. Sebagaimana bisa diharapkan, cakupan perbaikan tergantung pada
bakat dan pengalaman pendidikan awal peserta tes, sifat tes, dan jumlah serta jenis bimbingan
yang disediakan. Bimbingan dalam pengertian yang sempit dn tradisional, dirancang untuk
mengembangkan keterampilan yang amat terbatas yang mungkin sedikit saja berguna dalam
aktivitas-aktivitas kehidupan.
KerumitanTes. Dampak dari kerumitan tes, atau praktik mengikuti tes semata-
mata juga relevan dalam kaitan ini. Dalam telaah terhadap formulir yang berbeda bagi tes yang
sama, ada tendensi bahwa skor kedua akan menjadi lebih tinggi. Perolehan rata-rata yang
signifikan telah dilaporkan ketika formulir-formulir yang berbeda diadakan secara berturut turut
atau setelah interval yang berkisar dari satu hari sampai tiga tahun.
Pengajaran Keterampilan Kognitif Luas. Sejumlah peniliti telah meneliti
pendekatan yang berlawan dengan perbaikan kinerja tes. Sasaran mereka adalah
perkembangan keterampilan intelektual, kebiasaan-kebiasaan kerja, dan strategi-strategi
pemecahan masalah yang dapat diterapkan secara luas.
Rangkuman. Kita telah membahas tiga jenis pelatihan pretest yang cukup
berbeda sasaran-sasarannya. Bagaimana pengaruh jenis-jenis tes ini pada validitas tes tertentu
dan bagaimana kegunaan praktisnya sebagai instrument penilaian? Yang pertama adalah
bimbingan, dalam pengertian menghapal secara intensif dan massif hal-hal yang mirip dengan
yang ada dalam tes.

 Sumber-Sumber Informasi Tentang Tes


Salah satu sumber penting adalah Mental Measurements Yearbook (MMY) yang
didirikan oleh Oscar K. Buros dan disuntingnya pada tahun 1978. Seri buku tahunan ini
mencakup hampir semua tes psikologis, pendidikan, dan kejuruan yang tersedia secara
komersial yang diterbitkan dalam bahasa inggris.
Sumber utama informasi lainnya tentang tes-tes yang diterbitkan adalah Test
Collection Bibliographies yang dipersiapkan oleh Education Test Service yaitu informasi dewasa
tentang tes dan pelaksanaan tes.
Bab 2 – Riwayat Pendahulu Tes Pendahulu
Tinjauan singkat atas para pendahulu sejarah dan asal-mula tes psikologis akan
memberikan wawasan dan bantuan dalam memahami tes-tes dewasa ini. Arah perkembangan
tes psikologi dewasa ini bisa kelihatan lebih jelas bila dipahami dari sudut pandang para
pendahulunya.

 Minat Awal Pada Pengklasifikasian dan Pelatihan Orang-orang yang Terbelakang


Mental
Abad ke-19 merupakan masa kebangkitan minat pada pengobatan yang lebih
manusiawi terhadap orang-orang gila dan mereka yang terbelakang mental. Dalam usaha
mengembangkan system untuk mengklasifikasikan tingkat dan jenis keterbelakangan yang
berbeda-beda, Esquirol mencoba berbagai prosedur dan menyimpulkan bahwa penggunaan
bahasa seseorang merupakan kriteria yang paling dapat diandalkan tentang tingkat
intelektualnya.

 Psikolog-psikolog Ekperimental Pertama


Psikolog-psikolog eksperimental awal dari abad ke-19 pada umumnya tidak
peduli dengan pengukuran perbedaan-perbedaan individu. Tujuan utama para psikolog pada
masa itu adalah perumusan deskripsi umum tentang perilaku manusia. Fokus perhatian mereka
adalah keseragaman, bukannya perbedaan-perbedaan perilaku.

 Sumbangan Francis Galton


Pakar biologi Inggris, Francis Galton, adalah orang yang bertanggung jawab atas
peluncuran gerakan tes. Faktor pemersatu dalam berbagai aktivitas penelitian Galton adalah
minatnya terhadap terhadap hereditas manusia. Galton membantu mendorong sejumlah
lembaga pendidikan menyelenggarakan pencatatan anthropometris pada Internasional
Exposisition 1884 yang dengan membayar tiga penny, para pengunjung bisa diukur ciri-ciri fisik
tertentunya dan bisa menjalani tes ketazaman penglihatan dan pendengaran, kekuatan otot,
waktu reaksi, dan fungsi-fungsi motor indriawi sederhana lainnya.

 Cattell dan “Tes-tes Mental” Awal


Karya Cattell mempertemukan ilmu psikologi eksperimental yang baru didirikan
dan gerakan tes yang baru. Artikel yang ditulis Cattel memaparkan rangkaian tes yang
diselenggarakan tiap tahun bagi para mahasiswa dalam upaya menentukan tingkat intelektual.
Dalam pilihan tes-tesnya, Cattell punya pandangan sama dengan Galton bahwa ukuran fungsi-
fungsi intelektual bisa diperoleh melalui tes-tes pembedaan indriawi dan waktu reaksi. Tes-tes
Cattell lazim ditemukan dalam sejumlah rangkaian tes yang dikembangkan selama dasawarsa
terakhir abad ke-19. Rangkaian tes semacam itu diselenggarakan bagi anak-anak sekolah,
mahasiswa, dan berbagai orang dewasa.
 Binet dan Munculnya Tes-tes Kecerdasan
Binet dan rekan-rekan sekerjanya mencurahkan waktu bertahun-tahun untuk
penelitian aktif dan sederhana tentang cara-cara pengukuran kecerdasan atau intelegensi.
Banyak pendekatan telah dicoba, bahkan mencakup pengukuran bentuk tengkorak, muka, dan
tangan, dan analisis atas tulisan. Akan tetapi, hasil-hasilnya menimbulkan keyakinan makin
besar bahwa pengukuran yang langsung, meskipun kasar, atas fungsi-fungsi intelektual yang
kompleks membawa harapan yang sangat besar. Lalu muncullah situasi tertentu yang
memungkinkan usaha-usaha Binet segera menunjukkan hasil-hasil praktis.

 Tes Kelompok
Tes kelompok seperti skala Binet, awalnya dikembangkan untuk memenuhi
kebutuhan praktis. Sejumlah tes menuntut pengukuran waktu tanggapan individu. Karena alas
an ini dan alas an lainnya, tes-tes seperti ini tidak diadptasikan pada tes kelompok. Ciri khas lain
jenis tes Binet ini adalah bahwa tes ini membutuhkan penguji tes yang amat terlatih. Tes-tes
seperti ini pada dasarnya adalah instrument-instrumen klinis, yang sesuai untuk telaah
mendalam atas kasus-kasus individu.

 Tes Bakat (Aptitude Testing)


Boleh dipastikan tes ini mencakup kemampuan-kemampuan yang amat penting
dalam budaya yang menjadi konteks rancangan tes. Namun, sudah disadari bahwa peruntukan
yang lebih tepat, dilihat dari segi jenis informasi yang hendak didapat dari tes-tes ini.
Para pengguna tes, dan terutama orang-orang klinik sering memanfaatkan
perbedaan-perbedaan semacam itu dalam rangka memeroleh lebih banyak wawasan atas
susunan psikologis individu. Jadi, tak hanya IQ atau skor global melainkan juga kinerja pada
kelompok soal atau subtes tertentu yang akan diperiksa dalam mengevaluasi masing-masing
kasus. Akibatnya, perbedaan yang diperoleh antara skor-skor subtes mungkin terbalik jika
individu dites-ulang pada hari yang berbeda atau dengan tes yang sama tapi dalam bentuk lain.

 Tes-tes Prestasi (Achiement Test) Yang Dibakukan


Setelah peralihan abad ini, tes standar pertama untuk mengukur hasil
pengajaran sekolah mulai muncul. Dipelopori oleh karya E.L. Thorndike, tes-tes ini memakai
prinsip-prinsip pengukuran yang dikembangan dalam laboratorium psikologis.
Tes-tes prestasi digunakan tidak hanya untuk maksud pendidikan, tetapi juga
untuk menyeleksi para pelamar pekerjaan industry dan pemerintahan. Peningkatan upaya untuk
mempersiapkan tes-tes prestasi yang akan mengukur pencapaian sasaran pendidikan yang luas,
sebagai lawan dari penghapalan rincian-rincian factual, juga membuat isi tes prestasi lebih
menyerupai tes inteligensi.

 Penilaian Kepribadian
Perintis awal tes kepribadian diilustrasikan oleh penggunaan Kraepelin atas tes
asosiasi bebas terhadap pasien-pasien psikiatris. Dalam tes ini, peserta ujian diberi kata-kata
stimulus yang dipilih secara khusus dan mereka diminta memberikan tanggapan atas setiap kata
itu dengan kata pertama yang muncul dalam benak mereka.
Bab 3 – Norma dan Arti Skor Tes
 Konsep-konsep Statistik
Langkah pertama dalam menata kekacauan data kasar adalah mentabulasikan
skor-skor ke dalam distribusi frekuensi. Distribusi semacam ini dipersiapkan dengan
mengelompokan skor-skor ke dalam interval kelas yang lebih mudah digunakan dan
menjuruskan (tallying) setiap skor itu ke dalam interval yang cocok. Ketika semua skor telah
dimasukkan, turus (tallies) dihitung untuk mendapatkan frekuensi atau atau jumlah kasus dalam
setiap interval kelas. Jumlah frekuensi akan sama dengan N, jumlah total kasus-kasus dalam
kelompok.

 Norma-norma Perkembangan
Salah satu cara untuk mengartikan skor-skor tes adalah dengan menunjukan
sejauh mana individu telat maju sepanjang jalur perkembangan yang normal.
Usia Mental. Istilah “usia mental” dikenal luas lewat penerjemahan dan adaptasi
skala-skala Binet-Simon, meskipun Binet sendiri telah menggunakan istilah lebih netral,
“tingkatan mental”. Normal-normal usia mental juga digunakan pada tes-tes yang tidak dibagi-
bagi ke sejumlah level tahun. Dalam kasus seperti ini, pertama-tama ditentukan skor mentah si
anak. Perlu dicatat bahwa unit usia mental tidak tinggal tetap bersama umur, melainkan
cenderung mengerut ketika semakin banyaknya tahun.
Ekuivalen-ekuivalen Kelas (Grade Equivalents). Skor-skor pada tes prestasi
pendidikan kerap diinterpretasikan berdasar ekuivalen-ekuivalen kelas. Praktek ini bisa
dimengerti karena te-tes ini digunakan dalam lingkungan sekolah. Meskipun popular, norma-
norma kelas memiliki berbagai kekurangan. Pertama, isi instruksi agak berbeda dari kelas ke
kelas. Karenanya, norma-norma kelas hanya sesuai untuk subjek-subjek umum yang diajarkan
sepanjang tingkat-tingkat kelas yang dicakup oleh tes itu.

 Norma-Norma dalam Kelompok


Persentil. Skor-skor persentil diungkapkan berdasarkan persentase orang dalam
sampel terstandardisasi yang berada di bawah skor mentah tertentu. Persentil menunjukkan
posisi relative individu dalam sampel terstandardisasi. Persentil juga dapat dianggap sebagai
peringkat dalam kelompok berisi 100, dengan catatan bahwa dalam penentuan peringkat
biasanya orang mulai menghitung dari atas, orang terbaik dalam kelompok itu mendapat
peringkat satu.
Skor-skor Standar. Skor skor standar mengungkapkan jarak individu dari rata-rata
berdasarkan simpangan baku distribusi. Skor-skor standar bisa diperoleh dengan tranformasi
linear atau nonlinear atas skor-skor mentah yang orisinil.
IQ Simpangan. Dalam upaya untuk mengonversikan skor-skor MA ke dalam
indeks seragam tentang status relative individu, IQ dimasukkan ke dalam tes-tes intelegensi
awal. IQ 100 dengan begitu menggambarkan kinerja normal atau rata-rata. IQ di bawah 100
menunjukkan “keterbelakangan”; (retardation), sedangkan di atas 100 menunjukkan
“akselerasi”.
Antar-hubungan Skor-skor dalam Kelompok. Pada tahap ini dalam pembicaraan
kita tentang skor-skor yang dihasilkan, pembaca bisa menjadi sadar akan persesuaian di antara
berbagai tipe skor. Bentuk yang pasti untuk laporan skor amat ditentukan oleh kenyamanan,
keakraban, dan kemudahan mengembangkan norma-norma.

 Relativitas Norma-Norma
Perbandingan Antartes. IQ, atau skor lain apa pun, seharusnya selalu disertai
dengan nama tes yang dengannya skor itu akan diperoleh. Skor-skor tes tak dapat
diinterpretasikan setepatnya setepatnya secara abstrak; melainkan harus dirujuk pada tes-tes
tertentu. Ada tiga alasan utama untuk menerangkan variasi sistematik di antara skor-skor yang
didapatkan oleh individu yang sama pada tes-tes yang berbeda.
Pertama, tes-tes bisa berbeda dalam isi meskipun labelnya sama. Kedua, unit-
unit skala mungkin bisa tidak dapat dibandingkan. Ketiga, komposisi sampel-sampel standarisasi
yang digunakan dalam memantapkan norma-norma untuk berbagai tes bisa berbeda-beda.
Sampel Normatif. Bagaimanapun juga, norma apapun dibatasi pada populasi
normative tertentu dari mana norma itu diturunkan. Pengguna tes seharusnya tidak pernah
boleh luput dari memahami cara norma itu ditetapkan. Dalam memilih sampel semacam itu,
biasanya dilakukan sesuatu untuk mendapat sampel yang representative dari populasi yang
untuknya tes itu dirancang.
Norma-norma Spesifik. Pendekatan lain pada nonekuivalensi norma-norma yang
ada dan kemungkinan besar merupakan pendekatan yang lebih realistis bagi banyak tes adalah
membakukan tes-tes pada populasi yang didefinisikan secara lebih sempit, yang dipilih
sedemikian rupa agar cocok dengan maksud-maksud khusus dari setiap tes. Dengan demikian,
norma-norma bisa dianggap berlaku bagi “para pekerja kantoran yang bekerja dalam organisasi-
organisasi bisnis yang besar” atau bagi “mahasiswa-mahasiswa teknik tahun pertama”.
Kelompok Rujukan Tetap. Satu jenis skala nonnormatif memanfaatkan kelompok
rujukan tetap dalam rangka menjamin komparabilitas dan kontinuitasskor, tanpa memberikan
evaluasi normatif atas kinerja. Dengan skala seperti ini, interpretasi normatif menurut rujukan
pada norma-norma yang dikumpulkan sendiri-sendiri dari populasi yang sesuai.
Item Response Theory. Ukuran dasar yang digunakan oleh pendekatan-
pendekatan ini adalah probabilitas bahwa orang yang memiliki kemampuan khusus (yang
disebut ciri laten) berhasil pada suatu butir soal (item) dengan kesulitan tertentu. Akatn tetapi,
taka da implikasi bahwa ciri-ciri laten seperta itu atau kemampuan yang mendasari ada dalam
arti fisik atau fisiologis, atau ciri-ciri itu menyebabkan perilaku. Ciri-ciri laten adalah konstruktur
statistic yang diturunkan secara matematis dari hubungan-hubungan yang diamati secara
empiris di antara respons-respons tes. Perkiraan kasar dan awal atas ciri laten peserta ujian
adalah skor total yang ia dapatkan pada tes.

 Komputer dan Interpretasi Skor-skor Tes


Perkembangan Tenis. Manfaat yang jelas computer dan yang dikembangkan
lebih awal menggambarkan peningkatan yang benar-benar tak bisa diramalkan dalam hal
kecepat yang dengannya proses analisis data dan skoring dijalankan.
Pada dasarnya, komputer memadukan semua informasi yang tersedia tentang
individu dengan data tersimpan tentang program pendidikan dan pekerjaan dan menggunakan
semua fakta dan hubungan yang relevan dalam menjawab pertanyaan individu dan
membantunya dalam mencapai keputusan.
Bahaya dan Garis-garis Pedoman. Aplikasi computer tentu bisa saja mengarah
pada penyalahgunaan dan interpretasi yang salah atas skor-skor tes. Dalam upaya mencegah
bahaya-bahaya ini, perhatian perlu diberikan pada pengembangan garis-garis pedoman untuk
pengetesan yang berbasis komputer.
Dua dari keprihatinan utama tentang pengetesan terkomputerisasikan
berhubungan dengan komparabilitas skor dan skoring interpretif naratif. Amatlah penting untuk
memeriksa komparabilitas skor untuk berbagai individu atau kelompok yang pengalamannya
dengan penggunaan komputer dan terutama dengan pengetasan terkomputerisasi, bisa amat
berbeda.

 Interpretasi Tes Berujukan Domain


Hakikat dan Penggunaannya. Berbagai istilah alternative umum digunakan,
seperti berujukan isi, domain, dan sasaran. Istilah-istilah ini kadang kala digunakaansebgai
sinonim untuk pengetesan berujukan kriteria dan kadang kala dengan konotasi yang agak
berbeda. Secara bertahap, istilah-istilah yang lebih deskriptif telah menggantikan penamaan
“berujukan-kriteria” yang muncul lebih dahulu. Dalam buku ini, istilah “berujukan-domain” yang
digunakan untuk maksud ini.
Sejauh ini, aplikasi utama pengetesan berujukan-domain terjadi pada berbagai
inovasi dalam bidang pendidikan. Yang menonjol di antara aplikasi ini adalah sistem pengajaran
yang didukung komputer, dikelola komputer, dan sistem-sistem pengajaraan yang lebih bersifat
perorangan dan dikerjakan sendiri.
Arti Isi. Ciri utama yang khas dari pengetesan berujukan domain adalah
interpretasinya atas kinerja tes dari segi arti isi. Fokusnya jelas pada apa yang dapat dilakukan
seorang peserta dan apa yang mereka ketahui, bukan bagaimana mereka dibandingkan dengan
orang lain.
Pengetesan Penguasaan (Mastery Testing). Pada dasarnya, prosedur ini
menghasilkan skor semua-atau-kosong (all-or-none) mengindikasi bahwa individu telah
mencapai atau tidak mencapai tingkat penguasaan yang telah ditetapkan sebelumnya.
Hubungan dengan Pengetesan Berujukan-Norma. Perlu dicatat bahwa
pengetesan berujukan-domain bukan hal baru dan juga tidak terpisah sama sekali dari
pengetesan berujukan norma, seperti diklaim secara implisit oleh sejumlah pendukungnya.

 Kualifikasi Minimum dan Skor Potong


Kebutuhan-kebutuhan Praktis dan Kesulitan Tersembunyi. Kualifikasi minimum
harus dispesifikasikan dan diimplementasikan untuk berbagai maksud dalam hidup sehari-hari.
Dalam banyak situasi, pertimbangan keamanan menuntut ditetapkannya skor potong dalam
kinerja, sebagaimana dalam pemberian surat izin mengemudi, penyeleksian pilot pesawat
terbang, atau penerimaan karyawan untuk bekerja pada reactor nuklir.
Tabel Harapan. Sebuah table harapan memberi probabilitas hasil kriteria yang
berbeda bagi orang-orang yang memeroleh tiap skor tes.
Bab 4 – Reliabilitas
Reabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama
ketika mereka diuji ulang dengan tes yang sama pada kesempatan berbeda, atau dengan
seperangkat butir-butir ekuivalen yang berbeda, atau dalam kondisi pengujian yang berbeda.

 Koefisien Korelasi
Arti Korelasi. Pada dasarnya, koefisien korelasi menyatakan derajat kesesuaian
atau hubungan, antara dua perangkat skor. Korelasi nol menunjukan tidak adanya hubungan
sama sekali, sebagaimana bisa terjadi karena peluang.
Signifikansi Statistik. Ada prosedur statistic untuk memperkirakan fluktuasi yang
mungkin untuk bisa diharapkan dari sampel ke sampel dalam ukuran dari korelasi, rata-rata,
simpangan baku, dan ukuran-ukuran kelompok lain mana pun. Selama bertahun-tahun,tingkat
signifikansi merupakan cara tradisional untuk mengevaluasi korelasi.
Koefisien Reliabilitas. Koefisien korelasi telah digunakan dalam analisis data
psikometrik. Pengukuran reliabilitas tes mewakili satu aplikasi koefisien-koefisien.

 Jenis-jenis Reliabilitas
Reliabilitas Tes-Retes. Metode paling jelas untuk menemukan reliabilitas skor
tes ialah dengan mengulang tes yang sama pada kesempatan kedua. Ketika reliabilitas tes-ulang
dilaporkan dalam manual tes, interval yang digunakan untuk mengukur reliabilitas itu
seharusnya selalu spesifikasikan. Meskipun tampak sederhana dan blak-blakan, teknik tes dan
tes-ulang menampilkan berbagai kesulitan ketika diterapkan pada kebanyakan tes psikologis.
Reliabilitas Bentuk-Alternatif. Meskipun dapan diaplikasikan jauh lebih luas
daripada reliabilitas te-retes, reliabilitas bentuk-alternatif juga memiliki keterbatasan tertentu.
Pertama, jika fungsi-fungsi perilaku yang sedang diperhatikan tunduk pada efek praktik yang
besar, penggunaan bentuk-bentuk alternative akan mengurangi namun tidak menghilangkan
efek seperti itu.
Reliabilitas Belah-Separuh (Split-Half Reliability). Dengan cara ini, dua skor
didapatkan untuk setiap orang dengan membagi tes menjadi paruhan-paruhan yang
ekuivalen.tampak bahwa reliabilitas belah-separuh merupakan ukuran yang konsisten dalam
kaitan dengan sampling isi.
Reliabilitas Kuder-Richardson dan Koefisien Alpha. Konsistensi antarsoal ini
dipengaruhi oleh dua sumber varian kesalahan: (1) pencuplikan isi (sebagaimana dalam bentuk-
alternatif dan reliabilitas belah-separuh); (2) heterogenitas dari domain perilaku yang
disampelkan.
Reliabilitas Pemberi Skor. Reliabilitas pemberi skor dapat ditemukan dengan
memiliki sampel lembaran tes yang di skor secara terpisah oleh dua penguji. Dengan demikian,
dua skor yang didapatkan oleh masing-masing peserta tes ini kemudian dikorelasikan dengan
cara biasa, dan koefisien korelasi yang dihasilkannya adalah ukuran reliabilitas pemberi skor.
Tinjauan. Pemilah –milahan sumber varian adalah esensi dari yang dikenal
sebagai teori generalisabilitas tentang reliabilitas. Desain-desain eksperimental kompleks yang
yang memungkinkan perkiraan simultan atas banyak sumber varian kesalahan dan interaksi di
antara varian-varian kesalahan itu, dapat ditemukan pada karya yang lebih rinci tentang topic
tersebut.

 Reliabilitas Tes Yang Dipercepat


Tes kecepatan yang murni adalah tes yang perbedaan individu tergantung
sepenuhnya pada kecepatan kinerja. Perlu dicatat bahwa baik tes kecepatan maupun kekuatan
dirancang untuk mencegah pencapaian skor-skor sempurna. Kapan dan pada kondisi apa tes
benar-benar dipercepat? Yang jelas, penerapan batas waktu saja tidak menjadi tanda sebuah
tes kecepatan. Jika semua peserta tes selesai dalam batas waktu yang diberikan, kecepatan
kerja tidak memainkan peranan dalam menentukan skor. Presentase orang yang gagal
menyelesaikan tes bisa dianggap sebagai indeks kasar kecepatan versus kemampuan.

 Ketergantungan Koefisien-koefisien Reliabilitas Pada Sampel Yang DIuji


Variabilitas.seperti semua koefisien korelasi, koefisien reliabilitas tergantung
pada variabilitas sampel dimana koefisien itu ditemukan. Jadi, jika koefisien reliabilitas yang
dilaporkan dalam pegangan tes dikalkulasikan untuk sebuah kelompok yang merentang dari
anak kelas empat sampai pelajar sekolah menengah atas, tak dapat diasumsikan bahwa
reliabilitas akan sama tingginya di dalam, katakanlah, sampel kelas delapan.
Tingkat Kemampuan. Kooefisien reliabilitas tidak hanya bervariasi pada rentang
perbedaan individu dalam sampel, tetapi juga bervariasi antara kelompok-kelompok yang
berbeda dalam tingkat kempuan rata-rata. Lagi pula, perbedaan-perbedaan ini biasanya tidak
dapat diprediksi atau diestimasi dengan rumus statistic apa pun, tetapi dapat ditemukan hanya
dengan uji coba empris tes itu pada kelompok yang berbeda dalam tingkat usia atau
kemampuan.

 Kesalahan Standar Pengukuran


Interpretasi Skor-skor Individu. Reliabilitas sebuah tes bisa diungkapkan dalam
istilah kesalahan standar pengukuran yang juga disebut kesalahan standar sebuah skor.
Kesalahan standar pengukuran dan koefisien reliabilitas jelas merupakan cara-cara alternative
untuk mengungkapkan reliabilitas tes.
Interpretasi Perbedaan Skor. Berfikir dalam lingkup kisaran dimana tiap skor bisa
berfluktuasi, berfungsi sebagai alatperiksa terhadap penekanan berlebihan pada perbedaan-
perbedaan kecil antara skor-skor. Sikap hati-hati seperti ini perlu ada, baik bila membandingkan
skor tes dari orang yang berbeda maupun ketika membandingkan skor individu yang sama
dalam kemampuan yang berbeda.

 Reliabilitas Diterapkan Pada Tes Penguasaan dan Skor Potong


Implikasi statistic utama dari pengetesan penguasaan adalah reduksi dalam
variabilitas skor-skor dikalangan orang-orang. Secara teoritis, jika setiap orang meneruskan
pelatihan sampai keterampilan itu dikuasai, variabilitas direduksi sampai nol.
Bab 5 – Validitas: Konsep-konsep Dasar
Validitas tes menyangkut apa yang diukur tes dan seberapa baik tes itu bisa
mengukur. Validitas tes memberi tahu kita tentang apa yang bisa kitasimpulkan dari skor-skor
tes.
 Konsep-konsep Validitas Tes Yang Berkembang
Fungsi tes pada awalnya antara lain dalam mengukur apa yang telah dipelajari
individu dalam area tertentu. Jenis tes yang umumnya disebut tes prestasi ini, lazimnya
dievaluasi dengan membandingkan isi dengan domain isi yang memang dirancang untuk dinilai.
Begitu tes memasuki tahap kedua, penekanannya bergeser pada prediksi. Prosedur ini terutama
tepat untuk penggunaan tes dalam seleksi atau penempatan individu pada program-program
pendidikan, jabatan, atau program tertentu lainnya. Tahap sekarang dalam sejarah tes
mencerminkan dua kecendrungan utama : (1) orientasi teoritis yang makin kuat dan (2)
hubungan yang erat antara teori psikologis dan verifikasi melalui tes hipotesis secara empiris
dan eksperimental.

 Prosedur Deskripsi- Isi


Hakikat. Prosedur validasi deskripsi-isi pada dasarnya melibatkan pengujian
sistematik atau isi tes untuk menentukan apakah tes itu mencakup sampel representative dari
domain perilaku yang harus diukur.
Prosedur Spesifik. Berdasarkan informasi yang terkumpul, spesifikasi tes disusun
untuk para penulis soal. Spesifikasi-spesifikasi ini seharusnya menunjukan bidang isi atau topic-
topik yang dicakup, sasaran-sasaran atau proses-proses pengajaran yang harus di tes dan
pentingnya topik-topik serta proses individu. Spesifikasi-spesifikasi ini seharusnya menunjukan
jumlah tiap jenis item yang dipersiapkan untuk masing-masing topic.
Aplikasi. Terutama bila ditunjang oleh alat periksa empiris seperti yang sudah
digambarkan, validasi isi memberikan teknik yang memadai untuk mengevaluasi tes-tes
prestasi.
Validitas Nominal. Pada dasarnya, pertanyaan tentang validitas nominal
menyangkut rapor dan hubungan masyarakat (humas). Meskipun penggunaan istilah “validitas”
dalam kaitan ini bisa menimbulkang kebingungan, validitas tampang itu sendiri merupksn ciri
tes yang di senangi. Selain itu diperlukan juga validitas tampang agar bisa berfungsi secara
efektif dalam situasi praktis. Validitas tampang juga memengaruhi penerimaan tes tersebut
dalam keputusan legislative dan perundangan, dan juga penilaian oleh masyarakat umum.

 Prosedur-prosedur Prediksi-Kriteria
Validasi Konkuren dan Validasi Prediktif. Informasi yang disediakan oleh validasi
prediktif paling relevan bagi tes-tes yang digunakan dalam seleksi dan klasifikasi personel.
Vallidasi konkuren digunakan semata-mata sebagai pengganti validasi prediktif. Kerap
perpanjangan prosedur validasi selama waktu yang dubutuhkan untuk validasi prediktif atau
untuk memperoleh sampel praseleksi yang sesuai untuk maksud-maksud pengetesan, tak dapat
dilakukan. Oleh karena itu, sebagai pemecah yang merupakan jalan tengah, tes-tes diadaan bagi
kelompok yang menjadi sumber data kriteria. Dengan demikian, skor-skor tes mahasiswa bisa
dibandingkan dengan indeks prestasi kumulatif mereka pada saat pengetesan, atau skor tes
karyawan dengan sukses pekerjaan mereka sekarang ini.
Kontaminasi Kriteria. Sumber kesalahan potensial dalam validasi tes ini dikenal
sebagai kontaminasi kriteria, karena peringkat kriteria menjadi “terkontaminasi” oleh
pengetahuan pemeringkat terhadap skor-skor tes.
Ukuran-ukuran Krieria. Indeks-indeks khusus yang digunakkan sebagai ukuran
kriteria mencakup nilai sekolah, skor tes prestasi, promosi dan catatan kelulusan, penghargaan
dan hadiah khusus, serta peringkat guru ataupun pengajar untuk “inteligensi”. Dalam kaitan
dengan penggunaan catatan-catatan pelatihan sebagai ukuran-ukuran kriteria, sebuah
pembedaan yang berguna adalah pembedaan antara kriteria menengah dan kriteria puncak.
Generalisasi Validitas. Validitas prediksi-kriteria kerap digunakan dalam studi-
studi validasi local, dimana efektivitas sebuah tes untuk program tertentu harus dinilai. Ini
adalah pendekatan yang diikuti, misalnya ketika sebuah perusahaan ingin mengevaluasi tes
untuk menyeleksi para pelamar kerja di perusahaannya atau ketika sebuah perguruan tinggi
ingin menentukan bagaimana tes bakat akademik dapat memprediksi kinerja mata kuliah
mahasiswa-mahasiswanya.
Meta-Analisis. Meta-analisis mendapat perhatian yang makin besar dalam
psikologi sebagai pengganti untuk survei literature tradisional. Dengan memadukan temuan-
temuan itu sejauh mungkin berdasarkan segi-segi metodologis dan substantive yang relevan
dari masing-masing telaah, meta-analisis bisa menyingkapkan temuan positif yang penting.
Manfaatnya lebih jauh adalah bahwa meta-analisis memungkinkan penghitungan ukuran-
ukuran efek.

 Prosedur-prosedur Identifikasi Konstruk


Validitas konstruk sebuah tes adalah lingkup sejauh mana tes bisa dikatakan
mengukur suatu konstruk atau sifat teoritis. Tiap konstruk dikembangkan untuk menjelaskan
dan mengorganisasi konsistensi-konsistensi respons yang diamati.
Perubahan-perubahan perkembangan. Tes-tes seperti Standford-Binet dan
kebanyakan tes prasekolah dicocokan dengan usia kronologis untuk menentukan apakah skor-
skornya menunjukkan peningkatan secara bersamaan dengan peningkatan usia. Karena
kemampuan seseorang diharapkan untuk meningkat bersama selama usia selama masa kanak-
kanak, ada pendapat bahwa skor tes seharusnya juga menunjukkan peningkatan, jika tesnya
valid.
Korelasi dengan Tes-tes Lainnya. Korelasi antara tes baru dengan te-tes
sebelumnya yang serupa kadang kala disebut sebagai bukti bahwa tes baru mengukur bidang
perilaku yang hampir sama dengan tes lain yang diberi nama sama, seperti “tes inteligensi” atau
“tes bakat/kemampuan mekanis”.
Analisis Faktor. Tujuan utama analisis faktor adalah menyederhanakan deskripsi
perilaku dengan meredukasi jumlah kategori dari banyak variabel tes pada awalnya ke beberapa
faktor atau sifat umum.
Konsistensi Internal. Tampak bahwa korelasi konsisten internal, entah didasarkan
pada butir-butir soal entah sub-subtes, pada hakikatnya merupakan ukuran-ukuran
homogenitas. Karena membantu menggambarkan domain perilaku atau sifat yang dijadikan
sampel oleh tes, derajat homogenitas sebuah tes memiliki relevansi tertentu dengan validitas
konstruknya.
Validasi Konvergen dan Diskriminasi. Dalam suatu analisis penuh pertimbangan
atas validasi konstruk, D. T. Campbell (1960) menunjukkan bahwa, dalam rangka menunjukkan
validitas konstruk, kita harus menunjukkan bukan hanya tes berkorelasi tinggi dengan variabel-
variabel lain sebagaimana seharusnya secara teoritis, tetapi juga ia tidak berkorelasi secara
signifikan dengan variabel-variabel yang memang berbeda dari tes tersebut.
Intervensi Eksperimental. Dalam memeriksa validitas te untuk digunakan dalam
program pengajaran yang dibuat khusus untuk individu, misalnya, salah satu pendekatan adalah
melalui perbandingan antara skor pretest dan posttest. Dasar pemikiran dari tes semacam itu
mengandaikan skor rendah pada pretest, yang diadakan sesuai instruksi yang relevan, dan skor
tinggi pada posttest.
Pemodelan Persamaan Struktural. Pemodelan persamaan structural
memberikan cara-cara menghindari kesulitan-kesulitan semacam itu. Pada dasarnya, modeling
persamaan structural melakukan hal itu dengan menggunakan persamaan regresi untuk
memprediksi variabel dpenden dari variabel independe dalam model cross-lagged atau model
kausal lainnya.
Kontribusi dari Psikologi Kognitif. Pendekatan ini dengan jelas memusatkan
perhatian pada proses-proses respons, sangat berbeda dengan cara sebelumnya yang lebih
memerhatikan hasil akhir pikiran dalam riset psikometris. Menganalisis kinerja tes dari segi
proses kognitif tertentu tentu saja bisa memperkuat dan memperluas pengertian kita tentang
apa yang diukur oleh tes tersebut.

 Tinjauan dan Integrasi


Perbandingan Prosedur Validasi. Untuk menunjukan segi-segi kekhasan dari
prosedur-prosedur validasi yang berbeda, mari kita terapkan masing-masing prosedur ini pada
sebuah tes yang terdiri dari butir-butir soal aritmetik campuran. Empat cara di mana tes ini bisa
digunakan, bersama dengan jenis prosedur validasi yang tepat untuk masing-masing.
Perbandingan Prosedur Validasi. Semua teknik spesifik untuk analisis isi untuk
mengukur hubungan-hubungan kriteria. Validitas terhadap berbagai kriteria praktis umum
dilaporkan dalam manual tes untuk membantu penggunaan dalam memahami apa yang diukur
oleh tes tersebut.
Validasi dalam Proses Penyusunan Tes. Proses validasi dimulai dengan
memformulasikan ciri terinci atau definisi konstruk, yang berasal dari teori psikologi, penelitian
sebelumnya, atau observasi sistematik dan analisis atas domain perilaku yang relevan.
Konsekuensi Individu dan Sosial Pengetesan. Penekanan lebih diletakkan pada
konsekuensi-konsekuensi tak disengaja dalam penggunaan khusus suatu alat tes, yang bisa
merusak individu atau anggota-anggota kelompok etnik tertentu atau populasi dengan latar
belakang pengalaman yang ragam.
Bab 6 – Validitas: Pengukuran dan Interpretasi
 Koefisien Validitas dan Kesalahan Penilain
Kondisi-kondisi yang Memengurahi Koefisien Validitas. Orang-orang dengan
latar belakang pengelaman yang berbeda, misalnya, bisa memanfaatkan metode-metode kerja
yang berbeda-beda untuk memecahkan masalah tes yang sama. Koefisien validitas juga bisa
berubah sepanjang waktu tertentu karena perubahan standar seleksi. Agar bisa melakukan
interpretasi yang tepat atas koefisien validitas, kita harus memperhatikan bentuk hubungan
antara test dan kriteria.
Besaran Koefisien Validitas. Sebelum menarik kesimpulan apapun tentang
validitas test, kita seharusnya cukup yakin bahwa koefisien validitas yang diperoleh itu tidak bisa
muncul melalui fluktuasi pengambilan sampel secara kebetulan dari korelasi populasi nol. Perlu
diingat bahwa kesalahan pengukuran menunjukan marjin kesalahan yang harus diharapkan
dalam sebuah skor individu sebagai hasil dari tidak dapat diandalkannya test itu.

 Validitas Test dan Teori Keputusan


Pendekatan Dasar. Dalam menetapkan skor potong pada sebuah test, perhatian
seharusnya diberikan pada persentase penolakan salah, seperti halnya pada persentase sukses
dan kegagalan di dalam kelompok terpilih. Dalam situasi tertentu, skor potong seharusnya
cukup tinggi untuk menyingkirkan semua hal kecuali beberapa kegagalan yang mungkin terjadi.
Ini akan menjadi masalah bila pekerjaan itu bersifat sedemikian rupa sehingga pekerja yang
punya kualifikasi buruk bisa menyebabkan kerugian ataupun kerusakan yang serius.
Prediksi Hasil. Informasi yang diperlukan mencakup koefisien validitas test,
proporsi pelamar yang harus diterima (rasio seleksi) dan proporsi pelamar-pelamar yang sukses
tanpa penggunaan test (angka dasar). Sebuah perubahan dan ketiga kondisi ini dapat mengubah
efisiensi prediktif test.
Hubungan Validitas pada Produktivitas. Dalam banyak situasi praktis, yang
diinginkan adalah suatu penilaian atas efek test seleksi, bukan pada persentase orang-orang
yang melebihi kinerja minimum, melainkan pada produktivitas keseluruhan orang yang dipilih.
Brogden (1946b) pertama-tama menunjukkan bahwa peningkatan yang diharapkan dalam
output secara langsung sebanding dengan validitas test.
Konsep Utulitas dalam Teori Keputusan. Merupakan ciri dari teori keputusan
bahwa test-test dievaluasi dalam kaitan dengan efektivitasnya pada situasi tertentu. Evaluasi
semacam itu tidak hanya mempertimbangkan validitas test ini dalam memprediksi kriteria
tertentu, tetapi juga sejumlah parameter lainnya, termasuk angka dasar dan rasio seleksi. Dalam
memilih suatu strategi keputusan, sasarannya adalah memaksimalkan kegunaan yang
diharapkan pada semua hasil.
Strategi Berurutan dan Penanganan Adaptif. Test-test bisa digunakan untuk
mengambil keputusan berurutan daripada keputusan akhir. Strategi lain, yang sesuai dengan
diagnosis gangguan-gangguan psikologis, adalah penggunaan dua kategori saja, tetapi untuk
menguji lebih jauh semua kasus yang digolongkan sebagai kasus positif (yakni memiliki
kemungkinan patologis) melalui test seleksi awal. Seharusnya diperhatikan juga nahwa banyak
keputusan personel pada dasarnya merupakan keputusan berurutan, meskipun tidak kelihatan
seperti itu.
Variabel-variabel Moderator. Minat dan motivasi bisa berfungsi sebagai variabel
moderator. Satu temuan yang relative konsisten adalah perbedaan jenis kelamin dalam
kemampuan untuk memprediksi nilai-nilai akademis. Perlu dicatat bahwa perbedaan jenis
kelamin dalam koefisien validitas ini, meskipun agak konsisten pada umumnya kecil.

 Memdukan Informasi dari Berbagai Macam Test.


Bila sejumlah test yang terpilih secara khusus digunakan bersama untuk
memprediksi kriteria tunggal, test-test tersebut dikenal sebagai kumpulan test. Masalah utama
yang muncul dalam penggunaan kumpulan test semacam itu menyangkut cara dimana skor
pada test yang berbeda dipadukan untuk sampai pada keputusan yang menyangkut masing-
masing individu. Ada dua jenis utama prosedur yang ditempuh untuk maksud ini, yaitu
persamaan multi regresi dan analisis profil.
Persamaan Regresi Majemuk. Menghasilakan skor kriteria terprediksi untuk
masing-masing individu berdasarkan skor pada semua test dalam kumpulan test. Validitas
keseluruhan kumpulan test dapat diperoleh dengan menghitung korelasi (R) antara kriteria
dengan kumpulan testnya. Korelasi ini menunjukkan nilai prediktif yang paling tinngi yang dapat
diperoleh dari kumpulan test tadi, apabila setiap test diberi bobot optimum untuk memprediksi
kriteria yang dipertanyakan.

 Penggunaan Test untuk Klasifikasi Keputusan.


Hakikat Klasifikasi. Klasifikasi, dipihak lain selalu melibatkan dua atau lebih
kriteria. Dalam situasi militer misalnya, klasifikasi adalah problem utama karena masing-masing
individu dalam kelompok karyawan harus ditugaskan pada bagian militer dimana ia bisa
berfungsi paling efektif. Keputusan klasifikasi juga diperlurkan dalam industry, ketika karyawan
baru ditugaskan pada program-program pelatihan untuk berbagai jenis pekerjaan.
Validitas Diferensial. Sasaran kumpulan test semacam itu adalah memprediksi
perbedaan-perbedaan dalam kinerja masing-masing orang pada dua atau lebih pekerjaan,
program pelatihan, atau situasi kriteria lainnya. Prosedur-prosedur statistic telah dikembangkan
untuk menyeleksi test test sedemikian rupa sehingga memaksimalisasi validitas diferensial
klasifikasi kumpulan test. Dalam praktiknya, untuk mendekati sasaran yang diinginkan, bisa
digunakan berbagai pendekatan empiris.
Fungsi Diskriminan Majemuk. Sebuah cara alternative untuk menangani
keputusan klasifikasi adalah dengan saran fungsi diskriminan majemuk. Fungsi diskriminan ini
juga tepat ketika ada hubungan non linear antara kriteria dan satu atau lebih predictor.
Memaksimalisasikan Pemanfaatan Bakat. Prediksi diferensial atas krotesia
dengan kumpulan test memungkinkan pemanfaatan sumber daya manusia yang tersedia
dengan lebih penuh, dibandingkan dengan test umum tunggal, atau dengan sebuah skor
komposit dari persamaan regresi tunggal.
 Analisis Statistik Terhadap Bias Test
Masalahnya. Pemecahan yang lebih baik adalah memilih isi yang relevan dengan
Kriteria dan kemudia menyeleksi perbedaan-perbedaan populasi yang mungkin dalam
efektifitas test untuk masuk yang memang dikehendaki. Koefisien validitas, bobot regresi, dan
skor-skor potong bisa bervariasi sebagai perbedaan fungsi dalam latar belakang pengalaman
peserta test.
Bias Lereng (Slope Bias). Dalam telaah-telaah validitas diferensial, satu kesulitan
umum muncul dari kenyataan bahwa jumlah kasus dalam sampel minoritas kerap jauh lebih
kecil daripada dalam sampel mayoritas. Dalam kondisi ini, koefisien validitas yang sama bisa
bermakna (signifikan) secara statistic dalam sampel mayoritas dan tidak signifikan dalam sampel
minoritas (yang disebut validitas kelompok tunggal).
Bias Intersepsi. Test menunjukan bias intersepsi jik secara sistematis test itu
memprediksi terlalu tinggi atau terlalu rendah kinerja kriteria untuk kelompok tertentu.
Masalah bias intersepsi berhubungan paling erat dengan fairness test. Meskipun istilah fairness
test dan bias test kadang kala digunakan secara luas dan bisa saling dipertukarkan untuk
meliputi semua aspek penggunaan test dengan minoritas kultural, telah lazim untuk
mengidentifikasi fairness test (atau sebaliknya) dengan bias intersepsi.
Model-model Keputusan untuk Penggunaan Test yang Fair. Jika strategi seleksi
mengikuti model regresi, para individu akan dipilih (untuk penerimaan mahasiswa, pekerjaan,
dan sebagainya) semata-mata berdasarkan skor kriteria yang diprediksikan. Strategi ini akan
memaksimalisasi keseluruhan kinerja kriteria, tanpa hubungan dengan sasaran-sasaran lain
proses seleksi. Pada akhirnya, seharusnya ditekankan bahwa penyesuaian statistic dalam skor-
skor test, skor potong, dan rumusan prediksi mengandung sedikit harapan sebagia sarana untuk
mengoreksi ketimpangan social. Pendekatan lainnya adalah melalui penanganan adaptif,
misalnya program pelatihan yang disesuaikan untuk individu tertentu.
BAB 7 – Analisis Butir Soal

Analisis butir soal memungkinkan kita memperpendek tes dan pada saat yang
sama meningkatkan validitas dan reabilitasnya. Asal semua hal lain sama, tes yang lebih panjang
lebih valid dan lebih dapat diandalkan daripada tes yang pendek.

 Kesulitan Butir Soal


Persentase Kelulusan. Untuk kebanyakan tujuan pengetesan, kesulita
butir soal dirumuskan dalam kaitan dengan presentase (proporsi) orang-orang yang
menjawabnya dengan benar. Semakin mudah butir soal, semakin besarlah presentasenya.
Dalam proses penyusunan tes, alasan utama untuk mengukur kesulitan butir soal adalah
memilih butir soal dengan tingkat kesulitan yang sesuai. Kebanyakan tes kemampuan baku
untuk menilai seakurat mungkin tingkat pencapaian individu dalam kemampuan tertentu.
Skala-skala Interval. Presentase orang-orang yang lulus pada suatu butir
soal mengungkapkan kesulitan butir soal dalam kaitan dengan skala ordinal; dengan kata lain,
presentase itu dengan benar menunjukkan urutan peringkat atau kesulitan relatif butir-butir
soal.
Penentuan Skala Absolut Thurstone. Indeks kesulitan butir soal yang
diungkapkan sebagai persentase atau unit-unit kurva normal dibatasi oleh rentang kemampuan
yang dicakup oleh sampel yang dari mana indeks-indeks itu berasal. Prosedur statistik ini yang
dikenal sebagai penentu skala absolute, dikembangkan oleh Thurstone (1925, 1947) dan telah
digunakan secara luas dalam pengembangan tes. Dengan demikian tes-tes yang dirancang
dengan tujuan penyaringan seharusnya memanfaatkan butir-butir soal yang nilai kesulitannya
paling mendekati rasio seleksi yang dikehendaki.
Distribusi Skor-skor Tes. Jika sampel standarisasi adalah cross-section
representative dari populasi tersebut, maka umumnya diharapkan bahwa secara kasar skor-
skornya akan masuk dalam kurva distribusi normal. Ketika sampel standardisasi menghasilkan
distribusi nonnormal yang cukup mencolok pada sebuah tes, tingkat kesulitan tes ini biasanya
dimodifikasi sampai dicapai sebuah kurva normal.
Mengaitkan Kesulitan Butir Soal dengan Tujuan Pengetesan. Dalam
penyusunan tes untuk bermacam-macam tujuan, pilihan atas kesulitan butir soal yang tepat,
seperti halnya juga bentuk optimal distribusi skor-skor tes, tergantung pada jenis diskriminasi
yang dicari. Dengan demikian, tes-tes yang dirancang dengan tujuan penyaringan seharusnya
memanfaatkan butir-butir soalyang nilai kesulitannya paling mendekati rasio seleksi yang
dikehendaki.

 Diskriminasi Butir Soal


Pilihan Kriteria. Diskriminasi butir soal merujuk pada sejauh mana butir
soal melakukan diferensiasi dengan benar di antara para peserta tes dalam perilaku yang
memang menjadi objek pengukuran tes. Bila tes sebagai suatu keutuhan harus dievaluasi
dengan sarana validasi yang terkait dengan kriteria, butir-butir soal itu sendiri bisa dievaluasi
dan diseleksi atas dasar hubungan mereka dengan kriteria eksternal yang sama. Validasi
eksternal dan konsistensi internal merupakan sasaran penyusunan tes. Untuk banyak tujuan
pengetesan, kompromi yang memuaskan adalah memilah-milah butir-butir soal yang relatif
homogen ke dalam tes atau subtes yang berbeda, yang masing-masing mencakup dari kriteria
eksternal.
Indeks Statistik Diskriminasi Butir Soal. Karena respons-respons butir
soal umumnya, direkam sebagai hal yang salah atau benar, pengukuran diskriminasi butir soal
biasanya melibatkan variabel dikotomis (butir soal) dan variabel kontinu (kriteria).
Penggunaan Kelompok-kelompok Ekstrem. Ketika kriterianya diukur
sepanjang skala yang kontinu, seperti dalam kasus nilai-nilai mata kuliah, peringkat pekerjaan,
catatan-catatan keluaran, atau skor total pada tes, kelompok kriteria atas (U = upper) dan
bawah (L = lower) diseleksi dari ekstrem-ekstrem distribusi. Yang jelas, semakin ekstrem
kelompok itu, semakin tajam diferensiasinya.
Analisis Sederhana dengan Kelompok-kelompok Kecil. contohnya
analisis butir soal siswa-siswa yang mengikuti kuis di kelas untuk mengidentifikasi kekurangan-
kekurangan dalam tes atau dalam pengajaran.
Indeks Diskriminasi. Jika jumlah orang yang bisa mengerjakan tiap butir
soal dalam kelompok kriteria U dan L dinyatakan dalam persentase, perbedaan antara dua
persentase ini memberikan sebuah indeks diskriminasi butir soal yang bisa diinterpretasikan
secara independen dari ukuran sampel tertentu dimana sampel itu didapatkan.

 Teori Respons Butir Soal


Regresi Butir Soal-Tes. Baik kesulitan butir soal maupun diskriminasi butir
soal bisa di representasikan secara serentak dalam grafik regresi butir soal tes. Kekuatan
diskriminatif masing-masing butir soal diidikasikan dengan keterjalan kurva itu: semakin
terjalnya kurvanya, semakin tinggi korelasi kinerja butir soal dengan skor total dan semakin
tinggi indeks diskriminasinya.
Teori Respons Soal: Segi-segi Dasar. Pendekatan matematis yang sedang
kita bahasa dalah teori respons butir soal telah diberi nama teori sifat laten dan teori kurva
karakteristik butir soal ICC (Item Characteristic Curve). Kurva karakteristik butir soal dibagankan
dari fungsi yang diturunkan secara matematis bukan dari data empiris yang digunakan dalam
kurva regresi butir soal tes.
Model-model IRT yang berbeda menggunakan fungsi-fungsi matematis yang berbeda,
didasarkan pada berbagai perangkat asumsi. Sejumlah model menggunakan fungsi-fungsi
lengkung normal (yakni distribusi normal kumulatif), yang lain menggunakan fungsi-fungsi
logistik, yang memanfaatkan sejumlah ciri hubungan logaritmik yang mudah secara matematis.
Pada umumnya, hasil yang diperoleh dengan berbagai model itu pada dasarnya sama, asalkan
asumsi itu ada dalam situasi tertentu.

 Analisis Butir Soal atas Tes-Tes yang Dipercepat


Kecuali untuk butir-butir soal yang hanya bisa dikerjakan oleh para
peserta tes kalau mereka punya waktu, indeks-indeks butir soal yang didapatkan dari tes
kecepatan akan mencerminkan posisi butir soal itu dalam tes lebih daripada kesulitan intrinsic
atau kekuatan diskriminatifnya.
Kesulitan yang dihadapi dalam analisi butir soal dari tes yang dipercepat
pada dasarnya sama dengan yang dibicarakan dalam bab 4 berkaitan dengan reliabilitas tes-tes
yang dipercepat. Berbagai solusi, baik empiris maupun statistik telah dikembangkan untuk
memecahkan kesulitan-kesulitan ini. Satu solusi empiris adalah menjalankan tes dengan batas
waktu yang lama pada kelompok dimana analisis butir soal akan dijalankan. Solusi ini
memuaskan asalkan kecepatan itu sendiri bukan aspek penting dari kemampuan yang hendak
diukur oleh tes itu.

 Validasi-Silang
Arti validasi-silang. Penting bahwa validitas tes dihitung berdasarkan
pada sampel orang yang berbeda dari sampel dimana butir-butir soal itu di seleksi. Determinasi
independen validitas kesuluruhan tes ini dikenal sebagai validasi silang. Koefisien validitas
apapun yang dihitung berdasarkan sampel yang sama, yang digunakan untuk maksud seleksi.
Jumlah penyusutan koefisien validitas dalam validasi-silang tergantung sebagain pada ukuran
kelompok butir soal asli dan proporsi butir-butir soal yang dipertahankan.

 Pemfungsian Butir Soal Diferensial


Tak ada satu “metode terbaik” analisis butir soal yang berlaku untuk
semua tujuan. Karena berbagai metode yang berbeda memberikan jenis informasi yang
berbeda, lebih baik menggunakan kombinasi metode-metode. Umumnya, kombinasi terbaik
mencangkup prosedur statistik dan prosedur penilaian tertentu.

 Eksplorasi dalam Pengembangan Soal


Tuntutan-tuntutan kognitif dari stimuli tes bisa diekplorasi melalui teknik
teknik dekomposisi tugas yang dikembangkan di dalam psikologi kognitif. Dengan prosedur ini,
hubungan antara segi-segi butir soal yang berbeda dengan kecepatan serta kesalahan kinerja
bisa diteliti. Embretson (1994) menampilkan analisis mendalam dan upaya terbaru tentang
proses pengembangan soal. Proses ini mulai dengan definisi konstruk yang harus diukur dan
terus ke rancangan model kognitif untuk tes bersangkutan.
Bab 8 – Tes-tes Individu

 Skala Inteligensi Standford Binet


Tes Stanford-Binet merupakan tes inteligensi yang paling populer di dunia
dan seringkali digunakan sebagai standar untuk menguji validitas tes inteligensi lain yang
dikembangkan setelahnya. Tes Stanford-Binet edisi tahun 1916 memiliki banyak kelemahan
sehingga dilakukan revisi pada tahun 1937, yang menghasilkan dua format yang paralel (L dan
M). Revisi berikutnya dilakukan pada tahun 1960 dan kemudian distandardisasi pada tahun
1972 sehingga mencakup norma-norma yang memadai bagi populasi masyarakat Amerika saat
itu. Skala Binet edisi keempat disusun pada tahun 1986. Penyusunnya berusaha untuk
mempertahankan kelebihan edisi sebelumnya sebagai tes inteligensi individual, ditambah
dengan kelebihan tambahan dari perkembangan teori dan riset terbaru dalam psikologi kognitif.
Selain itu, pada edisi revisi keempat ini ditambahkan variasi lainnya, khususnya jenis tes
nonverbal.
Edisi keempat terdiri dari 15 jenis tes yang berbeda yang mencakup empat area: (1) verbal
reasoning, (2) abstract/visual reasoning, (3) quantitative reasoning, dan (4) short-term memory.
Sebagian dari kelimabelas jenis tes tersebut dapat digunakan untuk segala umur, dan sebagian
lainnya hanya dapat digunakan untuk umur-umur tertentu. Sebagaimana edisi sebelumnya,
pada tes edisi 1986, testi diberikan tugas-tugas yang sesuai dengan kemampuannya.
Edisi keempat ini telah distandardisasi dengan lebih dari 5000 orang dari seluruh Amerika
Serikat yang di dalamnya telah mewakili sampel berdasarkan gender, umur, kelompok etnis, dan
masyarakat luas. Reliabilitas konsistensi internal tes secara keseluruhan sangat tinggi (di atas .
95), begitu pula reliabilitas masing-masing area kognitif (di atas .93). Uji reliabilitas dengan
metode test-retest terhadap bagian-bagian tes dan tes secara keseluruhan menunjukkan hasil
yang lebih tinggi bagi testi usia dewasa. Penyusun tes Binet juga telah menguji validitas edisi
keempat ini dengan menggunakan (1) validitas konstruk terhadap penelitian terkini dalam
bidang inteligensi kognitif, (2) konsistensi internal dan metode analisis faktor, dan (3) uji korelasi
dengan tes inteligensi lain.
Skala Wechsler
 Wechsler-Bellevue Intelligence Scale (WBIS)
o Tes Stanford-Binet sebenarnya dikembangkan untuk anak-anak, dengan
penambahan beberapa item-item yang sulit untuk orang dewasa. David
Wechsler, bekerja di Rumah Sakit Bellevue di New York berasumsi bahwa ada
hal-hal yang dibutuhkan dalam tes inteligensi yang dirasa lebih cocok bagi
orang dewasa dan dikembangkan dalam Wechsler-Bellevue Intelligence Scale
(WBIS) pada tahun 1939 (Hood & Johnson, 1993). Selain itu, dengan asumsi
bahwa tes Stanford-Binet terlalu banyak menekankan pada kemampuan
berbahasa dan kemampuan verbal, Wechsler mengembangkan skala kinerja
yang sama sekali berbeda dalam mengukur kemampuan non-verbal.
 Wechsler Adult Intelligence Scale (WAIS)
o Skala pada tahun 1939, yaitu Wechsler-Bellevue Intelligence (WBIS) telah
direvisi pada 1955 untuk memperbaiki beberapa kekurangan yang ditemukan
dalam bentuk tes sebelumnya dan berubah menjadi Wechsler Adult
Intelligence Scale (WAIS) (Wechsler dalam Hood & Johnson, 1993). Tes ini
telah di-standardisasi pada suatu sampel yang dipilih untuk mencocokkan
proporsi populasi di Amerika Serikat berdasarkan ras, tingkat pekerjaan,
pendidikan, dan tempat tinggal pada sensus tahun 1970 dan dibagikan pada
tingkat umur 16 sampai 74 tahun.
 Wechsler-Intelligence Scale for Children (WISC-R)
o WISC-R sebenarnya dikembangkan sebagai turunan perluasan dari WBIS yang
digunakan pada anak-anak umur 6 tahun sampai 16 tahun. Wechsler (Hood &
Johnson, 1993) menyatakan WISC-R direvisi pada 1974 untuk memuat lebih
banyak item berorientasi anak, untuk menyertakan lebih banyak orang kulit
hitam dan tokoh-tokoh wanita, dan untuk menyediakan sebuah sampel
normatif yang mewakili populasi anak-anak di Amerika Serikat.
 Wechsler Preschool and Primary Scale of Intelligence (WPPSI)
o Pada 1967, sebuah turunan perluasan dari WISC-R telah dikembangkan untuk
digunakan pada anak umur 4 sampai 61/2 tahun yang disebut dengan
Wechsler Preschool and Primary Scale of Intelligence (WPPSI) dan direvisi
menjadi WPPSI-R pada 1989 (Wechsler dalam Hood & Johnson, 1993).
WPPSI-R ini memasukkan 11 subtes yang mana 10 dari 11 digunakan untuk
memperoleh skor IQ.

 Skala Kaufman
Skala Kaufman adalah instrument klinis yang diseenggarakan secara
individu, yang dirancang untuk banyak penggunaan sebagaimana juga dimaksudkan oleh tes-tes
semacam Standford-Binetdan skala Wechsler yang telah dikembangkan secara traditional
(Kaufman & Kaufman, 1983a, 1983b, 1990,1993).
Ada 3 jenis Skala Kaufman :
 Kaufman Assessment Battery for Children (K-ABC)
o Tes kemampuan kognitif yang dilaksanakan secara individual untuk anak-anak
dan remaja untuk usia 3-18. tujuan untuk mengurangi perbedaan skor antara
anak-anak dari kelompok etnis dan budaya yang berbeda.
 Kaufman Adolenscent and Adult Intelegence Test (KAIT)
o KAIT dirancang sebagai pengukuran inteligensi untuk usia 11 tahun hingga 85
tahun atau lebih tua. Tes ini untuk mengintegrasikan teori tentang inteligensi
cair dan Kristal yang diartikulasikan oleh Horn dan Cattel (1966) dengan
gagasan tentang inteligensi orang dewasa yang dikemukakan dalam teori lain.
 Kaufman Brief Intelligence (K-BIT)
o KBIT dilaksanakan untuk peserta berusia 4-90 tahun dan dalam waktu kurang
lebih 20 menit. Tes penyaringan intelegensi umum standar yang baru-baru ini
dipublikasikan dalam bentuk edisi kedua yaitu KBIT yang terdiri dari:
 Skala Cryztallized atau verbal yang memiliki dua jenis soal (pengetahuan verbal dan
teka-teki).
 Skala Non Verbal atau Fluid yang mencakup soal-soal matriks.

 Skala Kemampuan Diferensial


Differential Ability Scales (DAS) dirancang terutama untuk mengukur
kemampuan-kemampuan tertentu dengan reliabilitas memadai, dan juga membantu dengan
tujuan-tujuan lebih kompleks dari penilaian individual, yaitu diagnosis diferensial dan
perencanaan penanganan. Pilihan tugas-tugas yang dicakup dalam kumpulan tes itu mengacu
pada dasar pemikiran teoritis maupun empiris. Dalam penyelenggaraan DAS yang
sesungguhnya, strategi tes adaptif diimplementasikan dengan sarana yang disebut titik mulai
yang didasarkan pada usia, titik-titik keputusan, didasarkan pada kinerja dari titik mulai ke titik
keputusan dan aturan-aturan penghentian alternative yang spesifik untuk tiap subtes.
Bab 9 – Tes-tes Untuk Populasi Khusus

 Pengetesan Bayi dan Anak-Anak Prasekolah


Banyak dari tes-tes ini menyangkut perkembangan sensori-motorik,
seperti didemonstrasikan oleh kemampuan bayi seperti mengangkat kepala, berbalik, meraih,
memegang objek, dan mengikuti objek yang bergerak dengan matanya. Pengetesan prasekolah
adalah proses yang jauh lebih antarpribadi dari segi yang menambah, baik kesempatan maupun
kesulitan yang disajikan oleh situasi tes.

 Tes-Tes yang Dibakukan untuk Perkembangan Masa Kanak-Kanak Awal


 Skala-Skala Bayley untuk Perkembangan Bayi
Skala-Skala Bayley-II memberikan tiga alat Komplementer untuk menilai
status perkembangan anak di antara umur 1 bulan dan 3,5 tahun: mental scale, motor scale,
dan behavior rating scale. Scala Mental mengambil sampel misalnya, ketajaman sensorik dan
perceptual, memori, proses belajar, pemecahan masalah, vokalisasi, permulaan vokalisasi
verbal, dll. Skala motor melakukan pengukuran kemampuan motorik yang besar, misalnya
duduk, berdiri, berjalan, menaiki tangga. Skala peringkat perilaku dirancang untuk menaksir
berbagai aspek perkembangan kepribadian, seperti perilaku emosional dan sosial, rentang dan
pembangkitan perhatian, ketekunan, dan keterarahan pada sasaran.
 Skala-Skala Piagetian
Skala-skala ini dirancang untuk menilai pencapaian kemampuan kognitif
antara umur 2 minggu dan 2 tahun. Umur-umur ini mencangkup apa yang oleh Piaget dicirikan
sebagai masa sensorimotorik yang terdapat enam tingkat. Rangkaian ini mencangkup enak
skala yang dinamakan yaitu;
1. Permanensi Objek.
2. Perkembangan Sarana untuk mencapai tujuan lingkungan yang disukai.
3. Imitasi.
4. Kausalitas Operasional.
5. Hubungan-hubungan Objek dalam Ruangan.
6. Perkembangan Skemata.

 Mengetes Penyandang Cacat Jasmani


 Kerusakan Pendengaran
Pengetesan pada anak-anak tunarungu adalah sasaran primer dalam pengembangan
skala kinerja paling awal. Adaptasi khusus skala-skala Wechsler kerap digunakan dalam
mengetes para tunarungu. Kebanyakan tes verbal bisa diselenggarakan jika pertanyaan-
pertanyaan lisan diketik pada kartu. Pada kenyataannya, WISC-R Performance Scale
merupakan tes inteligensi yang telah digunakan secara luas untuk anak-anak dengan
kerusakan pendengaran di AS.
 Kerusakan Penglihatan
Tes-tes lisan bisa dengan mudah digunakan untuk tunanetra, tetapi tes-tes kinerja
tampaknya paling tidak mungkin untuk diterapkan. Skala-skala Wechsler juga harus
diadaptasi untuk peserta tes yang buta. Adaptasi ini pada dasarnya menggunakan tes-tes
verbal dan menghilangkan tes-tes kinerja.
 Kerusakan Motorik
Sejumlah ketidakmampuan motorik yang parah ditemukan di antara orang-orang dengan
cerebral palsy. Jenis tes lain yang memungkinkan penggunaan respons dengan
menunjuk adalah tes kosakata bergambar. Tes-tes ini memberikan ukuran cepat atas
kosakata “penggunaannya” yang membuat tes-tes itu dapat diterapkan, terutama pada
orang-orang yang tidak mampu membuat vokalisasi dengan baik (seperti mereka dengan
cerebral palsy).

 Pengetesan Multikultural
Pengetesan lintas-budaya atau multikultural menyoroti peran penting
yang dimainkan oleh pola asuh orang tua dan lingkungan rumah tangga dalam perkembangan
intelektual seorang anak yang sedang tumbuh. Sekarang juga diakui bahwa perbedaan
lingkungan semacam itu tidak terbatas pada populasi etnis atau budaya yang dengan jelas dapat
diindentifikasi, tetapi bisa sangat mempengaruhi perkembangan psikologis pribadi
bersangkutan.
Bab 10 – Tes Kelompok

Tes kelompok digunakan terutama dalam system pendidikan, pegawai


negeri, industru dan dinas militer, Pengetesan missal dmulai selama PD I yang dikembangkan
oleh Army Alpha dan Army Beta untuk digunakan dalam Angkatan Bersenjata AS.
Armed Forces Qualification Test (AFQT) dikembangkan sebagai alat
penyaringan utama, disusul kemampuan tes klasifikasi multikecerdasan untuk menilai bidang
keahlian jabatan. Armed Services Vocational Aptitude Battery (ASVAB) masih dikembangkan
untuk bisa digunakan dalam semua dinas militer sebagai seleksi gabungan dan kumpulan tes
klasifikasi. ASVAB berfungsi sebagai komponen kualifikasi umum untuk kualifikasi personal,
masing-masing jabatan menyeleksi dan menggabungkan subtes supaya sesai dengan kebutuhan
khusus satu jabatan tertentu.

 Tes Kelompok Versus Tes Individu


Perbedaan Khusus dalam Rancangan Tes. Tes kelompokharus berbeda
dari tes individu dalam hal bentuk ataupun susunan butir soal. Perbedaan pokok tes kelompok
dan tes individu adalah dalam hal control atas kesulitan soal. Dalam tes individu, penguji
mengikuti aturan penerimaan peserta, aturan dasar (basic rules) dan arutan plafon (ceiling
rules) untuk memastikan bahwa setiap peserta tes diuji dengan soal yang sesuai dengan tingkat
kemampuannya. Dalam tes kelompok, soal dengan isi (content) yang sama diatur sesuai dengan
tingkatan kesulitan dalam tes yang diukut secara terpisah berdasarkan waktu (timed).
Keuntungan dari Pengetesan Kelompok. Tes kelompok dirancang
terutama sebagai alat untuk pengetesan missal. Tes kelompok memiliki keuntungan yang
diselenggarakan secara stimultan bagi sebanyak mungkin orang yang benar-benar bisa
disesuaikan dengan ruang yang tersedia dan jangkauan suara microfon. Cara kedua adalah
memudahkan pengetesan missal karena tes ini benar-benar menyederhanakan peran penguji.
Kerugian dari Pengetesan Kelompok. Dalam pengetesan kelompok,
penguji memiliki peluang yang jauh lebih kecil untuk berhubunganm bekerja sama dan
mempertahankan minat peserta tes. Orang yang tidak terbiasa dengan pengetesan akan leih
mengalami rintangan pada pengetesan kelompok ketimbang pengetesan individu. Tes kelompok
telah di serang karena keterbatasan pada jawaban peserta tes. Kurangnya kelenturan, sejauh
setiap peserta tes secara teratur dites pada semua soal, waktu pengetesan yang teserdia dapat
digunakan dengan lebih efektif jika setiap peserta tes berkonsentrasi pada soal yang sesuai
dengan kemampuannya.

 Pengetesan Secara Adaptif dan Administrasi Tes Menggunakan Komputer


Tes-Tes yang Disusun secara Individu. Dalam upaya menggabungkan
beberapa keuntungan pengetesan kelompok dan individu ini, beberapa pengetesan telah
dijelajahi. Minat lebih dikembangkan pada cara menyesuaikan liputan soal terhadap
karakteristik jawaban peserta tes individu. Dalam literarut berbeda-beda sebagai pengetesan
yang dinamik, terprogram, terindividualisasi, terjalon, terbagi dalam cabang, sekuensial dan
adaptif.
Pengetesan secara Adaptif yang Terkomputerisasi (CAT Computerized
Adaptive Testing). Prosedur CAT memanfaatkan teknik IRT (item response theory) yang
digambarkan untuk menyusunkan kumpulan soal, mengetes individu dan menskoring kinerja
individu, untuk masing-masing butir soal dalam kelompok, ada perkiraan kemampuan yang
dituntut untuk mendapatkan peluang 50-50 supaya bisa lulus.

 Kumpulan Tes Multilevel


Tinjauan. Harus meliputi rentang kesulitan yang relative terbatas, cocok
untuk usia, tahap atau tingkat kemampuan tertentu, supaya bisa memberikan ukuran yang
sebanding dari perkembangan intelektual selama rentang yang luas seri dari kumpulan res
multilevel yang berumpang tindih telah dikonstruksikan.
Kumpulan Tes yang Representatif. Kumpulan tes ini dipilih berdasarkan
resensi dari revisi terakhir mereka, mutu yang tinggi dari prosedur konsruksi tes mereka dan
ukuran serta kerepresentatifan sampel baku mereka. Korelasi retes tinggi menunjukan stabilitas
yang memuaskan, korelasi dengan tingkatan sekolah dan dengan tes prestasi menunjukan
validitas prediktif yang baik. Interkorelasi antar skor bagian, juga analisis faktorial
menyingkapkan satu faktor umum yang luas melalui masing-masing kumpulan tes total.
Isi Tes yang Umum pada Level yang Berbeda. Pada usia prasekolah,
pengetesan secara individu diperlukan untuk membuat dan mengelola rapor, demikian pula
penyelenggaraan tes dengan soal-soal tipe oral dan kinerja sesuai untuk anak seusia itu. Tes
kelompok unuk level pertama umumnya meliputi taman kanak-kanak dan kelas satu atau dua
sekolah dasar. Tes untuk level sekolah dasar dari kelas tiga atau emapt keatas mempunyai
banyak hal yang sama baik dalam isi (content) maupun dalam rancangan umum. Level lebih
tinggi dari kumpulan tes multilevel, cocok untuk pelajar sekolah menengah.
Pengenalan atas Multibakat. Ada satu kecenderungan besar untuk
menjembatani kesenjangan awal antara pengetesan secara keseluruhan, kemampuan umum
dan pengukuran terhadap bakat-bakat terpisah yang relative independen. Dalam OLSAT (1996)
ditunjuk bahwa skor total sendiri terbatas pada sekelompok bakat “pendidikan verbal”,
kumpulan tes ridak ditunjukkan untuk mengukur segmen “praktik mekanik: dari inteligensi
umum.

 Mengenal Multi Bakat


Tes inteligensi tradisional, dilakukan secara individu atau kelompok
dirancang terutama untuk menghasilkan ukuran global tunggal dari tingkat perkembangan
kognitif individu secara umum seperti IQ, akan tetapi baik perkembangan praktis maupun
teoritis, menarik perhatian ke bakat khusus tertentu.
Differential Aptitude Test (Tes Bakat Diferensial). Salah satu dari
kumpulan tes multibakat yang paling luas digunakan adalah DAT. Pertama kali dipublikasikan
pada tahun 1947, DAT telah direvisi secara berkala. Kumpulan tes itu dirancang untuk digunakan
dalam bimbingan karier siswa kelas 8 sampaai kelas 12. DAT terdiri dari delapan tes, yaitu :
penalaran verbal, penalaran numeric, penalaran abstrak, kecepatan dan kecermatan persepsi,
penalaran mekanik, hubungan ruang (spatial), ejaan dan penggunaan bahasa.
Kumpulan Tes Bakat Multidimensional. Tes bakat multidimensional
(Multidimensional Aptitude Battery : MAB) adalah tes kelomok yang dirancang untuk menilai
bakat-bakt yang sama seperti Wechsler Adult Intelligence Scale-Revised (WAIS-R) yang
mencakup lima subtes skala verbal, yaitu : informasi, komprehensi, aritmatik, keserupaan dan
kosakata. Ada pula lima subtes dalam skala kinerja, yaitu: symbol digit, pelengkapan gambar,
ruang, pengaturan gambar dan perakitan objek.
Bab 11 – Hakikat Inteligensi

 Arti IQ
IQ tidak sma dengan jenis skor pada tes tertentu, tetapi kerap dipandang
sebagai singkatan untuk inteligensi. Tes inteligensi berbeda, yang menghasilkan IQ yang berbeda
dalam isi dan cara yang memengaruhi interpretasi skor mereka.
Pertama, inteligensi yang dites seharusnya dipandang sebagai konsip yang deskriptif lebih
daripada konsep yang eksplanatoris. IQ adalah ekspresi dari tingkat kemampuan individu pada
saat tertentu dalam hubungan dengan norma usia tertentu. Kedua, inteligensi bukan
kemampuan tunggal dan seragam, tetapi komposit dari berbagai fungsi. Istilah umm digunakan
untuk mencakup gabungan kemampuan yang diperlukan dalam budaya tertentu.

 Heritabilitas Dan Modifiabilitas


Indeks-indek heritabilitas telah dihitung dengan berbagai rumus, tetapi
data dasar mereka adalah pengukuran kesamaan familial dalam ciri yang sedang disoroti.
Berbagai hal harus diperhatikan dalam menginterpretasikan perkiraan heritabilitas. Pertama,
data empiris dalam kesamaan familial tunduk pada distorsi karena kontribusi factor-faktor
lingkungan yang tidak diperkirakan. Kedua, indeks-indeks heritabilitas merujuk pada populasi di
mana heritabilitas itu ditemukan pada waktunya. Ketiga, heritabilitas tidak menunjukan derajat
modifiabilitas sifat.

 Motivasi Dan Inteligensi


Salah satu cara dimana motivasi dan variabel-variabel afektif lainnya busa
memberikan sumbangan pada perkembangan bakat adalah melalui jumlah waktu yang
diluangkan individu pada aktivitas tertentu relative terhadap aktivitas-aktivitas lain yang
bersaing menuntut perhatian. Motivasi memengaruhi efisiensi pelaksanaan tugas dan waktu
yang diluangkan pada tugas itu, relative pada aktivitas-aktivitas lain.
Hubungan antara kepribadian dan intelektualitas bersifat resiprokal. Cirri-ciri kepribadian tidak
hanya memengaruhi perkembangan intelektual, tetapi tingkat intelektual juga bisa
memengaruhi perkembangan kepribadian.

 Analisis Faktor Atas Inteligensi


Riset psikologis tentang identifikasi sifat mental tumbuh dari minat dalam
hakikat dan komposisi inteligensi manusia. Penelitin semacam ini mulai dengan antar korelasi
skor-skor yang didapatkan dengan sampel orang-orang pada berbagai tes kemampuan.
Matriks Faktor. Objek utama analisis factor adalam menyederhanakan
deskripsi data dengan mereduksi jumlah variabel atau dimensi yang diperlukan. Semu teknik
analisis factor mulai dengan table lengkap antarkorelasi di antara satu set tes. Table seperti ini
dikenal sebagai matriks korelasi. Berbagai metode yang berbeda untk menganalisis seperangkat
variabel ke factor-umum telah diturunkan, pada tahun 1901, Pearson membuka jalan untuk
jenis analisis ini, dan Spearman mengembangkan analisis factor modern. Kelley dan Thurstone
di Amerika dan Burt di Inggris berbuat banyak untuk mengembangkan metode ini.
Sumbu-Sumbu Referensi. Posisi sumbu referensi tidak ditetapkan oleh
data. Tabel korelasi yang original hanya menentukan posisi tes dalam kaitan satu sama lain.
Untuk alas an in, para analis factor biasanya merotasikan sumbu-sumbu sampai mereka
mendapatkan pola yang paling memuaskan dan mudah diinterpretasikan.
Interpretasi Faktor-Faktor. Sekali matriks factor yang dirotasi dihitung,
kita bisa maju dengan interpretasi dan penamaan factor. Langkah ini membutuhkan wawasan
psikologis daripada keterampilan statistic. Untuk mempelajari hakikat factor particular, kita
semata-semata memeriksa tes bersangkutan memiliki pemuatan tinggi pada factor itu dan
berusama menemukan proses psikologis apa yang umumnya ada pada tes tersebut.
Kompoisi Faktorial Tes. Salah satu teorema dasar analisis factor
menyatakan bahwa varian total seuah tes adalah umlah varian yang disumbangkan daktor
umum dan factor yang spesifik, plus varian kesalahan.
Pemuatan Faktor dan Korelasi. Teorema dasar kedua analisis factor
menyangkut hubungan antara pemuatan factor dan korelasi antara variable. Karena factor
spesifik dan factor kesalahan itu unik bagi tiap variabel, factor itu tidak dapat memberikan
sumbangan pada korelasi antar variable. Korelasi antara dua variabel apapun tergantung hanya
pada factor yang dimiliki bersama oleh dua variabel ini. Samakin besar bobot factor-faktor
umum ini dalam kedua variabel itu, semakin tinggilah korelasi antar variabel.
Sumbu-Sumbu Miring dan Faktor-Faktor Tingkat-Dua. Sumbu
orthogonal adalah sumbu pada sudut yang tepat satu sama lain. Kelompok tes ada dalam situasi
sedemikian rupa sehingga kesesuaian yang lebih baik dapat dicapai dengan sumbu-sumbu
miring. Para psikologis Inggris mulai dengan factor umum yang mereka anggap menyebabkan
porsi utama varian umum, kemudian kembali pada factor kelompok untuk menerangkan
korelasi yang tersisa. Perbedaan procedural ini mencerminkan perbedaan.

 Teori-teori Organisasi Sifat


Teori Dua-Faktor. Teori pertama tentang organisasi sifat yang didasarkan
pada analisis statistic atas skor-skor tes adalah teori dua factor yang dikembangknoleh seorang
psikolog Inggris, Charles Spearman. Teori ini mempertahankan bahwa semua aktivitas
intelektual bersama-sama memiliki satu factor umum atau yang bisa disebut factor g.
konsekuensi adalah tujuan tes psikologi seharusnya untuk mengukr jumlah g masing-masing
individu. Jika factor ini melintasi semua kemampuan, factor ini melengkapi satu-satunya basis
untuk prediksi kinerja individu dari satu situasi ke situasi lain.
Teori-Teori Faktor Majemuk. Pandangan yang popules di Amerika yang
didasarkan pada penelitian analisis factor-awal, menerima sejumlah factor kelompok yang
cukup luas, yang masing-masing bisa masuk dengan bobot berbeda ke dalam tes yang berbeda-
beda. Penerbitan Kelley’s Crossroads in the Mind of Man (1928) mempermulus jalan bagi
sejumlah studi sdalam pencarian factor-faktor kelompok tertentu. Salah satu eksponen
terkemuka dari factor teori factor majemuk adalah Thustone yaitu mencakup: Verbal
Comprehension (v), Word Fuency (W), Number (N), Space (S), Associative Memory (M),
Pesceptual Speed (P), dan Generan Reasoning (R).
Model Struktur Intelek. Berdasarkan riset analisis factor selama lebih
dari dua dasawarsa, Guilford mengusulkan model bentuk kubus yang ia sebut model struktur
intelek (SI). Model ini yang mengklasifikasikan sifat-sifat intelektual menurut tiga dimensi, yaitu :
Operasi, Isi dan Produk. Karena klasifikasi ini maliputi kategori-kategori 6 x 5 x 6 ada 180 sel
dalam model ini.
Teori-Teori Hierarki. Skema alternative untukorganisasi factor-faktor
diusulkan oleh sejumlah psikolog Inggris, termasuk di dalamnya Burt (1949) dan Vernon (1960)
dan Humphreys (1962) di Amerika Serikat. Pada bagian puncaknya, Vernon menempatkan factor
g Spearman. Pada tingkat berikutnya ada dua factor kelompok yang luas yang sesuai dengan
kemampuan verbal-edukasional dan dengan kemampuan praktis-mekanis.

 Hakikat Dan Perkembangan Sifat-sifat


Sejarah Pengalaman. Peran sejarah pengalaman individu dalam
perkembangan inteligensi dan pembentkan actor kelompok semakin diterima. Perbedaan dalam
pola factor telah ditemukan berkaitan dengan kultur atau subkultur, tingkat social ekonomi dan
tiper kurikulum sekolah.
Mekanisme Pembentukan Sifat. Mekanisme untuk munculnya factor
disediakan oleh konsep yang sudah dikenal tentang paket belajar dan alih pelatihan. Sumber
utama lainnya dari pembentukan sifat adalah hubungan atau kemunculan bersama pengalaman
belajar.
Analisis Faktor dan Analisis Tugas Faktor Kognitif. Analisis protocol
dimana individu diarahkan untuk berpikir keras ketika menyelesaikan masalah atau menjalankan
tugas intelektual, memberikan pendekatan yang menjanjikan terhadap analisis atas pikiran
manusia.
Inteligensi Umum. Riset analisis factor pada intelgensi tidak hanya
memerhatikan apa yang diukur oleh tes inteligensi, tetapi juga memerhatikan hakikat inteligensi
dimanapun terwujud. Faktor yang dianalisis semacam itu diturunkan dari antarkoreasi diantara
variabel-variabel terpilih.
Bab 12 - Persoalan Psikologis dalam Pengetesan Kemampuan

 Telaah Longitudina Atas Inteligensi Anak-anak


Stabilitas Kinerja Tes Inteligensi. Sebuah kumpulan data ekstensif yang
telah berakumulasi memperlihatkan bahwam selama periode sekolah dasar, sekolah menengah
dan perguruan tinggi kinterja tes inteligensi cukup stabil.satu penjelasan terhadap
meningkatnya stabilitas skor tes inteligensi sesuai usia diberikan oleh sifat kumulatif dari
perkembangan intelektual.
Instabilitas dari Kinerja Tes Inteligensi. Telaah korelasi atas skor tes
memberikan data actual yang dapat diaplikasikan oada prediksi kelompok, karena alasan
tersebut, skor-skor cenderung stabil dalam arti actuarial ini. Kenaikan dan kemerosotan tajam
bisa terjadi sebagai akibat dari perubahan lingkungan yang besar dalam kehidupan anak.

 Inteligensi Dalam Masa Kanak-kanak Awal


Validitas Prediktif dari Tes Bayi dan Prasekolah. Tes-tes prasekolah
memiliki validitas yang moderat dalam meramalkan kinerja tes inteligensi berikutnya, namun tes
terhadap bayi justru tidak. Kekurangan daru validitias prediktif jangka panjang dari tes terhadap
bati dievaluasi lebih lanjut sehubungan dengn temuan-temuan terkait lainnya.
Implikasi atas Program Intervensi. Efektivitas dari berbagai program
intervensi era Head Start yang sudah didemonstrasikan, tergantng pada mutu program tertentu.
Dirancang terutama ntuk meningkatkan kesiapan akademik anak-anak dari latar belakang yang
tidak menguntungkan. Program-program ini sangat bervariasi dalam prosedur dan hasil.

 Masalah Dalam Melakukan Tes Inteligensi Pada Orang Dewasa


Penurunan Akibat Pertambahan Usia. Ciri khas yang diperkenalkan oleh
skala Wechsler untuk mengukur inteligensi orang dewasa adalah oenggunaan norma mundur
untuk menghitung simpangan IQ. Skor mentah pada subtes WAIS pertama diolah ke dalam skor
baku dengan rata-rata 10 dan simpangan baku 3.
Telaah Longitudinal Seattle (The Seattle Longitudinal Study SLS).
Program riset jangka panjang yang terencana baik yang menggunakan rancangan cross-
sequential adalah Seattle Longitudinal Study. Mulai tahun 1956 para penyelidik melaksanakan
suatu kumpulan tes kemampuan pada sebuah sampel acak yang dibagi atas tingkatan-tingkatan.
Perbedaan Individual dan Usia. Selain temuan dasar bahwa penurunan
akibat pertambahan usia lebih kecil dan selama hidup muncul belakangan dibanfing perkiran
sebelumnya, riset terbaru umumnya menyingkapkan perbedaan individual yang besar dalam
kemampuan pada semua level usia. Generalisasi apa saja harus dikualifikasikan oleh pengakuan
akan variabilitas individual yang ditemukan dalam semua situasi.
Hakikat Inteligensi Orang Dewasa. Tes inteligensi tradisional telah
diorientasikan, terutama kea rah anak sekolah dan mahasiswa perguruan tinggi. Pada level ini,
penyusun tes dapat mendekati kumpulan besar pengalaman umum yang telah diorgaisasikan ke
dalam kurikulum akademik.
 Perubahan Populasi Dalam Kinerja Tes Inteligensi
Skor yang Meningkat. Saat level pendidikan dari populasi orang dewasa
meningkat selama beberapa dasawarsa, rata-rata kinerja tes inteligensi meningkat sejaan
dengan itu. Akibatnya para anggota yang lebih tua dari sampel normative yang mendapatkan
pendidikan rata-rata kurang lengkap disbanding anggota yang lebih muda mendapatkan skor
lebih rendah disbanding mereka yang lebih muda.
Skor yang Menurun. Meningkatnya level pendidikan populasi akan
langsung memengaruhi kinerja tes orang dewasa, tetapi hal itu tidak langsung memengaruhi
kinerja naak-anak, karena anak-anak dalam sampel yang dibandingkan mempunyai jumlah
pendidikan yang sama ketika dites. Pertimbangan penting lain, khususnya bila menguji
sbpopulasi terpilih adalah perubahan apa saja dalam tingkat seleksi pada periode waktu yang
berbeda.
Ikhtisar. Problem metodologis yang dihadapu dalam usaha untuk menilai
perubahan populasi disoroti oleh survey yang diupayakan atas hasil perolehan yang dilaporkan
dalam kinerja tes inteligensi di 14 negara. Temuan itu yang menyingkapkan begitu banyak
inkonsistensi dan ketidakcocokan seperti mengerahkan pengarang untuk tidak bisa menarik
kesimpulan.

 Keanekaragaman Budaya
Bidang Psikologi Budaya. Ada konferensi internasional yang dikhususkan
untuk topic psikologi budaya. Bidang ini member perhatian khusus pada perbedaan perilaku
diantara kelompok yang dibesarkan dalam konteks budaya yang sangat berbeda. Konteks
tersebut dapar sesempit RT atau desa atau seluas bangsa atau benua.
Perbedaan Kultural Versus Hambatan Kultural. Perilaku individual
dianggap harus dibebeani sejenis lapisan budaya yang penetrasinya menjadi objektif tentang
apa yang kemudian disebut tes bebas budaya. Perkembangan selanjutnya dalam genetic dan
psikologi telah menunjukan kesesatan dari konep ini.
Bahasa dalam Pengetesan Transbudaya. Kebanyakan tes silang budaya
tradisional memanfaat isi nonverbal dengan harapan bisa memperoleh satu ukutan yang lebih
mendekati culture-fair dari fungsi-fungsi intelektual yang sama melalui tes inteligensi verbal.
Kedua pengandaian yang mendasari pendekatan ini dapat dipertanyakan. Pertama dapat
diandaikan bahwa tes-tes nonverbal mengukur fungsi yang sama seperti tes verbal. Dari sudut
pandang berbeda, sekelompok bukti yang sedang berkembang mengemukakan bahwa tes
nonbahasa bisa lebih bermuatan budaya ketimbang tes bahasa.
Situasi Pengetesan. Kontrak transbudaya yang cepat meluas di dunia
dewasa ini meningkatkan perobabilitas tes-tes yang dilaksanakan bagi orang dari budaya yang
berbeda. Setiap penguji dapat mengantipasi tes terhadap satu atau lebih orang yang berbeda
budaya dengannya. Karenananya pelatihan atas pemberi tes hendaknya mencakup
pengetahuan tentang satu atau lebih budaya yang tidk serupa dengan perhatian khusus pada
pengaruh budaya yang mungkin memengaruhi perkembangan perilaku individual.

Bab 13 - Inventori Kepribadian Laporan-Diri


Untuk maksud sekarang ini, instrumen-instrumen yang tersedia
diklasifikasikan menurut metode perolehan data dari individu-individu. Bab ini berhubungan
dengan inventori kepribadian laporan diri (self-report-personality inventories). Jumlah tes
kepribadian yang ada mencapai ratusan buah. Yang paling banyak adalah inventori kepribadian
dan teknik-teknik proyektif.
Dalam perkembangan inventori kepribadian, berbagai pendekatan telah
diikuti dalam merumuskan, menyususn, menyeleksi dan mengelompokan butir-butir soal. Di
antara prosedur-prosedur utama yang digunakan dewasa ini adalah pendekatan-pendekatan
yang didasarkan pada relvansi isi, pemasukan kriteria, empiris, analisis faktor, dan teori
kepribadian.
Meskipun sejumlah tes kepribadian digunakan sebagai intrumen penyaringan kelompok,
kebanyakan teruatama diterapkan dalam lingkungan klinis dan konserling.

 Prosedur-Prosedur Yang Terkait Dengan Isi


Prototipe inventori kepribadian laporan-diri adalah Lembar Data Pribadi
Woodworth, yang dikembangkan untuk digunakan selama Perang Dunia I. Inventori ini pada
dasarnya adalah upaya untuk membakukan wawancara pkisiatris dan untuk menyesuaikan
prosedur testing massal. Sesuai dengan itu, Woodworth mengumpulkan informasi yang
menyangkut simptom neurotis dan praneurotis dari pustakaan prikiatris seperti psikiater. Dalam
rujukan pada simptom-simptom inilah pertanyaan-perntanyaan inventori pada awalnya
dirumuskan. Perntanyaan-pertanyaan ini berhubungan dengan perilaku seperti ketakutan yang
abnormal atau fobia, obsesi dan kompulsi, mimpi buruk dan gangguan tidur lain, kelelahan yang
berlebihan dan simptom psikosomatis lain, perasaaan tidak nyata, dan gangguan motorik,
seperti gerakan urat saraf atau gemetar.
Keuntungan pertama dari pendekatan terkait dengan isi pada perkembangan inventori
kepribadian terletak pada keserdehanaan dan sifat langsung dari metodeini.

 Pemasukan Kriteria Empiris


Pendekatan Dasar. Pemasukan keriteria empiris (empirical criterior
keyring) merujuk pada perkembangan kunci skoring dalam kaitan dengan kriteria eksternal
tertentu. Prosedur ini mencangkup seleksi butir soal yang harus dipertahankan dan penunjukan
bobot skoring pada tiap respons. Metode pengontrasan kemlompok-kelompok juga digunakan
dalam seleksi butir-butir soal. Ada simptom-simptom yang sekurang-kurangnya dua kali
dilaporkan sering terjadi dalam kelompok psikoneuritis yang didiagnosis sebelumnya dibanding
dalam kelompok normal simptom-sipmtom.
Minnesota Multiphasic Personality Inventories. Contoh terkenal tentang
pemasukan kriteria empiris dalam penyusunan tes kepribadian adalah Minnesota Multiphasic
Personality Inventory (MMPI). Jadi, komisi yang dituntut dengan restandardisasi MMPI
menghadapi tugas yang sulit untuk memodernisasi intrumen yang ada, sementara berusaha
menyelamatkan kekayaan materi interpretatif yang relevan bagi penaksiran kepribadian dan
terutama kekayaan psikopatologi yang tertanam dalam struktur MMPI.
Minnesota Multiphasic Personality Inventories-2. Butir-butir soal MMPI
2 terdiri dari 567 pertanyaan alternatif yang ditanggapi peserta “Benar” atau “Salah”. 370 butir
soal pertama, yang pada dasarnya sama dengan butir-butir spal dari MMPI, kecuali dalam hal
perubahan editorial dan pengaturan kembali menyediakan semua respons yang dibutuhakan
untuk memberi skor 10 skala “klinis” yang asli dan tiga skala “validitas”.
Segi yang menonjol pada dari MMPI asli adalah penggunaan tiga skala yang disebut skala-skala
validitas, yang juga dipertahankan dalam MMPI-2. Skala ini tidak berkaitan dengan validitas
dalam pengertian teknis. Akibatnya, skala-skala ini mewakili pengecekan dalam hal kurangnya
perhatian, kesalahpahaman, pura-pura sakit, dan pelaksanaan perangkat respons khusus dan
sikap mengikuti tes. Skor-skorbvaliditas mencakup.
Skor Bohong (L): didasarkan pada sekelompok butir soal yang tampaknya dipahami dengan baik
oleh responden, tetpi tidak mungkin diajwab dengan benar dalam arah yang dihendaki.
Skor Infrekuensi (F): ditentukan dari seperangkat 60 (dari aslinya 64) soal yang dijawab dalam
arah diskor oleh tidak lebih dari 10% kelompok stndardasi MMPI. Skor F bisa menunjukan
kesalahan penskoran, kurangnya perhatian dalam pemberian respons, eksentrisitas kasar,
proses psikotris, atau kepura-puraan yang sengaja.
Skor Koreksi (K): mengunakan kombinisi lain dari butir-butir soal yang dipilih secara spesifik,
skor ini memberikan ukuran bagi sikap dalam mengikuti tes yang diyakini lebih tak halus. Skor K
yang tinggi bisa mengindikasi sikap defensif atau usaha untuk “memalsukan yang baik’. Skor K
yang rendah bisa menggambarkan sikap terus terang yang berlebihan dan kritik dari atau usaha
sengaja untuk “memalsukan yang buruk”
Minnesota Multiphasic Personality Inventory-Adolesent. MMPI-A adalah
bentuk baru MMPI ynag dikembangkan secara spesifik untuk digunakan pada remaja. MMPI-A
memuat hampir semua segi dari MMPI dan MMPI-2, mencangkup 13 skala dasar, tetapi
menampung para peserta lebih muda melalui pengurangan panjang keseluruhan inventori
menjadi 478 butir soal, dimasukkannya butir-butir soal dan skala-skala baru yang mencangkup
bisang yang secara spesifik relevan bagi mereka, seperti masalah sekolah dan keluarga, dan di
atas segala-segalanya, persyaratan norma kecocokan usia.
Kesimpulan dan Komentar atas Minnesota Multiphasic Personality
Inventories. MMPI dan versi revisinya telah dimasukkan berbagai prosedur tambahan dan
strategi interpretif ke dalam kerangka asli yang ditutunkan secara empiris dari inventori-
inventori. Berbagai cara baru dalam mendekati tugas kompleks dari interpretasi MMPI terus
dikembangkan. Salah satu yang terbaru adalah penggunaan ringkasan struktural untuk
menghasilkan keselarasan dan kemudahan bagi penggunaan multiplisitas skala-skala yang
memiliki korelasi satu sama lain yang dihasilkan oleh inventori-inventori Minnesota.

 California Psychological Inventory


Sambil menarik hampir separuh butir doal dari MMPI, CPI dikembangkan
secara khusus untuk digunakan pada polpulasi orang dewasa. Sebagaimana dalam MMPI-2,
semua skor CPI dilaporkan dalam kaitan dengan skala skor standar dengan rata-rata 50 dari SD
10; dewasa ini, didasarkan pada sampel normatif yang terdiri dari 3000 wanita dan 3000 laki-
laki yang ditarik dari arsip CPI untuk mewakili populasi umum Amerika Serikat dalam kaitan
dengan umur, tingkat sosioekonomis dan area geografis.

 Inventor Kepribadian untuk Anak-Anak


PIC dirancang untuk anak-anak dan remaja yang berusia antara 3 sampai
16 tahun. Perbedaan utama antara PIC dan MMPI berhubungan dengan cara informasi itu
diperoleh; butir-butir soal koesioner benar-salah dijawabtidak hnaya oleh anak bersangkutan,
tetapi oleh remaja yang pengetahuannya luas, biasanya si ibu.
PIC awalnya terdiri dari total 600 butir soal, yang dikelompokkan ke
dalam tiga “skala validitas”, sebuah skala penyaringan umum dan 12 skala klinis. Skala validitas
meliputi; skala Kebohongan, terdiri dari butir-butir soal yang membuat anak muncul dalam
cahaya yang menyenangkan, namum tidak realitis; skala Frekuensi, yang terdiri dari butir-butir
soal yang jarang digunakan; dan skala Sikap Defensif, yang dirancang untuk menaksir sikap
defensif parental atas perilaku si anak.

 Analisis Faktor Dalam Pengembangan Tes


Dalam upaya untuk sampai pada klasifikasi sistematis atas ciri-ciri
kepribadaian, sejumlah psikolog berpaling pada analisis faktor. Teknik ini, yang sudah dibahas
dalam kaitan dengan organisasi kemampuan kognitif, idealnya sesuai untuk tugas mengurangi
jumlah kategori yang diperlukan untuk menghasilkan fenomena perilaku dengan mencari pola-
pola konsisten dalam terjadinya fenomena tersebut.
Kuesioner Enam Belas Faktor Kepribadian (16 PF). Berdasarkan riset
faktorial mereka, Cattell dan rekan-rekan kerjanya telah mengembangkan sejumlah inventoru
kepribadian, dan yang paling dikenal adalah Sixtten Personality Factor Questionnaire, yang
sekarang sudah memasuki kelima (Catell, Cateel, & Catell, 1993; Conn & Rieke, 1994; Russell &
Karol, 1994)
“Model Lima-Faktor” dan Mengapa Model Ini Berhasil. Tulisan-tulisan
dewasa ini tentang penaksiran kepribadaian telah memberikan perhatian ynag kien besar pada
apa yang disebut Model Lima-Faktor (MLF), yang memrepresentasikan tingkat konsensus yang
tidak bisa dikalangan para peneliti kepribadian dari berbagai tradisi analisis faktor (Costa &
Wiidiget, 1994; Digman, 1990; McCrae & John, 1992; Wiggins & Pincus, 1992).

 Teori Kepribadian Dalam Pengembangan Tes


Teori-teori kepribadian biasanya muncul dalam lingkungan klinis. Jumlah
verifikasi eksperimental terhadap teori-teori itu, yang selanjutnya tunduk amatlah berbeda dari
satu sistem teoritis dengan sistem teoritis lainnya.
Millon Clinical Multiaxial Inventory. Meskipun mengikuti tradisi MMPI
dalam beberapa hal dan dirancang untuk maksud yang sama, Millon Clinical Multiaxial
Inventory-III (MCMI-III-Millon, Millon & Davis, 1994), yang awalnya diterbitkan pada tahun
1977, memperkenalkan inovasi metodologis yang berarti.
Pendekatan butir soal MCMI mengikuti pendekatan banyak segi (multifaet) yang menjadi ciri
khas dari praktik yang lazim belakangan ini dalam penyusunan dan validasi inventori
kepribadian.

Edwards Personal Preferene Schedule. Salah satu dari inventori-inventori


pertama yang dirancang untuk menaksir kekuatan kebutuhan semacam itu adalah Edwards
Personal Preference Schedule (EPPS-Edwards, 1959). Contoh-contoh meliputi kebutuhan akan
Prestasi (untuk melakukan yang baik dan yang sulit), Rasa Hormat (untuk menyesuaikan dengan
yang diharapkan seseorang), Eksbisi (untuk menjadi pusat perhatian), Dominasi (untuk
memengaruhi yang lain dan dihargai sebagai pemimpin), dan Pengasuhan (untuk membantu
orang dalam kesulitan).

 Sikap Mengikuti Tes dan Bias-Bias Respons


Berpura-pura dan Desirabilitas Sosial. Inventori-inventori laporan-diri
selalu memliki kemungkinan untuk disalah-interprestasikan secara sengaja. Meskipun ada
catatan pendahuluan pada arah yang berbeda, kebanykkan butir soal pada inventori semacam
ini memiliki satu jawaban yang dalam diterima sebagai sesuatau semacam ini, responden bisa
didorong untuk “berpura-pura baik” atau memilih jawaban-jawaban yang menciptakan kesan
baik, seperti ketika melamar pekerjaan atau dalam proses penerimaan pada pendidikan.

 Sifat, Keadaan, Pribadi, dan Situasi


Interaksi antara Pribadi dab Situasi. Interaksi anatara oarang dan situais
memberikan sumbangan yang sama seperti perbedaan-perbedaan individual memberikaan
sumbangan lebih pada variansi perilaku total daripada perbedaan situasional. Interaksi antara
orang dan situasi memberikan sumbangan yang sama seperti perbedaan-perbedaan individual,
atau bahkan agak lebih besar. Untuk mengidentifikasi sifat-sifat kepribadian yang luas, kita perlu
mengukur individu melintasi banyak situasi, dengan menggunakan dimensi-dimensi yang
dipersonalkan dan mengumpulkan hasil-hasilnya.
Orang. Dalam aspek ini, konsistensi eksesif menunjukan kekauan
maladaptif. Konsistensi antara dipengaruhi oleh cara individu mempersepsi dan mengategorikan
situasi. Dan pengelompokan situasi semacam itu, pada gilirannya, tergantung pada sasaran,
motif dan perasaan individu serta juga pada pengalaman sebelumnhya dengan situasi serupa.
Situasi. Situasi juga berbeda dalam kendala perilaku yang dihasilkan. Jaid,
kita bisa memprediksi dengan tingkat keyakinan tinggi bahwa pembaca akan tetap diam dalam
perpustakaan dan pengemudi motor akan berhenti ketika lampu metah.
Perbedaan lintas-budaya bisa dilihat sebagai contoh khusus dan lebih bagus daru variablilitas
situasional. Dengan demikian, perbedaan ini bisa menggapai kesempatan untuk mempelajari
konsistensi dan inkonsistensi dalam perilaku orang.
Sifat dan Situasi. Bahwa sifat dan situasi bukanlah cara-cara yang
bersesuaian dalam mengategorisasi perilaku diperlihatkan oleh inventosi laporan-diri untuk
menilai kecemasan tes (test anxiety). Dalam komteks ini, kecemasan (worry) didefinisikan
sebagai “kepribadian kognitif mengenai konsekuensi kegagalan” dan emosionalitas
(emosionality) sebagai reaksi-reaksi dari sistem saraf otonom yang membangkitkan stres
evaluatif”

Sifat dan Keadaan. Cara lain untuk mengonseptualisasikan domain


perilaku yang ditaksir oleh tes-tes kepribadian meliputi pendifensiasian ciri dari keadaan.
Diferensiasi ini paling jelas bisa dilihat contohnya dalam State-Trait Aniexy Inventory (STAI) yang
dikembangkan Spielberger dan rekan-rekan kerjannya (Spielberger, 1985; Spielberger et al.,
1983).

 Status Inventori Kepribadian Dewasa Ini


Penyusunan dan penggunaan inventori kepribadian mendapat kesulitan
khusu sepanjang dan di atas masalah-masalah umum yang ditemui dalam semua testing
psikologis.
BAB 14 - Mengukur Minat dan Sikap

Hakikat dan kekuatan dari minat dan sikap seseorang merupakan aspek
penting kepribadian. Karakteristik ini secara material memengaruhi prestasi pensisikan dan
pekerjaan, hubungan antarpribadi, kesenangan yang didapatkan seeorang dari aktivitas waktu
luang, dan fase-fase utama lainnya dari kehidupan sehari-hari.

 Inventori-Inventori Minat: Lingkungan Dewasa Ini


Sebagian besar dari inventori minat dirancang untuk menaksir minat
indiviidu dalam berbagai bidang pekerjaan. Sejumlah inventori juga memberikan analisan minat
dalam kerikulum pendidikan atau bidang studi, yang pada gilirannya terkait dengan keputusan
karier.
Salah satu perubahan berkaitan dengan meningkatnya penekanan pada
eksplorasi-diri. Semakin banyak instrimen memberikan kesempatan bagi individu untuk
memperlajari hasil-hasil tes terini dan menghubungkannya dengan informasi pekrjaan serta
data lain tentang kualifikasi dan pengalaman pribadi. Perubahan kedua dan yang terkait
memerhatikan sasaran pengukuran minat. Dewasa ini, ada lebih banyak penekanan pada
perluasan pilihan-pilihan karier yang terbuaka bagi individu.
Perubahan penting ketiga terkait dengan peluasan pilihan-pilihan karier ini. Perubahan ini
berkaiatan dengan keprihatinan tentang keadilan terhadap jenis kelamin (sex fairness) inventori
minat.

 The Strong Interrest Inventory


Asal Mula dan Perkembangan SII. Inventori minat ini, yang edisi
terakhirnya diterbitkan pada tahun1994, memiliki sejarah panjang. Pertama, butir-butir soal
berhubungan dengan rasa suka atau tidak suka reponden akan berbagai akan berbagai kegiatan,
objek atau jenis orang tertentu yang lazimnya ia temui dalam kehidupan sehari-hari. Kedua,
respons-respons ini secara empiris dikuni untuk berbagai pekerjaan. Dengan demikian, inventori
minat ini ada dinatara tes-tes pertama untuk menggunakan penguncian kriteria butir-butir soal,
yang selanjutnya diikuti dalam pengembangan inventori kepribadian, seperti MMPI dan CPI.
SII-From T317: Deskripsi Umum. Strong Interest Inventory dewasa ini
terdiri dari 317 butir soal yang dikelompokkan dalam delapan bagian. Dalam kelima bagian
pertmata, responden mencatat preferensinya dengan tanda S, TT, atau TS untuk
mengindikasikan “Suka”, “Tidak Tahu”, “Tidak Suka”. Butir-butir soal dalam lima bagian ini
termasuk kedalam kategori-kategori berikut: pekerjaan, mata pelajaran sekolah, aktivitas
(misalnya, membuat pidato, memperbaiki jam).
Skoring dan Interpretasi. Semua skor pada inventori Strong dilaporkan
sebagai skor-skor standar dengan rata-rata (mean) 50 serta SD 10.
Evaluasi Psikometris. Strong telah mengadakan program penelitian
berkesinambungan yang telah menghasilkan data ekstensif tentang relibilitas dan validitasnya.

 Inventori Minat: Tinjauan dan Penekanan


Di antara banyak inventori minat yang tersedia dewasa ini, empat
inventori telah dipilih untuk diibahas satu demi satu karena masing-masing menggamabarkan
segi yang patut diperhatikan dalam orentasi teoritis, metodologi, atau jenis populasi yang
untuknya inventori itu dirancang.
Jackson Vocational Interest Survey (JVIS). JVIS (Jackson, 1977) diseleksi
untuk mendapatkan perhatian khusus-pertama, karena JVIS merupakan contoh dari prosedur
penyusunan tes yang canggiih, dan kedua, karena dalam berbagai aspek, pendekatannya
berlawanan secara tajam dengan yang diikuti dalam SII.
Kuder Occupational Interest Survey dan Para Pendahulunya. Inventori
inventori minat yang dikembangkan oleh Frederic Kuder telah digunakan hampir sama lamanya
dengan swngan Strong. KOIS sekarang menyediakan skor pekerjaan dan 10 skor minat dasar
yang homogen dan luas, diberi lebwl Vocational Interest Estimates (VIE). VIE adalah skor-skor
persentil yang ditarik dari skala-skala pendek yang ekuivalen pada 10 skor bidang minat Kuder
Preference Record.
Career Assessment Inventory-The Vocational Verseion (CAI-VV). CAI
dirancang secara khusus untuk para pencari karier yang tidak memerlukan pendidikan
universitas selama empat tahun atau palatihan profesional lebih jauh. CAI berfokus pada
kekerjaan yang melibatkan keterampilan, pekerjaan teknis, dan pekerjaan jasa.
Self-Directed Search (SDS). Pendekatan lain terhadap penafsiran minat
minat pekerjaan digunakan oleh Self-Directed Search (SDS). Instrumen ini dikembangakang
oeleh Holland, yang model segi enamnya tentang tema-tema pekerjaan umum, telah menarik
perhatian luas dan dimasukkan dalam berbagai inventori yang ada sekarang (Holland,
1985/1992; Holland, Fritzsche & Powell, 1994; Holland & Gottfredson, 1976; Holland, Powell, &
Fritzsche, 1994).

 Sejumlah Kecenderungan yang Signifikan


Penegmbangan dan Penggunaan Inventori. Di antara perkembangan
yang paling jelas yang tampak dalam ukuran minat dewasa ini adalah perpaduan dua posisi
teoritis utama dalam psikologi pekerjaan dan penggunaan-lintas bank-bank data empiris untuk
maksud interpretif.
Model-Model Pekerjaan. Percaharian sifat, jumlah dan organisasi dari
minat-minat dasar, parelel dengan yang diadakan dalam rangka mengidentifikasi faktor-faktor
utama dalam bidangg kemampuan dan keprobadian. Dalam tiga contoh ini, kategori-kategori
yang tidak dicakup dari analisis data adalah fungsi dari variabel dan sempel spesifik yang
digunakan.

 Survei Pendapatan dan Skala Sikap


Sifat instrumen. Sikap sering didefinisikan sebagai tendensi untuk
bereaksi secara menyenangkan ataupun tidak menyenangkan terhadap sekelompok stimuli yang
ditunjukan, seperti kelompok etnis atau keompok nasional, adat-istiadat atau lembaga.
Jenis-Jenis Skala Sikap Utama. Dalam semua skala sifat, responden
mengindifikasi kesepakatan atau ketidaksepakatan mereka dengan rangkaian pernyatan tentang
objek sifat itu. Prosedur-prosedur khusus telah diranang untuk mencapai unidimensional atau
homogenitas butir-butir soal, kesamaan jarak anatara unit-unit skala, dan komparabilitas skor-
skor dari skala ke skala.
Catatan atas Variabel dan Ukuran Terkait dengan Jenis Kelamin.
Meskipun penelitian dan instrumen yang ditunjukan untuk menilsi fenomena ini telah
berkembang, banyak peneliti dalam bidang ini sepakat bahwa hal ini masih mengalami
kekacauan konseptual. Dari perspektif lebih luas tentang perbedaan individual dalam variabel-
variabel yang berhubungan dengan jenis kelamin.

 Lokus Kontrol (Locus of Control)


Konstruk yang dideskripsikan sebagai “lokus kontrol” pertama-tama
muncul dengan terpublikasinya sebuah monograf oleh Rotter 91966). Dalam publikasi ini, Rotter
mengemukakan skala yang ia kembangkan untuk menilai/menafsir harapan umun individu akan
kontrol penguatan internal versus eksternal atas penguatan (Skala I-E).
BAB 15 - Teknik-Teknik Proyektif

Ada suplai yang cukup besar dan bervariasi untuk teknik-teknik proyektif.
Teknik-teknik proyektif menyajikan kesenjangan yang menarik untuk diselidiki anatara penelitian
dan praktik. Ketika evaluasi sebagai instrumen psikometris, sebagian besar teknik proyektif tidak
tampil meyakinkan. Namun, popularitasnya dalam penggunaan klinis terus berlangsung. Sifat
dan implikasi inkonsistensi ini akan dibahas dalam bagian terakhir.

 Sifat Teknik-Teknik Proyektif


Ciri pembeda utama dari teknik proyektif adalah pada penilaian atas
tugas yang tak relatif tak terstruktur, yaitu tugas yang emungkinkan variasi yang hampir tak
terbatas dari respons-respons yang mungkin. Dalam rangka memungkinkan peemainan bebas
pada fantasi individu, hanya intruksi umum dan singkat yang diberikan.

 Teknik-Teknik Noda Tinta


Rorschach. Salah satu teknik proyektif populer adalah penggunaan noda
tinta Rorscach (Rorscach inkblot). Teknik ini, yang dikembangkan oleh psikiatris Swis Herman
Rorscach (1921/1942). Rorscach adalah yang pertama menerapkan noda tinda pada
penyelidikan diagnostik atas kepribadian secara keseuluran.
Sistem Komprehensif Exner. Pertama, Exner mengembangakan system
Roschach kemprehensif yang memadukan unsur-unsur yang dikumpulkan dari kelima
pendekatan utama. Exner dan rekan-rekan telah mengumpulkan banyak dara psikometris,
termasuk norma pada oarang dewasa, anak-anak, dan remaja serta berbagai sempel rujukan
psikiatris. Studi tentang relibilitas tes ulang selama beberapa interval waktu, berkisar dari
beberapa hari sampai tiga tahun, menunjukan stabilitas temporal yang cukup kuat bagi
kebnayakan variabel yang diskor.
Pendekatan-Pendekatan Alternatif. Pendektan ini lebih memusatkan
perhatian pada nterpresi ini ketimbang pada variabel struktural atau deteminan perseptual
respons, meskipun begitu, skala isi dan sistem penentuan skor yang ada tidak dianggap dapat
diandalkan sebagai instrumen psikometris untuk dapat digunakan pada diagnosis individual.
Teknik Noda Rinta Holtzam (Holtzman Inkblot Tecnique). Dengan
mengambil tes Rorscach sebagai model, Teknik Noda Tinta Holtzman dirancang sedemikian rupa
untuk memikirkan kekurangan teknik uatam dari instrumen yang lebih awal (Holtzman, 1961,
1986; Holtzman, Thorpe, Swartz, & Herron, 1961). Akan tetapi, perubahan-perubahan dalam
materi stimulus dan prosedur cukup ekstensif untk memandang teknik Holtzman sebagai tes
yang berbeda mengevaluasinya tanpa rujukan pada tes Roschach.

 Teknik-Teknik Gambar (Pictorial)


Thematic Apperception. Berbeda dari teknik-teknik noda tinta, Thematic
Apperception Test (TAT) memajukan stimuli yang jauh lebih terstruktur dan meminta respons
verbal yanag lebih kompleks dan terorganisasi secara bermakna. TAT telah digunakan secara
luas dalam penelitian kepribadian. Sayngnya, keanekaragaman administrasi dan prosedur
penentuan skor, bahkan materi-materi stimulus, yang terasosiasi dengan rubik TAT telah
berkembang ke penggunaan tes dan juga praktik klinis.
Adaptasi TAT dan Tes-Tes Terkait. Banyak adaptasi TAT dikembnagkan
untuk maksud-maksud tertentu. Adaptasi ini memperlihatkan berbagai tingkat kesamaan
dengan yang aslu. Tidak ada versi tega antara TAT yang dimodifikasikan dan tes-tes baru yang
didasarkan pada pendekatan umum sebagai TAT.
TEMAS adalah kata Spanyol untuk “tema” dan merupakan singkata yang
cerdik bagi “Tell-Me-A-Story”, yaitu intrumen yang dirancang secra khusus untuk penaksiran
atas ciri-ciri kognitif, afektif, dan kepribadian anak-anak dari usia 5 sampai 18 tahun. TEMAS
menggunakan dua rangkaian kartu stimulus paralel dengan warna lengkap, satu untuk anak-
anak minoritas etnik dan satu untuk anak-anak berkulit putih.
Rosenzweig Picture-Frustration Study. TAT dan teknik-teknik terkait yang
telah kita bahas menggunkan gambar untuk menstimulasi permainan fantasi ynag bebas serta
membangkitkan respons verbal yang rini. Sebaliknya Rosenzweig Picture-Frustration Study (P-F
Study), yang diuraikan dalam bagian ini, lebih dibatasi dalam cakupannya dan meminta respons-
respons yang lebih sederhana.

 Teknik-Teknik Verbal.
Sejumlah teknik verbal ini bisa diselnggarakan dalam bentuk lisan
ataupun tertulis, tetapi semuannya sesuai untuk penyelenggaraan kelompok. Teknik yang
mendahului banjirnya tes-tes proyektif lebih dari setengah abad adalah tes asosiasi kata.
Teknik proyeksi verbal lainnya, yaitu penyelesaian kalimat, telah digunakan secara luas dalam
praktik penelitian ataupun klinis. Dalam kaitannya dengan panjangrespons, struktur dan aspek-
aspek lainnya, tes-tes penyesuaian kalimat menempati bidang tengah anatara asosiasi kata dan
teknik-teknik tematis.

 Ingatan-Ingatan Autobiografis
Menganalisi ingatan-ingatan, terutama yang berasal dari kehiduoan
awal, dalam rangka memahami konflik yang muncul kembali atau yang tak dapat dilavak dalam
kehidupan di kemudian hari tertentu saja merupakan hal pokok dalam psikoterapi psikodinamis
sejak Zaman Freud.

 Teknik-Teknik Kinerja
Katerogi teknik proyeksi yang luas dan tak terbentuk dari banyak bentuk
ungkapan diri yang relatif bebas. Salah satu ciri khas dari semua teknik ini adalah teknik-teknik
ini telah digunakan sebagai prosedur terapeutik dan juga prosedur diagnostik. Metode-metode
yang paling sering digunakan dalam kategori adalah menggambar dan berbagai jenis teknik
bermain, termasuk penggunaan mainana secara dramatis.
Teknik-Teknik Menggambar. Mesikipun hampir tiap medium seni, teknik
dan jenis persoalan telah diteliti dalam usaha mencari isyarat diagnostik yang penting dalam
evaluasi kepribadian, perhatian khusus telah dipusatkan pada tindakan menggambar bentuk
manusia. Contoh awal yang terkenal adalah Machover Draw-a-Person Tes (D-A-P-Machover
1949).
Teknik Permainan dan Tes Mainan. Berbagi jenis permainan dan tes-tes
mainan yang melibatkan objek-objek, seperti wayang, boneka, dan miniatur, telah digunakan
secara luas dalam pengetesan proyektif. Berasal dari terapi mainan dengan anak-anak, materi-
materi ini selanjutnya dikembangkan untuk digunakan pada oengetesan diagnostik pada orang
dewasa ataupu anak-anak.
Rapor dan Kemampuan Aplikasi. Kebanyakan teknik proyektif mewakili
sarana yang efektif untuk “menairkan kebekuan” selama kontak awal antara ahli klinis dan klien.
Tugas ini umumnya secara intrinstik menarik dan kerap menghibur. Tugas tersebut cenderung
membelokkan perhatian individu dari diri sendiri dan dengan demikian mengurangi rasa malu
serta sikap defensif.
Berpura-pura. Pada umumnya, instrumen-instrumen proyeksi lebih
mampu menghadapi tindakan perpura-pura dibanding inventoru laporan diri. Maksud teknik
proyektif umumnya disembunyikan. Bahkan, jika individu memiliki pengalaman psikologis dan
mengenal sifat umum instrumen tertentu, seperti tes Rorschach atau TAT, masih sulit baginya
untuk menebak cara-cara rumit yang terhdapnya respons yang ia berikan akan diberi skor dan
diinterpretasikan.
Penguji dan Variabel-Variabel Situasional. Kebnayakan teknik proyektif
tidak distandarisasikan secara memadai dalam kaitan dengan penyelenggaraan dan penentuan
skor atau tidak digunakan dengan cara yang dibakukan dalam praktik klinis. Namun, bahkan
terbukti bahwa perbedaan-perbedaan yang halus dan pengistilahan intruksi-instruksi verbal dan
dalam hubungan penguji-peserta tes bisa cukup mengubah kinerja pada tes-tes ini.
Norma-Norma. Kelemahan lain yang menyolok mata yang lazim pada
instrumen proyektif berhungan dengan data normatif. Data seperti ini mungkin sangat kurang,
sangat tidak memadai, atau didasarkan pada populasi yang dideskripsikan seara takabur.
Reliabilitas. Dilihat dari segi sifat khusu prosedur-prosedur penentuan
skor dan tidak memadainya data normatif dalam pengetesan proyektif, reliabilitas pemberi skor
menjadi pertimbangan yang penting. Untuk teknik-teknik proyektif, ukuran ysng tepat
tergantung reliabilitas pemberi skor seharusnya tidak hanya mencakup penentuan skor
pendahuluan yang lebih objektif, melainkan juga mencankup tahap-tahap integratif dan
interpretif akhir.
Validitas. Bagi tes apa pun, pertanyaan paling mendasar adalah validitas.
Banyak studi validitas atas tes-tes proyektif berhadapan dengan validasi terkait kriteria secara
bersamaan (concurrent). Peneliti lain dalam validitas konkuren pada dasarnya telah
menggunakan teknik pencocokan dimana deskripsi kepribadian yang berasa dari catatan-
catatan tes dibandingkan dengan deskripsi tentang orang yang sama, yang diambil dari riwayat
kasus, wawancara psikiatris, atau catatan perilaku jangka panjang.
Hipotesis Proyektif. Asumsi tradisional yang menyangkut teknik-teknik
proyektif adalah bahwa respons-respons individu terhadap stimuli ambigu yang disajikan
kepadanya mencerminkan atribut kepribadian yang penting dan relatif bertahan. Meskipun jelas
bahwa respons tes proyektif bisa dan memang menerminkan gaya-gaya respons serta cita0cita
individu, badan penelitian yang besar dan sedang tumbuh menunjukan bahwa banyak faktor
lain bisa memengaruhi respons-respons itu.
Teknik-Teknik Proyeksi sebagai Instrumen Psikometrik. Banyak tektik
proyeksi jelas diinginkan bila dievaluasi sejlan dengan standar-standar tes. Hal ini jelas dari data
yang dirangkum dalam bagian terdahulu, dalam kaitan dengan standardisasi administrasi dan
prosedur penentuan skor, kecukupan norma, reliabilitas, dan validitas.
Teknik-Teknik Proyeksi sebagai Alat-Alat Klinis. Daripada dianggap dan
dievaluasi sebagai instrumen-instrumen psikometris, atau dianggap sebagai tes dalam
penegrtian yang ketat, kebanyakan instrumen proyektif lebih dipandang sebagai alat-alat klinis.
Dengan demikian, instrumen proyektif bisa berfungsi sebagai alat bantu wawancara kualitatif
suplementer di tangan ahli klinis yang terampil. Nilai teknik-teknik itu sebagai lat klinis memang
proporsional dengan keterangpialn ahli klinis dan karenanya tidak bisa ditaksir secara
independen dari pihak ahli klinis perorangan yang menggunakannya.
Bab 16 – Teknik-teknik Penaksiran Lainnya
Prosedur-prosedur yang dikembangkan dalam bab ini pada dasarnya adalah teknik-
teknik riset, meskipun sejumlah teknik juga bisa berfungsi sebagai alat penaksiran suplementer
dalam konsep terapan, seperti konseling, atau karya psikologi organisasi. Berbagai ragam
pendekatan telah diwakili oleh teknik-teknik khusus yang sudah disebutkan. Beberapa
diantaranya sulit untuk diklasifikasikan karena pendekatan itu menaksir konstruk yang
merentangi bidang kemampuan dan kepribadian. Tiga kategori utama mencakup ukuran gaya
kognitif dan tipe kepribadian; tes situasional; dan teknik-teknik yang dirancang untuk menilai
konsep diri dan konstruk personal. Untuk menambahkan perspektif lebih jauh pada survey ini,
perhatian diarahkan pada penggunaan teknik nontes pada penaksiran kepribadian, yang
meliputi observasi naturalistis, wawancara, pemeringkat, dan analisis atas data secara
kehidupan.

 Ukuran-ukuran Gaya dan Tipe


Sampel-sampel perilaku yang menghasilkan tes-tes psikologi merupakan
lintas seksi dari repertoire perilaku seseorang; karenanya, sampel-sampel tersebut mengandung
informasi tentang semua aspek orang itu sekaligus.
Ada sejumlah cara untuk menghadapi banyak faktor yang inheren dalam
perilaku manusia. Kita bisa, misalnya hanya memeriksa korelasi antara ukuran-ukuran ciri-ciri
seperti kecemasan dan kemampuan pemecahan masalah (misalnya, Zeidner, 1995). Kita juga
bisa menggunakan teknik multivariat, seperti analisis faktor dan penskalaan multidimensi, untuk
memisahkan komponen-komponen dalam satu set data perilaku (Jones & Sabers, 1992).
Gaya-gaya kognitif dan tipe keprbadian, yang dibahas dalam dua bagian
selanjutnya, juga memberikan contoh pendekatan ini. Pendekatan-pendekatan ini mewakili
usaha menangkap perbedaan kualitatif dalam pola atau konfigurasi perilaku manusia.
Gaya Kognitif. Gaya kognitif pada dasarnya merujuk pada cara yang khas
dan dipilih seseorang dalam memahami, mengingat, memikirkan, dan memecahkan masalah
(Messick et al., 1976). Salah satu sumber utama diferensiasi gaya-gaya kognitif bisa ditemukan
dalam bidang fungsi perseptual. Dari berbagai faktor yang diidentifikasi dalam analisis factorial
atas persepsi, salah satu faktor yang terbukti amat berguna dalam penelitian kepribadian adalah
fleksibilitas penutupan (Pemberton, 1952; Thurstone, 1944).
Tipe Kepribadian. Tipe kepribadian merujuk kepada konstruk-konstruk
yang telah digunakan untuk menjelaskan kesamaan dan perbedaan dalam modus pikiran,
persepsi, dan perilaku yang disukai di dalam dan melintas individu-individu. Pada dasarnya, tipe-
tipe kepribadian adalah kategori-kategori yang dirumuskan oleh konfigurasi dua atau lebih ciri
atau atribut tertentu. Dalam psikologi, sejumlah tipologi yang berbeda telah dirancang selama
bertahun-tahun. Kebanyakan system tipologis mencakup pembedaan-pembedaan di dalam satu
area tunggal seperti kedudukan atau temperamen.
Myers-Briggs Type Indicator. Klasifikasi tipologis ini merupakan
instrument yang digunakan secara luas untuk penaksiran kepribadian dalam orang-orang yang
normal. MBTI menggunakan dikotomi terkenal dari Jung atas sikap ekstraver dan introver (E
dan I), serta klasifikasinya tas cara-cara persepsi yang berlawanan (sensasi versus intuisi-S vs. N)
dan atas pendekatan yang berbeda terhadap penilaian (berpikir versus merasa-T vs. F).
Hasil-hasil MBTI, tidak seperti hasil dari interventori kepribadian lainnya,
terutama dimaksudkan untuk digunakan oleh responden dan disajikan dalam cara yang bersifat
tidak menilai. Dua dari premis paling dasar yang digunakan dalam menaksirkan hasil-hasil MBTI
adalah (a) semua tipe itu berharga dan niscaya serta memiliki kekuatan dan kelemahan
tertentu; (b) individu lebih termapil dalam fungsi, proses, dan sikap yang mereka sukai.

 Tes-tes Situasional
Tes ini merupakan tes yang menempatkan peserta tes dalam situasi yang
cukup mirip atau mensimulasikan situasi kriteria “hidup sesungguhnya”. Akan tetapi, dalam tes-
tes yang disebut disini, perilaku kriteria yang dijadikan sampel biasanya lebih bervariasi dan
rumit.
Tes Penyelidikan Pendidikan Karakter. Tes-tes ini dirancang , terutama
sebagai instrument riset untuk digunakan dalam proyek yang ekstensif sifat dan perkembangan
karakter pada anak. meskipun demikian, tekniknya bisa diadaptasikan pada maksud testing
lainnya da nada yang memang sudah diadaptasikan. Tes-tes diselenggarakan dalam bentuk
ujian di kelas secara regular, sebagai bagian dari pekerjaan rumah murid, dalam rangka kontes
atletik, atau sebgaai permainan-permainan.
Tes-tes CEI dalam cara yang baru dan asli untuk mengukur ciri-ciri
perilaku seperti, kejujuran, kendali diri, dan altruism. Jumlah paling besar menyangkut kejujuran
dan mencakup situasi di mana anak-anak diyakinkan bahwa doberi instruksi untuk membuat
tanda dalam 10 lingkaran kecil yang diletakkan secara tidak teratur dengan mata tertutup.
Kebanyakan te CEI terbukti memiliki daya diskriminatif yang baik, yang menghasilkan perbedaan
individu dengan rentang luas dalam skor-skor.
Tes Situasional dalam Pusat Penaksiran Penaksiran dan Teknik-teknik
Memainkan Peran. Tes situasional merupakan bagian utama dari program pusat penaksiran
yang diperkenalkan oleh United States Office of Strategic Services (OSS) selama Perang Dunia II.
Tes ini mwakili prosedur utama dalam seleksi personel militer untuk tugas kritis di luar negeri
(Murray & MacKinnon, 1946; OSS Assessment Staff, 1948). Satu jenis tes yang dikembangkan
oleh OSS adalah stress situasional, yang dirancang untuk mengambil sampel perilaku individu di
bawah kondisi penuh stress, frustasi, atau terganggu secara emosional. Jenis tes situasional
lainnya adalah menggunakan kelompok tanpa pimpinan sebagai alat untuk menguji sifat-sifat,
seperti kerja tim, panjangnya akal, inisiatif, dan kepemimpinan.
Sejumlah tes situasional menggunakan permainan peran atau improvisasi
untuk menumbuhkan perilaku minat. Meskipun permainan peran adalah salah satu teknik yang
digunakan dalam program penaksiran OSS, teknik ini memiliki asal mula yang lebih dini dan
penerapan yang lebih luas.
 Konsep Diri dan Konstruktur
Deskripsi diri individu dengan begitu menjadi kepentingan utama dalam
dirinya sendiri lebih daripada dipandang sebagai substitusi terbaik kedua untuk observasi
perilaku lainnya. Juga ada minat pada lingkup penerimaan diri yang ditunjukkan oleh individu.
Tes Menlengkapi Kalimat Universitas Washington. Interpretasi respon-respo
inventori dalam kaitan dengan konseptualisasidiri membentuk dasar pendekatan teoritis pada
perkembangan kepribadian yang dirumuskan oleh Loevinger (1966a, 1966b, 1976, 1987, 1993;
Loevinger &Ossorio, 1958). Dengan mengumpulkan banyak temuan yang terpisah dari
penelitian sendiri dan penelitian orang lain, Loevinger mengemukakan ciri kepribadian yang ia
rumusan sebagai kemampuan untuk mengonseptualisasikan diri sendiri atau untuk “mengambil
jarak” dari diri sendiri dan impuls-mpulsnya. Berdasarkan data dari banyak sumber, Loevinger
mengemukakan bahwa kemampuan untuk membentuk konsep diri meningkat bersama dengan
usia, intelegensi, pendidikan, dan tingkat sosioekonomik. Bersamaan dengan meningkatnya
kematangan, individu maju melampaui konsep stereotip ke konsep diri yang teridentifikasikan
dan realistik. Pada titik ini, individu sepenuhnya sadar akan keunikan dirinya dan menerima diri
apa adanya.
Ciri konseptualisasi diri inilah, yang dinamakan sebagai perkembangan ego atau
tingkat ego, yang hendak diukur oleh Loevinger dan rekan-rekan dalam Washington University
Sentence Competition Test (WUSCT-Loevinger, 1985, 1987; Loevinger & Wessler, 1970;
Loevinger, Wessler, & Redmore, 1970). Kerangka teoritis pengarang mendalilkan Sembilan
tingkat perkembangan ego sebagai berikut: Prasosial, Impulsif, Perlindungan-Diri, Konformis,
Sadar-Diri, Sikap hati-hati, Individualistik, Autonom, dan Terpadu.
Inventori Rasa Harga Diri dan Ukuran-ukuran Terkait. Tujuan utama dari
penelitian ini berkaitan dengan efek dari evaluasi diri individu atas kinerjanya. Secara khusus
ada kesepakatan yang luas bahwa harga diri adalah determinan yang menentukan dari variable-
varabel yang secara psikologis penting, seperti kemampuan mengatasi masalah dan perasaan
sejahtera. Pengukuran atas harga diri untuk penelitan dan maksud-maksud terapan secara
trandisional maju berdasarkan asumsi-asumsi ini.
Daftar Cek Ajektif. Beberapa teknik yang berorientasi luas telah dikembangkan
secara khusus untuk melakukan penaksiran atas konsep diri. Instrumen yang bisa diterapkan
secara luas dan dewasa ini tersediasecara komersial, yaitu Adjective Check Listn (ACL) atau
daftar cek ajektif. Sebagai instrument penelitian, ACL telah diterapkan pada berbagai maslaah,
dari bidang-bidang, seperti psikopatologi, pilihan pekerjaan, kreativitas, perilaku politis dan
ekonomis, bahkan reaksi pasien terhadap orthodontia dan lensa kotak. ACL juga telah
digunakan dalam memeringkat tokoh-tokoh historis dari biografi dan karya mereka yang
diterbitkan (Welsh, 1975a) dan dalam menentukan ciri objek-objek tak berjiwa, seperti kota dan
mobil.
Sortasi Q. teknik ini awalnya dikembangkan oleh Stephenson (1953) untuk
mengimplementasikan suatu pendekatan pada penelitian yang dikenal sebagai metodologi Q
(lihat, misalnya, Kerlinger, 1986, Bab 32; McKeown & Thomas, 1988). Sortasi-sortasi Q telah
digunakan untuk mempelajari berbagai masalah psikologis. Dalam penelitian intensif atas
kepribadian individu, responden telah diminta untuk memilah-milah kembali perangkat soal
yang sama dalam kerangka rujukan yang berbeda.
Semantik Diferensial. Pertama kali dikembalikan oleh Osgood dan rekan-
rekannya (Osgood, Suci, & Tannenbaum, 1957) sebagai alat penelitian tentang psikologi makna,
meskipun kemungkinan penggunakan untuk penaksiran kepribadian langsung diterima.
Semantik Diferensial mewakili suatu prosedur standard an kuantitatif untuk konotasi konsep apa
pun untuk individu.
Respon-respons pada Diferensial Semantik bisa dianalisis dengan beberapa cara.
Untuk penanganan kuantitatif, peringkat-peringkat pada tiap skala bisa diberi angka numeric
dari 1 sampai 7 atau dari -3 sampai +3.
Role Construct Repertory Test. Pengembangan Rep Test ini amat dekat terkait
dengan teori kepribadian Kelly. Dasar pemikiran dalam teori ini adalah konsep-konsep atau
konstruk-konstruk yang digunakan individu untuk memahami objek atau peristiwa
memengaruhi perilakunya. dalam psikoterapi, sering perlu membangun konstruk-konstruk baru
dan menyingkirkan konstruk-konstruk lama untuk bisa membuat kemajuan.
Rep Test dirancang untuk membantu ahli klinis mengidentifikasi sejumlah
konstruk penting tentang orang dari kliennya. Rep Test menghasilkan data yang bisa disusun
dalam sebuah matriks atau kisi-kisi dan hal ini memungkinkan penaksiran atas hubungan antara
konstruk-konstruk. Rep Test dalam berbagai modifikasi, telah digunakan dalam banyak
penelitian tentang maslah-maslaah yang terkait dengan, antara lain, teori kepribadian, kognisi
social, pendidikan, dan komunikasi, serta dengan psikoterapi dan penaksiran.
Lingkungan yang Dipersepsi dan Iklim Sosial. Skala iklim social dapat diterapkan
pada berbagai konteks: program penanganan psikiatris di rumah sakit dan di masyarakat,
fasilitas penampungan dan lembaga permasyarakatan, lingkungan militer, tempat tinggal
mahasiswa, kelas-kelas sekolah menengah, lingkungan kerja dan keluarga; selain itu juga ada
skala lingkungan kelompok yang lebih umum untuk kelompok yang berorientasi kerja, social,
dan saling mendukung.

 Laporan-laporan Pengamat
Pengamatan langsung atas perilaku memainkan peranan penting dalam
penaksiran kepribadian, entah dalam klinik, pusat konseling, ruang kelas, kantor tenaga kerja,
entah konteks lainnya yang memerlukan evaluasi individual. Tetapi, terhadap keuntungan yang
jelas dari prosedur standar semacam itu, kita harus menyeimbangkan keuntungan pengambilan
sampel yang luas atas perilaku yang tersedia melalui teknik observasi dalam lingkungan alamiah.
Observasi Naturalistik. Teknik-teknik observasi ini telah terbukti berguna di
ruang kelas, terutama jika pengamat adalah guru atau orang lain yang sudah cocok dengan
lingkungan sekolah yang normal. Penerapan utama teknik-teknik penaksiran semacam ini
ditemukan dalam progam modifikasi perilaku yang diadakan diadakan di sekolah, rumah, pusat
perawatan anak, klinik, rumah sakit, atau konteks, lainnya. Bisa dicatat juga bahwa observasi
naturalistik memilik banyak persamaan dengan tes situasional yang dibahas sebelumnya. keuda
alat ini berbeda terutama dalam dua hal: pada observasi naturalistic, tidak ada kendali atas
situasi stimulus dan setidaknya-tidaknya dalam kebanyakan metode observasi suatu sampel
perilaku yang lebih luas diamati.

Wawancara. Wawancara memenuhi berbagai tujuan dalam psikologi klinis,


konseling psikologi personalia, dan pendidikan. Dalam hal bentuk, wawancara bisa berbeda dari
yang berbentuk amat terstruktur samai wawancara berpola atau tertuntun yang mencakup
bidang-bidang yang telah ditentukan sebelumnya, dan juga sampai wawancara yang tidak
berarah serta mendalam di mana pewawancara semata-mata menggantungkan latarnya dan
mendorong orang yang diwawancarai untuk bicara sebebas mungkin.
Peringkat-peringkat. Meskipun peringkat-peringkat bisa diperoleh dalam banyak
konteks dan untuk berbagai maksud, bagian ini berurusan dengan penggunaan peringkat-
peringkat sebagai evaluasi individu oleh pemeringkat atas dasar observasi yang kumulatif dan
tak terkontrol atas hidup sehari-hari.
Salah satu yang memengaruhi validitas pemeringkat adalah lingkup dari kontak
relevan memeringkat dengan orang yang harus diperingkat (Freeberg, 1969; Landy & Farr, 1980;
Paulhus & Bruce, 1992;Wiggins & Pincus, 1992, hlm. 493-496). Contoh kesalahan-kesalahan dari
pemeringkat yaitu efek halo, kesalahan tendensi sentral, kesalahan kemurahan hati.
Teknik-teknik Nominasi. Prosedur penilaian yang amat berguna dalam
memperoleh penaksiran kelompok sebaya adalah teknik nominasi. Teknik yang pada awalnya
dikembangkan dalam sosiometri (J. L. Moreno, 1953) untuk meneliti struktur kelompok, bisa
digunakan dalam kelompok orang apa pun yang sudah cukup lama bersama-sama untuk
mengenal satu sama lain, seperti dalam kelas, pabrik, klub, atau unit militer.
Daftar Periksa dan Sortasi-sortasi Q. Adjective Check List (ACL) telah digunakan
secara luas untuk memperoleh evaluasi pengamat dalam program penelitian IPAR (Gough &
Heilbrun, 1983). Sortasi Q juga telah digunakan secara luas untuk evaluasi pengamat. Block
(1961/1978) awalnya mengembangkan California Q-Sort Deck untuk menyediakan bahasa yang
standar bagi evaluasi kepribadian komprehensif oleh pengamat yang terlatih secara
professional.

 Biodata
Buku harian dan autobiografis juga merupakan sumber informasi yang kaya bagi
pengarang psikobiografi dan orang-orang lain yang tertarik dalam studi atas kehidupan individu.
Secara historis, butir soal skala biografis telah diseleksi dan di bobot menurut pengujian kriteria
sebagaimana dalam penyusunan inventori, misalnya MMPI dan Strong. Ketika prosedur-
prosedur ini diikuti, inventori biodata terbukti merupakan alat prediksi yang baik secara
konsisten atas kinerja pada berbagai konteks.
Disamping pendekatan tradisional pada pengembangan inventori, metode baru
untuk memunculkan, menyeleksi, dan mengunci butir-butir soal biodata sedang di coba dalam
upaya untuk memuat instrument yang dihasilkan lebih bisa digeneralisasikan dan bisa
dipindahkan.

Bab 17 – Konteks Utama Penggunaan Tes Dewasa Ini


 Tes Pendidikan
Tes-tes ini mencakup instrument-instrumen yang dirancang untuk prediksi dan
klasifikasi dalam lingkup pendidikan tertentu dan banyak variasi dari tes-tes prestasi pendidikan.
Tes-tes Prestasi: Hakikat dan Penggunaannya. Tes-tes prestasi dirancang untuk
mengukur efek dari program instruksi tertentu atau pendidikan tertentu. Dari satu sudut
pandang, perbedaan antara pengetesan prestasi dan pengetesan kemampuan merupakan
perbedaan dalam hal derajat uniformitas pengalaman antesden yang relevan. Jadi, tes-tes
prestasi mengukur efek-efek dari berbagai perangkat pengalaman secara relative standar,
sedangkan tes bakat mencerminkan pengaruh kumulatif berbagai pengalaman dalam kehidupan
sehari-hari.
Pembedaan kedua antara tes kemampuan dan tes prestasi berhubungan dengan
penggunaannya masing-masing. Tes-tes bakat berfungsi untuk memprediksi kinerja sesudahnya.
Di pihak lain, tes-tes prestasi umumnya menampilkan evaluasi terminal atas status individu
akhir pelatihan. Penekanan dalam tes-tes ini adalah pada apa yang bisa dilakukan individu pada
waktu itu. Dalam upaya untuk menghindari arti yang berlebihan, yang kerap diasosiasikan
dengan istilah “bakat” (aptitude) dan “prestasi” , istilah yang lebih netral, yaitu “kemampuan”
(ability) sedang diajukan untuk menunjuk pada ukuran-ukuran dari perilaku kognitif.
Melabelkan beberapa instrument seperti “tes best” dan yang lain seperti “tes
prestasi” telah menimbulkan penyalahgunaan hasil-hasil tes tertentu. Sesungguhnya,
perbedaan-perbedaan intraindividu dalam skor-skor tes mencerminkan fakta bahwa taka da dua
tes apa pun yang berkorelasi secara sempurna satu dengan yang lain. Alasan-alasan terjadinya
keslahan-kesalahan prediksi dalam kasus individu , antara lain tidak dapat diandalkannya
instrument-instrumen pengukuran, perbedaan-perbedaan dalam cakupan isi, efek-efek yang
bervariasi dari faktor-faktor sikap dan motivasi pada dua ukuran, dan dampak dari pengalaman-
pengalaman perantara seperti pengajaran-pengajaran yang bersifat memperbaiki atau sakit
yang panjang (R. L. Thorndike, 1963).
Pada akhirnya, tes prestasi bisa digunakan sebagai alat bantu dalam evaluasi dan
perbaikan pengajaran dan dalam perumusan tujuan pendidikan. Tes prestasi bisa memberikan
informasi tentang kecukupan yang dengannya isi esensial dan keterampilan sungguh-sungguh
diajarkan.
Konstruksi Lawan Pilihan. Para kritikus format multipilihan berpendapat bahwa
multipilihan itu meningkatkan memorisasi hafalan dan pembelajaran fakta-fakta yang terisolasi
dan bukan pengembangan keterampilan pemecahan masalah dan pemahaman konseptual.
Disamping itu, banyak orang tidak untuk mendapatkan informasi yang memadai dalam
kemantapan politis dan pendidikan menyamakan butir-butir soal multipilihan dengan
pengetesan baku dan meremehkan kedua unsur metode penaksiraan ini sekaligus. Para
penasihat pembaruan pendidikan percaya bahwa suatu pembaruan besar-besaran diperlukan
dalam sasaran kurikuler dan metode-metode pengajaran, seperti halnya juga dalam alat-alat
penaksiran, dan mereka percaya semua bidang ini terkait erat satu sama lain.
Metode yang dikenal sebagai penilaian portofolio menyediakan berbagai
alternative lainnya. Metode penaksiran portofolio menawarkan fleksibilitas yang tinggi dan bisa
diterapkan secara kurang lebih formal dan dengan berbagai tingkat kolaborasi antara siswa dan
guru. Pembaca bisa memahami dari tinjauan yang singkat ini bahwa ada banyak perhatian
diberikan terhadap sarana pelaksanaan evaluasi proses belajar dan karya siswa.
Penelitian Lu dan Suen (1995) menunjukan bahwa penaksiran berdasarkan
kinerja cenderung menyenangkan siswa-siswa yang tidak tergantung pada lapangan dari pada
siswa-siswa yang tergantung pada lapangan. Dalam kaitan dengan isu validitas, basis penelitian
masih agak terbatas, setidak-tidaknya untuk tipe tugas-tugas respon tersusun yang paling
kurang restriktif dan paling inovatif. Salah satu pertanyaan awal yang paling penting adalah
sejauh mana butir-butir respon terseleksi dan butir-butir respons tersusun mengukur sifat-sifat
atau keterampilan-keterampilan yang ekuivalen.

 Tipe-tipe Tes Pendidikan


Tinjauan ini terpusat pada tipe-tipe instrument yang digunakan secara
tradisional dalam konteks pendidikan bersama dengan inovasi-inovasi yang sedang berlangsung
dalam tiap tipe dan bukan terpusat pada deskripsi terperinci atas tes-tes individual.
Kumpulan Prestasi Umum. Tipe tes ini bisa digunakan dari tingkat pertama
sampai tingkat dewasa, meskipun penerapan utamanya terutama di sekolah dasar. Keuntungan
dari kumpulan tes semacam ini, bila berhadapan dengan tes-tes prestasi yang di susun secara
indepeden, adalah bahwa kumpulan-kumpulan tes ini memungkinkan perbandingan horizontal
atau vertical atau keduanya. Ciri yang penting dari kumpulan-kumpulan prestasi adalah bahwa
kumpulan-kumpulan tes itu secara serentak dinormalkan dengan tes-tes inteligensi akademik
atau kemampuan belajar.
Tes Kompetensi Minimum dalam Keterampilan Dasar. Dalam dua dasawarsa
terakhir terlihat suatu keprihatinan yang memuncak tentang tingkat kompetensi rendah dari
lulusan-lulusan sekolah menengah dalam hal membaca, menulis, dan keterampilan aritmatika.
Kekhawatiran ini menghasilkan permintaan yang makin banyak akan tes-tes kompetensi dalam
keterampilan-keterampilan dasar sebagai sarana memberikan sertifikasi pencapaian kompetensi
minimum dan basis untuk menganugrahkan ijazah sekolah menengah.
Pada tahun-tahun belakangan ini, fokus minat dalam penentuan penguasaan atas
keterampilan-keterampilan dasar telah sampai pada populasi orang dewasa. Efek kumulatif dari
tingkat dropout sekolah pada umumnya dan tingkatkompetensi yang rendah diantara lulusan-
lulusan sekolah menengah, seperti halnya juga kenaikan dalam jumlah imigran yang tidak
berbahasa inggris, telah menghasilkan keprihatinan tentang tingkat kemampuan bersaing
tenaga kerja Amerika Serikat dalam pasaran dunia. Temuan-temuan dari National Adult Literacy
Survey, menunjukan bahwa hampir setengah dari populasi Amerika Serikat ada pada dua tingkat
melek huruf yang paling rendah dari lima tingkat yang mungkin.
Tes-tes dalam Kelas Buatan Guru. Pengembangan tes-tes di dalam kelas dapat
dibagi ke dalam tiga langkah utama: (1) perencanaan tes, (2) penulisan tes, dan (3) analisis butir
soal. Agar tidak jatuh dalam ketidakseimbangan yang tak disengaja dari cakupan butir soal ini,
spesifikasites seharusnya dihasilkan sebelum butir-butir soal mana pun dipersiapkan. Penyusun
tes seharusnya juga memutuskan bentuk soal yang paling tepat untuk materi itu.
Tes untuk Tingkat Universitas. Salah satu yang menonjol adalah Scholastic
Assessment Tests (SAT) Program of the Collage Board, yang dewasa ini terdiri dari dua unsur
yakni SAT I: Reasoning Test (Tes Penalaran), yang telah menggantikan bagian-bagian Scholastic
Aptitude Test’s Verbal and Mathematical, dan SAT II: Subject Test (Tes-tes Subjek), yang telah
menggantikan SAT Achievement Tests terdahulu. SAT I, terutama terdiri dari pertanyaan-
pertanyaan pilihan ganda yang mengukur kemampuan verbal dan matematis. Tes ini
dimaksudkan untuk digunakan sebagai suplemen pada nilai sekolah menengah dan informasi
lainnya dalam penaksiran atas kesiapan siswa untuk melakukan kerja tingkat universitas.
Penerimaan Sekolah Pascasarjana. Praktik untuk menguji para pelamar untuk
diterima atau tidak juga melanda sekolah pascasarjana dan sekolah professional. Kebanyakan
tes yang dirancang untuk maksud ini mewakili tes-tes inteligensi umum dan tes prestasi. Hasil-
hasil tesnya digunakan oleh universitas sebagai bantuan untuk memutuskan penerimaan dan
penempatan serta dalam menyeleksi penerima tugas belajar, beasiswa, dan penugasan-
penugasan khusus.
Tes Diagnostik dan Prognostik. Tes ini dirancang untuk menganalisis kekuatan
dan kelemahan tertentu dari seorang pribadi dalam domain materi subjek tertentu dan untuk
menunjukan sebab-sebab. Kebanyakan dari kelompok tes-tes diagnostic yang diterbitkan
berhubungan dengan keterampilan membaca, matematika, bahasa, dan menawarkan informasi
baik yang normative maupun yang dirujukan pada isi.
Dalam kaitan dengan pengguna semua tes diagnostic, satu hal perlu mendapat
penekanan khusus. Diagnosis ketidakmampuan belajar dan program pengajaran pemulihan
selanjutnya adalaah fungsi-fungsi yang sepantasnya dari seorang spesialis yang diberi latihan
tertentu. Jenis-jenis tes tertentu yang dirancang untuk digunakan dalam konteks pendidikan
pada hakikatnya adalah instrument-instrumen prognostik. Sebagai instrument prognostik, tes-
tes ini kerapmirip dengan tes-tes prestasi dalam isi, karena apa yang hendak diprediksi biasanya
adalah kinerja dalam masa studi tertentu.
Penaksiran dalam Pendidikan Awal Masa Kanak-kanak. Kesiapan sekolah pada
dasarnya merujuk pada pencapaian keterampilan-keterampilan dasar, pengetahuan, sikap,
motivasi, dan ciri-ciri perilaku lainnya yang memungkinkan si pembelajar untuk mengambil
manfaat secara maksimal dari pengajaran sekolah. Persyaratan-persyaratan ini adalah apa yang
oleh Hunt dan Kirk (1974) disebut sebagai “keterampilan entry” yang diperlukan anak untuk
menghadapi situasi belajar mengajar yang ditemui pada tingkat/kelas pertama.
Tes-tes kesiapan umumnya diselenggarakan pada waktu masuk sekolah.
Sejumlah perhatian juga diberikan pada persyaratan-persyaratan berpikir numeric dan pada
control sensorimotorik yang diperlukan dalam belajar menulis. Diantara fungsi-fungsi tertentu
yang sering di cakup adalah kemampuan melakukan pembedaan visual dan pendengaran,
kendali motoric, pemahaman lewat pendengaran, kosakata, konsep-konsep kuantitatif, dan
evaluasi umum.
Menyimpulkan Komentar. Banyak pengamat yang setuju bahwa ada kebutuhan
untuk mengintegrasikan penaksiran dan instruksi lebih lanjut dan dengan cara sedemikian rupa
sehingga aspek-aspek dari usaha pendidikan saling melengkapi secara lebih baik demi
keuntungan pembelajar.

 Tes Pekerjaan
Kumpulan tes multibakat dan tes-tes kemampuan khusus kerap dikembangkan
untuk maksud-maksud pekerjaan sebagaimana telah dipaparkan dalam kaitan dengan tes-tes
situasional. Aspek-aspek utama dari penggunaan industrial/organisasional tes diuji secara
intensif dalam berbagai bab dari buku pegangan yang disunting oleh Dunnette dan Hough
(1990-1992). Aplikasi utama lain dari pengetesan pekerjaan juga dicakup dalam keuda versi
Testing Standards adalah dalam pemberian lisensi dan sertifikasi orang yang dianggap
berkualifikasi untuk melakukan praktik dalam sejumlah bidang dan profesi.

 Validasi Tes Pekerjaan


Tes yang tidak valid atau tes yang memasukkan unsur-unsur yang tak terkait
dengan pekerjaan yang dimaksud bisa secraa tidak fair menyingkirkan anggota-anggota
kelompok minoritas, yang sebenarnya bisa menjalankan pekerjaan dengan memuaskan.
Prosedur-prosedur Global untuk Penaksiran Kinerja. Penempatan yang bersifat
percobaan paling dekat menjadi replica yang benar dari suatu pekerjaan. Sampel-sampel
pekerjaan mewakili usaha lain untuk mendekati kinerja pekerjaan yang sesungguhnya.
Sejumlah tes sampel pekerjaan disesuaikan dengan keperluan agar cocok untuk pekerja-pekerja
tertentu. Representative tidaknya sampel pekerjaan dan dekatnya tugas yang meniru kondisi-
kondisi kerja adalah faktor-faktor yang esensial.
Analisis Pekerjaan dan Metode Unsur Pekerjaan. Analisis pekerjaan yang efektif
seharusnya juga berkonsentrasi pada aspek-aspek kinerja yang secara tajam membedakan
pekerja yang baik dari pekerja yang buruk. Metode analisis pekerja bisa membantu
memperlancar penggunaan efektif atas te-tes pada berbaagai pekerjaan yang secara superfisial
berbeda. Analisis pekerjaan adalah salah satu metode yang paling tua dan paling layak
dijalankan yang dikembangkan dalam psikologi industri.
Prediksi Kinerja Pekerjaan. Konsep validasi sintetik didasarkan pada premis
metode unsur pekerjaan bahwa mungkin mengidentifikasi keterampilan, pengetahuan, dan
persyaratan-persyaratan kinerja lainnya yang bersifat umum bagi banyak pekerjaan yang
berbeda. Pada dasarnya teknik ini mencakup tiga langkah: (1) analisis pekerjaan yang rinci untuk
mengidentifikasi unsur-unsur pekerjaan dan bobot relative mereka dalam suatu pekerjaan
tertentu; (2) analisis dan studi empiris masing-masing tes untuk menentukanlingkup sejauh
mana tes itu mengukur kefasihan dalam melakukan masing-masing unsur pekerjaan ini; (3)
menemukan validitas masing-masing tes untuk pekerjaan tertentu secara sintetis dari bobot
unsur-unsur ini dalam pekerjaan dan tes.
Kriteria Kinerja Pekerjaan. Beberapa tahun belakangan ini, beberapa peneliti
telah bekerja untuk memperoleh konseptual yang lebih jernih tentang kinerja pekerja dan
pemahaman yang lebih baik tentang determinan-determinannya. Satu model baru kinerja
pekerjaan yang menjanjikan untuk memainkan peranan heuristic penting adalah teori faktor
majemuk yang telah dikembangkan oleh John P. Campbell dan rekan kerjanya bersama dengan
U.S. Army Selection and Classification Project.

 Penggunaan Tes dalam Pekerjaan


Kebanyakan keputusan-keputasan personalia berdasarkan tes menggunakan
perpaduan satu atau lebih ukuran dan juga sejumlah alat penaksiran lain misalnya wawancara
atau data-data latar belakang.
Peran Inteligensi Akademik. “Inteligensi” adalah istilah yang luas, dengan banyak
definisi. Telah diketahui bahwa kinerja pada tes-tes inteligensi akademik memiliki korelasi yang
substansial dengan jumlah pendidikan. Maka, akan kelihatan bahwa persyaratan pendidikan
bisa ditetepkan untuk mencakup kualifikasi pelamar dalam kelompok keterampilan kognitif dan
pengetahuan yang penting ini. Minat dalam manfaat potensial tes-tes inteligensi akademik
umum untuk seleksi personalia telah dibangkitkan lagi oleh penelitian tentang generalisasi
validitas.
Kumpulan Tes Bakat untuk Program Khusus. Penggunaan skor GATB bisa
dilakukan yang berbeda. Yang pertama menggunakan skor potong majemuk (multiple cut of)
pada sikap-sikap paling signifikan yang diperlukan untuk kelompok-kelompok pekerjaan yang
relative homogen. Satu mekanisme yang digunakan dalam pendekatan ini adalah struktur
Occupational Aptitude Pattern (OAP) yang dikembangkan pada tahun 1970-an.
Tes Bakat Khusus. Istilah bakat khusus berasal dari suatu saat ketika penekanan
utama dalam pengetesan ditempatkan pada inteligensi umum. Dengan demikian, bakat
mekanik, music, dan bakat khusus lainnya dipandang sebagai sesuatu yang melengkapi “IQ”
dalam deskripsinya tentang individu. Tes-tes bakat/kemampuan mekanis mencakup berbagai
fungsi. Faktor-faktor psikomotorik masuk dalam sejumlah tes dalam kategori ini, entah karena
manipulasi bahan yang cepat dibutuhkan dalam kinerja tes entah karena sub-subtes khusus
dirancang untuk mengukur ketangkasan motorik dumasukkan dalam tes yang menggunakan
kertas dan pensil. Tes-tes yang dirancang untuk mengukur bakat/kemampuan klerikal memiliki
ciri-ciri penekanan umum pada kecepatan dan ketepatan perseptual.

 Pengetesan Kepribadian di Tempat Kerja


Dalam tahun 1980-an, Bernardin dan Bownas (1985) memehartikan bahwa
penggunaan teknik-teknik evaluasi kepribadian meliputi metode-metode tidak ilmiah seperti
analisis tulisan tangan sedang menjamur dalam dunia industri. Meta-analisis telah digunakan,
terutama untuk menyelidiki validitas dan utilitas konstruk-konstruk kepribadian pada berbagai
tempat. Analisis jalan dan teknik modeling persamaan structural digunakan untuk mempelajari
antarhubungan antara alat-alat prediksi dan untuk menyelidiki atribut serta kondisi yang
menyebabkan pembedaan tingkat kinerja pekerjaan beda.
Tes Intergritas. Studi penelitian memperkirakan bahwa rata-rata validitas
operasional dari tes integritas untuk memprediksi peringkat penyedia kinerja pekerja adalah
0,14 dan mengindikasikan bahwa tes-tes ini juga bisa bernilai dalam memprediksi perilaku yang
mengganggu pada pekerjaan.
Kepemimpinan. Kepemimpinan adalah salah satu dari kualitas yang paling dicari
dalam tempat kerja karena kepemimpinan mencakup kemampuan untuk memengaruhi orang
lain agar bekerja menuju tujuan bersama.

Instrumen-instrumen. Inventori-inventori yang bertujuan mendeteksi


psikopatologi, misalnya MMPI, masih digunakan untuk tujuan penyeleksian pada sejumlah
pekerjaan yang sensitive, namun keprihatinan sekitar masalah pelanggaran hak pribadi dan
penyalahgunaan hasil-hasil tes telah mendorong penggunaan makin luas dari ukuran-ukuran
yang dirancang untuk menaksir kepribadian dalam subjek yang normal.
Kesimpulan dan Komentar. Perkembangan-perkembangan teknologi dewasa ini
mengubah sifat pekerjaan sedemikian rupa sehingga jauh melebihi perubahan-perubahan yang
telah dihasilkan oleh revolusi industri. Laju perubahan yang cepat memberikan tantangan yang
luar biasa bagi para psikolog personalia, seentara kemajuan metodologis yang dimungkinkan
oleh teknologi baru menawarkan kesempatan yang luar biasa.

 Penggunaan Tes Dalam Psikologi Klinis dan Konseling


Para psikolog klinis dan konseling menggunakan berbagai macam tes, termasuk
kebanyakan jenis tes. Berbagai survey periodis telah diadakan menyangkut penggunaan tes oleh
sampe-sampel psikolog klinis dan konseling yang berbeda dalam orientasi teoritis dan
lingkungan kerja mereka.
Penaksiran Psikologis. Informasi yang berasal dari observasi, wawancara, dan
riwayat kasusu dipadukan dengan skor-skor tes untuk memberikan gambaran yang terintegrasi
atau individu. Dengan begitu, psikolog klinis memiliki sikap berjaga-jaga tertentu agar tidak
melakukan overgeneralisasi atas skor-skor tes. Atribut lain dari penksiran psikologis adalah
tujuan, yang pada umumnya memang membantu dalam pengambilan keputusan berdasarkan
informasi yang berkaitan dengan diagnosis diferensial, seleksi karir, rekomendasi penanganan
tertentu, perencanaan pendidikan, pengambilan keputusan pengasuh anak, bersalah tidaknya
seseorang dan banyak lagi masalah yang memiliki kepentingan praktis bagi satu orang atau
lebih.

 Penaksiran Neuropsikologis
Masalah-masalah Metodologis dalam Diagnosis Kerusakan Otak. Berdasarkan
observasi yang ekstensif atas para prajurit pada Perang Dunia I, Goldstein merumuskan
deskripsi klasik tentang gangguan intelektual yang berhubungan dengan kerusakan otak.
Diantara simpton-simpton utama adalah penyusutan dalam kemampuan pikiran abstrak da
kecendrungan untuk memberikan respons pada stimulis dari luar yang bisa mengganggu
persepsi normal.
Sejak tahun 1950-an, para psikolog semakin mengakui bahwa kerusakan otak
bisa mengakibatkan berbagai pola perilaku, pengakuan yang mendorong perkembangan
neuropsikologis klinis, yaitu bidang yang bertujuan menerapkan apa yang diketahui tentang
hubungan otak-perilaku dalam diagnostic dan rehabilitas individu-individu dengan kerusakan
otak.
Ada banyak bukti bahwa kerusakan otak mencakup sejumlah gangguan organic
yang luas dengan berbagai perwujudan perilaku yang merupakan akibat. Dari sudut pandang
lain, gangguan perilaku atau intelektual yang sama dan tanda diagnostic yang sama dalam
kinerja tes bisa berakibat dari etiologi organik, emosional, atau tercampur.

Secara keseluruhan, praktik neuropsikologi adalah salah satu tugas klinis yang
paling menuntut, yang membutuhkan aplikasi pengetahuan tentang fungsi kognitif, kepribadian,
neurologis, dan fisiologis umum, baik pada kontinuum normal maupun kontinuum patologis.
Instrumen Neuropsikologis. Yang penting diantara fungsi-fungsi yang ditaksir
oleh instrument-instrumen ini adalah fungsi yang dianggap paling sensitive bagi proses
patologis, seperti persepsi atas hubungan special dan memori untuk materi yang harus
dipelajari. Para ahli neuropsikologi klinis kerap menggunakan perpaduan berbagai tes yang
tersedia untuk menaksir keterampilan dan kekurangan yang berbeda dalam suatu cara yang
diberi nama pendekatan “kumpulan tes fleksibel”

 Mengidentifikasi Ketidakmampuan Belajar yang Spesifik


Teknik Penaksiran. Berasal setidak-tidaknya dari tiga sumber masalah
diagnostik: (1) beragam gangguan perilaku yang terasosiasikan dengan kondisi ini, (2)
perbedaan individu dalam perpaduan tertentu symptom-simptom, dan (3) kebutuhan akan
informasi yang amat spesifik menyangkut sifat dan kontinuum ketidakmampuan dalam tiap
kasus.
Penasiran Dinamis. Pendekatan ini telah digunakan sebagai sumber data
suplementer, tidak hanya dalam kasus-kasus ketidakmampuan belajar yang spesifik melainkan
juga dengan anak-anak lain yang mengalami kesulitan dalam proses belajar mereka, misalnya
anak-anak dengan keterbelakangan mental ringan atau sedang. Manfaat pendekatan ini untuk
penaksiran anak-anak yang berbakat terutama dalam diri anak-anak yang secara ekonomis tidak
beruntung juga telah dicoba secara tentative.
 Penaksiran Perilaku
Teknik Penaksiran. Fungsi-fungsi utama yang dilayani oleh prosedur-prosedur
penaksiran dalam terapi perilaku bisa dimuat dalam tiga kelompok: (1) merumuskan masalah
individu, (2) menyeleksi penanganan yang tepat, (3) menaksir perubahan perilaku. Prosedur
penaksiran yang tersedia pada dirinya sendiri digolongkan menjadi tiga jenis utama: laporan diri
oleh klien, observasi langsung perilaku, dan ukuran fisiologis.

 Penaksiran Karier
Praktik penaksiran karier bermaksud membantu individu untuk memilih karier
yang paling tepat baginya dilihat dari segi kemampuan, minat, sasaran, nilai, dan temperamen
pribadi dan juga persyaratan yang ada dalam suatu pekerjaan.
Program Komprehensif untuk Eksplorasi Karier. Pendekatan lebih baru pada
konseling karier menyediakan prosedur untuk mengintegrasikan informasi yang tersedia dari
banyak sumber ke dalam suatu program eksplorasi karier yang komprehensif. SIGI-PLUS yang
semula dirancang untuk digunakan pada mahasiswa universitas, diperbarui untuk digunakan
pada orang dewasa yang ingin melakukan perubahan karier atau memasuki pasaran kerja pada
berbagai tahap kehidupan yang berbeda. Program ini dirancang sedemikian rupa sehingga
memandu individu dalam memeriksa berbagai fakta relevan dan menjalani rute sistematik
menuju pengambilan keputusan yang efektif.

Penaksiran Kematangan Karier. Kematangan karier merujuk pada penguasaan


individu atas tugas-tugas kejuruan yang sesuai dengan tingkat usia dan efektivitasnya dalam
mengatasi tugas-tugas tersebut. Penelitian itu sendiri merupakan penelitian longitudinal selama
20 tahun atas kurang lebih 100 anak kelas sembilan. Temuannya menunjukan bahwa tugas
perkembangan karier utama pada tingkat sekolah menengah junior adalah bersiap untuk
melakukan pilihan karier.

 Penilaian Klinis
Penelitian pada proses penilaian klinis telah menerangi sejumlah sumber
kesalahan yang mungkin terjadi dalam proses ini, misalnya pengaruh stereotip kultural dan sikap
mengandalkan asas-asas prediksi yang salah.
Laporan Penaksiran: Sintesis Akhir. Laporan itu seharusnya juga berkonsentrasi
diri pada ciri-ciri khas tiap individu, titik yang tinggi dan rendah dan bukan pada ciri-ciri dimana
posisi individu dekat dengan rata-rata. Fokus utama laporan seharusnya adalah tentang
interpretasi dan konklusi, meskipun catatan tes dan data terinci lainnyabisa dilampirkan secara
terpiah pada sejumlah kasus.

 Peran Komputer Dalam Penaksiran Psikologis


Komputer mampu mencari, secara sistematis dan konsisten, melalui basis data
yang jauh lebih luas disbanding yang mungkin untuk ahli klinis individual; komputer juga bisa
diandalkan dalam menerapkan banyak aturan kompleks pada data actuarial dalam menyeleksi
pernyataan-pernyataan yang tepat; dan komputer juga bisa menyisipkan banyak variable terkait
lain dalam proses bersangkutan, misalnya data demografis dari populasi normative yang
berbeda.
Kesimpulan dan Komentar. Secara keseluruhan, bidang penaksiran psikologis
sebagai mana dipraktikan oleh berbagai spesialis sedang mengalami perubahan sama cepat
dengan bidang-bidang lain.

Bab 18 – Pertimbangan Etis Dan Sosial Dalam Pengetesan


 Isu-Isu Etis Dalam Pengetesan Dan Pemeriksaan Psikologis
Dalam area pengetesan, analisis yang hati-hati dan provokatif tentang peran nilai
dan dasar pemikiran etis yang melandasi berbagai praktik, telah disajikan oleh Eyde dan
Quaintance (1988) dan Messick (1980b, 1989, 1995). Sejumlah soal yang dibahas dalam Ethics
Code terkait erat dengan pokok-pokok yang dicakup dalam Testing Standards. Isi testing
standards itu sendiri membantu merumuskan tanggung jawab penggunaan tes secara
profesional.
 Kualifikasi Pengguna Dan Kompetensi Profesional
Para penguji yang benar terlatih memilih tes yang sesuai, baik dengan maksud
tertentu yang menjadi tujuan pengetesan, maupun dengan orang yang diuji dalam
menyelenggarakan tes mereka tanggap terhadap banyak kondisi yang bisa memengaruhi kinerja
tes. Aturan pemberian lisensi umumnya meliputi dasar untuk tindakan disipliner terhadap
psikolog, yang bisa mulai dari denda dan teguran sampai skor dan pencabutan lisensi. Pada
tingkat yang lebih lanjut, sertifikasi spesialisasi diberikan oleh American board of professional
psychology (ABPP).

 Tanggung Jawab Penerbit Tes


Pembelian tes-tes umumnya dibatasi pada orang-orang yang memenuhi
persyaratan minimal tertentu. Umumnya, individu dengan gelar master dalam psikologi/ setara
dianggap memenuhi syarat. Usaha untuk membatasi distribusi tes memiliki dua tujuan :
keamanan materi tes dan pencegahan penyalahgunaan. Tanggu jawab utama untuk pengguna
tes yang selayaknya pada akhirnya ada pada diri pengguna individual/lembaga yang
bersangkutan. Tanggung jawab professional lainnya berhubungan dengan pemasaran tes-tes
psikologis oleh pengarang dan penerbit. Tes-tes seharusnya tidak dilepaskan secara premature
untuk penggunaan umum juga tidak seharusnya dilakukan klaim apapun menyangkut segi
positif tes itu jika tidak ada bukti objektif yang memadai.

 Perlindungan Atas Lingkup Pribadi


Dalam sebuah laporan yang berjudul Privacy And Behavioral Research (1967),
hak atas lingkup pribadi itu didefinisikan sebagai hak untuk memutuskan sendiri seberapa
banyak seorang hendak berbagai pikiran, perasaan, dan fakta tentang kehidupan pribadinya
dengan orang lain; hak ini lebih jauh dicirakan sebagai “Hal yang hakiki untuk menjamin
kebebasan dan penentuan diri sendiri).

 Kerahasiaan
Sebagaimana perlindungan atas lingkup pribadi, yang erat kaitannya, masalah
kerahasiaan data tes bersifat multidimensi. Pembahasan tentang kerahasiaan catatan tes
biasanya berhadapan dengan aksesibilitas orang ketiga, yang berbeda dari orang yang di tes
(orang tua anak) dan penguji. Prinsip yang mendasari nya adalah bahwa catatan-catatan seperti
itu seharusnya tidak dilepaskan tanpa pengetahuan dan izin dari peserta tes kecuali jika
pelepasan semacam itu dimandatkan oleh hukum atau diizinkan oleh hukum untuk maksud-
maksud yang sah.

 Mengomunikasikan Hasil-Hasil Tes


Diantara pihak-pihak yang mungkin menerima hasil tes, disamping peserta tes
itu sendiri, adalah orang tua anak, guru, dan tenaga sekolah lainnya, majikan, psikiater,
pengadilan, dan petugas lembaga permasyarakatan. Dalam semua komunikasi yang
berhubungan dengan tes, hendaknya diperhatikan ciri-ciri orang yang harus menerima informasi
ini. Masalah yang sama ditemui ketika mengkomunikasikan hasil-hasil tes pada peserta tes itu
snediri, entah anak-anak entah orang dewasa.
 Mengetes Populasi Yang Beraneka Ragam
Lingkungan. Dalam kitan dengan mekanisme perbaikan kesempatan pendidikan
serta pekerjaan bagi individu-individu dari berbagai kelompok, tes psikologis merupakan fokus
perhatian utama. Banyak keprihatinan berpusat pada penurunan skor-skor tes oleh kondisi-
kondisi kultural yang bisa memengaruhi pengembangan kemampuan, minat, motivasi, sikap,
dan karakteristik psikologis lain dari anggota kelompok minoritas.
Peraturan Legal. Dalam bidang pekerjaan, makin lama pengadilan semakin
memainkan peran penting dalam menaksirkan serta menerapkan hukum-hukum hak sipil.
Inkonsistensi antara keputusan professional, legal, dan etis mungkin akan tetap muncul di masa
depan. Tak diragukan lagi bahwa hal-hal itu akan mempersulit penerapan tes pada pengambilan
keputusan di dalam apa yang disebut bidang-bidang pekerjaan dan pendidikan “taruhan tinggi”.
Faktor-faktor yang Terkait dengan Tes. Faktor-faktor yang disebut terakhir
inilah, faktor-faktor yang terkait dengan tes yang mengurangi validitas. Contoh dari faktor-faktor
tersebut mencakup pengalaman sebelumnya dalam mengikuti tes, motivasi untuk berhasil
dalam tes, hubungan dengan penguji, penekanan berlebihan pada kecepatan dan variabel-
variabel apapun lainnya, yang memengaruhi kinerja pada tes tertentu, tetapi tidak relevan pada
domain perilaku luas yang dipertimbangkan.
Penaksiran dan Penggunaan Skor Tes. Tes dirancang untuk menunjukan apa yang
dapat dilakukan seorang individu pada waktu tertentu. Tes tidak bisa memberi tahu kita
mengapa dia melakukan tugas tertentu sebagaimana dia melakukannya. Untuk menjawab
pertanyaan ini kita perlu meneliti latar belakang, motivasi, dan lingkungan berkaitan lainnya. Tes
juga tidak bisa memberi tahu bagaimana mungkin seorang anak yang dalam hal budaya atau
pendidikan tidak diuntungkan, bisa berkembang jika ia dibesarkan dalam situasi yang lebih baik.
Objektivitas Tes. Bila stereotip dan prasangka social mungkin mengganggu
evaluasi antar pribadi, tes merupakan usaha untuk berjaga-jaga terhadap favoritisme da
keputusan yang sifatnya sewenang-wenang dan tidak terduga-duga.

Anda mungkin juga menyukai