Anda di halaman 1dari 23

Subscribe to DeepL Pro to translate larger documents.

Visit www.DeepL.com/pro
Topik 2B - for more information.
Pengujian dari Awal 1900-an hingga 69
Sekarang

TOPIK 2B Pengujian dari Awal 1900-an hingga Sekarang

Penggunaan dan Penyalahgunaan Awal Tes di Amerika


Serikat Tes Kelompok dan Klasifikasi Rekrutmen
Angkatan Darat Perang Dunia I Tes Pendidikan Awal
Perkembangan Tes Bakat Tes Kepribadian
dan Vokasional setelah Perang Dunia I Asal-
usul Tes Proyektif
Pengembangan Inventaris Bunga
Munculnya Tes Kepribadian Terstruktur
Perluasan dan Perkembangan Tes
Praktik Berbasis Bukti dan Penilaian Hasil

T
Skala Binet-Simon membantu memecahkan Terjemahan Pertama
masalah sosial praktis, yaitu bagaimana dari Skala Binet-Simon
mengidentifikasi anak-anak yang
Pada tahun 1906, Henry H. Goddard dipekerjakan
membutuhkan sekolah khusus.
oleh Vine- land Training School di New Jersey
Dengan keberhasilan penerapan tes mental ini, para
untuk melakukan penelitian tentang klasifikasi dan
psikolog menyadari bahwa penemuan mereka dapat
pendidikan "tunagrahita"
memiliki makna pragmatis bagi berbagai segmen
masyarakat. Hampir seketika, para psikolog di
Amerika Serikat mengadopsi fokus utilitarian. Tes
inteligensi diadopsi oleh banyak orang sebagai
respons yang dapat diandalkan dan objektif
terhadap masalah sosial yang dirasakan seperti
identifikasi imigran dengan keterbelakangan mental
dan klasifikasi yang cepat dan akurat untuk
merekrut anggota Angkatan Darat (Boake, 2002).
Apakah tes awal ini benar-benar memecahkan
dilema sosial-atau hanya memperburuknya-adalah
masalah yang diperdebatkan dengan sengit yang
diulas dalam bagian berikut. Satu hal yang pasti:
Banyaknya tes yang dilakukan pada awal abad ke-20
membantu membentuk karakter tes kontemporer.
Tinjauan terhadap tren historis ini akan membantu
dalam memahami sifat tes modern dan apresiasi
yang lebih baik terhadap isu-isu sosial yang
dimunculkan oleh tes-tes tersebut.

PENGGUNAAN AWAL DAN


PENYALAHGUNAAN TES DI AMERIKA
SERIKAT
70 Bab 2 - Asal-usul Tes Psikologi

anak-anak. Dia segera menyadari bahwa sebuah


petunjuk diagnostik akan diperlukan dan, oleh
karena itu, dia senang membaca skala Binet-Simon
tahun 1908. Dia segera mulai menerjemahkan skala
tersebut, membuat perubahan kecil sehingga dapat
diterapkan pada anak-anak Amerika (Goddard,
1910a).
Goddard (1910b) menguji 378 penghuni
fasilitas Vineland dan mengkategorikan mereka
berdasarkan diagnosis dan usia mental. Dia
mengklasifikasikan 73 penghuni sebagai idiot
karena usia mental mereka 2 tahun atau lebih
rendah; 205 penghuni disebut dungu dengan usia
mental 3 sampai 7 tahun; dan 100 penghuni
dianggap berpikiran lemah dengan usia mental 8
sampai 12 tahun. Sangat penting untuk dicatat
bahwa istilah-istilah yang awalnya netral dan
deskriptif untuk menggambarkan tingkat
keterbelakangan mental - idiot, imbesil, dan dungu
- telah masuk ke dalam leksikon sehari-hari sebagai
label yang merendahkan. Bahkan, Goddard
memberikan kontribusinya sendiri dengan
menciptakan istilah diagnostik moron (dari bahasa
Yunani moro-nia, yang berarti "bodoh").
Goddard (1911) juga menguji 1.547 anak
normal dengan menggunakan skala Binet-Simon
yang diterjemahkannya. Dia menganggap anak-
anak yang usia mentalnya empat tahun atau lebih di
belakang usia kronologis mereka sebagai
tunagrahita-ini merupakan 3 persen dari
sampelnya. Mengingat bahwa semua anak-anak ini
ditemukan di luar institusi untuk orang
terbelakang, 3 persen merupakan angka yang cukup
mengkhawatirkan dari kekurangan mental.
Goddard (1911) berpendapat bahwa anak-anak ini
harus dipisahkan agar mereka terhindar dari
"mencemari masyarakat". Anak-anak yang lebih
awal ini
Topik 2B - Pengujian dari Awal 1900-an hingga 71
Sekarang
yang memiliki kekurangan mental "mengkhawatirkan", ia
Studi-studi tersebut menggugah keingintahuan
tidak bergabung dengan seruan populer untuk
Goddard tentang warga negara yang "berpikiran
melakukan pembatasan imigrasi (Gelb, 1986).
lemah" dan beban sosial yang mereka pikul. Dia
Kisah Goddard dan kepeduliannya terhadap
juga mendapatkan reputasi sebagai salah satu ahli
"ancaman orang yang lemah," seperti yang dikatakan
terkemuka dalam penggunaan tes kecerdasan untuk
secara satir oleh Gould (1981), sering diabaikan atau
mengidentifikasi orang-orang dengan gangguan
diremehkan dalam
kecerdasan. Bakatnya segera diminati.

Binet-Simon dan Imigrasi


Pada tahun 1910, Goddard diundang ke Pulau Ellis
oleh komisaris imigrasi untuk membantu membuat
perkiraan jumlah imigran yang lebih akurat. Sebuah
cerita rakyat yang kelam dan penuh firasat telah
berkembang di sekitar kekurangan mental dan
imigrasi pada awal 1900-an:

Diyakini bahwa kaum difabel adalah makhluk


yang merosot yang bertanggung jawab atas
banyak, bahkan sebagian besar, masalah
sosial; bahwa mereka b e r k e m b a n g b i a k
dengan kecepatan yang
mengkhawatirkan dan mengancam kesehatan
biologis bangsa secara keseluruhan; dan
bahwa jumlah mereka terus bertambah oleh
imigran "baru" yang tidak diinginkan dari
negara-negara Eropa selatan dan timur yang
sebagian besar telah menggeser para imigran
"lama" dari Eropa utara dan barat. (Gelb,
1986)

Pada awalnya, Goddard tidak peduli dengan


ancaman lemah mental yang ditimbulkan oleh para
imigran. Dia menulis bahwa statistik yang memadai
tidak ada dan bahwa pendapat umum tentang
persentase imigran yang cacat mental yang tidak
semestinya adalah "sangat berlebihan" (Goddard,
1912). Namun, dengan kunjungan berulang kali ke
Pulau Ellis, Goddard menjadi yakin bahwa tingkat
cacat mental jauh lebih tinggi daripada yang
diperkirakan oleh p a r a dokter yang bekerja di
layanan imigrasi. Dalam waktu satu tahun, ia
membalikkan pendapatnya dan meminta dana dari
kongres agar Ellis Island dapat memiliki tenaga ahli
yang terlatih dalam penggunaan tes kecerdasan.
Pada dekade berikutnya, Goddard menjadi seorang
rasul untuk penggunaan tes intelijen untuk
mengidentifikasi imigran yang memiliki kelemahan
mental. Meskipun ia menulis bahwa tingkat imigran
72 Bab 2 - Asal-usul Tes Psikologi
imigran dengan keterbelakangan mental yang tinggi
buku-buku mengenai tes psikologi. Mayoritas
masuk ke Amerika Serikat setiap hari, Goddard
buku-buku teks mengenai tes tidak
mengirim asistennya ke Pulau Ellis untuk
menyebutkan atau merujuk pada Goddard
memberikan terjemahan bahasa Inggris dari tes
sama sekali. Beberapa buku yang
Binet-Simon kepada para imigran yang baru tiba.
menyebutkannya biasanya menyatakan bahwa
Tes-tes tersebut diberikan melalui seorang
Goddard "menggunakan tes di lembaga-
penerjemah, tidak lama setelah para imigran
lembaga untuk orang terbelakang," yang
berjalan ke daratan. Kita dapat menduga bahwa
tentunya meremehkan. Dalam bukunya yang
banyak dari para imigran yang ketakutan, bingung,
berpengaruh, History of Psychological Testing,
dan mengalami disorientasi. Oleh karena itu, tes
DuBois (1970) memiliki sebuah potret
yang dirancang dalam bahasa Prancis, kemudian
Goddard namun hanya memberikan kurang
diterjemahkan ke dalam bahasa Inggris, kemudian
dari satu baris teks untuknya.
diterjemahkan kembali ke dalam bahasa Yiddi,
Faktanya adalah bahwa Goddard adalah
Hungaria, Italia, atau Rusia; diberikan kepada para
salah satu psikolog Amerika yang paling
petani dan pekerja yang kebingungan karena baru
berpengaruh di awal tahun 1900-an. Oleh
saja menjalani penyeberangan Atlantik; dan
karena itu, setiap orang yang bijaksana pasti
ditafsirkan sesuai dengan norma-norma asli
bertanya-tanya mengapa begitu banyak
Prancis.
penulis kontemporer mengabaikan atau
meremehkan orang yang pertama kali
menerjemahkan dan menerapkan tes Binet di
Amerika Serikat. Kami akan mencoba
menjawabnya di sini, sebagian berdasarkan
tulisan asli Goddard, namun juga
mengandalkan kritik Gould (1981) terhadap
tulisan-tulisan Goddard yang sangat banyak
mengenai defisiensi mental dan tes inteligensi.
Kami juga merujuk pada penggambaran Gelb
(1986) yang lebih simpatik tentang Goddard.
Mungkin Goddard telah diabaikan
dalam buku-buku teks karena dia adalah
seorang keturunan yang keras yang percaya
pada kecerdasan dalam istilah-istilah Mendeley
yang berpikiran sederhana. Tidak diragukan
lagi, seruannya untuk menjajah "orang-orang
bodoh" untuk membatasi perkembangbiakan
mereka juga membuatnya tidak disukai di masa
kini. Dan desakannya bahwa banyak perilaku
yang tidak diinginkan-kejahatan, alkoholisme,
prostitusi-adalah karena kekurangan mental
yang diwariskan juga tidak sesuai dengan posisi
lingkungan modern.
Namun, alasan yang paling mungkin
mengapa para penulis modern mengabaikan
Goddard adalah karena ia menjadi contoh bagi
sejumlah besar psikolog terkemuka di masa
lalu yang terlibat dalam penyalahgunaan tes
inteligensi secara terang-terangan. Dalam
upayanya untuk menunjukkan bahwa tingkat
Topik 2B - Pengujian dari Awal 1900-an hingga 73
Sekarang
yang diterima secara umum dapat
Apa yang ditemukan Goddard dan apa yang ia
menyalahgunakan psikotes. Kita harus selalu
simpulkan dari hasil penelitiannya? Dalam sampel
waspada bahwa "ilmu pengetahuan" yang tidak
kecil imigran (22 hingga 50), asistennya menemukan
tertarik dapat dimanfaatkan untuk tujuan-tujuan
83 persen orang Yahudi, 80 persen orang Hungaria,
ideologi sosial yang merusak.
79 persen orang Italia, dan 87 persen orang Rusia
mengalami keterbelakangan mental, yaitu di bawah Menguji Keberbakatan: Leta Stetter
usia 12 tahun dalam skala Binet-Simon (Goddard, Hollingworth
1917). Penafsirannya terhadap temuan ini, secara
bergantian, bersifat skeptis dan kemudian secara Salah satu penggunaan paling awal dari tes IQ
provokatif mengkhawatirkan. Di satu tempat dia seperti Stanford-Binet adalah untuk menguji
mengklaim bahwa penelitiannya "tidak membuat keberbakatan. Seorang pelopor dalam hal ini
penghentian persentase yang sebenarnya, bahkan
dari kelompok-kelompok ini, yang lemah pikiran."
Namun, di bagian lain dalam laporan tersebut ia
menyatakan bahwa angka-angkanya hanya perlu
direvisi "dalam jumlah yang relatif kecil" untuk
menemukan persentase yang sebenarnya dari
orang-orang yang mengalami gangguan mental di
antara kelompok-kelompok imigran. Lebih jauh lagi,
ia menyimpulkan bahwa kecerdasan rata-rata
imigran rendah, "mungkin setingkat dengan orang
tolol," tetapi kemudian ia menyebutkan bahwa
kekurangan lingkungan sebagai penyebab utama.
Pada saat yang sama, Goddard tampaknya
mendukung deportasi bagi imigran ber-IQ rendah,
tetapi juga memberikan perspektif kemanusiaan
bahwa kita mungkin dapat menggunakan "pekerja
bodoh" jika saja "kita cukup bijaksana untuk melatih
mereka dengan benar."
Masih banyak lagi yang bisa kita pelajari
tentang era Goddard dalam pengujian inteligensi
awal, dan pembaca yang tertarik dianjurkan untuk
membaca Gould (1981) dan Gelb (1986). Poin
terpenting yang ingin kami tekankan di sini adalah
bahwa-seperti banyak psikolog awal lainnya-
pandangan ilmiah Goddard dipengaruhi oleh
ideologi sosial pada masanya. Akhirnya, Goddard
adalah seorang sarjana yang kompleks yang
menyempurnakan dan bertentangan dengan
pendapat profesionalnya dalam banyak kesempatan.
Satu contoh yang ironis: Setelah kerusakan terjadi
dan tulisannya telah membantu membatasi imigrasi,
Goddard (1928) menarik kembali pendapatnya, dan
menyimpulkan bahwa tunagrahita tidak dapat
disembuhkan dan bahwa tunagrahita tidak perlu
dipisahkan dalam institusi.
Bab Goddard dalam sejarah psikotes berfungsi
sebagai pengingat bahwa orang yang bermaksud
baik yang beroperasi dalam norma-norma sosial
74 Bab 2 - Asal-usul Tes Psikologi
keunggulan tidak mungkin terjadi. Sebagai
adalah Leta Stetter Hollingworth (1886 - 1939) yang
akibatnya, dapat ditambahkan bahwa ... .
menghabiskan karirnya yang singkat (ia meninggal
Sangat diharapkan, baik untuk memperkaya
karena kanker pada usia 53 tahun) dengan berfokus
masyarakat maupun kedamaian individu,
pada psikologi kejeniusan. Dalam sebuah penelitian,
bahwa wanita dapat menemukan cara untuk
Hollingworth (1928) menunjukkan bahwa anak-
berbeda dari modus mereka seperti yang
anak jenius tinggi (IQ Stanford-Binet berkisar di
dilakukan pria, dan tetap beranak pinak. Jalan
angka 165) menunjukkan prestasi sekolah yang
seperti itu saat ini terhalang oleh prasangka
jauh lebih baik dibandingkan dengan anak-anak
individu, kemiskinan, dan pemberlakuan
jenius biasa (IQ berkisar di angka 146). Dalam
langkah-langkah hukum. Namun, ekspektasi
penelitian lain, ia menepis keyakinan yang umum
publik perlahan-lahan akan berubah, karena
pada saat itu, bahwa anak-anak berbakat tidak boleh
kondisi yang menghasilkan ekspektasi
dimajukan di sekolah karena mereka akan
tersebut telah
tertinggal dari anak-anak yang lebih tua dalam hal
menulis dan keterampilan motorik lainnya
(Hollingworth & Monahan, 1926). Dalam
penelitian lain, ia menemukan bahwa remaja yang
sangat berbakat dinilai oleh orang asing secara
signifikan lebih tampan dibandingkan dengan
kontrol yang sebaya pada usia yang sama
(Hollingworth, 1935).
Hollingworth adalah seorang peneliti yang
produktif yang memajukan ilmu pengetahuan
tentang tes IQ. Sebagai seorang idealis, dia berada di
depan zamannya. Dia mengusulkan dana bergulir
yang dapat diambil oleh anak-anak berbakat untuk
pengembangan mereka, dengan kewajiban moral
(tetapi tidak legal) untuk membayar kembali uang
tersebut dalam waktu 20 tahun. Dia menduga
bahwa dana tersebut akan tumbuh secara
eksponensial selama beberapa dekade dan
bermanfaat bagi bangsa dengan cara yang tak
terduga (H. Hollingworth, 1943). Sayangnya,
rencana yang luar biasa ini tidak pernah terwujud.
Hollingworth juga merupakan seorang
feminis yang mengaitkan perbedaan gender dalam
hal keunggulan dan pencapaian dengan dampak
sosial dan budaya:

Tidaklah pantas untuk mencari penyebab


perbedaan jenis kelamin dalam keunggulan
dalam perbedaan afektif dan intelektual yang
paling utama dan jelas sampai kita telah
menghabiskan fakta yang diketahui, jelas, dan
tak terhindarkan bahwa perempuan
melahirkan dan membesarkan anak-anak,
dan bahwa hal ini memiliki konsekuensi yang
tak terhindarkan dari pekerjaan mengurus
rumah tangga, sebuah bidang di mana
Topik 2B - Pengujian dari Awal 1900-an hingga 75
Sekarang
skala Wechsler memberikan 10 hingga 12 skor subtes dan
sudah berubah, dan dalam satu abad lagi
Ver- bal dan Performance IQ. Sebaliknya, skala yang
solusi untuk masalah ini akan ditemukan.
lebih awal
(Hollingworth, 1914, hal. 529)

Sekarang sudah satu abad, kurang lebih, sejak


proklamasi Hol- lingworth. Perbedaan gender
dalam hal keunggulan dan pencapaian masih ada,
tetapi sudah sangat berkurang.

Stanford-Binet: Andalan Awal dari IQ


Meskipun Goddard yang pertama kali
menerjemahkan skala Binet di Amerika Serikat,
profesor Stanford, Lewis M. Terman (1857-1956),
yang mempopulerkan tes IQ dengan revisinya
terhadap skala Binet pada tahun 1916. Stanford-
Binet yang baru, demikian sebutannya, merupakan
revisi substansial, bukan sekadar perluasan, dari
skala Binet sebelumnya. Di antara banyak
perubahan yang menyebabkan prestise Stanford-
Binet tidak perlu dipertanyakan lagi adalah
penggunaan IQ yang sekarang sudah tidak asing lagi
untuk menyatakan hasil tes. Jumlah item
ditingkatkan menjadi 90, dan skala baru ini cocok
untuk mereka yang mengalami keterbelakangan
mental, anak-anak, dan orang dewasa normal dan
"superior". Selain itu, Stanford-Binet memiliki
instruksi yang jelas dan terorganisir dengan baik
untuk administrasi dan penilaian. Perhatian yang
besar telah diberikan untuk mendapatkan sampel
subjek yang representatif untuk digunakan dalam
standarisasi tes. Seperti yang dicatat oleh Good
(1949): "Penerbitan Revisi Stanford menandai
berakhirnya periode awal eksperimen dan
ketidakpastian. Untuk selamanya, pengujian
kecerdasan telah memiliki dasar yang kuat."
Stanford-Binet adalah standar pengujian
kecerdasan selama beberapa dekade. Tes-tes baru
selalu divalidasi dalam hal korelasinya dengan
ukuran ini. Tes ini terus menjadi yang terdepan
melalui revisi pada tahun 1937 dan 1960, di mana
pada saat itu skala Wechsler (Wechsler, 1949, 1955)
mulai bersaing dengannya. Revisi terakhir dari
Stanford-Binet selesai pada tahun 2003. Tes ini dan
skala Wechsler akan dibahas secara rinci dalam bab
selanjutnya. Perlu disebutkan di sini bahwa skala
Wechsler menjadi alternatif yang cukup populer
untuk Stanford-Binet terutama karena memberikan
lebih dari sekadar skor IQ. Selain IQ Skala Penuh,
76 Bab 2 - Asal-usul Tes Psikologi
(Yerkes, 1919). Segera setelah ditugaskan di
versi Stanford-Binet hanya memberikan satu
Angkatan Darat sebagai kolonel, Yerkes
skor rangkuman keseluruhan, yaitu IQ global.
membentuk Komite Ujian Penerimaan Anggota
Baru, yang bertemu di sekolah Vineland di New
TES KELOMPOK DAN Jersey untuk mengembangkan tes kelompok baru
KLASIFIKASI REKRUTMEN untuk seleksi anggota baru Angkatan Darat. Yerkes
TENTARA WWI mengetuai komite tersebut; anggota terkenal lainnya
termasuk Goddard dan Terman.
Mengingat kecenderungan orang Amerika Dari kolaborasi ini, muncul dua kelompok uji
akan efisiensi, wajar jika para peneliti mencari coba: Army Alpha dan Army Beta. Akan sulit untuk
tes kelompok untuk melengkapi tes inteligensi melebih-lebihkan pengaruh dari
individu yang relatif memakan waktu yang
diimpor dari Prancis. Di antara yang pertama
kali mengembangkan tes kelompok adalah
Pyle (1913), yang mempublikasikan norma-
norma anak sekolah untuk s e b u a h
baterai yang terdiri dari ukuran-ukuran yang
sudah dipakai seperti rentang memori,
substitusi simbol angka, dan asosiasi kata
secara lisan (dengan cepat menuliskan kata-
kata sebagai respons terhadap kata
rangsangan). Pintner (1917) merevisi dan
memperluas baterai Pyle, dengan
menambahkan tes pembatalan berjangka
waktu di mana anak mencoret huruf a di
mana pun huruf tersebut muncul dalam
sebuah teks.
Namun tes kelompok lambat untuk
diterima, sebagian karena versi awal masih
harus dinilai secara manual dengan tangan.
Gagasan tentang tes yang sepenuhnya objektif
dengan kunci penilaian yang sederhana tidak
sesuai dengan tes seperti memori logis yang
membutuhkan penilaian dari penguji dalam
penilaian. Yang paling mengherankan dari
semuanya-setidaknya bagi siapa pun yang
pernah menghabiskan waktu sebagai siswa di
sekolah-sekolah Amerika-pertanyaan pilihan
ganda belum digunakan secara umum.
Laju perkembangan yang lambat dalam
pengujian kelompok meningkat secara
dramatis ketika Amerika Serikat memasuki
Perang Dunia I pada tahun 1917. Pada saat
itulah Robert
M. Yerkes, seorang profesor psikologi terkenal
di Harvard, meyakinkan pemerintah AS dan
Angkatan Darat bahwa seluruh 1,75 juta
anggota baru harus menjalani tes intelijen
untuk tujuan klasifikasi dan penugasan
Topik 2B - Pengujian dari Awal 1900-an hingga 77
Sekarang
asistennya yang bersemangat. Pembacaan yang
Alpha dan Beta pada tes-tes kecerdasan berikutnya.
cermat terhadap memoarnya mengungkapkan
Format dan isi dari tes-tes ini mengilhami
bahwa Yerkes tidak melakukan lebih dari sekadar
perkembangan tes kelompok dan individu selama
membuat testimoni yang tidak menyenangkan dari
beberapa dekade berikutnya. Kami membahas tes-
para perwira tinggi. Pada dasarnya, memoarnya
tes ini secara mendetail agar pembaca dapat
mengatakan bahwa Angkatan Darat dapat
memahami pengaruhnya terhadap tes-tes inteligensi
menghemat jutaan dolar dan meningkatkan
modern.
efisiensinya jika data pengujian digunakan.
Ujian Alpha dan Beta Angkatan Darat
Alpha didasarkan pada karya Otis (1918) yang tidak
dipublikasikan dan terdiri dari delapan tes yang
dimuat secara lisan untuk rekrutan dengan
kemampuan rata-rata dan tinggi. Delapan tes
tersebut adalah (1) mengikuti arahan lisan,
(2) penalaran aritmatika, (3) penilaian praktis,
(4) pasangan sinonim-antonim, (5) kalimat yang
tidak beraturan, (6) penyelesaian deret angka, (7)
analogi, dan (8) informasi. Gambar 2.1
mencantumkan beberapa soal umum dari ujian
Army Alpha.
Army Beta adalah tes kelompok
nonverbal yang dirancang untuk digunakan oleh
para buta huruf dan rekrutan yang bahasa
pertamanya bukan bahasa Inggris. Tes ini terdiri
dari berbagai tes visual-perseptual dan motorik
seperti menelusuri jalur melalui labirin dan
memvisualisasikan jumlah blok yang benar yang
digambarkan dalam gambar tiga dimensi. Gambar
2.2 menggambarkan demonstrasi papan tulis untuk
kedelapan bagian dari ujian Beta.
Untuk mengakomodasi subjek yang buta
huruf dan imigran baru yang tidak memahami
bahasa Inggris, Yerkes menginstruksikan para
penguji untuk menggunakan sebagian besar metode
bergambar dan gerak tubuh untuk menjelaskan tes
kepada para calon anggota Angkatan Darat. Penguji
dan seorang asisten berdiri di atas panggung di
bagian depan kelas dan melakukan pantomim
untuk menjelaskan masing-masing dari delapan tes.
Pengujian Angkatan Darat dimaksudkan
untuk membantu menyortir dan mengeliminasi
orang-orang yang tidak kompeten secara mental,
mengklasifikasikan pria sesuai dengan kemampuan
mental mereka, dan membantu penempatan orang-
orang yang kompeten pada posisi yang bertanggung
jawab (Yerkes, 1921). Namun, tidak begitu jelas
apakah Angkatan Darat m e m a n f a a t k a n
banyak data yang diberikan oleh Yerkes dan para
78 Bab 2 - Asal-usul Tes Psikologi
Baik atau buruk, skema besar Yerkes untuk menguji
Sampai batas tertentu, tumpukan data uji
calon anggota Angkatan Darat membantu
coba hanya memiliki sedikit dampak praktis
mengantarkan era tes kelompok. Setelah Perang
terhadap efisiensi Angkatan Darat karena resistensi
Dunia I, banyak pertanyaan berdatangan dari
pikiran militer terhadap inovasi ilmiah. Namun,
perusahaan, sekolah umum, dan perguruan tinggi
juga benar bahwa para petinggi Angkatan Darat
tentang potensi
memiliki alasan kuat untuk meragukan keabsahan
hasil pengujian. Sebagai contoh, sebuah
memorandum internal menjelaskan penggunaan
pan-tomime dalam instruksi untuk pemeriksaan
Beta nonverbal:

Demi membuat hasil dari berbagai kamp yang


berbeda dapat dibandingkan, para penguji
diperintahkan untuk mengikuti serangkaian
kejenakaan balet yang terperinci dan spesifik,
yang tidak hanya tidak dapat dimengerti
secara sempurna dan tidak berhubungan
dengan pengujian mental, tetapi juga
m e m b e r i k a n suasana mistis yang
sangat membingungkan dan mengganggu
pada keseluruhan pertunjukan, yang pada
akhirnya menghalangi pendekatan terhadap
sikap yang seharusnya dimiliki oleh seorang
subjek ketika jiwanya diuji. (dikutip dalam
Samelson, 1977)

Selain itu, kondisi pengujian tidak sesuai dengan


yang diharapkan, dengan gelombang demi
gelombang rekrutan yang diantar ke satu pintu,
diuji, dan secara virtual dikeluarkan dari pintu yang
lain. Puluhan ribu rekrutan menerima nilai nol
untuk banyak subtes, bukan karena mereka
terbelakang tetapi karena mereka tidak d a p a t
memahami instruksi-instruksi baru yang penuh
teka-teki ini. Banyak rekrutan yang tertidur ketika
para p e n g u j i memberikan instruksi pantomim
yang esoterik dan misterius.
Sisi positifnya, pengujian Angkatan Darat
memberikan para psikolog dengan pengalaman
yang luar biasa dalam psikometri konstruksi tes.
Ribuan koefisien korelasi telah dihitung, termasuk
penggunaan korelasi berganda yang menonjol
dalam analisis data tes. Konstruksi tes berkembang
dari sebuah seni menjadi sebuah ilmu pengetahuan
dalam waktu beberapa tahun saja.

PENGUJIAN PENDIDIKAN AWAL


Topik 2B - Pengujian dari Awal 1900-an hingga 79
Sekarang

MENGIKUTI PETUNJUK LISAN

Tandai tanda silang pada lingkaran pertama dan juga lingkaran ketiga:

PENALARAN ARITMATIKA

Selesaikan setiap masalah:


Berapa jumlah laki-laki dari 5 orang dan 10 orang? Jawab ( )
Jika 3 1/2 ton batu bara berharga $21, berapa harga 5 1/2 ton? Jawaban( )
PENILAIAN PRAKTIS

Mengapa gunung-gunung tinggi tertutup salju? Karena


gunung-gunung tersebut berada di dekat awan
matahari jarang menyinari
mereka udara di sana dingin
PASANGAN SINONIM-ANTONIM

Apakah kata-kata ini sama atau berlawanan?


sumbangan-sedekah yang sama ? atau sebaliknya?
menumpuk-menghilang sama ? atau sebaliknya?
KALIMAT YANG TIDAK TERATUR

Dapatkah kata-kata ini disusun ulang untuk membentuk sebuah kalimat?


iri hati adalah sifat buruk yang buruk, benar atau salah ?
PENYELESAIAN SERI ANGKA

Selesaikan seri: 3 6 8 16 18 36 . . . . . . ANALOGI


Pilihan mana yang melengkapi analogi tersebut?
air mata-duka :: tawa-gembira senyum gadis-gadis
tersenyum
lumbung-gandum :: perpustakaan- mejabuku pustakawan kertas
INFORMASI

Pilih alternatif terbaik:


Pankreas berada di perutkepala bahu leher
Pertempuran Gettysburg terjadi pada tahun 1863 1813 1778 1812

GAMBAR 2.1 Contoh Item dari Sumber Pemeriksaan Alpha Angkatan Darat: Dicetak ulang dari Yerkes, RM (Ed.). (1921).
Pemeriksaan psikologis di Angkatan Darat Amerika Serikat. Memoar Akademi Ilmu Pengetahuan Nasional, Volume 15.
Dengan izin dari Akademi Ilmu Pengetahuan Nasional, Washington, DC.
Catatan: Peserta ujian menerima instruksi lisan untuk setiap subtes.

aplikasi dari tes-tes yang mudah ini yang dapat Yerkes segera meninggalkan dinas tersebut dan
dilakukan oleh siapa saja dan dinilai oleh siapa saja membawa gagasan baru mereka tentang tes
(Yerkes, 1921). Para psikolog yang telah bekerja kecerdasan dengan kertas dan pensil ke dunia
dengan industri dan pendidikan.
80 Bab 2 - Asal-usul Tes Psikologi

GAMBAR 2.2 Peragaan Papan Tulis untuk Kedelapan Bagian


dari Sumber Ujian Beta: Dicetak ulang dari Yerkes,
R. M. (Ed.). (1921). Pemeriksaan psikologis di Angkatan Darat
Amerika Serikat. Memoar Akademi Ilmu Pengetahuan
Nasional, Volume
15. Dengan izin dari National Academy of Sciences,
Washington, DC.
Topik 2B - Pengujian dari Awal 1900-an hingga 81
Sekarang
hingga saat ini. Sejak awal, SAchT memasukkan prinsip-
Army Alpha dan Beta juga dirilis untuk
prinsip psiko-metrik modern seperti menormalkan
penggunaan umum. Tes-tes ini dengan cepat
subtes sehingga
menjadi pro- totipe untuk keluarga besar tes
kelompok dan mempengaruhi karakter tes
kecerdasan, ujian masuk perguruan tinggi, tes
prestasi skolastik, dan tes bakat. Sebagai contoh,
sebagai akibat dari pengujian Angkatan Darat,
Dewan Riset Nasional, sebuah organisasi ilmuwan
pemerintah, merancang Tes Inteligensi Nasional,
yang pada akhirnya diberikan kepada 7 juta anak di
Amerika Serikat pada tahun 1920-an. Dengan
demikian, tes-tes yang terkenal seperti skala
Wechsler, Tes Bakat Skolastik, dan Graduate Record
Exam sebenarnya memiliki akar yang berasal dari
Yerkes, Otis, dan tes massal bagi para calon anggota
Angkatan Darat selama Perang Dunia I.
College Entrance Examination Board (CEEB)
didirikan pada pergantian abad k e - 2 0 untuk
membantu menghindari duplikasi dalam pengujian
pelamar ke perguruan tinggi di Amerika Serikat.
Ujian awal menggunakan format esai jawaban
singkat, namun hal ini berubah dengan cepat ketika
C. C. Brigham, seorang murid Yerkes, menjadi
sekretaris CEEB setelah Perang Dunia I. Pada tahun
1925, Dewan Perguruan Tinggi memutuskan untuk
membuat tes bakat skolastik untuk digunakan
dalam penerimaan mahasiswa baru di perguruan
tinggi (Goslin, 1963). Tes baru ini mencerminkan
format objektif yang sekarang menjadi fa- miliu
yaitu menguraikan kalimat, menyelesaikan analogi,
dan mengisi nomor berikutnya secara berurutan.
Penilaian dengan mesin diperkenalkan pada tahun
1930-an, membuat tes kelompok objektif menjadi
lebih efisien dari sebelumnya. Tes-tes ini kemudian
berevolusi menjadi tes College Board saat ini,
khususnya, Tes Bakat Skolastik, yang sekarang
dikenal sebagai Tes Penilaian Skolastik.
Fungsi CEEB kemudian disatukan di bawah
lembaga nirlaba Educational Testing Service (ETS).
ETS mengarahkan pengembangan, standarisasi, dan
validasi tes-tes terkenal seperti Graduate Record
Examination, Tes Penerimaan Sekolah Hukum, dan
Tes Masuk Korps Perdamaian.
Sementara itu, Terman dan rekan-rekannya di
Stanford sibuk mengembangkan tes prestasi yang
terstandarisasi. Stanford Achievement Test (SAchT)
pertama kali diterbitkan pada tahun 1923; versi
m o d e r n n y a masih digunakan secara luas
82 Bab 2 - Asal-usul Tes Psikologi
baterai aperture yang lambat adalah tidak adanya
variabilitas dalam subjek dapat dinilai dan
aplikasi praktis untuk instrumen yang
memilih sampel standar yang sangat besar dan
disempurnakan. Baru setelah Perang Dunia II,
representatif.
muncul kebutuhan mendesak untuk memilih para
pilot yang memiliki kualifikasi tinggi untuk tugas-
PENGEMBANGAN tugas yang sangat sulit dan terspesialisasi.
TES BAKAT Persyaratan pekerjaan pilot, insinyur penerbangan,
dan navigator sangat spesifik dan berat. Perkiraan
Tes bakat mengukur kemampuan yang lebih umum tentang kemampuan intelektual,
spesifik dan terbatas daripada tes inteligensi.
Secara tradisional, tes inteligensi menilai
konstruk yang lebih global seperti kecerdasan
umum, meskipun ada pengecualian untuk tren
ini yang akan dibahas nanti. Sebaliknya, tes
bakat tunggal hanya akan mengukur satu
kemampuan utama, dan tes bakat ganda akan
memberikan skor dalam beberapa bidang
kemampuan yang berbeda.
Pengembangan tes bakat tertinggal dari
tes kecerdasan karena dua alasan, satu alasan
statistik dan satu alasan sosial. Masalah
statistiknya adalah bahwa teknik baru, analisis
faktor, sering kali diperlukan untuk
membedakan bakat mana yang utama dan,
oleh karena itu, berbeda satu sama lain.
Penelitian tentang pertanyaan ini telah dimulai
sejak awal oleh Spearman (1904) namun tidak
disempurnakan hingga tahun 1930-an
(Spearman, 1927; Kelley, 1928; Thurstone,
1938). Rangkaian teknik baru ini, analisis
faktor, memungkinkan Thurstone untuk
menyimpulkan bahwa ada faktor-faktor
spesifik dari kemampuan mental utama seperti
pemahaman verbal, kefasihan kata, fasilitas
angka, kemampuan spasial, memori asosiatif,
kecepatan perseptual, dan penalaran umum
(Thurstone, 1938; Thurstone & Thurstone,
1941). Lebih lanjut akan dibahas lebih lanjut
pada bab-bab selanjutnya mengenai tes
kecerdasan dan kemampuan. Poin penting di
sini adalah bahwa Thurstone dan para
pengikutnya berpikir bahwa ukuran-ukuran
global kecerdasan tidak, bisa dikatakan,
"memotong alam pada persendiannya."
Akibatnya, ukuran-ukuran seperti Stanford-
Binet dirasa tidak berguna seperti baterai tes
bakat ganda dalam menentukan kekuatan dan
kelemahan intelektual seseorang.
Alasan kedua untuk pertumbuhan
Topik 2B - Pengujian dari Awal 1900-an hingga 83
Sekarang
untuk berkomitmen
seperti yang disediakan oleh tes intelijen kelompok
bunuh diri?
yang digunakan pada Perang Dunia I, tidak cukup
untuk memilih kandidat yang baik untuk sekolah Para pembaca yang akrab dengan Minnesota
penerbangan. Angkatan bersenjata memecahkan Multi-phasic Personality Inventory (MMPI) pasti
masalah ini dengan mengembangkan baterai bakat tahu bahwa inventori yang lebih baru ini memiliki
khusus yang terdiri dari 20 tes yang diberikan hutang pada instrumen Woodworth.
kepada para pria yang lulus tes penyaringan awal.
Langkah-langkah ini terbukti sangat berharga dalam
memilih pilot, navigator, dan pengebom,
sebagaimana tercermin dalam tingkat pencoretan
yang jauh lebih rendah dari orang-orang yang
dipilih dengan baterai tes daripada metode lama
(Goslin, 1963). Tes semacam itu masih digunakan
secara luas di angkatan bersenjata.

TES KEPRIBADIAN DAN KEJURUAN


SETELAH WWI
Meskipun metode penilaian yang belum sempurna
seperti teknik asosiasi bebas telah digunakan
sebelum pergantian abad ke-20 oleh Galton, Krae-
pelin, dan lainnya, baru pada Perang Dunia I tes
kepribadian muncul dalam bentuk yang menyerupai
tampilan kontemporernya. Seperti yang sering
terjadi dalam sejarah psikotes, sekali lagi, kebutuhan
praktislah yang menjadi pendorong perkembangan
baru ini. Tes kepribadian modern dimulai ketika
Woodworth berusaha mengembangkan instrumen
untuk mendeteksi calon anggota Angkatan Darat
yang rentan terhadap psikoneurosis. Hampir semua
inventori, jadwal, dan kuesioner kepribadian
modern berhutang budi pada Lembar Data Pribadi
Woodworth (1919).
Lembar Data Pribadi terdiri dari 116
pertanyaan yang harus dijawab oleh subjek dengan
memberi tanda Ya atau Tidak. Pertanyaan-
pertanyaan tersebut secara eksklusif merupakan
pertanyaan yang "terlihat jelas" dan, sebagian besar,
melibatkan gejala-gejala yang cukup serius. Item-
item yang representatif disertakan:
• Apakah ide mengalir di kepala Anda sehingga
Anda
tidak bisa tidur?
• Apakah Anda dianggap sebagai anak nakal?
• Apakah Anda merasa terganggu dengan
perasaan bahwa segala sesuatunya
tidak nyata?
• Apakah Anda memiliki keinginan kuat
84 Bab 2 - Asal-usul Tes Psikologi
Kategori terakhir ini meyakinkannya bahwa operasi
Perkembangan besar berikutnya adalah
mental "tenggelam sepenuhnya di bawah tingkat
penemuan tentang neurosis, Jadwal Kepribadian
kesadaran" sedang bermain. Beberapa sejarawan
Thurstone (Thurstone & Thurstone, 1930). Setelah
bahkan berspekulasi bahwa penerapan asosiasi
terlebih dahulu memusnahkan ratusan item yang
bebas oleh Freud sebagai alat terapi dalam
dapat dijawab dengan jawaban ya-tidak dari
psikoanalisis muncul dari makalah Galton yang
inventaris Woodworth dan sumber-sumber lain,
diterbitkan di Brain pada tahun 1879 (Forrest,
Thurstone secara rasional memasukkan item-item
1974).
tersebut ke dalam kategori yang biasanya dijawab oleh
orang neurotik. Mencerminkan kegemaran
Thurstone akan kemahiran statistik, penelitian ini
merupakan salah satu penelitian pertama yang
menggunakan metode konsistensi internal di mana
setiap item prospektif dikorelasikan dengan skor
total pada skala yang telah diidentifikasi secara
tentatif untuk menentukan apakah item tersebut
masuk ke dalam skala.
Dari tes Thurstone, muncullah Inventori
Kepribadian Bernreuter (Bernreuter, 1931). Tes ini
sedikit lebih baik dari pendahulunya Thurstone,
mengukur empat dimensi kepribadian:
kecenderungan neurotik, kemandirian, introversi-
ekstroversi, dan dominasi-kepatuhan. Sebuah
inovasi besar dalam konstruksi tes adalah bahwa
satu item tes dapat berkontribusi pada lebih dari
satu skala.
Setiap kronologi inventori laporan diri pasti
harus menyertakan Minnesota Multiphasic Per-
sonality Inventory (MMPI; Hathaway & McKinley,
1940). Tes ini dan revisinya, MMPI-2, akan dibahas
secara rinci nanti. Untuk saat ini, cukuplah untuk
menunjukkan bahwa skala MMPI disusun dengan
metode yang dipelopori oleh Woodworth, yang
membandingkan respons dari subjek normal dan
subjek yang mengalami gangguan kejiwaan. Selain
itu, MMPI juga memperkenalkan penggunaan skala
validitas untuk menentukan pola respons palsu
yang buruk, palsu yang baik, dan pola respons acak.

ASAL-USUL PENGUJIAN PROYEKTIF


Pendekatan proyektif berawal dari metode asosiasi
kata yang dipelopori oleh Francis Galton pada akhir
tahun 1800-an. Galton memberikan waktu empat
detik kepada dirinya sendiri untuk membuat
asosiasi sebanyak mungkin terhadap sebuah kata
rangsangan dan kemudian mengkategorikan
asosiasinya sebagai repetisi yang mirip burung beo,
yang diperantarai oleh gambar, atau histrionik.
Topik 2B - Pengujian dari Awal 1900-an hingga 85
Sekarang
sebagian besar menggambarkan satu atau lebih orang
Pekerjaan Galton dilanjutkan di Jerman oleh
yang terlibat dalam interaksi yang ambigu. Subjek
Wundt dan Kraepelin dan akhirnya membuahkan
diperlihatkan gambar satu per satu dan diminta untuk
hasil oleh Jung (1910). Tes Jung terdiri dari 100 kata
mengarang cerita tentang gambar tersebut. Dia
rangsangan. Untuk setiap kata, subjek harus
diinstruksikan untuk membuat cerita sedramatis
menjawab secepat mungkin dengan kata pertama
mungkin,
yang muncul dalam pikirannya. Kent dan Rosanoff
(1910) memberikan metode asosiasi dengan cita
rasa khas Amerika dengan membuat tabel reaksi
1.000 subjek normal terhadap daftar 100 kata
rangsangan. Tabel-tabel ini dirancang untuk
memberikan dasar untuk membandingkan reaksi
subjek yang normal dan "gila".
Ketika orang Amerika mengejar pendekatan
emotif terhadap tes kepribadian objektif, seorang
psikiater muda dari Swiss, Hermann Rorschach
(1884-1922), mengembangkan sarana yang sama
sekali berbeda untuk mempelajari kepribadian.
Rorschach sangat dipengaruhi oleh pemikiran Jung
dan psikoanalisis, sehingga wajar jika pendekatan
barunya berfokus pada kecenderungan pasien untuk
mengungkapkan konflik terdalam mereka secara
tidak sadar saat merespons rangsangan yang
ambigu. Tes Rorschach dan tes-tes proyektif lainnya
yang dibahas selanjutnya didasarkan pada hipotesis
proyektif: Ketika merespons rangsangan yang
ambigu atau tidak terstruktur, kita secara tidak
sadar mengungkapkan kebutuhan, fantasi, dan
konflik terdalam kita.
Rorschach yakin bahwa orang-orang
mengungkapkan dimensi kepribadian yang penting
dalam tanggapan mereka terhadap bercak tinta. Dia
menghabiskan waktu bertahun-tahun untuk
mengembangkan set yang tepat dari 10 bercak tinta
dan secara sistematis menganalisis respons teman-
teman pribadi dan kelompok pasien yang berbeda
(Rorschach, 1921). Sayangnya, dia meninggal hanya
setahun setelah monografnya diterbitkan, dan
terserah pada orang lain untuk menyelesaikan
karyanya. Perkembangan dalam Rorschach akan
diulas kemudian dalam teks ini. Sementara tes
Rorschach pada awalnya d i r a n c a n g untuk
mengungkap cara kerja terdalam dari subjek yang
tidak normal, TAT, atau Tes Apersepsi Tematik
(Morgan & Murray, 1935), dikembangkan sebagai
instrumen untuk mempelajari kepribadian normal.
Tentu saja, keduanya telah diperluas untuk
pengujian dengan
seluruh kontinum perilaku manusia.
TAT terdiri dari serangkaian gambar yang
86 Bab 2 - Asal-usul Tes Psikologi
disebabkan oleh gen yang tidak aktif. Tes yang
untuk mendiskusikan pikiran dan perasaan,
dilakukannya terdiri dari 48 foto pasien kejiwaan
dan untuk menggambarkan masa lalu, masa
yang dibagi menjadi enam set dari delapan jenis
kini, dan masa depan dari apa yang
berikut: homoseksual, epilepsi, sadis, histeris,
digambarkan dalam gambar.
katatonik, paranoid, manik, dan depresi (Deri,
Murray (1938) percaya bahwa
1949). Dari setiap set delapan gambar, subjek
kebutuhan per- sonalitas yang mendasari,
diinstruksikan untuk memilih dua gambar yang
seperti kebutuhan untuk berprestasi, akan
paling disukainya dan dua gambar yang paling tidak
terungkap dari isi cerita. Meskipun banyak
disukainya. Seorang anak yang secara konsisten
sistem penilaian yang dikembangkan, para
lebih menyukai satu jenis gambar
klinisi pada umumnya mengandalkan analisis
impresionistik untuk memahami protokol
TAT. Aplikasi modern dari TAT akan dibahas
dalam bab selanjutnya.
Teknik melengkapi kalimat juga dimulai
pada era ini dengan karya Payne (1928). Ada
banyak perluasan dan variasi pada teknik ini,
yang terdiri dari memberikan subjeksubjek
sebuah batang seperti "Saya bosan ketika ---,"
dan meminta mereka untuk melengkapi
kalimat tersebut. Beberapa aplikasi modern
akan dibahas kemudian, tetapi dapat
dikatakan sekarang bahwa masalah penilaian
dan inter- pretasi, yang menjengkelkan para
pengembang tes penyelesaian kalimat awal,
masih ada pada kita saat ini.
Sebuah pendekatan yang sama sekali
baru terhadap tes proyektif dilakukan oleh
Goodenough (1926), yang mencoba
menentukan tidak hanya tingkat intelektual
tetapi juga minat dan ciri-ciri kepribadian
anak-anak dengan menganalisis gambar
mereka. Tes Buck (1948), Rumah-Pohon-
Orang, sedikit lebih terstandardisasi dan
terstruktur dan mengharuskan subjek untuk
menggambar rumah, pohon, dan orang.
Proyeksi P e r s o n a l i t a s Machover
(1949) dalam Menggambar Figur Manusia
merupakan perluasan logis dari karya
sebelumnya. Gambar figur sebagai pendekatan
proyektif untuk memahami kepribadian masih
digunakan sampai sekarang, dan bab
selanjutnya membahas perkembangan modern
dalam praktik ini.
Sementara itu, tes proyektif di Eropa
didominasi oleh Tes Szondi, sebuah instrumen
aneh yang didasarkan pada premis-premis
yang sepenuhnya salah. Lipot Szondi adalah
seorang psikiater Swiss kelahiran Hungaria
yang percaya bahwa gangguan kejiwaan utama
Topik 2B - Pengujian dari Awal 1900-an hingga 87
Sekarang
modifikasi instrumen yang dikenal sebagai Strong
dalam enam set diduga memiliki beberapa gen
Vocational Interest Blank
resesif yang membuatnya memiliki simpati terhadap
orang yang digambarkan. Dengan demikian,
preferensi proyektif dianggap dapat mengungkap
gen resesif yang membuat seseorang mengalami
gangguan kejiwaan tertentu.
Deri (1949) mengimpor tes ini ke Amerika
Serikat dan mengubah dasar pemikirannya. Dia
tidak memperdebatkan penjelasan genetik resesif
tentang pilihan gambar tetapi menjelaskan
preferensi tersebut berdasarkan identifikasi yang
tidak disadari dengan karakteristik pasien yang
difoto. Ini adalah dasar teori yang lebih dapat
diterima untuk tes ini daripada teori genetik Szondi
yang meragukan. Meskipun demikian, penelitian
empiris meragukan validitas Tes Szondi, dan tes ini
segera terlupakan.

PENGEMBANGAN INVENTARIS BUNGA


Sementara para klinisi mengembangkan langkah-
langkah untuk menganalisis kepribadian dan
konflik bawah sadar, para psikolog lain merancang
langkah-langkah untuk bimbingan dan konseling
bagi banyak orang. Salah satu yang paling penting
adalah inventori minat, yang berakar dari studi
Thorndike (1912) tentang tren perkembangan
minat 100 mahasiswa. Pada tahun 1919-1920,
Yoakum mengembangkan 1.000 item yang
berkaitan dengan minat sejak masa kanak-kanak
hingga dewasa (DuBois, 1970). Banyak dari item-
item ini dimasukkan ke dalam Inventarisasi Minat
Carnegie. Cowdery (1926-1927) memperbaiki dan
menyempurnakan pekerjaan sebelumnya pada
instrumen Carnegie dengan meningkatkan jumlah
item, membandingkan respons dari tiga kelompok
kriteria (dokter, insinyur, dan pengacara) dengan
kelompok pengawas nonprofesional, dan
mengembangkan formula pembobotan untuk item.
Beliau juga merupakan psikometris pertama yang
menyadari pentingnya validasi silang. Dia menguji
skala barunya pada kelompok dokter, insinyur, dan
pengacara tambahan untuk memastikan bahwa
diskriminasi yang ditemukan dalam penelitian asli
adalah perbedaan kelompok yang dapat diandalkan
daripada kapitalisasi pada varians kesalahan.
Edward K. Strong (1884-1963) merevisi
tes Cowdery dan mengabdikan diri selama 36 tahun
untuk mengembangkan kunci empiris untuk
88 Bab 2 - Asal-usul Tes Psikologi
yang mengukur konsep-konsep umum seperti
(SVIB). Orang yang mengikuti tes ini dapat diberi
responsivitas, dominasi, toleransi, dan fleksibilitas;
skor pada kunci yang terpisah untuk beberapa lusin
dan,
pekerjaan, memberikan serangkaian skor yang
nilainya tak terukur dalam bimbingan vokasional.
SVIB menjadi salah satu tes yang paling banyak
digunakan sepanjang masa (Strong, 1927). Versi
modernnya, Strong Interest Inventory, masih
digunakan secara luas oleh para konselor
bimbingan.
Selama beberapa dekade, satu-satunya pesaing
serius untuk SVIB adalah Kuder Preference Record
(Kuder, 1934). Kuder berbeda dengan Strong
dengan memaksa pilihan dalam tiga serangkai item.
Kuder merupakan tes ipsatif; yaitu membandingkan
kekuatan relatif dari minat dalam diri individu,
daripada membandingkan responsnya terhadap
berbagai kelompok profesional. Revisi terbaru dari
Kuder Prefer- ence Record meliputi Kuder General
Interest Survey dan Kuder Occupational Interest
Survey (Kuder, 1966; Kuder & Diamond, 1979).

MUNCULNYA TES KEPRIBADIAN


TERSTRUKTUR
Dimulai pada tahun 1940-an, tes kepribadian mulai
berkembang sebagai alat yang berguna untuk
evaluasi klinis dan juga untuk menilai spektrum
fungsi normal. Alat yang paling dihormati dan
banyak diteliti dalam genre ini adalah MMPI, yang
pada awalnya dirancang untuk memfasilitasi
diagnosis psikiatri (Hathaway & McKinley, 1940,
1942, 1943). Selanjutnya, aplikasi dari inventori
benar-salah yang berbasis empiris ini telah diperluas
untuk mencakup penilaian penyesuaian pribadi dan
sosial, penyaringan pra-kerja individu dalam posisi
penegakan hukum yang berisiko tinggi, pengujian
pasien dalam pengaturan medis dan
penyalahgunaan obat-obatan, evaluasi orang-orang
dalam proses forensik atau ruang sidang, dan
penilaian mahasiswa untuk konseling karir
(Butcher, 2005). Banyak tes lain yang berguna
mengikuti langkah terobosan ini, yang sekarang
berada dalam edisi kedua (MMPI-2). Beberapa tes
yang banyak digunakan adalah Sixteen Personality
Factor Questionnaire (16PF), sebuah tes yang
berasal dari analisis faktor, yang berguna untuk
mengevaluasi kepribadian normal dan abnormal;
California Psychological Inventory (CPI, Gough,
1987), yang merupakan pengembangan dari MMPI,
Topik 2B - Pengujian dari Awal 1900-an hingga 89
Sekarang
beberapa spesialisasi baru, masing-masing
Myers-Briggs Type Indicator (MBTI; Myers &
McCaulley, 1985), sebuah inventori laporan diri
yang didasarkan pada teori tipe kepribadian Carl
Jung. MBTI digunakan secara luas di lingkungan
perusahaan.
Baru-baru ini, beberapa tes kepribadian
menunjukkan kesetiaan pada teori yang dikenal
sebagai model "5 besar", yang umumnya dipandang
sebagai model konsensus kepribadian (Goldberg,
1990). M e n u r u t pendekatan ini, lima faktor
kepribadian cukup memadai untuk menangkap
domain-domain penting dari fungsi individu.
Faktor-faktor ini adalah neurotisme, ekstraversi,
keterbukaan terhadap pengalaman, keramahan, dan
kesadaran. Kita akan membahas model lima faktor
dalam Bab 8, Dasar-dasar Tes Kepribadian. Tes-tes
yang dihormati dan setia pada pendekatan ini
termasuk NEO-Personality Inventory-Revised
(Costa & McCrae, 1992), the Five-Factor Personality
Inventory (FFPI, Hendriks, Hofstee, & De Raad,
1999), dan the NEO-Personality Inventory-3 (Costa,
McCrae, & Martin, 2005).
Puluhan juta orang menjalani tes kepribadian
setiap tahunnya. Menurut penerbitnya, Myers-
Briggs Type Indicator diberikan kepada lebih dari
1,5 juta orang setiap tahunnya, termasuk karyawan
dari sebagian besar perusahaan Fortune 500. Di
seluruh dunia, diperkirakan 15 juta orang mengikuti
MMPI dalam versi yang berbeda setiap tahunnya
(MMPI-A, untuk remaja, MMPI-2, untuk orang
dewasa) (Paul, 2004). Tes ini telah diterjemahkan
secara luas ke dalam puluhan bahasa (Butcher,
2000). Tes lain yang telah diterjemahkan secara luas
adalah 16 Personal- ity Factor (16PF), yang telah
diadaptasi ke dalam 35 bahasa. Di setiap negara, tes
ini diinterpretasikan sesuai dengan norma-norma
setempat (Cattell & Mead, 2008). Meskipun angka
pastinya tidak tersedia, tidak diragukan lagi bahwa
16PF diambil oleh jutaan orang setiap tahunnya.

PERLUASAN DAN PROLIFERASI


PENGUJIAN
Pada abad kedua puluh satu, jangkauan pengujian
terus meningkat, baik dalam penggunaan klinis
satu-ke-satu maupun dalam pengujian kelompok
untuk aplikasi masyarakat. Mengenai penilaian
satu-ke-satu, psikologi klinis telah melahirkan
90 Bab 2 - Asal-usul Tes Psikologi
(ACT) setiap tahun, dan lebih dari 600.000 ribu
membutuhkan pendekatan yang inovatif
siswa menyelesaikan Ujian Rekor Lulusan setiap
dalam pengujian. Sebagai contoh, dulunya
tahun. Puluhan ribu pelamar juga mengikuti tes
hanya merupakan area fokus dalam praktik
khusus untuk pelatihan profesional seperti MCAT
psiko-logis, neuropsikologi klinis sekarang
(Medical College Admissions Test), LSAT (Law
menjadi domain keahlian yang terdefinisi
School Admis- sions Test), dan GMAT (Graduate
dengan baik dengan tes-tes khusus yang
Management Admissions Test).
digunakan terutama oleh mereka yang
memiliki kredensial yang tepat. Dalam sebuah
buku besar setebal 1.240 halaman, Strauss,
Sherman, dan Spreen (2006) memberikan
norma-norma dan komentar untuk hampir
100 tes dan skala neuropsikologi. Psikologi
kesehatan adalah spesialisasi lain yang sedang
berkembang yang telah menghasilkan banyak
tes baru, seperti yang dibuktikan oleh buku
kembar Measur- ing Health and Measuring
Disease (Bowling, 1997, 2001). Buku-buku ini
merinci ratusan ukuran status kesehatan dan
penyakit, termasuk tes kesejahteraan, ukuran
kualitas hidup, dan skala dampak penyakit.
Spesialisasi tambahan, masing-masing dengan
berbagai tes baru, termasuk psikologi klinis
anak, psikologi fenomenal, dan psikologi
industri-organisasi. Jumlah tes yang tersedia
untuk penilaian klinis secara individu pasti
berjumlah ribuan.
Pengujian kelompok untuk tujuan sosial
yang luas seperti penilaian pendidikan, masuk
ke perguruan tinggi dan sekolah pascasarjana,
dan sertifikasi di bidang p r o f e s i juga terus
berkembang. Pengujian mungkin lebih banyak
digunakan dan lebih penting sekarang
daripada kapan pun dalam sejarah.
Pertimbangkan hanya satu arena untuk
pengujian kelompok, jutaan tes
terstandardisasi yang diselenggarakan setiap
tahun dalam sistem sekolah umum. Menurut
FairTest, sebuah kelompok advokasi nasional
untuk pengujian yang adil dan terbuka, lebih
dari 100 juta tes terstandardisasi-termasuk tes
prestasi, IQ, tes penyaringan, dan tes kesiapan-
diberikan di sekolah-sekolah negeri di
Amerika pada tahun 2007
(www.fairtest.org/testing- explosion-0).
Mengenai tes kelompok untuk penerimaan
perguruan tinggi dan sekolah pascasarjana,
berdasarkan situs web yang relevan, lebih dari
3 juta siswa mengikuti Tes Penilaian Skolastik
(SAT) atau Tes Perguruan Tinggi Amerika
Topik 2B - Pengujian dari Awal 1900-an hingga 91
Sekarang
PRAKTIK BERBASIS BUKTI DAN (EBPP), yang mengamanatkan praktik intervensi
PENILAIAN HASIL yang didukung secara empiris (APA Task Force,
2006). EBPP juga melibatkan penggunaan penilaian
Praktik berbasis bukti merupakan tren penting hasil dengan pasien psikoterapi. Semakin banyak
dalam perawatan kesehatan, pendidikan, dan perusahaan asuransi yang mensyaratkan penilaian
bidang lainnya. Gerakan terbaru ini akan sangat berkala dengan pengukuran hasil yang singkat dan
meningkatkan kebutuhan akan penilaian dengan tes sederhana sebagai syarat untuk penggantian biaya
dan pengukuran hasil. Menurut Institute of yang berkelanjutan. EBPP akan terus berlanjut. Ini
Medicine (IOM, 2001), praktik berbasis bukti akan mendorong peningkatan pengujian dengan
adalah "integrasi bukti penelitian terbaik dengan pengukuran singkat seperti Outcome Rating Scale
keahlian klinis dan nilai-nilai pasien (hal. 147)." (ORS, Miller & Duncan, 2000), sebuah indeks fungsi
Kemajuan praktik berbasis bukti merupakan bagian pasien saat ini. ORS adalah skala analog visual yang
dari tren di seluruh dunia yang mengharuskan terdiri dari empat garis berukuran 10 sentimeter,
adanya bukti bahwa pengobatan dan intervensi yang masing-masing mewakili dimensi
memberikan hasil yang dapat diukur. Tentu saja, kesejahteraan bipolar (individual, interpersonal,
setiap kali pengukuran diperlukan, tes psikologis sosial, dan umum). Pasien cukup memberi tanda
sering kali merupakan pilihan terbaik. Dalam dunia centang pada setiap garis. Jarak dari titik awal dalam
pendidikan, misalnya, undang-undang federal baru- sentimeter adalah skor untuk setiap dimensi. Skor
baru ini seperti No Child Left Behind (NCLB) Act ini dijumlahkan untuk mendapatkan skor total,
(2001), yang mendorong perubahan pendidikan yang dapat berkisar dari 0 hingga 40. Skala ini
berbasis standar, mutlak membutuhkan tes prestasi membutuhkan waktu kurang dari satu menit untuk
akademik secara berkala dengan instrumen yang menyelesaikannya, dan memberikan indeks yang
tervalidasi. Pada tahun 2012, versi revisi NCLB sangat andal dan valid untuk fungsi saat ini (Miller,
disahkan kembali. Undang-undang ini Duncan, Brown, Sparks, & Claud, 2003).
kemungkinan besar akan tetap menjadi kekuatan Kami menyimpulkan bab tentang asal-usul
pendorong di balik peningkatan penilaian tes psikologi ini dengan merujuk pembaca pada
pendidikan di tahun-tahun mendatang. ringkasan tabel singkat tentang peristiwa-peristiwa
Dalam psikologi, gerakan berbasis bukti telah penting yang terdapat pada Lampiran A di bagian
menghasilkan praktik psikologi berbasis bukti akhir buku ini.

Anda mungkin juga menyukai