Anda di halaman 1dari 32

MAKALAH

INSTRUMENTASI TES

PENGETESAN KEMAMPUAN

Dosen Pengampu :
Yuda Syahputra, M.Pd.

Disusun Oleh :
Kelompok 4 (Empat)
Nuraini Az Zahrah 201901500607
Dea Ananda Putri 201901500598
Hernita Zahra 201901500605
Muhammad Rizky Febryanto 201901500610
Kelas R4F

FAKULTAS ILMU PENDIDIKAN DAN PENGETAHUAN SOSIAL


PROGRAM STUDI BIMBINGAN DAN KONSELING
UNIVERSITAS INDRAPRASTA PGRI
KATA PENGANTAR

Alhamdulillahi rabbil ‘alamin, segala puji bagi Allah SWT yang telah
memberi limpahan rahmat, hidayah, serta kekuatan kepada kami sehingga dapat
menyelesaikan penyusunan makalah ini yang berjudul “Pengetesan Kemampuan“.
Shalawat serta salam semoga tercurah limpah kepada Baginda Nabi Muhammad
SAW, serta keluarga, sahabat, dan para pengikutnya.
Makalah ini dibuat untuk memenuhi tugas Mata Kuliah Instrumentasi Tes.
Kami mengucapkan hormat dan terimakasih kepada Bapak Yuda Syahputra,
M.Pd. selaku Dosen Mata Kuliah Instrumentasi Tes.
Dalam materi “Pengetesan Kemampuan ini, akan dibahas mengenai tes
kemampuan individu lainnya sebagai alternatif yang digunakan dalam pendidikan
dan pendidikan khusus. Lalu, apa saja tes-tes standar yang digunakan dalam
bidang pendidikan, masyarakat sipil (pelayanan publik), dan militer. Ketika kita
menggunakan tes, pastinya ada persoalan dalam psikologis serta penyebab dari
perubahan populasi dalam kinerja tes inteligensi kegiatan.
Kami menyadari bahwa dalam makalah ini masih banyak kekurangan,
baik materi maupun penulisannya. Namun demikian, kami telah berusaha dengan
segala kemampuan dan pengetahuan yang kami miliki sehingga dapat
diselesaikan. Oleh karena itu, kami membutuhkan kritik dan saran. Semoga
makalah ini bermanfaat bagi kita semua.

Jakarta, 31 Maret 2021

Penyusun

ii
DAFTAR ISI

KATA PENGANTAR............................................................................................ii

DAFTAR ISI......................................................................................................... iii

BAB I. PENDAHULUAN

A. Latar Belakang..................................................................1

B. Rumusan Masalah............................................................ 2

C. Tujuan Penulisan.............................................................. 2

BAB II. PEMBAHASAN

A. Tes Kemampuan Individu Lain dalam Pendidikan dan


Pendidikan Khusus........................................................... 3

B. Tes Baku dalam Bidang Pendidikan, Pelayanan Publik,


dan Militer...................................................................... 14

C. Persoalan Psikologis dalam Pengetesan Kemampuan....20

D. Perubahan Populasi dalam Kinerja Tes Inteligensi


Kegiatan..........................................................................24

BAB III. PENUTUP

A. Kesimpulan.....................................................................28

B. Saran............................................................................... 28

DAFTAR PUSTAKA ........................................................................................ 29

iii
BAB I
PENDAHULUAN

A. Latar Belakang
Tes adalah alat untuk mengukur suatu hal yang berisikan
pertanyaan-pertanyaan yang harus dijawab dan atau perintah-perintah yang
harus dijalankan oleh testee. Tes ini untuk melihat tingkahlaku, kemampuan,
kebiasaan, minat, bakat, dan apapun yang ada pada diri seseorang. Tujuannya
adaalah untuk didapati suatu hasil yang dibutuhkan untuk penelitian dan data
untuk kebutuhan tertentu. Sedangkan pengertian kemampuan (abilities)
adalah suatu kebisaan, kesanggupan, kedapatan seseorang untuk melakukan
sesuatu. Melekat pada diri seseorang yang berasal dari lahiriah atau alamiah,
dan dapat juga dipelajari sehingga memiliki kemampuan tersebut. Tujuannya
adalah agar dapat melakukan kegiatan fisik dan mental tertentu.
Dengan dijabarkannya pengertian dari tes dan kemampuan di atas,
berarti dapat diketahui bahwa pengetesan kemampuan adalah tes yang
dilakukan untuk mengetahui, mengukur, menilai, dan mendapatkan hasil atau
data mengenai kemampuan seseorang dan kelompok orang. Dalam
pengetesan kemampuan ini, ada banyak sekali tes-tes yang dapat digunakan
untuk mengukur kemampuan seseorang. Tes tersebut diciptakan oleh para
Ahli yang dapat digunakan dan ada juga alternatif lain. Tes tersebut dapat
mengukur semua kalangan, mulai dari pengetesan untuk bayi, anak-anak,
remaja, dan dewasa. Meliputi bakat, minat, inteligensi, kecerdasan, gangguan
belajar, sikap yang baik, dan sebagainya.
Salah satu cara untuk dapat mengetahui kompetensi individu dan
dalam rangka memecahkan masalah individu sebagai peserta didik dan
masyarakat baik masalah pribadi, belajar, sosial, dapat menggunakan tes
psikologi (kemampuan). Tes ini sangat esensial bagi pendidik, konselor, guru
BK, dan orang tua dalam memahami potensi, kemampuan, bakat, dan minat
siswa. Tes digunakan untuk membedakan anak khusus untuk tes penempatan,

1
memahami dirinya, pengambilan keputusan, membantu tugas perkembangan
dan sebagainya. Sampai saat ini tes-tes kemampuan masih digunakan dalam
pendidikan dan masyarakat. Diharapkan mampu menggunakan kedudukan
tes kemampuan dengan baik dalam pendidikan, masyarakat, dan lainnya.

B. Rumusan Masalah
1. Apa saja tes kemampuan individu lainnya yang digunakan sebagai
alternatif dalam pendidikan dan pendidikan khusus?
2. Bagaimana tes standar atau tes baku yang digunakan dalam bidang
pendidikan, layanan sipil (publik), dan militer?
3. Apa saja yang menjadi persoalan psikologis dalam pengetesan
kemampuan?
4. Bagaimana perubahan populasi dalam kinerja tes inteligensi kegiatan?

C. Tujuan Penulisan
1. Memenuhi tugas mata kuliah Instrumentasi Tes materi “Pengetesan
Kemampuan
2. Agar mampu mengerti dan memahami apa saja tes kemampuan individu
yang menjadi alternatif, yang digunakan dalam pendidikan dan pendidikan
khusus secara baik dan benar.
3. Agar mengetahui dan memahami bagaimana penerapan tes standar dalam
bidang pendidikan, pelayanan publik dan militer.
4. Dikuasainya materi pada bab ini.
5. Memanfaatkan materi dan ilmu yang didapat sebagai bekal calon guru
Bimbingan dan Konseling.
6. Mampu menerapkan apa yang sudah diajarkan, minimal yang berkaitan
dalam kehidupan sehari-hari.

2
BAB II
PEMBAHASAN

A. Tes Kemampuan Individu Lain (Alternatif) dalam Pendidikan dan


Pendidikan Khusus
Seperti dicatat dalam Special Educator 2003 Desk Book (Norlin, 2003),
sebuah buku referensi penting dalam pendidikan khusus yang merangkum
keputusan pengadilan baru-baru ini di lapangan, tes harus dianggap valid
untuk siswa tertentu atau tidak dapat digunakan. Dalam kasus ini, Binet dan
Wechsler tampaknya tidak memenuhi standar ini dalam pandangan
pengadilan. Untuk menilai kecerdasan umum pada individu yang relatif
normal atau untuk mendapatkan informasi dasar, skala Binet dan Wechsler
adalah instrumen yang sangat baik. Namun, kedua skala tersebut memiliki
keterbatasan dan tidak berlaku untuk semua individu. Misalnya, sampel
standarisasi tidak memasukkan individu dengan kecacatan sensorik, fisik,
atau bahasa.
Bagaimana, kemudian, dapatkah seseorang dengan adil mengevaluasi
kinerja pada skala Binet dari seseorang yang telah buta seumur hidup?
Bagaimana dengan individu yang tidak dapat berbicara? Jelas, banyak
keadaan muncul di mana skor pada skala mayor tidak mungkin diperoleh atau
sangat bias terhadap individu. Untuk itu, beberapa pengujian individu telah
dibuat untuk memenuhi masalah khusus, mengukur kemampuan spesifik,
atau mengatasi keterbatasan skala Binet dan Wechsler. Tes semacam itu
banyak digunakan dalam pendidikan dan, khususnya, dalam bidang penting
pendidikan khusus.
Ada cukup banyak tes kemampuan individu. Karena banyak yang
dirancang untuk melengkapi atau memberikan alternatif pada skala Binet dan
Wechsler, kami memulai bab ini dengan membandingkan fitur umum tes ini
dengan skala Binet dan Wechsler. Kami melanjutkan untuk membandingkan
tes alternatif satu sama lain, dan kemudian kami membahasnya satu per satu.

3
1. Tes Kemampuan Individu Alternatif Dibandingkan dengan Binet dan
Skala Wechsler
Tes yang dibahas dalam bagian ini dikembangkan baru-baru ini dan
lebih baru serta kurang mapan dibandingkan skala Binet dan Wechsler;
Namun, ini tidak cukup menjelaskan mengapa tidak ada tes individu lain
yang digunakan sebanyak dua skala utama ini. Terlepas dari keterbatasan
skala Binet dan Wechsler, tidak ada alternatif yang jelas lebih unggul dari
sudut pandang psikometri. Meskipun beberapa tes yang terakhir direvisi
cukup baik, beberapa tes alternatif lebih lemah dalam hal keterwakilan atau
kualitas sampel standarisasi. Beberapa kurang stabil, dan sebagian besar lebih
terbatas dalam validitas terdokumentasi mereka. Beberapa memiliki
kekurangan dalam manual tes, seperti instruksi administrasi yang tidak jelas
atau tidak terstandarisasi dengan baik, dan yang lainnya memberikan
informasi yang tidak memadai tentang kecukupan psikometri, penggunaan
yang sesuai, dan batasan.
Seperti skala Wechsler, sebagian besar alternatif berisi skala kinerja
atau subskala. Memang, kelangkaan tugas kinerja pada skala Binet awal
membantu merangsang pengembangan banyak tes kemampuan individu
alternatif. Dalam menyediakan komponen kinerja (banyak alternatif hanya
skala kinerja), alternatif untuk Binet dan Wechsler memiliki relevansi khusus
untuk populasi khusus. Beberapa dirancang untuk populasi khusus, seperti
individu dengan keterbatasan sensorik (misalnya, orang tuli) atau
keterbatasan fisik (misalnya, orang yang lumpuh atau lumpuh sebagian).
Yang lain dirancang untuk mengevaluasi mereka yang memiliki
keterbatasan bahasa, seperti orang-orang yang kehilangan budaya, individu
yang mengalami kerusakan otak, dan individu yang lahir di luar negeri atau
tidak berbahasa Inggris. Yang lain lagi dirancang untuk menilai
ketidakmampuan belajar. Karena pengujian dirancang untuk populasi atau
tujuan khusus, keberadaan alternatif dapat dibenarkan. Namun, kekhususan
mereka seringkali membatasi jangkauan fungsi atau kemampuan yang dapat
mereka ukur.

4
Bagi kami, orang mungkin menganggap spesifikasi yang lebih besar
dari beberapa alternatif sebagai kelemahan sekaligus kekuatan. Meskipun
alternatif mungkin jauh lebih cocok untuk populasi khusus daripada skala
mayor, skor IQ berdasarkan salah satu alternatif, dengan pengecualian yang
jarang, tidak dapat dibandingkan secara langsung dengan skor dari salah satu
skala mayor. Namun, alternatif tersebut seringkali berguna sebagai suplemen
untuk hasil yang diperoleh dengan salah satu skala utama, seperti untuk
tujuan skrining, untuk tindak lanjut atau evaluasi ulang, atau ketika waktu
yang tersedia tidak mencukupi untuk mengelola salah satu skala utama.
Selain itu, jika beberapa pengujian semacam itu digunakan
bersama-sama, batasan di satu pengujian dapat dikurangi atau diatasi dengan
kekuatan tertentu di pengujian lainnya. Karena dirancang untuk populasi
khusus, beberapa alternatif dapat diberikan sepenuhnya tanpa instruksi verbal
(misalnya, melalui pantomim atau instruksi papan tulis) (Naglieri & Ford,
2003).
2. Alternatif dibandingkan dengan Satu Sama Lain
Untuk membuat dan menerbitkan pengujian yang berguna, kita harus
mengembangkan metode yang lebih baik daripada yang tersedia saat ini.
Kami dapat mengembangkan tes untuk mengukur beberapa faktor yang tidak
dimanfaatkan oleh ukuran yang ada atau memberikan tes untuk kelompok
tertentu yang ada. Perbandingan Fitur Umum Alternatif dengan Skala
Wechsler dan Binet;
a. Kerugian dari alternatif
- Sampel standardisasi lebih lemah
- Kurang stabil
- Dokumentasi validitas kurang
- Batasan dalam manual tes Skor IQ yang tidak terdengar secara psikometri
tidak dapat dipertukarkan dengan Binet atau Wechsler
b. Keuntungan alternatif
Dapat digunakan untuk populasi tertentu dan tujuan khusus:
- Batasan sensorik Batasan fisik

5
- Batasan bahasa Orang yang kehilangan budaya
- Orang yang lahir asing
- Orang asing yang tidak bisa berbahasa Inggris
- Tidak terlalu bergantung pada tanggapan verbal
- Tidak tergantung pada integrasi visual-motorik yang kompleks
- Berguna untuk skrining, suplemen, dan evaluasi ulang
- Dapat dilakukan secara nonverbal
Dalam membandingkan tes yang digunakan dalam pendidikan dan
pendidikan khusus selain skala Binet dan Wechsler, kami menemukan bahwa
beberapa tes hanya berlaku untuk anak-anak yang paling kecil, yang lain
untuk anak-anak yang lebih tua dan remaja, dan yang lainnya untuk
anak-anak dan orang dewasa. Dengan begitu, beberapa alternatif timbangan
mayor berbeda dalam rentang usia yang mereka targetkan. Perbedaan penting
kedua menyangkut apa yang diukur. Beberapa dari alternatif mencoba untuk
mengukur keterampilan bahasa atau kosa kata melalui teknik nonverbal,
beberapa untuk mengukur kecerdasan nonverbal atau non-bahasa, dan yang
lainnya untuk mengukur keterampilan perseptual atau motorik. Alternatif
juga berbeda dalam jenis skor yang mereka hasilkan. Beberapa hanya
memberikan satu skor, seperti pada skala Binet awal, sedangkan yang lain
menghasilkan beberapa skor seperti pada skala Binet dan Wechsler modern.
Alternatifnya juga berbeda dalam jenis tanggapan yang dibutuhkan subjek.
Beberapa menyajikan item dalam format pilihan ganda, mengharuskan
subjek memilih atau menunjuk ke alternatif yang benar; yang lain hanya
meminta subjek untuk menunjukkan "Ya" atau "Tidak" dengan cara apa pun
yang memungkinkan.
3. Tes Kemampuan Individu Khusus
Tes kemampuan individu paling awal biasanya dirancang untuk tujuan
atau populasi tertentu. Salah satu yang pertama, Tes Papan Bentuk Seguin
(Seguin, 1907) yang pertama kali diterbitkan pada tahun 1800-an, sebenarnya
mendahului Binet. Tes ini, dari variasi kinerja, hanya menghasilkan satu skor.
Ini terdiri dari papan bentuk sederhana dengan objek dari berbagai bentuk

6
yang ditempatkan di lubang berbentuk tepat (seperti kotak atau lingkaran).
Tes Papan Bentuk Seguin digunakan terutama untuk mengevaluasi orang
dewasa yang terbelakang mental dan menekankan kecepatan kinerja. Versi
tes ini masih tersedia.
Beberapa saat setelah pengembangan tes Seguin, Tes Healy-Fernald
(1911) dikembangkan sebagai tes nonverbal eksklusif untuk remaja nakal.
Meskipun hanya menghasilkan satu skor, Tes Healy-Fernald menyediakan
beberapa jenis tugas, bukan hanya satu seperti dalam Tes Papan Bentuk
Seguin, dan penekanan pada kecepatan kurang. Then Knox (1914)
mengembangkan serangkaian tes kinerja untuk imigran dewasa yang tidak
berbahasa Inggris ke Amerika Serikat. Tes ini adalah salah satu tes pertama
yang dapat dilakukan tanpa bahasa. Kecepatan tidak ditekankan. Singkatnya,
tes kemampuan individu awal selain skala Binet dirancang untuk populasi
tertentu, menghasilkan skor tunggal, dan memiliki skala kinerja nonverbal.
Penekanan pada kecepatan secara bertahap menurun dari tes paling awal ke
tes yang lebih baru. Prosedur awal ini menunjukkan kelayakan untuk
membuat tes kinerja nonverbal individu yang dapat memberikan alternatif
untuk skala Binet yang kemudian bergantung secara verbal. Ini dapat
diberikan tanpa instruksi visual dan digunakan dengan anak-anak maupun
orang dewasa.
4. Timbangan Bayi
Kategori penting dari tes kemampuan individu yang mencoba
mengukur kecerdasan pada bayi dan anak kecil. Secara umum, tidak banyak
gunanya memperkirakan IQ bayi atau balita prasekolah. Namun, jika
dicurigai adanya keterbelakangan mental atau keterlambatan perkembangan,
tes ini dapat melengkapi observasi, tes genetik, dan prosedur medis lainnya.
Dengan begitu, pembahasan kami tentang tes pendidikan dimulai dengan tes
yang dapat digunakan dengan baik sebelum anak memasuki sistem sekolah.
Jenis dan penjelasannya sebagai berikut:
a. Brazelton Neonatal Assessment Scale (BNAS). BNAS adalah tes individu
untuk bayi antara usia 3 hari dan 4 minggu (Botet & Rosales, 1996;

7
Brazelton, 1973, 1984). Ini konon memberikan indeks kompetensi bayi yang
baru lahir. Dikembangkan oleh seorang dokter anak Harvard, skala Brazelton
menghasilkan 47 skor: 27 item perilaku dan 20 respons yang ditimbulkan.
Skor ini diperoleh dalam berbagai bidang, termasuk aspek neurologis, sosial,
dan perilaku fungsi bayi baru lahir. Faktor-faktor seperti refleks, respons
terhadap stres, reaksi mengejutkan, pelukan, kematangan motorik,
kemampuan untuk membiasakan diri terhadap rangsangan sensorik, dan
koordinasi tangan-mulut semuanya dinilai.
b. Gesell Developmental Schedule (GDS) GDS (juga dikenal sebagai
Gesell Maturity Scale, Gesell Norms of Development, dan Yale Tests of
Child Development) adalah salah satu ukuran kecerdasan bayi tertua dan
paling mapan. Pertama kali diterbitkan pada tahun 1925 (Gesell, 1925), skala
Gesell telah menjadi sasaran penelitian dan pemurnian yang ekstensif
(Banerji, 1992a; Gesell, 1925; Rodger, 1994; Williamson, Wilson, Lifschitz,
& Th urbers, 1990). Salah satu ukuran kecerdasan bayi terkemuka dari tahun
1930-an hingga 1960-an, skala Gesell terus digunakan oleh mereka yang
tertarik untuk menilai kecerdasan bayi (Banerji, 1992b; Bernheimer & Keogh,
1988) dan menilai bayi dengan autisme (Abel, & Russell, 2005; Yurong, Dun,
& Xiurong, 2001). Namun, karena skala Gesell menderita dari beberapa
kelemahan psikometri, minat dan penggunaan skala telah menurun meskipun
ada revisi dan perbaikan.
c. Skala Bayley Perkembangan Bayi – Edisi Kedua (BSID-II) Seperti skala
Gesell, Skala Bayley dari Perkembangan Bayi mendasarkan penilaian pada
data perkembangan pematangan normatif. Awalnya diterbitkan hanya empat
tahun sebelum skala Brazelton, skala Bayley adalah produk dari studi selama
40 tahun (Bayley, 1969; Kimble & Wertheimer, 2003). Direvisi pada tahun
1994, BSID-II, atau Bayley-II, dirancang untuk bayi berusia antara 1 dan 42
bulan; itu menghasilkan dua nilai utama (mental dan motorik) dan berbagai
peringkat perilaku. Untuk menilai fungsi mental, Bayley-II menggunakan
ukuran seperti respons bayi terhadap bel, kemampuan untuk mengikuti objek
dengan mata, dan, pada bayi yang lebih tua, kemampuan untuk mengikuti

8
instruksi oral. Inti dari Bayley-II adalah skala motorik karena
mengasumsikan bahwa fungsi mental nantinya bergantung pada
perkembangan motorik (Flanagan & Alfonso, 1995).
5. Ujian Utama untuk Anak Kecil
Pada bagian ini, kami membahas dua tes individu utama yang secara
khusus dikembangkan untuk mengevaluasi kecerdasan pada anak-anak:
McCarthy Scales of Children’s Abilities (MSCA) dan Kaufman Assessment
Battery for Children (KABC).
a. McCarthy Scales of Children’s Abilities (MSCA) Sebagai produk awal
tahun 1970-an, MSCA mengukur kemampuan pada anak-anak berusia antara
2 dan 8 tahun. Secara keseluruhan, skala McCarthy terdiri dari tes
kemampuan manusia yang dibangun dengan hati-hati. Indeks tersebut
mencerminkan seberapa baik anak telah berintegrasi sebelumnya, belajar
pengalaman dan menyesuaikannya dengan tuntutan timbangan. Konsep
menggabungkan berbagai subtes untuk membentuk skor komposit
merupakan ide penting dalam pengujian, dan ini adalah salah satu fitur utama
dari edisi kelima tahun 2003 dari Stanford-Binet.
b. Kaufman Assessment Battery for Children, Edisi Kedua (KABC-II)
Awalnya merupakan produk awal 1980-an, KABC-II versi 2004 modern
adalah tes kemampuan individu untuk anak-anak antara usia 3 dan 18 tahun.
KABC-II terdiri dari 18 sub tes yang digabungkan menjadi lima skala global
yang disebut pemrosesan sekuensial, pemrosesan simultan, pembelajaran,
perencanaan, dan pengetahuan. Ini dimaksudkan untuk penilaian psikologis,
klinis, kelompok minoritas, prasekolah, dan neuropsikologis serta penelitian.
Tes ini juga dimaksudkan untuk memungkinkan evaluasi psikoedukasi
terhadap ketidakmampuan belajar dan anak-anak luar biasa lainnya serta
perencanaan dan penempatan pendidikan.
c. Piagetian Scales. Meskipun dapat diterapkan jauh melampaui tingkat
prasekolah, skala yang dimodelkan pada teori perkembangan Jean Piaget
sejauh ini telah menemukan aplikasi utama mereka di masa kanak-kanak.
skala Piaget adalah ordinal dalam arti bahwa mereka mengandaikan urutan

9
perkembangan yang seragam melalui tahapan yang berurutan. Mereka juga
mengacu pada konten, sejauh mereka memberikan deskripsi kualitatif tentang
apa yang sebenarnya dapat dilakukan oleh anak tersebut.
6. Tes Kemampuan Individu Umum untuk Cacat dan Populasi Khusus
Banyak tes alternatif yang secara khusus dirancang untuk memberikan
ukuran yang lebih valid dari fungsi intelektual untuk kasus-kasus di mana
Binet dan Wechsler mungkin bias atau tidak sesuai. Masing-masing tes
kemampuan individu umum untuk penyandang cacat dan populasi khusus ini
mengandung kekuatan dan keterbatasan unik.
a. Columbia Mental Maturity Scale – Third Edition (CMMS) Bagi anak
yang mengalami keterbatasan fisik (seperti cerebral palsy), gangguan bicara,
keterbatasan bahasa, atau gangguan pendengaran, diperlukan instrumen yang
tidak menimbulkan bias negatif. Pada instrumen tersebut adalah CMMS,
yang dimaksudkan untuk mengevaluasi kemampuan pada anak-anak normal
dan berbagai cacat dari usia 3 sampai 12 tahun. Ketika digunakan untuk
individu dengan kebutuhan khusus, tes seringkali memberikan ukuran
kecerdasan yang lebih sesuai daripada skala yang lebih mapan (Kamhi,
Minor, & Mauer, 1990). Skala Columbia tidak memerlukan respons verbal
maupun keterampilan motorik halus. Disajikan sebagai ukuran kemampuan
penalaran umum, skala tersebut mengharuskan subjek untuk membedakan
persamaan dan perbedaan dengan menunjukkan gambar mana yang tidak
termasuk dalam kartu berukuran 6 kali 9 inci yang berisi tiga hingga lima
gambar, tergantung pada tingkat di culty.
b. Tes Kosakata Gambar Peabody – Edisi Ketiga (PPVT-III) Mirip dengan
skala Columbia dalam beberapa hal, PPVT-III pada awalnya dikembangkan
oleh L. M. Dunn dan I. M. Dunn (1981). Revisi terbaru diterbitkan pada
tahun 1997. Meskipun rentang usia 2 hingga 90 tahun jauh lebih luas
daripada rentang skala Columbia, keduanya merupakan tes pilihan ganda
yang mengharuskan subjek hanya menunjukkan "Ya" atau "Tidak" dalam
beberapa cara. Terutama untuk penyandang cacat fisik atau bahasa, PPVT-III
biasanya tidak digunakan dengan tuna rungu, karena instruksi diberikan

10
dengan suara keras. Meskipun demikian, tes telah digunakan dalam
penelitian dengan tunarungu untuk mengevaluasi kemampuan mereka dalam
mendefinisikan kata (Krinsky, 1990).
c. Skala Kinerja Internasional Leiter-Revisi (LIPS-R) Sementara tes
Columbia dan Peabody mengukur aspek verbal kecerdasan, LIPS-R secara
ketat merupakan skala kinerja. Ini bertujuan untuk memberikan alternatif
nonverbal untuk skala Stanford-Binet untuk rentang usia 2 sampai 18 tahun.
Skala Leiter dimaksudkan untuk memberikan ukuran kecerdasan umum
nonverbal dengan mengambil sampel berbagai fungsi dari memori hingga
penalaran nonverbal. Seseorang dapat mengaturnya tanpa menggunakan
bahasa, dan tidak memerlukan tanggapan verbal dari subjek. Agaknya,
seseorang dapat menerapkannya pada sejumlah besar penyandang disabilitas,
terutama yang tuna rungu dan ketidakmampuan bahasa.
d. Porteus Maze Test (PMT) PMT adalah ukuran kecerdasan kinerja
nonverbal yang populer tetapi tidak terstandarisasi dengan baik. Sejak
pertama kali diterbitkan sekitar waktu Perang Dunia I, ini telah menjadi tes
kemampuan individu yang penting (Krikorian & Bartok, 1998). Sesuai
dengan namanya, PMT terdiri dari masalah labirin. Seperti skala Leiter, tes
Porteus dapat diberikan tanpa instruksi verbal dan dengan demikian dapat
digunakan untuk berbagai populasi khusus (Kugler, 2007; Leshem &
Glicksohn, 2007; Levin, Song, Ewing-Cobbs, & Roberson, 2001; Stevens ,
Kaplan, & Hesselbrock, 2003).
7. Pengujian Lintas Budaya
Ujian terhadap orang-orang dengan latar belakang budaya yang sangat
berbeda semakin mendapat perhatian sejak pertengahan abad. Tes diperlukan
untuk pemanfaatan sumber daya manusia secara maksimal di negara-negara
berkembang baru di Afrika dan di tempat lain. Fasilitas pendidikan yang
berkembang pesat di negara-negara ini membutuhkan tes untuk tujuan
penerimaan serta untuk konseling individu.

11
Ketika seorang individu harus menyesuaikan diri dan bersaing dalam
budaya atau subkultur selain di mana ia dibesarkan, maka perbedaan budaya
kemungkinan besar menjadi kerugian budaya.
Dalam upaya mereka untuk membangun tes yang dapat diterapkan di
seluruh budaya, psikometri telah mengikuti berbagai prosedur. Di antara
tugas yang termasuk dapat disebutkan: mencocokkan warna yang identik,
corak abu-abu, bentuk, atau gambar; menyalin desain blok; penyelesaian
gambar; perkiraan angka; analogi; penyelesaian seri; pengakuan perbedaan
usia; hubungan spasial; pengenalan jejak kaki; kesamaan; memori untuk
sebuah seri; dan klasifikasi hewan menurut habitatnya.
8. Menguji Ketidakmampuan Belajar
Para penulis ini mengidentifikasi beberapa "tanda dari masalah
pembelajaran," termasuk: disorganisasi — misalnya, pekerjaan rumah yang
tidak rapi atau makalah yang kusut atau tidak pada tempatnya; upaya ceroboh
— misalnya, salah membaca instruksi atau salah membaca petunjuk arah;
kelupaan — misalnya, alasan terbaik anak adalah "Saya lupa"; penolakan
untuk mengerjakan tugas sekolah atau pekerjaan rumah — misalnya,
menyerahkan pekerjaan setengah jadi atau membutuhkan seseorang yang
diawasi dengan ketat untuk menyelesaikan tugas; kinerja lambat — misalnya,
membutuhkan waktu jauh lebih lama daripada waktu yang diharapkan untuk
menyelesaikan tugas; perhatian yang buruk — misalnya, pikiran tampak
mengembara atau sering tidak tahu apa yang seharusnya dia lakukan; dan
kemurungan — misalnya, anak menunjukkan kemarahan, kesedihan, atau
mudah tersinggung saat diminta menyelesaikan tugas sekolah atau rumah.
a. Tes Illinois tentang Kemampuan Psikolinguistik (ITPA) Berdasarkan
konsep modern dari pemrosesan informasi manusia, ITPA mengasumsikan
bahwa kegagalan untuk merespon dengan benar terhadap stimulus tidak
hanya dapat dihasilkan dari sistem keluaran (respon) yang rusak tetapi juga
dari sistem input atau pemrosesan informasi yang rusak. Tes Illinois
memberikan tiga sub tes yang mengukur kemampuan individu untuk

12
menerima masukan visual, pendengaran, atau sentuhan secara independen
dari faktor pemrosesan dan keluaran.
b. Woodcock-Johnson III Tes yang jauh lebih baik untuk mengevaluasi
ketidakmampuan belajar adalah Woodcock-Johnson III (Woodcock, McGrew,
& Mather, 2001). Woodcock-Johnson III dirancang sebagai tes yang
diberikan secara individual dengan cakupan luas untuk digunakan dalam
pengaturan pendidikan. Ini menilai kemampuan intelektual umum (g),
kemampuan kognitif khusus, bakat skolastik, bahasa lisan, dan prestasi
(Schrank, McGrew, & Woodcock, 2001).
c. Tes Visiografi Tes visiografik memerlukan subjek untuk menyalin
berbagai desain. Tes semacam itu digunakan dalam pendidikan dan telah
mencapai posisi sentral dalam pengujian neuropsikologis karena
kepekaannya terhadap berbagai jenis kerusakan otak (Jacobson, Delis, &
Bondi, 2002). Ada 3 jenis yaitu; 1) Benton Visual Retention Test (BVRT)
Tes untuk kerusakan otak didasarkan pada konsep defisit psikologis, di mana
kinerja yang buruk pada tugas tertentu terkait dengan atau disebabkan oleh
beberapa defisit yang mendasarinya. 2) Bender Visual Motor Gestalt Test
(BVMGT) Juga digunakan dalam penilaian kerusakan otak, BVMGT
memiliki berbagai kegunaan dan merupakan salah satu tes individu yang
paling populer. Ini terdiri dari sembilan gambar geometris (seperti lingkaran
dan berlian) yang hanya diminta untuk disalin oleh subjek. 3) Tes
Memori-untuk-Desain (MFD) Tes gambar sederhana lainnya yang
melibatkan koordinasi motorik perseptual adalah Tes MFD. Hanya
membutuhkan waktu 10 menit, Tes MFD dapat digunakan untuk individu
berusia 8 hingga 60 tahun.
9. Kreativitas: Torrance Tests of Creative Thinking (TTCT)
Tes Torrance secara terpisah mengukur aspek pemikiran kreatif seperti
fluency, originality, dan flexible (Palaniappan & Torrance, 2001). Dalam
mengukur pengaruh, administrator meminta seseorang untuk memikirkan
sebanyak mungkin solusi yang berbeda untuk suatu masalah. Semakin
banyak solusi berbeda yang dapat ditemukan seseorang, semakin besar

13
pengaruhnya. Untuk mengevaluasi orisinalitas, pembuat pengujian mencoba
mengevaluasi seberapa baru atau tidak biasa solusi seseorang terhadap
masalah.
10. Tes Prestasi Individu: Wide Range Achievement Test-3 (WRAT-3)
Di antara tes prestasi individu yang paling banyak digunakan adalah
WRAT-3, yang konon memungkinkan perkiraan fungsi tingkat kelas dalam
membaca, mengeja, dan berhitung (Kareken, Gur, & Saykin, 1995; Snelbaker,
Wilkinson, Robertson, & Glutting, 2001). Ini dapat digunakan untuk
anak-anak usia 5 tahun ke atas dan memiliki dua tingkat untuk
masing-masing dari tiga bidang pencapaian.
11. Mengukur Kebiasaan, Minat, dan Sikap Belajar
Misalnya, Daftar Periksa Kebiasaan Belajar, yang dirancang untuk
digunakan dengan siswa di kelas 9 sampai 14, terdiri dari 37 item yang
menilai kebiasaan belajar sehubungan dengan pencatatan, bahan bacaan, dan
praktik pembelajaran umum.
Beberapa instrumen menilai sikap dalam mata pelajaran tertentu,
sedangkan yang lain, seperti Survei Sikap Sekolah dan Skala Kualitas Hidup
Sekolah, lingkupnya lebih umum. Survei Kebiasaan dan Sikap Belajar
(SSHA) dan Survei Sikap dan Metode Studi menggabungkan penilaian sikap
dengan penilaian metode studi. SSHA, dimaksudkan untuk digunakan di
kelas 7 sampai perguruan tinggi, terdiri dari 100 item yang memanfaatkan
keterampilan belajar yang buruk dan sikap yang dapat mempengaruhi kinerja
akademik.
Item tes dibagi menjadi enam bidang: Penghindaran Penundaan,
Metode Kerja, Kebiasaan Belajar, Persetujuan Guru, Penerimaan Pendidikan,
dan Sikap Belajar. Tes tersebut menghasilkan skor keterampilan belajar, skor
sikap, dan skor orientasi total.

B. Tes Baku dalam Bidang Pendidikan, Pelayanan Publik dan Militer


Anda pasti pernah mengalami ujian kelompok standar. Tes semacam itu
diberikan di taman kanak-kanak sampai kelas 12. Sebagian besar perguruan

14
tinggi mewajibkan ujian masuk kelompok standar. Salah satu ujian yang
menjadi kutukan banyak jurusan psikologi dan pendidikan adalah Graduate
Record Examination (GRE). Pada tahun 2006, 50 juta GRE dikelola di lebih
dari 180 negara di lebih dari 9000 lokasi di seluruh dunia (Educational
Testing Service, 2007). GRE adalah salah satu tes yang paling banyak
digunakan untuk masuk ke program pascasarjana. Jika Anda berencana untuk
melanjutkan ke sekolah pascasarjana, Anda mungkin akan menghadapi GRE.
Ketika membenarkan penggunaan tes standar kelompok, pengguna tes
sering memiliki masalah dalam mendefinisikan apa yang sebenarnya mereka
coba prediksi, atau apa kriteria tesnya (Th ayer, 1992; Th ayer & Kalat, 1998).
Dengan GRE, kriteria terbaik tampaknya adalah nilai tahun pertama di
sekolah pascasarjana. Namun, GRE biasanya berkorelasi hanya pada remaja
kelas atas hingga usia dua puluhan dengan nilai tahun pertama (Schneider &
Briel, 1990).
Dalam bab ini, kami melanjutkan diskusi kami tentang pengujian dalam
pendidikan, mengevaluasi banyak tes kelompok yang digunakan setiap hari
di sekolah, perguruan tinggi, dan sekolah pascasarjana dan profesional. Kami
juga memeriksa tes standar yang digunakan di layanan sipil dan militer
Amerika Serikat.
1. Tes Baku dalam Bidang Pendidikan
Tes Baku dalam Bidang Pendidikan sebagai berikut:
a. Tes Prestasi VS Tes Bakat. Tes prestasi belajar pertama yang digunakan di
sekolah adalah tes esai. Ini dengan cepat diganti pada tahun 1930-an oleh tes
prestasi standar seperti Tes Prestasi Stanford, yang masih digunakan sampai
sekarang. Tes ini lebih hemat biaya daripada tes esai mereka, dan penilaian
jauh lebih obyektif dan dapat diandalkan. Namun, seperti pendahulunya, tes
prestasi standar memiliki tujuan sebagai evaluasi pengetahuan siswa setelah
kursus standar pelatihan. Dalam tes tersebut, validitas ditentukan terutama
oleh bukti yang berhubungan dengan konten. Dengan kata lain, tes ini
dianggap valid jika mereka secara memadai mengambil sampel domain
konstruksi (misalnya, matematika, sains, atau sejarah) yang sedang dinilai. Di

15
sisi lain, tes bakat mencoba untuk mengevaluasi potensi siswa untuk belajar
daripada seberapa banyak siswa telah belajar. Tidak seperti tes prestasi, tes
bakat mengevaluasi berbagai pengalaman yang diperoleh dengan berbagai
cara. Mereka mengevaluasi efek dari pengalaman yang tidak diketahui dan
tidak terkontrol. Validitas tes bakat dinilai terutama pada kemampuannya
untuk memprediksi kinerja masa depan. Bagi kami, tes tersebut sangat
bergantung pada bukti berorientasi kriteria untuk validitas.
b. Tes Prestasi Kelompok. Seperti yang ditunjukkan sebelumnya, Tes
Prestasi Stanford adalah salah satu tes prestasi standar tertua yang banyak
digunakan dalam sistem sekolah (Gardner, Rudman, Karlsen, & Merwin,
1982). Diterbitkan oleh Psychological Corporation, tes ini diatur dengan baik
dan mengacu pada kriteria, dengan dokumentasi psikometri yang patut
dicontoh. Ini mengevaluasi prestasi di kelas pertama sampai kelas sembilan
di bidang-bidang berikut: ejaan, pemahaman membaca, studi kata dan
keterampilan, seni bahasa, studi sosial, sains, matematika, dan pemahaman
mendengarkan.
Contoh hasil penilaian untuk Tes Prestasi Stanford. Dua tes terkait, Tes
Prestasi Sekolah Awal Stanford – Edisi Kedua (SESAT) dan Tes Stanford
untuk Keterampilan Akademik – Edisi Kedua (TASK), digunakan untuk
memperluas rentang kelas ke taman kanak-kanak hingga ke-12.
Bersama-sama, ketiga tes ini disebut sebagai Seri Prestasi Stanford. Ukuran
pencapaian kelompok lain yang terstandardisasi dengan baik dan secara
psikometri adalah Metropolitan Achievement Test (MAT), yang mengukur
pencapaian dalam membaca dengan mengevaluasi kosa kata, pengenalan kata,
dan pemahaman bacaan. MAT diubah pada tahun 2000, dan versi alternatif
dari tes termasuk Braille, cetakan besar, dan format audio tersedia untuk
digunakan dengan anak-anak yang memiliki keterbatasan visual (Pengukuran
Pendidikan Harcourt, 2000).
c. Tes Kelompok Kemampuan Mental (Kecerdasan). Membahas empat tes
kelompok kemampuan mental: Kuhlmann-Anderson, Henmon-Nelson, Tes

16
Kemampuan Kognitif, dan Tes Kemampuan Kognitif Berkembang. Jenis dan
penjelasannya sebagai berikut:
1) Kuhlmann-Anderson Test (KAT) –Eighth Edition KAT adalah tes
kecerdasan kelompok dengan delapan tingkat terpisah yang mencakup taman
kanak-kanak sampai kelas 12. Setiap level KAT berisi beberapa tes dengan
item yang bervariasi di masing-masing level. Seperti pada kebanyakan
baterai bertingkat yang mencakup banyak rentang usia atau kelas, item KAT
terutama nonverbal pada level yang lebih rendah, yang membutuhkan
kemampuan membaca dan bahasa minimal.
2) Tes Henmon-Nelson (H-NT) Tes kedua yang distandarisasi dengan baik,
sangat digunakan, dan dibuat dengan cermat untuk semua tingkat kelas
adalah H-NT dari kemampuan mental. Meskipun hanya menghasilkan satu
skor yang diyakini mencerminkan kecerdasan umum, dua perangkat norma
tersedia.
3) Tes Kemampuan Kognitif (COGAT) Dalam hal reliabilitas dan
validitasnya, COGAT sebanding dengan H-NT. Berbeda dengan H-NT,
bagaimanapun, COGAT memberikan tiga skor terpisah: verbal, kuantitatif,
dan nonverbal. Reliabilitas (KR20) untuk skor verbal berada di atas, 90-an;
untuk kuantitatif, rendah .90; dan untuk nonverbal, tinggi .90. Pilihan item
COGAT lebih unggul dari H-NT dalam hal memilih anak-anak minoritas,
beragam budaya, dan kurang beruntung secara ekonomi.
d. Tes Masuk Perguruan Tinggi. Tes masuk yang paling banyak digunakan
dan terkenal adalah Tes Penalaran SAT (Scholastic Aptitude Test),
(sebelumnya dikenal sebagai Tes Bakat Skolastik), Tes Kemampuan Sekolah
dan Perguruan Tinggi (SCAT - Cooperative School and College Ability
Tests), dan American College Test (ACT).
1) Tes Penalaran SAT Hingga Maret 1995, Tes Penalaran SAT (SAT-I)
dikenal sebagai Tes Bakat Skolastik. Tes SAT-I tetap menjadi tes masuk
perguruan tinggi yang paling banyak digunakan. Pada tahun tes 2000–2001,
lebih dari 2,1 juta siswa mengikuti SAT-I: Tes Penalaran sebagai bagian dari
proses penerimaan untuk lebih dari 1000 institusi pendidikan tinggi swasta

17
dan publik (Lawrence, Rigol, Van Essen, & Jackson, 2002 ). Bagian utama
dari tes, SAT-V (Verbal) dan SAT-M (Matematika). Bagian verbal sekarang
disebut "membaca kritis", mungkin karena fokus yang meningkat pada
pemahaman bacaan. Memang, pertanyaan pemahaman bacaan mendominasi
bagian ini, dengan 48 pertanyaan dikhususkan untuk pemahaman bacaan dan
19 pertanyaan penyelesaian kalimat.
2) Tes Kemampuan Sekolah dan Perguruan Tinggi (SCAT). Kedua setelah
SAT dalam hal penggunaan adalah SCAT, yang dikembangkan pada tahun
1955. Selain tingkat perguruan tinggi, SCAT mencakup tiga tingkat
pra-perguruan tinggi yang dimulai pada kelas empat. SCAT dimaksudkan
untuk mengukur kemampuan yang dipelajari di sekolah serta potensi individu
untuk melakukan sekolah tambahan.
3) American College Test adalah tes masuk perguruan tinggi (bakat) lain
yang populer dan banyak digunakan. Di beberapa negara bagian (misalnya,
Alabama), sebagian besar siswa mengambilnya. ACT menghasilkan skor
konten tertentu dan komposit. Skor konten dalam bahasa Inggris, penggunaan
matematika, bacaan IPS, dan bacaan sains alam. Dalam mengungkapkan
hasil, ACT memanfaatkan skala Iowa Test of Educational Development
(ITED). Skor pada skala ini dapat bervariasi antara 1 dan 36, dengan standar
deviasi 5 dan rata-rata 16 untuk siswa sekolah menengah dan rata-rata 19
untuk calon perguruan tinggi.
e. Tes Masuk Sekolah Pascasarjana dan Professional.
Jenis dan penjelasannya sebagai berikut:
1) Graduate Record Examination Aptitude Test, lebih dikenal sebagai GRE,
adalah salah satu tes yang paling umum digunakan untuk masuk sekolah
pascasarjana. Ini terdiri dari dua esai yang mengharuskan peserta tes untuk
menganalisis argumen berdasarkan bukti yang disajikan dan untuk
mengartikulasikan dan mendukung argumen (Layanan Pengujian Pendidikan,
2002). Selain tes umum untuk semua jurusan perguruan tinggi, GRE berisi
bagian lanjutan yang mengukur pencapaian setidaknya di 20 jurusan, seperti
psikologi, sejarah, dan kimia.

18
2) Miller Analogies Test Tes masuk sekolah pascasarjana kedua yang utama
adalah Miller Analogies Test. Seperti GRE, Miller Analogies Test dirancang
untuk mengukur bakat skolastik untuk studi pascasarjana. Namun, tidak
seperti GRE, Miller Analogies Test bersifat verbal. Dalam 60 menit, siswa
harus membedakan hubungan logis untuk 120 masalah analogi yang
bervariasi, termasuk item yang paling sulit ditemukan pada setiap tes.
Pengetahuan tentang konten tertentu dan kosakata yang luas sangat berguna
dalam upaya ini. Namun, faktor terpenting tampaknya adalah kemampuan
untuk melihat hubungan dan pengetahuan tentang berbagai cara analogi dapat
dibentuk (dengan suara, angka, persamaan, perbedaan, dan sebagainya).
2. Tes Baku yang Digunakan dalam Sistem Layanan Sipil (Publik)
Tes Standar yang Digunakan dalam Sistem Pelayanan Sipil A.S. Jumlah dan
variasi tes kemampuan kelompok untuk mengukur bakat untuk berbagai
pekerjaan sangat mencengangkan. Baterai Tes Bakat Umum (GATB -
General Aptitude Test Battery), misalnya, adalah tes kemampuan membaca
yang konon mengukur bakat untuk berbagai pekerjaan. Layanan
Ketenagakerjaan A.S. mengembangkan GATB untuk digunakan dalam
membuat keputusan ketenagakerjaan di lembaga pemerintah. Ini mencoba
untuk mengukur berbagai macam bakat dari kecerdasan umum (g) hingga
ketangkasan manual. GATB juga menghasilkan skor untuk koordinasi
motorik, persepsi bentuk (kesadaran akan detail yang relevan dan
kemampuan untuk membandingkan dan membedakan berbagai bentuk), dan
persepsi klerikal (misalnya, kemampuan mengoreksi). Skor juga tersedia
untuk bakat verbal, numerik, dan spasial.
3. Tes Baku yang Digunakan di Militer AS
The Armed Services Vocational Aptitude Battery Designed untuk
Departemen Pertahanan, Baterai Bakat Kejuruan Angkatan Bersenjata
(ASVAB) diberikan kepada lebih dari 1,3 juta orang setiap tahun. Baterai
bakat ganda, ASVAB dirancang untuk siswa di kelas 11 dan 12 dan di
sekolah pasca-sekolah menengah. Tes ini menghasilkan skor yang digunakan
dalam pengaturan pendidikan dan militer. Hasil ASVAB dapat membantu

19
mengidentifikasi siswa yang berpotensi memenuhi syarat untuk masuk ke
militer dan dapat merekomendasikan penugasan ke berbagai program
pelatihan okupasi militer. ASVAB terdiri dari 10 sub tes: ilmu umum,
penalaran aritmatika, pengetahuan kata, pemahaman paragraf, operasi angka,
kecepatan pengkodean, informasi otomotif dan toko, pengetahuan
matematika, pemahaman mekanis, dan informasi elektronik. Sub-tes ini
dikelompokkan ke dalam berbagai komposit, termasuk tiga komposit
akademik — kemampuan akademik, verbal, dan matematika; empat
gabungan pekerjaan — mekanik dan kerajinan tangan, bisnis dan klerikal,
elektronik dan kelistrikan, serta kesehatan dan sosial; dan gabungan
keseluruhan yang mencerminkan kemampuan umum. Karakteristik
psikometri ASVAB sangat baik (Ree & Carretta, 1994, 1995).

C. Persoalan Psikologis dalam Pengetesan Kemampuan


Konsekuensi yang tak terelakkan dari perluasan dan kerumitan penelitian
ilmiah yang terus bertumbuh adalah spesialisasi minat dan fungsi yang terus
berkembang di kalangan para praktisi. Spesialisasi tersebut tampak jelas
dalam hubungan antara tes psikologis dengan pendekatan psikologi
kontemporer (Anastasi, 1967, 1991). Akibatnya, interpretasi-interpretasi
kinerja tes yang ketinggalan zaman dipertahankan tanpa rujukan pada
hasil-hasil dari riset perilaku yang berhubungan dengannya. Isolasi yang
dilakukan terhadap tes psikologis dari bidang lain, dengan konsekuensi salah
penggunaan dan interpretasi, turut menyebabkan ketidakpuasan (diskonten)
terhadap tes psikologis yang dimulai pada tahun 1950-an, mencapai
puncaknya pada tahun 1970-an, dan tetap hidup dalam berbagai konteks
dewasa ini. Pada bab ini, mengilustrasikan bagaimana temuan riset psikologis
dapat mendukung penggunaan tes-tes kemampuan secara efektif dan
membantu memperbaiki kesalahan konsepsi tentang “IQ” dan skor-skor
serupa.
1. Telaah Longitudinal atas Inteligensi Anak-Anak

20
Pendekatan penting terhadap pemahaman akan “inteligensi” konstruk adalah
melalui telaah longitudinal atas individu yang sama selama periode waktu
lama. Bila inteligensi diyakini secara luas sebagai suatu ekspresi potensial
turun temurun, IQ setiap individu diharapkan hampir tetap konstan sepanjang
hidup. Variasi yang diobservasi pada tes ulang berasal dari kelemahan dalam
alat ukur, entah keandalan yang tidak memadai atau seleksi yang jelek atas
fungsi yang dites. Dalam bagian berikut, akan menyelidiki kondisi yang
menyebabkan stabilitas dan instabilitas dari kemampuan yang dites.
a. Stabilitas Kinerja Tes Inteligensi. Ketika proses perkembangan tindih
keterampilan dan pengetahuan sejalan dengan penambahan usia bisa
menyebabkan peningkatan stabilitas skor tes yang diperoleh individu yang
bersangkutan, dua kondisi tambahan pantas untuk dipertimbangkan. Yang
pertama adalah stabilitas lingkungan yang mewarnai tahun perkembangan
dari kebanyakan orang. Misalnya tinggal dengan keluarga yang sama,
sosio-ekonomi sama, dengan begitu anak akan tetap tinggal bersama orang
tua. Lalu tinggal dengan saudara kandung dengan pengalaman anak tunggal
atau tidak punya saudara akan mendapati pengalaman yang berbeda dan
sangat berpengaruh kepda anak, perceraian, ekonomi, perpindahan desa ke
kota, dan sebagainya. Lalu kondisi yang kedua yang mempengaruhi stabilitas
umum dari kinerja tes inteligensi individual menyinggung peran dari
prasyarat keterampilan belajar dalam pelajaran baru. Semakin banyak anak
memiliki keterampilan intelektual dan pengetahuan pada satu titik waktu,
semakin baik dia mampu mendapatkan keuntungan dari pengalaman belajar
yang berikutnya. Konsep tentang kesiapan dalam pendidikan adalah ekspresi
dari prinsip umum ini. Aplikasi dari prinsip yang sama mendasari project
Head Stat dan program kompensasi lain untuk nak-anak prasekolah yang
diragukan dalam pendidikan. Selanjutnya anak harus meguasai bahasa, sikap,
minat, motivasi, gaya, penyelesaian masalah, reaksi kekecewaan, pemahaman
diri, karakteristik kepribadian, dan sebagainya.
b. Instabilitas dari Kinerja Tes Inteligensi. Telaah korelasi atas skor tes
memberikan data aktual, yang dapat diaplikasikan pada prediksi kelompok.

21
Kenaikan atau kemerosotan tajam bisa terjadi sebagai akibat dari perubahan
lingkungan yang besar dalam kehidupan anak. Perubahan drastis dalam
struktur keluarga atau kondisi rumah tinggal, adopsi ke dalam rumah yang
lebih membantu perkembangan, sakit yang parah dan lama, serta program
penyembuhan, merupakan contoh dari peristiwa yang bisa mengubah
perkembangan intelektual selanjutnya dari anak. Akan tetapi, dalam kondisi
yang sama pula, anak tetap dapat meningkatkan atau penurunan besar dalam
skor pada tes ulang. Anak yang lingkungan pendidikannya menguntungkan
cenderung lebih baik skornya daripada anak dengan pendidikan tidak
menguntungkan.
2. Inteligensi dalam Masa Kanak-Kanak Awal
Penilaian inteligensi pada dua ekstrem rentang usia menggambarkan
masalah-masalah interpretatif dan teoretis khusus. Satu dari masalah ini
menyinggung fungsi yang harus dites. Apa sebenarnya yang menentukan
inteligensi untuk bayi dan anak prasekolah, dan orang dewasa?. Dalam
bagian ini, akan dibahas implikasi dari masalah-masalah ini terhadap tes pada
masa kanak-kanak awal dan dewasa.
a. Validitas Prediktif dari tes Bayi dan Prasekolah. Tes yang diberikan pada
tahun pertama usia memiliki sedikit atau sama sekali tidak memiliki nilai
prediktif jangka panjang, memperlihatkan beberapa validitas dalam prediksi
IQ pada usia prasekolah, tapi korelasi memperlihatkan satu penurunan tajam
melebihi poin itu. Lalu kekurangan validitas prediktif di evaluasi lenih lanjut.
Perkembangan anak selanjutnya umumnya ditentukan oleh lingkungan
tempat dia dibesarkan. Ini tidak bisa diharapkan untuk diramalkan oleh tes.
Sesungguhnya, pendidikan orang tua dan karakteristik yang lebih spesifik
lainnya dari lingkungan rumah merupakan peramal yang lebih baik atas level
intelektual berikutnya ketimbang skor tes terhadap bayi.
b. Hakikat dari Inteligensi Masa Kanak-Kanak Awal. Temuan-temuan dari
riset tersebut gagal mendukung konsepsi tentang kemampuan intelektual
yang uniter dan berkembang konstan dalam masa bayi (Lewis, 1973, 1976;
McCall et al., 1972). Korelasi yang tak terelakkan bisa ditemukan selama

22
selang waktu minimal tiga bulan; dan korelasi dengan kinerja pada skala
yang sama atau berbeda pada usia dua tahun dan di atasnya biasanya tidak
signifikan. Lagi pula, ada korelasi kecil antara skala-skala berbeda yang
dilakukan pada usia yang sama.
c. Implikasi atas Program Intervensi. Program intervensi era Head Start
dirancang terutama untuk meningkatkan kesiapan akademik anak-anak dari
latar belakang yang tidak menguntungkan, program-program ini sangat
bervariasi dalam prosedur dan hasil. Proyek yang bermutu tinggi jelas
menetapkan keterampilan intelektual spesifik untuk diperbaiki dan prosedur
pelatihan memadai yang terseleksi. Sebuah proyek jangka panjang yang
sangat menjanjikan berkonsentrasi pada efek perilaku orang tua terhadap
anak berusia 1 dan 2 tahun dalam hal kinerja anak selanjutnya (Hart & Risley,
1995). Data awal sudah memberikan dukungan kuat untuk relasi antara sifat
dan luasnya kontak orang tua dengan perkembangan intelektual anak.
3. Masalah dalam Melakukan Tes Inteligensi pada Orang Dewasa
a. Penurunan Akibat Pertambahan Usia. Ciri khas yang diperkenalkan oleh
skala Wechsler untuk mengukur inteligensi orang dewasa adalah penggunaan
norma mundur untung menghitung simpangan IQ. Skor mencapai puncak
antara usia 20 dan 34 tahun dan selanjutnya merosot terus dalam semua
kelompok usia yang lebih tua. Setiap sampel standarisasi itu hendaknya
mencerminkan karakteristik populasi yang ada pada setiap level usia
(Anastasi, 1956). Bila level pendidikan dari populasi umum telah naik selama
beberapa dasawarsa, pada titik waktu pendidikan kelompok yang lebih tua
akan lebih kurang dibanding kelompok yang lebih muda. Tahun maksimum
dari kegiatan belajar di sekolah ditemukan dalam level 20 sampai 34 tahun,
dan level pendidikan merosot secara konsisten dalam kelompok yang lebih
tua. Perubahan budaya dan faktor pengalaman lain itulah, dan bukan usia saja,
yang mengakibatkan kenaikan maupun kemerosotan dalam skor yang
diperoleh. Selain itu juga karena status kesehatan yang jelek, penyakit khusus,
dan kondisi kepribadian tertentu. Dapat menurunkan motivasi dan
mengurangi keluwesan. Hal ini juga bergantung pada individu tersebut, ada

23
individu yang dapat bekerja dengan baik di usia yang tua seperti usia muda,
dan ada pula individu ketika tua, ia tidak mengaami perubahan berarti serta
ada yang meningkat dalam kinerja tes.
b. Hakikat Inteligensi orang Dewasa. Kebanyakan tes inteligensi mengukur
seberapa baiknya individu memperoleh keterampilan intelektual yang
diajarkan di sekolah; dan mereka dapat pada gilirannya meramalkan seberapa
baiknya mahasiswa dipersiapkan untuk level berikut dalam tangga
pendidikan. Tes-tes untuk orang dewasa, termasuk skala Wechsler, juga
tes-tes PMA yang digunakan dalam Seattle Lngitudinal Study,
menggambarkan tentang pengalaman umum yang dapat diidentifikasi ini.
Begitu individu bertambah usia dan pengalaman pendidikan formalnya
semakin lama ditinggalkan, persediaan pengalaman umum ini bisa menjadi
semakin tidak sesuai untuk menilai fungsi intelektualnya. Kehidupan orang
dewasa lebih kompleks dibandingkan kehidupan sekolah pada masa
kanak-kanak. Pengalaman kumulatif dari masa dewasa bisa merangsang satu
perkembangan dari kemampuan dalam orang yang berbeda. Tes Inteligensi
berkaitan dengan kemampuan akademik; tidak heran kalau ditemukan bahwa
telaah paling dini atas orang dewasa telah memperlihatkan peningkatan usia
yang lebih besar dalam skor di kalangan individu, yang melanjutkan
pendidikan mereka lebih jauh. Semua jenis riset mengemukakan bahwa tes
inteligensi yang naik atau turun sesuai dengan bertambahnya usia dan
pengalaman apa yang didapatkan.

D. Perubahan Populasi dalam Kinerja Tes Inteligensi


1. Skor yang Meningkat
Begitu level pendidikan dari populasi orang dewasa meningkat selama
beberapa dasawarsa, rata-rata kinerja tes inteligensi meningkat sejalan
dengan itu. Akibatnya, orang yang lebih tua dari sampel normatif, yang
mendapatkan pendidikan rata-rata kurang lengkap dibanding anggota yang
lebih muda, mendapatkan skor lebih rendah dibanding mereka yang lebih
muda. Gejala yang sama ditemukan dalam sampel baku dari tes untuk

24
anak-anak. Dalam standarisasi ulang berikutnya atas Stanford-Binet dan
WISC, sampel standarisasi WISC berkinerja jauh lebih baik daripada
Stanford-Binet. Akibatnya adalah anak mana saja akan mendapatkan IQ lebih
rendah jika dites dengan edisi yang direvisi dibanding jika dites dengan edisi
sebelumnya, hanaya karena kinerjanya dinilai dengan norma yang lebih
tinggi. Level pendidikan yang lebih tinggi dari orang tua anak-anak yang
dites dalam sampel WISC merupakan salah satu dari kondisi yang
mempengaruhi kenaikan dalam inteligensi yang dites ini.
Jenis perbandingan ini mungkin menunjukkan telaah longitudinal atas
populasi. Aplikasi biasa dari metode longitudinal dalam riset psikologi
mencakup tes berulang atas individu yang sama sepanjang waktu. Ttapi,
dalam telaah longitudinal atas populasi, populasi itu disampelkan pada
periode waktu yang berbeda. Perbandingan dilakukan antara kelompok orang
yang lahir pada waktu yang berlainan, tetapi di tes pada usiayang sama.
Dengan meningkatnya orang yang yang bisa vaca tulis, level pendidikan
lebih tinggi, dan perubahan kultur lainnya, menjadi jelas bahwa rata-rata
inteligensi yang dites dari populasi umum pada semua usia memperlihatkan
kenaikan yang mantap selama beberapa dasawarsa.
Berbagai prosedur ditempuh dalam telaah perbandingan ini. Satu
prosedur adalah melaksanakan tes identik sesudah selang bebrapa waktu,
sebagaimana dilakukan dalam survei anak-anak. Prosedur lain adalah
memberikan dua tes kepada sampel orang representatif untuk membangun
hubungan antara dua perangkat skor dan dengan demikian “mengalihkan”
kinerja dari satu tes ke tes yang lain. Pendekatan ketiga dan secara teknis
lebih baik didasarkan pada kemapanan dari suatu skala skor bebas-sampel
yang mutlak, melalui penggunaan butir soal jangkar.
2. Skor yang Menurun
Apakah skor tes inteligensi dari populasi yang ada itu naik, menurun
atau stabil sepanjang waktu tergantung pada banyak kondisi?. Periode
wwaktu seiring dengan perubahan kultural, jelas merupakan faktor utama.
Usia orang yang dites juga menghasilkan perbedaan. Misalnya,

25
meningkatnya level pendidikan populasi akan langsung memengaruhi kinerja
tes orang dewasa; tetapi hal itu tidak langsung memengaruhi kinerja
anak-anak, karena anak-anak dalam sampel yang dibandingkan mempunyai
jumlah pendidikan yang sama ketika dites. Pertimbangan lain khususnya bila
menguji subpopulasi terpilih, adalah perubahan apa saja yang dalam tingkat
seleksi pada periode waktu yang berbeda.
Banyak faktor yang berpengaruh besar terhadap kemerosotan skor,
antara lain berkurangnya tekanan pada standar akademik, inflasi tingkatan
dan promosi otonatis, berkurangnya tugas pekerjaan rumah, meningkatnya
kemangkiran (bolos) dari sekolah, berkurangnya perhatian pada penguasaan
keterampilan dan pengetahuan, menonton TV berlebihan, dan pergolakan
sosial dari periode yang bersaing dalam memberi perhatian terhadap
kehidupan siswa.
Selain itu juga banyak siswa yang tidak dipersiapkan dengan baik selam
di sekolah lanjutan dan lalu melamar ke perguruan tinggi, dan sebagainya.
Perubahan dalam populasi siswa mengarah ke perubahan program pendidikan,
yang pada gilirannya mengarah pada kemerosotan skor.

Pemahaman yang tepat atas temuan riset mengenai naik dan turunnya kinerja
tes dari populasi menuntut beberapa jenis informasi terkait. Pertama, tes-tes
khusus yang dilaksanakan harus diidentifikasi, dengan perhatian khusus
kepada liputan mereka atas proses dan isi konten khusus (misalnya,
kecepatan pemahamn, ingatan, komprehensi verbal, orientasi ruang), juga
sumber dari norma-norma mereka. Kedua, tanggal-tanggal mengenai kapan
berlangsungnya tes dan tes ulang harus dilaporkan. Ketiga, data relevan yang
tidak boleh diabaikan mencakup populasi yang disampelkan, juga perubahan
pemilihan sampel dalam tes ulang, seperti hilangnya orang yang bekerja baik,
lebih baik, atau lebih jelek pada mulanya dalam sampel sampel berikutnya.
Keempat, informasi yang harus tersedia tentang perubahan besar budaya apa
pun yang mempengaruhi populasi dalam telaah; semua ini akan merujuk pada
jumlah dan sifat pendidikan, perkembangan dalam komunikasi atau

26
transportasi yang mungkin memengaruhi kontak antar kultural, atau
peristiwa-peristiwa apa saja lainnya dalam riwayat pengalaman dari para
individu yang dapat menggantikan kemaujuan intelektual mereka dalam
jumlah atau arah.

27
BAB III
PENUTUP

A. Kesimpulan
Tes kemampuan individu ini ada banyak sekali, mulai dari penggunaan
untuk bayi, anak-anak, dan dewasa. Secara spesifik, yaitu dari timbangan
bayi dan prasekolah, Timbangan Perkembangan Bayi Bayley, Skala
Kemampuan Anak-anak McCarthy, KABC-II. Secara keseluruhan, tes
kemampuan umum untuk penyandang cacat dan populasi khusus harus
digunakan dengan hati-hati. Di antara tes kemampuan untuk orang cacat,
Skala Kematangan Mental Columbia – Edisi Ketiga, Tes ketidakmampuan
belajar didasarkan pada teori pemrosesan informasi. Tes menggambar seperti
Bender, Benton, dan Memoryfor-Designs, Tes Gestalt Motor Visual Bender.
Meskipun tes prestasi dan kecerdasan sering kali tumpang tindih,
perbandingan keduanya dapat berguna. Tes prestasi individu utama, Wide
Range Achievement Test-3, dapat menyebabkan kesimpulan yang salah
karena beberapa masalah serius.
Melanjutkan diskusi kami tentang pengujian dalam pendidikan,
mengevaluasi banyak tes kelompok yang digunakan setiap hari di sekolah,
perguruan tinggi, dan sekolah pascasarjana dan profesional. Kami juga
memeriksa tes standar yang digunakan di layanan sipil dan militer. Berbagai
persoalan psikologis dalam pengetesan kemampuan yaitu mengalami
hambatan tugas perkembangan, masalah inteligensi anak dan dewasa. Serta
penurunan dan kenaikan skor karena penyebab tertentu.

B. Saran
Dengan dibahasnya materi ini, diharapkan membuat mahasiswa belajar, sadar,
memahami dan harusnya menerapkan dalam kehidupan sehari-hari. Dan juga
dapat bermanfaat dalam memahami mata kuliah dan masa depan nantinya
sebagai Guru Bimbingan dan Konseling.

28
DAFTAR PUSTAKA

Kaplan, Robert M. dan Dennis P. Saccuzzo. 2009. Psychological Testing:


Principles, Applications, and Issues. Seventh Edition. United States: Wadsworth
Cengage Learning.

Anastasi, Anne. 1976. Psychological Testing. Fourth Edition. New York:


Collier Macmilan.

Anastasi, Anne dan Susana Urbina. 2007. Tes Psikologi. Edisi ketujuh. PT
Indeks.

Cohen, Ronald Jay dan Mark E. Swerdlik. 2018. Psychological Testing


And Assesment: An Introduction To Test and Mearsurement. Ninth Edition. New
York: McGraw-Hill Education.

Nurussakinah Daulay. 2014. Implementasi Tes Psikologi Dalam Bidang


Pendidikan. Jurnal Tarbiyah. 21 (2), 403.

29

Anda mungkin juga menyukai