BAB I ............................................................................................................................................................ 1
PENDAHULUAN ........................................................................................................................................ 1
I.Latar Belakang........................................................................................................................................ 1
II. Rumusan Masalah ................................................................................................................................ 2
III. Tujuan ................................................................................................................................................. 2
BAB II........................................................................................................................................................... 2
I. Asesmen bayi dan anak prasekolah .................................................................................................. 3
II. MENGETES ORANG YANG MENGALAMI DISABILITAS .................................................... 34
BAB III ....................................................................................................................................................... 52
PENUTUP .................................................................................................................................................. 52
Kesimpulan ............................................................................................................................................. 52
BAB I
PENDAHULUAN
I.Latar Belakang
Tes populasi khusus digunakan untuk populasi yang memiliki gangguan
penglihatan,bicara,pendengaran,dan intelektual yang tidak normal. Ataupun pada anak-anak atu
1
bayi. Dalam hal ini tentu saja memerlukan pendekatan asesmen pendekatan secara khusus, sebab
memiliki keterbatasan kemampuan berkomunikasi.
III. Tujuan
pada dasarnya tugas ini dibuat sebagai wujud dari pertanggung jawaban kami atas tugas yang
diberikan oleh Dosen pengampu sebagai syarat untuk memenuhi aspek penilaian mata kuliah.
Serta untuk memberikan pemahaman kepada mahasiswa tentang asesmen bayi dan
prasekolah,&cara mengetes orang yang mengalami disabilitas.
BAB II PEMBAHASAN
2
I. Asesmen bayi dan anak prasekolah
Tes individual dan kelompok yang sesuai untuk orang dengan kapasitas normal atau
mendekati normal dalam berbicara, mendengar, melihat, bergerak, dan kemampuan
intelektual umum. Bagaimanapun, tidak setiap orang yang diuji(examinee) masuk dalam
spektrum biasa dari kemampuan fisik dan mental. Berdasarkan alasan usia,
ketidakmampuan fisik, kelemahan bahasa, atau kurangnya kecerdasan, sebuah proporsi
besar dari populasi masuk diluar jangkauan tes dan prosedur tradisional.
Bayi dan anak yang sangat kecil secara pasti membutuhkan pendekatan perkecualian
untuk penilaian karena kapasitas terbatas mereka dalam berkomunikasi. Dalam Topik ini,
Penilaian Bayi dan Anak Pra Sekolah, kami meninjau sifat dan aplikasi alat penilaian
bayi dan masa kanak-kanak dini/awal dan selanjutnya menyelidiki sebuah pertanyaan
fundamental yang berhubungan dengan tes ini: Apakah manfaat praktis dari pengujian
anak di awal kehidupannya?
Secara khusus, apakah terdapat berbagai validitas prediktif untuk hasil tes yang diperoleh
dari bayi atau anak yang belajar jalan? Jika instrument untuk examinee yang sangat kecil
tidak memprediksi hasil penting selanjutnya dalam kehidupan, selanjutnya menggunakan
mereka akan terlihat jadi tidak berarti dan mungkin bahkan menyesatkan. Kami
memeriksa kebingungan ini secara detil. Akhirnya, kami menyimpulkan topik dengan
sebuah diskusi dari sebuah aplikasi penting pengujian anak pra sekolah- screening untuk
kesiapan sekolah. Dalam Topik ini, Menguji Orang dengan Kecacatan, kami menyelidiki
beragam tes yang dibutuhkan untuk penilaian individual dengan kebutuhan khusus.
Kebutuhan khusus ini mencakup spektrum luas, termasuk bahasa, pendengaran, dan
kerusakan visual. Tentu saja, orang dengan kecacatan perkembangan juga membutuhkan
pendekatan khusus pada penilaian, dan kami memberikan pencakupan dari bidang ini
juga. Berdasarkan satu estimasi, sebanyak 7.5 juta warga negara AS menunjukkan
keterlambatan mental, dan 1 dalam 10 keluarga adalah secara langsung dipengaruhi oleh
kecacatan fungsional ini.
3
mengembangkan refleks-refleks dasar, menguasai tonggak perkembangan
(menggengam, merangkak, duduk, berdiri dan seterusnya), belajar sebuah bahasa, dan
membentuk sebuah kapasitas untuk pemikiran simbolis. Untuk sebagian besar anak-
anak, pola dan ruang perkembangan secara jelas dalam batas normal.
Bagaimanapun, orang tua dan profesional yang terlatih dalam penilaian bayi dan
anak-anak pra sekolah kadangkala menghadapi anak-anak yang perkembangannya
nampak lambat, terlambat, atau secara nyata tertinggal. Anak-anak ini mendatangkan
banyak sekali pertanyaan: Bagaimana keterlambatan anak ini? Apakah prospek untuk
fungsi normal di sekolah akankah anak ini mencapai kebebasan personal pada tahun-
tahun dewasa?
Pada ekstrim yang berlawanan adalah anak-anak berkembang terlalu cepat melebihi
anak-anak sesusianya. Dalam kasus ini, orang tua yang bangga memiliki serangkaian
kekhawatiran yang berbeda: Seberapa maju anak saya? Apakah area kelemahan dan
kelebihan dari fungsi intelektual? Akankah anak ini jadi orang dewasa berbakat?
Alat penilaian bayi dan anak pra sekolah bisa membantu menjawab pertanyaan
mengenai anak-anak pada kedua ekstrim spektrum itu- mereka yang mungkin secara
perkembangan terlambat, dan mereka yang mungkin berbakat secara intelektual.
Tentu saja, tes ini juga memberikan informasi berguna mengenai mayoritas cepat
anak-anak yang masuk di tengah-tengah distribusi. Dalam topik ini, kami meninjau
sifat dan aplikasi ukuran bayi dan anak pra sekolah menonjol. Ala ini termasuk tes
individual, jadwal perkembangan, dan skala rating. Kami memulai dengan sebuah
gambaran dari beberapa instrument menonjol dan selanjutnya menyelidiki pertanyaan
fundamental dari tujuan atau kegunaan. Apakah kegunaan ukuran ini? Apakah makna
dari sebuah skor pada sebuah jadwal perkembangan atau tes kecerdasan pra sekolah?
Pada tingkat mana prosedur ini memungkinkan kita untuk meramalkan kemampuan
orang dewasa atau, untuk hal itu, membantu kita untuk memprediksi prestasi sekolah
dini? Pertanyaan ini akan jadi lebih bermakna jika kita pertama meninjau instrument
relevan.
Kami membagi tinjauan kedalam dua bagian: ukuran bayi untuk anak-anak dari lahir
hingga usia 2 ½ tahun, dan tes pra sekolah untuk anak-anak dari usia 2 ½ tahun
hingga 6 tahun. Pembagian adalah kadangkala berubah-ubah, tetapi tidak sepenuhnya
4
demikian. Tes bayi cenderung untuk jadi multidimensi dan memuat secara signifikan
pada perkembangan sensory dan motor. Perolehan kembali pada usia 2 ½ tahun,
ukuran standard Stanford-Binet:Edisi Kelima, Kaufman Assessment Battery for
Children-2, Skala Kemampuan Diferensial, dan Skala McCarthy dari Kemampuan
Anak adalah secara khusus digunakan dalam penilaian anak-anak pra sekolah. Tes ini
banyak memuat keahlian kognitif seperti pemahaman verbal dan pemikiran spatial.
Jadi, skala bayi dan tes sekolah mengukur komponenyg berbeda dari kemampuan
intelektual.
Jadwal Perkembangan Gesell
Didesain untuk mengukur kemajuan perkembangan bayi dan anak-anak dari usia 4
hingga 60 minggu, Jadwal Perkembangan Gesell adalah pertama diperkenalkan di
tahun 1925 dan selanjutnya direvisi secara periodik. Secara virtual semua tes bayi
telah meminjam atau mengadaptasi item-item dari jadwal orisinil yang dirancang oleh
Arnold Gesell (1880-1961), sehingga ini cocok dan tepat dimana kita memulai
tinjauan kita mengenai instrument ini.
Jadwal Perkembangan Gesell memberikan sebuah prosedur yang distandarisasi untuk
mengamati dan mengevaluasi pencapaian perkembangan dari anak-anak dalam lima
area: motor-kotor, motor-halus, perkembangan bahasa, perilaku adaptif, perilaku
sosial-personal. Sebagian besar 144 item dalam jadwal adalah secara murni
observasional, berdasarkan pada inspeksi langsung dari respon anak-anak pada
mainan dan situasi standard. Contohnya, disini adalah beberapa item-item ilustratif
yang secara khusus diberikan oleh bayi usia 40 minggu:
Range usia dari Jadwal Perkembangan Gesell adalah kelahiran hingga 60 bulan.
Genius dari Gesell adalah dalam mengidentifikasi secara alami situasi yang terjadi di
rumah atau klinik dan penggunaan obyek atau tugas dengan daya tarik tinggi bagi
bayi dan anak pra sekolah. Dalam beberapa kasus, informasi dari orang tua atau
pengasuh dibutuhkan untuk menilai item-item individual. Disamping lingkungan
pengujian alami, pengamat yang terlatih dengan baik bisa mendapatkan reliabilitas
antar pemeriksa dalam pertengahan ,90an (Knobloch, Stevens & Malone, 1987).
Jadwal Perkembangan Gesell adalah digunakan utamanya oleh dokter anak dan
spesialis anak lainnya untuk mengidentifikasi bayi dan anak-anak pada resiko
5
kerusakan neurologi dan keterlambatan mental. Gesell tidak pernah bermaksud
membuat jadwalnya sebagai tes kecerdasan. Dia membawa sebuah orientasi biologi
kuat ada penelitiannya dan mengasumsikan bahwa perkembangan formal adalah
pengungkapan kematangan yang terjadi dalam sebuah urutan yang bisa diprediksi.
Gesell menentukan bahwa perkembangan normal adalah sebuah fenomena yang
dikurung-waktu: Variabilitas usia untuk mencapai tonggak perkembangan pada masa
bayi adalah secara umum kecil, pada order beberapa minggu untuk banyak tugas.
Oleh karena itu, keterlambatan serius dalam memenuhi tonggak perkembangan
kronik(sejarah) secara sungguh-sungguh bisa menunjukkan kerusakan neurologi atau
keterlambatan mental. Beberapa studi menunjukkan bahwa Jadwal Perkembangan
Gesell berfungsi baik dalam screening bayi yang beresiko.
Meskipun Jadwal Perkembangan Gesell adalah digunakan utamanya untuk screening
klinis dan diagnosa, Knobloch, Stevens dan Malone (1987) memberikan sebuah basis
yang didefinisikan secara longgar untuk mendapatkan Development Quotients (DQ)
untuk lima area dan perkembangan keseluruhan. Rumusnya adalah sebagai berikut:
DQ=
Usia kematangan adalah berdasarkan pada “gambaran klinis total” dari tonggak
perkembangan yang dilalui dan yang gagal di masing-masing area. Meskipun kriteria
tepat tidak diberikan, Usia Kematangan (Maturity Age) untuk seorang bayi terlihat
jadi usia perkembangan dimana sebagian besar item dilalui. Karena properti teknis
tidak diteliti dengan baik, Development Quotient seharusnya digunakan utamanya
sebagai sebuah alat penelitian.
Tes Gesell secara luas dihargai karena mereka memberikan gambaran detil mengenai
tonggak perkembangan bayi yang tidak disamakan dalam literatur penilaian anak.
Bagaimanapun, penggunaan Gesell sebagai sebuah instrument psikometri telah secara
tajam dikritik di tahun-tahun sekarang. Masalah dasar terlihat jadi sebuah kekurangan
perhatian pada kriteria formal untuk reliabilitas dan validitas. Contohnya, pedoman
Gesell awal secara jarang jika pernah dilaporkan reliabilitas tes-retest. Ketika para
peneliti secara kontemporer memeriksa properti ini dari tes Gesell, hasilnya sangat
mengejutkan. Lichtenstein(1990) melaporkan sebuah korelasi tes-retest hanya .73
dengan sampel 46 anak, yang masuk dibawah level yang direkomendasikan .90 untuk
6
pembuatan keputusan mengenai individual. Benerji (1992) menyimpulkan bahwa tes
Gesell berfungsi secara buruk sebagai sebuah alat screening untuk kesiapan sekolah.
Secara umum, spesialis pendidikan adalah berhati-hati menggunakan Gesell untuk
keputusan mengenai penempatan atau retensi sekolah.
Neonatal Behavioral Assessment Scale (NBAS)
Neonatal Behavioral Assessment Scale (NBAS) adalah unik karena basis
teoritisnya, yang menekankan kebutuhan untuk mendokumentasikan kontribusi
bayi baru lahir pada sistem orang tua-bayi. Dokter anak T. Berry Brazelton
mengembangkan instrumen ini untuk mengidentifikasi dan memahami bayi “yang
menyimpang” dan untuk menggali dampak timbal balik bayi pada orang tuanya :
Sasaran saya dalam menciptakan NBAS adalah asesmen sejauh mana
bayi turut berperan dalam masalah yang muncul saat orang tua menjumpai
bayi yang sulit ditangani atau yang menyimpang. Jika kita dapat
memahami alasan atau penyebab perilaku menyimpang bayi tersebut,
mungkin kita dalam gilirannya nanti, kita bisa membimbing orang tua
untuk mampu memahami perannya dengan lebih baik.
NBAS adalah sesuai untuk bayi hingga usia dua bulan tetapi paling umum
diberikan dalam minggu pertama kehidupan. Ukuran ini menilai daftar perilaku
bayi pada 28 item perilaku, masing-masing diberi skor pada skala 9-point. Contoh
indicator perilaku yang dinilai adalah sebagai berikut:
- Genggaman plantar
- Reflex Babinski
7
- Reflex mencum-cium
- Reflex menghisap
Brazelton dan Nugent (1995) tidak memberikan sebuah sistem penentuan skor
integratif; yaitu, tidak ada skor rangkuman untuk seluruh battery atau
subkomponen. Selain itu, “scoring” dari NBAS terdiri dari sebuah lembar
rangkuman dengan rating pada masing-masing item spesifik. Dalam penelitian
klinis, instrumen digunakan untuk memberikan umpan balik pada orang tua.
Secara spesifik, Brazelton merekomendasikan bahwa profesional perawatan
kesehatan menunjukkan NBAS dengan tujuan untuk membuat peka orang tua
pada keunikan bayi mereka dan untuk mendorong hubungan orang tua-bayi
positif. Mengenai penggunaan klinis tes, Fowles (1999) membandingkan ibu yang
menerima sebuah demonstrasi NABS dengan sebuah grup kontrol yang cocok dan
menunjukkan bahwa grup intervensi selanjutnya menilai bayi mereka sebagai
secara signifikan lebih bisa diprediksi. Jadi, NBAS ditemukan jadi berguna dalam
membantu ibu mengantisipasi respon bayi mereka pada stimuli lingkungan.
Bagaimanapun, berdasarkan pada sebuah tinjauan komprehensif dari studi yang
dipublikasikan, Britt dan Myers (1994) memberikan sebuah tinjauan yang kurang
optimis dari efek intervensi NABS, mencatat penemuan yang tidak konsisten
dalam area seperti interaksi orang tua-bayi, perkembangan bayi, temperamen, dan
sikap bayi dan kepuasannya.
Untuk penelitian pada hasil bayi baru lahir, beragam peneliti telah
mengembangkan sistem scoring untuk NBAS, termasuk sebuah metode scoring
tujuh-kelompok populer oleh Lester (1984). Metode ini memberikan skor
8
rangkuman untuk mengidentifikasi kelompok (kebiasaan, orientasi, kinerja motor,
dorongan/kemampuan, pengaturan, stabilitas otonomi, dan refleks). Menggunakan
pendekatan scoring kuantitatif, para peneliti telah menghubungkan pengenaan
cocaile pra kelahiran pada prestasi inferior dalam NBAS. Selain itu, NBAS adalah
juga sensitif pada efek-efek yang membuat buruk dari polychlorinated biphenyls
(PCR) pada bayi yang terlahir dari wanita yang mengkonsumsi ikan Danau
Ontorio yang terkontaminasi. Brazelton dan Nugent(1995) merangkum studi lain
dengan tes.
Disamping manfaat yang terbukti dari NABS sebagai sebuah alat klinis dan
penelitian, peninjau telah skeptis mengenai sifat-sifat psikometrik instrument.
Contohnya, Majnemer dan Mazer (1998) menunjukkan pada koefisien reliabilitas
tes-retest yang sangat rendah (r=-0.15 hingga +0.32 untuk item-item individual)
dan perjanjian antar penilai lemah. Satu penjelasan memungkinkan adalah bahwa
pada bayi baru lahir, sifat-sifat individual bisa berfluktuasi dengan cepat pada
periode waktu singkat, yang bisa menghasilkan perendahan dari reliabilitas
sebenarnya ketika NABS diberikan dua kali pada satu periode hari atua minggu.
Untuk alasan ini, skor devian dari administrasi tunggal NBAS seharusnya teridak
berlebihan ditafsirkan.
Secara orisinil diluncurkan di tahun 1969, tes Bayley sekarang dalam edisi ketiga
(Bayley, 2006). Sesuai untuk anak-anak usia 1 bulan hingga 42 bulan, instrumen
ini adalah sebuah aliran utama penting untuk evaluasi penundaan perkembangan
pada bayi dan anak yang belajar merangkak. Diketahui secara formal sebagai
Bayle-Scales of Infant and Toddler Development IIII dan secara informal sebagai
Baylay-III, versi yang paling baru mewakili sebuah ekstensi cepat dan revisi
edisi-edisi awal. Contohnya, edisi pertama tes dievaluasi hanya oleh kapasitas
kognitif dan motor bayi, dimana edisi terakhir memberikan untuk penilaian dari
lima domain. Domain kapasitas representative yang diuji adalah:
- Cognitive scale (skala kognitif): 91 soal yang meliputi kepekaan
sensorik, keterampilan perseseptual, atensi, permanensi objek,
9
eskpolasi dan manipulasi, pemecahan puzzle , pencocokan warna, dan
menghitung. Skala ini tidak memuat subteks-subteks yang terpisah.
- Language scale (skala bahasa): 48 soal yang meliputi komunikasi
reseptif dan ekspresif. Soal-soal ini mencakup pengenalan suara,
ekspresi non verbal, mengikuti petunjuk-petunjuk sederhana,
mengidentifikasi gaambaar-gambar yang menunjukkan suatu gerakan
(action), menangani objek, dan menjawab pertanyaan. Skala ini
memberiikan skoring terpisah bagi expressive communication
(komunikasi ekspresif) dan reseptive communication (komunikaasi
reseptif) serta memiliki skor komposit (skor skala secara keseluruhan)
- Motor scale (skala motoric): 138 soal yang berkaitan dengan
keterampilan motoric kasar dan keterampilan motoric halus. Soal-soal
ini meliputi manipulasi objek, kemampuan fungsional tangan, control
postur, pergerakan dinamik, dan perencanaan motoric. Skala ini
memberikan skoring terpisah bagi motoric kasar dan motoric halus.
- Social emotional scale (skala social-emosional): 35 soal yang meliputi
penggunaan emosi secara interaktif dan bermakna, kemampuan
menggunaakan perasaan, dan koneksi antara ide dan emosi. Skala ini
tidak memuat subtes-subtes yang terpisah.
- Adaptive behavior scale (skala perilaku adaptif): para pengasuh bayi
mengisi item-item pada skala 4 poin, yakni 0 (tidak mampu), 1 (tidak
pernah saat dibutuhkan), 2 (terkadang saat ddibutuhkan), atau 3 (selalu
saat dibutuhkan).
10
tantangan yang sulit. Meskipus demikian, banyak perencang tes telah berusaha
menjawab tantangan tersebut. Bahkan suatu tinjuan singkat mengenai instrument-
instrumen tersebut akan menghabiskan satu bab penuh. Kami memberikan sebuah
rangkuman singkat mengenai pendekatan yang popular. Sebagai besar instrument
tersebut melibatkan observasi atau pemberian tugas-tugas sederhana ke peserta
tes.
11
Anak-anak pra sekolah menunjukkan variabilitas luas dalam kematangan emosi dan
keresponsivan pada orang dewasa. Salah satu anak bisa mengembangkan diri supaya
lebih menarik pada pemeriksa dan berusaha untuk tampil optimal di semua pertanyaan.
Anak lain bisa diam di lantai daripada berusaha untuk secara sederhana menghambat
tugas desain. Untuk anak pertama, kita bisa menjamin bahwa hasil tes adalah sebuah
indeks yang tepat dari fungsi kognitif. Tetapi untuk anak kedua, ketidakpastian berlaku.
Apakah ketidakresponsivan menunjukkan kurangnya keahlian atau kurangnya
kerjasama? Dengan anak-anak pra sekolah, sebuah kerendahan hati yang besar
dibutuhkan untuk pemeriksa.
Bahaya khusus dalam penilaian pra sekolah adalah bahwa pemeriksa bisa menyimpulkan
bahwa sebuah skor rendah menunjukkan fungsi kognitif rendah ketika, dalam
kenyataannya, anak hanya tidak bisa untuk duduk diam, memperhatikan, bekerjasama,
dll. Penilaian anak pra sekolah perlu untuk didekati dengan kehati-hatian yang tidak biasa
untuk menghindari konsekuensi negatif dari pemberian label dan diagnosa berlebih dari
kondisi ketidakmampuan.
Terdapat beberapa tes kecerdasan yang diberikan secara individual yang sesuai untuk
anak-anak pra sekolah. Instrumen yang paling umum digunakan termasuk: …
KABC-2 digambarkan dalam bab sebelumnya. Kami akan fokus pada McCarthy Scales
of Children’s Abilities, Differential Ability Scales, WPPSi-III, dan SB5 awal.
McCarthy Scales of Children’s Ability
McCarthy Scales of Children’s Ability (MSCA) adalah sebuah tes kecerdasan yang
diberikan secara individual yang didesain untuk anak usia 2 ½ hingga 8 ½ tahun. Tes
terdiri dari 18 subtes terpisah, seperti yang di daftar dalam Tabel 7.2. Subtest
memberikan kontribusi pada skor pada lima skala, masing-masing skala diperoleh dari
tiga hingga tujuh subtest: Kuantitatif Perceptual-Performance Verbal, memori, dan motor.
Selain itu, sebuah Indeks Kognitif Umum dengan mean 100 dan standard deviasi 16
dihitung dari 15 subtest. Tes didesain untuk memberikan sebuah pemahaman baik anak-
anak normal dan mereka dengan ketidakmampuan belajar. McCarthy (1972) menekankan
pertimbangan fungsional seperti keinginan untuk mengidentifikasi secara klinis dan
secara pendidikan kelemahan kognitif relevan secara pendidikan sebagai kriteria utama
untuk seleksi item dan pengelompokan subtest pada Skala McCarthy.
12
Sampel standarisasi 1,032 anak terdiri dari kurang lebih 100 subyek pada setengah tahun
penambahan dari usia 2 ½ hingga 5 ½ dan penambahan setahun penuh dari 5 ½ hingga 8
½. Pada masing-masing level usia, sampel secara kasar distratifikasi pada variabel berikut
ini sesuai dengan Sensus AS 1970: jenis kelamin, ras (kulit putih-non kulit putih),
wilayah geografis, level pekerjaan ayah, dan tempat tinggal di desa-kota. Anak-anak
dengan masalah mental atau emosi parah dikeluarkan, dan subyek bilingual dimasukkan
hanya jika mereka bisa bicara dan memahami bahasa Inggris. Tentu saja, sebuah masalah
potensial dengan McCarthy Scales adalah bahwa data normative, dikumpulkan di awal
1970an, adalah cukup tidak kuno.
Penemuan reliabilitas untuk McCarthy Scales memberikan sebuah gambaran campuran.
General Cognitive Index tampil dengan baik, dengan rata-rata reliabilitas dibagi-
setengah(split-half) sekitar .93 dan rata-rata koefisien test-retest satu bulan sekitar .90.
Reliabilitas untuk lima skala dari .79 hingga .88, sedangkan koefisien test-retest berkisar
dari .69 hingga .89. reliabilitas untuk 18 subtest individual adalah secara substansial lebih
rendah, sehingga pemeriksa bisa berhati-hati untuk tidak menempatkan terlalu banyak
penekanan pada pola dan perbedaan subtest.
Sayangnya, turunan berbasis secara klinis dari lima skala McCarthy belum dikonfirmasi
oleh studi faktor-analitis, memberikan keraguan pada validitas konsep dari instrument ini.
Meskipun lima faktor (yang berhubungan dengan lima-skala) adalah ditemukan pada
sebagian besar grup usia dalam sampel standarisasi (Kaufman, 1975), studi selanjutnya
belum direplikasi penemuan orisinil. Contohnya, Forns-Santacana dan Gomez-
Benito(1990) menemukan lima faktor dalam sampel 141 4- dan 5- tahun, tetapi faktor ini
tidak berhubungan dengan penghentian yang diajukan oleh McCarty. Para peneliti
lainnya melaporkan contoh serupa dari kegagalan untuk menegaskan distribusi orisinil
dari subtest.
Kebingungan mengenai struktur faktorial yang ditunjukkan McCarthy Scales dimana
pemeriksa harus hati-hati mengenai analisa profil yang bergantung pada lima skala yang
sebelumnya didaftar (Verbal, Perceptual, Kinerja, Kuantitatif, Memori dan Motor).
Dalam banyak contoh dan beberapa kelompok usia, scale bisa jadi ukuran yang lebih baik
dari kemampuan kognitif umum dibandingkan kemampuan spesifik yang ditunjukkan
berdasarkan nama-nama scales (Sattler, 1988).
13
Pada sisi positif, McCarthy Scales berfungsi dengan baik sebagai prediktor kesiapan
sekolah dan prestasi sekolah selanjutnya untuk anak-anak TK. Massoth dan Levenson
(1982) menguji 33 anak dengan MSCA pada masa TK dan mengkorelasi skor ini dengan
hasil sebuah tes kesiapan membaca yang diberikan satu tahun kemudian dan juga dengan
level pencapaian pada penyelesaian kelas satu. Secara menarik, korelasi terkuat adalah
dengan Skala Kuantitatif, dimana Skala Verbal buruk sebagai sebuah prediktor dari
kesiapan sekolah atau prestasi membaca (Tabel 7.3). Kemampuan perceptual dan
kemampuan analitis yang diukur oleh McCarthy Scales terlihat jadi prediktor kesiapan
membaca dan prestasi yang merupakan tugas verbal. Tindak lanjut enam tahun dari
subyek yang sama menunjukkan secara mengejutkan korelasi tinggi antara McCarthy
Scales yang diberikan pada masa TK dan prestasi sekolah di kelas enam. Skala
Kuantitatif menunjukkan korelasi terkuat dengan grade mata pelajaran (r=.60), dimana
Skala Verbal adalah sebuah prediktor lemah (r=.40). Skala Kuantitatif akan terlihat jadi
sebuah tes screening sempurna untuk anak-anak pra sekolah.
Rangkumannya, McCarthy Scale memberikan sebuah indeks yang berharga dan prediktif
dari fungsi intelektual, khususnya untuk anak-anak usia 5 hingga 6 tahun. Instrument juga
sebuah alat sempurna untuk menilai kecerdasan umum, meskipun ini bisa merendahkan
fungsi anak pra sekolah dan anak dengan ketidakmampuan belajar dan keterlambatan
mental. Norma untuk tes adalah sekarang secara buruk kuno. Disamping itu, skor
keseluruhan pada MSCA berhubungan secara erat dengan Full Scale IQ pada WPPSI-R.
Meskipun demikian, McCarthy Scales perlu untuk direvisi dan distandarisasi kembali.
14
Subtes battery pra sekolah terdiri dari subtes “inti” dan “diagnostik”. Subtes inti
adalah sangat jenuh dengan faktor g dan digunakan untuk mendapatkan dua skor
area (Verbal dan non Verbal) dan sebuah skor campuran keseluruhan dikenal
sebagai General Conceptual Ability (GCA). Skor area dan GCA adalah
berdasarkan pada mean 100 dan standard deviasi 15. Subtest diagnostik mengukur
memori jangka pendek dan kecepatan pemrosesan informasi. Mereka digunakan
untuk analisa klinis saja. Subtes diagnostik adalah kurang bergantung pada faktor
g dan, oleh karena itu, tidak menggambarkan campuran keseluruhan.
Reliabilitas skor DAS adalah dapat dihargai untuk instrument yang digunakan
pada level pra sekolah. Untuk anak pra sekolah, reliabilitas GCA dilaporkan jadi
.90 hingga .94. Untuk anak pra sekolah yang lebih besar (3 ½ hingga 6 tahun)
skor kelompok Verbal dan Nonverbal menunjukkan reliabilitas .88 dan .89,
masing-masing. Studi validitas yang bersamaan adalah sangat suportif dari DAS,
dengan korelsai .70s dan .80s dengan ukuran kecerdasan dan prestasi pra sekolah
lainnya. Sebuah studi oleh Dumont, Cruse, Price dan Whelley (1996) memberikan
dukungan yang sangat kuat untuk validitas DAS dengan memberikan sebuah pola
konfirmasi dari korelasi antara instrument ini dan WISC-III untuk 53 anak yang
diidentifikasi sebagai memiliki ketidakmampuan belajar. Hasilnya dirangkum
dalam Tabel 7.5 dan menunjukkan komponen serupa yang berkorelasi secara
lebih kuat dibandingkan komponen yang tidak sama untuk dua tes. Juga, tabel
menunjukkan bahwa skor keseluruhan adalah sangat serupa, rata-rata, untuk DAS
(mean CGA 87.2) dan WISC-III (mean IQ 89.7). DiCerbo dan Barona (2000),
Elliott (1997) dan Gordon dan Elliot (2001) menggambarkan studi validitas
tambahan untuk instrument halus ini.
15
WPPSI-III dibagi menjadi dua range usia: usia 2-6 hingga 3-11, dan usia 4-0
hingga 7-3. Battery untuk grup yang lebih muda termasuk empat subtest inti dan
satu subtest tambahan. Singkatnya, battery ini terdiri dari Receptive Vocabulary
dan subtest Informasi, dimana IQ verbal adalah dihitung, subtest Block Design
and Object Assembly, dimana IQ Performance dihitung. Subtest tambahan
Pemberian Nama Gambar bisa diganti untuk kosakata reseptif atau inforasi
reseptif. Battery untuk anak yang lebih besar adalah jauh lebih komprehensif dan
terdiri dari tujuh subtest inti, lima subtes tambahan, dan dua subtest pilihan.
Diskusi kita disini berhubungan hanya dengan battery untuk anak yang lebih
besar, usia 4-0 hingga 7-3. Struktur WPPSI-III untuk grup usia ini ditunjukkan
dalam Tabel 6.
• Standford-Binet Intelligence Scales untuk Masa kanak-kanak dini/awal
Diketahui secara informal bahwa SBS awal, Stanford-Binet Intelligence Scales
untuk masa kanak-kanak awal mengkombinasikan subtest dari Stanford-Binet
Intelligence Scales, edisi ke 5 (SB5) dengan Datar Pemeriksaan Observasi Test
dan sebuah software untuk laporan Induk. Subtest SB5 digambarkan dalam studi
sebelumnya. Kami fokus disini pada Daftar Pemeriksaan Observasi Tes(TOC)
yang merangkum informasi esensial mengenai perilaku pelaksanaan-tes anak-
secara khusus, perilaku yang bisa jadi memiliki dampak besar pada skor tes.
Early SB5 dikembangkan untuk anak-anak berusia 2 tahun hingga 7 tahun dan 3
bulan. Ini secara tepat range usia dimana level sebenarnya anak dari fungsi bisa
jadi secara radikal direndahkan karena masalah perilaku seperti kekacauan,
toleransi frustasi rendah, atau non pemenuhan. Contohnya, banyak anak pra
sekolah secara sederhana berhenti merespon ketika item-item subtest menjadi
sulit- mereka bisa terlihat down, atau menjauh, atau menawarkan sebuah
komentar pada topik yang tidak terkait. Perilaku yang tidak tunduk dari sifat ini
adalah umum; dalam kenyataannya, penolakan kadangkala adalah dilaporkan
dalam 41 persen anak kecil. Tetapi sebuah penolakan bisa berarti banyak hal.
Mungkin anak benar-benar tidak tahu jawabannya; atau mungkin anak tahu
jawaban tetapi bosan dengan tes, atau takut untuk coba-coba menebak, atau secara
sederhana bingung. Pemeriksa tidak akan pernah tahu secara pasti, tetapi terdapat
16
sebuah kesempatan yang baik bahwa kemampuan kognitif yang sebenarnya dari
seorang anak yang tidak mau tunduk akan jadi diremehkan. Tujuan dari TOC
adalah untuk memberikan sebuah format kualitatif tetapi sangat terstruktur untuk
menggambarkan sebuah range luas dari perilaku, termasuk non pemenuhan,
diketahui mempengaruhi kinerja tes.
Perilaku pelaksanaan tes didaftar pada TOC dibagi kedalam dua grup: (1)
Karakteristik, dan (2) Perilaku Spesifik. Yang sebelumnya adalah sifat-sifat
umum yang paling mungkin ditemukan di banyak situasi, dimana yang terakhir
adalah perilaku spesifik secara aktual yang diamati selama sesi pengujian. Fokus
TOC adalah perilaku yang secara negatif berdampak pada kinerja tes. Banyak
karakteristik dan perilaku adalah dinilai pada satu kesatuan, dimana yang lainnya
adalah kategorikal.
TOC membantu pemeriksa mengidentifikasi perilaku problematis yang bisa
mempengaruhi validitas dari hasil tes. Tetapi ini adalah bukan satu-satunya tujuan
dari instrument ini. Selain itu, dokumentasi masalah perilaku ini bisa terbukti
membantu dalam deteksi dini dari kesulitan perkembangan seperti
ketidakmampuan belajar, masalah perilaku, kesulitan perhatian, fungsi kognitif
garis batas, dan defisit neuropsikologikal.
17
Sejarah penilaian anak telah menunjukkan watku dan sekali lagi, secara umum,
skor tes yang diperoleh di tahun pertama atau kedua kehidupan menunjukkan
validitas prediktif yang minimal. Adanya catatan muram ini dari kegagalan
berulang validitas prediktif, kita harus menanyakan sebuah pertanyaan penting:
apakah tujuan dan manfaat praktis dari penilaian bayi? Dalam kenyataannya, tes
bayi memiliki sebuah peran penting tetapi terbatas untuk dimainkan. Kami
kembali pada masalah itu setelah tinjauan studi prediktif.
18
pada anak-anak pra sekolah dan pada masa kanak-kanak selanjutnya. Semakin
besar anak dalam tes awal, semakin kuat hubungan dengan IQ selanjutnya. Dalam
kenyataannya, hasil menyatakan bahwa IQ menjadi secara layak stabil, rata-rata,
pada usia 8 tahun.
Secara kolektif, penemuan ini bahwa tes bayi secara umum memiliki nilai
prognostik buruk, dimana tes anak pra sekolah adalah secara menengah prediktif
dari kecerdasan selanjutnya. Ini membawa kita kembali pada pertanyaan yang
diberikan pada awal bagian ini: Apakah tujuan dan manfaat praktis penilaian
bayi?
Manfaat Praktis Infant Scales
Penggunaan yang paling penting dan bagus dari tes bayi adalah screening untuk
ketidakmampuan perkembangan. Deteksi awal dari anak pada resiko untuk
keterlambatan mental adalah vital karena ini memberikan intervensi awal dan,
konsekuensinya, memungkinkan untuk perbaikan hasil selanjutnya dalam
kehidupan. Meskipun tes bayi yang ada adalah prediktor buruk dari masa kanak-
kanak dan kecerdasan orang dewasa, sebuah perkecualian pada aturan ini adalah
dijumpai untuk bayi yang mendapatkan skor sangat rendah pada tes Bayley dan
tes screening lainnya. Contohnya, bayi yang mendapat skor dua atau lebih banyak
standard deviasi dibawah mean Bayley orisinil (1969) dan Bayley-II, khususnya
pada Skala Mental, menunjukkan sebuah probabilitas tinggi dari memenuhi
kriteria untuk keterlambatan mental selanjutnya pada masa anak-anak. Tidak ada
penelitian longitudinal dengan Bayley-III terbaru, tetapi tes ini kemungkinan
memiliki validitas prediktif yang bagus untuk skor rendah juga.
Dengan anak-anak beresiko, korelasi antara skor tes bayi dan IQ selanjutnya masa
anak-anak adalah jauh lebih kuat dibandingkan untuk sampel anak normal.
Penemuan yang lebih konsisten adalah bahwa skor yang sangat rendah pada tes
bayi- dua atau lebih standard deviasi dibawah mean- secara akurat meramalkan
keterlambatan mental pada masa anak-anak. Contohnya, studi dengan Denver
Developmental Screening Test-Revised (karena di revisi dan dipublikasikan
sebagai Denver II) menunjukkan tingkat positif salah dari hanya 5 hingga 11
19
persen, makna dimana bayi dan anak pra sekolah yang diidentifikasi sebagai
beresiko untuk keterlambatan mental jarang mencapai range normal fungsi
kognitif pada masa kanak-kanak. Sebagian besar studi dengan Bayley Test juga
sesuai dengan pola ini. Contohnya, VanderVeer dan Schweid (1974) menemukan
bahwa 23 anak kecil dengan keterlambatan mental ringan, menengah dan parah
yang dikonfirmasi oleh Baylay apda usia 18 hingga 30 bulan terus untuk
memberikan sebuah diagnosa keterlambatan mental pada satu hingga tiga tahun
berikutnya. Meskipun beberapa anak dengan keterlambatan mental menengah dan
parah berfungsi pada level yang lebih tinggi (keterlambatan ringan), tidak ada
anak dengan keterlambatan mental awal adalah normal pada tindak lanjut. Dalam
sebuah penemuan yang agak berlawanan, Hack, Taylor, Drotar, dll (2005)
melaporkan bahwa skor yang sangat rendah pada Bayley II untuk bayi berat lahir
rendah yang dites pada 20 bulan usia tidak secara kuat memprediksi skor rendah
pada K-ABC pada usia 8. Penemuan ini adalah bersifat menasehati, bukan
definitif, sejauh K-ABC bukan sebuah kriteria yang bagus untuk keterlambatan
mental.
20
Tes bayi yang dibahas dalam bab ini bisa digambarkan sebagai tradisional, dalam
kesan bahwa metode mereka adalah hasil pertumbuhan alami dari sweep panjang
dari tes kecerdasan individual yang menjangkau bagian belakang di awal 1900an.
Tetapi mungkin pendekatan baru adalah dibutuhkan dengan bayi. Lewis telah
menyatakan bahwa tes bayi tradisional mengabaikan perilaku pemrosesan
informasi awal, seperti memori pengenalan dan sifat penuh perhatian pada
lingkungan, yang mungkin lebih baik memprediksi fungsi kognitif masa anak-
anak (Lewis & Sullivan, 1985). Dalam satu studi, kebiasaan visual sederhana
pada sebuah stimulus baru (diukur oleh durasi fiksasi) yang dinilai pada 3 bulan
usia terkorelasi .61 dengan skor Mental Bayley pada usia 24 bulan. Fagan dan
McGrath(1981) melaporkan penemuan serupa. Dalam studi mereka, bayi pertama
mengamati sebuah gambar wajah bayi untuk waktu singkat dan selanjutnya
ditunjukkan gambar yang asma bersama dengan gambar dimana dia tidak lazim
dengannya(contohnya, gambar pria kepala botak). Penyelidik terus
memperhatikan track gambar mana yang lebih banyak dilihat bayi. Logika
prosedur adalah sederhana melihat utamanya pada gambar baru menegaskan
bahwa bayi mengenali gambar lama, yaitu, seorang bayi dengan memori
pengenalan yang baik memilih untuk melihat pada sesuatu yang baru. Pilihan
untuk kebaruan- seperti yang diukur oleh waktu fiksasi visual pada gambar baru-
dengan demikian menjadi sebuah indeks memori pengenalan awal. Tahun-tahun
berikutnya, investigator memberikan Peabody Picture Vocabulary Test (PPVT)
untuk mengukur kecerdasan anak awal. Skor memori pengenalan bayi dan skor
PPVT anak awal terkorelasi .37 pada usia 4 tahun dan .57 pada usia 7 tahun.
Korelasi ini kemungkinan merendahkan validitas prediktif tes memori bayi sejauh
indeks memori bayi adalah sebuah prosedur yang tidak bisa diandalkan
berdasarkan pada jumlah item tes yang kecil. Lebih lanjut, para peneliti menilai
hanya bayi normal, yang selanjutnya melemahkan korelasi potensial antara
prediktor dan kriteria. Ukuran kognitif bayi akan terlihat jadi prediktor yang
menjanjikan dari kecerdasan di masa kanak-kanak.
21
sebagai Fagan Test of Infant Intelligence (FTII). FTII menilai memori pengenalan
visual menggunakan format kebiasaan 10-percobaan. Dalam masing-masing
percobaan, sebuah foto satu wajah ditunjukkan pada bayi, yang diikuti dengan
sepasang presentasi dari wajah orisinil dengan 1 sebuahfoto serupa tetapi wajah
baru atau 2 sebuah foto wajah orisinil tetapi dengan orientasi berbeda. Jumlah
waktu yang dihabiskan yang terlihat pada foto baru adalah diasumsikan untuk
menunjukkan tingkat dimana bayi telah memperhatikan bahwa ini adalah berbeda
dari gambar orisinil. Pemeriksa mengamati refleksi kornea bayi untuk
menentukan persen Pilihan Kebaruan, rata-rata pada 10 percobaan. Prosedur
menunjukkan perjanjian antar penilai yang sangat tinggi. Sebuah skor kurang dari
53 persen dari pilihan kebaruan mengidentifikasi anak yang berada pada resiko
untuk keterlambatan mental selanjutnya.
Studi validasi dari FTII sebagai sebuah prediktor dari kecerdasan masa kanak-
kanak dan sebagai sebuah alat screening untuk keterlambatan mental adalah
dicampur dalam hasil. Dengan memperhatikan pada prediksi kecerdasan, skor
FTII diperoleh pada 7 hingga 9 bulan usia terkorelasi hanya .32 dengan Stanford-
Binet IQ pada usia 3 untuk sebuah sampel 200 bayi. Dalam studi lainnya, korelasi
keseluruhan antara skor-skor FTII diperoleh pada 7 hingga 9 bulan dari usia dan
WPPSI-RIQ pada usia 6 adalah sangat rendah, sekitar .2, untuk dua sampel
Norwegian dari anak sehat. Tasbihsazan, Nettelbeck, dan Kirby (2003) telah
mengidentifikasi sebuah alasan memungkinkan dimana skor FTII berkorelasi
secara lemah dengan IQ selanjutnya; yaitu, tes bisa memiliki reliabilitas rendah.
Secara khusus, untuk bayi tidak beresiko, sehat, koefisien stabilitas tes-retest
untuk persen Pilihan Kebaruanad .29 untuk 12 bayi dites pada 27 dan 29 minggu,
-.07 untuk 12 bayi yang dites pada 29 dan 39 minggu, dan -.17 untuk 13 bayi
yang dites pada 39 dan 52 minggu. Koefisien stabilitas ini adalah tidak hanya
rendah- mereka tidak bisa dibedakan dari nol, yang menimbulkan keraguan pada
kebaruan instrument FTII.
FTII bisa tampil lebih baik sebagai sebuah tes screening dibandingkan sebagai
sebuah prediktor umum dari kecerdasan masa kanak-kanak. Dengan
22
memperhatikan pada screening bayi pada resiko untuk ketidakmampuan
perkembangan, Fagan, Singer, Montie, dan Sheperd (1986) melaporkan
penemuan yang sangat positif dalam sebuah studi 62 bayi yang mengalami aktor
buruk seperti kelahiran premature atau diabetes yang dialami ibu. Ketika
dievaluasi pada usia 3 tahun, dleaan anak menunjukkan keterlambatan kognitif
(IQ 70), dimana 54 adalah dianggap normal. FTII, sebelumnya diberikan antara
usia 6 dan 7 bulan, secara tepat mendeteksi 6 dari 8 anak dengan keterlambatan
(75 persen sensitivitas) dan secara sesuai diidentifikasi 49 dari 54 anak-anak
normal (91 persen spesifikasi). Bagaimanapun, tidak semua studi screening FTII
pada bayi beresiko adalah positif dalam tone. Contohnya, McGrath, Wypij,
Rappaport, Newburger, dan Bellinger (2004) menggunakan skor FTII dari 1 tahun
usia untuk memprediksi IQ rendah pada usia 8 dalam 100 bayi beresiko dan
menemukan sensitivitas buruk 32 persen dalam mendeteksi penundaan kognitif
(IQ 85) tetapi spesifikasi fair dari 80 persen. Penelitian lebih lanjut adalah
dibutuhkan sebelum kita melepaskan ukuran bayi tradisional dalam keuntungan
dari tes Fagan dan ukuran serupa.
23
Tujuan sreening adalah untuk mengidentifikasi anak-anak beresiko sehingga mereka bisa
dirujuk pada evaluasi yang lebih komprehensif (Kamphaus, 1993). Tetapi “beresiko”
untuk apa? Jawaban umum merujuk pada kemungkinan kegagalan di tahun-tahun dasar
awal sekolah. Konsep berada pada resiko adalah secara intim terhubung pada konsep
penundaan perkembangan, yang menunjuk pada anak-anak yang perkembangan
kognitifnya dibawah ekspektasi usia. Beberapa anak diidentifikasi dengan label “catch
up” selanjutnya dalam kehidupan. Untuk anak-anak ini, keterlambatan perkembangan
adalah sebuah penunjukan yang tepat. Secara pasti, ini adalah lebih optimis dan label
yang lebih sedikit terstigma dibandingkan keterlambatan mental- yang seringkali hasil
akhir dari keterlambatan perkembangan.
Anak-anak dengan kecerdasan rendah adalah secara substansial pada resiko gagal
sekolah, yang menjelaskan mengapa tes kecerdasan individual memainkan sebuah peran
penting dalam evaluasi anak-anak pra sekolah. Tetapi tes kecerdasan individual
membutuhkan sebuah komitmen substansial dari waktu (hingga dua jam) dan harus
diberikan oleh praktisi yang terlatih secara hati-hati. Untuk alasan praktis, selanjutnya, tes
kecerdasan individual adalah tidak sesuai dengan instrument screening.
Instrumen screening ideal adalah sebuah tes pendek yang bisa diberikan oleh guru,
perawat sekolah, dan individual lainnya yang telah menerima training terbatas dalam
penilaian. Selain itu, sebuah tes screening yang peka adalah salah satu yang memberikan
skor cutoff yang akurat dalam mengklasifikasi anak-anak sebagai normal atau beresiko.
Dalam konteks tes screening, dua jenis error bisa terjadi. Anak-anak normal yang gagal
tes akan ditunjuk sebagai kasus positif-salah (karena mereka telah secara salah
diklasifikasikan sebagai positif untuk ketidakampuan potensial). Anak beresiko yang
lulus tes akan disebut sebagai kasus negatif-salah (karena mereka telah secara salah
diklasifikasikan sebagai negatif untuk ketidakmampuan potensial). Pembaca harus ingat
bahwa tujuan screening adalah hanya untuk mengidentifikasi anak yang membutuhkan
evaluasi tambahan, yang berarti bahwa kasus positif-salah akan menerima evaluasi lebih
lanjut. Selanjutnya, sebuah kesalahan klasifikasi positif-salah jarang membawa pada
konsekuensi yang tidak diinginkan. Bagaimanapun, kasus negatif-salah secara khusus
tidak menerima evaluasi lebih lanjut, sehingga jenis kesalahan klasifikasi ini adalah
secara potensial lebih serius- karena anak yang berkebutuhan jadi nampak normal.
24
Glascoe(1991) merekomendasikan bahwa instrumen berguna seharusnya menghasilkan
rate negatif-salah kurang dari 20 persen (makna dimana 80 persen anak beresiko
sebenarnya adalah diberi bendera/ditandai oleh tes) dan bahkan rate positif-salah lebih
rendah kurang dari 10 persen (berari bahwa 90 persen anak normal lulus tes).
Glascoe dan Shapiro (2005) menunjukkan lima kelemahan umum screening
perkembangan dan perilaku pada masa bayi dan masa kanak-kanak awal:
- Menunggu sampai masalah bisa diobservasi.
- Mengabaikan hasil screening.
- Bergantung pada metode informal.
- Menggunakan tes yang tidak tepat.
- Mengasumsikan pelayanan adalah terbatas atau tidak konsisten.
Kelemahan ini membawa pada hasil buruk: kurang terdeteksi masalah perkembangan dan
penemuan terlambat dari ketidakmampuan. Dalam kedua kasus, bayi dan anak-anak
berkebutuhan tidak menerima pelayanan yang mereka butuhkan.
Tes screening adalah berdasarkan definisi singkat dan, oleh karena itu, rentan pada
kesalahan pengukuran. Bahkan dengan tes terbaik yang tersedia, anak yang berhak
mendapat perhatian akan terselip diantara retakan (kasus negatif-salah) dan jadi tidak
diketahui membutuhkan intervensi sampai mereka masuk ke tahun-tahun sekolah dasar.
Bagaimanapun, jika ini mengidentifikasi proporsi tinggi dari kasus positif-benar- anak
pra sekolah yang diklasifikasikan sebagai beresiko yang sebenarnya benar-benar tidak
membutuhkan pelayanan khusus atau penundaan masuk sekolah- sebuah tes screening
akan berperan dalam tujuan yang berguna.
Instrument untuk screening anak pra sekolah
Seperti yang dicatat oleh Malcolm (1998), lusinan instrument telah diproduksi
untuk menyaring untuk keterlambatan perkembangan, tetapi hanya sedikit yang
bertahan dalam tes waktu. Dalam Tabel 7.9, kami merangkum beberapa alat yang
direkomendasikan (Glascoe, 2005). Kami membatasi diskusi kami disini hanya
pada tiga tes: DIAL-III (Developmental Indicators for the Assessment of
Learning-III), Denver II (sebuah revisi dari Denver Developmental Screening
Test-Revised), dan HOME (Home Observation for the Measurement of the
Environmant). Dua tes pertama menggunakan pendekatan konvensional untuk
25
identifikasi keterlambatan perkembangan, sedangkan instrument ketiga, HOME,
mencakup sebuah pemberangkatan radikal dari prosedur tradisional.
DIAL III
Scoring untuk beberapa item adalah tersendiri dan obyektif, dimana untuk pertanyaan
lain kriteria scoring dalam manual men
inggalkan ruang untuk penafsiran subyektif, yang kurang dari realibilitas instrument.
Sebuah skor total diperoleh dengan menjumlah skor tiga area. Untuk masing-masing
skor area dan juga skor total, manual memberikan skor cutoff untuk menunjukkan
anak pada satu dari dua grup hasil yang diberi label “secara potensial terlambat” atau
“okay”. Sampel standarisasi terdiri dari 1,560 anak (berbahasa Inggris) dan 605 anak
(berbahasa Spanyol) yang distratifikasi secara kasar dengan data sensus 1994
berdasarkan gender, ras, wilayah geografi, dan pendidikan orang tua.
Reliabilitas DIAL III adalah fair, memberikan bahwa ini adalah tes singkat untuk
tujuan screening. Koefisien konsistensi internal berkisar dari .66 untuk Motor hingga
.84 untuk Konsep, dengan reliabilitas skala total dari.87. Data tes-retest adalah
serupa, yaitu untuk menyatakan, tidak bergantung pada reliabilitas minimum yang
dinyatakan .90 untuk tes yang digunakan untuk membuat keputusan individual.
Validitas dari instrument telah dievaluasi bersama line kandungan lazim, konsep, dan
kriteria terkait. Validitas isi adalah diputuskan untuk jadi tinggi sejauh sebuah panel
ahli memberikan tinjauan isi dan membantu menghilangkan item yang tidak tepat dan
26
bias. Validitas terkait-kriteria adalah kuat, seperti yang diputuskan oleh korelasi
dengan instrument serupa seperti Early Screening Profiles, Differential Abilities Scale
dan Peabody Picture Vocabulary Test-III.
Ini adalah dengan memperhatikan pada kemampuan praktis dimana DIAL-III dan
edisi pendahulunya telah menaikkan skeptisme terbesar. Nilai sebuah tes screening
paling diputuskan berdasarkan tingkat dimana ini secara akurat mengidentifikasi anak
yang berkebutuhan penilaian perkembangan lebih lanjut. Salah satu statistik berguna
adalah sensitivitas, yaitu proporsi kasus masalah yang dikonfirmasi secara akurat
“flagged” sebagai kasus masalah berdasarkan sebuah tes (yaitu, anak dengan
keterlambatan yang secara akurat diklasifikasi sebagai “keterlambatan potensial”).
Sayangnya, tes screening singkat seperti DIAL III tidak menunjukkan sensitivitas
kuat ketika skor cutoff yang direkomendasikan digunakan untuk mengidentifikasi
anak sebagai menunjukkan “keterlambatan potensial”. Satu-satunya cara untuk
mencapai sensitivitas tinggi adalah untuk liberalisasi skor cutoff, yaitu, klasifikasi
sebuah proporsi yang lebih besar dari anak-anak yang menunjukkan “keterlambatan
potensial”. Bagaimanapun, ini akan menciptakan masalah dengan spesifikasi, yaitu
persentase dari anak normal secara tepat diidentifikasi sebagai normal. Selalu,
semakin tinggi sensitivitas dari tes screening, semakin rendah spesifikasinya. Biaya
secara akurat mengidentifikasi sebuah proporsi tinggi anak-anak dengan
keterlambatan adalah bahwa banyak anak normal juga akan secara tentative diberi
label sebagai “keterlambatan potensial.”
Denver II
27
kronologis pada tes berdasarkan usia anak dan ditandai sebagai lulus/gagal.
Pengujian dimulai pada level usia yang tepat dan berlanjut sampai anak gagal
dalam tiga item. Total waktu untuk evaluasi adalah 20 menit atau kurang.
Tidak seperti tes screening lainnya, Denver II tidak menghasilkan sebuah quotient
atau skor perkembangan. Selain, hasilnya pada sekitar 30 item tepat-usia
memberikan sebuah skor yang bisa ditafsirkan sebagai normal, dipertanyakan,
atau abnormal dalam referensi pada norma berbasi-usia. Kategori “tidak bisa
dites” juga dimasukkan. Sampel standarisasi terdiri dari 2,096 anak, semua dari
negara bagian Colorado, distratifikasi oleh usia, ras, dan status sosial ekonomi.
Mengenali bahwa tidak ada instrument yang secara sempurna bisa diandalkan dan
bahwa anak berubah sepanjang waktu, pengembang dari Denver II
merekomendasikan pengujian berulang pada kurang lebih interval enam-bulan
hingga usia 2 tahun dan selanjutnya setiap tahun sampai usia 5 tahun. Reliabilitas
dari Denver II dilaporkan luar biasa untuk sebuah tes screening yang singkat.
Reliabilitas antar penilai diantar para penilai terlatih rata-rata luar biasa .99.
Reliabilitas tes-retest untuk skor total 7 hingga 10 hari interval rata-rata .90.
Denver memiliki validitas isi sempurna sejauh perilaku yang dites dikenali oleh
orotitas dalam perkembangan anak sebagai penanda penting perkembangan.
Bagaimanapun, kategori penafsiran tes (normal, dipertanyakan, abnormal) adalah
berdasarkan pada keputusan klinis dan oleh karena itu menunggu studi tambahan
untuk validasi. Sedikit studi awal menimbulkan kekhawatiran signifikan. Glascoe
dan Byrne (1993) mengevaluasi 89 anak dalam setting tempat penitipan anak
yang berusia 7 hingga 70 bulan. Berdasarkan pada evaluasi independen ekstensif,
18 dari 89 anak ini adalah dikonfirmasi memiliki keterlambatan perkembangan
menurut definisi federal dari kondisi kecacatan (yaitu, keterlambatan bahasa,
keterlambatan mental, dan autism). Dimana Denver II berfungsi dengan baik
dalam secara tepat mengidentifikasi 15 dari 18 anak beresiko, instrument
dilakukan secara buruk dengan anak normal. Dalam kenyataannya 38 dari 71 anak
normal gagal tes dan diklasifikasikan sebagai dipertanyakan atau abnormal.
Secara keseluruhan, hampir empat dalam enam anak yang menjalankan tes akan
28
dirujuk pada penilaian tambahan, dan dari empat, hanya satu yang memiliki
ketidakmampuan sebenarnya. Para peneliti merekomendasikan studi validasi lebih
lanjut dengan kalibrasi ulang dan pembuangan memungkinkan dari beberapa item
tes sebelum tes menerima penggunaan luas.
HOME
29
lingkungan bermakna. Ditempatkan begitu saja, pendukung SES sebagai sebuah
ukuran lingkungan mempercayai bahwa, rata-rata, anak-anak dari kelas sosial
lebih tinggi akan mengalami sebuah lingkungan pengasuhan yang lebih kaya dan
lebih terawat dibandingkan anak dari kelas sosial lebih rendah.
Tujuan dari HOME Inventory adalah untuk mengukur kualitas dan kuantitas
stimulasi dan dukungan untuk perkembangan kognitif, sosial dan emosional yang
tersedia bagi anak di rumah. Skala dan item HOME diperoleh dari sebuah daftar
proses lingkungan yang diidentifikasi dari penelitian yang ada dan teori yang
penting untuk perkembangan masa kanak-kanak optimal. Proses peningkatan-
pertumbuhan termasuk gratifikasi kebutuhan dasar; kontak jarang dengan
sejumlah kecil orang dewasa; sebuah iklim emosional positif yang
mengembangkan kepercayaan diri dan orang lain; tepat, beragam, dan input
sensori berpola; konsistensi dalam respon fisik, verbal dan emosional dari orang
30
lain; sebuah pembatasan sosial minimal pada perilaku exploratory dan motor;
struktur dan order lingkungan harian; ketentuan dan penafsiran orang dewasa dari
beragam pengalaman kultural, material permainan dan lingkungan yang tepat;
kontak dengan orang dewasa yang menilai pencapaian; dan pemrograman
kumulatif pengalaman untuk mencocokkan level perkembangan anak (Caldwell &
Bradley, 1984). Singkatnya, selanjutnya, tujuan HOME adalah untuk mengukur
pola yang ditujukan spesifik dari pemeliharaan dan stimulasi yang tersedia bagi
anak-anak di rumah.
Tiga bentuk HOME adalah bayi dan anak yang belajar jalan (usia 0 hingga 3
tahun), masa kanak-kanak awal (usia 3 hingga 6 tahun), dan masa kanak-kanak
menengah (usia 6 hingga 10 tahun). Formulir untuk bayi dan anak yang belajar
jalan terdiri dari 45 item yang diorganisir dalam enam sub skala.
Versi Masa Kanak-Kanak awal terdiri dari 55 item yang diorganisir kedalam
delapan sub skala, dimana versi Masa kanak-kanak menengah terdiri dari 59 item
yang diorganisir kedalam delapan sub skala. Item-item untuk versi bayi dan anak
yang belajar jalan dari HOME Inventory adalah didaftar dalam Tabel 7.10. Detil
pada item-item spesifik yang dimasukkan dalam HOME bisa ditemukan dalam
Caldwell dan Bradley (1984).
Fitur-Fitur Teknis
31
Norma-norma relevan dari HOME Inventory adalah tersedia untuk beberapa
sumber. Untuk versi bayi dan anak belajar jalan, Caldwell dan Bradley
(1984)melaporkan means sub skala dan standar deviasi untuk 174 keluarga dari
Little Rock, Arkansas. Dibandingkan dengan populasi umum, sampel ini terlihat
mewakili keluarga SBS-lebih rendah. Contohnya, 34 persen keluarga adalah pada
rumah tangga sejahtera, dan 29 persen adalah rumah tangga orang tua tunggal.
Untuk versi Masa kanak-kanak awal, data standarisasi tersedia dari 323 keluarga
di Little Rock, dengan keluarga SES-lebih rendah secara serupa diwakili berlebih.
Untuk versi masa kanak-kanak menengah, Bradley dan Rock (1985) melaporkan
means dan standard deviasi sub skala untuk 141 keluarga dari Little Rock. Kurang
lebih setengah dari keluarga ini adalah orang Afrika Amerika, sisanya Caucasian;
anak laki-laki dan wanita dijadikan sampel secara sama. Keluarga ini adalah
dianggap jadi representatif dari semua keluarga yang mengasuh anak usia sekolah
dasar di Little Rock, Arkansas. Bagaimanapun, untuk semua tiga versi ini adalah
jelas bahwa sampel standarisasi memberikan hanya norma-norma lokal. Data ini
bisa jadi berguna sebagai poin referensi tetapi seharusnya tidak disamakan dengan
sebuah sampel stratifikasi, acak, nasional.
32
dari stabilitas untuk subskala, dengan sebagian besar korelasi dalam 50an, 60an,
dan 70an. Korelasi antara skor total untuk pengujian pada usia 12 dan 24 bulan
adalah sangat dihargai .77.
33
untuk mengidentifikasi anak-anak untuk siapa intervensi remedial akan jadi tepat.
Jenis intervensi ini adalah lebih dari hanya sebuah aplikasi humanistik penemuan
penelitian- ini bisa dibutuhkan oleh hukum:
34
Berawal pada tahun 1950-an muncullah pembaharuan komitmen terhadap kebutuhan
dan hak-hak para penderita cacat fisil dan cacat mental di Amerika Serikat (Maloney
& Ward, 1979: Patton, Payne, & Beirne Smith, 1986). Sikap masyarakat terhadap
orang-orang berkebutuhan khusus telah berubah, dari pengucilan dan penyingkiran
sikap yang lebih suportif, yang mendukung program-program dan tindakan demi
kesejahteraan orang cacat. Seperti penggunaan toilet umum yang dilengkapi akses
bagi penderita cacat fisik yang menggunakan kursi roda. Selain hal diatas, para
penderita retardasi mental semakin terpenuhi kebutuhan khususnya dengan semakin
banyaknya pelayanan dan fasilitas-fasilitas pelayanan komunitas kecil (small
community care facilities), alih-alih institusi besar yang kurang empatik (seperti
rumah sakit jiwa atau asylum pada anad-abad terdahulu).
Pada tahun 1973, Public Law 93-112 disahkan, yang berfungsi sebagai “Bill of
Rights” (undang-undang yang mengatur hak-hak asasi) bagi para penyandang cacat.
Undang-undang ini melarang diskriminasi berdasarkan kecacatan. Dua tahun
kemudian, Education for All Handicapped Children Act (undang-undang Pendidikan
bagi anak-anak cacat, dalam Public Law 94-142) disahkan. Undang-undang ini
menetapkan bahwa anak-anak cacat usia sekolah harus mendapatkan Pendidikan dan
asesmen yang layak.
B. Tes Nirbahasa
Tes nirbahasa (Tes bebas Bahasa) hanya melibatkan (tidak sama sekali) tindakan
menulis atau berbicara dari pihak penguji maupun partisipan.
Tes Nirbahasa sangat cocok digunakan untuk asesmen terhadap orang-orang yang
tidak menguasai Bahasa pembuat tes, atau untuk orang-orang dengan hambatan
bicara atau keterampilan Bahasa yang terbatas.
35
Pada tahun 1929, Leiter merancang sebuah edisi eksperimental dari tes tersebut
untuk tujuan asesmen intelegensi orang-orang yang mengalami hambatan bicara
dan hambatan pendengaran serta untuk orang-orang yang menguasai lebih dari
satu Bahasa (bilingual) dan tidak bias berbahasa inggris.
36
Goodenough-Harris Drawing Test adalah sebuah tes intelegensi nonverbal yang
durasinya singkat, yang diadministrasikan secara perseorangan maupun dalam
kelompok.
Selain pada skala Pria, revisi Harris (1963) juga termasuk dua bentuk tambahan:
skala Wanita dan skala Diri. Untuk dua skala terakhir ini, examinee diperintahkan
untuk menggambar seorang wanita dan dirinya sendiri. Skor pada skala Pria dan
Wanita adalah sangat terkorelasi untuk examinees salah satu jenis kelamin (r=.91
hingga .98). Dua versi ini bisa dianggap bentuk ekivalen. Skala Diri adalah
dimaksudkan sebagai sebuah tes proyektif konsep diri. Bagaimanapun, konsep-
diri adalah sebuah konsep kabur yang sulit untuk obyektifitas. Skala Diri telah
secara luas Turun berdasarkan sisi jalan, meskipun beberapa psikolog
menggunakan ini secara murni sebuah ekstensi yang tidak diberi skor dari
wawancara klinis.
37
Sampel standarisasi untuk Goodenough-Harris Drawing Test adalah besar
(N=2,975 anak), secara geografis beragam (dari area desa dan kota diseluruh
Amerika Serikat), dan secara hati-hati diseleksi untuk mencocokkan nilai populasi
AS untuk status pekerjaan orang tua. Tes mencakup usia 3 hingga 16, tetapi
norma-norma adalah paling baik untuk usia 5 hingga 12. Diatas usia 12,
examinees mulai untuk mendekati sebagai asymptote kinerja dan perbedaan usia
direduksi. Man Scale menghasilkan sebuah skor standard seperti-IQ deviasi
dengan mean 100 dan standard deviasi 15. Salah satu perhatian adalah secara
sederhana dimana norma Drawing Test adalah cukup terkini. Abell, Hork-heimer,
dan Nguyen(1998) mendanai sistem scoring itu untuk tes ini secara konsisten
merendahkan skor IQ pada WISC-R.
Reliabilitas dari tes telah dinilai oleh prosedur , studi test-retest, dan perbandingan
antar skor. Reliabilitas mendekati .90 adalah umum. Bagaimanapun, koefisien
stabilitas jarang melampaui .70an, bahkan ketika interval tes-retest adalah hanya
beberapa minggu. Ini menyatakan bahwa skor pada Goodenough-Harris Drawin
Test memiliki sebuah berkas besar dari kesalahan pengukuran. Pada sisi lain,
scoring adalah cukup obyektif: korelasi antar penilai adalah secara khusus .90.
Pemeriksa yang telah menguasai sistem scoring point elaborasi bisa selanjutnya
menggunakan sebuah metode global lebih sederhana yang disebut Skala Kualitas.
Skala Kualitas terdiri dari 24 gambar (12 untuk Skala Pria dan 12 untuk Skala
Wanita) digunakan sebagai poin referensi yang distandarisasi. Pemeriksa
mencocokkan gambar examinee pada salah satu dari 12 gambar referensi dan
selanjutnya mengkonsultasikan sebuah tabel untuk menentukan skor standard
yang berhubungan. Skor Kualitas adalah lebih cepat tetapi sedikit lebih kasar:
Reliabilitas antar penilai adalah secara khusus serendah .80. Sekarang ini, Ter
Laak, De Goede, Aleva, dan Van Rijswijk (2005) menegaskan kembali bahwa
sistem scoring obyektif, kuantitatif untuk Goodenough-Harris test menghasilkan
skor yang lebih bisa diandalkan dibandingkan pendekatan kualitatif global.
38
bahasa dan minoritas atau anak-anak dengan dua bahasa. Oakland dan Dowling
(1983) memandang Drawing Test sebagai sebuah tes yang direduksi secara
kultural yang sesuai untuk screening awal anak minoritas. Tes bekerja paling baik
dengan anak kecil, khususnya mereka dengan kemampuan intelektual yang lebih
rendah. Contohnya, anak usia 5 tahun di tempat penitipan anak untuk keluarga
sosial ekonomi rendah, Frederickson (1985) melaporkan korelasi antara skor
Goodenough-Harris Drawing Test dan WPPSI Full Scale IQ dalam range .72
hingga .80. Dalam beberapa studi lainnya, korelasi dengan tes IQ individual
adalah lebih variabel, tetapi mayoritas adalah lebih dari .50.
Peninjau menghargai DAP untuk sistem scoring jelasnya, reliabilitas kuat, dan
standarisasi hati-hati. Bagaimanapun, hasil dari studi validitas adalah lebih
bersifat menasehati. Harrison dan Schock (1994) mencatat bahwa bukti yang
diakumulasi dengan tes HFD menunjukkan validitas prediktif rendah hingga
menengah. Disamping popularitas dan daya tarik mereka, tes HFD tidak secara
efektif mengidentifikasi anak-anak dengan kesulitan belajar atau ketidakmampuan
perkembangan, dan mereka bisa jadi tidak valid untuk penggunaan bahkan
sebagai ukuran screening.
39
Hiskey-Nebraska test of learning aptitude
Skor mentah pada subset adalah dirubah kedalam Deviation Learning Quotient
(LQ) dengan mean 100 dan standard deviasi .16. Skor H-NTLA cukup secara kuat
dengan skala pencapaian untuk grade 2 hingga 12 (median r=.49) dan juga dengan
WISC-R Performance IQ (r=.85). Meskipun LQ menghasilkan skor rata-rata yang
sangat mendekati WISC-R Performance IQ untuk sampel anak-anak dengan
gangguan pendengaran dan mereka yang tuli, skor H-NTLA adalah secara
substansial lebih variabel. Jadi, penggunaan H-NTLA bisa meningkatkan resiko
dari kesalahan klasifikasi salah- pemberian label anak-anak sebagai berbakat
ketika mereka hanya cemerlang atau memiliki keterlambatan mental ketika
mereka hanya garis batas.
40
Tes Nonverbal Intelligence-3
Tes Nonverbal Intelligence-3 (TONI-3) adalah sebuah ukuran bebas bahasa dari
kemampuan kognitif yang didesain untuk populasi cacat atau minoritas. Secara
khusus, para perancang tes merekomendasikan tes ini untuk keperluan asesmen
terhadap orang-orang yang menderita aphasia (gangguan berbahasa akibat
kerusakan di otak), orang-orang yang mengalami gangguan pendengaran, dan
orang-orang yang mengalami trauma neurologis yang berat.
Instruksi tes adalah dibuat pantomim oleh pemeriksa dan examinee menjawab
dengan menunjuk pada satu dari enam respon memungkinkan. Tes terdiri dari
dua bentuk ekivalen 50 item pemecahan masalah abstrak/figural. Item-item ini
adalah secara hati-hati diseleksi dari sebuah kelompok item awal menurut
korelasi item-total, level kesulitan tepat, dan kemampuan penerimaan pada
pengguna potensial dan keahlian teknis. Item TONI-3 masuk kedalam
beberapa kategori.
41
TONI-3 adalah secara hati-hati distandarisasi pada lebih dari 3,000 subyek yang
berkisar dari usia 6 hingga 89. Karakteristik sampel membuat paralel data sensus
untuk jenis kelamin, ras, etnis, penduduk kota-subkota-desa, grade,
pendidikan/pekerjaan orang tua, dan wilayah geografi. Data reliabilitas adalah
cukup memuaskan, dengan koefisien konsistensi internal secara khusus melebihi
.90 dan reliabilitas bentuk-alternatif dalam range .80 hingga .95.
Studi validitas dari TONI-3 adalah sedikit, tetapi investigasi edisi sebelumnya
(yang sangat serupa dengan isi) adalah mendukung tes ini sebagai indeks reduksi-
kultur dari kecerdasan umum. Namun, penelitian tidak mendukung pandangan
bahwa TONI-3 adalah sebuah tes non-verbal,kecuali dalam kesan trivial bahwa
respon verbal adalah tidak dibutuhkan. Contohnya, koefisien korelasi laporan
manual TONI-2 dalam .70an antara skor TONI-2 dan subtes Language Arts dari
SRA Achievement Series. Secara umum, studi penelitian dengan pendahulu
TONI-3 menunjukkan bahwa ini adalah sebuah ukuran baik dari kecerdasan
umum, tetapi mereka tidak mendukung pandangan bahwa ini adalah utamanya
sebuah ukuran kecerdasan nonverbal. Secara keseluruhan, TONI-3 adalah sangat
dianggap sebagai sebuah alat screening non bahasa singkat untuk subyek dengan
kemampuan bahasa terganggu (contohnya, untuk mereka yang aphasic, tuli atau
berbicara non bahasa-Inggris atau yang mengalami keterlambatan mental). Barrett
(2000) juga merekomendasikan menggunakan TONI-3 dengan imigran dari
negara-negara berbahasa Inggris seperti Jamaica. Tes adalah lebih secara hati-hati
distandarisasi dibandingkan sebagian besar dan memiliki reliabilitas sempurna.
Sebuah fitur berguna dari TONI-3 adalah administrasi yang tidak ditetapkan
waktunya jarang lebih dari 20 menit.
Dua instrumen yang dibahas sebelumnya dalam tes juga mengkualifikasi sb tes
non bahasa. Raven’s Progressive Matrices dan Catell Culture Fair Intelligence
Test menggunakan item non verbal dan membutuhkan pada intinya tidak ada
interaksi berbasis-bahasa antara examiner dan examinee. Sebuah tes bebas-bahasa
yang menjanjikan adalah Universal Nonverbal Inteligence Test (UNIT), sebuah
ukuran komprehensif dan multidimensi dari kecerdasan non verbal. Tes ini
42
didesain untuk anak-anak dengan kerusakan pendengaran atau kemahiran
berbahasa Inggris terbatas. Analisa item canggih menunjukkan UNIT adalah
sebuah ukuran yang tidak bias dari kecerdasan non verbal pada anak-anak yang
tuli. UNIT memberikan sebuah ukuran yang baik dari beberapa subskor, termasuk
skor jelas, berbasis-faktor pada memori dan dasar pemikiran.
Seperti yang diingat, tes non bacaan adalah didesain untuk examinee buta huruf yang
bisa namun demikian, memahami bahasa Inggris dengan baik untuk mengikuti
instruksi oral. Tes-tes nirbahasa cocok diterapkan bagi anak-anak belia, partisipan
yang buta huruf, dan orang-orang yang mengalami hambatan kemampuan verbal atau
hambatan kemampuan mengekspresikan Bahasa.
- PPVT-4 dipublikasikan dalam dua versi yang parallel, setiap versinya terdiri dari
4 lembar untuk latihan dan 228 lembar yang digunakan untuk pengetesan itu
sendiri. Setiap lembar memuat empat gambar objek atau pemandangan sehari-
hari.
- Soal-soal tes fitata dalam 19 set (setiap set berisi 12 soal) untuk keperluan
identifikasi yang efisien terhadap level basal (batas bawah) dan ceiling (batas
atas)
43
D. MENGETES ORANG YANG MENGALAMI HAMBATAN
PENGLHATAN/VISUAL
Dalam menilai fungsi intelektual dari orang yang secara visual lemah, pemeriksa
telah secara historis bergantung pada adaptasi dari Standford-Binet. Revisi Hayes-
Binet untuk pengujian mereka dengan kerusakan visual adalah berdasarkan pada
Standford-Binet 1916; instrumen ini telah menjalani beberapa revisi. Adaptasi yang
paling baru adalah Perkins-Binet. Perkins-Binet menahan sebagian besar item verbal
pada sebuah mode tactual. Proses Perkins-Binet bisa menerima reliabilitas split-half
dan menunjukkan korelasi tinggi dengan skala verbal dari WISC-R. Pengembang
Perkins-Binet telah mengakui bahwa masalah visual ada pada sebuah kesatuan oleh
pengembangan norma terpisah untuk anak-anak dengan pengelihatan yang bisa
digunakan (Form U) dan pengelihatan yang tidak bisa digunakan (Form N).
44
pola yang dirasakan di papan yang memiliki baris lubang dengan pasak di dalamnya.
Reliablitas HISAB adalah sempurna dan penulis memberikan data normatif pada
sebuah sampel orang dewasa dengan kerusakan visual.
Lebih dari 1 juta orang Amerika adalah tuli dan secara memeliki gangguan
pendengaran mend dimana mereka bergantung pada American Sign Language (ASL)
sebagai cara komunikasi primer. Adanya penguasaan terbatas secara khusus dari
bahasa Inggris untuk orang yang tuli, dan sebaliknya, . cara psikolog dalam
berkomunikasih menggunakan ASL merupakan penilaian tepat dan valid individual
yang tuli memiliki sebuah tantangan lintas-kultural yang menonjol.
ASL Lebih banyak digunakan untuk sebuah tes dan dikembangkan . untuk norma,
Individual yang tuli atau kesulitan mendengar dan yang menggunakan bahasa
isyarat.namun Salah satu masalahnya adalah bahasa isyarat “dimana bahasa isyarat
sekarang tidak dapat digolongkan pada kesatuan multidimensi yang mencakup
sejumlah gaya, varian lexical, struktur sintaktis, dialek, dan pendekatan pada atau
keberangkatan susunan kata bahasa Inggris.” Jadi, sebuah tes yang dikembangkan
dalam ASL standard adalah tidak cocok untuk diterapkan pada semua orang yang tuli.
Jika seorang psikolog konsultan tidak memiliki keahlian ini. Seorang psikolog harus
merujuk asesment kaum TunaRunggu pada satu orang atau agensi dengan bakat dan
keahlian yang dibutuhkan.
Penggunaan penerjemah bahasa isyarat dalam pengujian orang yang tuli adalah
sebuah masalah rumit dan kontroversial.karna terdapatt resiko bahwa seorang
penerjemah yang ceroboh , bisa saja mengubah isu atau materi tes sehingga
memepengaruhi validitas .jenis tes lain yang biasanya digunakan untuk tunarunggu
adalah Raven’s Progressive Matrices(Raven, Court,& Raven) dan Hiske-Nebraska
Test of Learning Aptitude.Resolusi yang lebih dibutuhkan bagi pemeriksa untuk jadi
45
mahir dalam bahasa isyarat, sehingga mereka dapat berbagi terjemahan yang
dibutuhkan namun tetap dalam batas-batas prosedur yang distandarisasi.
Penilaian dari keterlambatan mental adalah sebuah masalah kompleks dan masalah
multidimensi yang layak dikaji dalam suatu bab tersendiri . akibat dari Adanya
keterbatasan ruang,topic tersebut hanya disajikan secukupnya sehingga pencakupan
kami memerlukan jembatan .untuk para pembaca yang tertarik di refrensikan ke
American Association on Mental Retardation (2002). Disini kami secara singkat
merangkum kriteria diagnostik untuk keterlambatan mental dan selanjutnya meninjau
dua kontras instrumen penilaian dalam detil sederhana. Kami menutup dengan sebuah
rangkuman tabular dari beberapa ukuran menonjol perilaku adaptif.
Sumber yang paling otoritatif mendefinisi keterlambatan mental merupakan manual dari
terminology. klasifikasi dari American Association on Mental Retardation mendefinisikan
keterlambatan mental sebagai berikut:
Keterlambatan mental menunjuk pada keterbatasan substansial dalam fungsi sekarang. Ini
digolongkan oleh fungsi intelektual sub rata-rata secara signifikan, yang ada bersamaan dengan
keterbatasan terkait dalam dua atau lebih area keahlian adaptif yang bisa digunakan: komunikasi,
pemeliharaan-diri, kehidupan di rumah, keahlian sosial, penggunaan komunitas, arah diri,
kesehatan dan keselamatan, akademi fungsional, waktu luang dan pekerjaan. Keterlambatan
mental manifest sebelum usia 18.
Manual lebih lanjut menyebutkan bahwa fungsi intelektual subrata-rata secara signifikan adalah
IQ 70 atau 75 atau dibawah skala dengan mean 100 dan standard deviasi 15. Pada tes seperti
Standford Binnet: Edisi Keempat yang memiliki sebuah standard deviasi 16, range kurang untuk
fungsi intelektual akan mengalami terlambat dan akan menjadi IQ 68 hingga 73 atau
dibawahnya. Manual juga secara eksplisit dimana Ia menegaskan pentingnya keputusan yang
dilakukan oleh tenaga profesional dalam kasus individual.
46
IQ rendah tidak dapat digunakan sebagai sebuah dasar untuk memenuhi sebuah diagnose
diagnosa keterlambatan mental.Definisi AAMR juga menyebutkan criteria kedua , dimana
keterbatasan dalam dua atau lebih area keahlian adaptif relevan.sebuah diagnosa dari
keterlambatan mental hanya diberikan ketika individual menampilkan sebuah IQ yang rendah
dan keterbatasan dalam keahlian adaptif.
Keterbatasan dalam keahlian adaptif ternyata lebih sulit untuk ditegaskan jika dibandingkan
dengan IQ rendah.AMMR manual mendaftar 10 area berbeda dari keahlian adaptif dan
menyebutkan klien harus menunjukkan bagaimana keterbatasan substansial dalam dua atau lebih
dari mereka.
Jika Seorang pengembang tes menghadapi masalah utama yaitu terbatasnya kalibrasi dalam
keahlian adaptif. Dan fakta sulit yang kita miliki dalam domain ini yaitu ekspektasi lingkungan
bagi perilaku adaptif yang meningkat secara tajam dari lahir hingga dewasa.Selian itu, ekspresi
perilaku adaptif dapat merubah karakter.Pada masa anak-anak,merupakan masa dimana perilaku
adapatif bisa direfleksikan dalam keahlian sensory-motorik dan fasilitas dengan bahasa.pada
masa dewasa, pencapaian pekerjaan dan tanggungjawab sosial merupakan hal penting bagi
penilaian intelektual,tenaga ahli dan alat untuk menilai perilaku adapatif harus dilakukan secara
hati-hati dan dinilai berdasarkan usia.
Instrument yang distandarisasi pertama digunakan untuk penilaian perilaku adaptif adalah
Vineland Social Maturity Scale (Doll, 1935, 1936) karna skala yang digunakan tampak
cenderung simplistic dan kasar namun hingga kini Vineland Masih sebuah instrument yang
dihargai, karna Vineland telah menjalani beberapa revisi dan sekarang dikenal sebagai Vineland
Adaptive Behavior Scales.
47
14 subskala dari SIB diatur menjadi 4 kelompok, seperti yang ditunjukkan dalam Tabel 7.13.
Masing-masing subskala terdiri dari sejumlah item-item yang kecil dan berurutan dengan
perkembangan yang tersendiri.
Sebuah bagian unik yang terpisah dari SIB-R juga menilai perilaku maladaptif dengan
mengukur frekuensi dan keparahan perilaku masalah. Skala Perilaku Masalah juga termasuk
kedalam delapan kategori utama dari kesalahan penyesuaian personal dan sosial yang dpat
mempengaruhi perilaku adaptif.
Reliabilitas SIB-R secara umum dapat dihargai, namun variabel dari subskala ke subskala dan
dari satu grup ke grup lainnya, Subskala individual cenderung untuk menunjukkan reliabilitas
split-half dalam kedekatan ,80 empat kelompok dapat memiliki reliabilitas campuran median.90
merupakan Skala Kebebasan Luas memiliki reliabilitas yang sangat kuat dalam
Rangkumannya, SIB-R merupakan sebuah alat yang sempurna karna dapat memberikan
wawasan untuk sebuah level examinee dan fungsi atau situasi kehidupan yang riil di rumah,
sekolah, dan setting komuntias. Meskipun instrument ini tidak memiliki korespondens satu-
demi-satu dengan 10 area keahlian adaptif yang terdaftar dalam definisi keterlambatan mental,
namun terdapat persamaan substansial.
Independent Living Behavior Checklist (ILBC) adalah sebuah daftar ektensif dari 343 keahlian
yang hidup independen dan yang diklasifikasi dan dipresentasikan dalam enam mobilitas
kategori, pemeliharaan-diri, pemeliharaan rumah dan keamanan, makanan, sosial dan
komunikasi, dan akademik fungsional. Tidak sama seperti sebagian besar instrument yang
dibahas sejauh ini dalam teks ini, ILBC sepenuhnya nonnormative. Karna bertujuan tunggal
yaitu untuk memfasilitasi training dari examinee individual untuk keahlian yang dibutuhkan dan
untuk kehidupan independen. Untuk tujuan ini, sebuah perbandingan sebuah grup skor berbasis
norma. ILBC juga fokus pada apa yang bisa dilakukan examinee, bukan bagaimana examinee
dibandingkan dengan orang lain.
Untuk masing masing-keahlian, ILBC menyebutkan sebuah kondisi, perilaku, dan sebuah
standard. Tabel 7.14 yang mendaftar sebuah sampel item ILBC. Pembaca akan diberitahu bahwa
48
ketiga komponen (kondisi, perilaku, dan standard) didefinisikan dengan presisi cukup dimana
pengamat kemungkinan setuju ketika sebuah keahlian dikuasai. Dalam kenyataannya, tes-retest
dan perjanjian antar pengamat untuk keahlian ILBC berkisar dari .96 hingga sempurna 1.00.
Item-item dalam masing-masing kategori ILBC harus secara hati-hati dipilih untuk mencakup
keahlian penting dan relevan untuk kehidupan independen.
Inventory for Client and Agency Planning adalah salah satu dari tes yang paling luas digunakan
dalam bidang ketidakmampuan perkembangan. Tes ini telah disesuaikan untuk anak-anak dan
orang dewasa yang memiliki keterlambatan mental, individual yang menjadi cacat pada masa
dewasa karena sakit atau kecelakaan, atau orang tua yang telah secara perlahan kehilangan
kemandirian mereka sangat membutuhkan bantuan spesial. Fokus dari instrument pada
penentuan kebutuhan untuk pelayanan spesial seperti perawatan personal, pendidikan perbaikan,
training pekerjaan, atau lingkungan kerja yang terlindungi.
Tes sebuah booklet yang memiliki 16 halaman yang mengevaluasi perilaku adaptif, perilaku
maladaptif, dan kebutuhan untuk bantuan atau dukungan. Yang menarik tes ini dapat
diselesaikan sekitar 15 menit oleh orang tua, guru, atau pengasuh yang kenal dengan baik .
berbeda dengan klien skala dan subskala dari ICAP digambarkan dalam Tabel 7.15. Identik
dengan SIB-R, perilaku adaptif dinilai pada skala dari 0 hingga 3, dengan 0 menunjukkan tidak
pernah atau jarang melakukan sebuah perilaku (bahkan jika diminta), 1 menunjukkan
mengerjakan tugas tetapi tidak baik, 2 menunjukkan mengerjakan tugas cukup baik, dan 3
menunjukkan mengerjakan tugas dengan baik tanpa diminta. Perilaku maladapatif dinilai dengan
cara yang lebih kompleks dengan menggunakan pertanyaan-pertanyaan yang berujung-terbuka
dengan penyelidikan tindak lanjut seperti frekuensi, keparahan, dan konsekuensi dari perilaku
maladaptif.
Salah satu aspek paling berguna dan menarik dari ICAP adalahi memberikan sebuah Skor Servis
dari keseluruhan yang berdasarkan pada perilaku adaptif dan maladaptif. Skor Servis, yang
berkisar dari 0 hingga 100, menunjukkan level kemungkinan perhatian, supervisi, training yang
dibutuhkan oleh klien. Semakin rendah skor, semakin besar kebutuhan untuk pengawasan.
49
Berdasarkan tujuan, Skor Servis didesain untuk memprediksi, tidak hanya intensitas servis yang
dibutuhkan tetapi juga biaya yang berkaitan dengan penyampaian bantuan. Untuk alasan ini,
pengguna negara dan regional seringkali menyatukan data ICAP mereka dalam sebuah database
komputer yang diberikan oleh penerbit test.
Kami mengingatkan pembaca bahwa ukuran perilaku adaptif sangat beragam.Beberapa skala
didesain utamanya untuk diagnose menunjukkan , yang lainnya memerlukan perbaikan.
Beberapa skala dapat juga berguna untuk orang yang menderita keterlambatan mental parah dan
menonjol, dan yang tidak akan pernah dipekerjakan, individual dengan keterlambatan mental
ringan dapat mencari training pekerjaan. Beberapa skala berguna secara ekslusif pada anak-
anak, dan orang dewasa. Namun Instrument ini tidak bisa ditukar, serta pengguna potensial
harus meneliti kekuatan dan kelemahan secara hati-hati.
Vineland Adaptive Behavior Scales (VABS) adalah ukuran yang paling luas digunakan dari
perilaku adaptif dalam eksistensi.VABS merupakan instrument yang secara luas dihargai dengan
validitas bersamaan yang baik, termasuk korelasi dalam range .50 hingga .80 dengan WISC-R
dan Stanford Binet.
Scale ini telah secara ekstensif divalidasi dan secara jelas membedakan orang yang secara
independen diklasifikasi pada level perilaku adaptif berbeda.
50
51
BAB III
PENUTUP
Kesimpulan
Periode bayi dan prasekolah mencakup masa kelahiran hingga usia 6 tahun.sebuah aplikasi
penting dalam tes bayi dan prasekolah adalah membantu menjawab pertanyaan – pertanyaan
mengenai hambatan perkembangan. Sebagian besar tes bayi sangat bergantung dengan
keterampilan – keterampilan sensorik hingga motoric. Dalam hal ini juga kami mengingatkan
para pembaca bahwa pengukuran perilaku adaptif sangatlah bervariasi.sejumlah skala merancang
hanya tujuan untuk dianopsis, sejumlah skala lainnya diperuntukkan bagi penderita retdasi
mental ringan yang memerlukan pelatihan keterampilan kerja.sejumlah skala secara khusus
diperuntukkan untuk anak- anak, sejumlah skala lainnya diperuntukkan bagi orang dewasa.
Instrument – instrument tersebut penggunaannya tidak bisa saling dipertukarkan satu dengan
lainnya, calon pengguna harus mempelajari keunggulan dan kelemahan tes – tes tersebut dengan
cerna
52