OLEH :
NI PUTU AYU KEMALA SAVITRI
(1802531029)
Diantara banyaknya terjemahan dan adaptasi dari tes Binet. Terdapat beberapa revisi dari
Amerika, yang dimana yang paling layak pakai adalah Stanford-Binet. Revisi Stanford pertama
dari skala Binet-Simon dilakukan oleh Terman dan asosiasinya di Universitas Stanford, dan
dipublikasikan pada tahun 1916. Dalam revisian yang dilakukan oleh Terman dan asosiasinya,
terdapat hampir lebih dari sepertiga item baru, sejumlah item lama yang direvisi, relokasi ke
perbedaan level usia, dan eliminasi beberapa item. Skala juga telah distandarisasi di Amerika
dengan menggunakan sample dari 1000 anak dan 400 orang dewasa. Instruksi terperinci untuk
administrasi dan skoring tes diadakan, serta untuk pertamakalinya IQ digunakan dalam berbagai
tes psikologis.
Revisian kedua dari Stanford-Binet dipublikasi pada tahun 1937. Yang tersedia dengan
dua bentuk yaitu L dan M (Terman & Merrill, 1937). Dalam revisian ini, skala binet telah
diperluas dan distandarisasi berdasarkan populasi di Amerika. 3.184 subjek yang digunakan
dalam standarisasi ini terdiri atas 100 anak-anak di setiap interval usia 1 1/2 hingga 51/2 tahun, 200
anak dari setiap usia 6-14 tahun, dan 100 anak dari setiap rentang usia 15-18 tahun. Semua
subjek berada dalam 1 bulan menuju hari ulang tahunnya di hari dimana mereka di tes. Dan
setiap grup usia terdiri atas perempuan dan laki-laki dalam jumlah yang sama.
Revisi ke-tiga dipublikasi pada tahun 1960, tersedia dengan satu bentuk (L-M) yang
diperoleh dengan menggabungkan item terbaik dari kedua bentuk yang dipublikasi pada tahun
1937. Hal ini dilakukan untuk mengeliminasi item lama yang sudah usang tanpa menambahkan
item yang baru serta untuk merelokasi item yang tingkat kesulitannya telah berubah seiring
waktu mengikuti perubahan budaya.
Selanjutnya kembali lagi dilakukan standarisasi pada tahun 1972 dari bentuk L-M. Dalam
hal ini tidak dilakukan perubahan terhadap konten, namun terjadi beberapa perubahan pada
norma berdasarkan 2.100 kali tes yang telah dilakukan menggunakan skala ini dari tahun 1971-
1972 pada tahun akademik. Untuk dapat mewakili populasi nasional, kemudia dilakukan
pengujian kembali pada sample yang sangat besar. Penerbit dari tes ini kemudian menggunakan
sampel sebanyak 20.000 anak dari masing-masing level usia. Sampel yang diambil dari beberapa
anak sekolahan ini, yang kira-kira bila dijumlahkan, sekitar 200,000 berasal dari berbagai
komunitas, yang bertingkat baik ukuran, wilayah geografi, status ekonomi, termasuk anak-anak
Afrika-Amerika, Meksiko-Amerika, dan Puerto Rico.
Secara administrasi, tes Stanfor –Binet membutuhkan penguji yang sangat terlatih oleh
karena kerumitannya. Banyak dokter menganggap bahwa tes Stanford-Binet tidak hanya sebagai
tes standar, tetapi juga sebagai tes wawancara klinis. Karakteristik yang membuat skala ini
sangat sulit dikelola menciptakan peluang bagi pemeriksa untuk berinteraksi dengan subjek,
Stanford-Binet memungkinkan untuk mengamati metode kerja subjek, pendekatannya terhadap
masalah, dan aspek kerja kualitatif lainnya. Pemeriksa juga dapat memiliki kesempatan untuk
menilai karakteristik kepribadian tertentu, seperti tingkat aktivitas, kepercayaan diri, kegigihan,
dan kemampuan untuk berkonsentrasi. Nilai pengamatan kualitatif sangat bergantung pada
keterampilan, pengalaman dan kecanggihan psikologis dari pemeriksa, serta kesadaran pada
perangkap dan keterbatasan pada pengamatan yang dilakukan.
Dalam mengambil tes Stanfor-Binet, tidak ada subjek yang mencoba semua item. Setiap
individu hanya diuji berdasarkan rentang usia yang sesuai dengan level intelektualnya. Tes
biasanya tidak membutuhkan lebih dari tiga puluh sampai empat puluh menit pada subjek yang
lebih muda, dan tidak lebih dari satu setengah jam pada objek yang lebih tua. Prosedur pertama
adalah memulai tes menggunakan item yang tingkatnya sedikit dibawah usia mental yang
diharapkan dari peserta ujian. Dengan demikian, tes yang dibagikan pertama harus lebih mudah
untuk membangkitkan kepercayan diri, tetapi tidak semudah yang dapat menyebabkan
kebosanan dan gangguan. Jika individu gagal dalam prosedur tingkat pertama, maka tes yang
tingkatnya lebih rendah akan diberikan. Prosedur ini berlanjut hingga tercapai di mana semua tes
dilewati. Tingkat ini dikenal sebagai usia basal. Pengujian kemudian dilanjutkan ke atas ke
tingkat di mana semua tes gagal, dari sini akan didapat level maksimum. Ketika level ini
tercapai, maka tes dihentikan.
Item dalam tes individual Stanford-Binet diberi skor bersadarkan all-or-none. Untuk
setiap tes, kinerja minimal yang menentukan kemampuan menjawab benar ditentukan secara
manual. Misalnya dalam mengidentifikasi subjek, subjek akan lulus jika dia mengidentifikasi
secara tiga dari enam objek yang ditunjuk, dalam menjawab pertanyaan mengenai pemahaman,
subjek akam lulus apabila berhasil menjawab empat dari enam pertanyaan. Terkadang beberapa
tes muncul dalam bentuk yang identik pada tingkat tahun yang berbeda, namundiberi skor
dengan standar kelulusan yang berbeda.
Belum dijumpai peserta ujian yang dapat lulus semua tes pada atau di bawah tingkat usia
mental mereka dan gagal semua tes diatas tingkat tersebut. Usia mental subjek pada Stanford-
Binet didapatkan dengan member kredit kepada subjek dengan usia basal dan menambah usia
kredit beberapa bulan untuk setiap tes yang melampaui level basal. Usia mental tertinggi yang
secara teoritis dapat dicapai di Stanford-Binet adalah 22 tahun 10 bulan. Namun skro tersebut
bukanlah usia mental yg sebenarnya, melaikan skor numerik yang menunjukkan tingkat
keunggulan di atas kinerja rata-rata dewasa, dan tentu saja tidak sesuai dengan pencapaian rata-
rata anak berusia 22 tahun.
Normative Interpretations
Pada tahun 1960, Stanford-Binet menawarkan inovasi berupa substitusi deviasi IQ untuk
rasio yang digunakan dalam IQ pada bentuk sebelumnya. Deviasi IQ ini adalah skor standar
dengan rata-rata 100 dan SD 16. Keunggulan dari jenis IQ ini adalah bahwa ia memberikan skor
yang sebanding di semua tingkat usia dan menghilangkan tingkat keanehan rasio IQ.
Salah satu keunggulan Stanford-Binet berasal dari banyaknya data interpretative dan
pengalaman klinis yang telah diakumulasikan terkait dengan tes ini. Bagi banyak dokter,
pendidik, dan orang-orang yang perduli dengan evaluasi tingkat kemampuan umum, Stanford-
Binet IQ telah menjadi hamper identik dengan kecerdasan. Banyak yang telah dipelajari tentang
perilaku, sepeti apa yang dapat digarapkan pada anak dengan skor IQ 50 atau 80 ataupun 120
pada tes ini. Distribusi IQ dalam sampel standarisasi berturut-turut telah memberikan kerangka
acuan umum untuk interpretasi IQ.
Reliability
Reliabilitas dari tes Stanford-Binet pada tahun 1937 ditentukan dengan mengkorelasikan
IQ pada Formulir L dan M yang diberikan kepada kelompok standarisasi dalam interval satu
minggu atau kurang. Dengan demikian, koefisien reliabilitas merupakan ukuran stabilitas
temporal jangka pendek dan kesetaraan konten dikedua sampel item. Analisis yang sangat teliti
tentang kendala tes ini dilakukan dengan menaruh acuan pada usia dan tingkat IQ subjek.
Stanford-Binet cenderung dapat lebih diandalkan serta memiliki reliabilitas yang lebih
tinggi untuk subjek yang lebih tua daripada yang lebih muda, oleh karena bertambahnya usia
menyebabkan control yang lebih baik terhadap mata pelajaran yang pernah dipelajari. Faktor lain
adalah perlambatan laju perkembangan seiring bertambahnya usia. Ketika reliabilitas diukur
dengan pengujian ulang, subjek yang mengalami sedikit perubahan menunjukan fluktuasi yang
kurang acak.
Sebagian besar koefisien reliabilitas tes Stanford-Binet yang dilaporkan untuk berbagai
usia dan tingkat IQ lebih daro 0.90, meskipun tes dihitung secara terpisah dalam setiap kelompok
umur yang diuji satu bulan setelah ulang tahun ataupun setengah ulang tahun. Reliabilitas yang
ditawarkan Stanford-Binet memberikan kesalahan pengukuran sekitar 5 poin IQ. Dengan kata
lain, IQ Stanford-Binet seorang subjek dapat lebih atau kurang dari 5 poin dalam satu pengujian.
Namun kesalahan pengukuran ini akan sedikit lebih tinggi pada anak yang lebih muda daripada
anak yang lebih tua serta agak lebih tinggi pada anak yang cerdas daripada anak yang kurang
cerdas.
Validity
Validitas konten dari Stanford-Binet didapat dari informasi pengerjaan tes yang dilakukan
oleh subjek. Tugas-tugas yang dikerjakan oleh subjek terdiri atas menjalankan keseluruhan dari
manipulasi sederhana hingga penalaran abstrak. Pada tingkat usia paling awal, tes membutuhkan
koordinasi mata-tangan, diskriminasi persepsi, dan kemampuan untuk mengikuti arahan, serta
identifikasi objek umum yang disajikan dalam bentuk mainan maupun gambar.
Beberapa bentuk tes yang diaplikasikan pada usia yang lebih luas lebih menggunakan
penilaian praktis dan akal sehat seperti, mengapa praktik tertentu dilakukan, penafsiran situasi,
ataupun pendeteksian kerumitan sebuah gambar. Tes memori juga terdapat di seluruh skala, tes
ini meminta individu untuk mengingat suatu objek, angka, maupun kalimat. Pada tingkat yang
lebih luas terdapat tes orientasi spasial yang menuntut subjek untuk dapat mengukur kemampuan
orientasi spasial dari subjek.
Jenis tes yang paling umum terutama pada tingkat usia atas adalah yang menggunakan
konten verbal seperti kosa kata, analogi, penyelesaian kalimat, kalimat yang kacau,
mendefinisikan istilah abstrak, dan menafsirkan peribahasa. Terdapat beberapa jenis tes yang
tidak didominasi verbal dalam kontennya namun tetap membutuhkan instruksi verbal yang
cukup kompleks.
Sejauh semua fungsi yang tercantum relevan dengan “kecerdasan”, skala dapat dikatakan
memiliki validitas konten. Data validitas konstruk Stanford-Binet berasal dari banyak sumber.
Kesinambungan fungsi yang diukur pada skala 1916, 1937, dan 1960 dipastikan dengan hanya
mempertahankan item-item yang dianggap berkorelasi memuaskan dengan usia mental pada
setiap versi formulir sebelumnya. Sehingga item-item yang terdapat di dalam skala Stanford-
Binet memiliki korelasi yang sangat tinggi. Diferensiasi usia merupakan kriteria utama dalam
pemilihan item Stanford-Binet, dengan demikian ada jaminan bahwa Stanford-Binet dapat
mengukur kemampuan yang meningkat dari subjek seiring bertambahnya usia.
Skala Kecerdasan Wechsler-Bellevue, diterbitkan pada tahun 1939, yang di mana tujuan
utama dari tes ini adalah untuk memberikan tes kecerdasan yang cocok untuk orang dewasa.
Ketika pertama kali menyajikan skala ini, Wechsler menunjukkan bahwa tes kecerdasan yang
tersedia sebelumnya telah dirancang terutama untuk anak sekolah dan telah diadaptasi untuk
digunakan orang dewasa dengan menambahkan item yang lebih sulit dari jenis yang sama. Isi
dari tes semacam itu seringkali kurang menarik bagi orang dewasa. Banyak item tes kecerdasan,
yang ditulis dengan referensi khusus untuk kegiatan sehari-hari anak sekolah, jelas memiliki
validitas yang tidak diperuntukkan bagi orang dewasa.
WAIS terdiri dari sebelas subyek, enam subyek dikelompokkan ke dalam Skala Verbal
dan lima subyek ke dalam Skala Kinerja. Subjek tersebut antara lain:
Verbal Scale
1. Informasi: terdapat 29 pertanyaan yang mencakup berbagai informasi yang dimiliki orang
dewasa mengenai kulturnya, upaya ini dilakukan untuk menghindari pengetahuan khusus
atau akademis untuk menetapkan tingkat intelektual individu dan orientasi praktisnya.
3. Aritmatika: 14 masalah yang mirip dengan yang dijumpai di aritmatika sekolah dasar.
Setiap masalah disajikan secara lisan dan harus diselesaikan tanpa menggunakan kertas dan
pensil.
4. Kesamaan: terdiri atas 13 item yang meminta subjek untuk menjelaskan dengan cara apa
subjek melihat dua hal yang disajikan.
5. Digit Span: Daftar tiga hingga sembilan digit yang disajikan secara lisan dan harus diulangi
secara lisan oleh subjek. Pada bagian kedua, subjek harus mengucapkan ulang daftar dua
hingga delapan digit dalam urutan mundur.
6. Kosakata: Disajikan 40 kata yang diurutkan dari yang termudah hinga yang paling rumit,
kata-kata disajikan baik secara lisan dan visual. Peserta ujian ditanya apa arti setiap kata.
Performance Scale
7. Digit Symbol: Ini adalah versi tes substitusi kode yang sudah dikenal yang sering
dimasukkan dalam skala kecerdasan non-bahasa. Terdapat kunci yang berisi 9 simbol yang
dipasangkan dengan 9 digit angka. Dengan kunci ini di depannya, peserta ujian memiliki 1
½ menit untuk mengisi sebanyak mungkin simbol di bawah angka pada lembar jawaban.
8. Picture Completion: terdiri atas 21 kartu, masing-masing berisi gambar yang sebagian
unsurnya hilang. Peserta ujian harus menyebutkan bagian apa yang hilang dari setiap
gambar.
9. Block Design: Subtes ini menggunakan satu set kartu yang berisi desain berwarna merah dan
putih serta satu set balok berukuran satu inci yang identik, yang sisi-sisinya dicat merah,
putih, dan merah-putih. Peserta ujian ditunjukkan satu desain pada satu waktu, yang harus ia
lakukan adalah dengan memilih dan merakit blok yang tepat yang sesuai dengan gambar
pada kartu.
10. Picture Arrangement: Setiap item terdiri dari satu set kartu yang berisi gambar untuk disusun
kembali dalam urutan yang tepat untuk menceritakan suatu kisah.
11. Perakitan Objek: Subjek diminta untuk menyusun potongan-potongan yang harus dirakit
untuk membuat suatu bentuk dari objek yang familar.
Norms
Sampel yang digunakan dalam proses standardisasi WAIS dipilih dengan sangat hati-hati
untuk memastikan keterwakilannya. Sampel normatif utama terdiri dari 1.700 kasus, termasuk
jumlah yang sama antara pria dan wanita yang mendistribusikan lebih dari tujuh tingkat usia
antara 16 dan 64 tahun. Subjek dipilih sedemikian rupa agar semirip mungkin dengan proporsi
dalam sensus Amerika Serikat tahun 1950 berkenaan dengan wilayah geografis, tempat tinggal
perkotaan-pedesaan, ras (kulit putih versus non kulit putih), tingkat pekerjaan, dan pendidikan.
Pada setiap tingkat umur, satu pria dan satu wanita dari institusi retardasi mental juga
dimasukkan.
Norma pelengkap untuk orang yang lebih tua ditetapkan dengan menguji “sampel usia
tua” dari 475 orang, berusia 60 tahun ke atas, di kota Midwestern. Memang sulit untuk
mendapatkan sampel yang representatif dari populasi dengan usia di atas 60. Meskipun sampel
WAIS mungkin lebih representatif daripada sampel manula lainnya yang diuji sebelum waktu
itu, ada bukti yang menunjukkan bahwa perbedaan regional yang signifikan berpengaruh
terhadap besaran relatif dari Skor Verbal dan Kinerja pada tingkat usia ini (60+). Selain itu,
penerapan norma-norma yang dikumpulkan sebelum 1955 dipertanyakan, mengingat tingkat
pendidikan dan budaya penduduk yang meningkat pesat, yang terpenting dalam hal ini adalah
melakukan peninjauan kembali terhadap penurunan baya di antara orang tua.
Skor mentah pada setiap subtes WAIS ditransmutasikan ke dalam skor standar dengan
rata-rata 10 dan SD 3. Skor skala ini berasal dari kelompok referensi dengan jumlah 500 kasus
yang mencakup semua orang diantara usia 20 dan 34 tahun yang digunakan sebagai sampel
dalam proses standardisasi. Dengan demikian, semua skor subtest dinyatakan dalam unit yang
sebanding.
B. Tes Kelompok
Tes kelompok merupakan jenis tes yang dikembangkan untuk mengukur kemampuan dari
banyak individu dalam waktu yang bersamaan, penilaian dari tes kelompok bersifat objektif
sehingga tes ini cenderung bersifat hemat waktu dalam pengadministrasian dan penilaian tes.
Dalam hal konten, tes kelompok hamper sama halnya dengan tes individual karena sama-sama
bertujuan untuk mengcapture kemampuan individu. Ts kelompok banyak digunakan dalam
sekolah-sekolah maupun penyeleksian tenaga kerja.
Terdapat jenis tes yang temasuk kedalam tes kelompok antara lain :
1. Tes Prestasi Siswa
Merupakan tes yang digunakan untuk mengukur sejauh mana kemampuan belajar dari
siswa, tes ini berbentuk ujian mengenai materi tertentu yang diberikan kepada siswa.