Anda di halaman 1dari 16

Jurnal Ilmiah Psikologi MANASA

2016, Vol. 5, No. 2, 165-180

PENGUJIAN PROPERTI PSIKOMETRIK INTELLIGENZ STRUKTUR TEST


SUBTES KEMAMPUAN SPASIAL DUA DIMENSI (FORM AUSWAHL): STUDI
PADA DUA SMA SWASTA DI JAKARTA

Indro Adinugroho
Fakultas Psikologi, Unika Atma Jaya
indro.adinugroho@atmajaya.ac.id

Abstrak

Intelligenz Struktur Test (IST) adalah salah satu jenis alat ukur yang mengukur
konstruk inteligensi manusia. Sebagai alat ukur inteligensi, IST menghasilkan skor mean
dalam konteks inteligensi yang disebut dengan Intelligence Quotient (IQ). IST dikembangkan
oleh Rudolf Amthauer pada tahun 1953 di Jerman dengan teori dasar Primary Mental
Abilities (PMA). PMA adalah teori inteligensi dasar yang dikembangkan oleh Lois Leon
Thurstone dimana teori ini mendeskripsikan tujuh kemampuan dasar dalam tataran kognitif
manusia. Hingga saat ini, IST masih digunakan oleh Biro Layanan Psikologi, Fakultas
Psikologi Unika Atma Jaya sebagai instrumen utama guna keperluan asesmen dan evaluasi.
Studi ini bertujuan untuk menguji properti psikometrik salah satu subtes dalam IST yang
mengukur kemampuan spasial dua dimensi, yaitu subtes Form Auswahl (FA). Metode uji
properti psikometrik akan melibatkan analisis item; validasi convergent – discriminant dan
uji reliabilitas dengan split-half. Hasil analisis item menunjukkan bukti empiris untuk
mempertahankan seluruh item. Akan tetapi, analisis distraktor menunjukkan hasil yang
berbeda. Ada kebutuhan untuk merevisi pilihan jawaban dalam soal karena ketidakmampuan
distraktor untuk mengecoh respon individu. Secara umum, uji validitas dan reliabilitas
menunjukkan bahwa subtes FA masih sesuai untuk mengukur kemampuan spasial terhadap
orang Indonesia.

Kata kunci: spasial, IST, Form Auswahl, properti psikometrik

Abstract

Intelligenz Struktur Test (IST) is one-kind psychological measurement that has


primary function measure human intelligence. As an intelligence test, IST produces mean
score in the context of human ability called intelligence quotient (IQ). IST was developed by
Rudolf Amthauer on 1953 in Germany, also with Primary Mental Abilities (PMA) as its
theoretical framework. PMA is a basic concept of intelligence developed by Lois Leon
Thurstone that describes seven primary abilities exists in human cognition. Until now, IST is
still used in Psychological Services Bureau (PSB), Faculty of Psychology Atma Jaya Catholic
University as their primary tool for assessment and evaluation purposes. This study aims to
examine the psychometric properties of one of the subtest in IST that measures two-
dimension spatial intelligence, Form Auswahl (FA). Techniques related to psychometric
examination will include item analysis, convergent and discriminant validation and also
split-half method for reliability testing. Item analysis shows the empirical support to retain
all the items in FA. However, distractor-analysis shows different result. There is a need to
revise some of the choices due to lack of capability to flam the answer of lower group. In
conclusion, validity and reliability examinations show that FA is still appropriate for
assessing two-dimension spatial ability in Indonesian context.

Keywords: Spatial, IST, Form Auswahl, psychometric properties

165
Dalam psikologi, inteligensi proses psikometrik bernama factor
dipahami sebagai sebuah variabel yang analysis, yaitu metode psikometrik dengan
menggambarkan kemampuan dasar tujuan mengidentifikasi keterkaitan antar
manusia (ability) dan menyangkut variabel yang disebut dengan faktor baik
berbagai kemampuan khusus (Thurstone, yang sudah ada (confirmatory factor
1938). Setiap kemampuan khusus mampu analysis) maupun yang belum ada
berperan sebagai instrumen yang (exploratory factor analysis; Chadha,
digunakan oleh manusia ketika 2009) Metode analisis faktor dapat
menghadapi persoalan yang membutuhkan memberikan analisis mengenai kontribusi
kapasitas kognitif. Misalnya, ketika item secara statistik dan psikometrik
seorang tentara harus mengatur strategi terhadap faktor-faktor yang terbentuk.
yang paling efektif untuk melakukan Teori PMA adalah teori yang lahir dari
penyergapan musuh di hutan belantara. kritik Thurstone terhadap teori inteligensi
Strategi yang disusun akan berbeda ketika g factor yang mendeskripsikan inteligensi
musuh berada di daerah perairan. sebagai satu kemampuan umum yang
Penyusunan strategi yang berbeda tentu dimiliki oleh manusia yang bernama
akan membutuhkan kemampuan khusus general ability atau general factor (g)
yang berbeda pula, bahkan kombinasi dari yang dikemukakan Charles Spearman
lebih satu kemampuan khusus. Dalam (1904;1927).
ranah pengukuran psikologi, kemampuan IST memiliki sembilan subtes
khusus disebut sebagai aptitude (Anastasi dengan karakteristik item yang berbeda-
& Urbina, 1997). Guna mengidentifikasi beda. Setiap subtes dibuat untuk mengukur
inteligensi yang merupakan gabungan dari aspek kemampuan khusus pada manusia
berbagai aptitude, psikologi memiliki atau yang disebut dengan aptitude. Secara
konsep yang disebut dengan intelligence psikometrik, IST tergolong ke dalam
quotient (IQ). IQ merujuk pada multiple aptitude batteries test, yaitu tes
pemaknaan mengenai sejauh mana yang disusun oleh serangkaian subtes
kemampuan dasar individu yang dimana setiap subtes mengukur
digambarkan melalui skor rata-rata dari kemampuan khusus yang berbeda
berbagai aspek kemampuan khusus yang (Anastasi & Urbina, 1997). Nilai IQ dalam
diperoleh individu melalui alat ukur IST diperoleh dari nilai total rata-rata
inteligensi yang terstandar (Anastasi & kemampuan khusus yang diperoleh oleh
Urbina, 1997). individu. Namun, interpretasi paling utama
Salah satu alat ukur inteligensi dari IST bukanlah merujuk kepada nilai IQ
yang telah diadaptasi dalam konteks total, namun pada profil inteligensi yang
Indonesia adalah Intelligenz Struktur Test dihasilkan dari 9 subtes pada IST.
(IST). IST dibuat dan dikembangkan oleh Misalnya, ketika individu memiliki skor
Rudolf Amthauer di Jerman pada tahun yang tinggi pada subtes kemampuan verbal
1953 (Polhaupessy, 2002). IST lahir dan (Gemeinsamkeiten atau GE) dibandingkan
dikembangkan mengacu kepada teori dengan kemampuan spasial (Form
inteligensi yang dikemukakan L.L Auswahl atau FA), bukan berarti bahwa
Thurstone yaitu Primary Mental Abilities selamanya individu tersebut tidak dapat
(PMA). PMA adalah teori inteligensi yang melakukan pekerjaan berbasis kemampuan
memaparkan bahwa manusia memiliki keruangan. Melalui pengalaman dan
tujuh kemampuan dasar yang saling terkait pembelajaran kemampuan khusus yang
satu sama lain (Thurstone, 1938; konsisten, maka skor kemampuan khusus
Thurstone & Thurstone, 1941). Tujuh tersebut pun dapat berubah.
kemampuan dasar tersebut lahir dari

166
IST pertama kali diadaptasi dalam Studi ini merupakan salah satu
konteks Indonesia oleh Fakultas Psikologi rangkaian dari studi besar guna
Universitas Padjajaran Bandung. mengidentifikasi properti psikometrik
Penggunaan IST sebagai alat ukur keseluruhan subtes dalam IST secara detil.
inteligensi yang menghasilkan profil Secara khusus, studi ini hanya akan
kecerdasan individu telah berlangsung berfokus pada satu subtes dalam IST, yaitu
lama dan cukup luas, seperti seleksi calon subtes Form Auswahl (FA). Subtes FA
peserta didik di institusi pendidikan dan dalam IST memiliki fungsi mengukur
calon karyawan di perusahaan. Salah satu kemampuan spasial dua dimensi. Secara
institusi pendidikan yang menggunakan khusus, kemampuan spasial dua dimensi
IST hingga saat ini adalah Biro Layanan pada IST-FA dipahami sebagai
Fakultas Psikologi Unika Atma Jaya. kemampuan manusia untuk
Sebagai alat tes yang diadaptasi pada membayangkan objek yang memiliki
tahun 1953 dan masih digunakan hingga bentuk konkret dua dimensi, seperti
saat ini, IST harus mendapat sentuhan bangun datar seperti persegi, lingkaran,
pengujian properti psikometrik guna dan trapezium. Salah satu hal yang
mengidentifikasi apakah item dan subtes merupakan ciri utama dari objek dua
dalam IST masih layak digunakan atau dimensi adalah tidak memiliki volume
tidak. Kajian mengenai properti (isi). Sebagai sebuah kemampuan khusus,
psikometrik sebuah alat tes menjadi sangat manfaat dari kemampuan spasial terhadap
esensial karena kunci utama dari alat ukur kehidupan manusia tidak dapat dipandang
dalam ilmu psikologi adalah soal presisi sebelah mata. Studi yang dilakukan oleh
(validitas) dan konsistensi hasil Wanzel, Hamstra, Anastakis, Matsumoto,
pengukuran (reliabilitas) (Crocker & dan Cusimano (2002) mendeskripsikan
Algina, 1986; Anastasi & Urbina, 1997). bahwa individu dengan kemampuan
Sebenarnya, studi terkait properti spasial yang tinggi cenderung memiliki
psikometrik terhadap IST pernah kemampuan bedah medis yang baik. Studi
dilakukan oleh Santosa, Bonang, dan ini merekrut 37 mahasiswa kedokteran
Panggabean (1998) terhadap seluruh yang sedang mempelajari ilmu
subtes IST. Studi ini membahas mengenai pembedahan. Setiap partisipan diminta
kekuatan IST dalam memberikan prediksi untuk mengisi enam jenis alat ukur
terhadap skor IPK mahasiswa di Fakultas kemampuan spasial dari tingkat kesulitan
Keguruan dan Ilmu Pendidikan (FKIP); sederhana hingga kompleks. Guna
Fakultas Hukum (FH) dan Fakultas mengidentifikasi kemampuan mereka
Psikologi (FP) Universitas Katolik dalam melakukan operasi bedah, Wanzel
Indonesia Atma Jaya. Hasil studi et al. (2002) menggunakan role play
menunjukkan beberapa subtes mampu operasi pembedahan yang telah
memberikan prediksi yang signifikan terstandarisasi untuk menguji kemampuan
terhadap nilai IPK mahasiswa di FKIP, FH operasi bedah partisipan bernama two-flap
dan FP, yaitu subtes Satzerganzung (SE); Z-plasty dan four-flap Z-plasty. Role play
Analogien (AN); Merk Aufgaben (ME), merujuk kepada sebuah aktivitas yang
dan Rachen Aufgaben (RA). Namun, studi berperan sebagai ilustrasi dari aktivitas
ini sudah berlangsung cukup lama dan yang sebenarnnya. Hasil studi
hingga saat kini dunia telah mengalami menunjukkan bahwa partisipan dengan
perkembangan ilmu pengetahuan yang kemampuan spasial yang tinggi cenderung
dirasa menjadi sebuah pemicu perlunya memiliki kemampuan pembedahan medis
dilakukan kembali studi terkait properti yang lebih baik dibandingkan dengan
psikometrik secara komprehensif terhadap partisipan yang memiliki kemampuan
IST dan subtes-subtes di dalamnya. spasial rendah.

167
Studi yang mengidentifikasi komponen yang terdiri dari beragam
properti psikometrik terhadap subtes FA aktivitas intelektual yang merujuk kepada
akan dilakukan dalam tiga tahap penting, satu kemampuan dasar yang disebut
yaitu: (1) analisis item, (2) validitas, dan dengan general ability (g). General ability
(3) reliabilitas (Cohen & Swerdlik, 2009). (g) mengidentifikasi eksistensi
Tahap pertama adalah analisis item guna kemampuan-kemampuan khusus yang
mengidentifikasi kualitas setiap item dimiliki oleh manusia dan setiap
dalam membedakan partisipan dengan kemampuan khusus memiliki kontribusi
kemampuan spasial tinggi dan rendah. terhadap kemampuan umum (g). Terdapat
Guna mencapainya, penulis menggunakan empat kemampuan khusus yang
metode analisis item difficulty, item diidentifikasi oleh teori g-factor, yaitu
discrimination, dan analisis distraktor. kemampuan mekanis (mechanical);
Ketiganya dilakukan sebagai masukan kemampuan berpikir logis (logical);
empiris mengenai item mana saja yang kemampuan keruangan (spatial) dan
masih berkualitas dan yang tidak kemampuan numerik (arithmatic). Salah
berkualitas. Tahap kedua adalah satu alat ukur inteligensi dengan kerangka
melakukan uji validitas dengan metode teori g-factor adalah Raven Progressive
convergent-discriminant guna Matrices (RPM; Raven, 2000). RPM
mengidentifikasi kemampuan subtes FA memandang inteligensi manusia sebagai
secara keseluruhan (kombinasi item-item) kombinasi (agregat) skor total alat ukur
untuk membedakan partisipan dengan dengan menyesuaikan pada usia biologis
kemampuan spasial dua dimensi yang partisipan. Artinya, ada standar baku yang
rendah dan tinggi. Teknik ini ditetapkan dalam norma RPM di setiap
mengharuskan penulis melakukan uji jenjang usia biologis terkait dengan nilai
korelasi antara subtes FA dengan subtes minimum inteligensi yang seharusnya
lain yang memiliki konstruk serupa diperoleh oleh partisipan.
(convergent) dan alat tes lain yang Jika g-factor theory memandang
memiliki konstruk berbeda (discriminant) bahwa inteligensi adalah satu kemampuan
(Cohen & Swerdlik, 2009). Tahap ketiga utama yang terbentuk dari empat
adalah melakukan uji reliabilitas dengan kemampuan khusus, maka berbeda halnya
membagi alat tes yang telah melalui proses dengan PMA sebagai landasan teori alat
analisis item ke dalam dua belahan yang ukur IST. Teori PMA tidak
setara atau disebut dengan split-half. mengidentifikasi bahwa manusia hanya
Kesimpulan apakah subtes FA masih layak memiliki satu kemampuan dasar,
digunakan atau tidak akan diperoleh melainkan tujuh kemampuan dasar.
melalui analisis yang mendalam dari tiga Kemampuan-kemampuan dasar ini disebut
tahapan tersebut. sebagai Primary Mental Abilities
(Thurstone, 1938; Guilford, 1972). Tujuh
Primary Mental Abilities (PMA) sebagai kemampuan dasar tersebut, adalah verbal
Landasan Teori IST comprehension (V); word fluency (W);
Teori PMA pertama kali number (N); space (S); associative
dikembangkan oleh Lois Leon Thurstone, memory (M); perceptual speed (P);
seorang tokoh psikologi yang memiliki general reasoning (I). Setiap kemampuan
berbagai kontribusi terhadap lahir dan dasar berkaitan dengan beberapa subtes
berkembangnya teori inteligensi, statistik yang mengukur konstruk serupa. Tujuh
serta analisis faktor dalam psikologi. PMA kemampuan dasar ini diperoleh melalui
adalah sebuah teori yang mengkritik teori analisis faktor yang bertujuan
inteligensi g-factor yang dibuat oleh mengidentifikasi kontribusi dari dimensi
Charles Spearman (1904; 1927). Teori g- alat ukur terhadap faktor yang terbentuk.
factor mengidentifikasi inteligensi sebagai

168
Tabel 1 menunjukkan skema dasar PMA alat ukur inteligensi dan salah satunya
yang terbagi ke dalam tujuh kemampuan adalah Intelligenz Struktur Test (IST) yang
dasar atau yang disebut dengan faktor dikembangkan oleh Rudolf Amthauer di
utama. Setiap faktor dapat diukur dengan Jerman pada tahun 1953 (Polhaupessy,
dimensi perilaku berbeda yang dapat 2002). IST memiliki sembilan subtes yang
direpresentasikan dengan subtes. Subtes merepresentasikan teori PMA. Kombinasi
merupakan representasi yang lebih konkret skor dari beberapa subtes mampu
dari faktor utama atau yang disebut dengan merepresentasikan tujuh faktor utama
primary factor. Kombinasi dari tujuh PMA. Misalnya, faktor space (PMA) dapat
faktor utama dalam teori PMA tetap diukur dengan subtes Form Auswahl (FA)
mampu menghasilkan nilai IQ, namun yang mengukur kemampuan spasial dua
terlepas dari itu, profil kemampuan dasar dimensi dan subtes Wurfel Aufgaben (WU)
yang dihasilkan oleh teori PMA dari tujuh yang mengukur kemampuan spasial tiga
faktor utama memiliki peran yang lebih dimensi. Artinya, partisipan dikatakan
penting dalam mendeskripsikan memiliki kemampuan keruangan yang
kemampuan manusia. baik (space) diidentifikasi dari skor total
subtes FA dan WU.
Tabel 1: Struktur Primary Mental
Abilities (Thurstone, 1938) Intelligenz Struktur Test yang
Faktor utama Dimensi Digunakan di Indonesia
Verbal Pemahaman dalam Di Indonesia, IST pertama kali
comprehension (V) membaca dibawa dan diadaptasi oleh Fakultas
Analogi verbal Psikologi, Universitas Padjajaran
Memahami kalimat Bandung. Penggunaan IST sebagai alat
yang tidak terstruktur
ukur inteligensi yang dapat menghasilkan
Penalaran verbal
profil inteligensi telah diaplikasikan dalam
Word fluency (W) Mengenai nama objek
dalam kategori tertentu berbagai konteks seperti seleksi karyawan
Mengenali rima kata di dunia kerja hingga penentuan peminatan
Number (N) Kecepatan dan akurasi di sekolah menengah atas (SMA). Salah
dalam problem satu institusi yang masih menggunakan
matematika IST hingga saat ini adalah Biro Layanan
Space (S) Kemampuan Psikologi (BLP) Fakultas Psikologi (FPSI)
membayangkan objek Unika Atma Jaya. Namun, sebelum IST
(2 & 3 dimensi) digunakan oleh BLP FPSI Unika Atma
Membayangkan objek Jaya, terdapat tiga fakultas di universitas
secara visual dengan Atma Jaya yang telah menggunakan IST
rotasi tertentu sebagai instrumen seleksi calon mahasiswa
Associative memory Mengingat objek
tingkat S1 pada tahun 1997 yaitu Fakultas
(M) Mengingat kata
(verbal) Psikologi (FPSI); Fakultas Hukum (FH)
Perceptual speed Mengenai detil visual dan Fakultas Ilmu Keguruan dan Ilmu
(P) terkat persamaan dan Pendidikan pada tahun 1998 (FKIP;
perbedaan dari sebuah Santosa et. al, 1998). Ketiga fakultas
objek tersebut menggunakan IST sebagai
General reasoning Berpkir secara induktif instrumen seleksi mahasiswa baru program
(I) Berpikir secara S1.
deduktif Sebagai instrumen utama yang
digunakan oleh Unika Atma Jaya, Fakultas
Sebagai teori besar yang Psikologi pernah melakukan studi terkait
menjelaskan inteligensi, teori PMA telah uji psikometrik terhadap keseluruhan
digunakan sebagai kerangka teori berbagai subtes dalam IST (Santosa et. al, 1998).

169
Pengujian properti psikometrik melibatkan subtes RA dengan IPS FPSI (r=199,
461 mahasiswa FPSI, FH dan FKIP Unika p<.05). Studi ini menunjukkan bahwa
Atma Jaya sebagai partisipan. Pengujian beberapa subtes memiliki kemampuan
properti psikometrik yang dilakukan prediksi yang tepat. Misalnya subtes ME
melibatkan uji validitas prediktif terhadap yang mengukur kemampuan mengingat
seluruh subtes IST. Uji validitas prediktif kata memiliki korelasi yang positif dan
merujuk pada pengujian validitas yang signifikan dengan nilai IPS FH. Hal ini
terkait dengan kemampuan suatu alat ukur sejalan dengan argumen bahwa mata
memberikan prediksi terhadap perilaku kuliah yang dijalani oleh mahasiswa FH
atau konstruk lain yang terkait dengan alat erat kaitannya dengan menghafal undang-
ukur (Cohen & Swerdlik, 2009). Ketika undang dan berbagai aturan lain yang
melakukan uji validitas prediktif, akan ada berlaku di Republik Indonesia.
dua elemen utama, yaitu skor alat ukur Sayangnya, pengujian properti
(skor mentah) dan kriterion eksternal. psikometrik yang telah dilakukan hanya
Kriterion eksternal merujuk kepada menyasar aspek validitas prediktif. Uji
dimensi perilaku yang terkait dengan properti psikometrik terkait validitas
konstruk yang diukur dalam sebuah alat prediktif juga sudah terlampau lama, yaitu
ukur psikologi (Anastasi & Urbina, 1997; tahun 1998. Dalam uji properti
Cohen & Swerdlik, 2009). Misalnya, alat psikometrik yang melibatkan validitas
ukur yang mengukur kemampuan spasial prediktif tersebut tidak disertai dengan
dapat dikaitkan dengan kriterion eksternal pengujian kualitas item dan konsistensi
berupa catatan dari atasan mengenai subtes dalam mengukur konstruk. Hal ini
performa supir taksi dalam mengisyaratkan untuk dilakukannya uji
mengidentifikasi rute jalan yang paling validitas dan reliabilitas yang lebih
efisien Pengujian validitas prediktif yang komprehensif dan kontemporer guna
dilakukan oleh Santosa, et. al (1998) menyasar item hingga kemampuan
menggunakan nilai Indeks Prestasi keseluruhan subtes dalam mengukur
Semester I (IPS) mahasiswa FPSI, FH dan konstruk. Studi ini bermaksud untuk
FKIP. Secara teknis, uji validitas akan melakukan uji properti psikometrik yang
dilakukan dengan teknik statistik korelasi lebih komprehensif terhadap salah satu
Pearson antara skor yang dihasilkan setiap subtes dalam IST, yaitu subtes FA. Studi
subtes dalam IST dengan skor IPS subtes FA merupakan bagian dari studi
partisipan. Korelasi Pearson merujuk pada besar pengujian properti psikometrik
teknik statistik yang dapat digunakan terhadap seluruh subtes IST yang
untuk mengidentifikasi nilai korelasi atau dilakukan oleh Bagian Pengukuran
keterkaitan antar dua variabel yang Psikologi, FPSI Unika Atma Jaya.
dideskripsikan dengan nilai r dan arah
korelasi (positif atau negatif; Howell, Subtes Form Auswahl (FA) dan
2010). Sebanyak 27 nilai korelasi Kemampuan Spasial Dua Dimensi
dihasilkan melalui korelasi setiap subtes Sebagai alat ukur inteligensi yang
IST dengan nilai IPS partisipan dari tiga menggunakan kerangka teori PMA, setiap
fakultas. Hasilnya, sebanyak tujuh nilai r subtes dalam IST mewakili tujuh
memiliki korelasi yang positif dan kemampuan dasar manusia. Secara khusus,
signifikan, yaitu antara subtes SE dengan dalam konteks subtes FA, kemampuan
IPS FKIP (r=.181, p<.05); subtes AN dasar dalam kerangka PMA yang terukur
dengan IPS FKIP (r=.220, p<.05); subtes adalah faktor space atau keruangan.
SE dengan IPS FH (r=.248, p<.05); subtes Sebagai salah satu subtes yang mengkur
AN dengan IPS FH (r=213, p<.05); subtes kemampuan inteligensi, FA memiliki
ME dengan IPS FH (r=.322, p<.05); subtes kemampuan untuk mengidentifikasi
RA dengan IPS FH (r=.193, p<.05) dan kemampuan spasial yang sifatnya dua

170
dimensi. Dua dimensi yang dimaksudkan digunakan oleh individu dalam memahami
dalam subtes FA adalah kemampuan dan menyelesaikan permasalahan sosial
individu untuk mengidentifikasi apakah berbeda tergantung dengan
sebuah objek dua dimensi memiliki bentuk permasalahannya.
yang serupa meskipun diletakkan, dirotasi Sebagai salah satu subtes yang
dalam berbagai arah hingga dibelah bertujuan mengukur kemampuan spasial,
(Polhaupessy, 2002). Artinya, kemampuan subtes FA menetapkan persoalan
spasial pada individu bekerja ketika mengenai bangun datar sebagai persoalan
individu mampu memutuskan apakah dua yang harus diselesaikan. Item dengan jenis
atau lebih dari dua objek yang ditampilkan ini diharapkan mampu memberikan
memiliki bentuk yang serupa atau tidak. stimulasi kepada partisipan untuk
Sebagai salah satu dimensi menggunakan proporsi kemampuan spasial
kemampuan dasar (primary ability), yang lebih besar dibandingkan dengan
kemampuan spasial tidak dapat berperan kemampuan lainnya. Gambar 1
secara independen. Selalu ada irisan menunjukkan contoh item pada subtes FA.
kemampuan-kemampuan lain yang Pada setiap item, partisipan diminta untuk
memiliki keterkaitan dengan kemampuan mengidentifikasi satu bangun datar (5
spasial. Misalnya, ketika individu ingin pilihan) yang tidak dapat dibentuk dengan
pergi ke mall di daerah Pondoh Indah, bangun datar yang terbelah (4 pilihan).
Jakarta Pusat, ada dua kemampuan dasar Sebagai bagian dari alat ukur IST,
yang berperan disini. Kemampuan pertama subtes FA dapat digunakan sebagai skor
adalah kemampuan terkait dengan yang membentuk kemampuan dasar space,
mengingat objek (memory) dan maupun nilai agregat yang digunakan
kemampuan kedua adalah kemampuan sebagai dasar kalkulasi nilai IQ. Ketika
spasial yang terkait dengan ingin mengidentifikasi hanya aspek
membayangkan dan mengidentifikasi rute kemampuan dasar space saja, maka skor
jalan yang akan dilalui oleh individu untuk subtes FA akan digabungkan dengan skor
menuju ke tempat tersebut. Ilustrasi ini subtes WU yang mengukur kemampuan
menggambarkan bahwa kemampuan tiga dimensi. Nilai rata-rata dari
spasial adalah kemampuan yang tidak penjumlahan skor di dua subtes tersebut
hanya berkaitan dengan kemampuan nantinya mampu merepresentasikan
matematis semata, misalnya mengerjalan kemampuan dasar space atau keruangan.
soal matematika untuk mengidentifikasi Kesimpulannya, nilai subtes FA akan
panjang, lebar, dan tinggi sebuah bangun menjadi tidak bermakna ketika skor subtes
datar. Namun, besaran kemampuan yang FA diintepretasikan secara tunggal.

Gambar 1. Contoh Item pada Subtes FA

171
METODE Fisika, Kimia, dan Matematika IPA;
sedangkan jurusan IPS merujuk kepada
Metode Pengumpulan Data mata pelajaran yang sebagian besar berisi
Data yang digunakan penulis dalam pemahaman konseptual seperti sosiologi,
studi ini merupakan data sekunder (data antropologi dan ekonomi. Seluruh data
telah tersedia) dari BLP FPSI Unika Atma yang digunakan dalam studi tidak
Jaya. Data subtes FA dikumpulkan disebarluaskan ke publik sehingga
bersamaan dengan administrasi terstandar anonimitas partisipan sangat dijaga dalam
IST yang dilakukan oleh tim asesor dari output analisis yang dihasilkan.
BLP FPSI Unika Atma Jaya. Artinya,
kontrol yang terstandarisasi oleh tim Pengujian Validitas Convergent dan
asesor BLP FPSI Unika Atma Jaya saat Discriminant pada Subtes FA
administrasi IST telah dilakukan sesuai Uji convergent merujuk kepada
prosedur standar. Pengumpulan data usaha psikometrik untuk mengidentifikasi
dilakukan di dua Sekolah Menengah Atas apakah suatu alat ukur yang diuji memiliki
(SMA) swasta di Jakarta, yaitu SMA korelasi dengan alat ukur lain yang
Kolese Kanisius dan SMA Gonzaga pada mengukur konstruk serupa, sedangkan uji
tahun 2004 hingga 2006. Saat itu, kedua discriminant merujuk kepada
sekolah ini adalah pengguna (user) dari mengidentifikasi bagaimana kaitan suatu
layanan tes psikologi yang disediakan oleh alat ukur dengan alat ukur lain yang secara
BLP. teori tidak memiliki keterkaitan (Crocker
Metode pengambilan sampel yang & Algina, 1986; Anastasi & Urbina, 1997;
digunakan adalah non-purposive sampling Cohen & Swerdlik, 2009). Pengambilan
dimana partisipan yang berpartisipasi keputusan akan validitas sebuah alat ukur
dalam studi tidak memiliki kesempatan melalui metode convergent-discriminant
yang sama untuk dipilih menjadi partisipan sangat dipengaruhi oleh tiga hal. Pertama
(Cozby & Bates, 2010). Karakteristik adalah kerangka teori yang digunakan.
partisipan dalam studi adalah siswa/i SMA Kedua merujuk kepada besaran nilai
swasta yang akan masuk ke dalam kelas korelasi (r) yang dihasilkan. Ketiga terkait
penjurusan Ilmu Pengetahuan Alam (IPA) dengan arah korelasi yang dihasilkan oleh
dan Ilmu Pengetahuan Sosial (IPS). metode ini. Secara khusus, kerangka teori
Jurusan IPA merujuk kepada mata yang ditetapkan sebagai panduan
pelajaran yang sebagian besar berisi ilmu- interpretasi convergent-discriminant
ilmu objektif dan membutuhkan memiliki peran yang krusial.
perhitungan numerik yang akurat seperti

A B C D E

Gambar 2. Contoh Item pada Subtes WU

172
Dalam konteks pengujian terhadap subtes dari kaki. Kata kunci yang harus diidentifikasi
FA, metode convergent akan dilakukan adalah “bagian”.
dengan melakukan korelasi statistik antara
subtes FA dan subtes WU. Subtes WU Pengujian Reliabilitas terhadap IST-FA
adalah subtes dalam IST yang mengukur Selain validitas, salah satu syarat
kemampuan spasial tiga dimensi utama dari alat ukur psikologi yang
(Polhaupessy, 2002). Artinya, dalam mampu memberikan bukti empiris yang
subtes WU partisipan harus mengenali dan terpercaya adalah konsistensi hasil
mengidentifikasi objek bangun ruang mana pengukuran yang dihasilkan. Konsep ini
saja yang memiliki persamaan dan disebut dengan reliabilitas (Cohen &
perbedaan. Gambar 2 menunjukkan contoh Swerdlik, 2009). Guna mengidentifikasi
item pada sutes WU dimana partisipan apakah subtes FA konsisten dalam
harus memilih bangun ruang yang mengukur kemampuan spasial dua
memiliki persamaan dari lima pilihan dimensi, penulis menggunakan uji
jawaban yang disediakan (dengan gambar reliabilitas split-half: Spearman-brown
di bawahnya). Karakteristik item pada guna mengidentifikasinya. Metode split
subtes WU cenderung sedikit berbeda half adalah metode uji reliabilitas dengan
dengan subtes FA, namun jika dilihat cara melakukan pembelahan menjadi dua
dengan kerangka teori PMA, keduanya bagian berdasarkan jumlah item yang
sama-sama mengukur kemampuan dasar proporsional, sedangkan spearman brown
space. Terkait dengan metode adalah teknik korelasi untuk
discriminant, penulis akan melakukan mengidentifikasi koefisien reliabilitas alat
korelasi antara subtes FA dengan subtes ukur yang mengalami pembelahan split-
AN. Subtes AN adalah subtes dalam IST half. Pembelahan alat ukur dilakukan
yang mengukur kemampuan analogi verbal dengan mempertimbangkan jumlah yang
yaitu terkait dengan bagaimana individu proporsional antar belahan hingga derajat
mengkombinasikan dan menghubungkan kesulitan setiap item. Belahan pertama dan
kata dengan makna yang sama belahan kedua harus memiliki nilai rata-
(Polhaupessy, 2002). Item pada subtes AN rata derajat kesulitan yang tidak berbeda
terdiri dari tiga kata dan lima pilihan jauh atau signifikan. Hal ini penting
jawaban. Partisipan diminta untuk dilakukan karena perhitungan korelasi
menempatkan kata yang paling sesuai spearman brown (koefisien reliabilitas)
dengan kata ketiga sesuai dengan pola sangat ditentukan oleh varians dari kedua
hubungan ata pertama dan kedua. Tabel 2 belahan.
menunjukkan salah satu contoh item pada
subtes AN. Jika dikaitkan dengan teori HASIL DAN PEMBAHASAN
PMA, aspek kemampuan dasar yang
diukur oleh AN adalah aspek kemampuan Karakteristik Partisipan
dasar general reasoning (I). Tiga karakteristik utama yang
dicatat dalam studi terkait partisipan
Tabel 2: Contoh Item pada Subtes AN adalah asal sekolah, jenis kelamin dan
Item Pilihan jawaban tahun pengambilan data. Jumlah partisipan
Sikut : tangan = lutut a. Berjalan yang terlibat sebanyak 319 partisipan.
: ......... b. Jari tangan Pengambilan data subtes FA dilakukan
c. Kaki dalam metode administrasi tes IST yang
d. Hidung terstruktur oleh tim asesor dari BLP FPSI
e. Mata kaki Unika Atma Jaya. Artinya, seluruh standar,
Terkait dengan item ini, jawaban yang benar ketentuan dan batasan waktu yang
adalah pilihan kaki (c). Jika sikut merupakan
disediakan di setiap subtes mengikuti
bagian dari tangan, maka lutut adalah bagian

173
panduan standar IST. Tabel 3 derajat kesulitan item (item difficulty) dan
menunjukkan demografi partisipan yang uji diskriminasi item (D-index). Uji derajat
terlibat dalam studi. kesulitan item adalah analisis item yang
mampu mengidentifikasi tingkat kesulitan
Tabel 3: Karakteristik Partisipan yang dimiliki setiap item (Anastasi &
dalam Studi (N=319) Urbina, 1997; Cohen & Swerdlik, 2009).
Demografi partisipan Identifikasi tingkat kesulitan diperoleh
melalui proporsi partisipan yang menjawab
Asal sekolah SMA Gonzaga benar pada suatu item. Jika proporsi yang
(66,70%) menjawab benar lebih banyak
SMA Kolese dibandingkan dengan proporsi yang
Kanisius (30,09%)
menjawab salah, maka suatu item
Jenis kelamin Laki-laki (69%)
dikatakan mudah, begitu juga sebaliknya.
Perempuan (31%)
Tahun pengambilan Tahun 2004
Uji diskriminasi item merujuk kepada
data (30,09%) pengujian mengenai kemampuan item
Tahun 2005 mendiskriminasi partisipan yang memiliki
(36,67%) kemampuan tinggi dan rendah (Cohen &
Tahun 2006 Swerdlik, 2009). Secara khusus D-index
(33,22%) (D) adalah metode perhitungan
diskriminasi item yang berbasis pada
Analisis Item pada Subtes FA perbedaan skor kelompok upper dan
Kemampuan spasial dua dimensi kelompok lower. Uji statistik yang
yang diukur oleh subtes FA tergolong ke digunakan untuk mengidentifikasi nilai
dalam optimal performance test. Optimal kontribusi item terhadap skor total/dimensi
performance test (OPT) adalah suatu adalah uji korelasi (r). Tabel 4
bentuk alat ukur yang mengidentifikasi menunjukkan hasil analisis item terhadap
kemampuan manusia yang dapat setiap subtes FA. Nomor item disesuaikan
diklasifikasikan secara dikotomi, yaitu dengan nomor subtes FA sebagai bagian
benar/salah atau tinggi/rendah (Anastasi & dari IST.
Urbina, 1997). Konsekuensinya, jenis item
dalam OPT dinilai dengan penilaian benar Tabel 4: Hasil Pengujian Analisis Item
atau salah untuk menentukan apakah terhadap Subtes FA
individu mampu/tidak mampu dalam suatu No. Derajat kesulitan D-Index
aspek kemampuan dasar atau khusus (p) (D)
tertentu. Selain skoring dan interpretasi 117 0,98 0,047
skor, salah satu karakteristik utama dalam 118 0,55 1
optimal performance test adalah adanya 119 0,48 1
120 0,52 1
pemberian waktu yang telah dikalkulasi
121 0,84 0,495
secara terstruktur sehingga mampu 122 0,72 0,857
berperan sebagai variabel yang 123 0,40 1
menentukan tercapainya kemampuan 124 0,47 1
optimal dari individu saat mengerjakan tes. 125 0,60 1
Dalam konteks subtes FA, batas waktu 126 0,54 1
yang disediakan adalah 9 menit untuk 127 0,33 1
menyelesaikan 20 item pilihan ganda. 128 0,33 0,99
Sebagai tahap pertama pengujian 129 0,73 0,819
properti psikometrik terhadap subtes FA, 130 0,44 1
penulis melakukan analisis item terhadap 131 0,77 0,704
132 0,14 0,438
seluruh item pada subtes FA. Teknik
133 0,59 1
analisis item yang digunakan adalah uji 134 0,49 1

174
135 0,20 0,609 tinggi nilai p, maka semakin kecil nilai D
136 0,11 0,323 yang dihasilkan.
Catatan: Semakin tinggi nilai p, maka suatu
item dikatakan memiliki tingkat kesulitan yang Analisis Distraktor pada Pilihan
rendah, sedangkan nilai D yang mendekati Jawaban di Subtes FA
nilai 1 mengindikasikan bahwa item memiliki
Subtes FA mengidentifikasi
kemampuan yang baik dalam membedakan
kelompok partisipan yang memiliki
kemampuan spasial dua dimensi dengan
kemampuan spasial dua dimensi tinggi dan item berjenis pilihan ganda. Item dengan
rendah. jenis ini mengharuskan responden untuk
menganalisis pilihan jawaban yang paling
Hasil analisis item tepat di setiap item. Salah satu syarat
mengindikasikan adanya ragam nilai yang kualitas item yang baik pada pilihan ganda
diperoleh dari nilai D dan p. Tidak ada adalah kemampuan distraktor yang mampu
item yang dieliminasi dari hasil analisis mengecoh jawaban partisipan (Crocker &
item meskipun ditemukan nilai D yang Algina, 1986; Osterlind, 2002; Cohen &
cukup ekstrim pada item No. 117 Swerdlik, 2009). Suatu distraktor
(D=0,047). Hal ini disebabkan item 117 dikatakan berkualitas ketika partisipan
memang dibuat sebagai item pembuka dengan kemampuan rendah dapat terkecoh
dengan tingkat kesulitan yang sangat dengan pilihan yang disediakan dalam alat
mudah. Konsekuensinya, item ini tidak ukur. Analisis distraktor dilakukan dengan
mampu membedakan kelompok upper dan membandingkan jawaban yang dibuat oleh
kelompok lower. Rentang nilai p berkisar kelompok upper dan kelompok lower.
antara 0,98 (sangat mudah) hingga 0,11 Penentuan keputusan mengenai kualitas
(sangat sulit). Hasil ini mengindikasikan pilihan jawaban di setiap item dilakukan
bahwa subtes FA telah memiliki variasi atas dasar pilihan yang dibuat oleh
tingkat kesulitan yang mampu memotivasi kelompok lower. Seharusnya, kelompok
partisipan (test-taker) untuk menampilkan lower sebagai kelompok yang
kemampuannya yang paling optimal. mendapatkan skor rendah pada suatu item
Secara statistik, proporsi nilai 1 untuk nilai harus terkecoh dengan pilihan jawaban
D yang berjumlah 11 (>9) pada subtes FA yang disediakan. Apabila partisipan yang
juga menjadi pendukung bahwa mayoritas terkecoh adalah kelompok upper,
item dalam subtes FA masih memiliki menandakan bahwa pilihan jawaban yang
daya diskriminasi item yang baik. disediakan tidak memiliki kemampuan
Kesimpulannya, subtes FA telah memiliki mengecoh yang baik. Tabel 5
prinsip proporsionalitas, yaitu semakin mendeskripsikan analisis distraktor
terhadap subtes FA.

Tabel 5: Hasil Analisis Distraktor terhadap Pilihan Jawaban di Subtes FA


No item Kelompok Pilihan Jawaban
A B C D E
117 Upper 107 0 2 0 0
Lower 102 2 1 0 0
118 Upper 24 9 75 1 0
Lower 32 17 51 0 0
119 Upper 9 53 1 23 21
Lower 8 29 1 32 27
120 Upper 50 48 9 2 0
Lower 32 56 9 2 1
121 Upper 0 6 2 95 3
Lower 1 12 4 70 5

175
122 Upper 1 83 2 11 8
Lower 1 51 6 12 18
123 Upper 17 25 36 14 13
Lower 9 24 23 24 13
124 Upper 3 5 41 5 48
Lower 10 13 40 4 25
125 Upper 1 15 3 16 61
Lower 1 14 8 18 46
126 Upper 5 15 11 50 11
Lower 4 25 16 31 7
127 Upper 1 40 3 32 30
Lower 3 25 6 42 17
128 Upper 53 23 3 2 23
Lower 44 13 5 8 21
129 Upper 1 7 2 81 11
Lower 3 7 8 58 10
130 Upper 66 0 42 1 0
Lower 64 2 29 0 1
131 Upper 0 94 0 0 11
Lower 1 55 2 1 18
132 Upper 15 1 0 1 92
Lower 4 3 0 6 86
133 Upper 0 72 0 10 13
Lower 0 32 5 13 17
134 Upper 1 8 13 57 3
Lower 1 12 14 23 7
135 Upper 12 12 17 7 35
Lower 14 11 15 8 10
136 Upper 92 2 6 1 3
Lower 77 5 9 0 2

Hasil analisis distraktor menunjukkan ini terjadi pada distraktor A pada item 128;
bahwa ada dua pola yang terbentuk dari distraktor E pada item 132; distraktor E
pilihan jawaban pada item subtes FA. Pola pada item 135 dan distraktor A pada item
pertama terkait adalah perbedaan frekuensi 136. Kesimpulan terkait dengan pola
yang minim antara kelompok upper dan kedua adalah perlunya evaluasi dan revisi
lower dalam memilih pilihan yang menjadi terhadap distraktor-distraktor yang
pengecoh. Hal ini terjadi misalnya pada ternyata banyak dipilih oleh kelompok
pilihan jawaban B pada item 123 dan C upper (pola kedua).
pada item 124. Prinsip distraktor yang baik
seharusnya mampu mengecoh jawaban, Gambaran Persebaran Skor Subtes FA,
terutama kelompok lower untuk menjawab WU dan AN
pilihan yang keliru. Namun, pada kasus ini Setelah melalui proses analisis
terlihat bahwa kelompok upper justru item, keputusan yang dihasilkan adalah
menjadi kelompok yang terkecoh lebih tidak melakukan eliminasi terhadap item-
banyak dibandingkan dengan kelompok item pada subtes FA. Namun, sebelum
lower, meskipun perbedaannya cenderung melangkah kepada tahap pengujian
minim (1 angka). Pola kedua yang terjadi validitas dengan mayoritas teknik korelasi
adalah perbedaan yang ekstrim dimana statistik, deskripsi mengenai persebaran
kelompok upper cenderung lebih banyak skor perlu diidentifikasi. Identifikasi
memilih pilihan jawaban yang keliru dilakukan sebagai usaha melihat
dibandingkan dengan kelompok lower. Hal persebaran skor apakah membentuk

176
distribusi normal atau tidak. Konsekuensi Pengujian Convergent dan Discriminant
lanjutannya terkait dengan teknik korelasi terhadap Subtes FA
statistik yang akan digunakan. Identifikasi Uji convergent dan discriminant
bentuk distribusi skor dilakukan terhadap 3 dilakukan penulis guna mengidentifikasi
distribusi skor, yaitu skor yang berasal dari kemampuan subtes FA dalam mengukur
subtes FA; WU dan AN. Guna kemampuan spasial dua dimensi. Uji
mengidentifikasi normalitas dari ketiga convergent merujuk kepada
distribusi frekuensi, digunakan uji shapiro- membandingkan dua alat ukur yang
wilk. Uji shapiro-wilk adalah uji statistik mengukur konstruk serupa, sedangkan uji
yang digunakan untuk mengidentifikasi discriminant merujuk pada metode yang
apakah suatu distribusi frekuensi membandingkan dua alat ukur yang
terdistribusi dengan normal atau tidak mengukur konstruk yang berbeda (Cohen
(Graveter & Wallnau, 2004; Howel, 2010). & Swerdlik, 2009). Secara teknis, metode
Pengambilan keputusan uji shapiro-wilk statistik yang digunakan untuk
dilakukan dengan membandingkan nilai p- mengidentifikasi pengujian ini adalah
values (p) dengan nilai confidence interval teknik korelasi spearman-rank order.
yang ditetapkan. Ketika nilai p > .05 atau Penggunaan teknik korelasi spearman
p>.01 (tidak signifikan), maka suatu didasarkan atas pengujian normalitas
distribusi frekuensi disimpulkan bahwa shapiro-wilk yang memutuskan bahwa
suatu distribusi frekuensi tidak distribusi skor tidak membentuk distribusi
terdistribusi normal. Tabel 4 menunjukkan normal.
nilai shapiro-wilk dari tiga distribusi Dalam pengujian convergent
frekuensi, yaitu subtes FA, WU dan AN. validation, subtes FA akan dikorelasikan
dengan subtes WU yang mengukur
Tabel 6: Hasil Uji Shapiro-Wilk pada kemampuan spasial tiga dimensi. Kedua
Distribusi Frekuensi Subtes FA, WU subtes ini dalam kerangka teori PMA
dan AN sama-sama mengukur kemampuan dasar
Distribusi frekuensi Uji normalitas (W) space atau keruangan. Sedangkan terkait
Subtes FA .982** dengan uji discriminant validation, subtes
Subtes WU .987** FA akan dikorelasikan dengan subtes AN
yang mengukur kemampuan analogi
Subtes AN .981** verbal. Dalam kerangka teori PMA, sutes
*Signifikan pada p<.05 AN mengukur kemampuan dasar general
**Signifikan pada p<.01 reasoning. Tabel 5 menunjukkan hasil
korelasi antara subtes FA dengan sutes
Hasil pengujian normalitas dengan WU dan subtes AN. Hasil ini
uji shapiro-wilk ternyata menghasilkan mengindikasikan bahwa korelasi yang
nilai yang signifikan pada ketiga distribusi terjadi antara subtes FA dengan subtes WU
frekuensi. Artinya, persebaran skor dari lebih kuat (r=.439, p<.01) dibandingkan
ketiga subtes tidak menghasilkan distribusi dengan nilai korelasi yang terjadi antara
normal. Konsekuensi lanjutan dari hasil ini subtes FA dengan subtes AN (r=.294,
adalah pengujian korelasi pada p<.01). Nilai convergent diidentifikasi
convergent-discriminant serta uji lebih kuat karena subtes FA dan WU
reliabilitas split half akan menggunakan mengukur kemampuan yang serupa, yaitu
teknik korelasi spearman-rank order yang visualisasi objek atau keruangan. Hasil
dapat digunakan untuk persebaran skor signifikan pada korelasi discriminant juga
yang tidak membentuk distribusi normal memberikan insight baru kepada penulis
atau disebut juga perhitungan statistik non- bahwa kemampuan keruangan juga tidak
parametrik (Corder & Foreman, 2009). dapat dilepaskan dari kemampuan analogi
verbal. Artinya, ketika partisipan

177
mengerjakan subtes AN, partisipan juga mempengaruhi nilai individu di subtes FA
menggunakan kemampuan membayangkan berkisar sebesar 32%. Kedua, hasil ini juga
objek yang direpresentasikan oleh kata. mengindikasikan bahwa 46% dari varians
observed score pada belahan kedua dapat
Tabel 7: Hasil Pengujian Convergent diprediksi oleh belahan pertama. Ketiga,
dan Discriminant terhadap Subtes FA nilai koefisien reliabilitas juga
mengindikasikan korelasi antara true score
Subtes FA dan observed score yang terjadi sebesar
Subtes WU .439** r=.82. Kesimpulannya, nilai koefisien
reliabilitas subtes FA mampu
Subtes AN .294** menggambarkan konsistensi pengukuran
terhadap partisipan.
**Signifikan pada p<.01
SIMPULAN DAN SARAN
Pengujian Reliabilitas terhadap Subtes
FA Hasil analisis item dengan dua
Pengujian reliabilitas dilakukan metode, baik derajat kesulitan dan D-index
dengan metode psikometri split half yang menghasilkan kesimpulan bahwa tidak ada
membagi subtes FA menjadi dua belahan item yang dieliminasi atau direvisi. Hasil
(Cohen & Swerdlik, 2009). Pembagian kedua analisis mengindikasikan adanya
kedua belahan dilakukan atas dasar pola yang baik, yaitu semakin tinggi nilai
pertimbangan nilai rata-rata derajat p (item mudah), maka semakin kecil pula
kesulitan item pada belahan pertama nilai D yang diperoleh. Sebaliknya,
(M=0,454) dan belahan kedua (M=0,51). semakin rendah nilai p (item sulit), maka
Keduan belahan sama-sama berjumlah 10 semakin besar nilai D yang diperoleh.
item. Guna mengidentifikasi nilai Artinya, item sulit yang ditampilkan pada
koefisien korelasi antar belahan, penulis subtes FA hanya dapat dikerjakan oleh
menggunakan metode korelasi spearman- partisipan dengan kemampuan spasial
brown formula yang digunakan untuk yang tinggi. Namun, terkait dengan
mengidentifikasi reliabilitas keseluruhan analisis distraktor, penulis menemukan
subtes yang dibelah menjadi dua belahan bahwa ada beberapa pilihan jawaban yang
(Crocker & Algina, 1986; Cohen & seharusnya mengecoh kelompok lower
Swerdlik, 2009). Nilai spearman-brown tidak menjalankan fungsinya dengan baik.
yang diperoleh adalah rt=.678 yang Hal ini ditunjukkan dengan proporsi
merupakan nilai koefisien reliabilitas dari kelompok upper yang justru lebih besar
subtes FA. Nilai ini mencapai batas nilai menjawab pilihan jawaban yang keliru
minimum koefisien reliabilitas suatu alat dibandingkan dengan kelompok lower.
ukur yang ditetapkan oleh Tavakol dan Terkait dengan uji properti
Dennick (2011). psikometrik validitas dan reliabilitas,
Hasil koefisien korelasi ini dapat subtes FA berada pada posisi yang cukup
menunjukkan tiga hal utama dari subtes baik. Hal ini ditandai dengan dua
FA. Pertama, hasil ini mengindikasikan dindikator. Indikator pertama adalah
bahwa 68% varians observed score pada subtes FA memiliki korelasi yang positif
subtes FA disebabkan oleh varians true dan signifikan lebih tinggi dengan subtes
score. True score merujuk kepada nilai WU dibandingkan dengan subtes AN.
murni dari partisipan tanpa dipengaruhi Indikator kedua adalah melalui analisis
oleh error, sedangkan observed score reliabilitas yang dihasilkan. Hasil analisis
adalah nilai true score yang dipengaruhi menunjukkan bahwa error yang terjadi
oleh nilai error (Crocker & Algina, 1986). pada subtes FA cenderung kecil (32%)
Artinya, indikasi error yang terjadi dan yang artinya item-item dengan pilihan

178
jawaban pada subtes FA mampu intellect abilities.Psychological
memberikan stimulasi kepada partisipan Bulletin, 77(2), 129-143.
(test taker) untuk menampilkan Howell, D. C. (2010). Statistical methods
kemampuan spasial dua dimensi. Selain for psychology (7th.ed). Singapore:
itu, analisis reliabilitas juga memprediksi Wadsworth, Cengage Learning.
bahwa kontribusi true score terhadap Osterlind, S. J. (2002). Constructing test
observed score sebesar 67% yang items: Multiple-choice, costructed-
diperoleh dari nilai R2 dari nilai korelasi response,performance, and other
antara observed score dan true score. Nilai formats. Kluwer Academic
ini mengindikasikan subtes FA mampu Publishers.
memberikan prediksi true score di atas Polhaupessy, L. F. (2002). Intelligenz
50%. Kesimpulan utama dari studi ini struktur test (Terjemahan). Laporan
adalah, tidak ada item yang dieliminasi, tidak diterbitkan.
namun memerlukan sedikit revisi pada Raven, J. (2000). The raven’s progressive
pilihan jawaban yang disediakan oleh matrices: Change and stability over
subtes FA. Pada akhirnya, subtes FA tetap culture and time. Cognitive
masih bisa digunakan sebagai kepentingan Psychology, 41, 1-48.
mengukur kemampuan spasial dua Santosa, E. M., Bonang, E. T., &
dimensi. Panggabean, H. (1998). Pengujian
validitas prediktif Intelligenz
DAFTAR PUSTAKA Struktur Test (IST). Laporan tidak
diterbitkan.
Anastasi, A., & Urbina, S. (1997). Spearman, C. (1904). “General
Psychological testing 7th.ed. New intelligence” objectively determined
Jersey: Prentice Hall. and measured. American Journal of
Chadha, N. K. (2009). Applied Psychology, 15, 201-293.
psychometry. Singapore: Sage Spearman, C. (1927). The abilities of man.
Publication. New York: Macmillan.
Cohen, R. J., & Swerdlik, M. E. (2010). Tavakol, M., & Dennick, R. (2011).
Psychological testing and Making sense of Cronbach’s alpha.
assessment: An introduction to tests International Journal of Medical
and measurement (7th.ed). McGraw- Education, 2, 53-55.
Hill. Thurstone, L. L. (1925). A method of
Corder, G. W., & Foreman, D. I. (2009). scaling psychological and
Nonparametric statistics for non- educational tests. Journal of
statisticians. New Jersey: Wiley Inc. Educational, 16, 433-451.
Cozby, P. C., & Bates, S. C. (2010). Thurstone, L. L. (1938). Primary mental
Methods in behavioral research abilities. Psychometric Monographs,
(11th.ed). Singapore: McGraw-Hill. No. 1.
Crocker, L., & Algina, J. (1986). Thurstone, L. L. (1944). A factorial study
Introduction to classical and modern of perception. Psychometric
test theory. New York: Horcourt Monographs, No. 4.
Brace Jovanovich. Thurstone, L. L. (1947a). The calibration
Gravetter, F. J., & Wallnau, L. B. (2004). of test items. American Psyhologist,
Statistics for the behavioral sciences 2, 103-104.
(6th.ed). Singapore: Thomson Thurstone, L. L. (1947b). Multiple factor
Learning, Inc. analysis. Chicago: University of
Guilford, J. P. (1972). Thurstone’s primary Chicago Press.
mental abilities and structure-of-

179
Thurstone, L. L. (1950). Some primary
abilities in visual thinking (No.59).
Chicago:
University of Chicago, Psychometric
Laboratory.
Thurstone, L. L. (1959). The measurement
of values. Chicago: University of
Chicago Press.
Wanzel, K. R., Hamstra, S. J., Anastakis,
D. J., Matsumoto, E. D., &
Cusimano, M. D. (2002). Effect of
visual-spatial ability on learning of
spatially-complex surgical skills. The
Lancet, 359, 230-231

180

Anda mungkin juga menyukai