Afifah FPS

STUDI VALIDITAS KONSTRUK GENERAL
APTITUDE TEST BATTERY (GATB) DENGAN

METODE CFA
Skripsi
Diajukan untuk Memenuhi Persyaratan Memperoleh
Gelar Sarjana Psikologi (S.Psi)
Disusun oleh:
AFIFAH
NIM: 107070002378
FAKULTAS PSIKOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
1432H / 2011
1
UJI VALIDITAS KONSTRUK GENERAL APTITUDE TEST BATTERY
(GATB) DENGAN METODE CFA
SKRIPSI
Diajukan kepada Fakultas Psikologi untuk memenuhi syarat-syarat
memperoleh gelar Sarjana Psikologi
Oleh:
AFIFAH
NIM: 107070002378
Di bawah bimbingan:
Pembimbing I Pembimbing II
Jahja Umar, Ph.D Mulia Sari Dewi, M.Si

NIP: 130 885 522 NIP: 19780502 200801 2 026
FAKULTAS PSIKOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
1432 H / 2011 M
2
PENGESAHAN
Skripsi yang berjudul “UJI VALIDITAS KONSTRUK GENERAL APTITUDE

TEST BATTERY (GATB) DENGAN METODE CFA” telah diujikan dalam
sidang munaqasyah Fakultas Psikologi Universitas Islam Negeri Syarif
Hidayatullah Jakarta pada tanggal 7 Oktober 2011. Skripsi ini telah diterima
sebagai salah satu syarat untuk memperoleh gelar Sarjana Program Strata 1 (S1)
pada Fakultas Psikologi.
Jakarta, 7 Oktober 2011
Sidang Munaqasyah
Dekan/ Pembantu Dekan/

Ketua merangkap Anggota Sekretaris
Jahja Umar, Ph.D Dra. Fadhilah Suralaga,M.Si

NIP: 130 885 522 NIP: 19561223 198303 2 001
Anggota:
Yunita Faela Nisa, M.Psi, Psi Mulia Sari Dewi, M.Si

NIP: 19770608 200501 2 003 NIP: 19780502 200801 2 026
3
PERNYATAAN ORISINALITAS
Saya yang bertanda tangan di bawah ini:
Nama : Afifah
NIM : 107070002378
Dengan ini menyatakan bahwa skripsi yang berjudul “UJI VALIDITAS

KONSTRUK GENERAL APTITUDE TEST BATTERY (GATB) DENGAN
METODE CFA” adalah benar merupakan karya saya sendiri dan tidak
melakukan tindakan plagiat dalam penyusunan skripsi tersebut. Adapun kutipan-
kutipan yang ada dalam penyusunan skripsi ini telah saya cantumkan sumber
pengutipannya dalam daftar pustaka.
Saya bersedia untuk melakukan proses yang semestinya sesuai dengan

undang-undang jika ternyata skripsi ini secara prinsip merupakan plagiat atau
jiplakan dari karya orang lain.
Demikian pernyataan ini saya buat untuk dipergunakan sebaik-baiknya.
Jakarta, 7 Oktober 2011
Afifah .
NIM: 107070002378
4
MOTTO DAN PERSEMBAHAN
MOTTO:
“Karena sesungguhnya sesudah kesulitan itu ada

kemudahan. Maka apabila kamu telah selesai (dari
sesuatu urusan), kerjakanlah dengan sungguh-sungguh
(urusan) yang lain, dan hanya kepada Tuhanmulah
hendaknya kamu berharap”
(QS. Al Insyirah : 5-8).
“All your dreams can come true if you have the courage to pursue
them”
-Walt Disney
“If we believe in something, and we just keep on trying we’ll survive.. we will
survive..
It’s a beautiful life act from the heart when you play your part. It’s a
beautiful life when you survive and everything is alright”
-Maliq n D’essentials
5
PERSEMBAHAN:
Skripsi ini ku persembahkan untuk Ummi, Abi serta ketiga
adikku tersayang..
Yang tanpa pernah lelah selalu memberikan cinta, kebahagiaan,
serta canda tawa tanpa syarat. Kalianlah penyemangatku dalam
menyelesaikan ini..
6
ABSTRAK
(A) Fakultas Psikologi Universitas Islam Negeri Syarif Hidayatullah Jakarta

(B) September 2011
(C) Afifah
(D) xv + 108 halaman + lampiran
(E) Uji Validitas Konstruk General Aptitude Test Battery (GATB) Dengan
Metode CFA
(F) Tes psikologi diperlukan dalam pengambilan keputusan berkaitan dengan
sumber daya manusia dalam bidang industri dan organisasi. Pengambilan
keputusan tersebut berkaitan dengan penerimaan dan penempatan, promosi,
evaluasi, maupun penepatan karier. Kebutuhan akan alat tes untuk asesmen
mendorong banyak dikembangkan berbagai alat ukur tes psikologis baik tes,
self-report, skala, maupun inventori. Salah satu alat tes tersebut adalah
General Apitude Test Battery (GATB). GATB adalah suatu alat tes yang
berhubungan dengan jabatan yang berorientasi pada beberapa tes bakat baterai
yang mengukur sembilan bakat dalam delapan tes tulis serta empat perangkat
tes. Dalam penelitian ini digunakan empat subtes dari GATB yaitu
computation, three dimensional space, vocabulary, dan arithmetic reasoning
dengan jumlah total 175 item. keempat subtes tersebut digunakan karena
mengukur bakat skolastik atau hanya dari keempat subtes tersebut telah dapat
mengukur kemampuan kognitif atau inteligensi (general intelligence) atau
dapat menghasilkan skor IQ.
Penelitian ini bertujuan untuk mengetahui apakah seluruh item dalam keempat
subtes GATB yang dijadikan penelitian adalah fit (sesuai) dengan model satu
faktor, yang berarti semua item pada suatu subtes mengukur hanya satu
kemampuan yang didefinisikan pada subtes tersebut. Dan apakah setiap item
dalam masing-masing subtes adalah secara signifikan mengukur kemampuan
pada subtes tersebut. Tujuan yang kedua adalah untuk mengetahui apakah
7
empat subtes dalam GATB fit (sesuai) dengan model satu faktor, yaitu satu
faktor umum “inteligensi”.
Penelitian ini menggunakan data sekunder yang merupakan hasil tes GATB
yang diperoleh dari Divisi Asesmen SDM PPM Manajemen. Data yang
digunakan merupakan hasil dari rekruitmen karyawan PT Semen Tonasa yang
menjalani tes di Jakarta. Pelaksaan tes dilakukan pada tahun 2009 dan
ditempuh oleh 3257 orang. Metode analisis faktor yang digunakan dalam
penelitian ini adalah Confirmatory Factor Analysis (CFA) dengan program
lisrel 8.70.
Berdasarkan perhitungan dengan metode CFA dapat disimpulkan bahwa hasil

pengujian hipotesis 1 menunjukkan bahwa hipotesis diterima, bahwa semua
subtes fit (sesuai) mengukur model satu faktor, namun untuk subtes three
dimensional space serta artihmetic reasoning diperlukan modifikasi model
pengukuran untuk dapat memperoleh nilai fit. Hasil pengujian hipotesis 2
melalui analisis faktor dua tingkat (second order confirmatory factor analysis)
menghasilkan bahwa terdapat tiga dari empat subtes GATB yang signifikan
dalam mengukur inteligensi umum, yaitu subtes computation, three
dimensional space, dan vocabulary.
Dengan hasil seperti ini, maka alat tes GATB masih dapat dan layak
digunakan sebagai salah satu alat tes inteligensi namun perlu dilakukan
perbaikan dan pembaharuan terhadap item-item yang memiliki
multidimensionalitas yang terlalu banyak.
(G) Daftar Bacaan: 36, 22 buku; 4 jurnal; 8 internet.
8
KATA PENGANTAR
Alhamdulillahi rabbil 'alamin, puja dan puji syukur penulis panjatkan

kehadirat Allah SWT atas segala rahmat, hidayah, dan kasih sayang yang
diberikan-Nya, sehingga penulis dapat menyelesaikan penulisan Skripsi dengan
judul “UJI VALIDITAS KONSTRUK GENERAL APTITUDE TEST
BATTERY (GATB) DENGAN METODE CFA”. Shalawat serta salam semoga
selalu tercurahkan kepada junjungan kita semua, Rasulullah Muhammad SAW,
berikut para keluarga dan sahabat.
Terwujudnya skripsi ini tidak lepas dari bantuan berbagai pihak, baik
dalam bentuk sumbangan pikirian, tenaga, dan waktu yang tidak terukur dalam
menyelesaikan skripsi ini. Oleh karena itu dengan segala kerendahan hati penulis
menyampaikan rasa terima kasih kepada:
1. Bapak Jahja Umar, Ph.D, Dekan Fakultas Psikologi UIN Syarif Hidayatullah
Jakarta dan sekaligus sebagai Dosen Pembimbing I. Terima kasih sudah
meluangkan waktu dalam jadwal yang padat untuk melakukan proses
bimbingan skripsi ini. Terima kasih atas segala arahan, masukan, kritik, cerita
penuh inspirasi, serta motivasi dalam penyelesaian skripsi ini.
2. Ibu Mulia Sari Dewi, M.Si., sebagai Dosen Pembimbing II, terima kasih atas
bimbingan, sumbangan pikiran dalam penulisan, serta saran demi
kesempurnaan skripsi ini.
3. Ibu Yufi Adriani M.Psi., Dosen Pembimbing Akademik, terima kasih atas
bimbingannya dan semangatnya selama Penulis menjalani perkuliahan.
4. Seluruh dosen Fakultas Psikologi UIN Syarif Hidayatullah Jakarta, yang telah
banyak memberikan ilmu dan pembelajaran kepada Penulis.
5. Seluruh karyawan Fakultas Psikologi UIN Syarif Hidayatullah Jakarta yang
telah banyak membantu Penulis dalam menjalani perkuliahan, Mbak Rini
yang tanpa pernah bosan memberikan informasi mengenai kegiatan Bapak,
sehingga Penulis dapat bertemu dengannya.
9
6. Kedua orangtuaku tersayang, Muchtadi dan Iin Indarwati yang merupakan
sumber inspirasi bagi penulis dan senantiasa memberikan doa yang selalu
menyertai penulis, kasih sayang, cinta, motivasi, bantuan dan material yang
tidak akan pernah bisa terganti dan terbayar oleh apapun. Thank you for being
my super great parents.
7. Ketiga Adikku tersayang, Ja’far Fathul Haq, Muhammad Al-Fatih, dan Farhan
Muharam. Adik-adikku yang selalu setia menghiburku dan menyemangatiku,
setiap bermain bersama kalian rasanya semua kepenatan dan kegalauan kakak
hilang. Terima kasih telah sabar menjadi adik dari kakak yang cerewet dan
semoga kalian bisa menjadi seorang yang ‘LEBIH’ hebat dari kakak kalian
ini.
8. Reza Inspirawan, terima kasih sudah menjadi partner yang hebat dalam segala
situasi dan kondisi 
9. Hildi Okatatia Iskadar, terima kasih untuk canda tawanya, cerita-cerita labil
nan aneh juga semangat yang diberikan ketika penulis sudah mulai galau
dalam mengerjakan skripsi, dan untuk semua waktu yang telah kita habiskan
bersama.
10. Sahabatku tersayang, Renny dan Vhia. Terima kasih untuk semua
persahabatan kita selama ini, untuk semua cerita yang tertumpah dan untuk
semua waktu yang kita jalani bersama, terima kasih sudah mau mengertiku.
Ayank-ayankku, Chahyu, Imel, Tya, Ami, dan Zya. Terima kasih untuk canda
tawa yang telah dibagi, untuk gosip-gosip terhangat, untuk tempat-tempat
yang telah kita kunjungi bersama dan untuk kantong-kantong belanja. Sangat
mewarnai hari-hari penulis selama perkuliahan.
11. Seluruh teman-teman kelas A angkatan 2007, terima kasih untuk semua
kebersamaan kita selama 4 tahun ini, untuk semua cerita dan pengalaman yang
luar biasa serta diskusi-diskusi berbobot dalam setiap mata kuliah.
12. Teman sesama bimbingan skripsi, Risna, Nuran, Kak Sarah, dan Kak Aji..
Terima kasih sudah menemani hari-hari Penulis selama menjadi penunggu
setia ruangan dekanat, menghabiskan waktu menunggu dengan canda tawa,
10
dan berbagi kegalauan dalam proses penyelesaian skripsi. Yeaay, kita bisa ko
‘menjalani’ semua ini yang pada awalnya terkesan sangat berat.
13. Kak Adiyo, terima kasih telah sabar mengajari penulis tata cara penggunaan
Lisrel mulai dari Penulis tidak bisa sama sekali sampai akhirnya bisa. Kak
Vhia, terima kasih atas sharing nya serta masukan bagi Penulis.
14. Pihak PPM atas data yang telah disediakan, terima kasih telah memudahkan
Penulis dalam mengambil data bagi penelitian ini.
15. Seluruh pihak yang tidak dapat disebutkan satu per satu, terima kasih untuk
segala doa, dukungan dan bantuan yang telah diberikan untuk membantu
penulis dalam menyelesaikan skripsi ini.
Semoga seluruh bantuan yang telah diberikan dibalas berlipat ganda oleh
Allah SWT. Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan.
Oleh karena itu, segala kritik dan saran yang membangun akan sangat berguna
agar pada penulisan selanjutnya dapat menghasilkan karya yang lebih baik.
Semoga skripsi ini dapat bermanfaat bagi siapapun yang membacanya.
Jakarta, 22 September 2011
Penulis
11
DAFTAR ISI
Lembar Pengesahan Pembimbing i

Lembar Pengesahan Panitia Ujian ii
Lembar Orisinalitas iii
Motto dan Persembahan iv
Abstrak vi
Kata Pengantar viii
Daftar Isi xi
Daftar Tabel xiii
Daftar Gambar xv
Daftar Lampiran xvi
BAB I Pendahuluan
1.1 Latar Belakang 1
1.2 Pembatasan Masalah 10
1.3 Perumusan Masalah 10
1.4 Tujuan Penelitian 11
1.5 Manfaat penelitian 11
1.6 Sistematika Penulisan 12
BAB II Kajian Teori
2.1 Bahasan Umum Mengenai Tes Psikologi 14
2.2 Bakat
2.2.1 Definisi Bakat 17
2.2.2 Faktor-faktor Yang Mempengaruhi Perkembangan Bakat 17
2.2.3 Tes Bakat 19
2.3 Inteligensi 22
2.3.1 Definisi Inteligensi 22
2.3.2 Teori-teori Inteligensi 23
2.3.3 Pengukuran Inteligensi 28
2.3 Konstruksi Tes 33
12
2.3.1 Validitas 33
2.3.2 Reliabilitas 38
2.4 Gambaran Umum GATB 40
2.5 Kerangka Berpikir 48
2.6 Hipotesis 50
BAB III Metode Penelitian
3.1 Subjek Penelitian 51
3.2 Instrumen Penelitian 52
3.3 Metode Analisis Data 54
3.4 Prosedur Penelitian 61
BAB IV Hasil Penelitian
4.1 Validitas Konstruk Tingkat Subtes 63
4.1.1 Validitas Konstruk Subtes Computation 63
4.1.2 Validitas Konstruk Subtes Three Dimensional Space 70
4.1.3 Validitas Konstruk Subtes Vocabulary 81
4.1.4 Validitas Konstruk Subtes Arithmetic Reasoning 88
4.2 Validitas Konstruk Seluruh Subtes GATB dalam Mengukur Satu 97
Konstruk Bersifat Umum (General Intelligence)
BAB V Kesimpulan, Diskusi dan Saran
5.1 Kesimpulan 100
5.2 Diskusi 104
5.3 Saran 107
5.3.1 Saran Metodologis 108
5.3.2 Saran Praktis 109
Daftar Pustaka 110
Lampiran 112
13
DAFTAR TABEL
Tabel 2.1 Faktor-Faktor dan Komposit General Aptitude Test 48

Battery (GATB)
Tabel 4.1 Matriks Korelasi antar Kesalahan Pengukuran Butir Item 67
pada Computation
pada Computation (Lanjutan)
Tabel 4.2 Muatan Faktor Item GATB Subtes Computation 69
Tabel 4.2 Muatan Faktor Item GATB Subtes Computation 70
(Lanjutan)
pada Three Dimensional Space
pada Three Dimensional Space (Lanjutan)
pada Three Dimensional Space (Lanjutan)
Tabel 4.4 Muatan Faktor Item GATB Subtes Three Dimensional 77
Space
Tabel 4.4 Muatan Faktor Item GATB Subtes Three Dimensional 78
Space (Lanjutan)
Tabel 4.5 Rotated Component Matrix pada Subtes Three 80
Dimensional Space
Tabel 4.6 Sebaran Item GATB subtes Three Dimensional Space 81
Tabel 4.7 Muatan Faktor Item GATB Subtes Vocabulary 85
(Lanjutan)
(Lanjutan)
14
pada Arithmetic Reasoning
pada Arithmetic Reasoning (Lanjutan)
Tabel 4.9 Muatan Faktor Item GATB Subtes Arithmetic Reasoning 94
Tabel 4.10 Rotated Component Matrix pada Subtes Arithmetic 96
Reasoning
Tabel 4.11 Sebaran Item GATB subtes Arithmetic Reasoning 97
Tabel 4.12 Koefisien Muatan Faktor Untuk General Intelligence 98
Tabel 5.1 Analisis CFA Pada Setiap Subtes GATB 101
Tabel 5.2 Hasil Pengujian Model Satu Faktor Setiap Subtes GATB 102
15
DAFTAR GAMBAR
Gambar 2.1 Model Hirarki Inteligensi Vernon 27

Gambar 2.2 Kerangka Berfikir Berdasarkan Subtes 49
Gambar 2.3 Kerangka Berfikir Berdasarkan Sebaran Item 49
Gambar 4.1 Analisis faktor Konfirmatorik Untuk Subtes Computation 66
Gambar 4.2 Analisis faktor Konfirmatorik Untuk Subtes 73
Three Dimensional Space
Gambar 4.3 Analisis faktor Konfirmatorik Untuk Subtes Vocabulary 84
Gambar 4.4 Analisis faktor Konfirmatorik Untuk Subtes Arithmetic 91
Reasoning
Gambar 4.5 Koefisiein Muatan Faktor Untuk General Intelligence 98
16
DAFTAR LAMPIRAN
Lampiran A : Surat Keterangan Penelitian
Lampiran B : Analisis Faktor Konfirmatorik Computation
Analisis Faktor Konfirmatorik Three Dimensional Space
Analisis Faktor Konfirmatorik Vocabulary
Analisis Faktor Konfirmatorik Arithmetic Reasoning
Analisis Faktor Konfirmatorik 2nd Order GATB
17
BAB I
PENDAHULUAN
Dalam bab pendahuluan ini akan dibahas mengenai latar belakang penelitian,
batasan masalah, perumusan masalah, tujuan penelitian, manfaat penelitian, dan
sistematika penelitian.
1.1 Latar Belakang
Sumber daya manusia dalam perusahaan merupakan aset yang paling berharga.
Optimalisasi hasil pencapaian perusahaan akan sangat didukung oleh peningkatan
peran para manajer fungsional yang terlibat dalam pengelolaan sumber daya
manusia. Dewasa ini aspek pengembangan sumber daya manusia semakin
mendapat perhatian khusus dari para pimpinan perusahaan. Pimpinan perusahaan
memperhatikan aspek sumber daya manusia dalam menentukan pola penentuan
strategi dan kebijakan secara terpadu. Pengelolaan faktor sumber daya manusia
sangat penting karena memegang peran utama dalam pelaksanaan kegiatan fungsi-
fungsi yang lain dalam perusahaan.
Untuk mencapai visi dan misi perusahaan, kualitas SDM merupakan faktor
penting yang perlu dipersiapkan perusahaan sejak dini mulai dari melakukan
proses rekruitmen. Proses rekruitmen pada dasarnya adalah proses untuk memilih
berbagai sumber dari calon karyawan potensial dan usaha untuk menariknya agar
bersedia masuk menjadi bagian dari suatu perusahaan. Dengan merekrut
karyawan yang potensial dan memiliki kesiapan psikologis yang baik, serta
18
penempatan karyawan yang tepat, perusahaan akan lebih lebih mudah
memperoleh produktivitas yang optimal dari karyawan dan karyawan pun merasa
nyaman serta dapat menikmati pekerjaan yang mereka lakukan.
Munandar (2001) menjelaskan bahwa sasaran seleksi adalah suatu
rekomendasi atau suatu keputusan untuk menerima atau menolak seorang calon
untuk pekerjaan tertentu berdasarkan suatu dugaan tentang kemungkinan-
kemungkinan dari calon untuk menjadi tenaga kerja yang berhasil pada
pekerjaannya.
Tujuan utama dari proses seleksi adalah untuk mendapatkan orang yang
tepat bagi suatu jabatan tertentu, sehingga orang tersebut mampu bekerja secara
optimal dan dapat bertahan di perusahaan untuk waktu yang lama. Meskipun
tujuannya terdengar sangat sederhana, proses tersebut ternyata sangat kompleks,
memakan waktu cukup lama, menggunakan biaya yang tidak sedikit dan sangat
terbuka peluang untuk melakukan kesalahan dalam menentukan orang yang tepat.
Kesalahan dalam memilih orang yang tepat sangat besar dampaknya bagi
perusahaan atau organisasi. Hal tersebut bukan saja karena proses rekruitmen dan
seleksi itu sendiri telah menyita waktu, biaya dan tenaga, tetapi juga karena
menerima orang yang salah untuk suatu jabatan akan berdampak pada efisiensi,
produktivitas, dan dapat merusak moral kerja pegawai yang bersangkutan dan
orang-orang di sekitarnya. Tahapan seleksi yang utama dalam proses perekrutan
adalah mengikuti tes psikologi.
19
Tes psikologi adalah sebuah instrumen pengukuran yang memiliki tiga
karakteristik yang menentukan sebuah contoh dari perilaku, sampel yang
diperoleh dalam suatu tes harus dibawah kondisi standar, dan ada penetapan
aturan untuk penilaian atau untuk memperoleh informasi kuantitatif (numerik)
dari sampel perilaku (Murphy, 1994).
Tes psikologi diperlukan dalam pengambilan keputusan berkaitan dengan
sumber daya manusia dalam bidang industri dan organisasi (Gregory, 2000).
Pengambilan keputusan tersebut berkaitan dengan penerimaan dan penempatan,
promosi, evaluasi, maupun penepatan karier. Keberagaman dari perkembangan
tes psikologi sangat mengejutkan. Terdapat lebih dari 1.000 tes psikologis yang
berbeda dan tersedia secara komersial di negara-negara barat dan tidak diragukan
lagi terdapat ratusan lainnya yang diterbitkan di seluruh bagian dunia. Tes ini
berkisar dari tes kepribadian dan tes guna mendapatkan skor IQ, tes pemeriksaan
skolastik sampai tes persepsi. Meskipun terdiri dari berbagai keberagaman, ada
beberapa bagian yang biasanya terdapat di semua tes psikologi, diambil secara
bersama-sama, dan kemudian terciptalah definisi dari “test” (Loewenthal, 1997 ).
Kebutuhan akan alat tes untuk asesmen mendorong banyak dikembangkan
berbagai alat ukur tes psikologis baik itu berupa tes, self-report, skala, maupun
inventori. Pengembangan alat ukur dapat dilakukan dengan membuat alat ukur
atau melakukan adaptasi terhadap alat ukur yang telah dibuat di luar negeri.
Di Indonesia, psikotes merupakan istilah umum yang digunakan untuk
menjelaskan proses pemeriksaan psikologis calon pegawai. Banyak alat tes yang
20
dapat digunakan untuk proses seleksi, seperti melalui proses assessment, tes
pengetahuan, psikotes, battery test, maupun Behavior Interview. Tujuan dari
proses seleksi tentunya adalah untuk benar-benar dapat memperlihatkan
kapabilitas calon karyawan dan menentukan apakah kapabilitas yang dia miliki
sesuai dengan jabatan. Kunci utama keberhasilan sebuah seleksi adalah tersedia
rincian kompetensi (baik teknis maupun perilaku) yang diperlukan agar dapat
berhasil.
Menurut Davis (2009) keutamaan dari tes psikologi bila digunakan dalam
bidang industri adalah:
1. Objektif dalam arti mengurangi sekecil mungkin efek bias atau
prasangka berdasarkan usia, jenis kelamin, agama, maupun politik.
2. Konsisten karena semua calon mendapatkan pertanyaan atau latihan
yang sama dengan urutan yang sama dengan durasi waktu yang sama
untuk menjawabnya, dengan asumsi dilakukan dalam lingkungan
terkendali sesuai petunjuk pembuatnya. Bahkan sekarang ada variasi di
mana beberapa tes kemampuan verbal dan numerik secara online
menciptakan sekumpulan pertanyaan khas dari bank soal yang besar,
di mana tiap pertanyaan dianggap memiliki tingkat kesulitan yang
sama, sehingga masih memungkinkan dilakukan penilaian komparatif.
3. Dapat memprediksi kinerja efektif. Banyak studi menunjukkan bahwa
penggunaan tes psikologi yang berkualitas dalam hubungannya dengan
21
asesmen pengetahuan dan wawancara terstruktur ternyata dapat
meningkatkan efektivitas rekrutmen.
4. Dapat memberikan wawasan "kesadaran diri" kepada calon dan juga
organisasi. Perasaan bahwa seorang individu akan belajar dan
berkembang secara pribadi merupakan motivator yang penting. Oleh
karena itu keadaan ini bermanfaat untuk mempertahankan karyawan
(retention agent).
Dalam proses seleksi, salah satu cara yang umum dilakukan adalah
melakukan pemeriksaan atau tes psikologis pada calon karyawan guna untuk
meramalkan kemungkinan keberhasilan calon karyawan dalam jabatan atau
pekerjaan tertentu. Ada berbagai alat ukur psikologis yang umumnya digunakan
dalam proses seleksi seperti tes kecakapan atau kemampuan kognitif, tes
kepribadian objektif dan proyektif, tes situasional, informasi biografi, dan
wawancara. Salah satu tes yang paling umum digunakan dan menjadi dasar pada
tes selanjutnya adalah tes bakat dan tes inteligensi.
Dalam bidang pekerjaan, kegiatan seleksi, penempatan dan promosi
karyawan juga melibatkan tes inteligensi. Smith (dalam Cook & Cripps, 2005)
menunjukkan bahwa pengukuran mental ability bersifat universal dalam kegiatan
seleksi, sesuatu yang dibutuhkan dan berguna pada berbagai bidang pekerjaan.
Melalui tes inteligensi perusahaan terbantu dalam mengidentifikasi calon-calon
karyawan yang potensial untuk diseleksi atau dikembangkan.
22
Tes Inteligensi merupakan upaya untuk mengukur kecerdasan seseorang,
yaitu kemampuan dasar seseorang untuk memahami dunia di sekitarnya seperti
fungsi asimilasi dan menerapkan pengetahuan tersebut untuk meningkatkan
kualitas hidupnya. Telah diketahui bahwa kinerja pada tes inteligensi akademik
memiliki korelasi yang substansial dengan tingkat pendidikan. Maka akan terlihat
bahwa persyaratan pendidikan dapat diterapkan untuk mencakup kualifikasi
pelamar dalam kelompok keterampilan kognitif dan pengetahuan. Namun hal
tersebut dirasa tidak adil, karena pengetahuan dan keterampilan dapat diperoleh
melalui pendidikan non formal atau pelatihan-pelatihan yang lain (Anastasi &
Urbina, 1997).
Tes-tes inteligensi didesain untuk mengukur general ability, tetapi orang
merasakan bahwa kemampuan-kemampuan yang terukur oleh tes inteligensi tidak
meliput kemampuan-kemampuan atau fungsi-fungsi khusus yang dibutuhkan
dalam pekerjaan. Sejak Perang Dunia I para psikolog mulai membuat tes-
tes aptitude khusus untuk kebutuhan konseling pekerjaan (vocational counseling)
yang dapat melengkapi tes-tes inteligensi umum. Tes-tes aptitude atau bakat
khusus yang banyak dipakai adalah tes-tes mekanikal, spasial, perseptual, klerikal,
musikal, dan artistik. Tes-tes ini dipakai dalam seleksi dan penempatan
(klasifikasi) karyawan dalam perusahaan dan ketentaraan (Anastasi & Urbina,
1997).
23
Tes bakat atau aptitude test adalah tugas-tugas baku yang dirancang untuk
mengungkapkan kemampuan atau keberhasilan seseorang dalam melaksanakan
suatu pekerjaan di masa mendatang. Dalam bidang industri,bakat seseorang perlu
diketahui apakah ia tepat menduduki jabatan tertentu. Hasil tes bakat bisa
membantu suatu perusahaan atau lembaga untuk menempatkan karyawan atau
calon karyawan pada posisi yang sesuai dengan kualifikasi yang dibutuhkan.
Tes bakat dapat meramalkan bakat-bakat seseorang dalam berbagai bidang
atau dalam hal pekerjaan yang dipilihnya serta kesuksesan-kesuksesan bekerja di
masa datang. Seorang yang dapat memilih dan menyesuaikan pekerjaan yang
sesuai dengan bakatnya akan membuat seseorang tersebut mempunyai semangat
kerja yang tinggi dan kepuasan kerja akan tercapai. Sebaliknya seorang individu
yang dipaksa atau terpaksa bekerja tidak sesuai dengan bakatnya akan
menimbulkan kelesuan kerja, semangat kerja rendah, ketidakpercayaan pada diri
sendiri, banyak membuat kesalahan-kesalahan dan menimbulkan frustrasi bagi
individu yang bersangkutan.
Salah satu alat tes yang biasa dipakai tersebut adalah General Apitude Test
Battery (GATB). GATB adalah suatu alat tes yang berhubungan dengan jabatan
yang berorientasi pada beberapa tes bakat baterai yang mengukur sembilan bakat
dalam delapan tes tulis serta empat perangkat tes yaitu name comparison,
computation, three dimensional space, vocabulary, tool matching, arithmetic
reason, form matching, mark making, place, turn, dan disassemble.
24
Penelitian ini menggunakan empat subtes dari GATB yaitu computation,
three dimensional space, vocabulary, dan arithmetic reasoning dengan jumlah
total 175 item. Keempat subtes tersebut digunakan karena subtes ini merupakan
tes bakat dalam penilaian skolastik. Tes bakat skolastik adalah sebuah tes yang
bertujuan untuk mengetahui bakat dan kemampuan seseorang di bidang
keilmuan. Tes ini juga dapat mencerminkan tingkat kecerdasan intelektual (IQ)
seseorang.
Dalam penelitian ini GATB digunakan karena tes tersebut mengukur
kemampuan-kemampuan umum pada individu dan dapat dipakai untuk semua
kalangan. GATB merupakan salah satu alat tes bakat dan inteligensi yang telah
lama diciptakan dan digunakan dalam pengetesan psikologi. GATB dapat
digunakan secara individual, klasikal maupun berkelompok, serta dapat
memberikan gambaran atau profil seseorang mengenai kelemahan maupun
kekuatan yang dimilikinya berdasarkan berbagai aspek yang terkait dengan fungsi
inteligensinya.
Keuntungan dari penggunaan alat tes GATB sebagai salah satu tes untuk
mengukur inteligensi adalah pengadministrasian tes lebih mudah, waktu
pengerjaan tes yang relatif singkat dapat menghemat waktu dalam pengerjaan.
Dalam penghitungan skor IQ juga jauh lebih mudah apabila dibandingkan dengan
menggunakan alat tes inteligensi lainnya sehingga tidak perlu lagi menggunakan
tenaga professional yang berdampak pada penghematan biaya tes. Namun, alat tes
GATB ini telah lama digunakan karena termasuk salah satu alat tes yang tertua.
25
Belum adanya pengujian validitas pada item subtes GATB yang menyebabkan
item subtes GATB belum memuaskan. Oleh karena itu, peneliti akan meneliti
dengan teori modern dalam rangka menguji validitas konstruk dari GATB.
Dikarenakan peneliti belum mempelajari secara khusus statistik tentang analisis
faktor, maka peneliti hanya akan mempraktekkannya saja dengan software yang
sudah ada, yaitu Lisrel kemudian menafsirkan hasil analisis faktor terhadap data
hasil tes.
Alat tes GATB telah lama digunakan sebagai alat penyeleksian calon
pegawai. Mengingat alat tes tersebut digunakan untuk banyak kegiatan
penyeleksian calon karyawan maka perlu adanya pengujian validitas, sehingga tes
tersebut masih layak digunakan sebagai alat tes inteligensi. Kaplan & Saccuzzo
(2009) mengatakan bahwa tes yang baik minimal harus memenuhi syarat: 1)
validity; 2) reliability; 3) objectivity; dan 4) usability. Dalam menggunakan alat
ukur psikologis, setelah kriteria valid telah dipenuhi, maka hasil validitas itu akan
memberikan jawaban sebagai alat ukur yang baik atau tidak. Setelah validasi alat
tes, dapat diketahui item yang gugur dan membuat kurang baiknya suatu alat ukur
psikologis.
Kenyataan ini menunjukkan bahwa perlu sekali mengadakan berbagai
penelitian yang berkaitan dengan ‘keabsahan’ (keabsahan ramalan, keabsahan
konstruk, keabsahan isi, keabsahan sintetik) dari perangkat tes psikologik yang
digunakan dalam seleksi dan asesmen, sehingga seleksi dan asesmen psikologik
26
untuk berbagai tujuan menjadi lebih menggunakan kaidah-kaidah ilmiah
(Munandar, 2001).
Berdasarkan pemaparan di atas, peneliti tertarik untuk melakukan
penelitian mengenai studi validitas konstruk alat tes GATB secara lebih
mendalam agar mendapatkan gambaran yang lebih jelas mengenai tingkat
validitas suatu alat tes. Data penelitian di dapatkan dari Asesmen SDM PPM
Manajemen yang juga menggunakan GATB sebagai salah satu alat tes psikologis
dalam proses rekruitmen dan seleksi di seluruh Indonesia.
1.2 Pembatasan Masalah
Penelitian ini menggunakan data sekunder di PPM, yang beralamatkan Jl.
Menteng Raya 9, Jakarta. Respondennya adalah semua karyawan dari PT Semen
Tonasa yang mengikuti serangkaian proses asesmen dari PPM pada tahun 2009
yang mengikuti tes di Jakarta. Untuk mengukur validiasi dari sebuah alat tes,
penelitian ini terfokus kepada empat subtes dalam GATB yang terdiri dari:
computation, three dimensional space, vocabulary, dan arithmetic reasoning.
1.3 Perumusan Masalah
Merujuk kepada latar belakang yang telah diuraikan, maka penulis merumuskan
masalah sebagai berikut, yaitu:
1. Apakah benar seluruh item dalam empat subtes GATB yang dijadikan
penelitian mengukur konstruk yang dimaksud. Konstruk yang dimaksud
27
adalah computation, three dimensional space, vocabulary, dan three
dimensional space. Dimana setiap item dalam masing-masing subtes
adalah fit (sesuai) dengan model satu faktor, yang berarti semua item pada
suatu subtes mengukur hanya satu kemampuan yang didefinisikan pada
subtes tersebut. Apakah setiap item dalam masing-masing subtes secara
signifikan mengukur kemampuan pada subtes tersebut?
2. Apakah empat subtes dalam GATB fit (sesuai) dengan model satu faktor,
yaitu semua subtes mengukur satu faktor umum yang dalam hal ini adalah
“Inteligensi”?
1.4 Tujuan Penelitian
Penelitian ini bertujuan untuk mengetahui validitas konstruk GATB, sehingga alat
tes GATB tersebut masih dapat digunakan pada pengetesan calon pegawai di
dalam berbagai lembaga psikologi yang menggunakan alat tes GATB karena pada
kenyataannya alat tes GATB masih dipakai secara konsisten dalam pengetesan
kemampuan umum atau inteligensi.
1.5 Manfaat Penelitian
Secara pokok dan prinsip tujuan penelitian ini adalah menjawab pertanyaan
penelitian yang telah peneliti rumuskan diatas. Oleh karenanya tujuan dan manfaat
subtansial penelitian ini sangat berkaitan erat dengan pertanyaan penelitiannya
yaitu:
28
a. Secara teoritik, hasil penelitian ini diharapkan dapat menambah
khasanah ilmu pengetahuan psikologi, khususnya psikologi industri
dan organisasi dan memberikan gambaran mengenai bagaimana
menggunakan software Lisrel untuk menguji validitas konstruk dari
sebuah alat ukur psikologi. Sehingga, menambah ilmu baru pada
peneliti, lembaga psikologi yang menggunakan alat tes GATB,
maupun pembaca.
b. Secara praktis, hasil penelitian ini bermanfaat bagi pengguna tes
GATB, sehingga alat tes tersebut dapat disempurnakan dan digunakan
pada pengetesan calon pegawai berikutnya di lembaga psikologi yang
menggunakan GATB sebagai salah satu alat tes dengan tingkat
validitas yang lebih tinggi.
1.6 Sistematika Penelitian
Sistematika penulisan skripsi dengan judul “Uji Validitas Konstruk General
Aptitude Test Battery (GATB) Dengan Teknik CFA” terdiri dari lima bab,
yaitu
BAB 1 : Pendahuluan
Dalam bab pendahuluan ini akan dibahas mengenai latar belakang
penelitian, pembatasan masalah, perumusan masalah, tujuan
penelitian, manfaat penelitian baik yang teoritis maupun praktis,
dan sistematika penelitian.
29
BAB 2 : Kajian Teori
Dalam bab kajian teori ini berisi sub bab deskriptif teoritis yang
membahas mengenai bahasan umum mengenai tes psikologi, hal-
hal mengenai bakat dan inteligensi serta teori inteligensi yang
digunakan oleh alat tes GATB, definisi validitas dan reliabilitas,
gambaran umum alat tes GATB, kerangka berpikir, dan hipotesis
penelitian
BAB 3 : Metode Penelitian
Dalam bab metode penelitian ini akan dibahas mengenai
metode penelitian yang terdiri dari subjek penelitian, metode
analisis data, dan prosedur penelitian.
BAB 4 : Hasil Penelitian
Dalam bab empat ini, akan dibahas mengenai hasil penelitian
yang telah dilakukan. Pembahasan tersebut meliputi validitas
yang dihasilkan oleh analisis faktor, dengan masing-masing
skalanya.
BAB 5 : Kesimpulan, Diskusi, dan Saran
Dalam bab lima ini akan dipaparkan keseluruhan isi penelitian
dan menyimpulkan hasil penelitian. Dalam bab ini juga akan
dimuat diskusi dan saran.
30
BAB II
KAJIAN TEORI
Dalam bab kajian teori ini akan dipaparkan mengenai teori yang digunakan dalam
penelitian ini yang terdiri dari sub bab deskriptif teoritis yang membahas
mengenai tes psikologi, hal-hal mengenai bakat dan inteligensi serta teori
inteligensi yang digunakan dalam penelitian, definisi validitas dan reliabilitas,
gambaran umum alat tes GATB, kerangka berpikir, dan hipotesis penelitian.
2.1. Bahasan Umum Mengenai Tes Psikologi
Dalam kamus Psikologi, tes adalah satu perangkat pertanyaan yang sudah
dibakukan, yang dikenakan pada seseorang dengan tujuan untuk mengukur
perolehan atau bakat pada suatu bidang tertentu (Chaplin, 2006). Anne Anastasi
(1997) menjelaskan bahwa tes psikologi merupakan alat ukur yang terstandar dan
objektif tentang sampel perilaku individu. Karena mengukur sampel perilaku, tes
psikologi - melalui item-itemnya - haruslah mencerminkan perilaku yang hendak
diukur. Ia objektif dan terstandar. Hal ini mengandung arti bahwa alat tes haruslah
berisi hal-hal penting yang hendak diukur supaya representatif.
Cronbach (1984) menyatakan tidak ada definisi tes yang dianggap tuntas,
melainkan para ahli mendefinisikan tes menurut cara pandangnya sendiri-
sendiri. Cronbach (1984) cenderung mendefinisikan tes psikologis sebagai suatu
prosedur yang distandardisasikan (standardization of procedure) yang digunakan
tester untuk mengukur kemampuan potensi subyek. Dalam pandangan ini,
31
prosedur (procedure) diartikan sebagai tata cara yang spesifik dan konkrit. Dari
batasan tersebut dapat diambil kesimpulan. Pertama, tes merupakan prosedur
sistematis. Item-item dalam tes disusun dengan cara dan aturan tertentu, prosedur
administrasi dan pemberian angka (skoring) tes harus jelas dan dispesifikasikan
secara terperinci, dan setiap orang yang mengambil tes tersebut harus mendapat
item-item yang sama dan dalam kondisi yang sebanding. Kedua, tes berisi sampel
perilaku. Keseluruhan item itu mustahil dapat seluruhnya tercakup dalam tes.
Kelayakan tes lebih tergantung kepada sejauh mana item-item di dalam tes
mewakili secara representatif kawasan (domain) perilaku yang diukur. Ketiga, tes
mengukur perilaku. Item-item dalam tes menghendaki subyek agar menunjukkan
apa yang diketahui atau apa yang telah dipelajari subyek dengan cara menjawab
item-item atau mengerjakan tugas-tugas yang dikehendaki oleh tes.
Sebuah tes psikologi pada dasarnya adalah alat ukur yang objektif dan
dibakukan atas sampel perilaku tertentu (Anastasi & Urbina, 1997). Dalam
psikologi, tes dapat diklasifikasikan menjadi lima, yaitu: Pertama, tes yang
mengukur inteligensi umum (general intelligence test). Tes ini dirancang untuk
mengukur kemampuan umum seseorang dalam suatu tugas. Kedua, tes yang
mengukur kemampuan khusus atau tes bakat (special ability test). Tes ini
digunakan untuk mengungkap kemampuan potensial subjek dalam bidang
tertentu. Ketiga, tes yang mengukur prestasi (achievement test). Tes ini
dimaksudkan untuk mengukur tingkat pembelajaran, keberhasilan, atau prestasi
seseorang dalam memahami hasil pembelajaran. Keempat, tes yang mengungkap
aspek kepribadian (personality assesment). Tes ini mengungkap sifat-sifat,
32
kualitas, atau perilaku individual subjek dalam aspek non ability. Kelima, tes yang
menilai kreativitas dari seseorang (creativity test). Tes ini menilai kemampuan
subjek untuk menghasilkan ide-ide baru, atau kreasiartistik yang dapat diterima
sebagai nilai sosial, artistik, atau ilmiah (Greogory, 2000)
Berdasarkan beberapa pengertian di atas dapat disimpulkan pengertian tes
adalah suatu alat atau metode pengumpulan data yang sudah distandardisasikan
untuk mengukur atau mengevaluasi salah satu aspek kemampuan atau kecakapan
dengan jalan mengukur sampel dari salah satu aspek tersebut. Dengan demikian
tes merupakan alat pengumpul data untuk mengetahui kemampuan individu atau
kelompok individu dalam menyelesaikan sesuatu atau memperlihatkan
keterampilan tertentu, dalam memperlihatkan hasil belajar, atau dalam
menggunakan kemampuan psikologis untuk memecahkan suatu persoalan.
Penelitian ini akan menggunakan definisi tes psikologi yang disampaikan
oleh Anastasi, bahwa tes psikologi adalah alat ukur yang terstandar dan objektif
tentang sampel perilaku individu. Karena mengukur sampel perilaku, tes psikologi
– melalui item-itemnya - haruslah mencerminkan perilaku yang hendak diukur. Ia
objektif dan terstandar. Hal ini mengandung arti bahwa alat tes haruslah berisi hal-
hal penting yang hendak diukur supaya representatif.
33
2.2. Bakat
2.2.1. Definisi Bakat
Bakat menurut definisi Bingham (dalam Saparinah Sadli, 1991) adalah suatu
kondisi atau seperangkat karakteristik yang dianggap sebagai kemampuan
individu untuk memperoleh pengetahuan melalui suatu latihan khusus guna
mencapai suatu keterampilan, kemampuan berbahasa, bermusik dan lain
sebagainya.
Coyle (2009) mendefinisikan bakat sebagai keterampilan bersifat berulang
yang tidak tergantung pada ukuran fisik. Atas dasar definisi tersebut, bakat tidak
berhubungan sama sekali dengan kondisi fisik seseorang. Menurut Buckingham &
Coffman (1999) Bakat adalah suatu pola berulang dalam berpikir, merasakan, atau
berperilaku yang bisa diterapkan secara produktif.
Dari pengertian mengenai bakat diatas dapat disimpulan bahwa bakat
adalah kemampuan bawaan yang merupakan potensi yang masih perlu
dikembangkan atau dilatih untuk mencapai suatu kecakapan, pengetahuan, dan
keterampilan khusus.
2.2.2. Faktor-faktor Yang Mempengaruhi Perkembangan Bakat
Bakat berkembang sebagai hasil interaksi dari faktor yang bersumber dari dalam
diri individu dan dari lingkungannya. Apabila kedua faktor tersebut bersifat saling
mendukung maka bakat yang ada akan dapat berkembang secara optimal.
34
Manakah di antara kedua faktor tersebut yang paling besar pengaruhnya, ini
sangat sulit sekali untuk menentukannya dengan tepat (Rahman,2004).
Faktor yang bersumber dari diri individu yang mempengaruhi
perkembangan bakat, antara lain:
1. Kemampuan atau potensi individu yang dibawa sejak lahir. Faktor
bawaan akan sangat menentukan pembentukan dan perkembangan
bakat seseorang. Lingkungan tidak akan dapat merubah membentuk
manusia melebihi batas kemampuan yang dimiliki manusia.
2. Minat individu yang bersangkutan. Suatu bakat tertentu tidak akan
berkembang dengan baik apabila tidak disertai minat yang cukup
tinggi terhadap bidang atau hal yang sesuai dengan bakat tersebut..
3. Motivasi yang dimiliki individu. Suatu bakat akan menjadi kurang
berkembang atau tidak akan menonjol bila kurang disertai oleh adanya
motivasi yang cukup tinggi untuk mengaktualisasikannya, karena
motivasi berhubungan erat dengan daya juang seseorang untuk
mencapai suatu tujuan.
4. Nilai hidup yang dimiliki individu. Yang dimaksud dengan nilai hidup
di sini adalah bagaimana cara seseorang memberi arti terhadap sesuatu
di dalam hidupnya.
5. Kepribadian individu. Faktor kepribadian ini sangat memegang
peranan bagi perkembangan bakat seseorang, misal konsep diri, rasa
35
percaya diri, keuletan atau keteguhan dalam berusaha, kesediaan untuk
menerima kritik dan saran demi untuk meraih sukses yang tinggi.
6. Maturity (kematangan). Bakat tertentu akan berkembang dengan baik
apabila sudah mendekati atau menginjak masa pekanya. Suatu hal
yang sulit adalah dalam menentukan kapankah saatnya (pada usia
berapakah) suatu kemampuan atau bakat tertentu sudah matang untuk
dikembangkan atau dilatih, karena untuk masing-masing kemampuan
dan untuk setiap orang kematangannya belum tentu atau tidak selalu
sama.
Sebagaimana sudah diuraikan sebelumnya bahwa lingkungan juga
memegang peranan yang sangat menentukan berkembang tidaknya suatu bakat.
Oleh karena itu lingkungan dapat berfungsi sebagai perangsang untuk
berkembangnya bakat, tetapi dapat juga sebaliknya lingkungan justru menjadi
faktor penghambat bagi aktualisasi dan perkembangan bakat yang dimiliki
seseorang.
2.2.3. Tes Bakat
Tes bakat pada awalnya diprakarsai oleh seorang ahli yang bernama A.
Musterberg. Mula-mula tes bakat digunakan pada masa perang dunia I untuk
menyeleksi pilot, pengemudi dan kemudian meluas ke bidang industri.
Tahun 1920-1930, tes yang digunakan adalah tes inteligensi umum, karena
tes inteligensi pada saat itu dianggap sebagai satu-satunya tes yang mutlak dapat
36
mementukan kemampuan seseorang. Tes inteligensi umum ini meskipun
mengandung berbagai aspek penting yang menunjang berfungsinya inteligensi
seseorang seperti kemampuan berbahasa, kemampuan penalaran, semuanya
menunjang satu angka sebagai keseluruhan unit inteligensi yang biasanya
dinyatakan sebagai IQ. Namun, masing-masing aspek tidak dimaksudkan untuk
disimpulkan sendiri-sendiri.
Tes inteligensi yang hanya dapat memberikan gambaran kemampuan
umum dan tidak dapat memberikan gambaran kemampuan umum dan profil
kemampuan seseorang pada aspek tertentu dirasakan kurang. Diperlukan adanya
tes lain yang dapat mengukur bermacam aspek secara khusus, ileh karena pada
kenyataannya ada perbedaan profil kemampuan antara individu yang satu dengan
individu lainnya. Maka diperlukan penciptaan tes bakat yang dapat mengukur
kemampuan di dalam berbagai aspek sebagai pelengkap tes inteligensi.
Dasar dari tes bakat adalah membandingkan profil nilai seseorang dengan
profil nilai orang lain yang dianggap berkemampuan tinggi mengenai bidang
tertentu. Dengan cara menyimpulkan kekuatan atau kelemahannya, maka dapat
terukur kadar bakat yang dimiliki oleh seseorang.
Secara garis besar tes bakat dapat dikelompokkan menjadi dua bagian
besar (Anastasi, 1997), yaitu:
1. Multiple Aptitude Batteries yaitu tes bakat yang mengukur bermacam-
macam kemampuan, seperti. pengertian bahasa, kemampuan angka-
37
angka, penglihatan keruangan, penalaran dalam berhitung, kecepatan
dan ketepatan dalam persepsi. Dari hasil tes dapat dilihat kemampuan,
kekuatan dan kelemahan seseorang yang masing-masing dinyatakan
dalam angka-angka tersendiri, hasilnya adalah berupa profil angka-
angka. Berbeda dengan tes inteligensi umum dimana semua aspek
inteligensi keluar sebagai satu angka yaitu IQ. Tes ini termasuk tes
bakat yang sudah cukup lama dipakai, yaitu sejak perang Dunia I.
Yang termasuk jenis kelompok tes ini antara lain:
a) Differential Aptitude Test (DAT), terdiri dari 8 subtes.
b) General Aptitude Test Batteries (GATB), terdiri dari 9 subtes.
c) Flanagan Aptitude Classification Test (FACT), terdiri dari 14
subtes.
2. Special Aptitude Test atau Single Aptitude Test atau tes bakat khusus,
yakni tes yang hanya mengukur satu bakat khusus tertentu. Sebagai
contoh:
a) Musical Aptitude Test
b) Artistical Aptitude Test.
c) Clerical Aptitude Test.
d) Mathematical Aptitude Test.
38
2.3. Inteligensi
2.3.1. Definisi Inteligensi
Definisi inteligensi telah banyak yang dikemukakan oleh para ahli psikologi
maupun ahli pendidikan. Beberapa diantaranya akan dikemukakan disini untuk
mengarahkan pemahaman terhadap penelitian ini.
J. P. Guilford menjelaskan bahwa tes inteligensi hanya dirancang untuk
mengukur proses berpikir yang bersifat konvergen, yaitu kemampuan untuk
memberikan satu jawaban atau kesimpulan yang logis berdasarkan informasi yang
diberikan. Sedangkan kreativitas adalah suatu proses berpikir yang bersifat
divergen, yaitu kemampuan untuk memberikan berbagai alternatif jawaban
berdasarkan informasi yang diberikan. Lebih jauh, Guilford menyatakan bahwa
inteligensi merupakan perpaduan dari banyak faktor khusus.
Howard Gardner (1985) mengemukakan bahwa inteligensi adalah
kemampuan untuk memecahkan masalah, atau menciptakan suatu produk dalam
berbagai macam setting dan dalam situasi nyata.
Menurut David Wechsler (dalam Jackson, 2003), Inteligensi
adalah kapasitas keseluruhan atau global individu untuk bertindak, berpikir
rasional, dan menangani lingkungan secara efektif. Istilah keseluruhan atau
global digunakan karena terdiri dari elemen atau kemampuan yang meskipun
tidak sepenuhnya independen, namun secara kualitatif terdiferensialkan
39
William Stern mengemukakan inteligensi ialah kesanggupan untuk
menyesuaikan diri kepada kebutuhan baru, dengan menggunakan alat-alat berfikir
yang sesuai dengan tujuannya. William Stern berpendapat bahwa inteligensi
sebagian besar tergantung dengan dasar dan turunan, pendidikan atau lingkungan
tidak begitu berpengaruh kepada inteligensi seseorang (Anne Anastasi, 1997).
Alfred Binet (dalam Kaplan, 2009) seorang tokoh utama perintis
pengukuran inteligensi bersama Theodore Simon mendefinisikan inteligensi
sebagai sisi tunggal dari karakteristik seseorang yang terdiri atas tiga komponen,
yaitu (a) kemampuan untuk mengarahkan fikiran atau mengarahkan tindakan, (b)
kemampuan untuk mengubah arah tindakan bila tindakan tersebut telah
dilaksanakan, dan (c) kemampuan untuk mengeritik diri sendiri atau melakukan
autocriticism.
Berdasarkan pendapat para pakar di atas dapat di jelaskan
bahwa inteligensi adalah suatu kemampuan mental yang melibatkan proses
berpikir secara rasional. Inteligensi tidak dapat diamati secara langsung,
melainkan harus disimpulkan dari berbagai tindakan nyata yang merupakan
manifestasi dari proses berpikir rasional.
2.3.2. Teori–teori Inteligensi
Penggambaran secara sepintas tentang inteligensi sebagai suatu kemampuan dasar
yang bersifat umum telah berkembang menjadi berbagai teori inteligensi,
diantaranya adalah:
40
1. Teori Uni Faktor
Teori ini dipandang sebagai teori yang tertua. Alfred Binet termasuk
salah satu ahli psikologi yang mengatakan bahwa inteligensi bersifat
monogenetik, yaitu berkembang dari satu faktor satuan atau faktor
umum. Menurut Binet, inteligensi merupakan sisi tunggal dari
karakteristik yang terus berkembang sejalan dengan proses
kematangan seseorang.
Binet menggambarkan inteligensi sebagai sesuatu yang fungsional
sehingga memungkinkan orang lain untuk mengamati dan menilai
tingkat perkembangan individu berdasar suatu kriteria tertentu. Jadi
untuk melihat apakah seseorang cukup cerdas atau tidak, dapat diamati
dari cara dan kemampuannya untuk melakukan suatu tindakan dan
kemampuannya untuk mengubah arah tindakannya itu apabila perlu.
Inilah yang dimaksud dengan komponen arah, adaptasi dan kritik
dalam definisi inteligensi.
2. Teori Dwifaktor (The Two-Factor Theory)
Teori dwifaktor dikembangkan oleh Charles Spearman seorang
psikolog dan ahli statistik dari Inggris. Spearman (1927) mengusulkan
teori kecerdasan dua faktor yang menurutnya dapat menjelaskan pola
hubungan antara kelompok tes kognitif yang ia analisis. Dalam
bentuknya yang paling sederhana, teori ini menyatakan bahwa kinerja
41
pada setiap tugas kognitif tergantung pada faktor umum (g) ditambah
satu atau faktor yang lebih spesifik dan unik untuk tugas tertentu (s)
(Aiken, 1997).
Kedua faktor ini, baik faktor “g” maupun faktor “s” bekerja bersama-
sama sebagai suatu kesatuan. Semua faktor yang spesifik akan
bersama-sama membentuk single common factor “g” faktor. Spearman
berpendapat bahwa kemampuan seseorang bertindak dalam setiap
situasi sangat bergantung pada kemampuan umum maupun
kemampuan khusus. Jadi setiap faktor baik faktor “g” maupun faktor
“s” memberi sumbangan pada setiap perilaku yang intelegen.
3. Teori Multifaktor (Multiple factor Theory)
Teori multifaktor dikembangkan oleh Edward Lee Thorndike (1916).
Menurut teori ini, inteligensi terdiri dari hubungan-hubungan neural
antara stimulus dan respon. Hubungan-hubungan neural khusus inilah
yang mengarahkan tingkah laku indivivu. Pada dasarnya teori
Thorndike menyatakan bahwa inteligensi terdiri atas berbagai
kemampuan spesifik yang ditampakkan dalam wujud perilaku
intelegen. Thorndike mengemukakan empat atribut inteligensi, yaitu:
1) Tingkatan,
2) Rentang,
3) Daerah, dan
42
4) Kecepatan
4. Teori Hirearki
Model Hirearki dicetuskan oleh Vernon. Dalam menjelaskan teori
inteligensinya, teori ini menempatkan satu faktor kognitif umum (g)
dipuncak hierarki, kemudian dibawahnya terdapat dua faktor
inteligensi utama (mayor) yaitu verbal-eduacitional (v:ed) dan
practical-mechanical-spatial (k:m). Setiap kelompok mayor tersebut
kemudian terpecah kedalam beberapa faktor kelompok minor. Sebagai
contoh, v:ed terdiri dari kemampuan seperti kefasihan verbal,
kemampuan numerik, dan mungkin kreativitas. Beberapa faktor
kelompok kecil di bawah k:m adalah pemahaman mekanik,
kemampuan psikomotorik, serta hubungan spasial yang kemudian
terpecah lagi menjadi bermacam-macam faktor spesifik pada tingkat
hierarki yang paling rendah.
Dalam model hirarki kemampuan mental Vernon apabila semakin
tinggi posisi faktor dalam diagram maka semakin luas rentang
perilakunya.
43
Gambar 2.1
Model Hirarki Inteligensi Vernon
Sumber: Aiken, 1997
5. Teori Primary Mental Ability
Teori ini dikembangan oleh L.L. Thurstone berdasarkan analisis faktor
dengan mengkolerasikan 60 tes, yang akhirnya disusun menjadi
kecakapan-kecakapan primer. Thurstone menjelaskan mengenai
organisasi inteligensi yang abstrak atau biasa disebut dengan
“Primary-Mental Ability”. Thurstone berpendapat bahwa inteligensi
terdiri dari faktor yang jamak (multiple factors), mencakup tujuh
kemampuan mental utama (primary mental abilities), yaitu:
1) Verbal meaning (V): Memahami gagasan dan arti kata, yang
diukur dengan tes kosa kata.
2) Number (N): Kecepatan dan akurasi melakukan perhitungan
aritmatika.
44
3) Space (S): Kemampuan visualisasi hubungan yang berbentuk
dalam tiga dimensi, seperti dalam mengenali gambar dalam
orientasi berbeda.
4) Perceptual speed (P): Kemampuan untuk membedakan detail
visual, serta menetapkan persamaan dan perbedaan antara
obyek dalam gambar secara cepat.
5) Word fluency (W): Kecepatan dalam memikirkan kata-kata,
seperti dalam membuat puisi atau dalam memecahkan
anagram.
6) Memory (M): Kemampuan untuk menghafal kata-kata, angka,
huruf, dan sejenisnya, dengan cara menulis.
7) Inductive reasoning (I): Kemampuan untuk menurunkan
aturan dari informasi yang diberikan, seperti dalam
menentukan aturan dari serangkaian angka dari hanya sebagian
dari rangkaian angka tersebut.
Dalam penelitian ini, peneliti akan menggunakan teori inteligensi menurut
Thrustone karena teori Thrustone paling sesuai dengan teori yang terdapat dalam
GATB.
2.3.3. Pengukuran Inteligensi
Pada awalnya pengukuran inteligensi telah dipraktekkan di negara Cina sebelum
dinasti Han, pengukuran inteligensi dilakukan oleh jenderal Cina untuk menguji
45
rakyat sipil yang ingin menjadi legislatif berdasarkan pengetahuan menulis klasik,
persoalan administratif dan manajerial.
Pengukuran inteligensi kemudian dilanjutkan sampai pada masa dinasti
Han (200 SM- 200 M), namun seleksi ini tidak lagi untuk legislatif saja, tetapi
mulai merambah pada bidang militer, perpajakan, pertanian, dan geografi.
Meskipun diawali dengan sedikit mencontoh pada seleksi militer Prancis dan
Inggris, sistem ujian telah disusun dan berisi aktivitas yang berbeda, seperti
tinggal dalam sehari semalam dalam kabin untuk menulis artikel atau puisi, hanya
1 % sampai dengan 7 % yang diizinkan ikut ambil bagian pada ujian tahap kedua
yang berakhir dalam tiga hari tiga malam. Menurut Gregory (2007), seleksi ini
keras namun dapat memilih orang yang mewakili karakter orang Cina yang
kompleks. Tugas-tugas militer yang berat cukup dapat dilakukan dengan baik oleh
para pegawai yang diterima dalam seleksi fisik dan psikologi yang intensif.
Tokoh psikologi yang berperan antara lain adalah Wundt. Beliau
merupakan psikolog pertama yang menggunakan laboratorium dengan
penelitiannya mengukur kecepatan berpikir. Wundt mengembangkan sebuah alat
untuk menilai perbedaan dalam kecepatan berpikir. Tokoh yang tidak kalah
pentingnya adalah Alfred Binet. Kontribusi nyata Binet adalah menciptakan tes
inteligensi. Binet dibantu oleh Theophile Simon (1904) membuat instrumen
pengukur inteligensi dengan skala pengukuran level umum pada soal-soal
mengenai kehidupan sehari-hari sehingga tesnya dikenal dengan nama Tes Binet-
Simon. Perkembangan selanjutnya dua tokoh ini mengembangkan penggunaan tes
46
inteligensi dengan tiga puluh item yang berfungsi mengidentifikasikan
kemampuan sekolah anak (Van Ornum, 2008).
Di Amerika, usaha pertama tersebut dimulai oleh tokoh pencetus istilah
“tes mental” yaitu James Mckeen Cattell (1860-1944), yang menerbitkan bukunya
Mental Tes and Measurements di tahun 1890. Buku ini berisi serangkaian tes
inteligensi yang terdiri atas 10 jenis ukuran. Ke 10 macam ukuran tersebut adalah
(Gregory, 2007):
1. Dynamometer Pressure, yaitu ukuran kekuatan tangan menekan pegas
yang dianggap sebagai indikator aspek psikofisiologis
2. Rate of movement, yaitu kecepatan gerak tangan dalam satuan waktu
tertentu yang dianggap memiliki komponen mental didalamnya.
3. Sensation areas, yaitu pengukuran jarak terkecil diantara 2 tempat
yang terpisah dikulit yang masih dapat dirasakan sebagai 2 titik
berbeda.
4. Peasue caosing pain, yaitu pengukuran yamg dianggap berguna dalam
diaknosis terhadap penyakit saraf dan dalam mempelajari status
kesadaran abnormal.
5. Least noticabele difference in weight, yaitu pengukuran perbedaan
berat yang terkecil yang masih dapat dirasakan seseorang.
6. Reaction time for sound, yang mengukur waktu antara pemberian
stimulus dengan timbulnya reaksi tercepat.
47
7. Time for naming colors, yang dimaksudkan sebagai ukuran terhadap
proses yang lebih ‘mental’ daripada waktu-reaksi yang dianggap
reflektif.,
8. Bisection of a 50-cm line, yang dianggap sebagai suatu ukuran
terhadap akurasi ‘space judgment’
9. Judgment of 10 second time, yang dimaksudkan sebagai ukuran
akurasi dalam ‘time judgment’ (subyek diminta menghitung 10 detik
tampa bantuan apapun).
10. Number of latters repeated upon once hearing, yang dimaksudkan
sebagai ukuran terhadap perhatian dan ingatan (subyek diminta
mengulang huruf yang sudah disebutkan 1x)
Terdapat berbagai tes inteligensi yang terstandrisasi dan telah banyak
digunakan untuk berbagai keperluan pengetesan psikologi, diantaranya adalah
(Azwar, 2005):
1. Stanford-Binet Intelligence Scale
Tes Stanford-Binet digunakan pada anak-anak. Materi yang digunakan
dalam tes Stanford-Biner ini terdapat dalam sebuah kotak.
Penyelenggaraan tes dan Penentuan Skor menggunakan buku-buku kecil
berisi kartu-kartu tercetak untuk presentasi, flip-over soal tes, objek tes
mainan anak seperti balok, manik, papan bentuk, sebuah gambar besar
boneka yang uniseks dan multietnik, buku kecil untuk tester, dan
pedoman penyelenggaraan dan pen-skoran skala.
48
2. The Wechsler Intelligence Scale for Children – Revised (WISC-R).
Revisi skala WISC yang dinamai WISC-R diterbitkan tahun 1974 dan
dimaksudkan untuk mengukur inteligensi anak-anak usia 6 sampai
dengan 16 tahun. WISC-R terdiri atas 12 subtes yang dua diantaranya
digunakan hanya sebagai persediaan apabila diperlukan penggantian
subtes.
3. The Wechsler Adult Intelligence Scale-Revised (WAIS-R).
Sebagaimana versi WAIS lainnya, WAIS-R terdiri dari skala verbal dan
skala performansi. Kedua skala tersebut masing-masing menghasilkan
IQ verbal dan IQ performansi, sedangkan kombinasi keduanya menjadi
dasar untuk perhitungan IQ deviasi sebagai IQ keseluruhan.
4. The Standard Progressive Matrices (SPM)
SPM merupakan salah satu contoh bentuk skala inteligensi yang dapat
diberikan secara individual ataupun kelompok. Skala ini dirancang oleh
J.C. Raven dan terbit pada tahun 1960. SPM merupakan tes yang bersifat
nonverbal, artinya materi soal-soalnya diberikan tidak dalam bentuk
tulisan ataupun bacaan melainkan dalam bentuk gambar-gambar. Raven
sendiri menyebut skala ini sebagai tes kejelasan pengamatan dan
kejelasan berfikir, bukan tes inteligensi umum.
49
5. The Kaufman Assessment Battery for Children (K-ABC).
Kumpulan tes ini menghasilkan empat skor global: Pemrosesan
Berurutan, Simultan, Komposit, dan Pemrosesan Mental. Pemrosesan
simultan dipresentasikan oleh tujuh subtes sementara pemrosesan
berurutan dipresentasikan oleh tiga subtes. K-ABC dimaksudkan untuk
mengakomodasi kebutuhan pengetesan bagi kelompok-kelompok
khusus, seperti anak-anak cacat dan anak-anak dari kelompok minoritas
kultural dan bahasa, dan untuk membantu diagnosis ketidakmampuan
belajar.
2.4. Konstruksi Tes
Dua istilah yang paling sering diterapkan pada pengembangan tes psikologi
adalah validitas (validity) dan keandalan (reliability).
2.4.1. Validitas
Validitas suatu tes menerangkan apa yang diukur oleh tes dan sejauh mana tes
tersebut mengukur apa yang hendak diukur (Anastasi, 1997). Penentuan validitas
tes berkenaan dengan hubungan antara kinerja dengan fakta-fakta lain yang
independen dan dapat diamati. Prosedur pengujian sebuah alat ukur selalu
membutuhkan satu hal atau fakta lain di luar alat ukur yang disebut dengan
kriteria. Kriteria harus bersifat independen, dapat diukur, konsisten, relevan, dan
bebas dari bias. Pengukuran validitas yang menghasilkan koefisien validitas
berarti mencari korelasi antara skor tes dengan kriteria.
50
Dalam bidang psikologi konsep validitas memiliki tiga konteks yaitu
(Suryabratha, 2005):
1. Validitas Penelitian (Content Validity)
Konsep validitas penelitian ini bermakna adanya kesesuaian hasil-hasil
simpulan sebuah penelitian dengan kondisi senyatanya dilapangan.
Terkait dengan konsep validitas penelitian ini, Suryabrata (2005)
menyatakan bahwa validitas penelitian mengandung dua sisi, yaitu:
a) Validitas Internal
Konsep validitas internal membahas mengenai kesesuaian antara
hasil penelitian dengan kondisi sebenarnya. Adapun untuk
mengungkap validitas internal ini dapat dilakukan dengan
menggunakan instrumen yang disusun berdasarkan pada tahapan
penulisan instrumen yang baik.
b) Validitas Eksternal
Konsep validitas eksternal membahas kesesuaian antara
generalisasi hasil penelitian dengan keadaan yang sebenarnya.
Untuk mendapatkan hasil validitas eksternal dapat dilakukan
dengan memilih sampel yang tepat dari populasi yang diteliti.
51
2. Validitas Item (Item Validity)
Item merupakan bagian dari sebuah instrumen, sehingga dalam
memaknai validitas item ini tidak terlalu menyamakannya dengan
validitas seluruh item atau validitas instrumen. Validitas item merujuk
pada tingkat kesesuaian item (butir soal) dengan perangkat soal-soal
lainnya, secara sederhana dapat pula dinyatakan bahwa yang dimaksud
validitas item adalah tingkat korelasi antara skor butir soal (item)
dengan skor total (seluruh).
3. Validitas Alat Ukur (Test Validity)
Konsep validitas alat ukur merujuk pada makna kemampuan sebuah
alat ukur (instrumen/ skala/ tes) untuk mengukur apa yang seharusnya
diukur. Cara yang dapat digunakan untuk menghitung koefisien
validitas alat ukur adalah sebagai berikut (Kerlinger, 2006):
a) Validitas Isi (Content-Related Validation)
Validitas isi merupakan seperangkat item-item tes yang
menunjukkan sejauhmana isi dari item-item tersebut memang
mengukur apa yang hendak diukur. Dengan menggunakan
spesifikasi tes yang telah dikembangkan (telah ada), kemudian
dilakukan analisis logis untuk menetapkan apakah item-item yang
telah dikembangkan tersebut mengukur apa yang hendak diukur.
52
b) Validitas Konstruk (Construct Corelated Validation)
Validitas konstruk mengukur mengenai sejauh mana skor-skor
hasil pengukuran dengan instrumen itu sesuai atau tidak dengan
teori yang mendasari penyusunan alat ukur tersebut. Validasi
konstruk ini merupakan proses yang kompleks, yang memerlukan
analisis logis dan dukungan data empiris.
Teknik-teknik yang dapat digunakan untuk mengukur validitas
konstruk adalah sebagai berikut (Suryabratha, 2005):
1) Analisis faktor
Dasar pemikiran penerapan analisis faktor untuk validasi
adalah bahwa walaupun perilaku manusia itu sangat banyak
ragamnya, namun perilaku yang sangat beragam itu didasari
oleh sejumlah faktor yang terbatas. Dengan analisis faktor
dapat ditemukan faktor-faktor yang mendasari perilaku yang
beragam tersebut. Tinggi-rendahnya validitas konstruk suatu
alat tes tercermin pada sejauh mana muatan faktor yang
diperoleh dari analisis faktor ini berkontribusi pada teori yang
mendasarinya.
53
2) Korelasi dengan tes lain
Korelasi antara tes baru dengan tes lama yang serupa
menunjukkan bahwa tes baru juga mengukur konstruk yang
kurang lebih sama. Korelasi dengan tes lain dilakukan untuk
menunjukkan bahwa tes baru bebas dari pengaruh faktor-faktor
yang tidak relevan.
3) IRT (Item Responses Theory)
Analisis item-item secara modern yaitu penelaahan item
dengan menggunakan Item Respons Theory (IRT) atau teori
jawaban terhadap item. Teori ini merupakan suatu teori yang
menggunakan fungsi matematika untuk menghubungkan antara
peluang menjawab benar suatu skala dengan kemampuan testee
(Umar, 2008). Teori ini menjelaskan tentang apa yang terjadi
jika seseorang menempuh satu butir item. Menurut teori ini,
jika satu butir item dengan tingkat kesukaran tertentu ditempuh
oleh ribuan orang yang kemampuannya berbeda-beda, maka
orang yang kemampuannya lebih tinggi akan memiliki peluang
yang lebih besar untuk menjawab benar pada item tersebut
dibandingkan dengan orang yang kemampuannya lebih rendah.
Atau dengan kata lain, makin tinggi kemampuan seseorang
makin tinggi pula peluangnya untuk menjawab benar pada satu
butir item, dan sebaliknya.
54
c) Validitas Berdasarkan Kriteria (Criterion-Related Validation)
Prosedur validitas kriteria menunjukkan efektivitas dari suatu tes
dalam meramalkan kinerja seseorang pada aktivitas tertentu.
Kriteria pengukuran untuk validitas skor tes dapat diperoleh dalam
waktu yang bersamaan dengan skor tes atau dalam interval waktu
tertentu.
Dalam pelaksanaan penelitian ketiga konteks tersebut harus terpenuhi,
agar penelitian yang dilakukan dapat memberikan data yang sebagaimana
diharapkan, sehingga proses pengambilan kesimpulannya juga memiliki nilai
jaminan tinggi.
Penelitian ini menggunakan uji validitas konstruk dengan teknik analisis
faktor. Dengan melakukan uji pengukuran melalui analisis faktor maka dapat
ditemukan variabel yang diukur oleh item-item dan juga dapat dilihat bagaimana
hubungan antar item, item dengan faktor, serta korelasi antar variabel.
2.4.2. Reliabilitas
Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama
ketika mereka diuji-ulang dengan tes yang sama pada kesempatan berbeda atau
dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau
dalam kondisi pengujian yang berbeda (Anastasi, 1997).
55
Pendekatan yang dipergunakan untuk menghitung reliabilitas pengukuran
ada bermacam-macam. Berikut ini dikemukakan beberapa cara untuk menghitung
reliabilitas yang dikemukakan oleh Anastasi (1997):
1. Metode Pengujian Kembali (Test-Retest Methods)
Pengukuran terhadap sekelompok subyek dilakukan dua kali dengan
satu alat pengukur. Reliabilitas dihitung dengan cara mengkorelasikan
hasil pengukuran pertama dengan hasil pengukuran kedua. Metode ini
mengandung time sampling error, yaitu kesalahan yang timbul karena
pengukuran pada waktu yang berbeda.
2. Reliabilitas Alat Ukur Alternatif (Alternate-Form Reliability)
Pendekatan tes dilakukan dengan jalan menggunakan dua macam alat
pengukur dimana dua alat pengukur tersebut harus sama. Untuk
mengestimasi reliabilitasnya, maka dua alat ukur tersebut diberikan
pada sekelompok subyek secara berturut-turut. Kemudian hasil
pengukuran dari alat pengukuran yang pertama dicari korelasinya
dengan hasil pengukuran dari alat pengukuran kedua.
3. Metode Konsistensi Internal (Internal Consistency Methods)
Pengestimasian kadar reliabilitas dengan prosedur konsistensi internal
dilakukan dengan memfokuskan diri pada unsur-unsur internal
instrument, yaitu butir-butir pertanyaan atau item. Jadi, estimasi itu
56
cukup dilakukan berdasarkan kekuatan tiap-tiap butir pertanyaan yang
secara keseluruhan membentuk N item, dan tidak membutuhkan data-
data dari hasil pengukuran yang lain sebagaimana kedua prosedur
reliabilitas di atas.
2.5. Gambaran Umum GATB
General Aptitude Test Batteray (GATB) diciptakan oleh Charles E. Odell dari
United States Employes Services dan mulai dikembangkan pada tahun 1940.
General Aptitude The Battery (GATB) telah digunakan sejak 1947 oleh State
Employment service yang bergabung dengan United States Employment Service
untuk memenuhi kebutuhan tes yang bisa dipergunakan untuk berbagai tujuan
(multipurposes). Sejak masa itu, GATB telah dimasukkan kedalam program
penelitian yang berkelanjutan untuk menjadikannya tes yang akurat terhadap
kesuksesan pada berbagai pekerjaan yang berbeda. Karena dasar risetnya yang
luas, GATB dikenal sebagai sejumlah tes bakat ganda yang akurat dalam
pengadaanya untuk digunakan dalam bimbingan jurusan dan menilai kecerdasan
umum dari seseorang.
Kemampuan yang diukur oleh General Aptitude Test Battery adalah
sebagai berikut (Lynne Bezanson dalam Jigau, 2007):
57
a. Aptitude G (General Learning Ability)
Kemampuan untuk menangkap atau untuk memahami pelajaran dan
prinsip-prinsip yang mendasari suatu hal. Kemampuan untuk menalar
dan menyatakan pendapat atau mengambil keputusan.
b. Aptitude V (Verbal Aptitude)
Kemampuan untuk memahami arti kata-kata dan ide-ide,
menghubungkannya dan menggunakannya dengan baik. Kemampuan
untuk memahami bahasa, memahami hubungan diantara kata-kata, dan
memahami arti kalimat dan paragraph secara jelas dalam setiap bentuk
lisan maupun tulisan.
c. Aptitude N (Numerical Aptitude)
Kemampuan untuk mengoperasikan aritmatik seperti menjumlahkan,
mengalikan, mengurangi, dan membagi dengan cepat dan tepat.
d. Aptitude S (Spatial Aptitude)
Kemampuan untuk menggambarkan secara visual bentuk-bentuk
geometric dan memahami objek-objek dua dimensi serta
menggambarkan objek-objek dalam tiga dimensi. Kemampuan untuk
mengenali relasi ruang yang diakibatkan bergeraknya objek-objek dalam
ruang.
58
e. Aptitude P (Form Perception)
Kemampuan untuk melihat seluk beluk atau detail yang penting dalam
objek-objek, gambar-gambar, atau grafik. Kemampuan untuk melihat
persamaan dan perbedaan dalam corak dan bentuk bilangan, panjang dan
lebar atau garis-garis.
f. Aptitude Q (Clerical Perception)
Kemampuan untuk melihat seluk-beluk atau detail dari bahan-bahan
tertulis atau yang disajikan dalam bentuk table-tabel. Kemampuan untuk
melihat perbedaan salinan, untuk mengoreksi kata-kata dan angka-angka
dalam cetak coba, dan untuk menghindari penyimpangan dalam
mengerjakan aritmatik yang sederhana.
g. Aptitude K (Motor Coordination)
Kemampuan untuk mengkoordinasikan mata dan tangan atau jari dengan
cepat dan akurat dalam membuat gerakan yang tepat dengan
kecepatan. Kemampuan untuk membuat respon gerakan akurat dan
cepat.
h. Aptitude F (Finger Dexterity)
Kemapuan untuk menggerakkan jari tangan dan menangani objek-objek
yang kecil dengan cepat dan akurat
59
i. Aptitude M (Dexterity Manual)
Kemampuan untuk menggerakkan tangan dengan mudah dan
terampil. Kemampuan untuk bekerja dengan tangan dalam menempatkan
dan mengubah gerakan.
Dewasa ini GATB meliputi 12 tes; 4 tes membutuhkan alat sederhana,
sementara 8 tes yang lainnya hanya menggunakan kertas dan pensil. Keseluruhan
kumpulan tes dapat diselenggarakan dalam waktu kurang lebih 2,5 jam (Anastasi,
1997). Adapun subtes yang terdapat dalam GATB adalah sebagai berikut:
a. Bagian 1 - Membandingkan nama-nama (name comparison). 6 menit,
skor maksimal 150.
Tes ini berisi dua kolom nama. Peserta tes memeriksa masing-masing
kolom, dan menunjukkan apakah nama-nama yang ada sama atau
berbeda. Subtest ini mengukur persepsi klerikal (clerical perception)
b. Bagian 2 - Perhitungan (computation). 6 menit, skor maksimal 50.
Tes ini berisi suatu latihan bilangan aritmatik yang membutuhkan
penjumlahan, pengurangan, perkalian, atau pembagian seluruh
bilangan. Subtes ini mengukur kemampuan numerik (numerical
aptitude)
c. Bagian 3 - Tiga dimensi ruang (three dimensional space). 6 menit, skor
maksimal 40.
60
Tes ini berisi empat rangkaian gambar dengan objek tiga dimensi.
Gambar perangsang disajikan sebagai suatu potongan-potongan metal
yang datar dimana salah satu berputar-putar (berguling-guling) atau
keduanya. Garis-garis mengindikasikan dimana salah satu dari empat
gambar dengan objek tiga dimensi bisa dibentuk dari gambar
perangsang. Subtes ini mengukur kemampuan pengetahuan umum dan
kemampuan ruang (general learning ability & spatial aptitude).
d. Bagian 4 – Perbendaharaan kata (Vocabulary). 6 menit, skor maksimal
60.
Tes ini berisi empat set kata-kata. Peserta tes menunjukkan dua kata-
kata yang sama atau arti kata yang berlawanan. Subtes ini mengukur
kemampuan pengetahuan umum dan kemampuan verbal (general
learning ability & verbal aptitude).
e. Bagian 5 – Mencocokkan alat-alat (tool matching). 5 menit, skor
maksimal 49.
Tes ini berisi serangkaian latihan yang mengandung suatu gambar
perangsang dan empat gambar hitam-putih alat-alat perlengkapan
bengkel yang sederhana. Peserta tes menunjukkan mana dari empat
gambar hitam-putih itu yang sama seperti pada gambar perangsang.
Variasi yang ada hanya mendistribusikan masing-masing gambar hitam
putih. Subtes ini mengukur persepsi bentuk (form perception).
61
f. Bagian 6 – Penalaran aritmatik (arithmetic reason). 7 menit, skor
maksimal 25.
Tes ini berisi masalah angka aritmatik yang diekspresikan secara verbal.
Subtes ini mengukur kemampuan pengetahuan umum dan kemampuan
numerik (general learning ability & numerical aptitude).
g. Bagian 7 – Mencocokkan bentuk (form matching). 6 menit, skor
maksimal 60.
Tes ini berisi dua kelompok dengan berbagai cara dibentuk gambar
yang berpotongan. Peserta tes menunjukkan gambar mana dalam
kelompok kedua-duanya persis (tepat) sama ukurannya dan bentuk
potongannya seperti masing-masing gambar dalam kelompok
perangsang pertama. Subtes ini mengukur persepsi bentuk (form
perception).
h. Bagian 8 – Membuat tanda-tanda (mark making). 60 menit, skor
maksimal 130.
Tes ini berisi suatu rangkaian hasil perkalian (kuadrat), dimana peserta
tes membuat tiga tanda pensil, dikerjakan secepat-cepatnya. Tanda-
tanda yang dibuat dengan garis-garis pendek, dua garis vertical dan tiga
garis horizontal dibawahnya. Subtes ini mengukur koordinasi gerak
(motor coordination).
62
i. Bagian 9 – Menempatkan (place). 3 percobaan, masing-masing waktu
15 menit, skor maksimal 144.
Peralatan yang digunakan untuk tes ini berisi 10 bagian papan pasak
empat persegi panjang yang dibagi dalam dua bagian, masing-masing
berisi 48 lubang. Pelaksanaan ini dilakukan dalam tiga waktu, dimana
peserta tes harus bekerja dengan cepat untuk memindahkan sebanyak
mungkin pasak selama waktu yang disediakan. Tiga percobaan
diberikan untuk dilakukan. Subtes ini mengukur kecekatan tangan
(manual dexterity).
j. Bagian 10 – Memutar (turn). 3 percobaan, masing-masing 30 menit,
skor maksimal 144.
Tes ini menggunakan perlatan. Peralatan yang digambarkan dalam
bagian 9 juga digunakan dalam tes ini. Peserta tes bekerja dengan cepat
untuk memutar dan menempatkan kembali secepat mungkin pasak yang
berbentuk silinder selama waktu yang disediakan. Tiga percobaan
diberikan untuk dilakukan. Subtes ini mengukur kecekatan tangan
(manual dexterity).
k. Bagian 11 – Memasang (assemble). 90 detik, skor maksimal 50.
Tes ini menggunakan peralatan. Peralatan yang digunakan untuk tes ini
dan bagian 12 yang berisi papan persegi panjang kecil (papan kecekatan
tangan) berisi 50 lubang, dan menyediakan paku penyumbat kecil dari
63
metal dan cincin penutup (ring). Peserta tes bekerja dengan cepat dalam
memindahkan dan menempatkan setepat mungkin. Subtes ini mengukur
kecekatan tangan (manual dexterity).
l. Bagian 12 – Membongkar (disassemble). 60 detik, skor maksimal 50.
Tes ini mempergunakan peralatan yang sama seperti digambarkan pada
bagian 11. Peserta tes memindahkan paku sumbat kecil dari metal
memasang suatu lubang dalam papan bagian bawah, mendorong ring
pada dasar papan, meletakkan ring pada tangkai dengan satu tangan dan
paku sumbat ke dalam lubang yang cocok pada papan bagian atas
dengan tangan yang lainnya. Peserta tes bekerja dengan cepat untuk
memindahkan dan menempelkan paku sumbat dan ring setepat mungkin
selama waktu yang disediakan. Subtes ini mengukur kecekatan tangan
(manual dexterity).
Kumpulan tes ini menghasilkan skor pada sembilan faktor dan pada tiga
ukuran komposit utama yang ditarik dari faktor-faktor tersebut, keseluruhannya
didaftarkan pada tabel 2.1 berikut ini (Anastasi & Urbina, 1997):
64
Tabel 2.1
Faktor-Faktor dan Komposit General Aptitude Test Battery (GATB)
Faktor-faktor
G: Kemampuan Belajar S: Kemampuan Ruang K: Koordinasi Motor
Umum
V: Kemampuan Verbal P: Persepsi Bentuk F: Kelincahan Jari-jari
N: Kemampuan Numerik Q: Persepsi Klerikal M: Kelincahan Manual
Komposit
Kognitif = G + V + N Perseptual = S + P + Q Psikomotorik = K + F + M
Sumber: Anastasi & Urbina, 1997, hal.498
2.6. Kerangka Berpikir
Dari latar belakang dan teori yang sudah ada, maka dapat disimpulkan dalam
suatu kerangka sebagai berikut:
65
Diagram 2.2
Kerangka Berpikir Berdasarkan Subtes
Diagram 2.3
Kerangka Berpikir Berdasarkan Sebaran Item
66
2.7. Hipotesis
Sesuai dengan kerangka berpikir yang telah digambarkan, maka dapat disusun
hipotesis sebagai berikut:
1. Bahwa seluruh item dalam empat subtes GATB yang dijadikan penelitian
mengukur konstruk yang dimaksud. Konstruk yang dimaksud adalah
computation, three dimensional space, vocabulary, dan three dimensional
space. Dimana setiap item dalam masing-masing subtes adalah fit (sesuai)
dengan model satu faktor, yang berarti semua item pada subtes mengukur
hanya satu kemampuan yang didefinisikan pada subtes tersebut, dan
setiap item dalam masing-masing subtes menghasilkan informasi secara
signifikan tentang kemampuan pada subtes tersebut.
2. Bahwa empat subtes GATB adalah fit (sesuai) dengan model satu faktor,
yaitu semua subtes mengukur satu faktor umum yang dalam hal ini adalah
“inteligensi”
67
BAB III
METODE PENELITIAN
Hal yang hendak diteliti dalam penelitian ini adalah tingkat validitas alat tes
GATB. Selanjutnya untuk menjawab pertanyaan penelitian ini ada beberapa hal
yang dirancang oleh peneliti, diantaranya Subjek Penelitian, Instrumen Penelitian,
Metode Analisis Data, dan Prosedur Penelitian.
3.1. Subjek Penelitian
Penelitian ini hendak menguji validitas dari alat tes GATB. Untuk menguji
validitas tersebut digunakan pendekatan uji validitas konstruk yang akan
menentukan apakah setiap subtes dalam GATB mengukur komponen yang dapat
mengukur general intelligence. Dalam penelitian ini peneliti menggunakan data
mentah yang tersedia di Divisi Asesmen SDM PPM Manajemen. Data yang
digunakan merupakan hasil dari rekruitmen karyawan PT Semen Tonasa yang
menjalani tes di Jakarta. Pelaksanaan tes dilakukan pada tahun 2009 dan ditempuh
oleh 3257 orang. Karakteristik dari para peserta tes pada data yang tersedia ini
adalah sebagai berikut:
a. Umur 22-32 tahun
b. Tingkat pendidikan minimal D3
68
3.2. Instrumen Penelitian
Dalam penelitian ini, GATB dijadikan short form dengan empat subtes yang
memiliki jumlah item sebanyak 175, dikarenakan keempat subtes tersebut
mengukur kognisi atau inteligensi dari seseorang dan dari hasil penilaian tes
tersebut dapat menghasilkan skor IQ seseorang. Keempat subtes tersebut adalah:
1. Subtes kemampuan numerik (computation). 6 menit, skor maksimal 50.
Tes ini berisi suatu latihan bilangan aritmatik yang membutuhkan
penjumlahan, pengurangan, perkalian, atau pembagian seluruh bilangan.
Subtes ini mengukur kemampuan numerical (numerical aptitude)
Contoh Soal:
1) Kurang (-) A. 2
9 B. 3
4 C. 5
D. 9
E. Selain di atas
2. Subtes tiga dimensi ruang (three dimensional space). 6 menit, skor
maksimal 40.
Tes ini berisi empat rangkaian gambar dengan objek tiga dimensi.
Gambar perangsang disajikan sebagai suatu potongan-potongan metal
yang datar dimana salah satu berputar-putar (berguling-guling) atau
keduanya. Garis-garis mengindikasikan dimana salah satu dari empat
gambar dengan objek tiga dimensi bisa dibentuk dari gambar
69
perangsang. Subtes ini mengukur kemampuan pengetahuan umum dan
kemampuan ruang (general learning ability & spatial aptitude).
Contoh Soal:
3. Subtest kemampuan verbal (Vocabulary). 6 menit, skor maksimal 60.
Tes ini berisi empat set kata-kata. Peserta tes menunjukkan dua kata-
kata yang sama atau arti kata yang berlawanan. Subtes ini mengukur
kemampuan pengetahuan umum dan kemampuan verbal (general
learning ability & verbal ability).
Contoh Soal:
1) A. Besar B. Luas C. Kering D. Lambat
4. Subtes penalaran aritmatik (arithmetic reason). 7 menit, skor maksimal
25.
Tes ini berisi masalah angka aritmatik yang diekspresikan secara verbal.
Subtes ini mengukur kemampuan pengetahuan umum dan kemampuan
numerical (general learning ability & numerical aptitude).
70
Contoh Soal:
1) Satu bagian pekerjaan dapat diselesaikan A. 8

dalam waktu setengah jam. B. 10
Berapa bagian pekerjaan yang dapat C. 16
diselesaikan dalam waktu 8 jam? D. 24
E. Selain di atas
Subjek penelitian diminta untuk mengerjakan item pertanyaan sesuai
dengan waktu yang telah disediakan. Jawaban diberikan oleh subjek dengan
memilih 4 pilihan jawaban yang telah disediakan dimana diantara keempat
tersebut terdapat satu jawaban yang benar. Khusus untuk subtes vocabulary dalam
satu item pertanyaan terdapat dua jawaban yang benar dan saling berkaitan. Untuk
penskoran, apabila subjek menjawab dengan benar maka akan mendapatkan nilai
1 dan mendapatkan nilai 0 apabila menjawab dengan salah.
3.3. Metode Analisis Data
Metode analisis yang digunakan dalam penelitian ini adalah metode analisis
faktor. Pada dasarnya terdapat dua jenis pandangan mengenai analisis faktor,
yaitu: Exploratory Factor Analysis (EFA) dan Confirmatory Factor Analysis
(CFA). Analisis faktor pada awalnya dikemukakan oleh Spearman (1940) yang
pada saat ini dikenal dengan Exploratory Factor Analysis (EFA). Dalam EFA,
peneliti tidak memiliki ekspektasi tertentu mengenai jumlah atau sifat faktor yang
mendasari konstruk. Metode analisis faktor yang lebih modern adalah
Confirmatory Factor Analysis (CFA). Dalam CFA, peneliti harus memiliki
gambaran yang spesifik mengenai (a) jumlah faktor, (b) variabel yang
71
mencerminkan suatu faktor, dan (c) faktor-faktor yang saling berkolerasi
(Thompson, 2004).
Dalam rangka penelitian mengenai studi validitas konstruk General
Aptitude Test Battery (GATB) maka penulis menggunakan metode analisis faktor
Confirmatory Factor Analysis (CFA) dengan program lisrel 8.70. Alasan penulis
menggunakan CFA sebagai metode dalam penelitian karena dengan menggunakan
CFA maka setiap dimensi dapat diuji satu persatu. Validitas dari masing-masing
item juga dapat diuji dan digambarkan dalam matriks korelasi CFA.
Confirmatory Factor Analysis (CFA) adalah model teori-pengujian yang
bertentangan dengan metode teori yang menghasilkan faktor seperti eksploratori.
Dalam Confirmatory Factor Analysis (CFA), penelitian dimulai dengan membuat
hipotesis sebelum analisis. Model, atau hipotesis dengan spesifik menentukan
variabel mana yang akan berkolerasi dengan faktor dan faktor mana yang
berkolerasi. Hipotesis ini didasarkan pada teori yang kuat atau landasan empiris.
Tujuan dari CFA adalah (Umar, 2011) :
1. Untuk menguji hipotesis tentang satu atau lebih faktor serta saling
keterkaitan antara faktor tersebut sesuai model teori yang ditetapkan.
2. Untuk menguji validitas dari setiap indikator yang digunakan untuk
mengukur faktor atau konstruk tersebut.
CFA sering digunakan dalam proses pengembangan skala untuk
memeriksa struktur laten dari suatu alat tes (Brown, 2006). Dalam konteks ini,
72
CFA digunakan untuk verifikasi jumlah dimensi yang mendasari instrumen
(faktor) dan pola hubungan item dengan faktor (factor loading). Hasil CFA dapat
memberikan bukti kuat dari validitas convergent dan diskriminan dari sebuah
konstruk teoritis. Validitas konvergen diindikasikan oleh bukti bahwa alat tes
dengan konstruk yang sama dan secara teori juga mengukur hal yang sama, maka
korelasi antar tes tersebut tinggi. Sedangkan validitas diskriminan diindikasikan
oleh hasil yang menunjukkan bahwa indikator secara teoritis berbeda konstruksi
tidak saling berkorelasi tinggi..
Alat tes dikatakan bias ketika beberapa item tidak mengukur konstruk
yang mendasarinya jika dibandingkan dengan seluruh kelompok. Adapun logika
dasar dari CFA adalah sebagai berikut (Umar, 2011):
1. Sebuah konsep atau trait berupa kemampuan yang didefinisikan
secara operasional sehingga dapat disusun pertanyaan atau
pernyataan untuk mengukurnya. Kemampuan ini disebut faktor.
Sedangkan pengukuran terhadap faktor ini dilakukan melalui analisis
terhadap respon (jawaban) atas item-itemnya.
2. Setiap item diteorikan hanya mengukur atau memberi informasi
tentang satu faktor tertentu saja. Artinya baik item maupun subtes
bersifat unidimensional.
3. Berdasarkan teori yang dipaparkan di atas, dapat disusun
sehimpunan persamaan matematis. Persamaan tersebut dapat
digunakan untuk memprediksi (dengan menggunakan data yang
73
tersedia) matriks korelasi antar item yang seharusnya akan diperoleh
jika teori tersebut (unidimensional) benar. Matriks korelasi ini
dinamakan sigma (Σ). Kemudian matriks ini akan dibandingkan
dengan matriks korelasi yang diperoleh secara empiris dari data
(disebut matriks S). Jika teori tersebut benar (unidimensional), maka
seharusnya tidak ada perbedaan yang signifikan antara elemen
matriks Σ dengan elemen matriks S. Secara matematis dapat
dituliskan: S-Σ=0
4. Pernyataan matematik inilah yang dijadikan hipotesis nihil yang
akan dianalisis menggunakan CFA. Dalam hal ini dilakukan uji
signifikasi dengan Chi Square. Jika Chi Square yang dihasilkan tidak
signifikan (nilai p>0,05), maka dapat disimpulkan, bahwa hipotesis
nihil yang menyatakan: “tidak ada perbedaan antara matriks S dan
Σ” tidak ditolak. Artinya teori yang menyatakan bahwa ke 20 item
tersebut semuanya mengukur hal yang sama, yaitu kemampuan
berpikir analogis, dapat diterima kebenarannya (didukung oleh data).
Sebaliknya, jika nilai Chi Square yang diperoleh signifikan, maka
hipotesis nihil S- Σ =0 ditolak. Artinya teori tersebut tidak didukung
data (ditolak).
5. Jika teori diterima (model fit), langkah selanjutnya, adalah menguji
hipotesis tentang signifikan tidaknya masing-masing item dalam
mengukur apa yang hendak diukur (kemampuan berpikir analogis).
Uji hipotesis ini dilakukan dengan t-test. Jika nilai t signifikan,
74
berarti item yang bersangkutan signifikan dalam mengukur apa yang
hendak diukur. Dengan cara seperti ini, dapat dinilai butir item yang
mana yang valid dan yang tidak valid di dalam konteks validitas
konstruk. Dengan kata lain, analisis faktor konfirmatori dalam hal ini
adalah pengujian terhadap hipotesis nihil (H0): S - Σ = 0. Artinya,
tidak ada perbedaan antara matriks korelasi yang diharapkan oleh
teori dengan matriks korelasi yang diperoleh dari hasil observasi.
6. Persamaan matematis pada butir tiga di atas adalah persamaan
regresi untuk setiap butir soal dalam hubungannya dengan faktor
yang diukur yaitu:
X1= λ1F+δ1
Dimana:
X1 = Skor yang diperoleh pada item no.1
F = Konstruk yang hendak diukur (faktor)
λ1 = Koefisien Regresi untuk item no. 1 dalam mengukur F,
disebut juga sebagai ”koefisien muatan faktor”
δ1 = Segala hal yang mempengaruhi Varians X1 (selain F),
disebut juga ”kesalahan pengukuran”
Untuk menguji validitas alat ukur yang digunakan dalam penelitian ini,
peneliti menggunakan Confirmatory Factor Analysis (CFA) dengan bantuan
75
software Lisrel 8.70 (Joreskog dan Sorbom, 2006). Adapun langkah-langkah yang
dilakukan untuk mendapatkan kriteria hasil CFA yang baik adalah (Umar, 2011):
1. Dilakukan uji CFA dengan model satu faktor dan dilihat nilai Chi-
Square yang dihasilkan. Jika nilai Chi-Square tidak signifikan (p >
0.05) berarti semua item hanya mengukur satu faktor saja. Namun
jika nilai Chi-Square signifikan (p < 0.05), maka perlu dilakukan
modifikasi terhadap model pengukuran yang diuji sesuai langkah
kedua berikut ini.
2. Jika nilai Chi-Square signifikan (p < 0.05), maka dilakukan
modifikasi model pengukuran dengan cara membebaskan parameter
berupa korelasi kesalahan pengukuran. Ini terjadi ketika suatu item
selain mengukur konstruk yang ingin diukur, item tersebut juga
mengukur hal yang lain (mengukur lebih dari satu konstruk /
multidimensional). Jika setelah beberapa kesalahan pengukuran
dibebaskan untuk saling berkorelasi dan akhirnya diperoleh model
yang fit, maka model terakhir inilah yang akan digunakan pada
langkah selanjutnya.
3. Jika telah diperoleh model yang fit, maka dilakukan analisis item
dengan melihat apakah muatan faktor item tersebut signifikan dan
mempunyai koefisien positif. Melihat signifikan tidaknya item
tersebut mengukur faktornya, dengan cara melihat t-value koefisien
muatan faktor item. Jika t > 1.96 maka item tersebut signifikan dan
tidak akan di drop, begitu pun sebaliknya.
76
4. Setelah itu dilihat apakah ada item yang muatan faktornya negatif.
Dalam hal ini, jika ada pernyataan negatif, maka ketika dilakukan
skoring terhadap item, arah skoringnya dirubah menjadi positif. Jika
setelah diubah arah skoringnya masih terdapat item bermuatan faktor
negatif, maka item tersebut akan di drop.
5. Apabila kesalahan pengukurannya berkorelasi terlalu banyak dengan
kesalahan pengukuran pada item lain, maka item seperti ini pun
dapat di drop karena bersifat multidimensi yang sangat kompleks.
6. Jika dilakukan CFA dengan model satu faktor tidak diperoleh model
yang fit, maka dapat dilakukan analisis dengan menggunakan model
dua faktor dan mengulang tahap dua sampai lima hingga didapatkan
model yang paling fit.
Dalam GATB, ada empat faktor yang diteorikan untuk diukur. Oleh sebab
itu, dalam penelitian ini dilakukan empat kali uji validitas konstruk (untuk setiap
subtes) yang masing-masing terdiri dari dua jenis analisis statistik, yaitu:
1. Menguji teori yang menyatakan bahwa semua item pada satu
subtes bersifat unidimensional (mengukur apa yang hendak diukur)
2. Menguji tingkat signifikansi setiap butir soal dalam mengukur apa
yang hendak diukur.
Selanjutnya, dalam GATB juga diteorikan bahwa keempat faktor (subtes)
tersebut adalah mengukur satu hal (dimensi) yang sama yaitu kognitif (general
intelligence). Hanya saja, disini berkenaan dengan hubungan antara subtes dan
77
general intelligence. Artinya, dapat dilakukan analisis faktor konfirmatori seperti
yang dilakukan pada masing-masing subtes, tetapi yang dijadikan datanya disini
adalah skor subtes, sedangkan faktornya adalah general intelligence. Namun
demikian, peneliti akan melakukan kedua jenis analisis faktor tersebut secara
simultan (untuk subtes dan general intelligence ).
Dengan kata lain, diteorikan bahwa item-item mengukur faktor tingkat
satu (subtes) dan selanjutnya faktor-faktor tersebut (subtes) mengukur faktor
tingkat dua yang lebih umum yaitu general intelligence. Analisis faktor
konfirmatori secara simultan (sekaligus seperti ini) disebut second order
confirmatory factor analysis. Dalam hal ini, subtes adalah faktor tingkat (orde) ke
satu dan general intelligence adalah faktor tingkat (orde) kedua.
3.4. Prosedur Penelitian
Penelitian ini dilaksanakan melalui beberapa tahapan, yaitu: prosedur penelitian
melalui data sekunder pada tes masuk calon karyawan PT Semen Tonasa di PPM
yang jumlahnya 3257 orang pada tahun 2009 di Jakarta. Sebelum memproses
data, diadakan pengamatan terbatas dengan cara mewawancarai Divisi Asesmen
SDM PPM Manajemen perihal kegiatan asesmen dan rekruitmen serta
mengobservasi kegiatan asesmen yang dilakukan oleh mereka. Studi awal ini
bertujuan untuk memperjelas permasalahan sebagai langkah awal dalam
penelitian, dengan ini dapat diketahui:
78
1. Perumusan masalah.
2. Studi kepustakaan guna mendapatkan gambaran dan landasan
teoritis yang tepat mengenai variabel penelitian.
3. Surat izin melakukan penelitian kepada pihak fakultas Psikologi
dan meminta izin melakukan penelitian pada Divisi Asesmen
SDM PPM Manajemen.
4. Pengujian terhadap data mentah yang sudah ada.
79
BAB IV
HASIL PENELITIAN
Sejalan dengan judul penelitian, uji validitas konstruk akan dilakukan per subtes
untuk mengukur mengenai sejauh mana skor-skor hasil pengukuran item dengan
instrumen sesuai atau tidak dengan teori yang mendasari penyusunan alat ukur
tersebut. Pengujian validitas konstruk dilakukan melalui dua tahap:
1. Menguji hipotesis tentang model teori yang mengatakan bahwa item pada
masing-masing subtes mengukur satu faktor saja. Secara teknis, yang diuji
adalah tentang ada tidaknya perbedaan yang signifikan antara matriks
korelasi yang diharapkan atau diprediksi oleh teori dengan yang diperoleh
dari data.
2. Menguji hipotesis apakah setiap butir item itu memberikan informasi yang
signifikan mengenai aspek yang hendak diukur.
Kedua tahapan ini dilakukan dengan menggunakan teknik Confirmatory
Factor Analysis (CFA). Berikut ini dipaparkan hasil penelitian baik pada tingkat
subtes maupun pada tingkat general intelligence:
4.1. Validitas Konstruk Tingkat Subtes
4.1.1. Validitas Konstruk Subtes Computation
Hasil perhitungan awal untuk subtes computation dengan model satu faktor
(unidimensional) tidak fit, karena didapatkan Chi - Square = 1557.36, df = 1175,
P-value = 0.00000 RMSEA = 0.010. Setelah dilakukanlah modifikasi terhadap
80
model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap
item saling berkorelasi satu dengan lainnya, maka didapatkanlah model fit dengan
P>0,05 (tidak signifikan). Dengan demikian model dengan hanya satu faktor dapat
diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu
computation. Namun karena pada model ini ada beberapa item yang kesalahannya
saling berkolerasi, dapat disimpulkan bahwa beberapa item tersebut sebenarnya
bersifat multidimensional.
Pada awalnya df berjumlah 1175, namun setelah mencapai model fit, df
tersisa menjadi 1152. Ini berarti dalam perhitungan awal terdapat 1175-1152 = 23
korelasi yang dibebaskan. Sesuai dengan teori yang telah dikemukakan
sebelumnya, apabila ada item yang kesalahan pengukurannya saling berkolerasi
maka item tersebut bersifat multidimensional. Artinya, selain mengukur apa yang
hendak diukur oleh subtes yang bersangkutan, ada hal yang lain yang diukur oleh
item tersebut. Semakin banyak kesalahan pada sebuah item saling berkolerasi
dengan kesalahan pengukuran pada item lainnya, maka rendah atau tidak ideal
kualitas item tersebut.
Dari 50 item yang mengukur subtes computation, terdapat 22 item yang
tidak signifikan, karena nilai t lebih kecil dari 1, 96 (absolute) dan bernilai negatif.
Kedua puluh dua item inilah yang harus di-drop, yaitu item nomor 4, 5, 6, 7, 8, 9,
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, dan 25.
Untuk mendapatkan hasil dengan item yang benar-benar murni, maka
dilakukan analisis ulang setelah seluruh item yang tidak signifikan dan bernilai
81
negatif dibuang. Hasil yang diperoleh untuk perhitungan kedua pada subtes
computation dengan model satu faktor (unidimensional) dan item negatif yang
sudah di-drop adalah tidak fit, didapatkan Chi Square = 515.28, df = 350, P-value
= 0.00000 RMSEA = 0.012. Kemudian dilakukan modifikasi kembali terhadap
item saling berkolerasi satu dengan lainnya, maka didapatkanlah model fit seperti
pada gambar 4.1 berikut ini:
82
Gambar 4.1
Analisis Faktor Konfirmatorik untuk Subtes Computation
Terlihat dari gambar 4.1, bahwa nilai Chi Square menghasilkan p > 0,05
(tidak signifikan). Dengan demikian, model dengan hanya satu faktor dapat
83
computation. Pada model ini, terdapat 12 pasang korelasi antar item (tabel 4.1)
yaitu item 3 yang berkolerasi dengan item 35, 40, 41, 43, 45, dan 49. Item 27
yang berkolerasi dengan item 26. Item 28 berkolerasi dengan item 26 dan 27. Item
30 berkolerasi dengan item 28, item 47 yang berkolerasi dengan item 39 dan item
48 yang berkolerasi dengan item 47.
Tabel 4.1
Matriks korelasi antar kesalahan pengukuran butir item pada

Computation
Item 1 2 3 26 27 28 29 30 31 32 33 34 35 36
1 1
2 1
3 1
26 1
27 0.70 1
28 0.58 0.53 1
29 1
30 0.53 1
31 1
32 1
33 1
34 1
35 -0.62 1
36 1
37
38
39
40 -0.65
41 -0.56
42
43 -0.59
44
45 -0.72
46
47
48
49 -0.57
50
84
Tabel 4.1

Computation (Lanjutan)
Item 37 38 39 40 41 42 43 44 45 46 47 48 49 50
37 1
38 1
39 1
40 1
41 1
42 1
43 1
44 1
45 1
46 1
47 -1.04 1
48 -0.94 1
49 1
50 1
Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan
Selanjutnya kualitas item dapat dilihat dari signifikan atau tidaknya item
tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal ini,
yang diuji adalah hipotesis nihil dari muatan faktor. Pengujiannya dilakukan
dengan melihat nilai t bagi setiap koefisien muatan faktor seperti pada tabel 4.2
berikut ini:
85
Tabel 4.2
Muatan Faktor Item GATB subtes Computation
Item Koefisien Standar Error T- Value Signifikan

1 0.58 0.08 7.20 V
2 0.44 0.08 5.41 V
3 0.71 0.08 7.91 V
26 0.27 0.08 3.31 V
27 0.26 0.08 3.27 V
28 0.47 0.08 5.75 V
29 0.42 0.08 5.25 V
30 0.43 0.08 5.29 V
31 0.49 0.08 6.14 V
32 0.52 0.08 6.44 V
33 0.59 0.08 7.37 V
34 0.50 0.08 6.19 V
35 0.64 0.08 7.72 V
36 0.70 0.08 8.73 V
37 0.68 0.08 8.47 V
38 0.69 0.08 8.57 V
39 0.73 0.08 8.98 V
40 0.70 0.08 8.51 V
41 0.74 0.08 9.03 V
42 0.78 0.08 9.75 V
43 0.80 0.08 9.67 V
44 0.70 0.08 8.72 V
45 0.65 0.08 7.90 V
46 0.76 0.08 9.40 V
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan
86
Tabel 4.2
Muatan Faktor Item GATB subtes Computation (Lanjutan)
Item Koefisien Standar Error T-Value Signifikan

47 0.65 0.08 7.89 V
48 0.67 0.08 8.23 V
49 0.70 0.08 8.46 V
50 0.72 0.08 8.94 V
Dari 28 item yang mengukur subtes computation, semua item dinyatakan
signifikan karena nilai t lebih besar dari 1, 96 (absolute) dan bernilai positif. Item
yang paling baik sesuai urutannya: 42, 43, 46, 41, 39, 50, 36, 44, 38, 40, 37, 49,
48, 3, 45, 47, 35, 33, 1, 32, 34, 31, 28, 2, 30, 29, 26, dan 27. Oleh karena itu,
model satu faktor yang diteorikan dalam subtes ini dapat diterima, bahwa setiap
item dalam subtes ini bersifat unidimensional dengan hanya mengukur
computation saja.
4.1.2. Validitas Konstruk Subtes Three Dimensional Space
Hasil perhitungan awal yang diperoleh untuk subtes three dimensional space
dengan model satu faktor (unidimensional) tidak fit, didapatkan Chi Square =
71620.74, df = 740, P-value = 0.00000 RMSEA = 0.172. Setelah dilakukan
modifikasi terhadap model dengan cara membebaskan atau memperbolehkan
kesalahan pada setiap item saling berkolerasi satu dengan lainnya, maka
didapatkanlah model fit dengan P>0,05 (tidak signifikan). Dengan demikian,
model dengan hanya satu faktor tidak dapat diterima, dikarenakan pada model ini
87
terdapat banyak item yang kesalahannya saling berkolerasi sehingga item tersebut
bersifat multidimensional pada dirinya masing-masing, yang berarti seluruh item
selain mengukur three dimensional space juga mengukur hal yang lain.
Pada awalnya didapatkan df dengan jumlah 740, namun setelah mencapai
model fit, df tersisa menjadi 250. Ini berarti pada perhitungan awal terdapat 740-
250= 490 korelasi yang dibebaskan. Sesuai dengan teori yang telah dikemukakan
kualitas item tersebut. Pada subtes ini, semua item yang terdapat pada subtes three
dimensional space bersifat multidimensional.
Dari 40 item yang mengukur subtes three dimensional space, terdapat
tujuh item yang tidak signifikan, karena nilai t lebih kecil dari 1, 96 (absolute) dan
signifikan namun bernilai negatif . Ke tujuh item inilah yang harus di-drop, yaitu
item nomor 32, 34, 35, 36, 37, 38, dan 40.
Dikarenakan banyaknya korelasi antar item pada subtes three dimensional
space dan masih adanya item yang berkoefisien negatif sedangkan item dengan
koefisien negatif tidak diperbolehkan dalam sebuah tes kemampuan dan untuk
mendapatkan hasil dengan item yang benar-benar murni, maka akan dilakukan
88
analisis kembali dengan cara membuang semua item negatif dan item yang tidak
signifikan pada perhitungan.
Hasil yang diperoleh untuk perhitungan kedua pada subtes three
dimensional space dengan model satu faktor (unidimensional) dan item negatif
yang sudah di drop tidak fit, didapatkan Chi Square = 25586.12, df = 495, P-value
= 0.00000 RMSEA = 0.125. Kemudian dilakukan modifikasi kembali terhadap
89
Gambar 4.2
Analisis Faktor Konfirmatorik untuk Subtes Three Dimensional Space
diterima, namun masih terdapat banyak item yang saling berkorelasi dengan
kesalahan pengukuran pada item lainnya. Hal ini menandakan bahwa beberapa
item tersebut sebenarnya memang bersifat multidimensional. Pada awalnya df
90
berjumlah 495, namun setelah mencapai model fit, df yang tersisa hanya 214. Ini
berarti terdapat 495–214 =281 korelasi kesalahan yang dibebaskan. Kesalahan
pengukuran item-item yang saling berkolerasi disajikan pada tabel 4.3.
Tabel 4.3
Three Dimensional Space
Item 1 2 3 4 5 6 7 8 9 10 11
1 1
2 0.25 1
3 0.16 0.05 1
4 0.21 0.08 0.04 1
5 0.13 0.20 0.11 0.12 1
6 0.03 0.03 1
7 0.07 0.10 1
8 -0.04 -0.04 -0.07 1
9 -0.07 -0.03 0.05 1
10 0.03 -0.08 -0.04 1
11 0.06 0.04 0.08 -0.04 0.08 1
12 0.07 0.04 -0.10 -0.07 -0.04 -0.04
13 0.04 -0.05 0.05 -0.07
14 -0.02 -0.04 -0.05 -0.05 -0.06 -0.05
15 0.09 -0.04 -0.05 0.14 0.07 -0.08 -0.03
16 -0.04 0.05 -0.07
17 0.05 0.04 -0.04 0.03 -0.06 -0.05 -0.05 -0.05 -0.07
18 -0.08 0.04 0.06
19 -0.11 0.05
20 -0.03 -0.08 0.03 0.03
21 -0.05 -0.05 -0.06 -0.05 -0.06
22 -0.03 0.05 -0.06 -0.03 0.00
23 0.04 -0.07
24 0.04 -0.05 -0.04 -0.01 0.06
25 -0.05 0.07
26 0.04 0.11 0.03 -0.03 0.07
27 -0.05 0.07 0.06 0.08 0.05 0.08 0.04
28 -0.05 0.03 0.05 -0.03 0.04 0.07 -0.03
29 0.04 -0.05 -0.07 -0.04 -0.03
30 0.02 -0.06 -0.08 -0.08 0.01
31 -0.04 0.06 -0.07 0.07 -0.05
33 0.08 0.07 -0.04 -0.02 0.03 -0.13
39 -0.03 -0.12 -0.07 0.04 0.12 -0.03 -0.08
91
Tabel 4.3
Three Dimensional Space (Lanjutan)
Item 12 13 14 15 16 17 18 19 20 21 22
12 1
13 -0.04 1
14 -0.06 1
15 1
16 0.03 0.07 1
17 0.02 -0.05 1
18 -0.04 0.07 1
19 -0.02 0.11 1
20 0.04 -0.04 0.09 0.17 1
21 0.04 0.06 0.06 0.04 1
22 -0.03 -0.05 0.06 0.15 0.16 1
23 0.03 -0.04 0.12 0.13 0.30
24 0.06 0.03 0.04 0.07 0.14 0.16 0.32
25 -0.05 -0.06 -0.05 0.10 0.12 0.21
26 -0.04 -0.05 0.11 0.28
27 -0.07 -0.04 0.07 0.09 0.14
28 -0.04 -0.07 -0.04 0.14 0.09 0.22
29 -0.04 -0.05 0.11 0.21
30 -0.12 0.06 -0.05 -0.09 -0.06 -0.09 0.07
31 -0.05 0.03 -0.06 -0.13 -0.04 0.06 0.08
33 -0.09 0.05 -0.03 -0.06 -0.04 0.04 0.06
39 -0.01 -0.06 -0.05 -0.05 -0.04 -0.10 0.16
92
Tabel 4.3
Space Perception (lanjutan)
Item 23 24 25 26 27 28 29 30 31 33 39
23 1
24 0.38 1
25 0.44 0.36 1
26 0.25 0.28 0.34 1
27 0.24 0.23 0.31 0.37 1
28 0.30 0.23 0.44 0.36 0.42 1
29 0.10 0.20 0.21 0.27 0.28 0.48 1
30 0.14 0.14 0.23 0.25 0.27 0.44 0.35 1
31 0.13 0.21 0.14 0.26 0.28 0.36 0.29 0.50 1
33 0.23 0.12 0.27 0.15 0.28 0.47 0.31 0.47 0.46 1
39 0.03 0.11 0.06 0.18 0.15 0.26 0.25 0.24 0.31 0.44 1
berikut ini:
93
Tabel 4.4
Muatan Faktor Item GATB subtes Three Dimensional Space

1 0.37 0.02 19.84 V
2 0.48 0.02 27.39 V
3 0.62 0.02 34.72 V
4 0.55 0.02 30.72 V
5 0.59 0.02 33.93 V
6 0.22 0.02 11.35 V
7 0.55 0.02 30.86 V
8 0.59 0.02 34.28 V
9 0.15 0.02 7.97 V
10 0.52 0.02 27.83 V
11 0.49 0.02 27.72 V
12 0.70 0.02 41.70 V
13 0.31 0.02 16.72 V
14 0.62 0.02 36.72 V
15 0.56 0.02 31.83 V
16 0.48 0.02 26.57 V
17 0.53 0.02 28.27 V
18 0.36 0.02 19.77 V
19 0.60 0.02 35.32 V
20 0.51 0.02 28.66 V
21 0.51 0.02 28.92 V
22 0.18 0.02 9.48 V
23 0.45 0.02 25.16 V
24 0.29 0.02 15.28 V
25 0.33 0.02 18.05 V
Keterangan: V= signifikan (t-values > 1,96) X = Tidak signifikan
94
Tabel 4.4
Muatan Faktor Item GATB subtes Three Dimensional Space (Lanjutan)

26 0.38 0.02 20.64 V
27 0.23 0.02 11.94 V
28 0.11 0.02 5.69 V
29 0.10 0.02 5.18 V
30 0.24 0.02 12.28 V
31 0.11 0.02 5.93 V
33 0.29 0.02 15.13 V
39 0.14 0.02 7.29 V
Dari 33 item yang mengukur subtes three dimensional space, semua item
dinyatakan signifikan karena nilai t lebih besar dari 1, 96 (absolute) dan semua
item dinyatakan bernilai positif. Item yang paling baik sesuai urutannya: 12, 14,
19, 3, 8, 5, 15, 7, 4, 2, 20, 17, 10, 11, 2, 16, 23, 26, 1, 18, 25, 13, 24, 33, 30, 27, 6,
22, 9, 39, 31, 28, dan 29.
Setelah melakukan analisis untuk kedua kalinya dengan membuang item
negatif dan item tidak signifikan ternyata tidak menghasilkan banyak perubahan.
Setiap item dalam subtes three dimensional space masih menunjukkan kolerasi
antar item dan menunjukkan multidimensionalitas. Atas hal tersebut maka model
satu faktor yang diteorikan dalam subtes ini sebenarnya tidak dapat diterima
karena ternyata setiap item dalam subtes ini tidak hanya mengukur satu faktor
three dimensional space saja.
95
Melihat hasil yang seperti ini maka dilakukanlah analisis faktor dengan
menggunakan program SPSS 17. SPSS digunakan untuk memberikan perkiraan
mengenai berapa banyak faktor yang diukur oleh subtes three dimensional space
dengan batas eugen value 1. Melalui SPSS diperkirakan bahwa subtes three
dimensional space sebenarnya mengukur delapan faktor (Tabel 4.5). Namun
perhitungan ini hanya sebagai perkiraan saja, diperlukan penelitian lebih lanjut
mengenai berapa sebenarnya jumlah faktor yang diukur oleh subtes three
dimensional space dan penjelasan mengenai faktor-faktor tersebut tidak
dilakukan dalam penelitian ini.
Penjelasan mengenai kedelapan faktor dapat dilihat pada tabel 4.5
mengenai Rotated Component Matrix.
96
Tabel 4.5
Rotated Component Matrix pada Subtes Three Dimensional Space
a
Rotated Component Matrix
Component
1 2 3 4 5 6 7 8
V1 .037 .002 .031 .699 -.171- -.051- .054 -.106-
V2 .111 .033 .070 .458 .233 .216 .189 .058
V3 .256 .068 .026 .489 .116 .023 -.034- .103
V4 .045 .117 -.068- .585 .119 .014 -.047- .002
V5 .183 .045 .050 .428 .356 .241 .078 .042
V6 -.029- .035 -.031- .087 -.120- .764 -.222- -.047-
V7 .203 .115 .029 .111 .265 .252 .245 .329
V8 .485 .044 .116 .089 .255 -.080- -.052- .059
V9 .058 .062 -.056- .000 -.050- -.026- -.012- .839
V10 .308 .119 -.051- .121 .389 .062 -.325- -.137-
V11 .186 .048 -.032- .130 .522 -.052- -.017- -.036-
V12 .480 .075 .022 .278 .250 -.003- .023 .014
V13 .193 -.011- .085 .120 -.075- -.045- .659 .029
V14 .479 .022 .034 .146 .195 .142 .004 -.009-
V15 .265 .038 .066 .133 .275 .402 .202 .104
V16 .355 -.014- .073 -.016- .109 .352 .217 .023
V17 .434 .049 -.046- .248 -.067- .036 .173 .100
V18 .488 .038 -.054- -.011- -.107- .038 -.012- .147
V19 .602 .131 .010 .044 .076 .133 .028 -.030-
V20 .561 .244 .012 .054 .038 -.108- .045 -.102-
V21 .375 .321 .033 -.022- -.055- .279 .177 .004
V22 .189 .510 -.035- .092 -.342- -.028- -.099- -.081-
V23 .198 .628 .048 .109 .100 .009 .066 .000
V24 .167 .582 .050 .016 -.110- .121 .065 -.124-
V25 .055 .660 .103 .026 .181 -.059- .042 .054
V26 .047 .538 .191 .103 .018 .116 -.070- .193
V27 -.055- .432 .293 .009 .251 .002 -.075- .111
V28 -.033- .447 .462 -.002- .037 -.182- -.031- .079
V29 .061 .184 .441 .001 -.185- -.084- -.006- -.088-
V30 -.026- .107 .645 -.008- .058 .060 .143 -.036-
V31 -.018- .021 .586 -.040- .012 .091 -.043- -.064-
V32 .056 .081 .656 .072 .054 .001 .010 .092
V33 .168 -.118- .365 .064 -.262- -.009- -.442- .250
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 15 iterations.
97
Tabel 4.6
Sebaran Item GATB subtes Three Dimensional Space
Faktor Item
1 8, 12, 14, 16, 17, 18, 19, 20, 21
2 22, 23, 24, 25, 26, 27
3 28,29, 30, 31, 32, 33

4 1, 2, 3, 4, 5
5 10, 11
6 6, 15
7 13
8 7, 9
Dari tabel 4.6 terlihat bahwa faktor 1 terukur oleh item 8, 12, 14, 16, 17,
18, 19, 20, 21. Faktor 2 terukur oleh faktor 22, 23, 24, 25, 26, 27. Faktor 3 terukur
oleh faktor 28,29, 30, 31, 32, 33. Faktor 4 terukur oleh faktor 1, 2, 3, 4, 5. Faktor
5 terukur oleh faktor 10 dan 11. Faktor 6 terukur oleh faktor 6 dan 15. Faktor 7
terukur oleh faktor 13 saja serta faktor 8 yang terukur oleh faktor 7 dan 9.
4.1.3. Validitas Konstruk Subtes Vocabulary
Hasil perhitungan awal yang diperoleh untuk subtes Vocabulary dengan model
satu faktor (unidimensional) tidak fit, didapatkan Chi Square = 2163.52, df =
1710, P-value = 0.00000 RMSEA = 0.009. Setelah dilakukan modifikasi terhadap
item saling berkolerasi satu dengan lainnya, maka didapatkan model fit dengan
P>0,05 (tidak signifikan). Dengan demikian model dengan hanya satu faktor dapat
98
vocabulary. Namun karena pada model ini ada beberapa item yang kesalahannya
saling berkolerasi, dapat disimpulkan bahwa beberapa item tersebut sebenarnya
bersifat multidimensional pada dirinya masing-masing.
tersisa menjadi 1691. Ini berarti dalam perhitungan awal terdapat 1710-1691 = 19
korelasi yang dibebaskan. Sesuai dengan teori yang telah dikemukakan
kualitas item tersebut.
Selanjutnya, kualitas item juga dapat dilihat dari signifikan atau tidaknya
item tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal
ini, yang diuji adalah hipotesis nihil dari muatan faktor. Dari hasil tersebut,
ternyata didapatkan hanya ada satu item yang baik serta bernilai positif dari 60
item yang ada dalam subtes vocabulary yaitu item nomor 9 dan ke 59 item sisa
yang ada bernilai negatif.
Dikarenakan hasil dari analisis awal yang hanya menghasilkan satu item
dengan nilai yang positif, diprediksi subtes ini memiliki kesalahan dalam
penyusunan skalanya, maka dilakukanlah pengecekan kembali terhadap kunci
jawaban. Setelah melakukan pengecekan kunci jawaban dan tidak terjadi
99
kesalahan di dalamnya, 1 item yang bernilai positif tersebut dinyatakan
berlawanan arah dan dilakukanlah analisis kembali dengan cara membuang item
yang bernilai positif yaitu item nomor 9.
Hasil yang diperoleh untuk subtes vocabulary dengan model satu faktor
(unidimensional) tidak fit, didapatkan Chi Square = 1804.71, df = 1652, P-value =
0.00479 RMSEA = 0.005. Kemudian dilakukan modifikasi kembali terhadap
100
Gambar 4.3
Analisis Faktor Konfirmatorik untuk subtes Vocabulary
diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal, yaitu
vocabulary. Pada model ini, hanya terdapat 2 pasang item yang saling berkolerasi
101
yaitu antara item nomor 49 dengan 18 dan item nomor 56 dengan 24. Dengan nilai
koefisien korelasi untuk item 48 dengan 17 adalah -1.16 dan item nomor 56
dengan 24 adalah -1.15 dengan koefisien yang tidak signifikan. Dapat
disimpulkan bahwa dalam model ini semua item bersifat unidimensional yaitu
hanya mengukur vocabulary saja.
berikut ini:
Tabel 4.7
Muatan Faktor Item GATB subtes Vocabulary

1 0.19 0.07 2.66 V
2 0.24 0.07 3.33 V
3 0.28 0.07 3.95 V
4 0.17 0.07 2.40 V
5 0.21 0.07 3.00 V
6 0.19 0.07 2.63 V
7 0.22 0.07 3.14 V
8 0.27 0.07 3.71 V
10 0.17 0.07 2.33 V
11 0.17 0.07 2.43 V
12 0.12 0.07 1.75 X
102
Tabel 4.7
Muatan Faktor Item GATB subtes Vocabulary (Lanjutan)
Item Koefisien Standar Error T-value Signifikan

13 0.06 0.07 0.85 X
14 0.12 0.07 1.65 X
15 0.24 0.07 3.29 V
16 0.03 0.07 0.41 X
17 0.33 0.07 4.56 V
18 0.19 0.07 2.58 V
19 0.24 0.07 3.39 V
20 0.14 0.07 1.95 X
21 0.27 0.07 3.76 V
22 0.28 0.07 3.91 V
23 0.36 0.07 5.01 V
24 0.26 0.07 3.64 V
25 0.51 0.07 7.11 V
26 0.29 0.07 4.08 V
27 0.34 0.07 4.81 V
28 0.46 0.07 6.41 V
29 0.62 0.07 8.67 V
30 0.60 0.07 8.42 V
31 0.62 0.07 8.71 V
32 0.73 0.07 10.34 V
33 0.66 0.07 9.33 V
34 0.58 0.07 8.09 V
35 0.67 0.07 9.41 V
36 0.88 0.07 12.41 V
37 0.87 0.07 12.26 V
103
Tabel 4.7
Muatan Faktor Item GATB subtes Vocabulary (Lanjutan)

38 0.74 0.07 10.42 V
39 0.80 0.07 11.36 V
40 0.89 0.07 12.65 V
41 0.85 0.07 12.09 V
42 0.73 0.07 10.25 V
43 0.88 0.07 12.49 V
44 0.87 0.07 12.27 V
45 0.88 0.07 12.48 V
46 0.85 0.07 12.01 V
47 0.84 0.07 11.84 V
48 0.83 0.07 11.76 V
49 0.87 0.07 12.36 V
50 0.84 0.07 11.96 V
51 0.77 0.07 10.91 V
52 0.78 0.07 11.00 V
53 0.70 0.07 9.93 V
54 0.74 0.07 10.47 V
55 0.70 0.07 9.93 V
56 0.66 0.07 9.31 V
57 0.70 0.07 9.80 V
58 0.62 0.07 8.72 V
59 0.61 0.07 8.53 V
60 0.64 0.07 8.96 V
104
Dari 59 item yang mengukur subtes vocabulary, ternyata ada lima item
yang tidak signifikan, karena nilai t lebih kecil dari 1, 96 (absolute). Ke lima item
inilah yang harus di drop, yaitu item 12, 13, 14, 16, dan 20. Dari hasil tersebut
semua item dinyatakan bernilai positif, item yang paling baik sesuai dengan
urutannya adalah item nomor 40, 43, 45, 36, 49, 37, 44, 41, 46, 50, 47, 48, 39, 52,
51, 54, 38, 32, 42, 53, 55, 57, 35, 33, 56, 60, 58, 31, 29, 59, 30, 34, 25, 28, 23, 27,
17, 26, 3, 22, 21, 8, 24, 19, 2, 15, 7, 5, 1, 6, 18, 11, 4, dan 10. Oleh karena itu,
model satu faktor yang diteorikan dalam subtes ini dapat diterima, bahwa setiap
item dalam subtes ini bersifat unidimensional dengan hanya mengukur vocabulary
saja.
4.1.4. Validitas Konstruk Subtes Arithmetic Reasoning (AR)
Hasil perhitungan awal yang diperoleh untuk subtes arithmetic reasoning (AR)
dengan model satu faktor (unidimensional) tidak fit, didapatkan Chi Square =
29884.13, df = 275, P-value = 0.00000 RMSEA = 0.182. Kemudian setelah
dilakukanlah modifikasi terhadap model dengan cara membebaskan atau
memperbolehkan kesalahan pada setiap item saling berkolerasi satu dengan
lainnya, maka diperoleh model fit dengan Chi – Square = 57.98 , df = 44 , P-value
= 0.07693 , RMSEA = 0.10. Nilai Chi – Square menghasilkan P-value > 0.05
(tidak signifikan). Namun, model dengan hanya satu faktor tidak dapat diterima,
dikarenakan pada model ini terdapat banyak item yang kesalahannya saling
berkolerasi sehingga item tersebut bersifat multidimensional, yang berarti seluruh
item selain mengukur arithmetic reasoning juga mengukur hal yang lain.
105
Karena GATB adalah alat tes kemampuan, maka tidak boleh ada item
yang berkoefisien negatif karena negatif itu menandakan semakin salah jawaban
pada item tersebut semakin tinggi kemampuan arithmetic reasoningnya. Oleh
sebab itu, bila terjadi seperti ini, maka item tersebut tidak dapat dipakai sehingga
harus didrop atau direvisi. Setelah itu dilakukan analisis kedua setelah item
negatif dikeluarkan. Hasil run pertama menunjukkan bahwa item nomor 5
berkorelasi negatif, sehingga harus dibuang dan tidak diikutkan dalam analisis
kedua.
Dari hasil analisis kedua untuk subtes arithmetic reasoning dengan model
satu faktor (unidimensional) dan item negatif yang sudah di-drop tidak fit,
didapatkan Chi Square = 6100.55, df = 252, P-value = 0.00000 RMSEA = 0.084.
Kemudian dilakukan modifikasi kembali terhadap model dengan cara
membebaskan atau memperbolehkan kesalahan pada setiap item saling
berkolerasi satu dengan lainnya.
Pada model dengan item negatif yang sudah di-drop ternyata masih
terdapat item yang berkorelasi dengan kesalahan pengukuran pada item lainnya.
Hal ini menandakan bahwa beberapa item tersebut sebenarnya memang bersifat
multidimensional. Setelah melihat kualitas item dengan menguji hipotesis nihil
dari muatan faktor maka didapatkan bahwa dari 24 item yang mengukur subtes
arithmetic reasoning (AR), ternyata ada empat item yang tidak signifikan, karena
nilai t lebih kecil dari 1, 96 (absolute). Ke empat item inilah yang harus di drop,
106
yaitu item nomor 9, 16, 22, dan 23. Dari hasil tersebut semua item dinyatakan
bernilai positif.
Untuk mendapatkan hasil dengan item yang benar-benar murni, maka
dilakukan analisis kembali namun kali ini seluruh item yang tidak signifikan tidak
diikutsertakan atau dengan kata lain di-drop terlebih dahulu. Item yang tidak
diikutsertakan adalah item nomor 9, 16, 22, dan 23
Hasil yang diperoleh untuk analisis ketiga pada subtes arithmetic
reasoning dengan model satu faktor (unidimensional) dan item negatif yang sudah
di-drop tidak fit, didapatkan Chi Square = 4289.60, df=170, P-Value = 0.00000
RMSEA=0.086. Kemudian dilakukan modifikasi kembali terhadap model dengan
cara membebaskan atau memperbolehkan kesalahan pada setiap item saling
berkolerasi satu dengan lainnya, maka didapatkanlah model fit seperti pada
gambar 4.4 berikut ini.
107
Gambar 4.4
Analisis Faktor Konfirmatorik untuk Subtes Arithmetic Reasoning
Pada awalnya nilai Chi Square menghasilkan p > 0,05 (tidak signifikan). Dengan
demikian, model dengan hanya satu faktor dapat diterima. Namun, setelah model
dengan item negatif yang sudah di-drop ternyata hanya terdapat satu item yang
bersifat unidimensional yaitu item nomor 7 dan sisa item yang ada masih saling
berkolerasi dengan kesalahan pengukuran pada item lainnya, hal ini menandakan
108
bahwa beberapa item tersebut sebenarnya memang bersifat multidimensional
namun korelasi antar item nya telah banyak berkurang seiring dengan beberapa
item negatif dan tidak signifikan yang di drop.
yang tersisa hanya 95. Ini berarti terdapat 170-95 = 75 korelasi kesalahan yang
dibebaskan. Kesalahan pengukuran item-item yang saling berkolerasi disajikan
pada tabel 4.8.
Tabel 4.8
Arithmetic Reasoning
Item 1 2 3 4 6 7 8 10 11 12
1 1
2 0.13 1
3 0.09 1
4 1
6 0.19 0.15 0.19 0.12 1
7 -0.08 1
8 0.08 0.07 0.27 1
10 0.06 1
11 0.08 1
12 0.12 1
13 -0.08 -0.09 0.12
14 -0.07
15 0.08
17 0.07
18 0.00 -0.12 0.03
19 0.09
20 -0.08 0.07
21 -0.05 -0.09
24 -0.12 -0.08 -0.11
25 -0.09 -0.07 -0.19 -0.19 -1.08
109
Tabel 4.8
Arithmetic Reasoning (Lanjutan)
Item 13 14 15 17 18 19 20 21 24 25
13 1
14 0.15 1
15 0.26 0.21 1
17 0.13 0.14 0.24 1
18 0.12 0.11 0.40 1
19 0.10 0.13 0.20 0.47 0.54 1
20 0.09 0.12 0.37 0.29 0.59 1
21 0.09 0.10 0.30 0.36 0.57 0.59 1
24 0.13 0.09 0.13 0.36 0.25 0.33 0.41 1
25 0.25 0.15 0.28 0.07 0.27 0.53 0.42 0.57 1
berikut ini:
110
Tabel 4.9
Muatan Faktor Item GATB subtes Arithmetic Reasoning

1 0.28 0.03 8.71 V
2 0.50 0.03 15.39 V
3 0.49 0.03 14.57 V
4 0.57 0.03 16.65 V
6 0.35 0.03 9.31 V
7 0.59 0.03 18.59 V
8 0.48 0.03 14.38 V
10 0.52 0.03 16.08 V
11 0.53 0.03 16.37 V
12 0.41 0.03 12.98 V
13 0.50 0.03 15.27 V
14 0.18 0.03 5.17 V
15 0.36 0.03 10.96 V
17 0.31 0.03 9.16 V
18 0.37 0.03 10.81 V
19 0.25 0.03 7.54 V
20 0.18 0.03 5.45 V
21 0.27 0.03 8.14 V
24 0.17 0.03 4.75 V
25 0.19 0.03 5.21 V
Dari 20 item yang mengukur subtes arithmetic reasoning (AR), semua
item dinyatakan signifikan, karena nilai t lebih besar dari 1, 96 (absolute) dan juga
bernilai positif. Item yang paling baik sesuai dengan urutannya adalah item nomor
7, 4, 11, 10, 2, 13, 3, 8, 12, 15, 18, 6, 17, 1, 21, 19, 20, 25, 14, dan 24.
111
Setelah melakukan analisis untuk ketiga kalinya dengan membuang item
negatif dan item tidak signifikan ternyata tidak menghasilkan banyak perubahan.
Setiap item dalam subtes arithmetic reasoning masih menunjukkan kolerasi antar
item dan menunjukkan multidimensionalitas. Atas hal tersebut maka model satu
faktor yang diteorikan dalam subtes ini tidak dapat diterima karena ternyata setiap
item dalam subtes ini tidak hanya mengukur satu faktor arithmetic reasoning
saja.
Melihat hasil yang seperti ini maka dilakukanlah analisis faktor dengan
menggunakan program SPSS 17. SPSS digunakan untuk memberikan perkiraan
mengenai berapa banyak faktor yang diukur oleh subtes arithmetic reasoning
dengan batas eugen value 1. Melalui SPSS diperkirakan bahwa subtes arithmetic
reasoning sebenarnya mengukur lima faktor (Tabel 4.10). Namun perhitungan ini
hanya sebagai perkiraan saja, diperlukan penelitian lebih lanjut mengenai berapa
sebenarnya jumlah faktor yang diukur oleh subtes arithmetic reasoning dan
penjelasan mengenai faktor-faktor tersebut tidak dilakukan dalam penelitian ini.
Penjelasan mengenai kelima faktor dapat dilihat pada tabel 4.10 mengenai
Rotated Component Matrix.
112
Tabel 4.10
Rotated Component Matrix pada Subtes Arithmetic Reasoning
a
Rotated Component Matrix
Component
1 2 3 4 5
V1 -.104- .478 -.096- .150 .147
V2 .038 .471 .193 .035 .035
V3 .075 .537 .062 .052 -.076-
V4 .099 .403 .283 -.111- -.134-
V5 -.025- .667 .024 -.029- -.002-
V6 .083 .274 .389 .162 .014
V7 .001 .474 .261 .064 -.126-
V8 .069 .178 .545 -.055- -.020-
V9 .060 .103 .645 -.007- .087
V10 -.052- .004 .592 .205 .026
V11 .071 .065 .373 .545 -.022-
V12 .030 .127 -.232- .666 .088
V13 .140 .024 .223 .628 .014
V14 .548 -.044- .144 .303 -.078-
V15 .631 .008 .091 .104 -.092-
V16 .762 .005 .033 .082 .007
V17 .553 .056 -.047- -.076- .335
V18 .575 .069 -.027- -.087- .307
V19 .074 -.054- .100 -.020- .654
V20 .056 -.035- -.018- .112 .765
Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 7 iterations.
113
Tabel 4.11
Sebaran Item GATB subtes Arithmetic Reasoning
Faktor Item
1 14, 15, 16, 17, 18
2 1, 2, 3, 4, 5, 7
3 6, 8, 9, 10
4 11, 12, 13
5 19, 20
Dari tabel 4.10 terlihat bahwa faktor 1 terukur oleh item 14, 15, 16, 17, 18.
Faktor 2 terukur oleh faktor 1, 2, 3, 4, 5, 7. Faktor 3 terukur oleh faktor 6, 8, 9, 10.
Faktor 4 terukur oleh faktor 11, 12, 13 serta faktor 5 yang terukur oleh faktor 19
dan 20
4.2. Validitas Konstruk Seluruh Subtes GATB dalam Mengukur Satu
Konstruk Bersifat Umum (General Intelligence)
Langkah selanjutnya yang harus dilakukan setelah menganalisis faktor
konfirmatorik dari setiap subtes adalah melakukan analisis faktor konfirmatori
untuk kostruk umum yang hendak diteliti yaitu inteligensi. Dalam konteks ini,
matriks korelasi antar faktor (subtes) digunakan sebagai input. Namun apabila
menggunakan Lisrel, kedua tingkatan analisis faktor ini dapat dilakukan secara
simultan (satu kali analisis). Analisis seperti ini disebut juga dengan nama
“analisis faktor konfirmatorik orde kedua” (second order factor analysis). Dalam
hal ini item merupakan indikator dari masing-masing subtes (faktor tingkat satu)
114
dan pada saat yang sama subtes merupakan indikator dari faktor tingkat kedua
(inteligensi/general factor). Peneliti menggunakan metode ini, karena lebih efisien
(hanya satu kali analisis secara simultan) dan dari sudut statistik, analisis seperti
ini lebih terpercaya (Joreskog, dan Sorbom, 2006).
Hasil yang diperoleh untuk model dengan second order faktor analisis,
nilai Chi - Square = 5692.46, df = 8906, P-value = 1.00000 atau P>0,05 , dan
RMSEA = 0.000. Dapat disimpulkan bahwa model dengan dua tingkatan faktor
(second order CFA) fit dengan data. Artinya, teori yang mengatakan bahwa item-
item mengukur empat subtes dan keempat subtes mengukur inteligensi umum
dapat diterima. Hasilnya dapat dilihat pada tabel 4.12 dan gambar 4.5.
Tabel 4.12
Koefisien Muatan Faktor Untuk General Intelligence
Subtes Koefisien Standar T-Value Signifikan

Error
Computation 0.35 0.06 6.20 V
Three Dimensional 0.11 0.03 3.70 V
Space
Vocabulary 0.12 0.05 2.23 V
Arithmetic 0.01 0.07 0.17 X
Reasoning
115
Gambar 4.5
Koefisiein Muatan Faktor Untuk General Intelligence
Dari tabel dan gambar di atas ditemukan bahwa, subtes yang muatan
faktornya signifikan dalam mengukur inteligensi adalah computation, three
dimensional space dan vocabulary. Sedangkan yang tidak signifikan adalah
arithmetic reasoning. Berdasarkan hasil ini, terdapat kemungkinan bahwa
pengukuran terhadap inteligensi umum cukup dengan menggunakan subtes yang
signifikan saja, yaitu subtes computation, three dimensional space dan vocabulary
116
BAB V
KESIMPULAN, DISKUSI DAN SARAN
Dalam bab lima ini akan dipaparkan tentang kesimpulan, diskusi, dan saran
mengenai hasil dari penelitian.
5.1 Kesimpulan
Pada bagian ini, akan dipaparkan kesimpulan dari pengujian hipotesis yang telah
diuraikan pada bab empat. Hipotesis itu adalah:
1. Seluruh item dalam empat subtes GATB yang dijadikan penelitian
adalah fit (sesuai) dengan model satu faktor, yang berarti semua item
pada suatu subtes mengukur hanya satu kemampuan yang
didefinisikan pada subtes tersebut yaitu computation, three
dimensional space, vocabulary, dan arithmetic reasoning. Bahwa
setiap item dalam masing-masing subtes adalah secara signifikan
mengukur kemampuan pada subtes tersebut.
2. Empat subtes GATB adalah fit (sesuai) dengan model satu faktor,
yaitu semua subtes mengukur satu faktor umum yang dalam hal ini
adalah “Inteligensi”.
Kesimpulan mengenai jumlah df yang menjadi korelasi sebelum dan
sesudah dilakukannya modifikasi terhadap model dapat dilihat pada tabel 5.1.
117
Tabel 5.1
Analisis CFA Pada Setiap Subtes GATB
Subtes Chi Square Df P-Value RMSEA
515.28 350 0.00000 0.012

Computation
374.86 338 0.08157 0.006
Three Dimensional 25586.12 495 0.00000 0.125
Space 247.29 214 0.05887 0.007
1804.71 1652 0.00479 0.005

Vocabulary
1714.36 1650 0.13186 0.003
4289.60 170 0.00000 0.086

Arithmetic Reasoning
116.05 95 0.07105 0.008
Sedangkan kesimpulan mengenai hasil pengujian hipotesis 1 dipaparkan
dalam tabel 5.2 berikut ini:
118
119
Berdasarkan tabel 5.2 dapat dilihat bahwa hipotesis 1 diterima yang
artinya bahwa semua subtes dalam GATB fit (sesuai) dengan model satu faktor,
yaitu mengukur hanya satu kemampuan yang didefinisikan pada subtes tersebut.
Dari empat subtes dalam GATB terdapat dua subtes yang untuk mencapai model
fit hanya memerlukan modifikasi yang singkat, namun dua subtes lainnya untuk
mencapai model fit harus dilakukan beberapa kali modifikasi yang lebih
mendalam karena banyaknya item yang saling berkolerasi.
Terdapat dua subtes yang dalam mencapai model fit hanya memerlukan
modifikasi yang singkat karena memiliki item yang baik setelah item-item yang
tidak signifikan dan bernilai negatif dibuang. Subtes tersebut adalah computation
dan vocabulary, keduanya dianggap bernilai baik karena tidak memiliki korelasi
antar item yang terlalu banyak sehingga setiap item terbukti memang mengukur
konstruk yang dimaksud. Kedua subtes tersebut memiliki karakteristik yang baik
dikarenakan memiliki jenis item yang setara dan mengukur satu jenis kemampuan
saja sehingga mudah dipahami dalam pengerjaannya.
Subtes yang untuk mencapai model fit harus melakukan banyak
modifikasi adalah three dimensional space dan arithmetic reasoning. Jenis item
dalam subtes ini memiliki karakteristik yang tidak baik karena memiliki terlalu
banyak multidimensionalitas, dalam arithmetic reasoning hal ini dikarenakan
dalam setiap item selain mengukur kemampuan numerik namun juga memerlukan
kemampuan penalaran verbal. Item mengukur kemampuan numerik, namun
persoalan dalam setiap item dibalut dengan soal berbentuk cerita yang terstruktur.
120
Apabila subjek tidak mengerti perintah dalam setiap item pada subtes arithmetic
reasoning, maka subjek tidak akan mampu untuk menjawab persoalan.
Hasil pengujian hipotesis 2 melalui analisis faktor dua tingkat (second
order confirmatory factor analysis) menghasilkan pernyataan bahwa terdapat tiga
dari empat subtes GATB yang signifikan dalam mengukur inteligensi umum,
yaitu subtes computation, three dimensional space, dan vocabulary. Dalam
analisis faktor dua tingkat ini item-item yang berkoefisien negatif dan tidak
signifikan pada setiap subtes tidak digunakan atau di drop supaya menghasilkan
perhitungan yang baik.
Setelah melakukan analisis faktor terhadap empat subtes dalam GATB
yang mengukur inteligensi, menunjukkan bahwa alat tes GATB masih dapat dan
layak digunakan sebagai salah satu alat tes inteligensi namun perlu dilakukan
perbaikan dan pembaharuan terhadap item-item yang memiliki
multidimensionalitas yang terlalu banyak.
5.2 Diskusi
Melihat hasil analisis yang menyatakan bahwa terdapat subtes yang bersifat
multidimensional karena ternyata secara teoritis, tiga subtes dari empat subtes
yang diteliti dalam GATB memang mengukur lebih dari 1 faktor. Subtes yang
murni mengukur 1 faktor hanyalah computation yaitu mengukur kemampuan
numerik, sedangkan untuk subtes three dimensional space mengukur kemampuan
spatial dan general learning ability, subtes vocabulary selain mengukur
121
kemampuan verbal ternyata juga mengukur general learning ability dan subtes
arithmetic reasoning yang mengukur kemampuan numerik juga general learning
ability.
Dari hasil pengujian hipotesis 1 dengan menggunakan CFA menunjukkan
bahwa terdapat banyak korelasi antar measurement error pada setiap item di
subtes GATB. Hal ini menunjukkan bahwa banyak item dalam tes GATB yang
selain mengukur apa yang hendak diukur, ternyata juga mengukur hal yang lain
(multidimensional). Pada subtes computation terdapat 12 buah korelasi antar
kesalahan pengukuran pada satu item dengan kesalahan pengukuran pada item
lainnya dalam subtes tersebut. Selanjutnya pada subtes three dimensional space
terdapat 281 korelasi yang sejenis, pada subtes vocabulary terdapat 2 korelasi,
pada subtes arithmetic reasoning terdapat 75 korelasi. Jadi, kesimpulannya subtes
yang paling kompleks (multidimensional) adalah subtes three dimensional space,
dilanjutkan dengan arithmetic reasoning, computation dan yang memiliki
kesalahan korelasi paling sedikit adalah vocabulary.
Hal ini menunjukkan bahwa pada subtes yang itemnya valid (signifikan)
juga terdapat masalah multidimensionalitas dari item dalam subtes tersebut.
Beberapa hal yang mungkin menyebabkan multidimensional adalah:
1. Waktu pengerjaan yang diberikan untuk setiap subtes relatif singkat,
tidak sebanding dengan jumlah item dari setiap subtes yang cenderung
banyak sehingga sebagian besar subyek tidak dapat menyelesaikan
semua persoalan dalam setiap subtes.
122
2. Waktu pengerjaan untuk setiap subtes yang singkat menuntut subjek
untuk bekerja sesuai waktu yang ditentukan hal ini dapat
menyebabkan subjek menebak (guessing) jawaban dari setiap item
yang disajikan sehingga pelaksanaan tes yang mengacu pada norma-
norma tidak dapat berlaku.
3. Item yang diberikan terlalu mudah sehingga hampir setiap subyek
dapat menjawab dengan benar atau sebaliknya, item terlalu sulit
sehingga hampir setiap subyek menjawab salah.
4. Terdapat jenis item dalam subtes yang memerlukan penalaran dan
penafsiran lebih mendalam. Hal ini dapat dilihat dalam subtes three
dimensional space yang mengharuskan subjek untuk membayangkan
suatu bentuk peritmean kubus, balok maupun bentuk tiga dimensi
lainnya dan dalam subtes arithmetic reasoning yang mengharuskan
subjek untuk mengerjakan soal perhitungan namun harus terlebih
dahulu menalar soal cerita yang diberikan sehingga menyebabkan
banyak kekeliruan dalam menjawab item yang diberikan. Jenis Item
ini menyebabkan dengan mudahnya terjadi penafsiran ganda terhadap
apa yang ditanyakan.
5. Rentangan atau varians dari tingkat kesukaran soal antar satu subtes
dengan yang lainnya, sebaiknya jangan terlalu berbeda (homogenitas
varians dari kesukaran soal antar subtes). Artinya, dalam rangka
mengukur inteligensi sebaiknya semua subtes memiliki tingkat variasi
kesukaran soal yang relatif sama. Karena hal ini dapat berpengaruh
123
pada di dropnya item tertentu. Dari hasil indeks validitas item, terlihat
bahwa dari semua item, lebih dari setengahnya (77,14 % = 135 item)
dapat terus digunakan, walaupun akan lebih baik bila dilakukan revisi
terhadap pilihan jawaban. Sedangkan 22,86 % sisanya (40 item)
indeks validitas itemnya tergolong rendah sehingga tidak dapat terus
digunakan, dalam arti di drop atau perlu dilakukan revisi terhadap
item-item tersebut.
Penelitian mengenai perkembangan GATB pernah dituliskan oleh Steven
J. Mellon Jr pada tahun 1996 dalam jurnalnya yang berjudul Development of
General Aptitude Test Battery (GATB) Forms E and F. Jurnal ini bertujuan untuk
mengembangkan bentuk-bentuk alternatif dari bagian kognitif pada GATB.
Dalam jurnal dijelaskan bahwa bentuk kognitif mencakup tujuh subtes dalam
GATB yaitu arithmetic reasoning, vocabulary, three dimensional space,
computation, name comparation, tool matching, dan form matching. Secara
umum, sejumlah perubahan dilakukan untuk memperbaiki penampilan dan
menyederhanakan item tes itu sendiri. Sebagai contoh dari perbaikan item tes,
pada subtes three dimensional space, kualitas cetak dan resolusi ditingkatkan
melalui CorelDRAW untuk mengembangkan item.
5.3 Saran
Dalam penelitian ini, peneliti menyadari masih banyak terdapat kekurangan. Oleh
karena itu, peneliti memberi saran yang dapat digunakan untuk pengembangan
124
penelitian ke depannya. Saran tersebut berupa saran metodologis dan saran
praktis.
5.3.1 Saran Metodologis
1. Untuk penelitian selanjutnya, ada baiknya mempertimbangkan
variabel lainnya seperti perbedaan usia, jenis kelamin, latar belakang,
budaya dan hal penting lainnya yang dalam penelitian ini tidak
dimiliki datanya.
2. Untuk pengembangan uji validitas kedepannya, dapat menggunakan
seluruh subtes dalam GATB pada pengujian validitas konstruk.
Dengan menggunakan seluruh subtes dalam GATB maka akan
didapatkan kostruk mengenai bakat yang dimiliki seseorang, jadi
tidak terbatas hanya inteligensi saja.
3. Terdapat banyak item yang bersifat multidimensional. Hal ini dapat
disebabkan oleh kerangka berfikir teori GATB dimana dijelaskan
setiap subtes sebenarnya masih terdiri dari beberapa sub faktor, yang
seharusnya dapat diwujudkan dalam bentuk faktor tersendiri yang
berbeda tingkatan (analisis faktor tiga tingkat). Jadi, akan lebih baik,
bila analisis faktor dilakukan 3 tingkat (third order CFA). Namun
demikian, perlu dilakukan identifikasi terlebih dahulu untuk melihat
item yang mengukur sub faktor di dalam masing-masing subtes
tersebut.
125
5.3.2 Saran Praktis
1. Untuk penyedia layanan tes psikologi, sebaiknya mencari informasi
dan melakukan pengecekan terlebih dahulu sebelum memutuskan
untuk menggunakan suatu alat tes.
2. Selanjutnya, bagi institusi psikologi pengguna alat tes GATB, cukup
menggunakan 3 subtes saja dalam GATB yaitu computation, three
dimensional space, dan vocabulary untuk mengukur inteligensi.
Namun perlu ada penelitian lebih lanjut untuk membuktikan
mengenai skor inteligensi yang dihasilkan.
126
DAFTAR PUSTAKA
Aiken, Lewis. R. (1997). Psychological testing and assessment. Boston: Allyn

and bacon.
Anastasi, Anne. (1997). Psychological testing, seventh edition. New Jersey:

Prentice-Hall, Inc.
Azwar, Saifuddin. (2004). Reliabilitas dan validitas. Yogyakarta: Pustaka Pelajar.
Brown, T. A. (2006). Confirmatory factor analysis for applied research.

New york: The Guildford Press.
Buckingham, Marcus and Donald 0. Clifton. (2001). Now, discover your

strengths. New York: The Free Press.
Chaplin, JP. (2006). Kamus lengkap psikologi. Jakarta: PT Raja Grafindo Pustaka.
Coyle, Daniel. (2009). Talent code. New York: Bantam Dell.
Davis, Tony. (2009). Talent assessment. Jakarta: PPM
Djaali, H & Pudji Muljono. (2007). Pengukuran dalam bidang psikologi.

Jakarta: Gramedia Pustaka
Gardner, Howard. (1985). Frames of mind, the theory of multiple intelligences.

New York: Basic Book, Inc.
Greogry, Robert J. (2007). Psychological testing: History, principles, and

application 5th Edition. New Jersey: Pearson Education, Inc.
Jigau, Mihai. (2007). Career counselling, compendium of methods and

techniques. Bucharest: AFIR.
127
Jöreskog, K.G. & Sörbom, D. (2006). LISREL 8.70 for windows (computer
software). Lincolnwood, IL: Scientific Software International, Inc.
Kaplan, Robert M. & Dennis P. Saccuzzo. (2009). Psychological testing:

Principles, apllication & issues 7th edition. Belmont: Wadsworth
Kerlinger, F.N. (2006). Asas-asas penelitian behavioral. Yogyakarta: Gadjah

Mada University Press.
Loewenthal, Kate Miriam. (1996). An introduction to psychological test and

scales. London: UCL Press.
Munandar, Ashar Sunyoto. (2001). Psikologi industri dan organisasi. Jakarta:

Universitas Indonesia.
Murphy, Kevin R. (1994). Psychological testing: Principels and application.

London: Prentice-hall Int.
Thompson, Bruce. (2004). Explanatory and confirmatory factor analysis.

Washington DC: American Psychological Assosiation.
Sadli, Saparinah. (1991). Inteligensi bakat dan test IQ. Jakarta: Gaya Favorit Pres.
Shaleh, A.R & Wahab, M.A. (2004). Psikologi suatu pengantar, Jakarta:
Prenada Media.
Sukardi, Dewa Ketut. (2009). Analisis tes psikologi teori dan praktik. Jakarta:
Rineka Cipta.
Umar, Jahja. (2011). Personal Communication.
Van Ornum, William. (2008). Psychological testing across the life span. New
Jersey: Pearson Education, Inc
128
LAMPIRAN
129
130

Afifah FPS

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Afifah FPS

Diunggah oleh

Hak Cipta:

Format Tersedia

STUDI VALIDITAS KONSTRUK GENERAL

APTITUDE TEST BATTERY (GATB) DENGAN

Diajukan kepada Fakultas Psikologi untuk memenuhi syarat-syarat

memperoleh gelar Sarjana Psikologi

Jahja Umar, Ph.D Mulia Sari Dewi, M.Si

Skripsi yang berjudul “UJI VALIDITAS KONSTRUK GENERAL APTITUDE

Jakarta, 7 Oktober 2011

Dekan/ Pembantu Dekan/

Jahja Umar, Ph.D Dra. Fadhilah Suralaga,M.Si

Yunita Faela Nisa, M.Psi, Psi Mulia Sari Dewi, M.Si

Saya yang bertanda tangan di bawah ini:

Dengan ini menyatakan bahwa skripsi yang berjudul “UJI VALIDITAS

Saya bersedia untuk melakukan proses yang semestinya sesuai dengan

Demikian pernyataan ini saya buat untuk dipergunakan sebaik-baiknya.

Jakarta, 7 Oktober 2011

“Karena sesungguhnya sesudah kesulitan itu ada

Skripsi ini ku persembahkan untuk Ummi, Abi serta ketiga

Yang tanpa pernah lelah selalu memberikan cinta, kebahagiaan,

serta canda tawa tanpa syarat. Kalianlah penyemangatku dalam

(A) Fakultas Psikologi Universitas Islam Negeri Syarif Hidayatullah Jakarta

Berdasarkan perhitungan dengan metode CFA dapat disimpulkan bahwa hasil

(G) Daftar Bacaan: 36, 22 buku; 4 jurnal; 8 internet.

Alhamdulillahi rabbil 'alamin, puja dan puji syukur penulis panjatkan

Jakarta, 22 September 2011

Lembar Pengesahan Pembimbing i

Tabel 2.1 Faktor-Faktor dan Komposit General Aptitude Test 48

Gambar 2.1 Model Hirarki Inteligensi Vernon 27

Lampiran A : Surat Keterangan Penelitian

Lampiran B : Analisis Faktor Konfirmatorik Computation

Analisis Faktor Konfirmatorik Three Dimensional Space

Analisis Faktor Konfirmatorik Vocabulary

Analisis Faktor Konfirmatorik Arithmetic Reasoning

Analisis Faktor Konfirmatorik 2nd Order GATB

batasan masalah, perumusan masalah, tujuan penelitian, manfaat penelitian, dan

1.1 Latar Belakang

Optimalisasi hasil pencapaian perusahaan akan sangat didukung oleh peningkatan

manusia. Dewasa ini aspek pengembangan sumber daya manusia semakin

mendapat perhatian khusus dari para pimpinan perusahaan. Pimpinan perusahaan

memperhatikan aspek sumber daya manusia dalam menentukan pola penentuan

fungsi yang lain dalam perusahaan.

bersedia masuk menjadi bagian dari suatu perusahaan. Dengan merekrut

nyaman serta dapat menikmati pekerjaan yang mereka lakukan.

Munandar (2001) menjelaskan bahwa sasaran seleksi adalah suatu

untuk pekerjaan tertentu berdasarkan suatu dugaan tentang kemungkinan-

tujuannya terdengar sangat sederhana, proses tersebut ternyata sangat kompleks,

orang-orang di sekitarnya. Tahapan seleksi yang utama dalam proses perekrutan

adalah mengikuti tes psikologi.

karakteristik yang menentukan sebuah contoh dari perilaku, sampel yang

aturan untuk penilaian atau untuk memperoleh informasi kuantitatif (numerik)

dari sampel perilaku (Murphy, 1994).

Tes psikologi diperlukan dalam pengambilan keputusan berkaitan dengan

Pengambilan keputusan tersebut berkaitan dengan penerimaan dan penempatan,

promosi, evaluasi, maupun penepatan karier. Keberagaman dari perkembangan

bersama-sama, dan kemudian terciptalah definisi dari “test” (Loewenthal, 1997 ).

Kebutuhan akan alat tes untuk asesmen mendorong banyak dikembangkan

Di Indonesia, psikotes merupakan istilah umum yang digunakan untuk

pengetahuan, psikotes, battery test, maupun Behavior Interview. Tujuan dari

proses seleksi tentunya adalah untuk benar-benar dapat memperlihatkan

bidang industri adalah:

1. Objektif dalam arti mengurangi sekecil mungkin efek bias atau

prasangka berdasarkan usia, jenis kelamin, agama, maupun politik.

2. Konsisten karena semua calon mendapatkan pertanyaan atau latihan

untuk menjawabnya, dengan asumsi dilakukan dalam lingkungan