Anda di halaman 1dari 130

STUDI VALIDITAS KONSTRUK GENERAL

APTITUDE TEST BATTERY (GATB) DENGAN


METODE CFA

Skripsi
Diajukan untuk Memenuhi Persyaratan Memperoleh
Gelar Sarjana Psikologi (S.Psi)

Disusun oleh:
AFIFAH
NIM: 107070002378

FAKULTAS PSIKOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
1432H / 2011

1
UJI VALIDITAS KONSTRUK GENERAL APTITUDE TEST BATTERY
(GATB) DENGAN METODE CFA

SKRIPSI

Diajukan kepada Fakultas Psikologi untuk memenuhi syarat-syarat

memperoleh gelar Sarjana Psikologi

Oleh:

AFIFAH

NIM: 107070002378

Di bawah bimbingan:

Pembimbing I Pembimbing II

Jahja Umar, Ph.D Mulia Sari Dewi, M.Si


NIP: 130 885 522 NIP: 19780502 200801 2 026

FAKULTAS PSIKOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
1432 H / 2011 M

2
PENGESAHAN

Skripsi yang berjudul “UJI VALIDITAS KONSTRUK GENERAL APTITUDE


TEST BATTERY (GATB) DENGAN METODE CFA” telah diujikan dalam
sidang munaqasyah Fakultas Psikologi Universitas Islam Negeri Syarif
Hidayatullah Jakarta pada tanggal 7 Oktober 2011. Skripsi ini telah diterima
sebagai salah satu syarat untuk memperoleh gelar Sarjana Program Strata 1 (S1)
pada Fakultas Psikologi.

Jakarta, 7 Oktober 2011

Sidang Munaqasyah

Dekan/ Pembantu Dekan/


Ketua merangkap Anggota Sekretaris

Jahja Umar, Ph.D Dra. Fadhilah Suralaga,M.Si


NIP: 130 885 522 NIP: 19561223 198303 2 001

Anggota:

Yunita Faela Nisa, M.Psi, Psi Mulia Sari Dewi, M.Si


NIP: 19770608 200501 2 003 NIP: 19780502 200801 2 026

3
PERNYATAAN ORISINALITAS

Saya yang bertanda tangan di bawah ini:

Nama : Afifah

NIM : 107070002378

Dengan ini menyatakan bahwa skripsi yang berjudul “UJI VALIDITAS


KONSTRUK GENERAL APTITUDE TEST BATTERY (GATB) DENGAN
METODE CFA” adalah benar merupakan karya saya sendiri dan tidak
melakukan tindakan plagiat dalam penyusunan skripsi tersebut. Adapun kutipan-
kutipan yang ada dalam penyusunan skripsi ini telah saya cantumkan sumber
pengutipannya dalam daftar pustaka.

Saya bersedia untuk melakukan proses yang semestinya sesuai dengan


undang-undang jika ternyata skripsi ini secara prinsip merupakan plagiat atau
jiplakan dari karya orang lain.

Demikian pernyataan ini saya buat untuk dipergunakan sebaik-baiknya.

Jakarta, 7 Oktober 2011

Afifah .
NIM: 107070002378

4
MOTTO DAN PERSEMBAHAN

MOTTO:

“Karena sesungguhnya sesudah kesulitan itu ada


kemudahan. Maka apabila kamu telah selesai (dari
sesuatu urusan), kerjakanlah dengan sungguh-sungguh
(urusan) yang lain, dan hanya kepada Tuhanmulah
hendaknya kamu berharap”
(QS. Al Insyirah : 5-8).

“All your dreams can come true if you have the courage to pursue
them”
-Walt Disney

“If we believe in something, and we just keep on trying we’ll survive.. we will
survive..
It’s a beautiful life act from the heart when you play your part. It’s a
beautiful life when you survive and everything is alright”
-Maliq n D’essentials

5
PERSEMBAHAN:

Skripsi ini ku persembahkan untuk Ummi, Abi serta ketiga

adikku tersayang..

Yang tanpa pernah lelah selalu memberikan cinta, kebahagiaan,

serta canda tawa tanpa syarat. Kalianlah penyemangatku dalam

menyelesaikan ini..

6
ABSTRAK

(A) Fakultas Psikologi Universitas Islam Negeri Syarif Hidayatullah Jakarta


(B) September 2011
(C) Afifah
(D) xv + 108 halaman + lampiran
(E) Uji Validitas Konstruk General Aptitude Test Battery (GATB) Dengan
Metode CFA
(F) Tes psikologi diperlukan dalam pengambilan keputusan berkaitan dengan
sumber daya manusia dalam bidang industri dan organisasi. Pengambilan
keputusan tersebut berkaitan dengan penerimaan dan penempatan, promosi,
evaluasi, maupun penepatan karier. Kebutuhan akan alat tes untuk asesmen
mendorong banyak dikembangkan berbagai alat ukur tes psikologis baik tes,
self-report, skala, maupun inventori. Salah satu alat tes tersebut adalah
General Apitude Test Battery (GATB). GATB adalah suatu alat tes yang
berhubungan dengan jabatan yang berorientasi pada beberapa tes bakat baterai
yang mengukur sembilan bakat dalam delapan tes tulis serta empat perangkat
tes. Dalam penelitian ini digunakan empat subtes dari GATB yaitu
computation, three dimensional space, vocabulary, dan arithmetic reasoning
dengan jumlah total 175 item. keempat subtes tersebut digunakan karena
mengukur bakat skolastik atau hanya dari keempat subtes tersebut telah dapat
mengukur kemampuan kognitif atau inteligensi (general intelligence) atau
dapat menghasilkan skor IQ.

Penelitian ini bertujuan untuk mengetahui apakah seluruh item dalam keempat
subtes GATB yang dijadikan penelitian adalah fit (sesuai) dengan model satu
faktor, yang berarti semua item pada suatu subtes mengukur hanya satu
kemampuan yang didefinisikan pada subtes tersebut. Dan apakah setiap item
dalam masing-masing subtes adalah secara signifikan mengukur kemampuan
pada subtes tersebut. Tujuan yang kedua adalah untuk mengetahui apakah

7
empat subtes dalam GATB fit (sesuai) dengan model satu faktor, yaitu satu
faktor umum “inteligensi”.

Penelitian ini menggunakan data sekunder yang merupakan hasil tes GATB
yang diperoleh dari Divisi Asesmen SDM PPM Manajemen. Data yang
digunakan merupakan hasil dari rekruitmen karyawan PT Semen Tonasa yang
menjalani tes di Jakarta. Pelaksaan tes dilakukan pada tahun 2009 dan
ditempuh oleh 3257 orang. Metode analisis faktor yang digunakan dalam
penelitian ini adalah Confirmatory Factor Analysis (CFA) dengan program
lisrel 8.70.

Berdasarkan perhitungan dengan metode CFA dapat disimpulkan bahwa hasil


pengujian hipotesis 1 menunjukkan bahwa hipotesis diterima, bahwa semua
subtes fit (sesuai) mengukur model satu faktor, namun untuk subtes three
dimensional space serta artihmetic reasoning diperlukan modifikasi model
pengukuran untuk dapat memperoleh nilai fit. Hasil pengujian hipotesis 2
melalui analisis faktor dua tingkat (second order confirmatory factor analysis)
menghasilkan bahwa terdapat tiga dari empat subtes GATB yang signifikan
dalam mengukur inteligensi umum, yaitu subtes computation, three
dimensional space, dan vocabulary.

Dengan hasil seperti ini, maka alat tes GATB masih dapat dan layak
digunakan sebagai salah satu alat tes inteligensi namun perlu dilakukan
perbaikan dan pembaharuan terhadap item-item yang memiliki
multidimensionalitas yang terlalu banyak.

(G) Daftar Bacaan: 36, 22 buku; 4 jurnal; 8 internet.

8
KATA PENGANTAR

Alhamdulillahi rabbil 'alamin, puja dan puji syukur penulis panjatkan


kehadirat Allah SWT atas segala rahmat, hidayah, dan kasih sayang yang
diberikan-Nya, sehingga penulis dapat menyelesaikan penulisan Skripsi dengan
judul “UJI VALIDITAS KONSTRUK GENERAL APTITUDE TEST
BATTERY (GATB) DENGAN METODE CFA”. Shalawat serta salam semoga
selalu tercurahkan kepada junjungan kita semua, Rasulullah Muhammad SAW,
berikut para keluarga dan sahabat.

Terwujudnya skripsi ini tidak lepas dari bantuan berbagai pihak, baik
dalam bentuk sumbangan pikirian, tenaga, dan waktu yang tidak terukur dalam
menyelesaikan skripsi ini. Oleh karena itu dengan segala kerendahan hati penulis
menyampaikan rasa terima kasih kepada:

1. Bapak Jahja Umar, Ph.D, Dekan Fakultas Psikologi UIN Syarif Hidayatullah
Jakarta dan sekaligus sebagai Dosen Pembimbing I. Terima kasih sudah
meluangkan waktu dalam jadwal yang padat untuk melakukan proses
bimbingan skripsi ini. Terima kasih atas segala arahan, masukan, kritik, cerita
penuh inspirasi, serta motivasi dalam penyelesaian skripsi ini.
2. Ibu Mulia Sari Dewi, M.Si., sebagai Dosen Pembimbing II, terima kasih atas
bimbingan, sumbangan pikiran dalam penulisan, serta saran demi
kesempurnaan skripsi ini.
3. Ibu Yufi Adriani M.Psi., Dosen Pembimbing Akademik, terima kasih atas
bimbingannya dan semangatnya selama Penulis menjalani perkuliahan.
4. Seluruh dosen Fakultas Psikologi UIN Syarif Hidayatullah Jakarta, yang telah
banyak memberikan ilmu dan pembelajaran kepada Penulis.
5. Seluruh karyawan Fakultas Psikologi UIN Syarif Hidayatullah Jakarta yang
telah banyak membantu Penulis dalam menjalani perkuliahan, Mbak Rini
yang tanpa pernah bosan memberikan informasi mengenai kegiatan Bapak,
sehingga Penulis dapat bertemu dengannya.

9
6. Kedua orangtuaku tersayang, Muchtadi dan Iin Indarwati yang merupakan
sumber inspirasi bagi penulis dan senantiasa memberikan doa yang selalu
menyertai penulis, kasih sayang, cinta, motivasi, bantuan dan material yang
tidak akan pernah bisa terganti dan terbayar oleh apapun. Thank you for being
my super great parents.
7. Ketiga Adikku tersayang, Ja’far Fathul Haq, Muhammad Al-Fatih, dan Farhan
Muharam. Adik-adikku yang selalu setia menghiburku dan menyemangatiku,
setiap bermain bersama kalian rasanya semua kepenatan dan kegalauan kakak
hilang. Terima kasih telah sabar menjadi adik dari kakak yang cerewet dan
semoga kalian bisa menjadi seorang yang ‘LEBIH’ hebat dari kakak kalian
ini.
8. Reza Inspirawan, terima kasih sudah menjadi partner yang hebat dalam segala
situasi dan kondisi 
9. Hildi Okatatia Iskadar, terima kasih untuk canda tawanya, cerita-cerita labil
nan aneh juga semangat yang diberikan ketika penulis sudah mulai galau
dalam mengerjakan skripsi, dan untuk semua waktu yang telah kita habiskan
bersama.
10. Sahabatku tersayang, Renny dan Vhia. Terima kasih untuk semua
persahabatan kita selama ini, untuk semua cerita yang tertumpah dan untuk
semua waktu yang kita jalani bersama, terima kasih sudah mau mengertiku.
Ayank-ayankku, Chahyu, Imel, Tya, Ami, dan Zya. Terima kasih untuk canda
tawa yang telah dibagi, untuk gosip-gosip terhangat, untuk tempat-tempat
yang telah kita kunjungi bersama dan untuk kantong-kantong belanja. Sangat
mewarnai hari-hari penulis selama perkuliahan.
11. Seluruh teman-teman kelas A angkatan 2007, terima kasih untuk semua
kebersamaan kita selama 4 tahun ini, untuk semua cerita dan pengalaman yang
luar biasa serta diskusi-diskusi berbobot dalam setiap mata kuliah.
12. Teman sesama bimbingan skripsi, Risna, Nuran, Kak Sarah, dan Kak Aji..
Terima kasih sudah menemani hari-hari Penulis selama menjadi penunggu
setia ruangan dekanat, menghabiskan waktu menunggu dengan canda tawa,

10
dan berbagi kegalauan dalam proses penyelesaian skripsi. Yeaay, kita bisa ko
‘menjalani’ semua ini yang pada awalnya terkesan sangat berat.
13. Kak Adiyo, terima kasih telah sabar mengajari penulis tata cara penggunaan
Lisrel mulai dari Penulis tidak bisa sama sekali sampai akhirnya bisa. Kak
Vhia, terima kasih atas sharing nya serta masukan bagi Penulis.
14. Pihak PPM atas data yang telah disediakan, terima kasih telah memudahkan
Penulis dalam mengambil data bagi penelitian ini.
15. Seluruh pihak yang tidak dapat disebutkan satu per satu, terima kasih untuk
segala doa, dukungan dan bantuan yang telah diberikan untuk membantu
penulis dalam menyelesaikan skripsi ini.

Semoga seluruh bantuan yang telah diberikan dibalas berlipat ganda oleh
Allah SWT. Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan.
Oleh karena itu, segala kritik dan saran yang membangun akan sangat berguna
agar pada penulisan selanjutnya dapat menghasilkan karya yang lebih baik.
Semoga skripsi ini dapat bermanfaat bagi siapapun yang membacanya.

Jakarta, 22 September 2011

Penulis

11
DAFTAR ISI

Lembar Pengesahan Pembimbing i


Lembar Pengesahan Panitia Ujian ii
Lembar Orisinalitas iii
Motto dan Persembahan iv
Abstrak vi
Kata Pengantar viii
Daftar Isi xi
Daftar Tabel xiii
Daftar Gambar xv
Daftar Lampiran xvi
BAB I Pendahuluan
1.1 Latar Belakang 1
1.2 Pembatasan Masalah 10
1.3 Perumusan Masalah 10
1.4 Tujuan Penelitian 11
1.5 Manfaat penelitian 11
1.6 Sistematika Penulisan 12
BAB II Kajian Teori
2.1 Bahasan Umum Mengenai Tes Psikologi 14
2.2 Bakat
2.2.1 Definisi Bakat 17
2.2.2 Faktor-faktor Yang Mempengaruhi Perkembangan Bakat 17
2.2.3 Tes Bakat 19

2.3 Inteligensi 22
2.3.1 Definisi Inteligensi 22
2.3.2 Teori-teori Inteligensi 23
2.3.3 Pengukuran Inteligensi 28
2.3 Konstruksi Tes 33

12
2.3.1 Validitas 33
2.3.2 Reliabilitas 38
2.4 Gambaran Umum GATB 40
2.5 Kerangka Berpikir 48
2.6 Hipotesis 50
BAB III Metode Penelitian
3.1 Subjek Penelitian 51
3.2 Instrumen Penelitian 52
3.3 Metode Analisis Data 54
3.4 Prosedur Penelitian 61
BAB IV Hasil Penelitian
4.1 Validitas Konstruk Tingkat Subtes 63
4.1.1 Validitas Konstruk Subtes Computation 63
4.1.2 Validitas Konstruk Subtes Three Dimensional Space 70
4.1.3 Validitas Konstruk Subtes Vocabulary 81
4.1.4 Validitas Konstruk Subtes Arithmetic Reasoning 88
4.2 Validitas Konstruk Seluruh Subtes GATB dalam Mengukur Satu 97
Konstruk Bersifat Umum (General Intelligence)
BAB V Kesimpulan, Diskusi dan Saran
5.1 Kesimpulan 100
5.2 Diskusi 104
5.3 Saran 107
5.3.1 Saran Metodologis 108
5.3.2 Saran Praktis 109
Daftar Pustaka 110
Lampiran 112

13
DAFTAR TABEL

Tabel 2.1 Faktor-Faktor dan Komposit General Aptitude Test 48


Battery (GATB)
Tabel 4.1 Matriks Korelasi antar Kesalahan Pengukuran Butir Item 67
pada Computation
Tabel 4.1 Matriks Korelasi antar Kesalahan Pengukuran Butir Item 68
pada Computation (Lanjutan)
Tabel 4.2 Muatan Faktor Item GATB Subtes Computation 69
Tabel 4.2 Muatan Faktor Item GATB Subtes Computation 70
(Lanjutan)
Tabel 4.3 Matriks Korelasi antar Kesalahan Pengukuran Butir Item 74
pada Three Dimensional Space
Tabel 4.3 Matriks Korelasi antar Kesalahan Pengukuran Butir Item 75
pada Three Dimensional Space (Lanjutan)
Tabel 4.3 Matriks Korelasi antar Kesalahan Pengukuran Butir Item 76
pada Three Dimensional Space (Lanjutan)
Tabel 4.4 Muatan Faktor Item GATB Subtes Three Dimensional 77
Space
Tabel 4.4 Muatan Faktor Item GATB Subtes Three Dimensional 78
Space (Lanjutan)
Tabel 4.5 Rotated Component Matrix pada Subtes Three 80
Dimensional Space
Tabel 4.6 Sebaran Item GATB subtes Three Dimensional Space 81
Tabel 4.7 Muatan Faktor Item GATB Subtes Vocabulary 85
Tabel 4.7 Muatan Faktor Item GATB Subtes Vocabulary 86
(Lanjutan)
Tabel 4.7 Muatan Faktor Item GATB Subtes Vocabulary 87
(Lanjutan)

14
Tabel 4.8 Matriks Korelasi antar Kesalahan Pengukuran Butir Item 92
pada Arithmetic Reasoning
Tabel 4.8 Matriks Korelasi antar Kesalahan Pengukuran Butir Item 93
pada Arithmetic Reasoning (Lanjutan)
Tabel 4.9 Muatan Faktor Item GATB Subtes Arithmetic Reasoning 94
Tabel 4.10 Rotated Component Matrix pada Subtes Arithmetic 96
Reasoning
Tabel 4.11 Sebaran Item GATB subtes Arithmetic Reasoning 97
Tabel 4.12 Koefisien Muatan Faktor Untuk General Intelligence 98
Tabel 5.1 Analisis CFA Pada Setiap Subtes GATB 101
Tabel 5.2 Hasil Pengujian Model Satu Faktor Setiap Subtes GATB 102

15
DAFTAR GAMBAR

Gambar 2.1 Model Hirarki Inteligensi Vernon 27


Gambar 2.2 Kerangka Berfikir Berdasarkan Subtes 49
Gambar 2.3 Kerangka Berfikir Berdasarkan Sebaran Item 49
Gambar 4.1 Analisis faktor Konfirmatorik Untuk Subtes Computation 66
Gambar 4.2 Analisis faktor Konfirmatorik Untuk Subtes 73
Three Dimensional Space
Gambar 4.3 Analisis faktor Konfirmatorik Untuk Subtes Vocabulary 84
Gambar 4.4 Analisis faktor Konfirmatorik Untuk Subtes Arithmetic 91
Reasoning
Gambar 4.5 Koefisiein Muatan Faktor Untuk General Intelligence 98

16
DAFTAR LAMPIRAN

Lampiran A : Surat Keterangan Penelitian

Lampiran B : Analisis Faktor Konfirmatorik Computation

Analisis Faktor Konfirmatorik Three Dimensional Space

Analisis Faktor Konfirmatorik Vocabulary

Analisis Faktor Konfirmatorik Arithmetic Reasoning

Analisis Faktor Konfirmatorik 2nd Order GATB

17
BAB I

PENDAHULUAN

Dalam bab pendahuluan ini akan dibahas mengenai latar belakang penelitian,

batasan masalah, perumusan masalah, tujuan penelitian, manfaat penelitian, dan

sistematika penelitian.

1.1 Latar Belakang

Sumber daya manusia dalam perusahaan merupakan aset yang paling berharga.

Optimalisasi hasil pencapaian perusahaan akan sangat didukung oleh peningkatan

peran para manajer fungsional yang terlibat dalam pengelolaan sumber daya

manusia. Dewasa ini aspek pengembangan sumber daya manusia semakin

mendapat perhatian khusus dari para pimpinan perusahaan. Pimpinan perusahaan

memperhatikan aspek sumber daya manusia dalam menentukan pola penentuan

strategi dan kebijakan secara terpadu. Pengelolaan faktor sumber daya manusia

sangat penting karena memegang peran utama dalam pelaksanaan kegiatan fungsi-

fungsi yang lain dalam perusahaan.

Untuk mencapai visi dan misi perusahaan, kualitas SDM merupakan faktor

penting yang perlu dipersiapkan perusahaan sejak dini mulai dari melakukan

proses rekruitmen. Proses rekruitmen pada dasarnya adalah proses untuk memilih

berbagai sumber dari calon karyawan potensial dan usaha untuk menariknya agar

bersedia masuk menjadi bagian dari suatu perusahaan. Dengan merekrut

karyawan yang potensial dan memiliki kesiapan psikologis yang baik, serta

18
penempatan karyawan yang tepat, perusahaan akan lebih lebih mudah

memperoleh produktivitas yang optimal dari karyawan dan karyawan pun merasa

nyaman serta dapat menikmati pekerjaan yang mereka lakukan.

Munandar (2001) menjelaskan bahwa sasaran seleksi adalah suatu

rekomendasi atau suatu keputusan untuk menerima atau menolak seorang calon

untuk pekerjaan tertentu berdasarkan suatu dugaan tentang kemungkinan-

kemungkinan dari calon untuk menjadi tenaga kerja yang berhasil pada

pekerjaannya.

Tujuan utama dari proses seleksi adalah untuk mendapatkan orang yang

tepat bagi suatu jabatan tertentu, sehingga orang tersebut mampu bekerja secara

optimal dan dapat bertahan di perusahaan untuk waktu yang lama. Meskipun

tujuannya terdengar sangat sederhana, proses tersebut ternyata sangat kompleks,

memakan waktu cukup lama, menggunakan biaya yang tidak sedikit dan sangat

terbuka peluang untuk melakukan kesalahan dalam menentukan orang yang tepat.

Kesalahan dalam memilih orang yang tepat sangat besar dampaknya bagi

perusahaan atau organisasi. Hal tersebut bukan saja karena proses rekruitmen dan

seleksi itu sendiri telah menyita waktu, biaya dan tenaga, tetapi juga karena

menerima orang yang salah untuk suatu jabatan akan berdampak pada efisiensi,

produktivitas, dan dapat merusak moral kerja pegawai yang bersangkutan dan

orang-orang di sekitarnya. Tahapan seleksi yang utama dalam proses perekrutan

adalah mengikuti tes psikologi.

19
Tes psikologi adalah sebuah instrumen pengukuran yang memiliki tiga

karakteristik yang menentukan sebuah contoh dari perilaku, sampel yang

diperoleh dalam suatu tes harus dibawah kondisi standar, dan ada penetapan

aturan untuk penilaian atau untuk memperoleh informasi kuantitatif (numerik)

dari sampel perilaku (Murphy, 1994).

Tes psikologi diperlukan dalam pengambilan keputusan berkaitan dengan

sumber daya manusia dalam bidang industri dan organisasi (Gregory, 2000).

Pengambilan keputusan tersebut berkaitan dengan penerimaan dan penempatan,

promosi, evaluasi, maupun penepatan karier. Keberagaman dari perkembangan

tes psikologi sangat mengejutkan. Terdapat lebih dari 1.000 tes psikologis yang

berbeda dan tersedia secara komersial di negara-negara barat dan tidak diragukan

lagi terdapat ratusan lainnya yang diterbitkan di seluruh bagian dunia. Tes ini

berkisar dari tes kepribadian dan tes guna mendapatkan skor IQ, tes pemeriksaan

skolastik sampai tes persepsi. Meskipun terdiri dari berbagai keberagaman, ada

beberapa bagian yang biasanya terdapat di semua tes psikologi, diambil secara

bersama-sama, dan kemudian terciptalah definisi dari “test” (Loewenthal, 1997 ).

Kebutuhan akan alat tes untuk asesmen mendorong banyak dikembangkan

berbagai alat ukur tes psikologis baik itu berupa tes, self-report, skala, maupun

inventori. Pengembangan alat ukur dapat dilakukan dengan membuat alat ukur

atau melakukan adaptasi terhadap alat ukur yang telah dibuat di luar negeri.

Di Indonesia, psikotes merupakan istilah umum yang digunakan untuk

menjelaskan proses pemeriksaan psikologis calon pegawai. Banyak alat tes yang

20
dapat digunakan untuk proses seleksi, seperti melalui proses assessment, tes

pengetahuan, psikotes, battery test, maupun Behavior Interview. Tujuan dari

proses seleksi tentunya adalah untuk benar-benar dapat memperlihatkan

kapabilitas calon karyawan dan menentukan apakah kapabilitas yang dia miliki

sesuai dengan jabatan. Kunci utama keberhasilan sebuah seleksi adalah tersedia

rincian kompetensi (baik teknis maupun perilaku) yang diperlukan agar dapat

berhasil.

Menurut Davis (2009) keutamaan dari tes psikologi bila digunakan dalam

bidang industri adalah:

1. Objektif dalam arti mengurangi sekecil mungkin efek bias atau

prasangka berdasarkan usia, jenis kelamin, agama, maupun politik.

2. Konsisten karena semua calon mendapatkan pertanyaan atau latihan

yang sama dengan urutan yang sama dengan durasi waktu yang sama

untuk menjawabnya, dengan asumsi dilakukan dalam lingkungan

terkendali sesuai petunjuk pembuatnya. Bahkan sekarang ada variasi di

mana beberapa tes kemampuan verbal dan numerik secara online

menciptakan sekumpulan pertanyaan khas dari bank soal yang besar,

di mana tiap pertanyaan dianggap memiliki tingkat kesulitan yang

sama, sehingga masih memungkinkan dilakukan penilaian komparatif.

3. Dapat memprediksi kinerja efektif. Banyak studi menunjukkan bahwa

penggunaan tes psikologi yang berkualitas dalam hubungannya dengan

21
asesmen pengetahuan dan wawancara terstruktur ternyata dapat

meningkatkan efektivitas rekrutmen.

4. Dapat memberikan wawasan "kesadaran diri" kepada calon dan juga

organisasi. Perasaan bahwa seorang individu akan belajar dan

berkembang secara pribadi merupakan motivator yang penting. Oleh

karena itu keadaan ini bermanfaat untuk mempertahankan karyawan

(retention agent).

Dalam proses seleksi, salah satu cara yang umum dilakukan adalah

melakukan pemeriksaan atau tes psikologis pada calon karyawan guna untuk

meramalkan kemungkinan keberhasilan calon karyawan dalam jabatan atau

pekerjaan tertentu. Ada berbagai alat ukur psikologis yang umumnya digunakan

dalam proses seleksi seperti tes kecakapan atau kemampuan kognitif, tes

kepribadian objektif dan proyektif, tes situasional, informasi biografi, dan

wawancara. Salah satu tes yang paling umum digunakan dan menjadi dasar pada

tes selanjutnya adalah tes bakat dan tes inteligensi.

Dalam bidang pekerjaan, kegiatan seleksi, penempatan dan promosi

karyawan juga melibatkan tes inteligensi. Smith (dalam Cook & Cripps, 2005)

menunjukkan bahwa pengukuran mental ability bersifat universal dalam kegiatan

seleksi, sesuatu yang dibutuhkan dan berguna pada berbagai bidang pekerjaan.

Melalui tes inteligensi perusahaan terbantu dalam mengidentifikasi calon-calon

karyawan yang potensial untuk diseleksi atau dikembangkan.

22
Tes Inteligensi merupakan upaya untuk mengukur kecerdasan seseorang,

yaitu kemampuan dasar seseorang untuk memahami dunia di sekitarnya seperti

fungsi asimilasi dan menerapkan pengetahuan tersebut untuk meningkatkan

kualitas hidupnya. Telah diketahui bahwa kinerja pada tes inteligensi akademik

memiliki korelasi yang substansial dengan tingkat pendidikan. Maka akan terlihat

bahwa persyaratan pendidikan dapat diterapkan untuk mencakup kualifikasi

pelamar dalam kelompok keterampilan kognitif dan pengetahuan. Namun hal

tersebut dirasa tidak adil, karena pengetahuan dan keterampilan dapat diperoleh

melalui pendidikan non formal atau pelatihan-pelatihan yang lain (Anastasi &

Urbina, 1997).

Tes-tes inteligensi didesain untuk mengukur general ability, tetapi orang

merasakan bahwa kemampuan-kemampuan yang terukur oleh tes inteligensi tidak

meliput kemampuan-kemampuan atau fungsi-fungsi khusus yang dibutuhkan

dalam pekerjaan. Sejak Perang Dunia I para psikolog mulai membuat tes-

tes aptitude khusus untuk kebutuhan konseling pekerjaan (vocational counseling)

yang dapat melengkapi tes-tes inteligensi umum. Tes-tes aptitude atau bakat

khusus yang banyak dipakai adalah tes-tes mekanikal, spasial, perseptual, klerikal,

musikal, dan artistik. Tes-tes ini dipakai dalam seleksi dan penempatan

(klasifikasi) karyawan dalam perusahaan dan ketentaraan (Anastasi & Urbina,

1997).

23
Tes bakat atau aptitude test adalah tugas-tugas baku yang dirancang untuk

mengungkapkan kemampuan atau keberhasilan seseorang dalam melaksanakan

suatu pekerjaan di masa mendatang. Dalam bidang industri,bakat seseorang perlu

diketahui apakah ia tepat menduduki jabatan tertentu. Hasil tes bakat bisa

membantu suatu perusahaan atau lembaga untuk menempatkan karyawan atau

calon karyawan pada posisi yang sesuai dengan kualifikasi yang dibutuhkan.

Tes bakat dapat meramalkan bakat-bakat seseorang dalam berbagai bidang

atau dalam hal pekerjaan yang dipilihnya serta kesuksesan-kesuksesan bekerja di

masa datang. Seorang yang dapat memilih dan menyesuaikan pekerjaan yang

sesuai dengan bakatnya akan membuat seseorang tersebut mempunyai semangat

kerja yang tinggi dan kepuasan kerja akan tercapai. Sebaliknya seorang individu

yang dipaksa atau terpaksa bekerja tidak sesuai dengan bakatnya akan

menimbulkan kelesuan kerja, semangat kerja rendah, ketidakpercayaan pada diri

sendiri, banyak membuat kesalahan-kesalahan dan menimbulkan frustrasi bagi

individu yang bersangkutan.

Salah satu alat tes yang biasa dipakai tersebut adalah General Apitude Test

Battery (GATB). GATB adalah suatu alat tes yang berhubungan dengan jabatan

yang berorientasi pada beberapa tes bakat baterai yang mengukur sembilan bakat

dalam delapan tes tulis serta empat perangkat tes yaitu name comparison,

computation, three dimensional space, vocabulary, tool matching, arithmetic

reason, form matching, mark making, place, turn, dan disassemble.

24
Penelitian ini menggunakan empat subtes dari GATB yaitu computation,

three dimensional space, vocabulary, dan arithmetic reasoning dengan jumlah

total 175 item. Keempat subtes tersebut digunakan karena subtes ini merupakan

tes bakat dalam penilaian skolastik. Tes bakat skolastik adalah sebuah tes yang

bertujuan untuk mengetahui bakat dan kemampuan seseorang di bidang

keilmuan. Tes ini juga dapat mencerminkan tingkat kecerdasan intelektual (IQ)

seseorang.

Dalam penelitian ini GATB digunakan karena tes tersebut mengukur

kemampuan-kemampuan umum pada individu dan dapat dipakai untuk semua

kalangan. GATB merupakan salah satu alat tes bakat dan inteligensi yang telah

lama diciptakan dan digunakan dalam pengetesan psikologi. GATB dapat

digunakan secara individual, klasikal maupun berkelompok, serta dapat

memberikan gambaran atau profil seseorang mengenai kelemahan maupun

kekuatan yang dimilikinya berdasarkan berbagai aspek yang terkait dengan fungsi

inteligensinya.

Keuntungan dari penggunaan alat tes GATB sebagai salah satu tes untuk

mengukur inteligensi adalah pengadministrasian tes lebih mudah, waktu

pengerjaan tes yang relatif singkat dapat menghemat waktu dalam pengerjaan.

Dalam penghitungan skor IQ juga jauh lebih mudah apabila dibandingkan dengan

menggunakan alat tes inteligensi lainnya sehingga tidak perlu lagi menggunakan

tenaga professional yang berdampak pada penghematan biaya tes. Namun, alat tes

GATB ini telah lama digunakan karena termasuk salah satu alat tes yang tertua.

25
Belum adanya pengujian validitas pada item subtes GATB yang menyebabkan

item subtes GATB belum memuaskan. Oleh karena itu, peneliti akan meneliti

dengan teori modern dalam rangka menguji validitas konstruk dari GATB.

Dikarenakan peneliti belum mempelajari secara khusus statistik tentang analisis

faktor, maka peneliti hanya akan mempraktekkannya saja dengan software yang

sudah ada, yaitu Lisrel kemudian menafsirkan hasil analisis faktor terhadap data

hasil tes.

Alat tes GATB telah lama digunakan sebagai alat penyeleksian calon

pegawai. Mengingat alat tes tersebut digunakan untuk banyak kegiatan

penyeleksian calon karyawan maka perlu adanya pengujian validitas, sehingga tes

tersebut masih layak digunakan sebagai alat tes inteligensi. Kaplan & Saccuzzo

(2009) mengatakan bahwa tes yang baik minimal harus memenuhi syarat: 1)

validity; 2) reliability; 3) objectivity; dan 4) usability. Dalam menggunakan alat

ukur psikologis, setelah kriteria valid telah dipenuhi, maka hasil validitas itu akan

memberikan jawaban sebagai alat ukur yang baik atau tidak. Setelah validasi alat

tes, dapat diketahui item yang gugur dan membuat kurang baiknya suatu alat ukur

psikologis.

Kenyataan ini menunjukkan bahwa perlu sekali mengadakan berbagai

penelitian yang berkaitan dengan ‘keabsahan’ (keabsahan ramalan, keabsahan

konstruk, keabsahan isi, keabsahan sintetik) dari perangkat tes psikologik yang

digunakan dalam seleksi dan asesmen, sehingga seleksi dan asesmen psikologik

26
untuk berbagai tujuan menjadi lebih menggunakan kaidah-kaidah ilmiah

(Munandar, 2001).

Berdasarkan pemaparan di atas, peneliti tertarik untuk melakukan

penelitian mengenai studi validitas konstruk alat tes GATB secara lebih

mendalam agar mendapatkan gambaran yang lebih jelas mengenai tingkat

validitas suatu alat tes. Data penelitian di dapatkan dari Asesmen SDM PPM

Manajemen yang juga menggunakan GATB sebagai salah satu alat tes psikologis

dalam proses rekruitmen dan seleksi di seluruh Indonesia.

1.2 Pembatasan Masalah

Penelitian ini menggunakan data sekunder di PPM, yang beralamatkan Jl.

Menteng Raya 9, Jakarta. Respondennya adalah semua karyawan dari PT Semen

Tonasa yang mengikuti serangkaian proses asesmen dari PPM pada tahun 2009

yang mengikuti tes di Jakarta. Untuk mengukur validiasi dari sebuah alat tes,

penelitian ini terfokus kepada empat subtes dalam GATB yang terdiri dari:

computation, three dimensional space, vocabulary, dan arithmetic reasoning.

1.3 Perumusan Masalah

Merujuk kepada latar belakang yang telah diuraikan, maka penulis merumuskan

masalah sebagai berikut, yaitu:

1. Apakah benar seluruh item dalam empat subtes GATB yang dijadikan

penelitian mengukur konstruk yang dimaksud. Konstruk yang dimaksud

27
adalah computation, three dimensional space, vocabulary, dan three

dimensional space. Dimana setiap item dalam masing-masing subtes

adalah fit (sesuai) dengan model satu faktor, yang berarti semua item pada

suatu subtes mengukur hanya satu kemampuan yang didefinisikan pada

subtes tersebut. Apakah setiap item dalam masing-masing subtes secara

signifikan mengukur kemampuan pada subtes tersebut?

2. Apakah empat subtes dalam GATB fit (sesuai) dengan model satu faktor,

yaitu semua subtes mengukur satu faktor umum yang dalam hal ini adalah

“Inteligensi”?

1.4 Tujuan Penelitian

Penelitian ini bertujuan untuk mengetahui validitas konstruk GATB, sehingga alat

tes GATB tersebut masih dapat digunakan pada pengetesan calon pegawai di

dalam berbagai lembaga psikologi yang menggunakan alat tes GATB karena pada

kenyataannya alat tes GATB masih dipakai secara konsisten dalam pengetesan

kemampuan umum atau inteligensi.

1.5 Manfaat Penelitian

Secara pokok dan prinsip tujuan penelitian ini adalah menjawab pertanyaan

penelitian yang telah peneliti rumuskan diatas. Oleh karenanya tujuan dan manfaat

subtansial penelitian ini sangat berkaitan erat dengan pertanyaan penelitiannya

yaitu:

28
a. Secara teoritik, hasil penelitian ini diharapkan dapat menambah

khasanah ilmu pengetahuan psikologi, khususnya psikologi industri

dan organisasi dan memberikan gambaran mengenai bagaimana

menggunakan software Lisrel untuk menguji validitas konstruk dari

sebuah alat ukur psikologi. Sehingga, menambah ilmu baru pada

peneliti, lembaga psikologi yang menggunakan alat tes GATB,

maupun pembaca.

b. Secara praktis, hasil penelitian ini bermanfaat bagi pengguna tes

GATB, sehingga alat tes tersebut dapat disempurnakan dan digunakan

pada pengetesan calon pegawai berikutnya di lembaga psikologi yang

menggunakan GATB sebagai salah satu alat tes dengan tingkat

validitas yang lebih tinggi.

1.6 Sistematika Penelitian

Sistematika penulisan skripsi dengan judul “Uji Validitas Konstruk General

Aptitude Test Battery (GATB) Dengan Teknik CFA” terdiri dari lima bab,

yaitu

BAB 1 : Pendahuluan

Dalam bab pendahuluan ini akan dibahas mengenai latar belakang

penelitian, pembatasan masalah, perumusan masalah, tujuan

penelitian, manfaat penelitian baik yang teoritis maupun praktis,

dan sistematika penelitian.

29
BAB 2 : Kajian Teori

Dalam bab kajian teori ini berisi sub bab deskriptif teoritis yang

membahas mengenai bahasan umum mengenai tes psikologi, hal-

hal mengenai bakat dan inteligensi serta teori inteligensi yang

digunakan oleh alat tes GATB, definisi validitas dan reliabilitas,

gambaran umum alat tes GATB, kerangka berpikir, dan hipotesis

penelitian

BAB 3 : Metode Penelitian

Dalam bab metode penelitian ini akan dibahas mengenai

metode penelitian yang terdiri dari subjek penelitian, metode

analisis data, dan prosedur penelitian.

BAB 4 : Hasil Penelitian

Dalam bab empat ini, akan dibahas mengenai hasil penelitian

yang telah dilakukan. Pembahasan tersebut meliputi validitas

yang dihasilkan oleh analisis faktor, dengan masing-masing

skalanya.

BAB 5 : Kesimpulan, Diskusi, dan Saran

Dalam bab lima ini akan dipaparkan keseluruhan isi penelitian

dan menyimpulkan hasil penelitian. Dalam bab ini juga akan

dimuat diskusi dan saran.

30
BAB II

KAJIAN TEORI

Dalam bab kajian teori ini akan dipaparkan mengenai teori yang digunakan dalam

penelitian ini yang terdiri dari sub bab deskriptif teoritis yang membahas

mengenai tes psikologi, hal-hal mengenai bakat dan inteligensi serta teori

inteligensi yang digunakan dalam penelitian, definisi validitas dan reliabilitas,

gambaran umum alat tes GATB, kerangka berpikir, dan hipotesis penelitian.

2.1. Bahasan Umum Mengenai Tes Psikologi

Dalam kamus Psikologi, tes adalah satu perangkat pertanyaan yang sudah

dibakukan, yang dikenakan pada seseorang dengan tujuan untuk mengukur

perolehan atau bakat pada suatu bidang tertentu (Chaplin, 2006). Anne Anastasi

(1997) menjelaskan bahwa tes psikologi merupakan alat ukur yang terstandar dan

objektif tentang sampel perilaku individu. Karena mengukur sampel perilaku, tes

psikologi - melalui item-itemnya - haruslah mencerminkan perilaku yang hendak

diukur. Ia objektif dan terstandar. Hal ini mengandung arti bahwa alat tes haruslah

berisi hal-hal penting yang hendak diukur supaya representatif.

Cronbach (1984) menyatakan tidak ada definisi tes yang dianggap tuntas,

melainkan para ahli mendefinisikan tes menurut cara pandangnya sendiri-

sendiri. Cronbach (1984) cenderung mendefinisikan tes psikologis sebagai suatu

prosedur yang distandardisasikan (standardization of procedure) yang digunakan

tester untuk mengukur kemampuan potensi subyek. Dalam pandangan ini,

31
prosedur (procedure) diartikan sebagai tata cara yang spesifik dan konkrit. Dari

batasan tersebut dapat diambil kesimpulan. Pertama, tes merupakan prosedur

sistematis. Item-item dalam tes disusun dengan cara dan aturan tertentu, prosedur

administrasi dan pemberian angka (skoring) tes harus jelas dan dispesifikasikan

secara terperinci, dan setiap orang yang mengambil tes tersebut harus mendapat

item-item yang sama dan dalam kondisi yang sebanding. Kedua, tes berisi sampel

perilaku. Keseluruhan item itu mustahil dapat seluruhnya tercakup dalam tes.

Kelayakan tes lebih tergantung kepada sejauh mana item-item di dalam tes

mewakili secara representatif kawasan (domain) perilaku yang diukur. Ketiga, tes

mengukur perilaku. Item-item dalam tes menghendaki subyek agar menunjukkan

apa yang diketahui atau apa yang telah dipelajari subyek dengan cara menjawab

item-item atau mengerjakan tugas-tugas yang dikehendaki oleh tes.

Sebuah tes psikologi pada dasarnya adalah alat ukur yang objektif dan

dibakukan atas sampel perilaku tertentu (Anastasi & Urbina, 1997). Dalam

psikologi, tes dapat diklasifikasikan menjadi lima, yaitu: Pertama, tes yang

mengukur inteligensi umum (general intelligence test). Tes ini dirancang untuk

mengukur kemampuan umum seseorang dalam suatu tugas. Kedua, tes yang

mengukur kemampuan khusus atau tes bakat (special ability test). Tes ini

digunakan untuk mengungkap kemampuan potensial subjek dalam bidang

tertentu. Ketiga, tes yang mengukur prestasi (achievement test). Tes ini

dimaksudkan untuk mengukur tingkat pembelajaran, keberhasilan, atau prestasi

seseorang dalam memahami hasil pembelajaran. Keempat, tes yang mengungkap

aspek kepribadian (personality assesment). Tes ini mengungkap sifat-sifat,

32
kualitas, atau perilaku individual subjek dalam aspek non ability. Kelima, tes yang

menilai kreativitas dari seseorang (creativity test). Tes ini menilai kemampuan

subjek untuk menghasilkan ide-ide baru, atau kreasiartistik yang dapat diterima

sebagai nilai sosial, artistik, atau ilmiah (Greogory, 2000)

Berdasarkan beberapa pengertian di atas dapat disimpulkan pengertian tes

adalah suatu alat atau metode pengumpulan data yang sudah distandardisasikan

untuk mengukur atau mengevaluasi salah satu aspek kemampuan atau kecakapan

dengan jalan mengukur sampel dari salah satu aspek tersebut. Dengan demikian

tes merupakan alat pengumpul data untuk mengetahui kemampuan individu atau

kelompok individu dalam menyelesaikan sesuatu atau memperlihatkan

keterampilan tertentu, dalam memperlihatkan hasil belajar, atau dalam

menggunakan kemampuan psikologis untuk memecahkan suatu persoalan.

Penelitian ini akan menggunakan definisi tes psikologi yang disampaikan

oleh Anastasi, bahwa tes psikologi adalah alat ukur yang terstandar dan objektif

tentang sampel perilaku individu. Karena mengukur sampel perilaku, tes psikologi

– melalui item-itemnya - haruslah mencerminkan perilaku yang hendak diukur. Ia

objektif dan terstandar. Hal ini mengandung arti bahwa alat tes haruslah berisi hal-

hal penting yang hendak diukur supaya representatif.

33
2.2. Bakat

2.2.1. Definisi Bakat

Bakat menurut definisi Bingham (dalam Saparinah Sadli, 1991) adalah suatu

kondisi atau seperangkat karakteristik yang dianggap sebagai kemampuan

individu untuk memperoleh pengetahuan melalui suatu latihan khusus guna

mencapai suatu keterampilan, kemampuan berbahasa, bermusik dan lain

sebagainya.

Coyle (2009) mendefinisikan bakat sebagai keterampilan bersifat berulang

yang tidak tergantung pada ukuran fisik. Atas dasar definisi tersebut, bakat tidak

berhubungan sama sekali dengan kondisi fisik seseorang. Menurut Buckingham &

Coffman (1999) Bakat adalah suatu pola berulang dalam berpikir, merasakan, atau

berperilaku yang bisa diterapkan secara produktif.

Dari pengertian mengenai bakat diatas dapat disimpulan bahwa bakat

adalah kemampuan bawaan yang merupakan potensi yang masih perlu

dikembangkan atau dilatih untuk mencapai suatu kecakapan, pengetahuan, dan

keterampilan khusus.

2.2.2. Faktor-faktor Yang Mempengaruhi Perkembangan Bakat

Bakat berkembang sebagai hasil interaksi dari faktor yang bersumber dari dalam

diri individu dan dari lingkungannya. Apabila kedua faktor tersebut bersifat saling

mendukung maka bakat yang ada akan dapat berkembang secara optimal.

34
Manakah di antara kedua faktor tersebut yang paling besar pengaruhnya, ini

sangat sulit sekali untuk menentukannya dengan tepat (Rahman,2004).

Faktor yang bersumber dari diri individu yang mempengaruhi

perkembangan bakat, antara lain:

1. Kemampuan atau potensi individu yang dibawa sejak lahir. Faktor

bawaan akan sangat menentukan pembentukan dan perkembangan

bakat seseorang. Lingkungan tidak akan dapat merubah membentuk

manusia melebihi batas kemampuan yang dimiliki manusia.

2. Minat individu yang bersangkutan. Suatu bakat tertentu tidak akan

berkembang dengan baik apabila tidak disertai minat yang cukup

tinggi terhadap bidang atau hal yang sesuai dengan bakat tersebut..

3. Motivasi yang dimiliki individu. Suatu bakat akan menjadi kurang

berkembang atau tidak akan menonjol bila kurang disertai oleh adanya

motivasi yang cukup tinggi untuk mengaktualisasikannya, karena

motivasi berhubungan erat dengan daya juang seseorang untuk

mencapai suatu tujuan.

4. Nilai hidup yang dimiliki individu. Yang dimaksud dengan nilai hidup

di sini adalah bagaimana cara seseorang memberi arti terhadap sesuatu

di dalam hidupnya.

5. Kepribadian individu. Faktor kepribadian ini sangat memegang

peranan bagi perkembangan bakat seseorang, misal konsep diri, rasa

35
percaya diri, keuletan atau keteguhan dalam berusaha, kesediaan untuk

menerima kritik dan saran demi untuk meraih sukses yang tinggi.

6. Maturity (kematangan). Bakat tertentu akan berkembang dengan baik

apabila sudah mendekati atau menginjak masa pekanya. Suatu hal

yang sulit adalah dalam menentukan kapankah saatnya (pada usia

berapakah) suatu kemampuan atau bakat tertentu sudah matang untuk

dikembangkan atau dilatih, karena untuk masing-masing kemampuan

dan untuk setiap orang kematangannya belum tentu atau tidak selalu

sama.

Sebagaimana sudah diuraikan sebelumnya bahwa lingkungan juga

memegang peranan yang sangat menentukan berkembang tidaknya suatu bakat.

Oleh karena itu lingkungan dapat berfungsi sebagai perangsang untuk

berkembangnya bakat, tetapi dapat juga sebaliknya lingkungan justru menjadi

faktor penghambat bagi aktualisasi dan perkembangan bakat yang dimiliki

seseorang.

2.2.3. Tes Bakat

Tes bakat pada awalnya diprakarsai oleh seorang ahli yang bernama A.

Musterberg. Mula-mula tes bakat digunakan pada masa perang dunia I untuk

menyeleksi pilot, pengemudi dan kemudian meluas ke bidang industri.

Tahun 1920-1930, tes yang digunakan adalah tes inteligensi umum, karena

tes inteligensi pada saat itu dianggap sebagai satu-satunya tes yang mutlak dapat

36
mementukan kemampuan seseorang. Tes inteligensi umum ini meskipun

mengandung berbagai aspek penting yang menunjang berfungsinya inteligensi

seseorang seperti kemampuan berbahasa, kemampuan penalaran, semuanya

menunjang satu angka sebagai keseluruhan unit inteligensi yang biasanya

dinyatakan sebagai IQ. Namun, masing-masing aspek tidak dimaksudkan untuk

disimpulkan sendiri-sendiri.

Tes inteligensi yang hanya dapat memberikan gambaran kemampuan

umum dan tidak dapat memberikan gambaran kemampuan umum dan profil

kemampuan seseorang pada aspek tertentu dirasakan kurang. Diperlukan adanya

tes lain yang dapat mengukur bermacam aspek secara khusus, ileh karena pada

kenyataannya ada perbedaan profil kemampuan antara individu yang satu dengan

individu lainnya. Maka diperlukan penciptaan tes bakat yang dapat mengukur

kemampuan di dalam berbagai aspek sebagai pelengkap tes inteligensi.

Dasar dari tes bakat adalah membandingkan profil nilai seseorang dengan

profil nilai orang lain yang dianggap berkemampuan tinggi mengenai bidang

tertentu. Dengan cara menyimpulkan kekuatan atau kelemahannya, maka dapat

terukur kadar bakat yang dimiliki oleh seseorang.

Secara garis besar tes bakat dapat dikelompokkan menjadi dua bagian

besar (Anastasi, 1997), yaitu:

1. Multiple Aptitude Batteries yaitu tes bakat yang mengukur bermacam-

macam kemampuan, seperti. pengertian bahasa, kemampuan angka-

37
angka, penglihatan keruangan, penalaran dalam berhitung, kecepatan

dan ketepatan dalam persepsi. Dari hasil tes dapat dilihat kemampuan,

kekuatan dan kelemahan seseorang yang masing-masing dinyata- kan

dalam angka-angka tersendiri, hasilnya adalah berupa profil angka-

angka. Berbeda dengan tes inteligensi umum dimana semua aspek

inteligensi keluar sebagai satu angka yaitu IQ. Tes ini termasuk tes

bakat yang sudah cukup lama dipakai, yaitu sejak perang Dunia I.

Yang termasuk jenis kelompok tes ini antara lain:

a) Differential Aptitude Test (DAT), terdiri dari 8 subtes.

b) General Aptitude Test Batteries (GATB), terdiri dari 9 subtes.

c) Flanagan Aptitude Classification Test (FACT), terdiri dari 14

subtes.

2. Special Aptitude Test atau Single Aptitude Test atau tes bakat khusus,

yakni tes yang hanya mengukur satu bakat khusus tertentu. Sebagai

contoh:

a) Musical Aptitude Test

b) Artistical Aptitude Test.

c) Clerical Aptitude Test.

d) Mathematical Aptitude Test.

38
2.3. Inteligensi

2.3.1. Definisi Inteligensi

Definisi inteligensi telah banyak yang dikemukakan oleh para ahli psikologi

maupun ahli pendidikan. Beberapa diantaranya akan dikemukakan disini untuk

mengarahkan pemahaman terhadap penelitian ini.

J. P. Guilford menjelaskan bahwa tes inteligensi hanya dirancang untuk

mengukur proses berpikir yang bersifat konvergen, yaitu kemampuan untuk

memberikan satu jawaban atau kesimpulan yang logis berdasarkan informasi yang

diberikan. Sedangkan kreativitas adalah suatu proses berpikir yang bersifat

divergen, yaitu kemampuan untuk memberikan berbagai alternatif jawaban

berdasarkan informasi yang diberikan. Lebih jauh, Guilford menyatakan bahwa

inteligensi merupakan perpaduan dari banyak faktor khusus.

Howard Gardner (1985) mengemukakan bahwa inteligensi adalah

kemampuan untuk memecahkan masalah, atau menciptakan suatu produk dalam

berbagai macam setting dan dalam situasi nyata.

Menurut David Wechsler (dalam Jackson, 2003), Inteligensi

adalah kapasitas keseluruhan atau global individu untuk bertindak, berpikir

rasional, dan menangani lingkungan secara efektif. Istilah keseluruhan atau

global digunakan karena terdiri dari elemen atau kemampuan yang meskipun

tidak sepenuhnya independen, namun secara kualitatif terdiferensialkan

39
William Stern mengemukakan inteligensi ialah kesanggupan untuk

menyesuaikan diri kepada kebutuhan baru, dengan menggunakan alat-alat berfikir

yang sesuai dengan tujuannya. William Stern berpendapat bahwa inteligensi

sebagian besar tergantung dengan dasar dan turunan, pendidikan atau lingkungan

tidak begitu berpengaruh kepada inteligensi seseorang (Anne Anastasi, 1997).

Alfred Binet (dalam Kaplan, 2009) seorang tokoh utama perintis

pengukuran inteligensi bersama Theodore Simon mendefinisikan inteligensi

sebagai sisi tunggal dari karakteristik seseorang yang terdiri atas tiga komponen,

yaitu (a) kemampuan untuk mengarahkan fikiran atau mengarahkan tindakan, (b)

kemampuan untuk mengubah arah tindakan bila tindakan tersebut telah

dilaksanakan, dan (c) kemampuan untuk mengeritik diri sendiri atau melakukan

autocriticism.

Berdasarkan pendapat para pakar di atas dapat di jelaskan

bahwa inteligensi adalah suatu kemampuan mental yang melibatkan proses

berpikir secara rasional. Inteligensi tidak dapat diamati secara langsung,

melainkan harus disimpulkan dari berbagai tindakan nyata yang merupakan

manifestasi dari proses berpikir rasional.

2.3.2. Teori–teori Inteligensi

Penggambaran secara sepintas tentang inteligensi sebagai suatu kemampuan dasar

yang bersifat umum telah berkembang menjadi berbagai teori inteligensi,

diantaranya adalah:

40
1. Teori Uni Faktor

Teori ini dipandang sebagai teori yang tertua. Alfred Binet termasuk

salah satu ahli psikologi yang mengatakan bahwa inteligensi bersifat

monogenetik, yaitu berkembang dari satu faktor satuan atau faktor

umum. Menurut Binet, inteligensi merupakan sisi tunggal dari

karakteristik yang terus berkembang sejalan dengan proses

kematangan seseorang.

Binet menggambarkan inteligensi sebagai sesuatu yang fungsional

sehingga memungkinkan orang lain untuk mengamati dan menilai

tingkat perkembangan individu berdasar suatu kriteria tertentu. Jadi

untuk melihat apakah seseorang cukup cerdas atau tidak, dapat diamati

dari cara dan kemampuannya untuk melakukan suatu tindakan dan

kemampuannya untuk mengubah arah tindakannya itu apabila perlu.

Inilah yang dimaksud dengan komponen arah, adaptasi dan kritik

dalam definisi inteligensi.

2. Teori Dwifaktor (The Two-Factor Theory)

Teori dwifaktor dikembangkan oleh Charles Spearman seorang

psikolog dan ahli statistik dari Inggris. Spearman (1927) mengusulkan

teori kecerdasan dua faktor yang menurutnya dapat menjelaskan pola

hubungan antara kelompok tes kognitif yang ia analisis. Dalam

bentuknya yang paling sederhana, teori ini menyatakan bahwa kinerja

41
pada setiap tugas kognitif tergantung pada faktor umum (g) ditambah

satu atau faktor yang lebih spesifik dan unik untuk tugas tertentu (s)

(Aiken, 1997).

Kedua faktor ini, baik faktor “g” maupun faktor “s” bekerja bersama-

sama sebagai suatu kesatuan. Semua faktor yang spesifik akan

bersama-sama membentuk single common factor “g” faktor. Spearman

berpendapat bahwa kemampuan seseorang bertindak dalam setiap

situasi sangat bergantung pada kemampuan umum maupun

kemampuan khusus. Jadi setiap faktor baik faktor “g” maupun faktor

“s” memberi sumbangan pada setiap perilaku yang intelegen.

3. Teori Multifaktor (Multiple factor Theory)

Teori multifaktor dikembangkan oleh Edward Lee Thorndike (1916).

Menurut teori ini, inteligensi terdiri dari hubungan-hubungan neural

antara stimulus dan respon. Hubungan-hubungan neural khusus inilah

yang mengarahkan tingkah laku indivivu. Pada dasarnya teori

Thorndike menyatakan bahwa inteligensi terdiri atas berbagai

kemampuan spesifik yang ditampakkan dalam wujud perilaku

intelegen. Thorndike mengemukakan empat atribut inteligensi, yaitu:

1) Tingkatan,

2) Rentang,

3) Daerah, dan

42
4) Kecepatan

4. Teori Hirearki

Model Hirearki dicetuskan oleh Vernon. Dalam menjelaskan teori

inteligensinya, teori ini menempatkan satu faktor kognitif umum (g)

dipuncak hierarki, kemudian dibawahnya terdapat dua faktor

inteligensi utama (mayor) yaitu verbal-eduacitional (v:ed) dan

practical-mechanical-spatial (k:m). Setiap kelompok mayor tersebut

kemudian terpecah kedalam beberapa faktor kelompok minor. Sebagai

contoh, v:ed terdiri dari kemampuan seperti kefasihan verbal,

kemampuan numerik, dan mungkin kreativitas. Beberapa faktor

kelompok kecil di bawah k:m adalah pemahaman mekanik,

kemampuan psikomotorik, serta hubungan spasial yang kemudian

terpecah lagi menjadi bermacam-macam faktor spesifik pada tingkat

hierarki yang paling rendah.

Dalam model hirarki kemampuan mental Vernon apabila semakin

tinggi posisi faktor dalam diagram maka semakin luas rentang

perilakunya.

43
Gambar 2.1

Model Hirarki Inteligensi Vernon

Sumber: Aiken, 1997

5. Teori Primary Mental Ability

Teori ini dikembangan oleh L.L. Thurstone berdasarkan analisis faktor

dengan mengkolerasikan 60 tes, yang akhirnya disusun menjadi

kecakapan-kecakapan primer. Thurstone menjelaskan mengenai

organisasi inteligensi yang abstrak atau biasa disebut dengan

“Primary-Mental Ability”. Thurstone berpendapat bahwa inteligensi

terdiri dari faktor yang jamak (multiple factors), mencakup tujuh

kemampuan mental utama (primary mental abilities), yaitu:

1) Verbal meaning (V): Memahami gagasan dan arti kata, yang

diukur dengan tes kosa kata.

2) Number (N): Kecepatan dan akurasi melakukan perhitungan

aritmatika.

44
3) Space (S): Kemampuan visualisasi hubungan yang berbentuk

dalam tiga dimensi, seperti dalam mengenali gambar dalam

orientasi berbeda.

4) Perceptual speed (P): Kemampuan untuk membedakan detail

visual, serta menetapkan persamaan dan perbedaan antara

obyek dalam gambar secara cepat.

5) Word fluency (W): Kecepatan dalam memikirkan kata-kata,

seperti dalam membuat puisi atau dalam memecahkan

anagram.

6) Memory (M): Kemampuan untuk menghafal kata-kata, angka,

huruf, dan sejenisnya, dengan cara menulis.

7) Inductive reasoning (I): Kemampuan untuk menurunkan

aturan dari informasi yang diberikan, seperti dalam

menentukan aturan dari serangkaian angka dari hanya sebagian

dari rangkaian angka tersebut.

Dalam penelitian ini, peneliti akan menggunakan teori inteligensi menurut

Thrustone karena teori Thrustone paling sesuai dengan teori yang terdapat dalam

GATB.

2.3.3. Pengukuran Inteligensi

Pada awalnya pengukuran inteligensi telah dipraktekkan di negara Cina sebelum

dinasti Han, pengukuran inteligensi dilakukan oleh jenderal Cina untuk menguji

45
rakyat sipil yang ingin menjadi legislatif berdasarkan pengetahuan menulis klasik,

persoalan administratif dan manajerial.

Pengukuran inteligensi kemudian dilanjutkan sampai pada masa dinasti

Han (200 SM- 200 M), namun seleksi ini tidak lagi untuk legislatif saja, tetapi

mulai merambah pada bidang militer, perpajakan, pertanian, dan geografi.

Meskipun diawali dengan sedikit mencontoh pada seleksi militer Prancis dan

Inggris, sistem ujian telah disusun dan berisi aktivitas yang berbeda, seperti

tinggal dalam sehari semalam dalam kabin untuk menulis artikel atau puisi, hanya

1 % sampai dengan 7 % yang diizinkan ikut ambil bagian pada ujian tahap kedua

yang berakhir dalam tiga hari tiga malam. Menurut Gregory (2007), seleksi ini

keras namun dapat memilih orang yang mewakili karakter orang Cina yang

kompleks. Tugas-tugas militer yang berat cukup dapat dilakukan dengan baik oleh

para pegawai yang diterima dalam seleksi fisik dan psikologi yang intensif.

Tokoh psikologi yang berperan antara lain adalah Wundt. Beliau

merupakan psikolog pertama yang menggunakan laboratorium dengan

penelitiannya mengukur kecepatan berpikir. Wundt mengembangkan sebuah alat

untuk menilai perbedaan dalam kecepatan berpikir. Tokoh yang tidak kalah

pentingnya adalah Alfred Binet. Kontribusi nyata Binet adalah menciptakan tes

inteligensi. Binet dibantu oleh Theophile Simon (1904) membuat instrumen

pengukur inteligensi dengan skala pengukuran level umum pada soal-soal

mengenai kehidupan sehari-hari sehingga tesnya dikenal dengan nama Tes Binet-

Simon. Perkembangan selanjutnya dua tokoh ini mengembangkan penggunaan tes

46
inteligensi dengan tiga puluh item yang berfungsi mengidentifikasikan

kemampuan sekolah anak (Van Ornum, 2008).

Di Amerika, usaha pertama tersebut dimulai oleh tokoh pencetus istilah

“tes mental” yaitu James Mckeen Cattell (1860-1944), yang menerbitkan bukunya

Mental Tes and Measurements di tahun 1890. Buku ini berisi serangkaian tes

inteligensi yang terdiri atas 10 jenis ukuran. Ke 10 macam ukuran tersebut adalah

(Gregory, 2007):

1. Dynamometer Pressure, yaitu ukuran kekuatan tangan menekan pegas

yang dianggap sebagai indikator aspek psikofisiologis

2. Rate of movement, yaitu kecepatan gerak tangan dalam satuan waktu

tertentu yang dianggap memiliki komponen mental didalamnya.

3. Sensation areas, yaitu pengukuran jarak terkecil diantara 2 tempat

yang terpisah dikulit yang masih dapat dirasakan sebagai 2 titik

berbeda.

4. Peasue caosing pain, yaitu pengukuran yamg dianggap berguna dalam

diaknosis terhadap penyakit saraf dan dalam mempelajari status

kesadaran abnormal.

5. Least noticabele difference in weight, yaitu pengukuran perbedaan

berat yang terkecil yang masih dapat dirasakan seseorang.

6. Reaction time for sound, yang mengukur waktu antara pemberian

stimulus dengan timbulnya reaksi tercepat.

47
7. Time for naming colors, yang dimaksudkan sebagai ukuran terhadap

proses yang lebih ‘mental’ daripada waktu-reaksi yang dianggap

reflektif.,

8. Bisection of a 50-cm line, yang dianggap sebagai suatu ukuran

terhadap akurasi ‘space judgment’

9. Judgment of 10 second time, yang dimaksudkan sebagai ukuran

akurasi dalam ‘time judgment’ (subyek diminta menghitung 10 detik

tampa bantuan apapun).

10. Number of latters repeated upon once hearing, yang dimaksudkan

sebagai ukuran terhadap perhatian dan ingatan (subyek diminta

mengulang huruf yang sudah disebutkan 1x)

Terdapat berbagai tes inteligensi yang terstandrisasi dan telah banyak

digunakan untuk berbagai keperluan pengetesan psikologi, diantaranya adalah

(Azwar, 2005):

1. Stanford-Binet Intelligence Scale

Tes Stanford-Binet digunakan pada anak-anak. Materi yang digunakan

dalam tes Stanford-Biner ini terdapat dalam sebuah kotak.

Penyelenggaraan tes dan Penentuan Skor menggunakan buku-buku kecil

berisi kartu-kartu tercetak untuk presentasi, flip-over soal tes, objek tes

mainan anak seperti balok, manik, papan bentuk, sebuah gambar besar

boneka yang uniseks dan multietnik, buku kecil untuk tester, dan

pedoman penyelenggaraan dan pen-skoran skala.

48
2. The Wechsler Intelligence Scale for Children – Revised (WISC-R).

Revisi skala WISC yang dinamai WISC-R diterbitkan tahun 1974 dan

dimaksudkan untuk mengukur inteligensi anak-anak usia 6 sampai

dengan 16 tahun. WISC-R terdiri atas 12 subtes yang dua diantaranya

digunakan hanya sebagai persediaan apabila diperlukan penggantian

subtes.

3. The Wechsler Adult Intelligence Scale-Revised (WAIS-R).

Sebagaimana versi WAIS lainnya, WAIS-R terdiri dari skala verbal dan

skala performansi. Kedua skala tersebut masing-masing menghasilkan

IQ verbal dan IQ performansi, sedangkan kombinasi keduanya menjadi

dasar untuk perhitungan IQ deviasi sebagai IQ keseluruhan.

4. The Standard Progressive Matrices (SPM)

SPM merupakan salah satu contoh bentuk skala inteligensi yang dapat

diberikan secara individual ataupun kelompok. Skala ini dirancang oleh

J.C. Raven dan terbit pada tahun 1960. SPM merupakan tes yang bersifat

nonverbal, artinya materi soal-soalnya diberikan tidak dalam bentuk

tulisan ataupun bacaan melainkan dalam bentuk gambar-gambar. Raven

sendiri menyebut skala ini sebagai tes kejelasan pengamatan dan

kejelasan berfikir, bukan tes inteligensi umum.

49
5. The Kaufman Assessment Battery for Children (K-ABC).

Kumpulan tes ini menghasilkan empat skor global: Pemrosesan

Berurutan, Simultan, Komposit, dan Pemrosesan Mental. Pemrosesan

simultan dipresentasikan oleh tujuh subtes sementara pemrosesan

berurutan dipresentasikan oleh tiga subtes. K-ABC dimaksudkan untuk

mengakomodasi kebutuhan pengetesan bagi kelompok-kelompok

khusus, seperti anak-anak cacat dan anak-anak dari kelompok minoritas

kultural dan bahasa, dan untuk membantu diagnosis ketidakmampuan

belajar.

2.4. Konstruksi Tes

Dua istilah yang paling sering diterapkan pada pengembangan tes psikologi

adalah validitas (validity) dan keandalan (reliability).

2.4.1. Validitas

Validitas suatu tes menerangkan apa yang diukur oleh tes dan sejauh mana tes

tersebut mengukur apa yang hendak diukur (Anastasi, 1997). Penentuan validitas

tes berkenaan dengan hubungan antara kinerja dengan fakta-fakta lain yang

independen dan dapat diamati. Prosedur pengujian sebuah alat ukur selalu

membutuhkan satu hal atau fakta lain di luar alat ukur yang disebut dengan

kriteria. Kriteria harus bersifat independen, dapat diukur, konsisten, relevan, dan

bebas dari bias. Pengukuran validitas yang menghasilkan koefisien validitas

berarti mencari korelasi antara skor tes dengan kriteria.

50
Dalam bidang psikologi konsep validitas memiliki tiga konteks yaitu

(Suryabratha, 2005):

1. Validitas Penelitian (Content Validity)

Konsep validitas penelitian ini bermakna adanya kesesuaian hasil-hasil

simpulan sebuah penelitian dengan kondisi senyatanya dilapangan.

Terkait dengan konsep validitas penelitian ini, Suryabrata (2005)

menyatakan bahwa validitas penelitian mengandung dua sisi, yaitu:

a) Validitas Internal

Konsep validitas internal membahas mengenai kesesuaian antara

hasil penelitian dengan kondisi sebenarnya. Adapun untuk

mengungkap validitas internal ini dapat dilakukan dengan

menggunakan instrumen yang disusun berdasarkan pada tahapan

penulisan instrumen yang baik.

b) Validitas Eksternal

Konsep validitas eksternal membahas kesesuaian antara

generalisasi hasil penelitian dengan keadaan yang sebenarnya.

Untuk mendapatkan hasil validitas eksternal dapat dilakukan

dengan memilih sampel yang tepat dari populasi yang diteliti.

51
2. Validitas Item (Item Validity)

Item merupakan bagian dari sebuah instrumen, sehingga dalam

memaknai validitas item ini tidak terlalu menyamakannya dengan

validitas seluruh item atau validitas instrumen. Validitas item merujuk

pada tingkat kesesuaian item (butir soal) dengan perangkat soal-soal

lainnya, secara sederhana dapat pula dinyatakan bahwa yang dimaksud

validitas item adalah tingkat korelasi antara skor butir soal (item)

dengan skor total (seluruh).

3. Validitas Alat Ukur (Test Validity)

Konsep validitas alat ukur merujuk pada makna kemampuan sebuah

alat ukur (instrumen/ skala/ tes) untuk mengukur apa yang seharusnya

diukur. Cara yang dapat digunakan untuk menghitung koefisien

validitas alat ukur adalah sebagai berikut (Kerlinger, 2006):

a) Validitas Isi (Content-Related Validation)

Validitas isi merupakan seperangkat item-item tes yang

menunjukkan sejauhmana isi dari item-item tersebut memang

mengukur apa yang hendak diukur. Dengan menggunakan

spesifikasi tes yang telah dikembangkan (telah ada), kemudian

dilakukan analisis logis untuk menetapkan apakah item-item yang

telah dikembangkan tersebut mengukur apa yang hendak diukur.

52
b) Validitas Konstruk (Construct Corelated Validation)

Validitas konstruk mengukur mengenai sejauh mana skor-skor

hasil pengukuran dengan instrumen itu sesuai atau tidak dengan

teori yang mendasari penyusunan alat ukur tersebut. Validasi

konstruk ini merupakan proses yang kompleks, yang memerlukan

analisis logis dan dukungan data empiris.

Teknik-teknik yang dapat digunakan untuk mengukur validitas

konstruk adalah sebagai berikut (Suryabratha, 2005):

1) Analisis faktor

Dasar pemikiran penerapan analisis faktor untuk validasi

adalah bahwa walaupun perilaku manusia itu sangat banyak

ragamnya, namun perilaku yang sangat beragam itu didasari

oleh sejumlah faktor yang terbatas. Dengan analisis faktor

dapat ditemukan faktor-faktor yang mendasari perilaku yang

beragam tersebut. Tinggi-rendahnya validitas konstruk suatu

alat tes tercermin pada sejauh mana muatan faktor yang

diperoleh dari analisis faktor ini berkontribusi pada teori yang

mendasarinya.

53
2) Korelasi dengan tes lain

Korelasi antara tes baru dengan tes lama yang serupa

menunjukkan bahwa tes baru juga mengukur konstruk yang

kurang lebih sama. Korelasi dengan tes lain dilakukan untuk

menunjukkan bahwa tes baru bebas dari pengaruh faktor-faktor

yang tidak relevan.

3) IRT (Item Responses Theory)

Analisis item-item secara modern yaitu penelaahan item

dengan menggunakan Item Respons Theory (IRT) atau teori

jawaban terhadap item. Teori ini merupakan suatu teori yang

menggunakan fungsi matematika untuk menghubungkan antara

peluang menjawab benar suatu skala dengan kemampuan testee

(Umar, 2008). Teori ini menjelaskan tentang apa yang terjadi

jika seseorang menempuh satu butir item. Menurut teori ini,

jika satu butir item dengan tingkat kesukaran tertentu ditempuh

oleh ribuan orang yang kemampuannya berbeda-beda, maka

orang yang kemampuannya lebih tinggi akan memiliki peluang

yang lebih besar untuk menjawab benar pada item tersebut

dibandingkan dengan orang yang kemampuannya lebih rendah.

Atau dengan kata lain, makin tinggi kemampuan seseorang

makin tinggi pula peluangnya untuk menjawab benar pada satu

butir item, dan sebaliknya.

54
c) Validitas Berdasarkan Kriteria (Criterion-Related Validation)

Prosedur validitas kriteria menunjukkan efektivitas dari suatu tes

dalam meramalkan kinerja seseorang pada aktivitas tertentu.

Kriteria pengukuran untuk validitas skor tes dapat diperoleh dalam

waktu yang bersamaan dengan skor tes atau dalam interval waktu

tertentu.

Dalam pelaksanaan penelitian ketiga konteks tersebut harus terpenuhi,

agar penelitian yang dilakukan dapat memberikan data yang sebagaimana

diharapkan, sehingga proses pengambilan kesimpulannya juga memiliki nilai

jaminan tinggi.

Penelitian ini menggunakan uji validitas konstruk dengan teknik analisis

faktor. Dengan melakukan uji pengukuran melalui analisis faktor maka dapat

ditemukan variabel yang diukur oleh item-item dan juga dapat dilihat bagaimana

hubungan antar item, item dengan faktor, serta korelasi antar variabel.

2.4.2. Reliabilitas

Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama

ketika mereka diuji-ulang dengan tes yang sama pada kesempatan berbeda atau

dengan seperangkat butir-butir ekuivalen (equivalent items) yang berbeda, atau

dalam kondisi pengujian yang berbeda (Anastasi, 1997).

55
Pendekatan yang dipergunakan untuk menghitung reliabilitas pengukuran

ada bermacam-macam. Berikut ini dikemukakan beberapa cara untuk menghitung

reliabilitas yang dikemukakan oleh Anastasi (1997):

1. Metode Pengujian Kembali (Test-Retest Methods)

Pengukuran terhadap sekelompok subyek dilakukan dua kali dengan

satu alat pengukur. Reliabilitas dihitung dengan cara mengkorelasikan

hasil pengukuran pertama dengan hasil pengukuran kedua. Metode ini

mengandung time sampling error, yaitu kesalahan yang timbul karena

pengukuran pada waktu yang berbeda.

2. Reliabilitas Alat Ukur Alternatif (Alternate-Form Reliability)

Pendekatan tes dilakukan dengan jalan menggunakan dua macam alat

pengukur dimana dua alat pengukur tersebut harus sama. Untuk

mengestimasi reliabilitasnya, maka dua alat ukur tersebut diberikan

pada sekelompok subyek secara berturut-turut. Kemudian hasil

pengukuran dari alat pengukuran yang pertama dicari korelasinya

dengan hasil pengukuran dari alat pengukuran kedua.

3. Metode Konsistensi Internal (Internal Consistency Methods)

Pengestimasian kadar reliabilitas dengan prosedur konsistensi internal

dilakukan dengan memfokuskan diri pada unsur-unsur internal

instrument, yaitu butir-butir pertanyaan atau item. Jadi, estimasi itu

56
cukup dilakukan berdasarkan kekuatan tiap-tiap butir pertanyaan yang

secara keseluruhan membentuk N item, dan tidak membutuhkan data-

data dari hasil pengukuran yang lain sebagaimana kedua prosedur

reliabilitas di atas.

2.5. Gambaran Umum GATB

General Aptitude Test Batteray (GATB) diciptakan oleh Charles E. Odell dari

United States Employes Services dan mulai dikembangkan pada tahun 1940.

General Aptitude The Battery (GATB) telah digunakan sejak 1947 oleh State

Employment service yang bergabung dengan United States Employment Service

untuk memenuhi kebutuhan tes yang bisa dipergunakan untuk berbagai tujuan

(multipurposes). Sejak masa itu, GATB telah dimasukkan kedalam program

penelitian yang berkelanjutan untuk menjadikannya tes yang akurat terhadap

kesuksesan pada berbagai pekerjaan yang berbeda. Karena dasar risetnya yang

luas, GATB dikenal sebagai sejumlah tes bakat ganda yang akurat dalam

pengadaanya untuk digunakan dalam bimbingan jurusan dan menilai kecerdasan

umum dari seseorang.

Kemampuan yang diukur oleh General Aptitude Test Battery adalah

sebagai berikut (Lynne Bezanson dalam Jigau, 2007):

57
a. Aptitude G (General Learning Ability)

Kemampuan untuk menangkap atau untuk memahami pelajaran dan

prinsip-prinsip yang mendasari suatu hal. Kemampuan untuk menalar

dan menyatakan pendapat atau mengambil keputusan.

b. Aptitude V (Verbal Aptitude)

Kemampuan untuk memahami arti kata-kata dan ide-ide,

menghubungkannya dan menggunakannya dengan baik. Kemampuan

untuk memahami bahasa, memahami hubungan diantara kata-kata, dan

memahami arti kalimat dan paragraph secara jelas dalam setiap bentuk

lisan maupun tulisan.

c. Aptitude N (Numerical Aptitude)

Kemampuan untuk mengoperasikan aritmatik seperti menjumlahkan,

mengalikan, mengurangi, dan membagi dengan cepat dan tepat.

d. Aptitude S (Spatial Aptitude)

Kemampuan untuk menggambarkan secara visual bentuk-bentuk

geometric dan memahami objek-objek dua dimensi serta

menggambarkan objek-objek dalam tiga dimensi. Kemampuan untuk

mengenali relasi ruang yang diakibatkan bergeraknya objek-objek dalam

ruang.

58
e. Aptitude P (Form Perception)

Kemampuan untuk melihat seluk beluk atau detail yang penting dalam

objek-objek, gambar-gambar, atau grafik. Kemampuan untuk melihat

persamaan dan perbedaan dalam corak dan bentuk bilangan, panjang dan

lebar atau garis-garis.

f. Aptitude Q (Clerical Perception)

Kemampuan untuk melihat seluk-beluk atau detail dari bahan-bahan

tertulis atau yang disajikan dalam bentuk table-tabel. Kemampuan untuk

melihat perbedaan salinan, untuk mengoreksi kata-kata dan angka-angka

dalam cetak coba, dan untuk menghindari penyimpangan dalam

mengerjakan aritmatik yang sederhana.

g. Aptitude K (Motor Coordination)

Kemampuan untuk mengkoordinasikan mata dan tangan atau jari dengan

cepat dan akurat dalam membuat gerakan yang tepat dengan

kecepatan. Kemampuan untuk membuat respon gerakan akurat dan

cepat.

h. Aptitude F (Finger Dexterity)

Kemapuan untuk menggerakkan jari tangan dan menangani objek-objek

yang kecil dengan cepat dan akurat

59
i. Aptitude M (Dexterity Manual)

Kemampuan untuk menggerakkan tangan dengan mudah dan

terampil. Kemampuan untuk bekerja dengan tangan dalam menempatkan

dan mengubah gerakan.

Dewasa ini GATB meliputi 12 tes; 4 tes membutuhkan alat sederhana,

sementara 8 tes yang lainnya hanya menggunakan kertas dan pensil. Keseluruhan

kumpulan tes dapat diselenggarakan dalam waktu kurang lebih 2,5 jam (Anastasi,

1997). Adapun subtes yang terdapat dalam GATB adalah sebagai berikut:

a. Bagian 1 - Membandingkan nama-nama (name comparison). 6 menit,

skor maksimal 150.

Tes ini berisi dua kolom nama. Peserta tes memeriksa masing-masing

kolom, dan menunjukkan apakah nama-nama yang ada sama atau

berbeda. Subtest ini mengukur persepsi klerikal (clerical perception)

b. Bagian 2 - Perhitungan (computation). 6 menit, skor maksimal 50.

Tes ini berisi suatu latihan bilangan aritmatik yang membutuhkan

penjumlahan, pengurangan, perkalian, atau pembagian seluruh

bilangan. Subtes ini mengukur kemampuan numerik (numerical

aptitude)

c. Bagian 3 - Tiga dimensi ruang (three dimensional space). 6 menit, skor

maksimal 40.

60
Tes ini berisi empat rangkaian gambar dengan objek tiga dimensi.

Gambar perangsang disajikan sebagai suatu potongan-potongan metal

yang datar dimana salah satu berputar-putar (berguling-guling) atau

keduanya. Garis-garis mengindikasikan dimana salah satu dari empat

gambar dengan objek tiga dimensi bisa dibentuk dari gambar

perangsang. Subtes ini mengukur kemampuan pengetahuan umum dan

kemampuan ruang (general learning ability & spatial aptitude).

d. Bagian 4 – Perbendaharaan kata (Vocabulary). 6 menit, skor maksimal

60.

Tes ini berisi empat set kata-kata. Peserta tes menunjukkan dua kata-

kata yang sama atau arti kata yang berlawanan. Subtes ini mengukur

kemampuan pengetahuan umum dan kemampuan verbal (general

learning ability & verbal aptitude).

e. Bagian 5 – Mencocokkan alat-alat (tool matching). 5 menit, skor

maksimal 49.

Tes ini berisi serangkaian latihan yang mengandung suatu gambar

perangsang dan empat gambar hitam-putih alat-alat perlengkapan

bengkel yang sederhana. Peserta tes menunjukkan mana dari empat

gambar hitam-putih itu yang sama seperti pada gambar perangsang.

Variasi yang ada hanya mendistribusikan masing-masing gambar hitam

putih. Subtes ini mengukur persepsi bentuk (form perception).

61
f. Bagian 6 – Penalaran aritmatik (arithmetic reason). 7 menit, skor

maksimal 25.

Tes ini berisi masalah angka aritmatik yang diekspresikan secara verbal.

Subtes ini mengukur kemampuan pengetahuan umum dan kemampuan

numerik (general learning ability & numerical aptitude).

g. Bagian 7 – Mencocokkan bentuk (form matching). 6 menit, skor

maksimal 60.

Tes ini berisi dua kelompok dengan berbagai cara dibentuk gambar

yang berpotongan. Peserta tes menunjukkan gambar mana dalam

kelompok kedua-duanya persis (tepat) sama ukurannya dan bentuk

potongannya seperti masing-masing gambar dalam kelompok

perangsang pertama. Subtes ini mengukur persepsi bentuk (form

perception).

h. Bagian 8 – Membuat tanda-tanda (mark making). 60 menit, skor

maksimal 130.

Tes ini berisi suatu rangkaian hasil perkalian (kuadrat), dimana peserta

tes membuat tiga tanda pensil, dikerjakan secepat-cepatnya. Tanda-

tanda yang dibuat dengan garis-garis pendek, dua garis vertical dan tiga

garis horizontal dibawahnya. Subtes ini mengukur koordinasi gerak

(motor coordination).

62
i. Bagian 9 – Menempatkan (place). 3 percobaan, masing-masing waktu

15 menit, skor maksimal 144.

Peralatan yang digunakan untuk tes ini berisi 10 bagian papan pasak

empat persegi panjang yang dibagi dalam dua bagian, masing-masing

berisi 48 lubang. Pelaksanaan ini dilakukan dalam tiga waktu, dimana

peserta tes harus bekerja dengan cepat untuk memindahkan sebanyak

mungkin pasak selama waktu yang disediakan. Tiga percobaan

diberikan untuk dilakukan. Subtes ini mengukur kecekatan tangan

(manual dexterity).

j. Bagian 10 – Memutar (turn). 3 percobaan, masing-masing 30 menit,

skor maksimal 144.

Tes ini menggunakan perlatan. Peralatan yang digambarkan dalam

bagian 9 juga digunakan dalam tes ini. Peserta tes bekerja dengan cepat

untuk memutar dan menempatkan kembali secepat mungkin pasak yang

berbentuk silinder selama waktu yang disediakan. Tiga percobaan

diberikan untuk dilakukan. Subtes ini mengukur kecekatan tangan

(manual dexterity).

k. Bagian 11 – Memasang (assemble). 90 detik, skor maksimal 50.

Tes ini menggunakan peralatan. Peralatan yang digunakan untuk tes ini

dan bagian 12 yang berisi papan persegi panjang kecil (papan kecekatan

tangan) berisi 50 lubang, dan menyediakan paku penyumbat kecil dari

63
metal dan cincin penutup (ring). Peserta tes bekerja dengan cepat dalam

memindahkan dan menempatkan setepat mungkin. Subtes ini mengukur

kecekatan tangan (manual dexterity).

l. Bagian 12 – Membongkar (disassemble). 60 detik, skor maksimal 50.

Tes ini mempergunakan peralatan yang sama seperti digambarkan pada

bagian 11. Peserta tes memindahkan paku sumbat kecil dari metal

memasang suatu lubang dalam papan bagian bawah, mendorong ring

pada dasar papan, meletakkan ring pada tangkai dengan satu tangan dan

paku sumbat ke dalam lubang yang cocok pada papan bagian atas

dengan tangan yang lainnya. Peserta tes bekerja dengan cepat untuk

memindahkan dan menempelkan paku sumbat dan ring setepat mungkin

selama waktu yang disediakan. Subtes ini mengukur kecekatan tangan

(manual dexterity).

Kumpulan tes ini menghasilkan skor pada sembilan faktor dan pada tiga

ukuran komposit utama yang ditarik dari faktor-faktor tersebut, keseluruhannya

didaftarkan pada tabel 2.1 berikut ini (Anastasi & Urbina, 1997):

64
Tabel 2.1

Faktor-Faktor dan Komposit General Aptitude Test Battery (GATB)

Faktor-faktor

G: Kemampuan Belajar S: Kemampuan Ruang K: Koordinasi Motor

Umum

V: Kemampuan Verbal P: Persepsi Bentuk F: Kelincahan Jari-jari

N: Kemampuan Numerik Q: Persepsi Klerikal M: Kelincahan Manual

Komposit

Kognitif = G + V + N Perseptual = S + P + Q Psikomotorik = K + F + M

Sumber: Anastasi & Urbina, 1997, hal.498

2.6. Kerangka Berpikir

Dari latar belakang dan teori yang sudah ada, maka dapat disimpulkan dalam

suatu kerangka sebagai berikut:

65
Diagram 2.2

Kerangka Berpikir Berdasarkan Subtes

Diagram 2.3

Kerangka Berpikir Berdasarkan Sebaran Item

66
2.7. Hipotesis

Sesuai dengan kerangka berpikir yang telah digambarkan, maka dapat disusun

hipotesis sebagai berikut:

1. Bahwa seluruh item dalam empat subtes GATB yang dijadikan penelitian

mengukur konstruk yang dimaksud. Konstruk yang dimaksud adalah

computation, three dimensional space, vocabulary, dan three dimensional

space. Dimana setiap item dalam masing-masing subtes adalah fit (sesuai)

dengan model satu faktor, yang berarti semua item pada subtes mengukur

hanya satu kemampuan yang didefinisikan pada subtes tersebut, dan

setiap item dalam masing-masing subtes menghasilkan informasi secara

signifikan tentang kemampuan pada subtes tersebut.

2. Bahwa empat subtes GATB adalah fit (sesuai) dengan model satu faktor,

yaitu semua subtes mengukur satu faktor umum yang dalam hal ini adalah

“inteligensi”

67
BAB III

METODE PENELITIAN

Hal yang hendak diteliti dalam penelitian ini adalah tingkat validitas alat tes

GATB. Selanjutnya untuk menjawab pertanyaan penelitian ini ada beberapa hal

yang dirancang oleh peneliti, diantaranya Subjek Penelitian, Instrumen Penelitian,

Metode Analisis Data, dan Prosedur Penelitian.

3.1. Subjek Penelitian

Penelitian ini hendak menguji validitas dari alat tes GATB. Untuk menguji

validitas tersebut digunakan pendekatan uji validitas konstruk yang akan

menentukan apakah setiap subtes dalam GATB mengukur komponen yang dapat

mengukur general intelligence. Dalam penelitian ini peneliti menggunakan data

mentah yang tersedia di Divisi Asesmen SDM PPM Manajemen. Data yang

digunakan merupakan hasil dari rekruitmen karyawan PT Semen Tonasa yang

menjalani tes di Jakarta. Pelaksanaan tes dilakukan pada tahun 2009 dan ditempuh

oleh 3257 orang. Karakteristik dari para peserta tes pada data yang tersedia ini

adalah sebagai berikut:

a. Umur 22-32 tahun

b. Tingkat pendidikan minimal D3

68
3.2. Instrumen Penelitian

Dalam penelitian ini, GATB dijadikan short form dengan empat subtes yang

memiliki jumlah item sebanyak 175, dikarenakan keempat subtes tersebut

mengukur kognisi atau inteligensi dari seseorang dan dari hasil penilaian tes

tersebut dapat menghasilkan skor IQ seseorang. Keempat subtes tersebut adalah:

1. Subtes kemampuan numerik (computation). 6 menit, skor maksimal 50.

Tes ini berisi suatu latihan bilangan aritmatik yang membutuhkan

penjumlahan, pengurangan, perkalian, atau pembagian seluruh bilangan.

Subtes ini mengukur kemampuan numerical (numerical aptitude)

Contoh Soal:

1) Kurang (-) A. 2
9 B. 3
4 C. 5
D. 9
E. Selain di atas

2. Subtes tiga dimensi ruang (three dimensional space). 6 menit, skor

maksimal 40.

Tes ini berisi empat rangkaian gambar dengan objek tiga dimensi.

Gambar perangsang disajikan sebagai suatu potongan-potongan metal

yang datar dimana salah satu berputar-putar (berguling-guling) atau

keduanya. Garis-garis mengindikasikan dimana salah satu dari empat

gambar dengan objek tiga dimensi bisa dibentuk dari gambar

69
perangsang. Subtes ini mengukur kemampuan pengetahuan umum dan

kemampuan ruang (general learning ability & spatial aptitude).

Contoh Soal:

3. Subtest kemampuan verbal (Vocabulary). 6 menit, skor maksimal 60.

Tes ini berisi empat set kata-kata. Peserta tes menunjukkan dua kata-

kata yang sama atau arti kata yang berlawanan. Subtes ini mengukur

kemampuan pengetahuan umum dan kemampuan verbal (general

learning ability & verbal ability).

Contoh Soal:

1) A. Besar B. Luas C. Kering D. Lambat

4. Subtes penalaran aritmatik (arithmetic reason). 7 menit, skor maksimal

25.

Tes ini berisi masalah angka aritmatik yang diekspresikan secara verbal.

Subtes ini mengukur kemampuan pengetahuan umum dan kemampuan

numerical (general learning ability & numerical aptitude).

70
Contoh Soal:

1) Satu bagian pekerjaan dapat diselesaikan A. 8


dalam waktu setengah jam. B. 10
Berapa bagian pekerjaan yang dapat C. 16
diselesaikan dalam waktu 8 jam? D. 24
E. Selain di atas

Subjek penelitian diminta untuk mengerjakan item pertanyaan sesuai

dengan waktu yang telah disediakan. Jawaban diberikan oleh subjek dengan

memilih 4 pilihan jawaban yang telah disediakan dimana diantara keempat

tersebut terdapat satu jawaban yang benar. Khusus untuk subtes vocabulary dalam

satu item pertanyaan terdapat dua jawaban yang benar dan saling berkaitan. Untuk

penskoran, apabila subjek menjawab dengan benar maka akan mendapatkan nilai

1 dan mendapatkan nilai 0 apabila menjawab dengan salah.

3.3. Metode Analisis Data

Metode analisis yang digunakan dalam penelitian ini adalah metode analisis

faktor. Pada dasarnya terdapat dua jenis pandangan mengenai analisis faktor,

yaitu: Exploratory Factor Analysis (EFA) dan Confirmatory Factor Analysis

(CFA). Analisis faktor pada awalnya dikemukakan oleh Spearman (1940) yang

pada saat ini dikenal dengan Exploratory Factor Analysis (EFA). Dalam EFA,

peneliti tidak memiliki ekspektasi tertentu mengenai jumlah atau sifat faktor yang

mendasari konstruk. Metode analisis faktor yang lebih modern adalah

Confirmatory Factor Analysis (CFA). Dalam CFA, peneliti harus memiliki

gambaran yang spesifik mengenai (a) jumlah faktor, (b) variabel yang

71
mencerminkan suatu faktor, dan (c) faktor-faktor yang saling berkolerasi

(Thompson, 2004).

Dalam rangka penelitian mengenai studi validitas konstruk General

Aptitude Test Battery (GATB) maka penulis menggunakan metode analisis faktor

Confirmatory Factor Analysis (CFA) dengan program lisrel 8.70. Alasan penulis

menggunakan CFA sebagai metode dalam penelitian karena dengan menggunakan

CFA maka setiap dimensi dapat diuji satu persatu. Validitas dari masing-masing

item juga dapat diuji dan digambarkan dalam matriks korelasi CFA.

Confirmatory Factor Analysis (CFA) adalah model teori-pengujian yang

bertentangan dengan metode teori yang menghasilkan faktor seperti eksploratori.

Dalam Confirmatory Factor Analysis (CFA), penelitian dimulai dengan membuat

hipotesis sebelum analisis. Model, atau hipotesis dengan spesifik menentukan

variabel mana yang akan berkolerasi dengan faktor dan faktor mana yang

berkolerasi. Hipotesis ini didasarkan pada teori yang kuat atau landasan empiris.

Tujuan dari CFA adalah (Umar, 2011) :

1. Untuk menguji hipotesis tentang satu atau lebih faktor serta saling

keterkaitan antara faktor tersebut sesuai model teori yang ditetapkan.

2. Untuk menguji validitas dari setiap indikator yang digunakan untuk

mengukur faktor atau konstruk tersebut.

CFA sering digunakan dalam proses pengembangan skala untuk

memeriksa struktur laten dari suatu alat tes (Brown, 2006). Dalam konteks ini,

72
CFA digunakan untuk verifikasi jumlah dimensi yang mendasari instrumen

(faktor) dan pola hubungan item dengan faktor (factor loading). Hasil CFA dapat

memberikan bukti kuat dari validitas convergent dan diskriminan dari sebuah

konstruk teoritis. Validitas konvergen diindikasikan oleh bukti bahwa alat tes

dengan konstruk yang sama dan secara teori juga mengukur hal yang sama, maka

korelasi antar tes tersebut tinggi. Sedangkan validitas diskriminan diindikasikan

oleh hasil yang menunjukkan bahwa indikator secara teoritis berbeda konstruksi

tidak saling berkorelasi tinggi..

Alat tes dikatakan bias ketika beberapa item tidak mengukur konstruk

yang mendasarinya jika dibandingkan dengan seluruh kelompok. Adapun logika

dasar dari CFA adalah sebagai berikut (Umar, 2011):

1. Sebuah konsep atau trait berupa kemampuan yang didefinisikan

secara operasional sehingga dapat disusun pertanyaan atau

pernyataan untuk mengukurnya. Kemampuan ini disebut faktor.

Sedangkan pengukuran terhadap faktor ini dilakukan melalui analisis

terhadap respon (jawaban) atas item-itemnya.

2. Setiap item diteorikan hanya mengukur atau memberi informasi

tentang satu faktor tertentu saja. Artinya baik item maupun subtes

bersifat unidimensional.

3. Berdasarkan teori yang dipaparkan di atas, dapat disusun

sehimpunan persamaan matematis. Persamaan tersebut dapat

digunakan untuk memprediksi (dengan menggunakan data yang

73
tersedia) matriks korelasi antar item yang seharusnya akan diperoleh

jika teori tersebut (unidimensional) benar. Matriks korelasi ini

dinamakan sigma (Σ). Kemudian matriks ini akan dibandingkan

dengan matriks korelasi yang diperoleh secara empiris dari data

(disebut matriks S). Jika teori tersebut benar (unidimensional), maka

seharusnya tidak ada perbedaan yang signifikan antara elemen

matriks Σ dengan elemen matriks S. Secara matematis dapat

dituliskan: S-Σ=0

4. Pernyataan matematik inilah yang dijadikan hipotesis nihil yang

akan dianalisis menggunakan CFA. Dalam hal ini dilakukan uji

signifikasi dengan Chi Square. Jika Chi Square yang dihasilkan tidak

signifikan (nilai p>0,05), maka dapat disimpulkan, bahwa hipotesis

nihil yang menyatakan: “tidak ada perbedaan antara matriks S dan

Σ” tidak ditolak. Artinya teori yang menyatakan bahwa ke 20 item

tersebut semuanya mengukur hal yang sama, yaitu kemampuan

berpikir analogis, dapat diterima kebenarannya (didukung oleh data).

Sebaliknya, jika nilai Chi Square yang diperoleh signifikan, maka

hipotesis nihil S- Σ =0 ditolak. Artinya teori tersebut tidak didukung

data (ditolak).

5. Jika teori diterima (model fit), langkah selanjutnya, adalah menguji

hipotesis tentang signifikan tidaknya masing-masing item dalam

mengukur apa yang hendak diukur (kemampuan berpikir analogis).

Uji hipotesis ini dilakukan dengan t-test. Jika nilai t signifikan,

74
berarti item yang bersangkutan signifikan dalam mengukur apa yang

hendak diukur. Dengan cara seperti ini, dapat dinilai butir item yang

mana yang valid dan yang tidak valid di dalam konteks validitas

konstruk. Dengan kata lain, analisis faktor konfirmatori dalam hal ini

adalah pengujian terhadap hipotesis nihil (H0): S - Σ = 0. Artinya,

tidak ada perbedaan antara matriks korelasi yang diharapkan oleh

teori dengan matriks korelasi yang diperoleh dari hasil observasi.

6. Persamaan matematis pada butir tiga di atas adalah persamaan

regresi untuk setiap butir soal dalam hubungannya dengan faktor

yang diukur yaitu:

X1= λ1F+δ1

Dimana:

X1 = Skor yang diperoleh pada item no.1

F = Konstruk yang hendak diukur (faktor)

λ1 = Koefisien Regresi untuk item no. 1 dalam mengukur F,

disebut juga sebagai ”koefisien muatan faktor”

δ1 = Segala hal yang mempengaruhi Varians X1 (selain F),

disebut juga ”kesalahan pengukuran”

Untuk menguji validitas alat ukur yang digunakan dalam penelitian ini,

peneliti menggunakan Confirmatory Factor Analysis (CFA) dengan bantuan

75
software Lisrel 8.70 (Joreskog dan Sorbom, 2006). Adapun langkah-langkah yang

dilakukan untuk mendapatkan kriteria hasil CFA yang baik adalah (Umar, 2011):

1. Dilakukan uji CFA dengan model satu faktor dan dilihat nilai Chi-

Square yang dihasilkan. Jika nilai Chi-Square tidak signifikan (p >

0.05) berarti semua item hanya mengukur satu faktor saja. Namun

jika nilai Chi-Square signifikan (p < 0.05), maka perlu dilakukan

modifikasi terhadap model pengukuran yang diuji sesuai langkah

kedua berikut ini.

2. Jika nilai Chi-Square signifikan (p < 0.05), maka dilakukan

modifikasi model pengukuran dengan cara membebaskan parameter

berupa korelasi kesalahan pengukuran. Ini terjadi ketika suatu item

selain mengukur konstruk yang ingin diukur, item tersebut juga

mengukur hal yang lain (mengukur lebih dari satu konstruk /

multidimensional). Jika setelah beberapa kesalahan pengukuran

dibebaskan untuk saling berkorelasi dan akhirnya diperoleh model

yang fit, maka model terakhir inilah yang akan digunakan pada

langkah selanjutnya.

3. Jika telah diperoleh model yang fit, maka dilakukan analisis item

dengan melihat apakah muatan faktor item tersebut signifikan dan

mempunyai koefisien positif. Melihat signifikan tidaknya item

tersebut mengukur faktornya, dengan cara melihat t-value koefisien

muatan faktor item. Jika t > 1.96 maka item tersebut signifikan dan

tidak akan di drop, begitu pun sebaliknya.

76
4. Setelah itu dilihat apakah ada item yang muatan faktornya negatif.

Dalam hal ini, jika ada pernyataan negatif, maka ketika dilakukan

skoring terhadap item, arah skoringnya dirubah menjadi positif. Jika

setelah diubah arah skoringnya masih terdapat item bermuatan faktor

negatif, maka item tersebut akan di drop.

5. Apabila kesalahan pengukurannya berkorelasi terlalu banyak dengan

kesalahan pengukuran pada item lain, maka item seperti ini pun

dapat di drop karena bersifat multidimensi yang sangat kompleks.

6. Jika dilakukan CFA dengan model satu faktor tidak diperoleh model

yang fit, maka dapat dilakukan analisis dengan menggunakan model

dua faktor dan mengulang tahap dua sampai lima hingga didapatkan

model yang paling fit.

Dalam GATB, ada empat faktor yang diteorikan untuk diukur. Oleh sebab

itu, dalam penelitian ini dilakukan empat kali uji validitas konstruk (untuk setiap

subtes) yang masing-masing terdiri dari dua jenis analisis statistik, yaitu:

1. Menguji teori yang menyatakan bahwa semua item pada satu

subtes bersifat unidimensional (mengukur apa yang hendak diukur)

2. Menguji tingkat signifikansi setiap butir soal dalam mengukur apa

yang hendak diukur.

Selanjutnya, dalam GATB juga diteorikan bahwa keempat faktor (subtes)

tersebut adalah mengukur satu hal (dimensi) yang sama yaitu kognitif (general

intelligence). Hanya saja, disini berkenaan dengan hubungan antara subtes dan

77
general intelligence. Artinya, dapat dilakukan analisis faktor konfirmatori seperti

yang dilakukan pada masing-masing subtes, tetapi yang dijadikan datanya disini

adalah skor subtes, sedangkan faktornya adalah general intelligence. Namun

demikian, peneliti akan melakukan kedua jenis analisis faktor tersebut secara

simultan (untuk subtes dan general intelligence ).

Dengan kata lain, diteorikan bahwa item-item mengukur faktor tingkat

satu (subtes) dan selanjutnya faktor-faktor tersebut (subtes) mengukur faktor

tingkat dua yang lebih umum yaitu general intelligence. Analisis faktor

konfirmatori secara simultan (sekaligus seperti ini) disebut second order

confirmatory factor analysis. Dalam hal ini, subtes adalah faktor tingkat (orde) ke

satu dan general intelligence adalah faktor tingkat (orde) kedua.

3.4. Prosedur Penelitian

Penelitian ini dilaksanakan melalui beberapa tahapan, yaitu: prosedur penelitian

melalui data sekunder pada tes masuk calon karyawan PT Semen Tonasa di PPM

yang jumlahnya 3257 orang pada tahun 2009 di Jakarta. Sebelum memproses

data, diadakan pengamatan terbatas dengan cara mewawancarai Divisi Asesmen

SDM PPM Manajemen perihal kegiatan asesmen dan rekruitmen serta

mengobservasi kegiatan asesmen yang dilakukan oleh mereka. Studi awal ini

bertujuan untuk memperjelas permasalahan sebagai langkah awal dalam

penelitian, dengan ini dapat diketahui:

78
1. Perumusan masalah.

2. Studi kepustakaan guna mendapatkan gambaran dan landasan

teoritis yang tepat mengenai variabel penelitian.

3. Surat izin melakukan penelitian kepada pihak fakultas Psikologi

dan meminta izin melakukan penelitian pada Divisi Asesmen

SDM PPM Manajemen.

4. Pengujian terhadap data mentah yang sudah ada.

79
BAB IV

HASIL PENELITIAN

Sejalan dengan judul penelitian, uji validitas konstruk akan dilakukan per subtes

untuk mengukur mengenai sejauh mana skor-skor hasil pengukuran item dengan

instrumen sesuai atau tidak dengan teori yang mendasari penyusunan alat ukur

tersebut. Pengujian validitas konstruk dilakukan melalui dua tahap:

1. Menguji hipotesis tentang model teori yang mengatakan bahwa item pada

masing-masing subtes mengukur satu faktor saja. Secara teknis, yang diuji

adalah tentang ada tidaknya perbedaan yang signifikan antara matriks

korelasi yang diharapkan atau diprediksi oleh teori dengan yang diperoleh

dari data.

2. Menguji hipotesis apakah setiap butir item itu memberikan informasi yang

signifikan mengenai aspek yang hendak diukur.

Kedua tahapan ini dilakukan dengan menggunakan teknik Confirmatory

Factor Analysis (CFA). Berikut ini dipaparkan hasil penelitian baik pada tingkat

subtes maupun pada tingkat general intelligence:

4.1. Validitas Konstruk Tingkat Subtes

4.1.1. Validitas Konstruk Subtes Computation

Hasil perhitungan awal untuk subtes computation dengan model satu faktor

(unidimensional) tidak fit, karena didapatkan Chi - Square = 1557.36, df = 1175,

P-value = 0.00000 RMSEA = 0.010. Setelah dilakukanlah modifikasi terhadap

80
model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap

item saling berkorelasi satu dengan lainnya, maka didapatkanlah model fit dengan

P>0,05 (tidak signifikan). Dengan demikian model dengan hanya satu faktor dapat

diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu

computation. Namun karena pada model ini ada beberapa item yang kesalahannya

saling berkolerasi, dapat disimpulkan bahwa beberapa item tersebut sebenarnya

bersifat multidimensional.

Pada awalnya df berjumlah 1175, namun setelah mencapai model fit, df

tersisa menjadi 1152. Ini berarti dalam perhitungan awal terdapat 1175-1152 = 23

korelasi yang dibebaskan. Sesuai dengan teori yang telah dikemukakan

sebelumnya, apabila ada item yang kesalahan pengukurannya saling berkolerasi

maka item tersebut bersifat multidimensional. Artinya, selain mengukur apa yang

hendak diukur oleh subtes yang bersangkutan, ada hal yang lain yang diukur oleh

item tersebut. Semakin banyak kesalahan pada sebuah item saling berkolerasi

dengan kesalahan pengukuran pada item lainnya, maka rendah atau tidak ideal

kualitas item tersebut.

Dari 50 item yang mengukur subtes computation, terdapat 22 item yang

tidak signifikan, karena nilai t lebih kecil dari 1, 96 (absolute) dan bernilai negatif.

Kedua puluh dua item inilah yang harus di-drop, yaitu item nomor 4, 5, 6, 7, 8, 9,

10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, dan 25.

Untuk mendapatkan hasil dengan item yang benar-benar murni, maka

dilakukan analisis ulang setelah seluruh item yang tidak signifikan dan bernilai

81
negatif dibuang. Hasil yang diperoleh untuk perhitungan kedua pada subtes

computation dengan model satu faktor (unidimensional) dan item negatif yang

sudah di-drop adalah tidak fit, didapatkan Chi Square = 515.28, df = 350, P-value

= 0.00000 RMSEA = 0.012. Kemudian dilakukan modifikasi kembali terhadap

model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap

item saling berkolerasi satu dengan lainnya, maka didapatkanlah model fit seperti

pada gambar 4.1 berikut ini:

82
Gambar 4.1

Analisis Faktor Konfirmatorik untuk Subtes Computation

Terlihat dari gambar 4.1, bahwa nilai Chi Square menghasilkan p > 0,05

(tidak signifikan). Dengan demikian, model dengan hanya satu faktor dapat

diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu

83
computation. Pada model ini, terdapat 12 pasang korelasi antar item (tabel 4.1)

yaitu item 3 yang berkolerasi dengan item 35, 40, 41, 43, 45, dan 49. Item 27

yang berkolerasi dengan item 26. Item 28 berkolerasi dengan item 26 dan 27. Item

30 berkolerasi dengan item 28, item 47 yang berkolerasi dengan item 39 dan item

48 yang berkolerasi dengan item 47.

Tabel 4.1

Matriks korelasi antar kesalahan pengukuran butir item pada


Computation
Item 1 2 3 26 27 28 29 30 31 32 33 34 35 36
1 1
2 1
3 1
26 1
27 0.70 1
28 0.58 0.53 1
29 1
30 0.53 1
31 1
32 1
33 1
34 1
35 -0.62 1
36 1
37
38
39
40 -0.65
41 -0.56
42
43 -0.59
44
45 -0.72
46
47
48
49 -0.57
50

84
Tabel 4.1

Matriks korelasi antar kesalahan pengukuran butir item pada


Computation (Lanjutan)

Item 37 38 39 40 41 42 43 44 45 46 47 48 49 50
37 1
38 1
39 1
40 1
41 1
42 1
43 1
44 1
45 1
46 1
47 -1.04 1
48 -0.94 1
49 1
50 1
Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan

Selanjutnya kualitas item dapat dilihat dari signifikan atau tidaknya item

tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal ini,

yang diuji adalah hipotesis nihil dari muatan faktor. Pengujiannya dilakukan

dengan melihat nilai t bagi setiap koefisien muatan faktor seperti pada tabel 4.2

berikut ini:

85
Tabel 4.2
Muatan Faktor Item GATB subtes Computation

Item Koefisien Standar Error T- Value Signifikan


1 0.58 0.08 7.20 V
2 0.44 0.08 5.41 V
3 0.71 0.08 7.91 V
26 0.27 0.08 3.31 V
27 0.26 0.08 3.27 V
28 0.47 0.08 5.75 V
29 0.42 0.08 5.25 V
30 0.43 0.08 5.29 V
31 0.49 0.08 6.14 V
32 0.52 0.08 6.44 V
33 0.59 0.08 7.37 V
34 0.50 0.08 6.19 V
35 0.64 0.08 7.72 V
36 0.70 0.08 8.73 V
37 0.68 0.08 8.47 V
38 0.69 0.08 8.57 V
39 0.73 0.08 8.98 V
40 0.70 0.08 8.51 V
41 0.74 0.08 9.03 V
42 0.78 0.08 9.75 V
43 0.80 0.08 9.67 V
44 0.70 0.08 8.72 V
45 0.65 0.08 7.90 V
46 0.76 0.08 9.40 V
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan

86
Tabel 4.2
Muatan Faktor Item GATB subtes Computation (Lanjutan)

Item Koefisien Standar Error T-Value Signifikan


47 0.65 0.08 7.89 V
48 0.67 0.08 8.23 V
49 0.70 0.08 8.46 V
50 0.72 0.08 8.94 V
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan

Dari 28 item yang mengukur subtes computation, semua item dinyatakan

signifikan karena nilai t lebih besar dari 1, 96 (absolute) dan bernilai positif. Item

yang paling baik sesuai urutannya: 42, 43, 46, 41, 39, 50, 36, 44, 38, 40, 37, 49,

48, 3, 45, 47, 35, 33, 1, 32, 34, 31, 28, 2, 30, 29, 26, dan 27. Oleh karena itu,

model satu faktor yang diteorikan dalam subtes ini dapat diterima, bahwa setiap

item dalam subtes ini bersifat unidimensional dengan hanya mengukur

computation saja.

4.1.2. Validitas Konstruk Subtes Three Dimensional Space

Hasil perhitungan awal yang diperoleh untuk subtes three dimensional space

dengan model satu faktor (unidimensional) tidak fit, didapatkan Chi Square =

71620.74, df = 740, P-value = 0.00000 RMSEA = 0.172. Setelah dilakukan

modifikasi terhadap model dengan cara membebaskan atau memperbolehkan

kesalahan pada setiap item saling berkolerasi satu dengan lainnya, maka

didapatkanlah model fit dengan P>0,05 (tidak signifikan). Dengan demikian,

model dengan hanya satu faktor tidak dapat diterima, dikarenakan pada model ini

87
terdapat banyak item yang kesalahannya saling berkolerasi sehingga item tersebut

bersifat multidimensional pada dirinya masing-masing, yang berarti seluruh item

selain mengukur three dimensional space juga mengukur hal yang lain.

Pada awalnya didapatkan df dengan jumlah 740, namun setelah mencapai

model fit, df tersisa menjadi 250. Ini berarti pada perhitungan awal terdapat 740-

250= 490 korelasi yang dibebaskan. Sesuai dengan teori yang telah dikemukakan

sebelumnya, apabila ada item yang kesalahan pengukurannya saling berkolerasi

maka item tersebut bersifat multidimensional. Artinya, selain mengukur apa yang

hendak diukur oleh subtes yang bersangkutan, ada hal yang lain yang diukur oleh

item tersebut. Semakin banyak kesalahan pada sebuah item saling berkolerasi

dengan kesalahan pengukuran pada item lainnya, maka rendah atau tidak ideal

kualitas item tersebut. Pada subtes ini, semua item yang terdapat pada subtes three

dimensional space bersifat multidimensional.

Dari 40 item yang mengukur subtes three dimensional space, terdapat

tujuh item yang tidak signifikan, karena nilai t lebih kecil dari 1, 96 (absolute) dan

signifikan namun bernilai negatif . Ke tujuh item inilah yang harus di-drop, yaitu

item nomor 32, 34, 35, 36, 37, 38, dan 40.

Dikarenakan banyaknya korelasi antar item pada subtes three dimensional

space dan masih adanya item yang berkoefisien negatif sedangkan item dengan

koefisien negatif tidak diperbolehkan dalam sebuah tes kemampuan dan untuk

mendapatkan hasil dengan item yang benar-benar murni, maka akan dilakukan

88
analisis kembali dengan cara membuang semua item negatif dan item yang tidak

signifikan pada perhitungan.

Hasil yang diperoleh untuk perhitungan kedua pada subtes three

dimensional space dengan model satu faktor (unidimensional) dan item negatif

yang sudah di drop tidak fit, didapatkan Chi Square = 25586.12, df = 495, P-value

= 0.00000 RMSEA = 0.125. Kemudian dilakukan modifikasi kembali terhadap

model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap

item saling berkolerasi satu dengan lainnya, maka didapatkanlah model fit seperti

pada gambar 4.2 berikut ini:

89
Gambar 4.2

Analisis Faktor Konfirmatorik untuk Subtes Three Dimensional Space

Terlihat dari gambar 4.2, bahwa nilai Chi Square menghasilkan p > 0,05

(tidak signifikan). Dengan demikian, model dengan hanya satu faktor dapat

diterima, namun masih terdapat banyak item yang saling berkorelasi dengan

kesalahan pengukuran pada item lainnya. Hal ini menandakan bahwa beberapa

item tersebut sebenarnya memang bersifat multidimensional. Pada awalnya df

90
berjumlah 495, namun setelah mencapai model fit, df yang tersisa hanya 214. Ini

berarti terdapat 495–214 =281 korelasi kesalahan yang dibebaskan. Kesalahan

pengukuran item-item yang saling berkolerasi disajikan pada tabel 4.3.

Tabel 4.3

Matriks korelasi antar kesalahan pengukuran butir item pada

Three Dimensional Space

Item 1 2 3 4 5 6 7 8 9 10 11
1 1
2 0.25 1
3 0.16 0.05 1
4 0.21 0.08 0.04 1
5 0.13 0.20 0.11 0.12 1
6 0.03 0.03 1
7 0.07 0.10 1
8 -0.04 -0.04 -0.07 1
9 -0.07 -0.03 0.05 1
10 0.03 -0.08 -0.04 1
11 0.06 0.04 0.08 -0.04 0.08 1
12 0.07 0.04 -0.10 -0.07 -0.04 -0.04
13 0.04 -0.05 0.05 -0.07
14 -0.02 -0.04 -0.05 -0.05 -0.06 -0.05
15 0.09 -0.04 -0.05 0.14 0.07 -0.08 -0.03
16 -0.04 0.05 -0.07
17 0.05 0.04 -0.04 0.03 -0.06 -0.05 -0.05 -0.05 -0.07
18 -0.08 0.04 0.06
19 -0.11 0.05
20 -0.03 -0.08 0.03 0.03
21 -0.05 -0.05 -0.06 -0.05 -0.06
22 -0.03 0.05 -0.06 -0.03 0.00
23 0.04 -0.07
24 0.04 -0.05 -0.04 -0.01 0.06
25 -0.05 0.07
26 0.04 0.11 0.03 -0.03 0.07
27 -0.05 0.07 0.06 0.08 0.05 0.08 0.04
28 -0.05 0.03 0.05 -0.03 0.04 0.07 -0.03
29 0.04 -0.05 -0.07 -0.04 -0.03
30 0.02 -0.06 -0.08 -0.08 0.01
31 -0.04 0.06 -0.07 0.07 -0.05
33 0.08 0.07 -0.04 -0.02 0.03 -0.13
39 -0.03 -0.12 -0.07 0.04 0.12 -0.03 -0.08

91
Tabel 4.3

Matriks korelasi antar kesalahan pengukuran butir item pada

Three Dimensional Space (Lanjutan)

Item 12 13 14 15 16 17 18 19 20 21 22
12 1
13 -0.04 1
14 -0.06 1
15 1
16 0.03 0.07 1
17 0.02 -0.05 1
18 -0.04 0.07 1
19 -0.02 0.11 1
20 0.04 -0.04 0.09 0.17 1
21 0.04 0.06 0.06 0.04 1
22 -0.03 -0.05 0.06 0.15 0.16 1
23 0.03 -0.04 0.12 0.13 0.30
24 0.06 0.03 0.04 0.07 0.14 0.16 0.32
25 -0.05 -0.06 -0.05 0.10 0.12 0.21
26 -0.04 -0.05 0.11 0.28
27 -0.07 -0.04 0.07 0.09 0.14
28 -0.04 -0.07 -0.04 0.14 0.09 0.22
29 -0.04 -0.05 0.11 0.21
30 -0.12 0.06 -0.05 -0.09 -0.06 -0.09 0.07
31 -0.05 0.03 -0.06 -0.13 -0.04 0.06 0.08
33 -0.09 0.05 -0.03 -0.06 -0.04 0.04 0.06
39 -0.01 -0.06 -0.05 -0.05 -0.04 -0.10 0.16
Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan

92
Tabel 4.3

Matriks korelasi antar kesalahan pengukuran butir item pada

Space Perception (lanjutan)

Item 23 24 25 26 27 28 29 30 31 33 39
23 1
24 0.38 1
25 0.44 0.36 1
26 0.25 0.28 0.34 1
27 0.24 0.23 0.31 0.37 1
28 0.30 0.23 0.44 0.36 0.42 1
29 0.10 0.20 0.21 0.27 0.28 0.48 1
30 0.14 0.14 0.23 0.25 0.27 0.44 0.35 1
31 0.13 0.21 0.14 0.26 0.28 0.36 0.29 0.50 1
33 0.23 0.12 0.27 0.15 0.28 0.47 0.31 0.47 0.46 1
39 0.03 0.11 0.06 0.18 0.15 0.26 0.25 0.24 0.31 0.44 1
Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan

Selanjutnya kualitas item dapat dilihat dari signifikan atau tidaknya item

tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal ini,

yang diuji adalah hipotesis nihil dari muatan faktor. Pengujiannya dilakukan

dengan melihat nilai t bagi setiap koefisien muatan faktor seperti pada tabel 4.4

berikut ini:

93
Tabel 4.4

Muatan Faktor Item GATB subtes Three Dimensional Space

Item Koefisien Standar Error T- Value Signifikan


1 0.37 0.02 19.84 V
2 0.48 0.02 27.39 V
3 0.62 0.02 34.72 V
4 0.55 0.02 30.72 V
5 0.59 0.02 33.93 V
6 0.22 0.02 11.35 V
7 0.55 0.02 30.86 V
8 0.59 0.02 34.28 V
9 0.15 0.02 7.97 V
10 0.52 0.02 27.83 V
11 0.49 0.02 27.72 V
12 0.70 0.02 41.70 V
13 0.31 0.02 16.72 V
14 0.62 0.02 36.72 V
15 0.56 0.02 31.83 V
16 0.48 0.02 26.57 V
17 0.53 0.02 28.27 V
18 0.36 0.02 19.77 V
19 0.60 0.02 35.32 V
20 0.51 0.02 28.66 V
21 0.51 0.02 28.92 V
22 0.18 0.02 9.48 V
23 0.45 0.02 25.16 V
24 0.29 0.02 15.28 V
25 0.33 0.02 18.05 V
Keterangan: V= signifikan (t-values > 1,96) X = Tidak signifikan

94
Tabel 4.4

Muatan Faktor Item GATB subtes Three Dimensional Space (Lanjutan)

Item Koefisien Standar Error T-Value Signifikan


26 0.38 0.02 20.64 V
27 0.23 0.02 11.94 V
28 0.11 0.02 5.69 V
29 0.10 0.02 5.18 V
30 0.24 0.02 12.28 V
31 0.11 0.02 5.93 V
33 0.29 0.02 15.13 V
39 0.14 0.02 7.29 V
Keterangan: V= signifikan (t-values > 1,96) X = Tidak signifikan

Dari 33 item yang mengukur subtes three dimensional space, semua item

dinyatakan signifikan karena nilai t lebih besar dari 1, 96 (absolute) dan semua

item dinyatakan bernilai positif. Item yang paling baik sesuai urutannya: 12, 14,

19, 3, 8, 5, 15, 7, 4, 2, 20, 17, 10, 11, 2, 16, 23, 26, 1, 18, 25, 13, 24, 33, 30, 27, 6,

22, 9, 39, 31, 28, dan 29.

Setelah melakukan analisis untuk kedua kalinya dengan membuang item

negatif dan item tidak signifikan ternyata tidak menghasilkan banyak perubahan.

Setiap item dalam subtes three dimensional space masih menunjukkan kolerasi

antar item dan menunjukkan multidimensionalitas. Atas hal tersebut maka model

satu faktor yang diteorikan dalam subtes ini sebenarnya tidak dapat diterima

karena ternyata setiap item dalam subtes ini tidak hanya mengukur satu faktor

three dimensional space saja.

95
Melihat hasil yang seperti ini maka dilakukanlah analisis faktor dengan

menggunakan program SPSS 17. SPSS digunakan untuk memberikan perkiraan

mengenai berapa banyak faktor yang diukur oleh subtes three dimensional space

dengan batas eugen value 1. Melalui SPSS diperkirakan bahwa subtes three

dimensional space sebenarnya mengukur delapan faktor (Tabel 4.5). Namun

perhitungan ini hanya sebagai perkiraan saja, diperlukan penelitian lebih lanjut

mengenai berapa sebenarnya jumlah faktor yang diukur oleh subtes three

dimensional space dan penjelasan mengenai faktor-faktor tersebut tidak

dilakukan dalam penelitian ini.

Penjelasan mengenai kedelapan faktor dapat dilihat pada tabel 4.5

mengenai Rotated Component Matrix.

96
Tabel 4.5

Rotated Component Matrix pada Subtes Three Dimensional Space

a
Rotated Component Matrix

Component
1 2 3 4 5 6 7 8
V1 .037 .002 .031 .699 -.171- -.051- .054 -.106-
V2 .111 .033 .070 .458 .233 .216 .189 .058
V3 .256 .068 .026 .489 .116 .023 -.034- .103
V4 .045 .117 -.068- .585 .119 .014 -.047- .002
V5 .183 .045 .050 .428 .356 .241 .078 .042
V6 -.029- .035 -.031- .087 -.120- .764 -.222- -.047-
V7 .203 .115 .029 .111 .265 .252 .245 .329
V8 .485 .044 .116 .089 .255 -.080- -.052- .059
V9 .058 .062 -.056- .000 -.050- -.026- -.012- .839
V10 .308 .119 -.051- .121 .389 .062 -.325- -.137-
V11 .186 .048 -.032- .130 .522 -.052- -.017- -.036-
V12 .480 .075 .022 .278 .250 -.003- .023 .014
V13 .193 -.011- .085 .120 -.075- -.045- .659 .029
V14 .479 .022 .034 .146 .195 .142 .004 -.009-
V15 .265 .038 .066 .133 .275 .402 .202 .104
V16 .355 -.014- .073 -.016- .109 .352 .217 .023
V17 .434 .049 -.046- .248 -.067- .036 .173 .100
V18 .488 .038 -.054- -.011- -.107- .038 -.012- .147
V19 .602 .131 .010 .044 .076 .133 .028 -.030-
V20 .561 .244 .012 .054 .038 -.108- .045 -.102-
V21 .375 .321 .033 -.022- -.055- .279 .177 .004
V22 .189 .510 -.035- .092 -.342- -.028- -.099- -.081-
V23 .198 .628 .048 .109 .100 .009 .066 .000
V24 .167 .582 .050 .016 -.110- .121 .065 -.124-
V25 .055 .660 .103 .026 .181 -.059- .042 .054
V26 .047 .538 .191 .103 .018 .116 -.070- .193
V27 -.055- .432 .293 .009 .251 .002 -.075- .111
V28 -.033- .447 .462 -.002- .037 -.182- -.031- .079
V29 .061 .184 .441 .001 -.185- -.084- -.006- -.088-
V30 -.026- .107 .645 -.008- .058 .060 .143 -.036-
V31 -.018- .021 .586 -.040- .012 .091 -.043- -.064-
V32 .056 .081 .656 .072 .054 .001 .010 .092
V33 .168 -.118- .365 .064 -.262- -.009- -.442- .250
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.

a. Rotation converged in 15 iterations.

97
Tabel 4.6

Sebaran Item GATB subtes Three Dimensional Space

Faktor Item
1 8, 12, 14, 16, 17, 18, 19, 20, 21
2 22, 23, 24, 25, 26, 27

3 28,29, 30, 31, 32, 33


4 1, 2, 3, 4, 5
5 10, 11
6 6, 15
7 13
8 7, 9

Dari tabel 4.6 terlihat bahwa faktor 1 terukur oleh item 8, 12, 14, 16, 17,

18, 19, 20, 21. Faktor 2 terukur oleh faktor 22, 23, 24, 25, 26, 27. Faktor 3 terukur

oleh faktor 28,29, 30, 31, 32, 33. Faktor 4 terukur oleh faktor 1, 2, 3, 4, 5. Faktor

5 terukur oleh faktor 10 dan 11. Faktor 6 terukur oleh faktor 6 dan 15. Faktor 7

terukur oleh faktor 13 saja serta faktor 8 yang terukur oleh faktor 7 dan 9.

4.1.3. Validitas Konstruk Subtes Vocabulary

Hasil perhitungan awal yang diperoleh untuk subtes Vocabulary dengan model

satu faktor (unidimensional) tidak fit, didapatkan Chi Square = 2163.52, df =

1710, P-value = 0.00000 RMSEA = 0.009. Setelah dilakukan modifikasi terhadap

model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap

item saling berkolerasi satu dengan lainnya, maka didapatkan model fit dengan

P>0,05 (tidak signifikan). Dengan demikian model dengan hanya satu faktor dapat

diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal saja, yaitu

98
vocabulary. Namun karena pada model ini ada beberapa item yang kesalahannya

saling berkolerasi, dapat disimpulkan bahwa beberapa item tersebut sebenarnya

bersifat multidimensional pada dirinya masing-masing.

Pada awalnya df berjumlah 1710, namun setelah mencapai model fit, df

tersisa menjadi 1691. Ini berarti dalam perhitungan awal terdapat 1710-1691 = 19

korelasi yang dibebaskan. Sesuai dengan teori yang telah dikemukakan

sebelumnya, apabila ada item yang kesalahan pengukurannya saling berkolerasi

maka item tersebut bersifat multidimensional. Artinya, selain mengukur apa yang

hendak diukur oleh subtes yang bersangkutan, ada hal yang lain yang diukur oleh

item tersebut. Semakin banyak kesalahan pada sebuah item saling berkolerasi

dengan kesalahan pengukuran pada item lainnya, maka rendah atau tidak ideal

kualitas item tersebut.

Selanjutnya, kualitas item juga dapat dilihat dari signifikan atau tidaknya

item tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal

ini, yang diuji adalah hipotesis nihil dari muatan faktor. Dari hasil tersebut,

ternyata didapatkan hanya ada satu item yang baik serta bernilai positif dari 60

item yang ada dalam subtes vocabulary yaitu item nomor 9 dan ke 59 item sisa

yang ada bernilai negatif.

Dikarenakan hasil dari analisis awal yang hanya menghasilkan satu item

dengan nilai yang positif, diprediksi subtes ini memiliki kesalahan dalam

penyusunan skalanya, maka dilakukanlah pengecekan kembali terhadap kunci

jawaban. Setelah melakukan pengecekan kunci jawaban dan tidak terjadi

99
kesalahan di dalamnya, 1 item yang bernilai positif tersebut dinyatakan

berlawanan arah dan dilakukanlah analisis kembali dengan cara membuang item

yang bernilai positif yaitu item nomor 9.

Hasil yang diperoleh untuk subtes vocabulary dengan model satu faktor

(unidimensional) tidak fit, didapatkan Chi Square = 1804.71, df = 1652, P-value =

0.00479 RMSEA = 0.005. Kemudian dilakukan modifikasi kembali terhadap

model dengan cara membebaskan atau memperbolehkan kesalahan pada setiap

item saling berkolerasi satu dengan lainnya, maka didapatkanlah model fit seperti

pada gambar 4.3 berikut ini:

100
Gambar 4.3

Analisis Faktor Konfirmatorik untuk subtes Vocabulary

Terlihat dari gambar 4.3, bahwa nilai Chi Square menghasilkan p > 0,05

(tidak signifikan). Dengan demikian, model dengan hanya satu faktor dapat

diterima, yang berarti bahwa seluruh item terbukti mengukur satu hal, yaitu

vocabulary. Pada model ini, hanya terdapat 2 pasang item yang saling berkolerasi

101
yaitu antara item nomor 49 dengan 18 dan item nomor 56 dengan 24. Dengan nilai

koefisien korelasi untuk item 48 dengan 17 adalah -1.16 dan item nomor 56

dengan 24 adalah -1.15 dengan koefisien yang tidak signifikan. Dapat

disimpulkan bahwa dalam model ini semua item bersifat unidimensional yaitu

hanya mengukur vocabulary saja.

Selanjutnya kualitas item dapat dilihat dari signifikan atau tidaknya item

tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal ini,

yang diuji adalah hipotesis nihil dari muatan faktor. Pengujiannya dilakukan

dengan melihat nilai t bagi setiap koefisien muatan faktor seperti pada tabel 4.7

berikut ini:

Tabel 4.7

Muatan Faktor Item GATB subtes Vocabulary

Item Koefisien Standar Error T- Value Signifikan


1 0.19 0.07 2.66 V
2 0.24 0.07 3.33 V
3 0.28 0.07 3.95 V
4 0.17 0.07 2.40 V
5 0.21 0.07 3.00 V
6 0.19 0.07 2.63 V
7 0.22 0.07 3.14 V
8 0.27 0.07 3.71 V
10 0.17 0.07 2.33 V
11 0.17 0.07 2.43 V
12 0.12 0.07 1.75 X
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan

102
Tabel 4.7

Muatan Faktor Item GATB subtes Vocabulary (Lanjutan)

Item Koefisien Standar Error T-value Signifikan


13 0.06 0.07 0.85 X
14 0.12 0.07 1.65 X
15 0.24 0.07 3.29 V
16 0.03 0.07 0.41 X
17 0.33 0.07 4.56 V
18 0.19 0.07 2.58 V
19 0.24 0.07 3.39 V
20 0.14 0.07 1.95 X
21 0.27 0.07 3.76 V
22 0.28 0.07 3.91 V
23 0.36 0.07 5.01 V
24 0.26 0.07 3.64 V
25 0.51 0.07 7.11 V
26 0.29 0.07 4.08 V
27 0.34 0.07 4.81 V
28 0.46 0.07 6.41 V
29 0.62 0.07 8.67 V
30 0.60 0.07 8.42 V
31 0.62 0.07 8.71 V
32 0.73 0.07 10.34 V
33 0.66 0.07 9.33 V
34 0.58 0.07 8.09 V
35 0.67 0.07 9.41 V
36 0.88 0.07 12.41 V
37 0.87 0.07 12.26 V
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan

103
Tabel 4.7

Muatan Faktor Item GATB subtes Vocabulary (Lanjutan)

Item Koefisien Standar Error T-Value Signifikan


38 0.74 0.07 10.42 V
39 0.80 0.07 11.36 V
40 0.89 0.07 12.65 V
41 0.85 0.07 12.09 V
42 0.73 0.07 10.25 V
43 0.88 0.07 12.49 V
44 0.87 0.07 12.27 V
45 0.88 0.07 12.48 V
46 0.85 0.07 12.01 V
47 0.84 0.07 11.84 V
48 0.83 0.07 11.76 V
49 0.87 0.07 12.36 V
50 0.84 0.07 11.96 V
51 0.77 0.07 10.91 V
52 0.78 0.07 11.00 V
53 0.70 0.07 9.93 V
54 0.74 0.07 10.47 V
55 0.70 0.07 9.93 V
56 0.66 0.07 9.31 V
57 0.70 0.07 9.80 V
58 0.62 0.07 8.72 V
59 0.61 0.07 8.53 V
60 0.64 0.07 8.96 V
Keterangan: V= Signifikan (t-values > 1,96); X = Tidak Signifikan

104
Dari 59 item yang mengukur subtes vocabulary, ternyata ada lima item

yang tidak signifikan, karena nilai t lebih kecil dari 1, 96 (absolute). Ke lima item

inilah yang harus di drop, yaitu item 12, 13, 14, 16, dan 20. Dari hasil tersebut

semua item dinyatakan bernilai positif, item yang paling baik sesuai dengan

urutannya adalah item nomor 40, 43, 45, 36, 49, 37, 44, 41, 46, 50, 47, 48, 39, 52,

51, 54, 38, 32, 42, 53, 55, 57, 35, 33, 56, 60, 58, 31, 29, 59, 30, 34, 25, 28, 23, 27,

17, 26, 3, 22, 21, 8, 24, 19, 2, 15, 7, 5, 1, 6, 18, 11, 4, dan 10. Oleh karena itu,

model satu faktor yang diteorikan dalam subtes ini dapat diterima, bahwa setiap

item dalam subtes ini bersifat unidimensional dengan hanya mengukur vocabulary

saja.

4.1.4. Validitas Konstruk Subtes Arithmetic Reasoning (AR)

Hasil perhitungan awal yang diperoleh untuk subtes arithmetic reasoning (AR)

dengan model satu faktor (unidimensional) tidak fit, didapatkan Chi Square =

29884.13, df = 275, P-value = 0.00000 RMSEA = 0.182. Kemudian setelah

dilakukanlah modifikasi terhadap model dengan cara membebaskan atau

memperbolehkan kesalahan pada setiap item saling berkolerasi satu dengan

lainnya, maka diperoleh model fit dengan Chi – Square = 57.98 , df = 44 , P-value

= 0.07693 , RMSEA = 0.10. Nilai Chi – Square menghasilkan P-value > 0.05

(tidak signifikan). Namun, model dengan hanya satu faktor tidak dapat diterima,

dikarenakan pada model ini terdapat banyak item yang kesalahannya saling

berkolerasi sehingga item tersebut bersifat multidimensional, yang berarti seluruh

item selain mengukur arithmetic reasoning juga mengukur hal yang lain.

105
Karena GATB adalah alat tes kemampuan, maka tidak boleh ada item

yang berkoefisien negatif karena negatif itu menandakan semakin salah jawaban

pada item tersebut semakin tinggi kemampuan arithmetic reasoningnya. Oleh

sebab itu, bila terjadi seperti ini, maka item tersebut tidak dapat dipakai sehingga

harus didrop atau direvisi. Setelah itu dilakukan analisis kedua setelah item

negatif dikeluarkan. Hasil run pertama menunjukkan bahwa item nomor 5

berkorelasi negatif, sehingga harus dibuang dan tidak diikutkan dalam analisis

kedua.

Dari hasil analisis kedua untuk subtes arithmetic reasoning dengan model

satu faktor (unidimensional) dan item negatif yang sudah di-drop tidak fit,

didapatkan Chi Square = 6100.55, df = 252, P-value = 0.00000 RMSEA = 0.084.

Kemudian dilakukan modifikasi kembali terhadap model dengan cara

membebaskan atau memperbolehkan kesalahan pada setiap item saling

berkolerasi satu dengan lainnya.

Pada model dengan item negatif yang sudah di-drop ternyata masih

terdapat item yang berkorelasi dengan kesalahan pengukuran pada item lainnya.

Hal ini menandakan bahwa beberapa item tersebut sebenarnya memang bersifat

multidimensional. Setelah melihat kualitas item dengan menguji hipotesis nihil

dari muatan faktor maka didapatkan bahwa dari 24 item yang mengukur subtes

arithmetic reasoning (AR), ternyata ada empat item yang tidak signifikan, karena

nilai t lebih kecil dari 1, 96 (absolute). Ke empat item inilah yang harus di drop,

106
yaitu item nomor 9, 16, 22, dan 23. Dari hasil tersebut semua item dinyatakan

bernilai positif.

Untuk mendapatkan hasil dengan item yang benar-benar murni, maka

dilakukan analisis kembali namun kali ini seluruh item yang tidak signifikan tidak

diikutsertakan atau dengan kata lain di-drop terlebih dahulu. Item yang tidak

diikutsertakan adalah item nomor 9, 16, 22, dan 23

Hasil yang diperoleh untuk analisis ketiga pada subtes arithmetic

reasoning dengan model satu faktor (unidimensional) dan item negatif yang sudah

di-drop tidak fit, didapatkan Chi Square = 4289.60, df=170, P-Value = 0.00000

RMSEA=0.086. Kemudian dilakukan modifikasi kembali terhadap model dengan

cara membebaskan atau memperbolehkan kesalahan pada setiap item saling

berkolerasi satu dengan lainnya, maka didapatkanlah model fit seperti pada

gambar 4.4 berikut ini.

107
Gambar 4.4

Analisis Faktor Konfirmatorik untuk Subtes Arithmetic Reasoning

Pada awalnya nilai Chi Square menghasilkan p > 0,05 (tidak signifikan). Dengan

demikian, model dengan hanya satu faktor dapat diterima. Namun, setelah model

dengan item negatif yang sudah di-drop ternyata hanya terdapat satu item yang

bersifat unidimensional yaitu item nomor 7 dan sisa item yang ada masih saling

berkolerasi dengan kesalahan pengukuran pada item lainnya, hal ini menandakan

108
bahwa beberapa item tersebut sebenarnya memang bersifat multidimensional

namun korelasi antar item nya telah banyak berkurang seiring dengan beberapa

item negatif dan tidak signifikan yang di drop.

Pada awalnya df berjumlah 170, namun setelah mencapai model fit, df

yang tersisa hanya 95. Ini berarti terdapat 170-95 = 75 korelasi kesalahan yang

dibebaskan. Kesalahan pengukuran item-item yang saling berkolerasi disajikan

pada tabel 4.8.

Tabel 4.8

Matriks korelasi antar kesalahan pengukuran butir item pada

Arithmetic Reasoning

Item 1 2 3 4 6 7 8 10 11 12
1 1
2 0.13 1
3 0.09 1
4 1
6 0.19 0.15 0.19 0.12 1
7 -0.08 1
8 0.08 0.07 0.27 1
10 0.06 1
11 0.08 1
12 0.12 1
13 -0.08 -0.09 0.12
14 -0.07
15 0.08
17 0.07
18 0.00 -0.12 0.03
19 0.09
20 -0.08 0.07
21 -0.05 -0.09
24 -0.12 -0.08 -0.11
25 -0.09 -0.07 -0.19 -0.19 -1.08
Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan

109
Tabel 4.8

Matriks korelasi antar kesalahan pengukuran butir item pada

Arithmetic Reasoning (Lanjutan)

Item 13 14 15 17 18 19 20 21 24 25
13 1
14 0.15 1
15 0.26 0.21 1
17 0.13 0.14 0.24 1
18 0.12 0.11 0.40 1
19 0.10 0.13 0.20 0.47 0.54 1
20 0.09 0.12 0.37 0.29 0.59 1
21 0.09 0.10 0.30 0.36 0.57 0.59 1
24 0.13 0.09 0.13 0.36 0.25 0.33 0.41 1
25 0.25 0.15 0.28 0.07 0.27 0.53 0.42 0.57 1
Keterangan: Angka dengan warna merah menunjukkan ketidaksignifikanan

Selanjutnya kualitas item dapat dilihat dari signifikan atau tidaknya item

tersebut menghasilkan informasi tentang apa yang hendak diukur. Dalam hal ini,

yang diuji adalah hipotesis nihil dari muatan faktor. Pengujiannya dilakukan

dengan melihat nilai t bagi setiap koefisien muatan faktor seperti pada tabel 4.9

berikut ini:

110
Tabel 4.9

Muatan Faktor Item GATB subtes Arithmetic Reasoning

Item Koefisien Standar Error T- Value Signifikan


1 0.28 0.03 8.71 V
2 0.50 0.03 15.39 V
3 0.49 0.03 14.57 V
4 0.57 0.03 16.65 V
6 0.35 0.03 9.31 V
7 0.59 0.03 18.59 V
8 0.48 0.03 14.38 V
10 0.52 0.03 16.08 V
11 0.53 0.03 16.37 V
12 0.41 0.03 12.98 V
13 0.50 0.03 15.27 V
14 0.18 0.03 5.17 V
15 0.36 0.03 10.96 V
17 0.31 0.03 9.16 V
18 0.37 0.03 10.81 V
19 0.25 0.03 7.54 V
20 0.18 0.03 5.45 V
21 0.27 0.03 8.14 V
24 0.17 0.03 4.75 V
25 0.19 0.03 5.21 V
Keterangan: V= signifikan (t-values > 1,96) X = Tidak signifikan

Dari 20 item yang mengukur subtes arithmetic reasoning (AR), semua

item dinyatakan signifikan, karena nilai t lebih besar dari 1, 96 (absolute) dan juga

bernilai positif. Item yang paling baik sesuai dengan urutannya adalah item nomor

7, 4, 11, 10, 2, 13, 3, 8, 12, 15, 18, 6, 17, 1, 21, 19, 20, 25, 14, dan 24.

111
Setelah melakukan analisis untuk ketiga kalinya dengan membuang item

negatif dan item tidak signifikan ternyata tidak menghasilkan banyak perubahan.

Setiap item dalam subtes arithmetic reasoning masih menunjukkan kolerasi antar

item dan menunjukkan multidimensionalitas. Atas hal tersebut maka model satu

faktor yang diteorikan dalam subtes ini tidak dapat diterima karena ternyata setiap

item dalam subtes ini tidak hanya mengukur satu faktor arithmetic reasoning

saja.

Melihat hasil yang seperti ini maka dilakukanlah analisis faktor dengan

menggunakan program SPSS 17. SPSS digunakan untuk memberikan perkiraan

mengenai berapa banyak faktor yang diukur oleh subtes arithmetic reasoning

dengan batas eugen value 1. Melalui SPSS diperkirakan bahwa subtes arithmetic

reasoning sebenarnya mengukur lima faktor (Tabel 4.10). Namun perhitungan ini

hanya sebagai perkiraan saja, diperlukan penelitian lebih lanjut mengenai berapa

sebenarnya jumlah faktor yang diukur oleh subtes arithmetic reasoning dan

penjelasan mengenai faktor-faktor tersebut tidak dilakukan dalam penelitian ini.

Penjelasan mengenai kelima faktor dapat dilihat pada tabel 4.10 mengenai

Rotated Component Matrix.

112
Tabel 4.10

Rotated Component Matrix pada Subtes Arithmetic Reasoning

a
Rotated Component Matrix

Component

1 2 3 4 5

V1 -.104- .478 -.096- .150 .147

V2 .038 .471 .193 .035 .035

V3 .075 .537 .062 .052 -.076-

V4 .099 .403 .283 -.111- -.134-

V5 -.025- .667 .024 -.029- -.002-

V6 .083 .274 .389 .162 .014

V7 .001 .474 .261 .064 -.126-

V8 .069 .178 .545 -.055- -.020-

V9 .060 .103 .645 -.007- .087

V10 -.052- .004 .592 .205 .026

V11 .071 .065 .373 .545 -.022-

V12 .030 .127 -.232- .666 .088

V13 .140 .024 .223 .628 .014

V14 .548 -.044- .144 .303 -.078-

V15 .631 .008 .091 .104 -.092-

V16 .762 .005 .033 .082 .007

V17 .553 .056 -.047- -.076- .335

V18 .575 .069 -.027- -.087- .307

V19 .074 -.054- .100 -.020- .654

V20 .056 -.035- -.018- .112 .765

Extraction Method: Principal Component Analysis.


Rotation Method: Varimax with Kaiser Normalization.

a. Rotation converged in 7 iterations.

113
Tabel 4.11

Sebaran Item GATB subtes Arithmetic Reasoning

Faktor Item
1 14, 15, 16, 17, 18
2 1, 2, 3, 4, 5, 7

3 6, 8, 9, 10
4 11, 12, 13
5 19, 20

Dari tabel 4.10 terlihat bahwa faktor 1 terukur oleh item 14, 15, 16, 17, 18.

Faktor 2 terukur oleh faktor 1, 2, 3, 4, 5, 7. Faktor 3 terukur oleh faktor 6, 8, 9, 10.

Faktor 4 terukur oleh faktor 11, 12, 13 serta faktor 5 yang terukur oleh faktor 19

dan 20

4.2. Validitas Konstruk Seluruh Subtes GATB dalam Mengukur Satu

Konstruk Bersifat Umum (General Intelligence)

Langkah selanjutnya yang harus dilakukan setelah menganalisis faktor

konfirmatorik dari setiap subtes adalah melakukan analisis faktor konfirmatori

untuk kostruk umum yang hendak diteliti yaitu inteligensi. Dalam konteks ini,

matriks korelasi antar faktor (subtes) digunakan sebagai input. Namun apabila

menggunakan Lisrel, kedua tingkatan analisis faktor ini dapat dilakukan secara

simultan (satu kali analisis). Analisis seperti ini disebut juga dengan nama

“analisis faktor konfirmatorik orde kedua” (second order factor analysis). Dalam

hal ini item merupakan indikator dari masing-masing subtes (faktor tingkat satu)

114
dan pada saat yang sama subtes merupakan indikator dari faktor tingkat kedua

(inteligensi/general factor). Peneliti menggunakan metode ini, karena lebih efisien

(hanya satu kali analisis secara simultan) dan dari sudut statistik, analisis seperti

ini lebih terpercaya (Joreskog, dan Sorbom, 2006).

Hasil yang diperoleh untuk model dengan second order faktor analisis,

nilai Chi - Square = 5692.46, df = 8906, P-value = 1.00000 atau P>0,05 , dan

RMSEA = 0.000. Dapat disimpulkan bahwa model dengan dua tingkatan faktor

(second order CFA) fit dengan data. Artinya, teori yang mengatakan bahwa item-

item mengukur empat subtes dan keempat subtes mengukur inteligensi umum

dapat diterima. Hasilnya dapat dilihat pada tabel 4.12 dan gambar 4.5.

Tabel 4.12

Koefisien Muatan Faktor Untuk General Intelligence

Subtes Koefisien Standar T-Value Signifikan


Error
Computation 0.35 0.06 6.20 V
Three Dimensional 0.11 0.03 3.70 V
Space
Vocabulary 0.12 0.05 2.23 V
Arithmetic 0.01 0.07 0.17 X
Reasoning

115
Gambar 4.5

Koefisiein Muatan Faktor Untuk General Intelligence

Dari tabel dan gambar di atas ditemukan bahwa, subtes yang muatan

faktornya signifikan dalam mengukur inteligensi adalah computation, three

dimensional space dan vocabulary. Sedangkan yang tidak signifikan adalah

arithmetic reasoning. Berdasarkan hasil ini, terdapat kemungkinan bahwa

pengukuran terhadap inteligensi umum cukup dengan menggunakan subtes yang

signifikan saja, yaitu subtes computation, three dimensional space dan vocabulary

116
BAB V

KESIMPULAN, DISKUSI DAN SARAN

Dalam bab lima ini akan dipaparkan tentang kesimpulan, diskusi, dan saran

mengenai hasil dari penelitian.

5.1 Kesimpulan

Pada bagian ini, akan dipaparkan kesimpulan dari pengujian hipotesis yang telah

diuraikan pada bab empat. Hipotesis itu adalah:

1. Seluruh item dalam empat subtes GATB yang dijadikan penelitian

adalah fit (sesuai) dengan model satu faktor, yang berarti semua item

pada suatu subtes mengukur hanya satu kemampuan yang

didefinisikan pada subtes tersebut yaitu computation, three

dimensional space, vocabulary, dan arithmetic reasoning. Bahwa

setiap item dalam masing-masing subtes adalah secara signifikan

mengukur kemampuan pada subtes tersebut.

2. Empat subtes GATB adalah fit (sesuai) dengan model satu faktor,

yaitu semua subtes mengukur satu faktor umum yang dalam hal ini

adalah “Inteligensi”.

Kesimpulan mengenai jumlah df yang menjadi korelasi sebelum dan

sesudah dilakukannya modifikasi terhadap model dapat dilihat pada tabel 5.1.

117
Tabel 5.1

Analisis CFA Pada Setiap Subtes GATB

Subtes Chi Square Df P-Value RMSEA

515.28 350 0.00000 0.012


Computation
374.86 338 0.08157 0.006

Three Dimensional 25586.12 495 0.00000 0.125

Space 247.29 214 0.05887 0.007

1804.71 1652 0.00479 0.005


Vocabulary
1714.36 1650 0.13186 0.003

4289.60 170 0.00000 0.086


Arithmetic Reasoning
116.05 95 0.07105 0.008

Sedangkan kesimpulan mengenai hasil pengujian hipotesis 1 dipaparkan

dalam tabel 5.2 berikut ini:

118
119
Berdasarkan tabel 5.2 dapat dilihat bahwa hipotesis 1 diterima yang

artinya bahwa semua subtes dalam GATB fit (sesuai) dengan model satu faktor,

yaitu mengukur hanya satu kemampuan yang didefinisikan pada subtes tersebut.

Dari empat subtes dalam GATB terdapat dua subtes yang untuk mencapai model

fit hanya memerlukan modifikasi yang singkat, namun dua subtes lainnya untuk

mencapai model fit harus dilakukan beberapa kali modifikasi yang lebih

mendalam karena banyaknya item yang saling berkolerasi.

Terdapat dua subtes yang dalam mencapai model fit hanya memerlukan

modifikasi yang singkat karena memiliki item yang baik setelah item-item yang

tidak signifikan dan bernilai negatif dibuang. Subtes tersebut adalah computation

dan vocabulary, keduanya dianggap bernilai baik karena tidak memiliki korelasi

antar item yang terlalu banyak sehingga setiap item terbukti memang mengukur

konstruk yang dimaksud. Kedua subtes tersebut memiliki karakteristik yang baik

dikarenakan memiliki jenis item yang setara dan mengukur satu jenis kemampuan

saja sehingga mudah dipahami dalam pengerjaannya.

Subtes yang untuk mencapai model fit harus melakukan banyak

modifikasi adalah three dimensional space dan arithmetic reasoning. Jenis item

dalam subtes ini memiliki karakteristik yang tidak baik karena memiliki terlalu

banyak multidimensionalitas, dalam arithmetic reasoning hal ini dikarenakan

dalam setiap item selain mengukur kemampuan numerik namun juga memerlukan

kemampuan penalaran verbal. Item mengukur kemampuan numerik, namun

persoalan dalam setiap item dibalut dengan soal berbentuk cerita yang terstruktur.

120
Apabila subjek tidak mengerti perintah dalam setiap item pada subtes arithmetic

reasoning, maka subjek tidak akan mampu untuk menjawab persoalan.

Hasil pengujian hipotesis 2 melalui analisis faktor dua tingkat (second

order confirmatory factor analysis) menghasilkan pernyataan bahwa terdapat tiga

dari empat subtes GATB yang signifikan dalam mengukur inteligensi umum,

yaitu subtes computation, three dimensional space, dan vocabulary. Dalam

analisis faktor dua tingkat ini item-item yang berkoefisien negatif dan tidak

signifikan pada setiap subtes tidak digunakan atau di drop supaya menghasilkan

perhitungan yang baik.

Setelah melakukan analisis faktor terhadap empat subtes dalam GATB

yang mengukur inteligensi, menunjukkan bahwa alat tes GATB masih dapat dan

layak digunakan sebagai salah satu alat tes inteligensi namun perlu dilakukan

perbaikan dan pembaharuan terhadap item-item yang memiliki

multidimensionalitas yang terlalu banyak.

5.2 Diskusi

Melihat hasil analisis yang menyatakan bahwa terdapat subtes yang bersifat

multidimensional karena ternyata secara teoritis, tiga subtes dari empat subtes

yang diteliti dalam GATB memang mengukur lebih dari 1 faktor. Subtes yang

murni mengukur 1 faktor hanyalah computation yaitu mengukur kemampuan

numerik, sedangkan untuk subtes three dimensional space mengukur kemampuan

spatial dan general learning ability, subtes vocabulary selain mengukur

121
kemampuan verbal ternyata juga mengukur general learning ability dan subtes

arithmetic reasoning yang mengukur kemampuan numerik juga general learning

ability.

Dari hasil pengujian hipotesis 1 dengan menggunakan CFA menunjukkan

bahwa terdapat banyak korelasi antar measurement error pada setiap item di

subtes GATB. Hal ini menunjukkan bahwa banyak item dalam tes GATB yang

selain mengukur apa yang hendak diukur, ternyata juga mengukur hal yang lain

(multidimensional). Pada subtes computation terdapat 12 buah korelasi antar

kesalahan pengukuran pada satu item dengan kesalahan pengukuran pada item

lainnya dalam subtes tersebut. Selanjutnya pada subtes three dimensional space

terdapat 281 korelasi yang sejenis, pada subtes vocabulary terdapat 2 korelasi,

pada subtes arithmetic reasoning terdapat 75 korelasi. Jadi, kesimpulannya subtes

yang paling kompleks (multidimensional) adalah subtes three dimensional space,

dilanjutkan dengan arithmetic reasoning, computation dan yang memiliki

kesalahan korelasi paling sedikit adalah vocabulary.

Hal ini menunjukkan bahwa pada subtes yang itemnya valid (signifikan)

juga terdapat masalah multidimensionalitas dari item dalam subtes tersebut.

Beberapa hal yang mungkin menyebabkan multidimensional adalah:

1. Waktu pengerjaan yang diberikan untuk setiap subtes relatif singkat,

tidak sebanding dengan jumlah item dari setiap subtes yang cenderung

banyak sehingga sebagian besar subyek tidak dapat menyelesaikan

semua persoalan dalam setiap subtes.

122
2. Waktu pengerjaan untuk setiap subtes yang singkat menuntut subjek

untuk bekerja sesuai waktu yang ditentukan hal ini dapat

menyebabkan subjek menebak (guessing) jawaban dari setiap item

yang disajikan sehingga pelaksanaan tes yang mengacu pada norma-

norma tidak dapat berlaku.

3. Item yang diberikan terlalu mudah sehingga hampir setiap subyek

dapat menjawab dengan benar atau sebaliknya, item terlalu sulit

sehingga hampir setiap subyek menjawab salah.

4. Terdapat jenis item dalam subtes yang memerlukan penalaran dan

penafsiran lebih mendalam. Hal ini dapat dilihat dalam subtes three

dimensional space yang mengharuskan subjek untuk membayangkan

suatu bentuk peritmean kubus, balok maupun bentuk tiga dimensi

lainnya dan dalam subtes arithmetic reasoning yang mengharuskan

subjek untuk mengerjakan soal perhitungan namun harus terlebih

dahulu menalar soal cerita yang diberikan sehingga menyebabkan

banyak kekeliruan dalam menjawab item yang diberikan. Jenis Item

ini menyebabkan dengan mudahnya terjadi penafsiran ganda terhadap

apa yang ditanyakan.

5. Rentangan atau varians dari tingkat kesukaran soal antar satu subtes

dengan yang lainnya, sebaiknya jangan terlalu berbeda (homogenitas

varians dari kesukaran soal antar subtes). Artinya, dalam rangka

mengukur inteligensi sebaiknya semua subtes memiliki tingkat variasi

kesukaran soal yang relatif sama. Karena hal ini dapat berpengaruh

123
pada di dropnya item tertentu. Dari hasil indeks validitas item, terlihat

bahwa dari semua item, lebih dari setengahnya (77,14 % = 135 item)

dapat terus digunakan, walaupun akan lebih baik bila dilakukan revisi

terhadap pilihan jawaban. Sedangkan 22,86 % sisanya (40 item)

indeks validitas itemnya tergolong rendah sehingga tidak dapat terus

digunakan, dalam arti di drop atau perlu dilakukan revisi terhadap

item-item tersebut.

Penelitian mengenai perkembangan GATB pernah dituliskan oleh Steven

J. Mellon Jr pada tahun 1996 dalam jurnalnya yang berjudul Development of

General Aptitude Test Battery (GATB) Forms E and F. Jurnal ini bertujuan untuk

mengembangkan bentuk-bentuk alternatif dari bagian kognitif pada GATB.

Dalam jurnal dijelaskan bahwa bentuk kognitif mencakup tujuh subtes dalam

GATB yaitu arithmetic reasoning, vocabulary, three dimensional space,

computation, name comparation, tool matching, dan form matching. Secara

umum, sejumlah perubahan dilakukan untuk memperbaiki penampilan dan

menyederhanakan item tes itu sendiri. Sebagai contoh dari perbaikan item tes,

pada subtes three dimensional space, kualitas cetak dan resolusi ditingkatkan

melalui CorelDRAW untuk mengembangkan item.

5.3 Saran

Dalam penelitian ini, peneliti menyadari masih banyak terdapat kekurangan. Oleh

karena itu, peneliti memberi saran yang dapat digunakan untuk pengembangan

124
penelitian ke depannya. Saran tersebut berupa saran metodologis dan saran

praktis.

5.3.1 Saran Metodologis

1. Untuk penelitian selanjutnya, ada baiknya mempertimbangkan

variabel lainnya seperti perbedaan usia, jenis kelamin, latar belakang,

budaya dan hal penting lainnya yang dalam penelitian ini tidak

dimiliki datanya.

2. Untuk pengembangan uji validitas kedepannya, dapat menggunakan

seluruh subtes dalam GATB pada pengujian validitas konstruk.

Dengan menggunakan seluruh subtes dalam GATB maka akan

didapatkan kostruk mengenai bakat yang dimiliki seseorang, jadi

tidak terbatas hanya inteligensi saja.

3. Terdapat banyak item yang bersifat multidimensional. Hal ini dapat

disebabkan oleh kerangka berfikir teori GATB dimana dijelaskan

setiap subtes sebenarnya masih terdiri dari beberapa sub faktor, yang

seharusnya dapat diwujudkan dalam bentuk faktor tersendiri yang

berbeda tingkatan (analisis faktor tiga tingkat). Jadi, akan lebih baik,

bila analisis faktor dilakukan 3 tingkat (third order CFA). Namun

demikian, perlu dilakukan identifikasi terlebih dahulu untuk melihat

item yang mengukur sub faktor di dalam masing-masing subtes

tersebut.

125
5.3.2 Saran Praktis

1. Untuk penyedia layanan tes psikologi, sebaiknya mencari informasi

dan melakukan pengecekan terlebih dahulu sebelum memutuskan

untuk menggunakan suatu alat tes.

2. Selanjutnya, bagi institusi psikologi pengguna alat tes GATB, cukup

menggunakan 3 subtes saja dalam GATB yaitu computation, three

dimensional space, dan vocabulary untuk mengukur inteligensi.

Namun perlu ada penelitian lebih lanjut untuk membuktikan

mengenai skor inteligensi yang dihasilkan.

126
DAFTAR PUSTAKA

Aiken, Lewis. R. (1997). Psychological testing and assessment. Boston: Allyn


and bacon.

Anastasi, Anne. (1997). Psychological testing, seventh edition. New Jersey:


Prentice-Hall, Inc.

Azwar, Saifuddin. (2004). Reliabilitas dan validitas. Yogyakarta: Pustaka Pelajar.

Brown, T. A. (2006). Confirmatory factor analysis for applied research.


New york: The Guildford Press.

Buckingham, Marcus and Donald 0. Clifton. (2001). Now, discover your


strengths. New York: The Free Press.

Chaplin, JP. (2006). Kamus lengkap psikologi. Jakarta: PT Raja Grafindo Pustaka.

Coyle, Daniel. (2009). Talent code. New York: Bantam Dell.

Davis, Tony. (2009). Talent assessment. Jakarta: PPM

Djaali, H & Pudji Muljono. (2007). Pengukuran dalam bidang psikologi.


Jakarta: Gramedia Pustaka

Gardner, Howard. (1985). Frames of mind, the theory of multiple intelligences.


New York: Basic Book, Inc.

Greogry, Robert J. (2007). Psychological testing: History, principles, and


application 5th Edition. New Jersey: Pearson Education, Inc.

Jigau, Mihai. (2007). Career counselling, compendium of methods and


techniques. Bucharest: AFIR.

127
Jöreskog, K.G. & Sörbom, D. (2006). LISREL 8.70 for windows (computer
software). Lincolnwood, IL: Scientific Software International, Inc.

Kaplan, Robert M. & Dennis P. Saccuzzo. (2009). Psychological testing:


Principles, apllication & issues 7th edition. Belmont: Wadsworth

Kerlinger, F.N. (2006). Asas-asas penelitian behavioral. Yogyakarta: Gadjah


Mada University Press.

Loewenthal, Kate Miriam. (1996). An introduction to psychological test and


scales. London: UCL Press.

Munandar, Ashar Sunyoto. (2001). Psikologi industri dan organisasi. Jakarta:


Universitas Indonesia.

Murphy, Kevin R. (1994). Psychological testing: Principels and application.


London: Prentice-hall Int.

Thompson, Bruce. (2004). Explanatory and confirmatory factor analysis.


Washington DC: American Psychological Assosiation.

Sadli, Saparinah. (1991). Inteligensi bakat dan test IQ. Jakarta: Gaya Favorit Pres.

Shaleh, A.R & Wahab, M.A. (2004). Psikologi suatu pengantar, Jakarta:
Prenada Media.

Sukardi, Dewa Ketut. (2009). Analisis tes psikologi teori dan praktik. Jakarta:
Rineka Cipta.

Umar, Jahja. (2011). Personal Communication.

Van Ornum, William. (2008). Psychological testing across the life span. New
Jersey: Pearson Education, Inc

128
LAMPIRAN

129
130

Anda mungkin juga menyukai