Anda di halaman 1dari 20

Ruang lingkup Pengukuran Psikometri

A. Pengertian psikometri dan ruang lingkupnya


Psikometri adalah ilmu tentang teori pengukuran psikologis. Ruang lingkup psikometri adalah masalah
pengembangan teori dan model tes serta pengembangan dasar-dasar evaluasi terhadap kualitas tes.
Pada tahap apilaksinya, teori psikometri memberikan landasan fundamnetal dalam perancangan dan pengembangan
tes psikologis sehingga metode-metode konstruksi tes berkembang maju dan dapat menghasilkan berbagai bentuk
tespsikologi yang valid dan reliabel. Evaluasi terhadap fungsi tes dapat dilakukan dengan cara yang lebih seksama
dan efisien sejalan dengan perkembangan aman teori psikometri itu sendiri.
!. Pengukuran, Evaluasi, dan "es
#. Pengukuran
$lmu pengukuran %meansurement& merupakan cabang dari ilmu statistika terapan yang bertujuan membangun dasar-
dasar pengembangan tes yang lebih baik sehingga dapat menghasilkan tes yang berfungsi secara optimal, valid dan
reliabel. 'asar-dasar pengembangan tes tersebut dibangun di atas model-model matematik yang secara
berkesinambungan terus diuji kelayaknnya oleh ilmu psikometri.
Pengukuran adalah suatu prosedur pemberian angka %kuantifikasi& terhadap atribut atau varabel sepanjang suatu
kontinum. (ecara garis besar kontinum dibagi menjadi dua bagian, yaitu kontinum fisik dan kontinum psikologis.
)ontinum fisik adalah suatu kontinum pengukuran yang menggunakan skala fisik. Pengukuran yang menggunakan
skala fisik akan menghasilkan kontinum-kontinum seperti* kontinum berat, kontinum kecepatan, dan kontinum tinggi
dan lain sebagainya. (edangkan kontinum psikologis adalah kontinum pengukuran yang menggunakan skala
psikologis.
(ecara operasional, pengukuran merupakan suatu prosedur perbandingan antara atribut yang hendak diukur dengan
alat ukurnya. )arakteristik pengukuran adalah*
a. +erupakan perbandingan antara atribut yang diukur dengan alat ukurnya.
b. ,asilnya dinyatakan secara kuantitatif
c. ,asilnya bersifat deskriptif.
)ita perhatikan, misalnya, kuantifikasi tinggi badan dilakukan dengan membandingkan tinggi %badan& sebagai atribut
fisik dengan meteran sebagai alat ukur. -leh karena itu pada karakteristik pertama disebutkan bah.a yang
dibandingkan adalah atribut. Artinya, apa yang diukur adalah atribut atau dimensi dari sesuatu, bukan sesuatu itu
sendiri. (ebaga contoh kita tidak dapat mengukur sebuah meja karena yang kita ukur bukanlah meja sebagai benda
melainkan dimensi meja, semisal panjang atau lebarnya. )ita tidak pula dapat mengukur manusia karena yang dapat
kita ukur adalah atribut manusianya semisal intelegensi atau prestasinya. Pengertian ini memba.a makna bah.a %#&
benda atau manusia yang dimensinya diukur merupakan subjek pengukuran, bukan objek/ %0& kita hanya akan
mengetahui alat ukurnya apabila atributyang hendak diukur telah diketahui lebih dahulu.
)arakteristik pengukuran yang ke dua adalah sifat yang kuantitatif. )uantitatif berarti ber.ujud angka. ,al ini adalah
selalu benar dalam setiap pengukuran. (uatu proses pengukuran akan dinyatakan selesai apabila hasilnya telah
di.ujudkan dalam bentuk angka yang biasanya dalam pengukuran fisik disertai oleh satuan ukurnya yang sesuai.
Pada pengukuran panjang, akan ber.ujud angka semisal 01 cm atau 12 m. Pada pengukuran volume hasilnya
ber.ujud angka semisal 342 cm atau #1#. !egitu pula dalam pengukuran aspek nonfisik atau aspek psikologis akan
kita temui hasil pengukuran yang berupa angka kecepatan dan ketelitian sebesar 14 misalnya, atau angka penilaian
kecerdasan setinggi #02.
)arakteristik pengukuran yang ketiga adalah sifat hasilnya yang deskriptif, artinya hanya sebatas memberikan angka
yang tidak diinterpretasikan lebih jauh. ,asil ukur terhdap luas terhadap luas meja adalah 052 cm tidak diikuti oleh
keterangan bah.a 052 cm tersebut adalah sedang, luas, atu sangat luas.
'alam berbagai kasus, pengukuran atribut tidak dapat dilakukan secara langsung dikarenakan atribut yang hendak
diukur bukan merupakan atribut dasar melainkan berupa atribut derivasi, yaitu atribut yang diperoleh dari turunan
atribut-atribut lainnya. (ebagai contoh, atribut luas sebuah bidang datar tidak dapat diukur langsung karena tidak
memiliki alat pengukur luas, oleh karena itu ukuran luas hanya dapat diperoleh dari derivasi ukuran atribut panjang
dan ukuran atribut lebar. +isalnya untuk bidang datar berbentuk empat persegi panjang ukuran luas diperoleh dari
67 p8# sedangkan untuk sebuah lingkaran ukuran luas diperoleh dari 670 r. 'emikian pula halnya untuk atribut
kecepatan %.alaupun kita telah lama mengenal speedo meter& pada dasarnya tetap merupakan turunan dari ukuran
atribut jarak dan ukuran atribut .aktu.
0. Evaluasi
'ari hasil pengukuran luas sebuah meja #22 cm 8 91 cm 7 9122 cm, misalanya, dapatkah kita mengatakan bah.a
meja tersebut sempi, sedang, atau lapang: Apakah angka 51 sebagai hasil suatu tes matematika termasuk rendah,
sedang atau tinggi: "ernyata tanpa adanya suatu pembanding, kita tidak akan dapat menja.ab pertanyaan-
pertanyaan tersebut. +eja seluas #22 cm 8 91 cm tentu sangat pas bila diperuntukkan sebagai meja ketik namun
menjadi terlalu sempit bila diperuntukkan sebagai meja makan keluarga. Angka matematika 51 poin tentu terlalu
rendah bila ternyata soal tes keseluruhan adalah #22 buah namun akan menjadi hasil yang sangat bagus bila tesnya
ternyata hanya berisi 12 soal saja. !egitu pun, angka 51 dari suatu tes yang berisi #22 soal dapat saja berarti sangat
baik kalau saja para peserta yang lain pada umumnya hanya mampu mencapai angka #1.
;elaslah bah.a interpretasi terhadap hasil pengukuran hanya dapat bersifat evalutif apabila disandarkan pada suatu
norma atau suatu kriteria. <orma berarti rata-rata, yaitu harga rata-rata bagi suatu kelompok subjek. )elompok
subjek dapat berupa kelompok usia, kelompok kelas, kelompok jenis kelamin, kelompok suku, kelompok budaya,
atau kelompok bangsa. ;adi akan ada norma usia, norma kelas, dan lain sebagainya. )arena hasil tes psikologis
seringkali tidak memiliki satuan ukur maka perlu dinyatakan secara normatif. (ebagai contoh, hasil ukur $=
dinyatakan sebagai ##2 $=->A$( atau skor tes matematika dinyatakan dalam skor PR %percentile rank& ke 9?.
'engan adanya noram dan kriteria, hasil yang sama dari suatu pengukuran dapat saja mendatangkan interpretasi
yang berbeda. (ebagai contoh, skor 31 pada tes (P+ akan berlainan sekali artinya bila dihasilkan oleh subjek yang
berusia 09 tahun dan bila dihasilkan oleh subjek yang berusia #0 tahun. 6aji kendaraan 52 km@jam akan lain sekali
maknanya apabila kendaraannya adalah sebuah mobil. 'emikianlah, dengan evaluasi kita dapat mengatakan suatu
atribut sebagai baik-buruk, cepat lambat, jauh-dekat, tinggi-rendah, dan lain sebagainya. (ecara ringkas, karakteristik
evaluasi adalah*
#. +erupakan pembandingan antara hasil ukur dengan suatu norma atau suatu kriteria
0. ,asilnya bersifat kualitatif
3. ,asilnya dinyatakan secara evaluatif.
3. "es
'ilihat dari .ujud fisiknya, suatu tes tidak lain daripada sekumpulan pertanyaan yang harus dija.ab dan@atau tugas
yang harus dikerjakan yang akan memberikan informasi mengenai aspek psikologis tertentu berdasarkan ja.aban
terhadap pertanyaan-pertanyaan atau cara dan hasil subjek dalam melakukan tugas-tugas tersebut.
!atasan seperti tersebut di atas tentu masih terlalu sederhana karena pada kenyataannya tidak semua kumpulan
pertanyaan cukup berharga untuk dinamakan tes. !anyak syarat-syarat kualitas yang harus dipenuhi oleh rangkaian
pertanyaan atau tugas itu agar dapat disebut tes.
'engan menekankan syarat kualitas utama, Anne Anastasi dalam bukunya Psychological "esting %#A94&
mengatakan bah.a tes pada dasarnya merupakan suatu pengukuran yang objektif dan standar terhadap sampel
perilaku. (edangkan Brederick C. !ro.n %#A94& mengatakan bah.a tes adalah prosedur yang sistematik guna
mengukur sampel perilaku seseorang. "ampaknya !ro.n menganggap bah.a ciri sistematik itu telah mencakup
pengertian objektif, standar, syarat-syarat kualitas lainnya.
'efinisi yang agak lengkap kita kutipkan langsung dari pendapat 6ee ;. Dronbach yang dikemukakan dalam bukunya
Essentials of Psycholocal "esting %#A92&, yaitu EEEa systematic procedure for observing a personFs behavior and
describing it .ith the aid of a numerical scale or a category syatemG.
'ari berbagai macam batasan mengenai tes dapatlah ditarik beberapa kesimpulan pengertian, antara lain*
#. "es adalah prosedur yang sistematik. +aksudnya %a& item-item dalam tes disusun menurut cara dan aturan
tertentu/ %b& prosedur administrasi tes dan pemberian angka %scoring& terhadap hasilnya harus jelas dan
dipesifikasikan secara terperinci/ dan %c& setiap orang yang mengambil tes itu harus mendapat aitem-aitem yang
sama dalam kondisi yang sebanding.
0. "es berisi sampel perilaku. Artinya %a& betapapun panjangnya suatu tes, aitem yang ada di dalamnya tidak akan
dapat mencakup seluruh isi materi yang mungkin ditanyakan, dan %b& kelayakan suatu tes tergantung pada sejauh
mana aitem-aitem dalam tes itu me.akili secara representatif ka.asan %domain& perilaku yang diukur.
3. "es mengukur perilaku. Artinya aitem-aitem dalam tes menghendaki agar subjek menunjukkan apa yang diketahui
atau apa yang telah dipelajari subjek dengan cara menja.ab pertanyaan-pertanyaan atau mengerjakan tugas-tugas
yang dihendaki oleh tes.
(edangkan beberapa hal yang tidak tercakup dalam pengertian tes adalah*
#. 'efinisi tes tidak memberikan spesifikasi mengenai formatnya. Artinya tes dapat disusun dalam berbagai bentuk
dan tipe sesuai dengan maksud dan tujuan penyusun tes.
0. 'efinisi tes tidak membatasi macam materi yang dapat dicakupnya. Artinya tes dirancang untuk melakukan
pengukuran terhadap hasil belajar, terhadap kemampuan atau abilitas, terhadap kemampuan khusus atau bakat,
intelegensi dan sebagainya.
3. (ubjek yang dikenai tes tidak selalu perlu dan tidak selalu pula harus tahu kalu ia sedang dikenai tes. 6ebih lanjut,
subjek tidak selalu perlu tahu aspek psikologis apakah yang sedang diungkap dari dalam dirinya.
(ebagian ahli psikometri membatasi tes sebagai suatu prosedur khusus yang merupakan bagian dari pengukuran
secara keseluruhan. "yler %#A9#& mengatakan bah.a pengukuran adalah EE. Assignment of numerals according
to rulesG. ;adi pemberian angka seperti yang dilakukan dalam suatu tes memang merupakan suatu bentuk
pengukuran.
)arena tes merupakan alat pengukur maka istilah pengetesan kerap kali menggantikan istilah pengukuran, dan
sebaliknya. 'alam hal ini yang terpenting adalah mengetahui di mana penggunaan kedua istilah itu dapat
dipertukarkan atau saling menggantikan dan kapan kedua istilah tersebutharus dibedakan agar tidak menimbulkan
salah pengertian.
'alam halnya tes prestasi belajar, pengertian pengukuran prestasi adalah sama dengan pengertian pengetasan
prestasi. Akan tetapi istilah tes lebih banyak dan lebih populer digunakan dalam konteks belajar di kelas atau
disekolah. ,al ini mungkin sekali disebabkan karena tes prestasi mengandung pengertian situasi yang lebih formal,
tyertib, dan lebih terencana daripada pengukuran prestasi. Pengukuran prestasi lebih sering digunakan pada situasi
di luar kelas yang kadang-kadang sifatnya tidak begitu formal dan tampaknya lebih banyak dikenakan pada ka.asan
prestasi motorik seperti pengukuran prestasi ateltik dan lain sebagainya.
D. Bungsi Pengukuran Psikologis
"es dapat menyajikan fungsi tertentu. "es dapat memberikan data untuk membantu seseorang dalam meningkatkan
pemahaman diri %self-understanding2, penilaian diri %self-evaluation&, dan penerimaan diri %self-acceptance&. ;uga,
hasil pengukuran psikologis yang dapat digunakan seseorang untuk meningkatkan persepsi dirinya secara optimal
dan mengembangkan eksplorasi dalam bidang tertentu. 'isamping itu pengukuran pengukuran psikologis berfungsi
dalam memprediksi, memperkuat, dan meyakinkan seseorang. 'alam menyajikan fungsi-fungsi hasil pengukuran
psikologis, tes psikologis dapat digunakan sebagai suatu alat prediksi, suatu bantuan diagnosis, suatu alat pemantau
%monitoring&, dan sebagai suatu instrumen evaluasi.
#. Prediksi
,asil pengukuran psikologis dapat membantu dalam memprediksikan keberhasilan atau ke tingkat keberhasilan
tertentu, pekerjaan, jabatan atau karir tertentu, ataupun dalam suatu bidang usaha yang lainya. 'alam kategori ini
tes psikologis acapkali digunakan dalam rangka pemilihan %seleksi& atau menjaring orang-orang tertentu untuk
ditempatkan dalam suatu pekerjaan atau jabatan tertentu.
)onselor profesional yang terlibat dalam layanan testing berke.ajiban memberikan informasi tentang prediksi hasil
tes kepada para anak didiknya dan menjelaskan kepadanya fungsi dan peranan dari tes yang telah dijalaninya. 'ari
beberapa informasi yang diberikan tersebut, konselor berke.ajiban pula untuk membantu mendapatkan yang lebih
jelas kepada anak didiknya tentang hasil-hasil pengukuran psikologis tersebut dan dapat mengambil keputusan yang
bermakna dan layak serta sesuai dengan ketentuan-ketentuan yang telah ditetapkan.
0. 'iagnosi
,asil pengukiuran psikologis dapat dimanfaatkan dalam diagnosis. Bungsi diagnosis yang dimaksud di sini adalah
perumusan masalah yang dihadapi oleh seseorang atau klien dan perkiraan penyebabnya. )lien dapat dibantu untuk
memahami dengan baik pengetahuan dan keterampilan tertentu yang dimilikinya sehingga klian memiliki .a.asan
yang lebih luas dalam bidang-bidang tertentu yang memungkinkan dapat diraihnya dengan cepat dan tepat.
)emudian klien dapat mengambil suatu keputusan bidang-bidang mana yang memerlukan perhatian atau
konsentrasi yang sungguh-sungguh.
Penggunaan testing dalam diagnosis dapat memberikan informasi tentang bberbagai pekerjaan atau jabatan kepada
seseorang. ,al-hal lainnya yang dikaitkan dengan aspek-aspek testing pada diagnosis adalah tes yang dapat
memberikan informasi yang mungkin belum dikenal sebelumnya.
'alam beberapa hal, inventori minat mungkin dapat mengidentifikasi bidang minat yang belum dikenal sebelumnya,
dan dengan demikian melibatkan klien dalam eksplorasi secara lebih mendalam pengenalan terhadap minat-
minatnya.
3. +onitoring
"es psikologis dapat berfungsi sebagai alat pemantau. +isalnya, para konselor dan staf sekolah lainnya dapat
mengamati dan memantau sejauh mana kemajuan yang telah dicapai sis.a, sehingga mereka dapat secara
langsung mengambil manfaat dari hasil pengukuran psikologis.
"es prestasi %achievment tes& misalnya, dapat memberikan manfaat karena kemajuan dalam bidang akademis akan
dipantau sepanjang .aktu tertentu atau setiap saat dan acap kali tidak dapat diduga-duga terjadinya perubahan yang
dapat dicek kembali oleh konselor.
Pengukuran psikologis lainnya dapat diberikan dengan cara yang sama untuk membantu konselor dan klien sebagai
suatu upaya untuk meningkatkan beberapa macam perubahan dalam perilaku, sikap, dan keterampilan-keterampilan
klien.
(elain fungsi-fungsi tersebut di atas, juga terdapat fungsi-fungsi lain, di antaranya*
#. Bungsi seleksi, yaitu untuk memutuskan individu-individu yang akan dipilih, misalnya tes masuk suatu lembaga
pendidikan atau tes seleksi suatu jenis jabatan tertentu. !erdasarkan hasil-hasil tes psikologis yang dilakukan,
pimpinan lembaga dapat memutuskan calon-calon pelamar yang dapat diterima dan menolak calon-calon yang
lainya.
0. Bungsi klasifikasi, yaitu mengelompokkan individu-individu dalam kelompok sejenis, misalnya mengelompokkan
sis.a yang mempunyai masalah yang sejenis, sehingga dapat diberikan bantuan yang sesuai dengan masalahnya.
Atau mengelompokkan sis.a ke dalam program khusus tertentu.
3. Bungsi deskripsi, yaitu hasil tes psikologis yang telah dilakukan tanpa klasifikasi tertentu, misalnya melaporkan
profil seseorang yang telah di tes dengan tes inventori.
5. +engevaluasi suatu treatment, yaitu untuk mengetahui suatu tindakan yang telah dilakukan terhadap seseorang
atau sekelompok individu, apakah telah dicapai atau belum. Atau seberapa hasil yang ditimbulkan oleh suatu
tindakan tertentu terhadap seseorang atau sekelompok orang. +isalnya seorang sis.a yang mengalami kesulitan
belajar diberikan remedial. (etelah remedial tersebut lalu diadakan tes untuk mengetahui apakah remedial yang
diberikan berhasil atau belum.
1. +enguji suatu hipotesis, yaitu untuk mengetahui apakah hipotesis yang dikemukakan itu betul atau salah.
+isalnya seorang peneliti mengemukakan hipotesis sebagai berikut* makin terang lampu yang digunakan untuk
belajar makin baik prestasi belajar yang akan dicapai. Hntuk menguji betul tidaknya hipotesis yang dikemukakan itu
dapat dilakukan suatu eksperimen.
'ari berbagai keterangan di atas, dapat diketahui bah.a fungsi tes psikologis di samping untuk klasifikasi, deskripsi,
evaluasi, menguji hipotesis, juga berfungsi untuk seleksi. (emua fungsi-fungsi dipergunakan sebagai kerangka
acuan dalam pengambilan keputusan karir.
'. "ujuan pengukuran psikologis
"ujuan pengukuran psikologis adalah*
#. Agar klien mampu mengenal aspek-aspek dirinya %kemampuan, potensi, bakat, minat, kepribadian, sikap dan
sebagainya&.
0. 'engan mengenal aspek-aspek dirinya diharapkan klian dapat menerima keadaan dirinya secara lebih objektif.
3. +embantu klien untuk mampu mengemukakan berbagai aspek dalam dirinya.
5. +embantu klien untuk dapat mengelola informasi tentang dirinya
1. +embantu klien agar dapat menggunkan informasi tentang dirinya sebagai dasar perencanaan dan pembuatan
keputusan masa depan.
E. (ifat-sifat pengukuran psikologis
Apabila dibandingkan dengan tipe-tipe atau jenis-jenis pengukuran yang lainnya, pengukuran psikologis memiliki
sifat-sifat yang berbeda. Adapun sifat-sifat yang dimaksud adalah sebagai berikut*
#. Pengukuran psikologis dilakukan secara tyidak langsung berdasarkan perilaku yang tampak, atau berdasarkan
atas respon terhadap stimulus yang diberikan.
0. Pengukuran psikologis tidak pernah menunjukkan ketepatan seratus persen %#22I&. !agaimapun valid, reliabel,
atau baiknya alat yang digunakan, dan bagaimanapun cermatnya pengadministrasian yang dilakukan, pengukuran
itu selalu mengandung eror kesesatan tertentu.
3. Pengukuran psikologis tidak mempunyai satuan mutlak. (eseoranmg yang mendapatkan angka nol tidaklah
berarti kosong sama sekali.
5. ,asil pengukuran psikologis tidak mempunyai skala rasio. )ita hanya dapat mengatakan bah.a si A lebih pandai
dari si !. "etapi tidak dapat mengatakan bah.a si A satu setengah kali lebih pandai dari si !.
Pengertian Psikometri
Psikometri adalah cabang ilmu psikologi yang berkaitan dengan pengukuran atribut-atribut psikologis, E8. $=, E=,
(=, Perilaku 'elinkuen, )epribadian Ekstrovert J $ntrovert, +otivasi belajar, prestasi belajar, )epercayaan diri, dll.
Apa yang dimaksud dengan pengukuran:
Pegukuran adalah prosedur kuantifikasi terhadap atribut atau variabel dengan aturan-aturan tertentu# sepanjang
suatu kontinum0.
#. Dara pengadministrasian alat ukur, (ikap "ester terhadap subjek %teste& yang dikenai pengukuran, model skala
yang digunakan dalam pensekoran %apakah model likert* (angat (etuju, (etuju, "idak (etuju, (angat "idak (etuju,
atau menggunakan model "hurstone&.
0. KKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKK $=
92 ?2 A2 #22 #02
)arakteristik pengukuran*
#. Pembanding antara atribut yang diukur dengan alat ukurnya. )etika pak AntoF mengenakan tes >A$( kepada
Asrul pada dasarnya Pak AntoF hendak membandingkan skor yang diperoleh Asrul pada tes >A$( dengan suatu
kontinum skor yang ada pada tes >A$(.
0. ,asilnya dinyatakan secara kuantitatif.
3. ,asilnya bersifat deskriptif.
+engapa perlu dilakukan pengukuran:
#. -bjektivitas.
0. Penyajian data secara rinci, bisa dilakukan analisis matematis, komunikabilitas hasil yang tinggi.
3. Ekonomi.
5. Ceneralisasi
Evaluasi
#. Evaluasi adalah kegiatan membandingkan antara hasil ukur dengan suatu norma# atau suatu kriteria. (ebagai
contoh, seorang Psikolog tidak bisa mengatakan bah.a skor 92 yang diperoleh 6eely %4 tahun& pada tes !$<E"
adalah tergolong baik atau buruk, sebelum Psikolog tersebut membandingkan dengan norma tes yang ada. (eorang
Psikolog juga tidak bisa mengatakan skor A2 yang diperoleh Asrul %01 th& pada tes >A$( tergolong sebagai $= yang
Average, !righ Everage, atau (uperior sebelum Psikolog tersebut membandingkan dengan norma tes yang ada.
0. ,asilnya bersifat kulaitatif.
3. ,asilnya dinyatakan secara evaluatif.
#. <orma adalah rata-rata, secara umum norma dibagi menjadi dua yaitu norma perkembangan %seperti pada tes
!$<E"& dan norma kelompok %seperti pada tes >A$(&.
;enis data
(kala nominal* (kala nominal adalah skala yang berfungsi sebagai pembeda atau menunjukkan suatu karakteristik.
(ebagai contoh, (eorang peneliti melakukan penelitian dengan judul Perbedaan Produktivitas )erja Antara Pekerja
Pria dan >anita. Hntuk memudahkan dalam pengolahan data maka peneliti memberi angka # untuk Pria dan angka
0 untuk >anita.
(kala ordinal* Adanya perjenjangan dan jarak antar jenjang tidak sama. Dontoh* Ranking kelas, dll.
(kala interval*
#. Adanya perjenjangan dan jarak antar jejang diasumsikan sama.
0. <ol tidak mutlak.
3. "idak dimungkinkan adanya perkalian atau pembagian.
(kala rasio*
#. $nterval yang memiliki harga 2 mutlak.
0. 'apat dikenai operasi hitung.
Apakah Psikometri $tu:
(eperti halnya ekonometri dan biometri, maka psikometri dapat didefinisikan sebagai Lpenerapan@penggunaan
metoda-metoda statistika pada data tentang perilaku manusia %data psikologi&L. -ieh sebab itu, jika anda membaca
buku-buku teks tentang psikometri atau jurnal yang diterbitkan oleh perhimpunan ahli psikometri %the Psychometric
(ociety& seperti LPsikometrikaL, maka yang akan anda jumpal adalah dua hal, yaitu*
M pembahasan teiitang teori-teori statistika yang sering dipakai pada data psikologi seperti teori estimasi, teori
distribusi, dsb,
M pembahasan tentang penggunaan@ aplikasi metoda statistika tertentu dalam pengolahan data di bidang
psikologi.
Pada jenis yang pertama materinya lebih bersifat teori statistika dan sering disebut sebagai Lteori psikometriL,
sedangkan yang kedua biasanya disebut Lpsikometri terapanL. !aik pada jenis yang pertama maupun yang kedua,
yang dibahas dalam bidang psikometri adalah sama yaitu selalu tentang statistika.
!erbeda dengan data di bidang ekonomi, biologi, dan fisika, data di bidang psikologi sebagian besar diperoleh
melalui proses pengukuran yang bersifat tidak langsung, dan dilakukan dengan menggunakan alat ukur yang sulit
untuk divalidasi dan dikalibrasi. -leh sebab itu, yang dibahas di dalam psikometri tidak hanya tentang penggunaan
statistika untuk menerangkan hubungan antara variabel-variabel psikologis yang telah terukur@ada datanya, tetapi
juga mengenai aplikasi statistika untuk untuk menerangkan Lmutu dataL itu sendiri sebagai hasil dari suatu
upaya@proses pengukuran. !ahkan, di dalam banyak buku tentang psikometri sering ditemui isi materi yang
didominasi oleh pembahasan yang mendalam dan panjang lebar tentang LpengukuranL tersebut. Akibatnya, sering
timbul kesan bah.a psikometri adalah ilmu@metoda tentang pengukuran variabel-variabel psikologis %teori tes&
semata. Padahal, model-model matematis@statistis yang ditelaah di dalam psikometri adalah menyangkut baik
tentang Lmodel pengukuranL measurement model maupun Lmodel tentang hubungan antara variabel-variabel yang
terukurL structural model. !ahkan, dalam perkembangannya saat ini, ilmu psikometri telah mplangkah lebih maju lagi
dengan telah berhaNiil dipadukannya kedua jenis model di atas sehingga hubungan antara variabel-variabel yang Ltak
terukurL pun telah dapat diterangkan dan diuji secara empirik.
Psikometri dan Pengembangan "es
)arena yang menjadi fokus pembicaraan dalam lokakarya ini adalah tentang pengggunaan tes psikologi untuk
menseleksi calon karya.an, maka konsep-konsep psikometri yang akan disajikan di sini pun adalah tentang kedua
model yang telah dikemukakan di atas dalam kaitannya dengs-n keberhasilan dari suatu proses seleksi. <amun
demikian, mengingat kemungkinan beragamnya tingkat pemahaman statistika para peserta, maka seluruh
pembahasan akan dilakukan secara non-statistikal dalam arti bah.a rumus-rumus serta model matematis dari
konsep yang dibahas tidak akan disajikan. Pertama, pada bagian ini akan dibahas konsep-konsep yang berkenaan
dengan measurement model, yang dalam hal ini adalah tentang hal-hal yang perlu diperhatikan dalam
pengembangan suatu tes sebagai Lalat ukurL sehingga data yang dihasilkannya dapat dipercaya. )emudian, pada
bagian selanjutnya akan dibahas pula segi structural model nya, yang dalam hal ini adalah berkenaan dengan
Lpenggunaan yang tepat dari suatu atau beberapa tes yang telah diuji mutunyaL sehingga dapat diperoleh suatu
keputusan seleksi yang optimal.
)onsep yang pertama yang perlu dikemukakan adalah tentang LtesL itu sendiri. (ecara operational, tes dapat
dinyatakan sebagai himpunan pertanyaan pertanyaan yang harus di ja.ab, atau pernyataan-pernyataan yang harus
dipilih@ ditanggapi, atau tugas-tugas yang harus dilakukan oleh orang yang dites %testee& dengan tujuan untuk
mengukur suatu aspek perilaku dari orang yang di tes. Dontoh yang sederhana adalah tes prestasi belajar, di mana
hal yang hendak diukur ialah tingkat sejauh mana seorang sis.a telah menguasai bahan pelajaran yang telah
diajarkan kepadanya. 'i sini, prestasi belajar dapat meliputi aspek pengetahuan dan ketrampilan seseorang. 'alam
istilah psikologi, aspek intelektual dan pengetahuan disebut aspek kognitif sedangkan aspekketrampilan disebut
aspek motorik. (elain tes untuk aspek intelektual dan ketrampilan, ada pula tes psikologis yang dimaksudkan untuk
mengukur hal-hal yang berkenaan dengan karakteristik pribadi %.atak, motivasi, minat, sikap, konsep diri, dsb.&, yang
soring kali disebut sebagai tes kepribadian atau Lpersonality testL. !anyak ahli psikologi tak mau menyebut alat ukur
jenis ini sebagai LtesL tetapi merpka menggunakan sebutan LinventoryL, atau LscaleL. !ahkan banyak dari mereka
yang begitu berhati-hati sehingga tak menamakan pengukuran aspek kepribadian seseorang ini dengan istilah
LmeasurementL tetapi cukup menggunakan istilah LassessmentL.
"es yang dimaksudkan sebagai alat ukur aspek kognitif biasanya dibagi menjadi dua jenis, yaitu apa yang disebut
Ltes kemampuanL %po.er test& dan Ltes kecepatanL %speed test&. Pemahaman tentang pembagian jenis tes ini amat
penting karena sifat-sifat yang harus dimiliki kedua jenis tes tersebut amat berbeda. Adapun perbedaan sifat tersebut
adalah sebagai berikut*
Prinsip dari suatu Lpo.er testL adalah tidak diperbolehkannya pembatasan .aktu di dalam pengerjaan tes.
+enurut prinsip ini, hanya jika .aktunya tak dibatasi, barulah hasil tes itu akan benar-benar mengungkapkan
kemampuan seseorang. Adanya pembatasan .aktu diperkirakan akan menyebabkan orang menjadi tidak dapat
menunjukkan seluruh kemampuan yang dimilikinya, sehingga skor yang dihasilkan tidak menunjukkan kemampuan
yang sebenarnya dari orang tersebut. <amun demikian, adalah tidak efisien jika orang yang paling lambat pun harus
ditunggu sampai ia menyelesaikan tes yang dihadapinya, terutama pada tes yang diberikan secara klasikal %kelom-
pok&. (ebagai kompromi, biasanya para ahli tes masih menganggap suatu pelaksanaan tes sebagai Ltes
kemampuanL %po.er test& jika sebagian besar orang yang dites dapat menyelesaikan tes tersebut dalam .aktu yang
disediakan. ,al ini perlu untuk diperhatikan oleh orang yang akan menyusun kisi-kisi suatu tes.
(ebaliknya pada sebuah Lspeed testL, yang diukur di sini ialah kecepatan di dalam memikirkan atau mengerjakan
sesuatu. ;adi, yang harus dilakukan hendaknya merupakan pengulangan tugas yang sama dalam suatu periode
.aktu yang ditentukan. "ugas tersebut sebaiknya dibuat semudah mungkin sehingga yang diukur benar-benar
kecepatan bekerja@ berpikir dan bukanlah kemampuan orang tersebut. "es prestasi belajar yang kita susun
umumnya adalah tes prestasi yang bersifat tes kemampuan %po.er test&.
"es yang dimaksudkan untuk mengungkapkan aspek .atak@ kepribadian pun terdiri dari duajenis yaitu tes
kepribadian yang bersifat LproyektifL dan yangNbersifat Lnon-proyektifL. "es yang bersifat proyektif adalah yang
menuntut orang yang di tes untuk memproyeksikan perasaan maupun pendiriannya melalui cerita, gambar, tulisan,
dan sebagainya. 'alam hal ini, orang yang di tes biasanya tidak menyadari@ mengetahui aspek apa yang sebenarnya
hendak diungkapkan oleh tes yang dihadapinya. Dontoh dari tes seperti ini adalah L"hematic Apperception "estL di
mana orang dihadapkan kepada kartu berisi gambar kemudian diminta untuk mengarang cerita tentang apa yang
terdapat dalam gambar tersebut. (elanjutnya, tes kepribadian yang bersifat Lnon-proyektifL adalah yang berbentuk
lebih obyektif dalam arti orang yang di tes diminta memilih alternatif tanggapan yang telah tersedia terhadap suatu
pernyataan atau situasi yang disajikan. Pada tes jenis ini, pengolahan data dan penafsirannya adalah seperti halnya
pada tes bidang aspek kognitif dan ketrampilan di atas. Dontoh sederhanii dari tes yang bersifat Lnon-proyektifL
adalah Lskala sikapL.
,al lain yang perlu diingat ialah bah.a tes itu adalah sebuah alat ukur, sebagaimana halnya dengan alat ukur
panjang %misalnya mistar&, alat ukur berat %timbangan&, alat ukur suhu %termometer&, dan sebagainya. !edanya ialah
bah.a tes dimaksudkan untuk mengukur aspek perilaku manusia. -leh sebab itu, segala persyaratan bagi sebuah
alat ukur yang baik, berlaku pula bagi sebuah tes.
(yarat pertama ialah bah.a setiap alat ukur yang baik hanya mengenai@ mengukur satu dimensi@ aspek saja. +istar
hanya mengukur jarak@panjang, timbangan hanya mengukur berat, dan sebagainya. ;adi sebuah tes prestasi belajar
di bidang matematika, misalnya, setiap butir soalnya harus mengukur hanya pengetahuan matematika saja. Pada
alat ukur di bidang fisika, pemenuhan syarat yang pertama ini biasanya lebih mudah. <amun pada alat ukur perilaku
manusia, pemenuhannya lebih sukar. Pada butir soal matematika, tidak mustahil terdapat unsur bahasa, atau bentuk
soal yang belum biasa dikenal oleh sis.a, dsb., sehingga berhasil tidaknya sis.a dalam menja.ab soal tersebut
akan bergantung pula pada aspek lain selain kemampuannya di bidang matematika. 'alam hal ini, kemampuan
sis.a dalam menja.ab soal tersebut dengan benar tidaklah semata-mata ditentukan oleh pengetahuannya di bidang
matematika, melainkan ditentukan pula oleh pemahamannya terhadap hal bahasa, bentuk soal, dan sebagainya itu.
'engan kata lain, dapat saja terjadi bah.a di dalam sebuah tes matematika terdapat butir-butir soal yang
sebenarnya tidak sepenuhnya mengukur kemampuan matematika. "es seperti ini disebut kurang LvalidL %kurang
sahih&. Hkuran tentang sejauh mana skor yang dihasilkan oleh sebuah tes men-)ing terbukti mengukur apa yang
diniati hendak diukur, disebut LvaliditasL dari sebuah tes. (etiap tes psikologi yang hendak digunakan, termasuk bagi
keperluan seleksi calon karya.an, harus terlebih dahulu diuji dan diketahui tingkat validitas nya.
!erkenaan dengan hal di atas, hanya jika sebuah tes %misalnya tes matematika& bersifat Lsatu dimensiL
%unidimensional&, barulah kita boleh menamakan skor total dari tes tersebut sebagai skor untuk dimensi yang diukur
%dalam hal ini Lskor matematikaL&. ;ika ada sebuah dimensi yang sifatnya lebih umum@luas seperti misalnya
LinteligensiL atau Lpengetahuan sosialL, maka perlu disusun sub-sub tes yang berdimensi tunggal %unidimensional&
yang hanya mengukur satu aspek saja dari LinteligensiL atau Lpengetahuan sosialL itu. 'alam hal ini disyaratkan
bah.a setiap aspek@sub-tes harus berkorelasi tinggi satu sama lain sehingga dapat dijadikan bukti bah.a semua
aspek tersebut memang merupakan bagian dari suatu yang lebih umum@ luas itu. ;ika tidak, maka sebenarnya kita
tak boleh menjumlahkan begitu saja skor-skor yang dihasilkan, untuk kemudian dinamakan sebagai skor inteligensi
atau skor pengetahuan sosial seseorang.
(yarat yang kedua ialah bah.a suatu tes harus memiliki sifat LkehandalanL dari suatu alat ukur. $stilah yang sering
digunakan uiituk hal ini ialah LreliabilitasL dari skor sebuah tes. )ehandalan yang dimaksud disini meliputi
ketepatan@kecermatan %precision& hasil pengukuran, dan keajegan@ kestabilan %consistency& dari hasil pengukuran.
)ecermatan hasil pengukuran ditentukan oleh banyaknya informasi yang dihasilkan dan amat berkaitan dengan
satuan ukuran dan jarak rentang %range& dari skala yang digunakan. 'alam mengukur berat sebuah cincin emas.
pengukuran dengan timbangan yang bersatuan miligram dan berjarak rentang antara 2 J #222 mg, tentu akan
menghasilkan ukuran yang lebih teliti dari pada penggnnaan timbangan dengan satuan kilogram dan berjarak
rentang 2 - #22 kg. !egitu pula halnya dengan tes prestasi belajar, tes inteligansi, tes bakat, dsb. (ebuah tes dengan
jumlah soal yang cukup banyak dan seluruh soalnya bertaraf kesukaran LsedangL %on-target& bagi orang yang
menempuh, tentu akan menghasilkan informasi yang lebih teliti mengenai orang yang diukur jika dibandingkan
dengan tes yang soalnya sedikit dengan tingkat kesukaran yang Loff-targetL. 'engan kata lain, soal-soal sebuah tes
tidak boleh terlalu jauh di ba.ah atau di atas tingkat kemampuan intelektual orang yang akan mengerjakannya agar
tingkat kecermatan hasil pengukuran dapat lebih tinggi. 'engan demikian, sebuah kisi-kisi tes yang menetapkan
prosentase soal yang mudah, sedang dan sukar, pada prinsipnya adalah salah dan menyimpang dari teori tentang
kehandalan hasil sebuah tes. ;ika orang yang hendak di tes sangat hcterogin tingkat kemampuannya, maka menurut
teori keterhandalan pengukuran, mereka harus dibagi menjadi beberapa kelompok yang relatif homogin, sehingga
untuk setiap kelompok dapat disusun dan diberikan tes yang tingkat kesukarannya sesuai dengan tingkat
kemampuan mereka. (ecara teoretis, jika memungkinkan, maka hendaknya setiap individu hanya dihadapkan pada
soal-soal yang tepat bagi tingkat kemampuan dirinya saja %individualied atau tailored testing&. 'engan bantuan
komputer dan bank soal yang soal-soalnya telah dikalibrasi, hal seperti ini dapat dimungkinkan dan memang telah
dipraktekkan di beberapa tempat di Amerika, Eropa daratan, dan Australia.
"entang syarat kestabilan@ keajegan %consistency& dari skor suatu tes, ada dua istilah yang perlu dikenal yaitu
keajegan internal dan eksternal. )eajegan internal ialah tingkat sejauh mana butir-butir soal sebuah tes itu homogin
baik dari segi tingkat kesukaran maupun dari segi bentuk soal@prosedur menja.abnya. ,al ini berkaitan erat dengan
masalah kehormatan@presisi yang telah dibicarakan sebelumnya, di mana disyaratkan agar tingkat kesukaran semua
soal yang ada dalam suatu tes sesuai dengan tingkal kemampuan orang yang akan di tes. "ingkat kehandalan skor
tes dalam arti %#& homoginitas butir soal dan %0& kehandalan butir-butir soal tersebut dalam mengungkapkan
perbedaan kemamnuan yang terdapat di kalangan sis.a, dapat diukur dengan sebuah indeks yang dikenal dengan
sebutan Lindeks alpha dari DronbachL %Dronbach Alpha&. )husus untuk tes tertulis yang ja.abannya bersifat
dichutomis %yaitu benar jika memilih kuncinya dan salah jika tidak&, teknik perhitungan indeks alpha tersebut dapat
disederhanakan sehingga lebih mudah dihitung. Penyederhanaan terhadap teknik perhitungan %rumus& alpha
tersebut dikemukakan oleh dua orang yang bernama )uder dan Richardson. -leh sebab itu, salah satu rumus
perhitungan indeks keterhandalan skor tes yang paling populer dikenal dengan sebutan )RO?2, di mana huruf
pertama dari nama kedua orang tersebut dicantumkan. ,al ini perlu dikemukakan karena setiap buku mengenai tes
selalu membicarakan konsep reliabilitas dengan rumus keterhandalan skor tes yang disebut indeks )RO02 itu.
)uder dan Richardson bahkan mengajukan pula cara perhitungan yang lebih sederhanajika butir-butir soal yang ada
dalam sebuah tes memang benar-benar homogin taraf kesukarannya. Rumus yang lebih sederhana tersebut
dinamakan indeks )RO0#.
'alam hal keajegan yang bersifat eksternal, pokok permasalahannya ialah mengenai tingkat sejauh mana skor yang
dihasilkan dari penyajian sebuah tes kepada sekelompok orang, akan tetap sama sepanjang kemampuan orang-
orang yang diukur tersebut masih belum berubah. Dara pendekatannya ada dua. Pertama, dengan mcmbayangkan
sekelompok orang menempuh sebuah tes berulang-ulang sampai tak terhingga kali banyaknya dengan asumsi
bah.a %#& kcmampuan orang tersebut tak berubah, dan %0& orang tersebut tak akan mempelajari isi tes. )edua,
dengan membayangkan sekelompok orang menempuh perangkat-perangkat tes paralel yang tak terhingga
banyaknya %diperlukan tes paralel karena disadari bah.a jika tesnya tetap sama maka orang tersebut akan
mempelajari isi tes tersebut&. ;ika dari kedua pendekatan tersebut dapat dihasilkan skor ya.ng sama pada setiap
pengukurannya, inaka berarti alat ukur %tes& tersebut adalali alat yang memenuhi syarat keajegan hasil ukuran
seeara eksternal. 'alam prakteknya, kedua pendekatan tersebut tak dapat dilaksanakan. !iasanya cukup disajikan
dua tes yang dianggap paralel atau sebuah tes disajikan dua kali saja. ;arang sekali ada yang sampai tiga kali atau
lebih. Hntuk menentukan apakah hasil yang diperoleh adalah sama, pun biasanya hanya dihitung dengan indeks
statistika yang disebut korelasi, yang sebenarnya kurang memadai untuk dipakai sebagai indeks keajegan. 'i dalam
cara mendapatkan perangkai, paralel pun kadang-kadang orang ingin mudahnya saja. !ukannya menyusun
perangkat baru yang paralel, tetapi cukup membagi saja tes yang akan diuji keajegannya itu menjadi dua buah sub-
tes yang masing-masing jumlah soalnya hanya separuh dari tes semula. )orelasi antara skor dari masing-masing
sub-tes tersebut kemudian dihitung dan dianggap sebagai indeks keajegan eksternal dari sebuah tes yang jumlah
butir soalnya hanya separuh dari tes samula. !erdasarkan hasil perhitungan ini kemudian dilakukan penaksiran
terhadap indeks keajegan eksternal dari tes yang sama seandainya jumlah soal tes tersebut dilipatkan dua.
)onsep lain yang perlu diketahui dalam teori tes ialah mengenai skala hasil pengukuran. Pengukuran yang terbaik
ialah yang menghasilkan ukuran dengan Lskala mutlakL %ratio scale&. Artinya, angka nol yang dihasilkan benar-benar
menunjukkan absensi %tidak adanyakuantitas& dari dimensi@aspek yang diukur, dan setiap angka hasil pengukuran
merupakan rasio dari dua obyek pada suatu dimensi yang sama. (ebagai contoh, pada pengukuran jarak antara dua
benda dengan menggunakan mistar yang ketelitiannya sampai sepersejuta milimeter, angka nol dapat ditafsirkan
sebagai berimpitnya kedua benda tersebut. Doba bandingkan hal tersebut dengan pengukuran suhu yang
menggunakan thermometer, di mana angka nol adalah didasarkan pada konvensi atau kesepakatan. +eskipun jarak
antara empat dan enam Delcius adalah sama dengan antara delapan dan sepuluh Delcius, tetapi tidak dapat
ditafsirkan bah.a delapan Delsius adalah dua kali lebih panas dari lima Delsius. (kala yang satuan ukurannya
berjarak sama tetapi titik a.al %nol& nya tidak miitlak seperti ini disebut skala interval.
"es psikologi yang dimaksudkan untuk mengukur aspek inlelektual, umumnya hanya menghasilkan skor dalam skala
interval tersebut. $tu pun jika semua butir soalnya benar-benar homogin baik dari segi isi materi, bentuk, maupun
taraf kesukarannya. !iasanya, pada sebuah tes selalu terdapat variasi pada ketiga hal tersebut, sehingga skala yang
dihasilkan tidak sepenuhnya bersifat %ePui-& interval. <amun dalam praktek sehari-hari, orang menganggap skala,
seperti itu sebagai skala interval. ,al seperti ini tentu saja dapat mengakibatkan kesalahan dalam penafsiran iiasil tes
serta dalam berbagai keputusan yang diambil berdasarkan hasil tes tersebut.
;enis skala lain ialah skala ordinal. 'alam skala ini yang ada hanyalah informasi tentang tinggi rendahnya posisi
obyek pada dimensi@ aspek yang diukur. !erapa tinggi dan herapa rendahnya tidak diketahui. ;adi informasi yang
diperoleh hanyalah bersifat penjenjangan kasar %ranking& saja. +isalkan ada tiga sis.a yang tinggi badannya
berbeda, masirg-masing #93, #4? dan #51em ;ika seorang guru yang belum mengetahui tinggi badan mereka,
dimintai meranking, akan diperoleh ranking kesatu, dua, dan ketiga. Padahal jarak antara tinggi sib.a yang kesatu
dan kedua sebenarnya amatlah berbeda dengan antara yang kedua dan ketiga. 'engan kata lain, skala angka #, 0,
dan 3 itL tidak berjarak sama%ePuiinterval&. ,asil pengumpulan data melalui skala rating, dan skala sikap@ angket
biaaanya dalam tingkatan skala ordinal ini. ;enis skala yang lair ialah skala nomiiial. Ei sini. skala atau angka yang
dihasilkan hanya bersifat klasifikasi@ kategorisasi@ nominasi saja. Dontohnya ialah jika ada delapan propinsi diberi
kode dengan angka satu sampai delapan. 'i sini angka yang dihasilkan tidak menunjukkan perbedaan tingkat dalam
suatu dimensi apa pun.
+asih banyak konsep-konsep penting yang berkenaan dengan teori tes yang harus diketahui oleh orang yang
hendak mengembangkan tes ataupun yang hendak mengetahui apakah tes yang akan digunakannya cukup bermutu
atau tidak. <amun dalam .aktu yang singkat seperti ini tak mungkin diliput seluruhnya. ,al-hal tersebut dapat
dibicarakan dalam kesempatan yang lain. !egitu pula halnya dengan pendalaman terhadap hal-hal yang telah
dibicarakan pada kesempatan ini, seperti misalnya mengenai model-model matematis@statistis dari setiap konsep
yang telah dibicarakan di muka.
Psikometri dan Penggunaan "es
"ujuan penggunaan tes biasanya banyak sekali ragamnya, namun selalu berkenaan dengan satu hal, yaitu
peiiggunaan skor tes untuk mengambil suatu keputusan. 'engan deinikian. sifat dasar dari perinasalaliannya adalah
peramalan tentang tepat tidaknya kepntusan yang diambil berdasarkan hasil dari suatu tes tersebut. 'engan kata
lain, skor tes yang dijadikan dasar pengambilan keputusan selalu n.rupakan variabel peramal %prediktor&,
sedangkan bervariasinya hasil yang timbul sebagai akibat dari diambilnya keputusan berdasarkan prediktor tprsebut
adalah variabel akibat %dependent variable, atau kriterion&. 'alam praktek, agar keputusan yang diambil dapat benar-
benar berhasil, maka. variabel yang dija,dikan dasar pengambilan keputusan itu biasanya terdiri dari beberapa buah
%misalnya skor dari beberapa tes ditambah dengan beberapa hal lain yang juga dijadikan dasar pertimbangan&.
!egitu pula halnya dengan variabel kriterion, biasanya terdiri dari hasil pengukuran terhadap berbagai jenis indikator
keberhasilan@kegagalan dari keputusan yang telah diambil. 'alam situasi penggunaan tes seperti ini, metoda-metoda
psikometri dapat dipergunakan sebagai alat untuk mencapai dua jenis tujuan*
untuk mendapatkan persamaan matematis yang paling handal dalam meramalkan akibat dari suatu keputusan
yang akan diambil berdasarkan skor dari satu atau sehimpunan tes. ;ika persamaan ini dapat ditemukan
berdasarkan penelusuran %eksplorasi& terhadap struktur hubungan antar variabel Qyang ada pada data, maka
keputusan-keputusan berdasarkan skor tes tersebut dapat disempurnakan.
untuk menguji apakah suatu model teoretis tentang cara penggunaan skor tes tertentu untuk tujuan tertentu yang
selama ini mungkin telah sering dipakai adalah memang cukup handal dan dapat dipercaya.
!aik pada tujuan yang pertama maupun yang kedua, permasalahannya adalah sama, yaitu mengenai tingkat
kesahihan %validitas& dari suatu keputusan yang telah diambil. (ehubungan dengan hal ini, khususnya pada masalah
seleksi calon karya.an, mahasis.a, dsb, validitas keputusan yang pernah diambil sering kali dikaitkan dengan tes
yang digunakan sehingga ukuran tentang validitas keputusan tersebut sering dinyatakan sebagai ukuran validitas
dari tes tersebut dalam penggunaannya sebagai alat seleksi. )eputusan seleksi yang menghasilkan tingkat validitas
yang tinggi biasanya didasarkan pada sehimpunan skor tes yang komposisi bobot peranan masing-masing tes
terhadap keputusan yang diambil telah ditetapkan secara empirik melalui penggunaan metoda-metoda psikometri
yang tepat. Hpaya menemukan model persamaan seleksi yang tepat secara empirik ini disebut Lselection modelingL
dan dalam bentuk yang canggih biasanya menggunakan model statistik yang di dalam ilmu psikometri dikenal
dengan nama Lmodeling dengan persamaan strukturalL.