Dalam sejarah tentang tes diceritakan, bahwa pemerintah kerajaan China telah
menggunakannya sekitar tahun 2200 SM. Tes tersebut digunakan untuk menyeleksi/
merekrut calon pegawai pemerintah kerajaan. Bentuk tes yang digunakan adalah tes lisan,
dimana dari penyelenggaraan tes ini harapkan dapat menentukan pejabat pemerintah
manakah yang layak mengerjakan tugasnya (fitness for office).
Di Amerika, gerakan testing psikologis berkembang sejak awal abad 19. Hal ini
disebabkan oleh karena kebutuhan akan adanya instrumen pengukuran kemampuan seseorang
sebagai akibat dari perkembangan industri pada waktu itu. Dunia industri dan dunia usaha
membutuhkan tenaga terampil dengan bakat dan kemampuan yang memadai untuk
menjalankan mesin-mesin dan melakukan pekerjaan-pekerjaan modern demi efisiensi dan
produktivitas.
Perang Dunia I juga memerlukan tenaga militer dengan kemampuan yang
diidentifikasi secara cepat untuk ditempatkan atau menjadi tenaga di bagian-bagian yang ada
seperti artileri, infantri, penerbang nakhoda, dan sebagainya.
Usaha pengukuran mental dimulai dengan rintisan oleh A. Binet, seorang dokter
Perancis dalam tahun 1890, yang tertarik untuk meneliti anak-anak yang pintar dan yang
tidak. Usahanya bersama Simon, juga dari Perancis, membuahkan tes inteligensi Binet-
Simon. Usaha tersebut kemudian diteruskan di Amerika Serikat oleh L.M. Terman dari
Universitas Stanford yang bersama M.A. Merril bertujuan merevisi dan menyempurnakan tes
buatan Binet. Hasilnya adalah tes kecerdasan Stanford-Binet pada tahun 1937 dengan
penyempurnaan yang penting, yaitu mulai digunakannya ukuran berupa kuosien kecerdasan
(Intelligence Quotient).
Sejak itu, usaha-usaha penyusunan tes meluas dan maju pesat mencakup bidang-
bidang kepribadian yang luas untuk berbagai penggunaan dan dengan menggunakan
teknologi yang makin canggih. Bidang penggunaan tes meluas, tetapi sebagaimana bisa
diduga pendidikan (sekolah) adalah pengguna yang utama. Diberlakukannya undang-undang
pendidikan untuk pertahanan nasional (National Defense Education Act) dalam tahun 1958
dipicu oleh peluncuran Sputnik, satelit pertama dalam tahun 1957 oleh Rusia (Uni Soviet
waktu itu).
Pemerintah federal Amerika serikat menyediakan dana besar untuk pengembangan
testing dan juga untuk pengembangan program konseling di sekolah menengah. Di samping
itu, bidang lain yang menggunakan tes adalah kedokteran, kehakiman, militer, manajemen,
dan perdagangan. Ilmuwan terkemuka dalam gerakan bimbingan (guidance) di Amerika
waktu itu, di antaranya E.L. Thorndike dengan Teori Pengukuran Mental, L.M. Terman
dengan tes kecerdasan Stanford-Binet, A.S. Otis dengan Tes Army Alpha, Strong dengan Tes
atau Inventory Minat, Kuder dengan Tes Minat, G.K. Bennet, dkk dengan Tes Bakat
Differensial.
B. Pengertian Tes
Bila dilihat dari wujud fisiknya, suatu tes adalah serangkaian pertanyaan yang harus
dijawab atau tugas yang harus dikerjakan guna memberikan informasi mengenai aspek
psikologis tertentu berdasarkan jawaban dari pertanyaan-pertanyaan atau cara dan hasil
subyek melakukan tugasnya. Penjelasan ini mungkin terlalu sederhana, karena pada
kenyataannya tidak sembarang kumpulan pertanyaan cukup berharga untuk dinamakan suatu
alat tes. Banyak syarat-syarat yang harus dipenuhi terlebih dahulu agar pertanyaan itu dapat
dikategorikan sebagai alat tes.
Anne Anastasi (1976) mengatakan bahwa tes pada dasarnya adalah suatu pengukuran
yang obyektif dan standar terhadap sampel perilaku. Moore (1983) mengatakan bahwa tes
adalah instrumen utama untuk menilai kinerja manusia. tes adalah ukuran perwakilan dari
perilaku sampel suatu populasi. Sementara Guy (1985) berpendapat, bahwa tes adalah alat
untuk mengukur pengetahuan, keterampilan, perasaan, intelegensi, dan/atau sikap dari
individu atau kelompok. Definisi yang lebih lengkap dapat dikutipkan langsung dari pendapat
Cronbach yang dikemukakan dalam bukunya Essentials of psychological Testing, yaitu: “….a
systematic procedure for observing a person’s behavior and describing it with the aid of a
numerical scale or a category system” (Cronbach, 1970).
Dari batasan-batasan mengenai tes tersebut diatas, dapatlah kita tarik kesimpulan
pengertian, antara lain:
1. Tes adalah prosedur yang sistematis, artinya (a) item-item dalam tes disusun dengan cara dan
aturan tertentu, (b) prosedur administrasi dan pemberian angka (skoring) tes harus jelas dan
dispesifikasikan secara terperinci, dan (c) setiap orang yang mengambil tes tersebut harus
mendapat item-item yang sama dan dalam kondisi yang sebanding.
2. Tes yang berisi sampel perilaku, artinya (a) betapapun panjangnya suatu tes isi yang
tercangkup didalamnya tidak akan lebih dari seluruh item yang mungkin ada, dan (b)
kelayakan suatu tes tergantung pada sejauh mana item-item di dalam tes itu mewakili secara
representatif kawasan (domain) perilaku yang diukur.
3. Tes mengukur perilaku, artinya item-item dalam tes menghendaki subyek agar menunjukkan
apa yang diketahui atau apa yang telah dipelajari subyek dengan cara menjawab item-item
atau mengerjakan tugas-tugas yang dikehendaki oleh tes.
4. Tes psikologi adalah suatu teknik yang terstruktur yang digunakan untuk menghasilkan satu
contoh perilaku terpilih. Contoh perilaku ini digunakan untuk membuat kesimpulan tentang
atribut-atribut psikologis dan seseorang yang sedang dites. Beberapa contoh atribut seseorang
antara lain intelegensi, self esteem (harga diri), need for achievement (kebutuhan berprestasi),
dan sebagainya.
Tes psikologi merupakan instrumen penting dalam proses asesmen. Awalnya, fungsi tes
psikologi adalah untuk mengukur perbedaan-perbedaan antara individu atau antara reaksi
individu yang sama dalam situasi yang berbeda. Namun, dewasa ini, tes psikologi digunakan
untuk pemecahan permasalahan praktis yang berskala luas, baik di bidang pendidikan, klinis,
maupun organisasi.
C. Klasifikasi Tes
Gary W. Moore (1983; 196-201) menjelaskan, bahwa tes dapat diklasifikasikan
menjadi :
1. Standardized Test
Adalah instrumen utama untuk menilai kinerja manusia. Tes digunakan untuk mengukur
sampel perilaku suatu populasi. Sebuah tes yang terstandarisasi adalah salah satu tes yang
memiliki prosedur konsisten dan seragam untuk mengadministrasi, pen-skoran, dan
menafsirkan perilaku subjek.
Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun
oleh lembaga yang khusus menyelenggarakan secara professional. Tes tersebut diketahui
memenuhi syarat sebagai tes yang baik; yakni diketahui validitas dan reliabilitasnya baik
validitas rasional maupun validitas empirik, reliabilitas dalam arti teruji tingkat stabilitas,
maupun homoginitasnya.
Tes ini dapat digunakan dalam waktu yang relatif lama, dapat diterapkan pada beberapa
obyek mencakup wilayah yang luas. Untuk mengukur validitas dan reliabilitasnya telah diuji-
cobakan beberapa kali sehingga hasilnya dapat dipertanggungjawabkan.
2. Non Standardized Tests
Adalah tes yang tidak dibuat melalui prosedur yang konsisten sebagai proses konstruksi
untuk meminimalkan kesalahan. Contoh tes yang tidak terstandarisasi yang misalnya tes yang
dibuat oleh guru untuk digunakan dalam kelas, tes yang dikembangkan dalam penelitian. Tes
yang tidak terstandarisasi biasanya tidak untuk dievaluasi atau digunakan dalam mereplikasi
hasil studi itu.
Tes Non-standar dapat diartikan sebagai tes yang disusun oleh seseorang yang belum
memiliki keahlian professional dalam penyusunan tes, atau mereka yang memiliki keahlian
tetapi tidak sempat menyusun tes secara baik, mengujicobakan, melakukan analisis sehingga
validitas dan reliabilitas belum dapat dipertanggungjawabkan. Tes non standar sering
digunakan untuk menyebut tes yang dibuat seseorang tanpa bantuan tim ahli.
Sedangkan dari segi isi dan tujuan, Cronbach (1970) mengklasifikasikan testing menjadi:
1. Tes yang mengukur performansi maksimal (maximum performance)
Contohnya Tes Kemampuan (Ability Test)
2. Tes yang mengukur performansi tipikal (typical performance)
Contohnya, Tes Kepribadian, Tes Minat, Tes Karakter
Drenth (1965) mengatakan, bahwa tes dapat diklasifikasikan menjadi :
1. Tes yang mengukur tingkah laku
a. Metode observasi (misalnya : tes observasi, metode observasi kelompok)
b. Metode inventori (misalnya : tes minat, tes sikap & nilai, tes inventory & kepribadian, tes
inventori khusus)
c. Tes pola tingkah laku (misalnya : tes organisasi, tes kualitatif tingkah laku motorik, tes
kualitatif untuk intelegensi, metode untuk mengukur gaya tingkah laku)
d. Metode proyeksi (misalnya : metode persepsi, metode proyeksi, metode ekspresi, metode
konstruksi, metode asosiasi, metode pilihan)
2. Tes yang mengukur kemampuan/ prestasi
a. Tes intelegensi umum bentuk tunggal (misalnya : tes intelegensi umum individual anak & dewasa, tes
intelegensi kolektif individual anak & dewasa).
b. Tes intelegensi bentuk jamak (misalnya : baterai tes intelegensi, baterai tes bakat).
c. Tes kemampuan khusus (misalnya : tes kemampuan khusus, tes bakat khusus, tes bakat kerja khusus)
d. Tes non intelektual (misalnya : tes motorik & waktu, tes daya konsentrasi, tes daya sensori, tes estetis)
e. Tes kemajuan prestasi/belajar (misalnya : tes pengetahuan & tes keterampilan)
Tes dapat diklasifikasikan berdasarkan kategori tes, yaitu :
a. Berdasarkan instruksi dan cara pengambilannya, misal : tes individu & kelompok, tes
kecepatan & tes kemampuan.
b. Berdasarkan jenis pertanyaannya, misalnya : culture fair test, tes yang langsung & tes tidak
langsung, tes jawaban bebas & tes pilihan.
c. Berdasarkan cara menyelesaikan, misalnya : tes verbal & tes non verbal, tes tertulis & tes lisan.
d. Berdasarkan cara menilai tes, misalnya tes alternatif & tes graduil
e. Berdasarkan fungsi-fungsi psikis yang dijaring, misalnya : tes fantasi, tes daya ingat, tes
asosiasi, tes kemauan, tes minat, tes sikap.
f. Berdasarkan jenis pertanyaan (item, misalnya force-choiced & ambiguity item.
g. Berdasarkan konstruksinya, misal :tes yang dibakukan & tes yang informal.
h. Berdasarkan performancenya, misal : paper & pencil test & tes yang menggunakan alat
(aparatus).
i. Berdasarkan kesesuaian dengan kriterium, misalnya : tipe tes dengan tingkah laku identik, tipe
tes dengan elemen-elemen tingkah laku, tipe tes dari kondisi-kondisi tingkah laku, tipe tes
dengan indikasi-indikasi tingkah laku, tipe tes yang berhubungan dengan kriterium, tipe tes
yang tidak berhubungan dengan kriterium
Menurut Friedenberg (1995), berdasarkan tujuannya, tes dibagi menjadi
a. Apa yang akan diukur oleh tes itu ? (domain)
Domain membedakan isi tes dan ketepatan format item tertentu. Salah satu sistem kategori
yang sederhana adalah tes yang mengukur performansi maksimal dan tes yang mengukur
performansi tipikal.
b. Siapa yang akan dikenai tes ? ( audiens)
Dalam penyusunan suatu alat tes, harus pula mempertimbangkan audiens tes itu, yaitu subjek
yang akan dikenai tes. Tes dapat pula disusun untuk subjek dengan variasi yang luas, tapi
dapat pula disusun untuk subjek terbatas. Misalnya, dibatasi dengan umur. Dalam hal ini
perlu dipertimbangkan pula karakteristik subjek tes tersebut. Tes untuk anak kecil usia SD
tentu berbeda dengan tes untuk orang dewasa. Tes untuk anak kecil haruslah lebih simpel dan
pendek daripada tes untuk orang dewasa. Kemampuan subjek juga harus dipertimbangkan.
c. Bagaimana tes akan digunakan ? (tipe skor)
Tujuan suatu tes adalah bagaimana skor tes akan digunakan. Pertama, apakah tes akan
digunakan untuk membandingkan kinerja testi dari dari yang satu dengan yang lain atau
mengevaluasi testi secara terpisah; kedua, apakah tes hanya akan mengukur atribut tunggal
atau suatu set atribut.
D. Fungsi Tes
1. Prediction
Tes diberikan untuk mengukur kemampuan, prestasi dan atau karakteristik yang lain akan
dijadikan dasar dalam pengambilan keputusan. Keputusan yang dimaksud adalah yang
menyangkut perkiraan tentang seberapa baik individu tersebut dalam berkembang pada waktu
yang akan datang. Perkiraan ini didasarkan pada data kuantitatif yang reliabel dan akurat,
bukan hanya sekedar perkiraan belaka tanpa dasar yang kuat.
Contohnya, kinerja individu di masa depan pada suatu pekerjaan diramalkan oleh hasil tesnya
sekarang ini, yang artinya sampel-sampel perilaku yang menjadi dasar pembuatan prediksi
yang menyangkut perilaku.
2. Selection
Dalam hal ini tes digunakan oleh institusi dan organisasi tertentu untuk menerima atau
menolak sejumlah individu yang mengikuti tes. Hasil tes tersebut dijadikan sebagai acuan
atau pertimbangan dalam menentukan keputusan apakah individu tersebut memenuhi kriteria
untuk diterima atau tidak. Misalnya, tes intelegensi yang digunakan untuk menyeleksi
karyawan baru pada suatu perusahaan.
3. Classification
Tes ini dilakukan dengan maksud untuk melakukan klasifikasi atau pemilihan individu untuk
menempati suatu kelompok tertentu yang sesuai dengan bakat dan kemampuannya. Misalnya
dalam dunia pendidikan, tes dapat digunakan untuk mengklasifikasikan anak berdasarkan
minat, bakat, intelegensi dan lain sebagainya.
4. Evaluation
Tes-tes yang berfungsi untuk menilai atau mengevaluasi suatu program, metoda, treatmen
atau sejenisnya. Tujuannya adalah untuk menentukan seberapa besar tingkat keberhasilan
yang telah dicapai dalam suatu tahapan tertentu.
E. Prinsip-prinsip Tes
Shertzer (1981; 264 - 265) menjelaskan tentang prinsip-prinsip tes sebagai berikut :
1. Penilaian harus dilakukan bagi kepentingan individual.
2. Penilaian tidak dapat dicapai pad ajumlah dan derajat kebutuhan yang sama pada tiap siswa
pada waktu yang sama pula
3. Tidak ada metode/pemilihan tes tunggal dan prosedur yang sama pada tiap situasi
4. Praktek penilaian mencakup antara belajar individu dan lingkungan mereka.
5. Penilaian membantu individu secara bersama-sama, tidak terpisah-pisah pada tahap-tahapnya.
6. Mengakui keterbatasan pengukuran penilaian.
7. Data penilaian harus dijaga, diadministrasikan dan diamankan dengan baik.
F. Karakteristik Tes (L.R. Guy 1985 : 106)
Tes yang baik harus memiliki 3 karakteristik, yaitu
1. Validitas, adalah sejauh mana perbedaan skor pada suatu instrumen mencerminkan suatu
kebenaran. Sejauh mana tes secara akurat dapat merefleksikan isi pokok tes. Artinya, tes
harus benar-benar mengukur apa yang seharusnya diukur. Validitas paling banyak diukur
dengan menyelidiki bagaimana skor tes itu berhubungan dengan kriterium, yaitu beberapa
perilaku, prestasi pribadi, atau karakteristik-karakteristik yang menunjukkan ciri-ciri yang
ingin diukur dari tes tersebut
2. Reliabilitas, adalah keandalan atau keterpercayaan, stabilitas atau kemantapan, konsistensi,
prediktabilitas, dan ketepatan atau akurasi dari suatu tes (ukuran). Seseorang dapat
diandalkan bila orang tersebut perilakunya akurat, konsisten, stabil, dapat dipercaya, dan
dapat diprediksi. Ini artinya, sebuah tes harus memberikan hasil yang sama walaupun
dilakukan oleh tester yang berbeda, atau diskor oleh orang yang berbeda. Bentuk tes yang
diberikan berbeda, dan orang yang sama melakukan tes pada waktu yang berbeda, hasilnya
harus tetap sama. Reliabilitas biasanya dicek dengan membandingkan serangkaian skor-skor
yang berbeda.
3. Norma, adalah kinerja normal atau rata-rata. Kinerja pada setiap tes dievaluasi berdasarkan
data empiris. Maksudnya adalah skor tes perorangan diinterpretasikan dengan cara
membangdingkan skor-skor yang didapatkan orang lain pada tes yang sama. Norma bisa
diartikan sebagai serangkaian skor yang ditetapkan oleh kelompok-kelompok yang
representatif dari orang-orang yang dituju oleh tes tersebut. Skor-skor yang diperoleh dari
kelompok-kelompok ini memberi suatu dasar untuk melakukan interpretasi skor individu lain
G. Prosedur Pelaksanaan Tes
1. Persiapan, yaitu hal-hal yang perlu disiapkan sebelum melakukan testing seperti; instrumen
tesnya, lembar jawaban, berita acara penyelenggaraan tes, alat menunjuk waktu (stopwatch),
dan ruangan tempat testing.
2. Pelaksanaan, yaitu berisi cara-cara menyelenggarakan tes sesuai dengan manual tes
psikologis yang bersangkutan.
3. Skoring dan penyusunan laporan, yaitu kegiatan untuk memberikan skor, skor dihitung
berdasarkan jawaban betul yang menghasilkan skor mentah (raw score), selanjutnya skor
mentah itu dikonversikan dengan norma tes, yang menghasilkan skor baku seperti IQ
(intelligence quotient), dan EQ (emotional quotient).
4. Pelaporan hasil tes, merupakan hal yang amat penting. Hasil testing psikologis hendaknya
disajikan dalam bentuk laporan yang sederhana, menarik, obyektif, dan spesifik, sehingga
mudah digunakan.
H. Pengguna Tes
Pengguna tes adalah siapapun yang menggunakan skor tes sebagai salah satu sumbeer
informasi dalam usahanya mencapai keputusan-keputusan praktis (Anastasi, 2006). Pengguna
mungkin adalah penguji atau bukan penguji yang menyelenggarakan dan menskor tes.
Contoh para pengguna tes adalah guru, konselor, pennyelenggara sistem pendidikan,
personalia dan lain sebagainya. Kebanyakan kritik atas tes bukan pada segi intrinsik tes,
tetapi pada penyalahgunaan hasil-hasil tes yang dijalankan oleh para pengguna tes yang tidak
memenuhi syarat. Sejumlah penyalahgunaan disebabkan oleh keinginan untuk mengambil
jalan pintas, mendapatkan jawaban-jawaban cepat dan solusi rutin yang sederhana bagi
masalah-masalah nyata dalam kehidupan, dan kurangnya pengetahuan akan tes.
Penggunaan tes harus dikontrol dengan baik, karena jika tes berada di tangan yang
tidak bijaksana, atau yang bermaksud baik tetapi tidak cukup ilmunya, akan memberikan
dampak buruk yang serius. Ada dua hal utama yang digunakan untuk mengendalikan
penggunaan tes psikologis:
1. Tes psikologis harus dipastikan bahwa tes diberikan oleh penguji yang memenuhi syarat dan
skor yang digunakan sesuai dengan tes yang diberikan.
2. Mencegah hubungan keakraban individu dengan isi tes, yang akan membuat tes itu tidak valid
lagi yaitu dengan pengaman isi tes dan mengkomunikasikan informasi tes dengan baik.
I. Pelaksana Tes
Tes ada yang relatif mudah dalam administrasinya, tetapi ada pula yang sukar. Oleh
karena itu, dibutuhkan tenaga pelaksana yang memenuhi syarat dan berkualifikasi sesuai
dengan tuntutan/ tingkat kesulitan penggunaan alat tes tersebut, sehingga hasil tes/
pemeriksaan dapat dipertanggungjawabkan.
Ada tiga tahap syarat utama pelaksanaan tes :
1. Seleksi tes,
2. Administrasi dan penskoran,
3. Interpretasi skor
J. Pelatihan Pelaksana Tes
Kualifikasi profesional penting dalam penggunaan tes. Profesionalisme itu meliputi
kemampuan sintesis pengetahuan, keterampilan, dan etika. Sementara beberapa kelompok-
kelompok profesional yang ingin membatasi penggunaan tes psikologis, percaya dengan
tegas bahwa dalam menggunakan tes sangat terkait langsung dengan kompetensi.
Kompetensi ini dicapai melalui pendidikan, pelatihan, dan pengalaman dalam bidang
pengujian. Dengan demikian, pelaksana tes membutuhkan pelatihan dan kursus yang sesuai
dalam penilaian / penilaian, pengawasan, dan pengalaman yang mumpuni untuk
menggunakan tes objektif. Dengan pelatihan tambahan dan pengalaman, pelaksana tes dapat
melakukan tes proyektif, tes kecerdasan individu, dan klinis tes diagnostik. Pelatihan ini
dapat terjadi di lembaga yang memadai seperti di pascasarjana atau lembaga penyelenggara
sertifikasi tes pengembangan profesional, atau dalam pelatihan diawasi dalam penggunaan
tes.
Dasar Ada tiga jenis pelatihan dalam tes, yaitu:
1. Bimbingan sebelum pelaksanaan tes
2. Pelatihan pembuatan instrument tes
3. Pelatihan keterampilan kognitif
Hal-hal yang harus dikuasai dalam pelatihan pelaksanaan tes adalah :
1. Keterampilan praktek dan pengetahuan teori yang relevan dengan konteks pengujian
2. Sebuah pemahaman menyeluruh teori pengujian, teknik konstruksi tes, dan uji reliabilitas dan
validitas.
3. Sebuah pengetahuan tentang teknik sampling, norma, dan deskriptif, statistik korelasional dan
prediktif.
4. Kemampuan untuk meninjau, pilih, dan melakukan tes yang sesuai untuk klien atau siswa
5. Keterampilan dalam administrasi tes dan interpretasi hasil tes
6. Pengetahuan tentang dampak keanekaragaman pengujian akurasi, termasuk usia, jenis
kelamin, etnis, ras, cacat, dan perbedaan linguistik. Pengetahuan dan keterampilan dalam
penggunaan profesional yang bertanggung jawab penilaian dan evaluasi praktek. (American
Counseling Association American)
DAFTAR RUJUKAN
Anastasi, A. (1982). Psychological Testing. New York : MacMillan
Azwar, Saifuddin (2007). Tes Prestasi. Fungsi dan Pengembangan Pengukuran Prestasi Belajar.
Yogyakarta : Pustaka pelajar
Brown, F.G. 1976. Principlesof Education and Psychological Testing, 2nd edition. New York, NY:
Holt, Rinehart & Winston.
Cronbach, L.J. 1970. Essentials of Psychological Testing, 3rd edition. New York, NY: Harper and
Row.
Friedenberg, L. (1995). Psychological Testing : Design, Analysis and Use. Boston : Allyn & Bacon
Guy, L.R., 1985. Educational Evaluation and Measurement : Competence for Analysis and
Application. Columbus, Ohio: Bell and Howeln Company.
Moore, Garry. W., 1983. Developing and Evaluating Educational Research. Boston: Little. Brown
and Company.
Nurkancana, Wayan. 1983. Tes dan Pengukuran. Yogyakarta: Andi Ofset
Shertzer, Bruce and Shelley C. Stone. 1981. Fundamentals of Guidance.4nd ed. Boston: Houghton
Mifflin Conpany.