( An Instructional Material)
OLEH:
Dr. MONIKA GULTOM, S.S., M.A.
dalam hal ini bahasa Inggris. Bahan ajar ini disusun sesuai dengan silabus program
Bahan ajar ini merupakan kumpulan informasi dari beberapa buku tentang
bahasa Inggris. Bahan ajar ini menggunakan istilah-istilah dalam bahasa Inggris
karena penulis menganggap bahwa para mahasiswa calon guru bahasa Inggris
perlu mengetahui istilah dalam bahasa Inggris selain juga dalam bahasa Indonesia.
Bahan ajar ini harus diakui masih memiliki banyak kesalahan dan
kekurangan dan karenanya penulis menerima dengan hati senang dan terbuka
untuk segala saran, kritik, dan masukan yang berharga bagi perbaikan kualitas dari
bahan ajar ini. Semoga bahan ajar ini bermanfaat bagi yang menggunakannya.
Jayapura 2014
Monika Gultom
DAFTAR ISI
HAL
KATA PENGANTAR
bahasa ibu mereka kedalam bahasa asing mereka pelajari, sehingga terjadilah kesalahan.
Hal ini suatu problem yang biasa ditemui dalam belajar bahasa asing. Makin banyak
perbedaan sistem bahasa ibu dan bahasa asing itu semakin bayak problem yang akan
dihadapi. Perbedaan ini meliputi sistem bunyi, sistem struktur, dan sistem arti.
antara bahasa yang dipelajari dan bahasa ibu (contrastive analysis). Teori testing bahasa
asing berasumsi bahwa menguasai problem itu berarti menguasai bahasa target dan
mentes kemampuan seseorang terhadap bahasa asing berarti mentes penguasan akan
problem-problem itu. Sebab itu item-item tes bahasa asing kebanyakan berisi problem
itu tanpa mengabaikan yang lain. Tetapi prediksi kesulitan melalui pendekatan teori
contrastive analysis tidak selalu benar. Untuk mengetahui kesulitan yang sebenarnya
terjadi atau dialami oleh siswa perlu dilaksanakan apa yang disebut error analysis. Hal
ini diketahhui dengan menganalisis pekerjaan siswa dalam tes bahasa itu, dimana
mereka mendapat banyak kesalahan data dan dimana mereka rata-rata dapat menjawab
benar.
1
B. FUNGSI TES
1. Untuk umpan balik kepada guru; dari hasil evaluasi guru dapat mengetahui hasil dari
kekurangan/kebaikan pengajarannya.
2. Untuk mengetahui sampai dimana murid telah mengetahui bahan yang telah
diajarkan; Dengan mengetahui hal-hal yang sudah diketahui dan yang belum, guru
3. Untuk mendapatkan informasi tentang kemajuan siswa baik setiap unit, semester,
4. Untuk mengetahui apakah seorang siswa dapat dinaikkan ke kelas berikutnya atau
7. Untuk mendorong siswa belajar. Biasanya setiap siswa ingin mendapatkan nilai yang
peserta. Sesudah tes siswa menyadari akan kekeliruannya, sehingga dia sadar akan
kesalahannya, dan menguatkan yang benar. Sebab itu, sebaiknya sesudah tes, guru
hendaknya memberikan kertas kerja siswa, sehingga siswa dapat melihat mana yang
2
II. JENIS-JENIS TES
Teacher-made test ialah tes ang disusun oeh seorang guru untuk mengetahui sampai
test dibuat oleh suatu team yang terdiri dari para ahli, dan tes itu sudah diuji cobakan
beberapa kali dengan hasil yang baik. Tes seperti TOEFL (test of English as a foreign
(International English Language Testing System), UMPTN (jian masuk perguran tingi
merupakan contoh dari standardized test. TOEFL dan ALIGU tes yang dipakai untuk
mengukur apakah seseorang dapat mengikuti kuliah pada perguruan tinggi di Amerika,
Essay test adalah test yang memerlukan jawaban dengan penguraian, penjelasan,
pengorganisasian, kreativitas, dan pemecahan masalah. Oral dan essay test termasuk
kedalam subjective test yaitu tes yang penilaiannya dapat dipengaruhi oleh faktor-faktor
lain selain jawaban, seperti tulisan, bahasa, organisasi, keadaan penguji dan lain-lain.
Objective test ialah tes yang penilaiannya dapat dilakukan dengan obyektif artinya tanpa
dipengaruhi faktor-faktor lain selain dari isi jawaban, dan dapat diskor oleh mesin atau
Speed test ialah tes yang harus dikerjakan dalam waktu yang singkat dan pertanyaan
dengan tingkat kesukaran yang rendah. Power test ialah test yang taraf kesukarannya
dibagi-bagi dari yang rendah, sedang, dan tinggi dan waktu yang disediakan untuk
mengerjakannya cukup banyak. Mastery test ialah test yang taraf kesukarannya rendah
Verbal rest ialah test yang dijawab dengan bahasa tertulis atau lisan. Non-verbal test
ialah test yang dijawab dengan pantomime atau gerakan-gerakan, tidak memakai bahasa.
Performance test ialah test yang mengukur keterampilan atau perbuatan (psychomotoric
skills).
3
5. PRETEST, READINESS PRETEST, DAN PLACEMENT TEST
Pretest ialah test yang diberikan kepada siswa sebelum pelajaran itu diajarkan kepada
mereka. Readiness Pretest ialah pretest yang digunakan untuk mengukur apakah siswa
telah memiliki persyaratan untuk pelajaran itu. Placement Pretest ialah pretest yang
digunakan untuk mengukur sampai dimana siswa telah menguasai bahan barulah akan
diajarkan kepada siswa. Hal ini bergina supaya guru dapat memfokuskan pelajarn pada
hal-hal yang belum dikuasai siswa, mengurangi penekanan pada hal-hal yang telah
dikuasai siswa, menentukan strategi, dan supaya dapat melihat hasil pelajaran dengan
Achievement test ialah test yang digunakan untuk mengukur sampai dimana para siswa
menguasai bahan yang telah diajarkan. Formative dan summative test kedua-duanya
termasuk achievement test. Formative test ialah achievement test yang diadakan sesudah
tiap satu unit atau sebagian dari unit pelajaran. Arti sebenarnya dari formative test
adalah tes yang diadakan sementara pelajaran (during the instruction). Summative test
ialah test yang diadakan pada akhir semester, akhir tahun atau akhir pelajaran.
7. DIAGNOSTIC TEST
Diagnostic test ialah tes yang diadakan untuk mengetahui kesulitan-kesulitan yang
Tes yang digunakan untuk meramalkan tingkat keberhasilan seorang siswa untuk belajar
sesuatu disebut Prognostic test. Dengan tes ini, apakah seseorang mempunyai bakat
General proficiency atau proficiency test ialah test yang dipakai untuk mengukur
Take home test ialah test yang dikerjakan di rumah masing-masing siswa.
4
12. OPEN BOOK TEST
Open book test ialah test yang waktu mengerjakannya dapat membuka buku.
Entrance/Admission test adalah tes untuk menentukan apakah seseorang dapat diterima
Oral test ialah test yang diberikan dengan lisan dan dijawab juga dengan bicara secara
langsung. Istilah lain untuk tes seperti ini ialah oral-oral. Selain itu biasa juga disebut
dengan oral-written yang berarti bahwa pertanyaan secara lisan tetapi jawabannya
dengan tertulis. Bentuk soal tentu bisa bermacam-macam, tetapi kebanyakan pada oral
test pemberian skor sama dengan pada essay yaitu sama-sama subjective dan
materi/tujuan yang tercakup sangat terbatas. Selain itu oral test sangat memakan waktu
karena harus dilaksanakan satu persatu. Jadi kalau 10 menit saja satu orang maka kita
memerlukan waktu 5 jam untuk 30 orang. Dalam pelajaran bahasa, oral test dipakai
untuk mengukur kemampuan speaking. Pada tes listening dapat dikatakan kita
sebuah teks dan pertanyaan dengan lisan, kemudian siswa menjawab dengan tertulis.
5
III. KLASIFIKASI TUJUAN PENDIDIKAN
Tujuan pendidikan dapat diklasifikasikan menjadi beberapa tingkat. Salah satu klasifikasi
Objectives). Karena sistem ini beranggapan bahwa hasil belajar sebaiknya dijelaskan dalam
istilah perubahan tingkah laku, guru dianjurkan menyatakan tujuan pengajarannya dalam
istilah tingkah laku pula. Klasifikasi ini dibagi menjadi tiga, yaitu: cognitive domain,
affective domain, psychomotor domain. Cognitive domain meliputi tujuan yang menekankan
berpikir. Affective domain meliputi tujuan yang menekankan perasaan dan emosi seperti
moral, melakukan hal-hal yang baik, menahan napsu, menahan emosi, minat, budi pekerti,
sikap, apresiasi, dan penyesuaian. Psychomotor domain meliputi tujuan yang menekankan
keterampilan menggunakan anggota badan untuk sesuatu (motor skills) seperti menulis
dengan tangan, mengetik, berenang, menjalankan mesin-mesin, menari, menyetir mobil, dll.
A. COGNITIVE DOMAIN
Bidang ini dibagi lagi enam yang diurutkan dari yang paling sederhana ke yang
analysis, synthesis, dan evaluation. Setiap tingkat meliputi tingkat yang dibawahnya,
Knowledge diartikan sebagai mengingat materi dari apa yang telah dipelajari
sebelumnya, jadi termasuk menghafalkan fakta-fakta atau teori-teori. Tetapi semua ini
hanyalah mengingat kembali. Tingkat inilah tingkat paling rendah dari bidang cognitive.
Kata kerja yang dapat dipakai untuk ini seperti: menyebutkan, menunjukkan, mengenal,
Misalnya:
Tujuan instruksional khusus: siswa dapat memberikan sinonim kata “happy” atau siswa
dapat menjodohkan kata itu dengan sinonimnya kata yang telah disediakan. Knowledge
dan terpisah
6
b) Knowledge of ways and means of dealing with specifics, yaitu mengingat kembali
cara-cara organisasi, belajar, mengadili, mengkritik, dan urutan kronologis. Hal lain
yang masuk bagian ini pengetahuan tentang klasifikasi, kriteria, dan metode.
skema dan pola utama yang merupakan alat untuk mengorganisasi fenomena.
materi, atau kemampuan mengerti materi yang disampaikan baik secara tertulis maupun
lisan dan dapat menggunakan materi itu. Hal ini bisa ditunjukkan dengan
menerjemahkan atau mengubah materi dari suatu bentuk ke bentuk lain, atau
datang. Kata kerja yang dapat dipakai untuk tingkat ini seperti membedakan,
Misalnya:
diberikan tentang isi bacaan. Kemampuan ini dapat dibagi tiga yaitu:
a) Translation, yaitu kemampuan mengubah materi dari satu bentuk ke bentuk lain
seperti paraphrasing, translating atau dari bentuk teks menjadi bentuk gambar.
diterima. Hal lain yang masuk dalam hal ini adalah reordering, rearranging.
c) Extrapolation, yaitu kemampuan mengerti sesuatu yang diluar dari data yang
yang telah dipelajari dalam situasi yang baru dan konkrit. Hal ini termasuk aplikasi dari
peraturan, metode, konsep, prinsip, dan teori. Kemampuan ini menuntut juga dua
kemampuan yang dibawahnya yaitu knowledge dan comprehension. Kata kerja yang
Contoh:
Tujuan khusus: Siswa dapat mengubah kata benda tunggal menjadi bentuk jamak.
7
Analysis (analisis) berhubungan dengan menguraikan suatu materi menjadi
pengertian dari isi maupun bentuk struktural dari materi. Kata kerja yang cocok untuk
TIK: Siswa dapat menunjukkan pernyataan yang menunjukkan fakta dan yang
menunjukkan kesimpulan.
kedalam suatu bagian yang utuh. Hal ini mungkin berupa menyusun suatu tulisan, atau
proposal penelitian dengan penekanan pada tingkah laku kreatif. Kata kerja yang cocok
TIK: Siswa dapat menulis suatu teks pidato dengan organisasi yang baik
pernyataan, ide, pemecahan, metode, novel, syair/poem, laporan) untuk sesuatu maksud.
Penilaian ini didasarkan atas kriteria yang tertentu. Kriteria ini mungkin internal
(organisasi) dan eksternal (relevansi dan maksud) dan siswa boleh pula menentukan
kriteria, kalau bukan diberikan. Beberapa kata kerja yang dapat dipakai pada tingkat ini
Informasi Tambahan
Knowledge:
1) Knowledge of specifics:
i. knowledge of terms
ii. knowledge of specific facts
8
b) Contoh verba yang dipakai untuk tiap kategori
1) knowledge : identify, name, define, describe, list, match, select, outline
2) Comprehension : classify, explain, summarize, convert, predict, distinguish
3) application : demonstrate, compute, solve, modify, arrange, operate,
relate
4) analysis : differentiate, diagram, estimate, separate, infer, order,
subdivide
5) synthesis : combine, create, formulate, design, compose, construct,
rearrange, revise
6) evaluate : judge, criticize, compare, justify, conclude, discriminate,
support
9
5) Synthesis
Ability to put together/combine: Suppose, like Ali, you have a rope, a
Different components of an object to brick, a bundle of hay
form a new object Instead of making a . . . as he did,
Different element of a story to form a what could you make?
new story Imagine you have 3 wiches, what
Different elements of a solution to form would you wish for?
a new solution to a problem Compose a story about an ald man and
a dog
Change the story to give it a sad/happy
ending
6) Evaluation
Ability to: Give merit points to each of the six
See both good and bad sides of a thing objects and then arrange them in
Weigh good and bad and make a order of usefulness
judgment How did you feel when you read the
Rank things/persons in order of marit poem?
Describe own feelings and reactions to
something or someone
B. AFFECTIVE DOMAIN
Seperti sudah dijelaskan didepan domain ini berkenaan dengan perasaan, emosi,
sikap, minat, mental, apresiasi, mengontrol diri dari napsu-napsu yang tidak baik (makan
berlebihan, seks yang tidak pada tempatnya, gila harta, gila pangkat, gila kehormatan,
dll). Manusia yang baik adalah manusia yang dapat mengontrol diri dari napsu-napsu
yang tidak baik dan bisa menuruti aturan-aturan yang baik, serta berusaha membangun
manusia lain disekitarnya, tidak hanya dirinya sendiri. Mata kuliah/pelajaran yang
masuk dalam kategori ini adalah Budi Pekerti, Agama, Sejarah Kebangsaan,
Kewiraan/civics, Pancasila, dll. Tetapi sering kali mata kuliah itu tidak mencapai tujuan,
karena mengutamakan kognitifnya bukan afektifnya. Bidang ini juga masih dapat dibagi
menjadi 5 bagian:
1. Receive. Hal ini berhubungan dengan kesediaan siswa menghadiri atau mengikuti
suatu kegiatan. Itu berarti siswa sedia menerima atau tidak menolak.
2. Responding. Pada tahap ini siswa diharapkan sudah aktif mengambil bagian bukan
saja menghadiri. Dalam tingkat ini selain dari menerima, juga diharapkan siswa
seida memberi respon seperti membaca dan mengerjakan melebihi dari apa yang
3. Valuing. Tingkat ini berhubungan dengan harga atau nilai yang diberi siswa kepada
suatu benda, peristiwa, atau tingkah laku. Valuing didasarkan atas nilai yang ada
pada diri siswa tetapi gejala nilai kelihatan jelas dari tingkah lakunya. Tingkah laku
ini adalah tingkah laku yang konsisten dan cukup stabil sehingga nilai ini dapat
10
diketahui. Tujuan pengajaran yang berada dibawah sikap dan apresiasi biasanya
berlainan menjadi satu nilai yang konsisten. Jadi penekanan terletak pada
kategori ini.
5. Characterization. Pada tingkat ini seseorang telah mempunyai sistem nilai yang
mengendalikan tingkah lakunya. Jadi nilai-nilai itu telah menjadi cara hidupnya.
C. PSYCHOMOTOR DOMAIN
Psikomotor domain dibagi menjadi enam tingkatan yang meliputi (Harrow, 1972):
1. Reflex Movements
In this first category the learner responds involuntarily. Reflex movements or actions
are elicited in response to some stimulus without conscious volition (the act of using
one’s will) on the part of the learner. Examples: movements which cause the limb to
move towards the body and away from the ground to avoid or escape harmful or
threatening stimuli and it responds to pain, the eyes are closed to avoid something
The basic fundamental movement patterns occur in the learner during the first yar of
tracking an object, reaching, grasping, and manipulating an object with hands, and
and walking. All of these fundamental movement patterns are built upon the
3. Perceptual Abilities
investigators claim that perceptual and motor functions are inseparable, and enriched
11
movement experiences usually enhanced a child’s abilities to structure and perceive
perceptual abilities are essential to development of the learner in the affective, the
cognitive, and the psychomotor domains. These abilities assist the learner in
abilities.
4. Physical Abilities
Physical abilities are essential to the efficient functioning of the learner in the
psychomotor domain. These physical abilities are in fact an essential part of the
foundation for the development of skilled movement. Level ini dibagi menjadi:
1) endures (the ability of the body to supply and utilize oxygen enabling the learner
to continue activity),
2) strength (the ability to exert (put into action or use) tension against resistance),
3) flexibility (the range of motion in the joints that the learner is capable of
achieving),
5. Skilled Movements
Munn defines this skill as proficiency in performing a task; Laban and Lawrence
state that skill is the economy of effort a learner displays while perfecting a complex
movement; they call the skill the final stage of perfection. Mohr defines skill as a
progress toward better performance; While Seashore contends that skill is a degree
movement tasks that require learning and are considered reasonably complex. This
will serve to distinguish between level two and level five. The movement skill
12
6. Non-Discursive Communication
perceptions of the learner’s feelings, needs, and interest, thereby enabling the
educator to make more meaningful selections of learning strategies for that particular
learner. Behaviors that fall into this classification level are both innate and learned.
(composed of aesthetic movement and creative movement, which are called art
forms). Discursive means wandering from one topic to another, rambling, digressive.
13
IV. LANGKAH-LANGKAH PENILAIAN
A. Planning
Dalam planning ini pertama-tama kita harus merumuskan tujuan (objectives dari
test itu). Tujuan pengajaran adalah supaya siswa menguasai materi yang diajarkan,
sedangkan tujuan evaluasi adalah untuk mengukur samapi dimana mereka menguasai
materi yang diajarkan untuk menentukan apakah mereka diluluskan, ditamatkan, dan
ditempatkan sesuai dengan kemampuan, diterima pada satu program atau perguruan
tinggi, dan lain-lain sesuai dengan maksud mengadakan tes tersebut. Untuk formative
test tujuan tesi itu disesuaikan dengan tujuan pengajaran (TIU dan TIK). UMPTN
bertujuan untuk menyeleksi mereka yang akan diterima di perguruan tinggi negeri
dilihat dari skor mereka. TOEFL yang bertujuan mengukur kemampuan seseorang
Hal kedua yang perlu dikerjakan ialah membuat design/table of specification, Tabel
ini berisi garis besar materi yang dites, banyaknya item tiap bagian, klasifikasi item
sesuai dengan taksonomi Bloom, bentuk item, banyaknya item dalam tiap klasifikasi
Bloom, presentase item pada setiap bentuk item, presentase item dalam tiap bentuk soal,
pelajaran bukan bahasa Inggris misalnya materi dapat dibagi menjadi reading, listening,
writing, speaking, vocabulary, dan structure. Untuk reading dibagi lagi atas beberapa
teks, dan tiap teks terdiri atas beberapa pertanyaan/item dan item-item harus ditentukan
harus ditentukan bentuk soalnya (apakah multiple-choice atau matching, dll). Untuk teks
pertama misalnya mempunyai 5 pertanyaan bisa saja dibagi menjadi 2 untuk knowledge
vocabulary bisa dibagi sesuai dengan materi itu, apakah kelompok maknanya seperti
sport, aviation, education, dll atau klasifikasi istilah grammar seperti noun, verb
adjective, dll. Untuk tes structure/grammar bisa dibagi dengan seperti tenses, reported
speech, conditional, plural form, negative form, question form, passive/active form,
modal, relative pronoun, gerund, dll; tiap bagian ditentukan jumlahnya dan tentukan
14
juga berapa yang untuk comprehension, berapa untuk analysis, dkk dan tentukan juga
bentuk soalnya.
1) “Classroom test plays a central role in the evaluation of pupil learning. They
provide relevant measures of many important learning outcomes. The validity of the
information they provide, however, depends on the care that goes into the planning
and usability. The likelyhood of developing classroomtests with these three qualities
C Construct Validity
R Reliability
A Authenticity
P Practicality
I Impact
I Interactiveness
3) Planning a Test
4) Table of Specification
15
B. Constructing the Test
Sesudah kita menentukan tujuan dan table of specification kita mulai menyusun
item-item sesuai dengan table. Jika sudah selesai, kita memeriksanya kembali dan
memperbaiki yang kurang baik. Untuk mendapatkan tes yang baik, tes itu harus
Untuk itu kita harus menganalisa hasil dari try out tersebut, mana item yang
kurang baik diperbaiki atau dibuang. Disini termasuk juga analisa option. Distractor fari
item yang takk pernah dipilih, diganti. Hal yang penting lagi ialah menghitung reliability
dan validity dari tes itu. Kedua hal ini juga menentukan mutu dari suatu tes. Untuk tes
biasa yang dilaksanakan oleh seorang guru kepada muridnya dalam praktek sehari-hari
Langkah berikutnya ialah melaksanakan tes itu kepada siswa yang dikehendaki.
Sehari sebelum pelaksanaan tes kita harus mengadakan persiapan tes itu seperti ruangan,
mengumpulkan kertasnya. Dalam pelaksanaan tes perlu diperhatikan supaya siswa atau
yang diuji tidak kerja sama dan tidak diberi kesempatan bagi peserta tes membuka buku
atau melihat catatan. Sebab itu jaraj antara peserta harus diatur agar berjauhan dan tidak
ada buku atau catatan didekat mereka. Jika tidak dijaga hal-hal tersebut maka hasil tes
D. Scoring
Setelah melaksanakan tes kita memeriksa kertas ujian dan memberi skor dari
masing-masing anak. Dalam memberi skor ini guru tentu harus mempunyai sistem
sehingga dapat dipertanggungjawabkan. Biji (besarnya point) untuk tiap soal harus jelas
apakah satu atau dua, sesuai dengan sukarnya atau beratnya tugas yang diminta. Dengan
demikian jelas juga berapa skornya kalau benar semua. Dalam memberi skor ini bisa
dipakai dua pemeriksa (scorer) bila dianggap perlu, sebab dengan dua pemeriksa skor itu
makin dipercaya. untuk item yang objektif, pemeriksa bisa memakai mesin pemeriksa
atau alat lain yang mempermudah pemeriksa, seperti kertas plastic, atau kunci jawaban
yang sudah diataur sehingga gampang menghitung jawaban yang benar. Untuk item
esai, pemeriksa harus melihat unsur-unsur yang dinilai dan bagian-bagiannya, sehingga
16
pemberian skor itu sama untuk semua. Jangan dilihat dari panjangnya jawaban tetapi
Disini guru menafsirkan skor dari siswa menjadi nilai yang mungkin berupa
huruf atau angka sesuai dengan sistem yang dipakai. Cara interpretasi ini bisa dengan
criterion reference (acuan patokan) atau dengan norm reference (acuan norma). Yang
pertama nilai atau grade siswa ditentukan berdasarkan persentase jawaban benar yang
peserta ditentukan atas rangking masing-masing dalam kelompok, bukan atas dasar
F. Reporting
Langkah terakhir ialah melaporkan hasil tes kepada yang berkepentingan, seperti
pengikut tes, kepala sekolah, orang tua siswa, panitia, dan sebagainya.
Course/Subject Matter :
School :
Credit Points :
Jumlah
Persentase
17
V. TYPES OF ITEM
Dilihat dari cara pemberian skor, tes dapat dibagi menjadi Objective Test dan
choice, Matching, Short Answer, dan Arrangement sedangkan Subjective Test memakai
bentuk-bentuk item yang subyektif yaitu jawaban yang meminta penjelasan, penguraian,
dan pengorganisasian yang terdiri dari satu atau beberapa kalimat, paragraph, atau
Objective berarti bahwa nilai seseorang benar-benar atas dasar kemampuan siswa,
tidak ada pengaruh faktor lain; misalnya tes yang diperiksa oleh mesin computer adalah
obyektif. Subyektif berarti nilai seseorang tidak benar-benar atas dasar kemampuannya,
tetapi ada faktor lain, seperti hubungan antara peserta tes dan pemeriksa, tulisan yang rapi
dan bagus atau tulisan yang tidak rapi dan tidak bagus, keadaan pemeriksa (mengantuk,
keadaan marah atau senang), disukai atau dibenci oleh pemeriksa, dsb. Dengan demikian,
kalau peserta tes memiliki kesempatan nyontek berarti tes itu tidak obyektif, karena nilai
A. Objective Types
1. True-False (T-F)
Dalam True-False yang diuji dalam memberi jawaban hanya memilih apakah
pernyataan yang diberikan benar atau salah. Dalam mengerjakannya mereka bisa disuruh
menyilang atau melingkari pilihannya. Ada beberapa variasi dari T-F ini, diantaranya
yaitu:
a. Two-Response Type
Bentuk inilah bentuk yang paling sederhana yaitu memilih T atau F. Contoh:
b. Three-Response Type
Tipe ini selain dari menentukan apakah benar atau salah ada pula pilihan lain yaitu
belum tentu (not certain) atau kata lain. Dalam pertanyaan reading comprehension
misalnya dapat diberi pilihan ketiga ‘tak ada dalam teks’, contoh:
18
c. Correction Type
Pada bentuk ini yang diuji selain memilih benar atau salah, dia harus juga memberi
Correction: _______________________________
d. Cluster Type
Pada tipe ini yang diuji memilih/menandai satu deretan kata yang termasuk dan
1) Pernyataan itu hendaknya semua salah atau semua benar, jangan setengah salah
Indonesia lies between Asia and Australia and produces a lot of wine.
3) Jawaban yang benar dan jawaban yang salah hendaknya diselang-seling, jangan semua
benar atau semua salah. Untuk menghilangkan skor dari guessing dapat dipakai Net
Score. Untuk mencari Net Score ialah dengan mengurangi jawaban yang benar dari
jumlah jawaban yang salah (R – W). Kalau yang benar 30 dan salah 20 makan Net
Score menjadi 30-20=10. Tetapi banyak orang tidak setuju dengan skor ini, karena
belum pasti testee mendapatkan jawaban dengan guessing. banyak guru menganggap
Net Score ini merugikan yang lemah, karena semakin banyak kesalahan makin banyak
pula pengurangnya.
2. Multiple-choice
Pada item multiple-choice testee diminta memberi jawaban yang benar sesuai
dengan pertanyaan atau perintah. Item ini terdiri dari stem (lead) dan choice/option
(alternative), dan option terdiri dari distractor dan correct answer. Contoh memilih
yang benar:
19
Contoh memilih yang salah:
A cat is:
Karena dalam menjawab multiple-choice item kemungkinan ada unsur guessing maka
= − −
Contoh perhitungan:
Jumlah soal 50. Jumlah yang salah 20. Setiap item terdiri dari 4 option, berapa Net Score-
= − −
= − , = ,
Saran-saran dalam menyusun multiple-choice.
3) Pokok persoalan hanya diletakkan pada stem dan bukan pada option.
5) Distractor dan jawaban yang benar hendaknya tidak mempunyai perbedaan yang
6) Jika option terdiri dari angka hendaknya diurutkan dari kecil ke besar, jika dari
9) Stem dan option supaya diusahakan terletak pada halaman yang sama.
10) Jawaban yang benar janganlah tetap pada tempat yang sama tetapi berpindah-
pindah.
20
3. Matching Test
Matching item terdiri dari dua daftar (deretan) kata atau frasa dan suruhan
(perintah) bagaimana kedua daftar itu dijodohkan. Daftar pertama disebut Premise dan
daftar kedua disebut response. Bila jumlah premise dan response sama maka matching itu
disebut perfect, dan bila response lebih banyak dari premise, matching itu disebut
imperfect matching. Jenis yang pertama mempunyai keburukan yaitu ada kemungkinan
jawaban yang dijawab benar walaupun sebenarnya yang diuji tidak tahu, misalnya kalau
ada 5 pasang dan yang empat sudah tahu maka yang lain juga pasti benar. Contoh:
Match each word on the left with its opposite on the right. Write your answer in the blank!
d. thin
e. sad
1) Usahakan supaya isi dari satu daftar premis maupun response sejenis.
2) Nyatakan dengan jelas atas dasar apakah premis dan response dijodohkan.
3) Urutkan premise dan response dengan urutan yang logis, kalau berhubungan dengan
waktu supaya kronologis, kalau angka mulai dari yang kecil ke besar atau diurutkan
menurut abjad.
Short answer type item ialah tes yang memerlukan jawaban yang singkat. Bentuk
a. Short Answer.
21
b. Listing
c. Completion
item ini meminta testee melengkapi kalimat yang belum lengkap. Contoh:
d. Analogy
Item ini memerlukan analogy dari testee untuk mendapatkan jawaban. Contoh:
e. Identification
Mention the writer of each books below. Write your answer in the blanks.
f. Problem
A fruiter bought twenty eight apples one dollar each. Then he sold them 1.50
1) Susunlah item itu sehingga hanya satu kemungkinan jawaban benar dan jawaban
itu pendek.
2) Gampang disusun.
22
Kelemahan Supply Type Item.
5. Arrangement/Rearrangement
Item ini meminta testee menyusun satu daftar kejadian, langkah, ukuran dsb yang
1). Scoring a = ……
2) Planning b = ……
6. Cloze Test
Tes ini adalah tes dimana para testee disuruh melengkapi kembali sebuah teks
yang sebagian kata-katanya sudah dihilangkan. Biasanya kata yang dihilangkan itu
adalah setiap kata kelima atau ketujuh. Penghilangan mulai dari baris kedua dan tidak
termasuk nama diri. Tes ini bisa mengukur kemampuan beberapa aspek seperti
Reading, Vocabulary, Listening, Writing, dan juga Structure. Kalau untuk Listening
teks diberikan dulu secara lisan baru kemudian diberikan teks yang sebagian kata-
katanya sudah dihilangkan. Bentuk variasi yang sedikit lain dari versi biasa, yaitu Maze
Test - - - penghilangan kata terdapat pada separuh kata bagian belakang dari setiap kata
kedua dalam teks itu. Variasi lain adalah versi Multiple-choice, artinya untuk setiap
When I we….. to Sentani t…. see m….. girl fri……, I go… an acci….t.
sev… meters fr…. the ro…. I wa…. fain… for ha… an ho… I wa… taken t…
Sentani hosp…. When I wa… awa… and real…. what ha… happened, I than…
23
The complete text is this.
motorbike collided with a big truck at Kampung Harapan. I was thrown seven
meters from the road. I was fainted for half an hour. I was taken to Sentani
hospital. When I was aware and realized what had happened, I thanked God very
B. Essay Test
Essay dan kebanyakan oral test termasuk dalam kelompok subjective test.
Pemberian nilai/skor pada tes ini subyektif, artinya penilaiannya gampang dipengaruhi
oleh faktor-faktor lain di luar dari jawaban seperti tulisan, bahasa, cara menjawab,
pemeriksaan, dll. Kalau essay dijawab dengan tertulis, sedangkan oral test dengan lisan.
Essay test meminta jawaban yang disusun oleh yang diuji dalam satu atau lebih
mereka miliki, dan tes ini jug dapat diukur untuk mengetahui interest dan attitude
siswa. Berdasarkan jawaban yang diminta essay dapat dibagi dua, Extended Response
pendapat, kreativitas, dan pengalaman lalu diorganisir dan ditulis. Contoh dari tes ini
Pada Restricted Response, jawaban dibatasi atau diarahkan kepada suatu hal yang
sempit. Testee diminta mengingat kembali jawabannya atau memberi jawaban lalu
mengorganisir dan menulisnya. Jawaban mungkin satu kalimat atau mungkin juga satu
2) Jelaskanlah …………..
3) Uraikanlah …… dll
24
Saran-saran untuk memperbaiki cara pemberian skor essay item.
1) Hilangkanlah nama siswa pada waktu memeriksa kertas pekerjaan siswa atau pakai
saja nomor sebagai pengganti nama.
2) Jika cara penulisan, bahasa dan gaya bahasa dinilai juga, hendaklah dipisahkan dari
penilaian isi jawaban.
3) Jika hasil tes ini sangat penting, sebaiknya pekerjaan siswa diperiksa oleh dua orang.
1) Mudah disusun.
2) Mengutamakan kebulatan pokok bahasan.
3) Baik untuk mengukur kemampuan tujuan yang penting/sukar.
25
VI. TESTING LISTENING COMPREHENSION
menangkap isi dari kalimat, paragraf, atau teks yang diberikan secara lisan. Selain mentes
dengan listening comprehension ada juga tes membedakan bunyi (sound discrimination
test), karena pengenalan bunyi juga memegang peranan yang penting dalam menangkap ari
suatu ucapan.
A. Sound Discrimination
Penguji mengucapkan dua kata yang sama atau hampir sama bunyinya dan testee
diminta menjawab apakah kedua kata itu mempunyai bunyi yang sama atau berbeda.
Contoh: Cross S if they are the same and cross D if they are different!
2. Picture
Penguji menunjukkan dua gambar dan mengucapkan sebuah kalimat atau kata yang
sebagai ari dari salah satu gambar itu. Testee disuruh memilih gambar mana yang
26
Kalimat pernyataan diucapkan oleh penguji dan testee memilih options yang sama
Choose the sentence that has the same meaning as the given sentence!
4. Dialogues
pertanyaan dari orang ketiga. Testee disuruh memilih jawaban tertulis sebagai jawab
I. Hello, Mary, this is Mr. Smith at the office. Is Bill feeling better today?
II. Oh, yes, Mr. Smith. He’s feeling much better now. But the doctor says he’ll
a. at the office
b. on this way to work
c. home in bed
d. away on vacation
5. Lecture
Tes ini cocol untuk advanced students. Kepada testee diperdengarkan lecture
(ceramah), kemudian diikuti oleh pertanyaan penulis dalam bentuk multiple choice
item. Untuk immature students, baiklah diberikan teks pendek yang terdiri dari satu
27
Pertanyaan:
2. How much is the sale price of the one-hundred dollar men’s suit
Alternatif:
2. a. $60 b. $120
c. $80 d. $450
Dalam menyusun tes listening dalam bentuk dialogues atau lectures, pertama
susunlah tes itu seperti menyusun tes reading, artinya, susun dulu text, petunjuk,
item (stem dan pilihan), dan lembar jawaban. Kemudian baca dan rekamlah petunjuk
Pisahkan lembar pilihan yang akan dibagikan kepada peserta selain dari lembar
jawaban. Jadi pada waktu ujian penguji memperdengarkan rekaman dan peserta
6. Cloze Test
Pertama siswa mendengarkan teks yang dibacakan sekali atau dua kali kemudian
kepada mereka diberikan teks tadi yang sudah diambil satu kata setiap baris untuk
Teks lengkap:
28
7. Dictation
Pada tes ini siswa diminta menulis semua apa yang diucapkan oleh penguji,
Walaupun tes ini kelihatannya sederhana, ternyata tes ini sukar juga, karena orang
bisa menulis benar kalau dia mengerti makna dan struktur bahasa lisan itu. Dictation
termasuk satu tes bahasa yang dapat mewakili semua unsur dan keterampilan,
walaupun disini yang diuji tidak expressive. Korelasi hasil tes yang lengkap dengan
Pada tes ini testee dihadapan kepada beberapa gambar, dan dia harus memilih
29
VII. TESTING SPEAKING/PRONUNCIATION
Tes speaking berarti mengukur kemampuan testee memakai bahas itu secara lisan, berarti
mengeluarkan pendapat, perasaan, keinginan, bercerita, atau menjawab pertanyaan. Dalam tes
speaking kita mengukur kemampuan seseorang berbicara dalam bahasa asing tertentu dengan
dilihat ketepatan bahasa itu dalam situasinya (sosiolinguistically) atau ‘baiknya’. Dalam
istilah bahasa Indonesia disebut ‘baik dan benar.’ Dalam testing pronunciation kita menyuruh
yang diuji berbicara tetapi yang diukur adalah ucapan atau lafalnya saja, bunyi segmentalnya
dan suprasegmentalnya.
1. Scored Interview
Pada scored interview testee diinterview satu persatu. Sesudah selesai langsung diberi
skor. Karena dalam speaking yang kita perhatikan keempat unsur di atas maka dalam
pemberian skor juga diberikan kepada fluency, pronunciation, grammar, dan vocabulary.
Untuk pemberian skor perlu diberi descriptor untuk tiap aspek, misalnya:
a. Untuk Pronunciation
b. Untuk Fluency
c. Untuk Grammar
d. Untuk Vocabulary
30
Saran-saran untuk melaksanakan scored interview
Testee disuruh mengamati gambar atau seri gambar dan kemudian testee disuruh
menceritakan isi gambar itu, latar depan maupun latar belakang, dan apa yang terlihat
dalam gambar itu, Kalau perlu tester bisa menanyakan hal-hal tertentu, supaya berjalan
3. Oral Report
Pada oral report yang diuji mempersiapkan suatu laporan dan disajikan secara lisan, yna
giuji meaporkan secara lisan antara 5 sampai 10 menit, tetapi bukan membaca laporan.
Yang diuji bisa mempunyai catatan yang sesekali dia bisa lihat. Dia juga bisa memakai
gambar-gambar atau OHP. Sesudah selesai penguji dapat memberikan pertanyaan dan
tersebut diatas.
4. Role Play
Yang diuji diminta memainkan peran tertentu dalam satu dialog atau percakapan. Dialog
bisa antara penguji dan yang diuji, atau semua peran diberikan kepada yang diuji yang
terdiri atas dua atau tiga orang. Sebelum dialog atau percakapan dimulai kepada testee
dijelaskan lebih dahulu situasinya, sehingga percakapan dapat berjalan lancar. Di bawah
Student A:
You wish to buy a car. You are in a showroom, looking at a second-hand car that
might be suitable. You decide to find out more about it, for example how old it is,
who the previous owner was, how expensive it is to run and whether there is a
guarantee. You can pay up to about $900 in cash.
Student B:
31
You are a car salesman. You see a customer looking at a car in the showroom.
The car is two years old and belonged previously to the leader of local pop group.
it does about twenty miles to the gallon. Your firm offers a three-month guarantee
and can arrange hire purchase. The price you are asking for the car is $1,400
(Littlewood, 1988:56)
5. Discussion
Kegiatan ini hampir sama dengan interview, tetapi berbeda karena disini ditanyakan
pendapat, atau argumentasi dari yang diuji, mengapa dia atau seseorang bertindak sesuatu
atau bersikap sedemikian rupa. Dalam interview percakapan di bawah kontrol penguji
atau penginterview, sedangkan pada discussion atau conversation orang yang diuji berhak
juga menyetir atau mengalihkan arah pembicaraan sesuai dengan pikirannya. Pada diskusi
yang diuji sering juga diminta memecahkan suatu masalah. Selain diskusi bisa juga
dipakai debat, dimana dua pendapat yang berbeda dan saling mempertahankan atau
Dalam kegiatan ini yang diuji diminta menceritakan pengalamannya yang dia bisa pilih
sendiri atau ditentukan oleh penguji. Selain menceritakan pengalaman, bisa juga
7. Sentence Construction
“You are trying to find the post office in a strange city. Ask a policeman for directions.”
Testee diminta mengubah kalimat ke bentuk lain, seperti: dari positive ke negative atau
interrogative, dari active ke passive. Cara lain yaitu dengan menyuruh testee
9. Translation
Testee disuruh menterjemahkan kalimat dalam bahasa sendiri ke dalam bahasa Inggris
dengan lisan. Contoh: terjemahkan kalimat ini ke dalam bahasa Inggris. “Kemarin kami
32
TESTING PRONUNCIATION
1. Reading Passage
Testee disuruh membaca teks dengan ekspresi yang tepat sesudah ia membaca teks itu
dalam hati. Yang dinilai terutama pronunciation dan fluency termasuk ketepatan
Testee disuruh membaca/ucapkan kata tertentu yang mengandung bunyi yang tidak
terdapat dalam bahasa ibu, seperti “bag”, “shop”, “measure”, “usual”, “zoo”, “thin”,
3. Minimal Pair
Item ini hanya bisa mengukur kemampuan pronunciation. Testee disuruh membaca dua
kata yang minimal pair yaitu yang berbeda ucapannya hanya satu bunyi (phoneme) seperti
“sheet” dan “shit”, atau “back” dan “bag”, atau “beg” dan “bag”.
Karena sulitnya membri skor dan banyaknya waktu yang terpakai dalam oral test, maka
dipakai juga test tertulis untuk mengukur production, dengan asumsi bahwa apa yang
seseorang ucapkan dalam hati sama jika ia betul-betul ucapkan dengan keras. Di bawah
Testee disuruh memilih kata-kata yang sama bunyinya dengan kata yang ditentukan.
Contoh:
33
b) Word Stress
Testee diminta memilih suku kata yang mendapat tekanan utama dalam kata. Contoh:
stability stable
- -- - - -
ABCD A B
c) Phrase Stress
Testee diminta memilih kata yang mendapat tekanan utama dalam suatu
phrase/kalimat. Contoh:
I need a map
A B C D
34
VIII. TESTING READING COMPREHENSION
menangkap isi bacaan yang dibacanya. Caranya yaitu menyuruh testee membaca text dan
sesuai dengan tingkat kemampuan yang diuji, baik dalam kosa kata maupun strukturnya,
pendek saja dan isinya berbeda-beda (jika lebih dari satu teks), misalnya yang pertama
mengenai sejarah, yang kedua mengenai binatang, yang ketiga mengenai dongeng, dan
keempat mengenai kejadian-kejadian yang sebenarnya. Panjang teks itu antara 100 sampai
dengan 250 kata diikuti oleh 5 atau 7 pertanyaan. Teks itu hendaknya teks yang belum
pernah dibaca (unseen passagges). Jadi dalam memilih teks, jangan pilih bacaan dari buku
7. Central/Main Idea
8. Supporting Ideas
dll
9. Factual Questions
Pertanyaan ini menanyakan fakta-fakta yang jelas dalam teks. Inilah pertanyaan yang
paling mudah. Pertanyaan ini biasanya dimulai dengan what, who, when, where, dsb.
35
Pertanyaan ini menanyakan pengertian akan kalimat/phrase dalam susunan tertentu dan
a. bird’s mouth
b. charge of payment
c. proposed law
12. Organization
Contoh: What is the relation between the first and the last paragraph.
Contoh: Find a word in paragraph two which shows that the writer does not like the
subject.
16. Translation
Siswa disuruh menterjemahkan beberapa kalimat dari teks ke dalam bahasa mereka.
17. To Relate the daily life/surrounding and to evaluate certain measure, situations
or characters in the Passage
36
Contoh: Does the habits mentioned in the passage apply in your town?
Baik juga menanyakan sikap pengarang dan tujuan pengarang dalam penulisannya
kalau hal itu jelas dalam bacaan. Disamping itu ditanyakan apakah pengarang memakai
susunan kalimat atau kata dan cara yang khusus untuk menyampaikan idenya.
a. persuasive
b. argumentative
c. serious
d. contemptuous
Instead of using straight forward way the writer many times uses:
a. irony
b. simile
c. metaphor
d. personification
19. Interpretation
Kegiatan ini mengubah atau mentransfer informasi dari teks ke gambar atau diagram
I bought a new house at Jalan Sentani. The front wall of the house has a door
in the middle and two windows each at the right and at the left of the door.
The form of the window is triangular and that of the door is rectangular.
37
IX. TESTING WRITING
3. Menulis satu atau lebih paragraph mengenai sesuatu dalam bentuk description, narration,
atau exposition
4. Menerjemahkan satu atau lebih paragraph dari bahasa sendiri ke bahasa asing (Inggris)
tertulis
5. Menulis surat
Cara lain mengukur kemampuan menulis dengan dictation dan cloze test. Pada kedua
tes ini kurang kelihatan ekspresi dari penulis, Tetapi dicatation dan cloze test bahkan dapat
bahwa kemampuan dalam dictation dan cloze test berkorelasi tinggi dengan kemampuan
keseluruhan bahasa.
7. Dictation
Types of dictation
a. Standard Dictation
In standar dictation the examinees are required to write verbal sequences of material
b. Partial Dictation
In partial dictation the examinees are given a written of the text (along with the
spoken version) in which the written passage has certain portion left out. The
examinees must listen to the spoken material and fill in the blanks in the written
version.
c. Noise Dictation
d. Dictation-composition (Dictocomp)
In this type of dictation, the examineeds are instructed to listen to a text one or more
times while it is presented either live on or tape at a conversational rate. Then they are
38
asked to write down from memory, as accurately as possible, what they have heard,
e. Dictogloss/natural dictation
It is a dictation where the examiner reads a sentence once after which the examinees
are to jot down the main or key words they can recall, and then to reconstruct the
f. Cloze dictation
It is similar to the standard cloze, i.e. the examinees are given a written version with
blanks and they are to fill thte blanks when they listen to the dictatd passage in its
cloze form.
This is a basic activity for beginners, In the phonemic item dictation the attention is
centred on the sound system. The items can be single sound, words, minimal pairs,
8. Cloze Test
Cloze test adalah melengkapi kembali sebuah teks yang sebagian kata-katanya
telah dihilangkan. Biasanya penghilangan kata itu pada setiap kata kelima atau ketujuh
kecuali kalimat pertama dan kata yang berupa nama, kata yang terdiri dari satu huruf tidak
dihitung.
Ada jenis lain yang disebut C-test yang penghilangan itu dilakukan setengah kata
di akhir pada setiap kata kedua (delete the second half of the second word starting with
Jenis lain yang hampir sama dengan cloze test tetapi untuk kata yang akan diisi
Hal-hal yang diskor dalam pemberian nilai dalam writing test adalah:
Apakah content itu sesuatu yang baru, kreatif, berguna, menarik, atau merupakan
analisis, membosankan, evaluative, atau sesuatu yang tak berguna. Bagaimana organisasi
tulisan itu, apa bagian-bagiannya dan urutannya, apakah ada introduction, main ideas,
39
supporting ideas, conclusion, apakah isinya sistematis, apakah cohesive dan coherent,
apakah memakai transition words, dll. Ketepatan pemakaian grammar, vocabulary, dan
spelling tentu saja sangat mempengaruhi mutu tulisan. Gaya (style) penulisan dan
Style is the instrument and the writer’s choice of words and arrangement of words
into sentences. The writer’s style usually reveals among other things, his attitude toward
himself, toward his readers, toward his subject. The writer’s attitude are called tone. Most
language (‘a sea of troubles’), inversion (‘a leader he is not’), repetition and parallelism
(‘governemnet of the people, by the people, for the people’), balance and antithesis (‘it
There are three level of style: formal, informal, popular or vulgar, Vulgar does not
mean dirty words; rather it refers to the speech characteristic of uneducated people,
speech that uses such expression as ‘ain’t, nohow, and he don’t). Formal writing found
assumes an audience, not only generally well educated but also with special knowledge
of or interest in the writer’s subject. Informal style is usually used in daily conversation
(Barnet, 1908:391).
Selaindari itu, dengan menilai langsung karangan testee, kita bisa juga menilai
Disini kita bkan mentes kemampuan dasar dalam grammar, tetapi grammar yang
i) substituting word
I have three cars, but the . . . . . .you see here is the newest
ii) parallelism
40
iii) Conjunction
b) Error Recognition
The man who stole the money have been arrested by the police
A B C D
c) Sentence Correction
Disamping mencari kesalahan dalam kalimat, testee disuruh membetulkan kata yang
After he had broken the glass he hurries into the room and tool
all the valuable things.
d) Ability to organize
e) Mechanics of Writing
Yang dimaksud mechanics of writing adalah pemakaian tanda-tanda baca dan huruf
besar. Hal ini dapat di test dengan menyuruh melengkapi kalimat-kalimat atau
“Returning to his friend Peter (1) Bill (2) asked whether he still
wished to continue with the trip (3)”
1 2 3
A. A. A. 1=
B, B, B, 2=
C; C; C; 3=
D: D: D:
41
f) Memilih kata yang paling tepat
Dalam menulis penulis harus memakai kata yang paling tepat, sesuai dengan situasi
dan bidang yang dibicarakan. Jadi dalam tes writing siswa bisa diminta memilih kata
Contoh:
42
X. TESTING VOCABULARY
Testing Vocabulary adalah testing mengenai kata apa yang di uji kan. Untuk
achievement test kata yang dipilih untuk di test tidak sukar, karena kata-kata yang baru
diajarkan terbatas. Walaupun terbatas, tidak mungkin memasukkannya semua dalam test.
Pilihlah kata yang paling banyak frekuensi atau yang paling banyak digunakan/dipakai.
Untuk menentukan yang paling tinggi frekuensinya boleh dengan perasaan guru
sendiri, tetapi yang paling tepat dengan melihat word list dalam buku kalau ada, misalnya A
General Service List of English Word oleh Michael West. Untuk General Proficiency Test,
biasanya diambil dari word list dengan stratified sample. Kosa kata dapat diklasifikasik atas
dasar word classes: nouns, verbs, adjectives, adverbs, prepositions, conjunctions, articles,
interjections, pronouns, dan numerals. Dan dapat juga dikelompokkan menjadi yang
linguistic, geografi, sejarah, hukum, matematika, olah raga, music, bangunan, ukuran,
Kalau tes kosa kata untuk jabatan/tugas tertentu, tentukanlah hal-hal yang
berhubungan dengan pekerjaan itu, lalu tentukan kosa katanya. Misalnya kalau
mengevaluasi kosa kata untuk menjadi pemandu pariwisata (guides) maka tentukan dulu
hal-hal yang berhubungan dengan tugas itu seperti: transportasi, hotel, recreation places,
souvenir, dll. Kemudian carilah kosakata yang berhubungan dengan transportasi (bus, taxi,
plane, driver, rent, reserve, dll), recreation places (beach, hiking, festival, movies, zoo,
D. Kinds of Questions
21. Definition
a. True-False
T–F A man who sells apples, bananas, papayas and oranges is called a fruiter.
b. Multiple-Choice
43
c. Matching
f. Supply Type
22. Opposite
a. True-False
b. Matching
1. happy a. sad
2. high b. bad
3. ugly c. beautiful
4. mad d. low
23. Synonym
a. True False
b. Multiple-Choice
c. Matching
44
d. Supply Type
a. Multiple Choice
Word in context.
The Indonesian word for bank in : He is standing on the bank of the river.
a) tepi
b) gedung
c) tengah
d) uang
b. Supply Type
25. Picture
a. True – False
b. Multiple-Choice
c. Supply Test
This is a . . . . . . . . . . .
In this kind of question the testees are asked the meaning of a word after using it in
45
27. Translation
1) Multiple-Choice
He kicked the bucket last year. The meaning of ‘kicked the bucket’ is:
a) died b) got sick c) played football
2) Supply Type
The Indonesian word for run out in: we run out of food is . . . . .
b. Sentence/Paragraph Translation
1. The ability to translate does not show the ability to use the language. Someone who is
skilled in translation, many times is bad in speaking, reading, listening, and writing.
2. One of the first objectives of foreign language learning is to free the learner from his
Dalam menguji vocabulary, pertama tentukan tujuan, kisi-kisi, tentukan kata yang
hendak diuji, baru susun soal. Untuk achievement test, sampel kata yang diuji tentu diambil dari
kurikulum/buku teks. Sampel ini dapat diambil dengan random, sistematik, atau purposeful.
Misalnya sesuai dengan kurikulum, vocabulary untuk SLTP 1000 kata, tetapi kita mengambil
sampel hanya 50 kata. Ambil kata 50 dari 1000 itu dengan cara tadi lalu susunlah item untuk tiap
kata itu. Misalkan dalam sampel itu ada kata: good, happy, bad, sick, pilot, ears, plane, rain,
river,etc. Pertama buatlah pertanyaan untuk ‘good’. Sebaiknya kata itu dimasukkan dalam
kalimat dengan konteks yang tepat. Ada bermacam-macam item untuk mengecek apakah siswa
46
1) cara pertama: tanyalah synonym atau opposite
Badu always does his homework well and he likes to help other students.
Badu is a . . . . . . student.
a) lazy b) good c) tall
a) Supply Type
47
XI. TESTING GRAMMATICAL/ STRUCTURE
menyusun kata menjadi phrase/kalimat dan bagian kata menjadi kata. Problem dari
grammatical structure terletak pada perbedaan pattern antara bahasa ibu dan bahasa asing
yang dipelajari. Makin banyak perbedaan itu makin banyak problem. Dalam testing
grammatical structure kita mengutamakan pada perbedaan pola bahasa ibu dan bahasa
target.
Dalam tes ini mengukur kemampuan testee terhadap bentuk dan susunan atau
urutan kata atau frasa dalam kalimat yang dalam istilah linguistic disebut morphology
atau sintaksis (frasa, klausa, dan kalimat). Materi tes tergantung kepada jenis tes, apakah
achievement test, proficiency test, atau placement test, dll. Untuk achievement test materi
diambil dari kurikulum yang dipakai, untuk proficiency test tergantung pada tujuan, dan
kalau untuk placement test harus meliputi pengetahuan semua level yang ada.
E. Item Types
48
Fill in with: in, on, at.
1. She is still . . . . . . . . . . . the office.
2. He came here . . . . . . . . . . . . December 25, 1960.
35. Conversion
A B C D
37. Translation
PETUNJUK TES
1. Tujuan tes
5. Contoh cara menjawab, kalau testee belum biasa dengan cara yang
diberikan.
Contoh:
Tes ini untuk mengukur hasil belajar kamu selama bulan-bulan yang
lewat. Hasil tes ini akan banyak menentukan nilai semester ini dalam
raportmu. Tes ini terdiri dari 100 soal dan waktu yang diberikan 90
menit. Pilihlah jawaban yang terbaik untuk menjawab tiap soal dan
lingkarilah huruf jawaban itu pada answer sheet. Bila kamu tidak pasti
didenda.
49
Contoh cara menjawab: Answer Sheet
1. My grandfather is . . . . . . . . . . . 1. a. b. c. d.
a. My mother’s mother
b. My uncle’s sister
c. My father’s father
d. My son’s mother
sheet. Bila ada dua atau lebih types of item, perlu diberi petunjuk selain
dari petunjuk umum. Petunjuk khusus berisi keterangan cara atau dasar
menjawab pertanyaan.
50
XII. INTERPRETASI SKOR
Interpretasi artinya pengubahan atau konversi skor (skor mentah) menjadi nilai (grades)
atau skor tertentu. Skor mentah biasanya dinyatakan dengan angka yang menunjukkan
banyaknya jumlah yang benar jumlah poin yang benar. Sedangkan nilai (grades) dapat
dinyatakan dengan angka 0 – 10 seperti di SD, SLTP, dan SMU. Sedangkan angka 0- 100
dinyatakan dengan huruf seperti A, B, C, D, dan E atau juga dengan kata-kata seperti baik
sekali, baik, sedang, kurang, dll, yang kadang-kadang disebut juga dengan predikat atau
academic standing. Untuk menginterpretasikan skor menjadi nilai boleh dipakai Criterion
Reference (penilaian acuan patokan = PAP) atau Norm Reference (penilaian acuan norma
= PAN).
A. Criterion Reference
Nilai yang didapat dengan cara ini disebut nilai mutlak. Nilai mutlak ini
diperoleh berdasarkan presentase dari jawaban yang benar atau presentase dari tujuan
yang dapat dilaksanakan dengan baik. Biasanya ditentukan dulu penguasaan serendah-
dari 80 item, ini berarti persentase penguasaan adalah 52/80 x 100 = 65%; maka
nilainya menjadi:
Untuk nilai di perguruan tinggi di Indonesia nilai akan menjadi C atau 2, karena skor
B. Norm Reference
Adapun beberapa nilai atau skor yang memakai perhitungan kedudukan skor
a. C Score
b. Standard Nine
c. Z Score
d. T Score
e. A G T C Score
f. CEEBT Score
g. Percentile
h. Norma berdasarkan 0 - 4
i. Ranking
51
Dalam mengelola skor mentah menjadi skor diatas, kebanyakan dengan
dimaksud. Nilai yang didapat dengan cara ini bukan berdasarkan persentase jawaban
Nilai ini disebut nilai relative. Nilai ini tidak menunjukkan penguasaan bahan atau
tercapainya tujuan. Untuk mendapatkan mean dan standar deviasi kita harus membuat
distribusi frekuensi berkelompok lebih dahulu kalau jumlah siswanya banyak. Kalau
jumlah siswanya sedikit tidak perlu membuat distribusi frekuensi tunggal. Cara yang
singkat dan gampang ialah dengan memakai kalkulator ilmiah (scientific calculator)
dengan memasukkan datanya satu persatu lalu tekan saja lambing yang menunjukkan
mean dan SD. Berikut ini cara untuk mendapatkan SD dan mean dengan memakai
distribusi frekuensi tunggal terutama untuk data yang siswanya tidak banyak, misalnya
10 orang sbb: 75, 70, 65, 69, 71, 68, 69, 74, 70, 72
Mendapatkan mean adalah jumlah semua skor dibagi jumlah peserta atau dengan
rumus:
MEAN =
MEAN = = 70,3
Mencari SD:
( )
SD =
√
SD =
SD = 2,76
52
3. Susunlah score group.
5. Hitunglah jumlah tally itu dan tulislah pada daftar di bawah f (frekuensi)
6. Tentukan assumed mean (mean dugaan) yaitu midpoint (titik tengah) dari score
7. Tulislah angka deviasi nilai mulai: 1, +2, +3, dst di atas mean dugaan, angka 0
Salah satu cara mencari mean untuk data berinterval dipakai rumus:
( )
Mean =
Dimana: M = mean
AM = mean dugaan (assumed mean)
i = interval
Efx = jumlah fx
N = jumlah pengikut
SD = −
Contoh: skor mentah dari suatu tes bahasa Inggris yang diikuti 40 peserta adalah
57 36 4 30 54 31 15 22
52 39 47 31 48 32 16 23
40 32 43 25 35 25 16 10
40 26 35 26 33 27 6 11
27 27 28 29 20 20 21 14
Penyelesaiannya:
skor terendah 4
range 53
53
3. susunlah score group
6. assumed mean adalah pertengahan dari 23 – 27 yaitu 25 karena score group inilah
7. tulislah 0 dibawah kolom x lurus pada score group 23 – 27 dan diatasnya +1, +2,
M = 25 + 5 ( ) = 25 + 3,5 = 28,5
Cara lain untuk menghitung SD untuk data berkelompok adalah dengan rumus sbb:
( )
SD =
54
1) C Score
Skala yang dipakai yaitu dari 0 – 10. Untuk mengubah raw score menjadi C-score
kita harus menghitung score mana yang untuk 10, mana untuk 9, dst. Caranya
sebagai berikut:
Jadi score yang 57 dari test di depan mendapat nilai 10, yang skor 4 mendapat
Cara lain untuk mendapatkan nilai dalam C-score ialah dengan mencari langsung
table C-score, misalnya kalau Z-score dari seorang siswa 1.6 maka nilai dalam C-
4% yang mendapat 9
7% yang mendapat 8
12% yang mendapat 7
17% yang mendapat 6
20% yang mendapat 5
17% yang mendapat 4
12% yang mendapat 3
7% yang mendapat 2
4% yang mendapat 1
Kalau kita mengubah skor mental bahasa Inggris yang sudah disebu di
muka, maka yang mendapat 9 adalah 4% dari 40 = 1.16 digenapkan menjadi dua
orang, yaitu skor 53 dan 57. Sedangkan yang mendapat nilai 5 yaitu 20% dari 40 =
55
3) Z-Score
Kedudukan skor dalam Z-score di antara -3 dan +3 Rumus untuk Z-score adalah:
Z=
Skor mentah dalam tes bahasa Inggris di muka yang skor mentahnya 40 menjadi
– .
Z= = 0.9
.
4) T-Score
T = 50 + 10 x Z-score
Kalau dikehendaki skala 0 – 100 maka angka SD itu diubah menjadi 16.7
50 + 10 x Z
( . )
50 + 10 = 50 + 9 = 59
.
5) CEEBT Score
Princeton, New Jersey. CEEBT score memakai skala 200-800 denga rumus:
( – )
500 + 100
6) AGCT Score
( – )
100 + 20
56
7) Norma Skala 0 – 4
Jadi peserta yang skor mentahnya 48, 52, 54, dan 57 mendapat nilai 4.
8) Percentile
dengan menghitung berapa perserta tes itu yang berada di bawah skor orang
tersebut dibagi dengan jumlah peserta dikali 100. Jika ada beberapa peserta yang
menduduki skor yang sama, perhitungannya menjadi jumlah peserta yang berada
dibawah skor itu ditambaha dengan setengah kali jumlah peserta yang menduduki
Contoh:
Sepuluh orang peserta tes yang skornya adalah sbb: Abu 80, Bernard
75, Charles 70, David 70, Eka 65, Fince 60, George 60, Hadi 60, Iin
57
peserta yang di bawahnya 2 dan peserta yang menduduki skor itu 3
orang.
/
Percentile = x 100
.
Dalam Distribusi f tunggal Percentile = x 100
(kalau skor dimiliki seorang saja)
9) Stanel
Stanel menggunakan angka dari 0 sampai 10. Sistem ini hampir sama dengan
stanine karena juga menentukan persen banyaknya yang menduduki suatu angka.
Perbedaannya ialah bahwa stanel mempunyai jarak yang sama antara satu angka
dengan angka yang lain yaitu 0,5 SD. Jadi kedudukan angka terdiri dari -2,75
sampai 2,75.
Angka 0 1 2 3 4 5 6 7 8 9 10
% 1 2 5 13 18 22 18 13 5 2 1
Jarak -2,75 -2,20 -1,65 -1,10 -0,55 0 0,55 1,10 1,65 2,20 2,75
58
Mencari Rangking.
kedudukan murid itu dalam kelasnya. Untuk mencari rangking adalah sbb:
1. Urutkanlah semua siswa dari nilai atau jumlah nilai yang tertinggi sampai yang
terendah.
2. Siswa yang tertinggi, jika dia sendiri yang tertinggi maka dialah rangkin I, jika
siswa nomor 1 dan 2 sama nilainya, maka merekalah menjadi rangking 1,5
3. Jika siswa nomor 5 hanya seorang, maka dia menjadi rangking 5. Tetapi bula sswa
=6
Kalau lebih dari satu orang pada satu skor/angka maka rangking adalah jumlah
59
XIII. ITEM ANALYSIS
Item analysis atau Analisis butir adalah kegiatan menganalisis item untuk melihat
apakah item-item itu baik atau jelek. Kegiatan ini diperlukan untuk mendapatkan item-
item yang baik seperti menyusun tes yang standar, untuk alat tes dalam penelitian, dan
untuk membuat bank soal. Tes ini diujicobakan dulu baru dianalisis. Item yang baik akan
dipakai, item yang jelek akan dibuang, kalau sedikit kurang baik bisa diperbaiki. Item yang
baik adalah item yang tidak terlalu sukar, tidak terlalu mudah, dapat membedakan
kelompok siswa yang pandai dan kelompok siswa yang tidak pandai (rendah), dan
Sesudah tes dicobakan atau dilaksanakan dan di skor, kita menganalisa item-item
c. keefektifan distraktor
Taraf kesukaran adalah presentase dari pengikut yang menjawab item itu dengan
benar. Kalau presentase dari pengikut yang menjawab benar tinggi misalnya 80% atau
lebih maka item itu dianggap mudah, tetapi kalau hanya sedikit misalnya 20% atau
kurang maka item itu dianggap sukar. Untuk mempermudah analisa maka yang
diperhitungkan hanya sepertiga (1/3) dari skor yang tertinggi dan 1/3 dari yang paling
terendah. Sepertiga yang tinggi disebut Upper Group dan yang rendah disebut Lower
Group.
a. Aturlah semua ke atas dari skor yang tertinggi sampai ke yang terendah
b. Pilihlah sepertiga yang tertinggi dan sepertiga yang terendah. Kalau pengikut 30
c. Hitunglah jumlah yang benar dari kelompok atas (Upper Group/UG) dan jumlah
yang benar kelompok bawah (Lower Group/LG) untuk tiap item test. Misalnya
untuk item No. 1 jumlah yang benar dari UG 6; jumlah yang benar dari LG 2.
%
TK =
60
dimana: TK = tingkat kesukaran
UG = Upper Group
LG = Lower Group
T = Jumlah pengikut dari UG dan LG
TK Kategori
≥ 95 Sangat mudah
≥ 80 − < 95 Mudah
≥ 20 − < 80 Sedang
≥ 5 − < 20 Sukar
<5 Sangat sukar
Daya pembeda ialah daya dari item itu yang membedakan siswa (pengikut) yang
berhasil baik dan yang kurang baik. Jika jumlah benar dari kelompok atas sama dengan
benar dari kelompok bawah maka item itu dianggap kurang baik karena tidak bisa
membedakan siswa yang baik dan yang kurang baik. Rumus untuk mencari daya
peembeda adalah:
D=
/
Kalau jumlah yang benar dari UG = 6 dan LG = 2, dan jumlah pengikut UG dan LG
D= = 0,40
Daya pembeda berkisar antara -1 dan +1. Item daya pembedanya negatif adalah item yang
61
4. Effectiveness of distracters (keefektifan distraktor)
Suatu distraktor dikatakan efektif bila pengikut yang memiliki distraktor itu
lebih banyak dari kelompok bawah dari pada kelompok atas. Contoh:
4) arrange the names based on the scores form the highest to the lowest,
9) compute the LD
The revised items can be administered again after being revised and analysed
again. Good items can be put in certain file called bank of items.
62
XIV. RELIABILITAS DAN VALIDITAS TES
Tes yang baik adalah tes yang reliable, valid, dan praktis. Reliabel berarti bahwa
tes itu konsisten (stabil), valid berarti tes itu tepat mengukur apa yang hendak diukur,
A. Reliabilitas
Suatu tes yang dilaksanakan pada hari ini kepada sejumlah siswa diharapkan
bahwa kalau tes ini diharapkan bahwa kalau tes ini dilaksanakan pada hari berikutnya
atau beberapa hari kemudian hasilnya tidak akan berubah drastis jika tes itu reliable. Jadi
konsep dasar dari reliabilitas tes ialah konsistensi hasil. Reliabilitas tes dapat
didefinisikan sebagai tingkat kekonsistensian dari tes bila dilaksanakan pada kondisi
yang serupa.
Hal ini dilaksanakan dengan mengadakan tes dua kali kepada testee yang sama.
pertama dan hasil tes kedua, angka itulah merupakan reliabilitas tes itu.
Untuk cara ini tes disusun dua tes yang hampir sama. Lalu kedua tes ini disuruh
Karena sering kali tidak disukai dilaksanakan dua kali tes atau mengerjakan dua
tes yang sama atau hampir sama, maka dicarilah cara yang lebih sederhana, yaitu
dengan mengerjakan tes yang tunggal pada suatu waktu saja. Dengan cara ini kita
dapat menghitung reliabilitas dari satu tes itu saja, dengan membagi tes itu menjadi
63
Menghitung Reliabilitas
Setelah diadakan tes dihitunglah skor siswa pada setengah tes, misalnya skor
pada nomor ganjil, dan skor pada setengah yang lain dan skor pada nomor genap.
korelasi keseluruhan tes. Rumus untuk mencari korelasi adalah sebagai berikut:
– ( )( )
=
(( – ( )( ))(( –( )( ))
N = Jumlah Siswa
Σ = Sigma (Jumlah)
Misalnya enam siswa mengerjakan sebuah tes. Kemudian skor mereka dibagi
yaitu skor pada nomor ganjil dan skor pada nomor genap. Skor mereka pada nomor
tes. Karena dalam rumus ada sigma XY, sigma X kuadarat, sigma Y kuadrat, maka
Perhitungan:
5 6 30 25 36
6 6 36 36 36
5 7 35 25 49
7 8 56 49 64
6 7 42 36 49
7 7 49 49 49
_____________________________________________________________
6(248) – (36)(41)
=
((6 220 – (36)(36))((6 283 – (41)(41))
64
12
=
4.9 4.1
= 0.597
Korelasi ini barulah korelasi separuh tes karena memakai split-half method.
Selanjutnya pakailah rumus di bawah ini untuk mencari reliabilitas keseluruhan tes.
( )
=
+
= ℎ ( )
1 = ℎ
2 0.597
=
1 + 0.597
= 0.747
Menghitung reliabilitas dengan cara ini dicari terlebih dahulu mean dan
( ( − )
− =( )( − )
− ( )
K = Jumlah Item
M = Mean
S = standard deviasi
30
KR − 21 =( )(1 – 0.27)
29
30
KR − 21 = ( )(0.73)
29
KR − 21 = 0.76
65
c. Perhitungan Reliability dengan Kuder Richardson cara proporsi siswa yang
berhasil dan gagal (Lado, 1967:333).
Rumusnya adalah:
−
=( )
−
r11 = reliabilitas
n = banyaknya peserta
S = standard deviasi
Σpq = jumlah hasil kali proporsi yang berhasil dan proporsi yang gagal tiap item
Untuk mencari reliabilitas ini harus dicari SD skor dan sigma proporsi yang berhasil
dikali proporsi yang gagal, kemudian masukkan data ke dalam rumus ini.
1) Panjangnya tes, yaitu bahwa makin panjang suatu tes makin reliable.
3) Daya beda soal, semakin tinggi daya bedanya semakin tinggi pula reliabilitasnya.
5) Cukupnya waktu yang diberikan kepada pengikut tes, semakin cukup waktu
3) edit the items so as to make the choices more effective and thus reduce the factor of
guessing
B. Validitas
Validitas adalah sampai di mana suatu tes dapat mengukur apa yang hendak di
ukur. Suatu tes mungkin saja valid untuk tujuan tertentu tetapi tidak untuk tujuan yang
Validitas ini menunjukkan sampai di mana suatu tes mewakili isi dari pokok
atau mata pelajaran. Jadi hal ini menyangkut apakah sampel itu sudah cukup
mewakili. Untuk tes pencapaian tentu dihubungkan dengan kurikulum dan silabus.
66
Cara untuk mendapatkan validitas isi yang tinggi:
seseorang. Atau dengan kata lain sampai dimana suatu tes dapat meramalkan
keberhasilan atau kemampuan dalam suatu hal. Validitas ini ada dua macam
Concurrent Validity adalah tingkat korelasi antara hasil suatu tes dengan
hasil tes yang sudah baku yang dilaksanakan pada waktu bersamaan atau hampir
bersamaan.
Predictive Validity tingkat korelasi hasil suatu tes dengan hasil tes yang
suatu tes dengan hasil tes kemudian. Validitas ini disebut juga empirical
validity.
Validitas ini adalah hubungan antara hasil tes dengan sifat-sifat psikologis
dari siswa seperti motivasi, harga diri, kekhawatiran dan lain-lain. Definisi lain
mengatakan hubungan antara hasil tes dan teori-teori yang ada. Jadi juga
dikatakan bahwa validitas ini adalah sampai dimana hasil suatu tes dapat
menjelaskan sifat psikologis testee. Dengan hasil suatu tes hendak disimpulkan
validity mencoba menentukan faktor yang mempengaruhi hasil suatu tes dan
67
4) Face Validity (Validitas Tampang)
Jenis validitas yang lain ada pula yang disebut face validity. Validitas ini melihat
mutu suatu tes hanya dari tampang, yaitu dari apa yang dilihat dari luar saja,
lembaran jawaban), dan bentuknya kelihatan teratur dan baik, tanpa membaca
isinya.
a. Perintah yang tidak jelas dalam tes sehingga mungkin siswa tahu jawabannya,
tetapi karena perintah yang tidak jelas siswa jadi salah mengerjakannya.
b. Kata atau kalmia dari soal yang sukar, sehingga para testee tidak mengerti.
g. Susunan soal, Jika soal dimulai dari yang sukar lebih dahulu dalam waktu yang
relative singkat, mungkin saja siswa tidak sempat menyelesaikan soal yang
mudah di belakang.
68
DAFTAR RUJUKAN
Anderson, O.W., Krathwohl, D.R. (eds.) (2001). A taxonomy for learning, teaching, and
assessing: a revision of Bloom’s taxonomy of educational objectives. New York: Addison
Wesley Longman, Inc.
Finocchiaro, M. (1983). Foreign language testing. New York: Regents Publishing Company.
Gronlund, N.E. (1977). Constructing achievement tests. New Jersey: Prentice Hall.
Harrow, A. J. (1972). A taxonomy of the psychomotor domain. New York: David McKay
Company.
Harrow, A. J. (1972). A taxonomy of the educational objectives. New York: David McKay
Company.
Krathwohl, D.R., Bloom, B.S., & Masia, B.B. (1973). Taxonomy of educational objectives: the
classification of educational goals. London: Longman Group LTD.
Lado, R. (1969). Language testing: the construction and use of foreign language test. London:
Longman.
Mackey, W.F. (1970). Measurement of language learning: language teaching analysis. London:
Indiana University Press.
Mager, R. (1984). Preparing instructional objectives. New York: Regents Publishing Company.