Anda di halaman 1dari 72

LANGUAGE TESTING

( An Instructional Material)

OLEH:
Dr. MONIKA GULTOM, S.S., M.A.

PROGRAM STUDI PENDIDIKAN BAHASA INGGRIS


JURUSAN PENDIDIKAN BAHASA DAN SENI
FAKULTAS BAHASA DAN SENI
UNIVERSITAS CENDERAWASIH
2014
KATA PENGANTAR

Bahan ajar ini diperuntukkan khusus bagi mahasiswa program S1 semester

VI di Program Studi Pendidikan Bahasa Inggris demi menunjang peningkatan

pengetahuan dan pemahaman mahasiswa dibidang evaluasi kemampuan bahasa

dalam hal ini bahasa Inggris. Bahan ajar ini disusun sesuai dengan silabus program

S1 Jurusan Pendidikan Bahasa dan Seni, Program Studi Pendidikan Bahasa

Inggris, Universitas Cenderawasih, Papua, oleh penulis yang adalah sebagai

pengajar mata kuliah Language Testing.

Bahan ajar ini merupakan kumpulan informasi dari beberapa buku tentang

evaluasi kemampuan bahasa pada umumnya dan evaluasi khusus kemampuan

bahasa Inggris. Bahan ajar ini menggunakan istilah-istilah dalam bahasa Inggris

karena penulis menganggap bahwa para mahasiswa calon guru bahasa Inggris

perlu mengetahui istilah dalam bahasa Inggris selain juga dalam bahasa Indonesia.

Bahan ajar ini harus diakui masih memiliki banyak kesalahan dan

kekurangan dan karenanya penulis menerima dengan hati senang dan terbuka

untuk segala saran, kritik, dan masukan yang berharga bagi perbaikan kualitas dari

bahan ajar ini. Semoga bahan ajar ini bermanfaat bagi yang menggunakannya.

Jayapura 2014

Monika Gultom
DAFTAR ISI

HAL
KATA PENGANTAR

BAB I. TEORI TESTING BAHASA ASING DAN FUNGSI TES . . . . . . . . . . . . . . . . . . 1

BAB II. JENIS-JENIS TES ........................................... 3

BAB III. KLASIFIKASI TUJUAN PENDIDIKAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

BAB IV. LANGKAH-LANGKAH PENILAIAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

BAB V. TYPES OF ITEM . . . . . . . . . . . . . . . . . . . . . . . ...................... 18

BAB VI. TESTING LISTENING COMPREHENSION .......... ............. 26.

BAB VII. TESTING SPEAKING/PRONUNCIATION ................... 30

BAB VIII. TESTING READING COMPREHENSION ................... 35

BAB IX. TESTING WRITING ...................................... 38

BAB X. TESTING VOCABULARY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

BAB XI. TESTING GRAMMATICAL/STRUCTURE . . . . . . . . . . . . . . . . . . . . . . 48

BAB XII. INTERPRETASI SKOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

BAB XIII. ITEM ANALYSIS ...................................... 60

BAB XIV. RELIABILITAS DAN VALIDITAS TES . . . . . . . . . . . . . . . . . . . . . . 63


I. TEORI TESTING BAHASA ASING DAN FUNGSI TES

A. TEORI TESTING BAHASA ASING

Language testing atau tes kemampuan bahasa berarti kegiatan mengukur

kemampuan bahasa seseorang atau sekelompok orang. Tujuan mengukur kemampuan

bahasa ini dapat bermacam-macam sesuai dengan jenis tes itu.

Dalam belajar bahasa asing siswa mempunyai kecenderungan mentransfer sistem

bahasa ibu mereka kedalam bahasa asing mereka pelajari, sehingga terjadilah kesalahan.

Hal ini suatu problem yang biasa ditemui dalam belajar bahasa asing. Makin banyak

perbedaan sistem bahasa ibu dan bahasa asing itu semakin bayak problem yang akan

dihadapi. Perbedaan ini meliputi sistem bunyi, sistem struktur, dan sistem arti.

Sebagian dari problem ini dapat diramalkan dengan mengadakan perbandingan

antara bahasa yang dipelajari dan bahasa ibu (contrastive analysis). Teori testing bahasa

asing berasumsi bahwa menguasai problem itu berarti menguasai bahasa target dan

mentes kemampuan seseorang terhadap bahasa asing berarti mentes penguasan akan

problem-problem itu. Sebab itu item-item tes bahasa asing kebanyakan berisi problem

itu tanpa mengabaikan yang lain. Tetapi prediksi kesulitan melalui pendekatan teori

contrastive analysis tidak selalu benar. Untuk mengetahui kesulitan yang sebenarnya

terjadi atau dialami oleh siswa perlu dilaksanakan apa yang disebut error analysis. Hal

ini diketahhui dengan menganalisis pekerjaan siswa dalam tes bahasa itu, dimana

mereka mendapat banyak kesalahan data dan dimana mereka rata-rata dapat menjawab

benar.

1
B. FUNGSI TES

Tes mempunyai banyak fungsi, antara lain adalah:

1. Untuk umpan balik kepada guru; dari hasil evaluasi guru dapat mengetahui hasil dari

pengajarannya, apakah sudah memuaskan atau belum dan dapat mengetahui

kekurangan/kebaikan pengajarannya.

2. Untuk mengetahui sampai dimana murid telah mengetahui bahan yang telah

diajarkan; Dengan mengetahui hal-hal yang sudah diketahui dan yang belum, guru

dapat memberikan remedial untuk bagian yang belum dikuasai.

3. Untuk mendapatkan informasi tentang kemajuan siswa baik setiap unit, semester,

maupun akhir tahun dan akhir program.

4. Untuk mengetahui apakah seorang siswa dapat dinaikkan ke kelas berikutnya atau

tidak dan apakah dapat diberi ijazah atau tidak.

5. Untuk menempatkan siswa sesuai dengan kemampuannya dalam belajar.

6. Untuk mendiagnosa kesulitan belajar yang dihadapi oleh murid-murid dan

seterusnya mengadakan remedial.

7. Untuk mendorong siswa belajar. Biasanya setiap siswa ingin mendapatkan nilai yang

baik; sehingga kalau ada ujian, baru mereka rajin belajar.

8. Untuk meramalkan keberhasilan seseorang dalam mengikuti suatu program

pendidikan atau mata pelajaran tertentu.

9. Untuk pengukuhan (reinforcement) dan kesadaran akan penguasaan materi kepada

peserta. Sesudah tes siswa menyadari akan kekeliruannya, sehingga dia sadar akan

kesalahannya, dan menguatkan yang benar. Sebab itu, sebaiknya sesudah tes, guru

hendaknya memberikan kertas kerja siswa, sehingga siswa dapat melihat mana yang

benar dan mana yang salah.

2
II. JENIS-JENIS TES

1. TEACHER-MADE TEST & STANDARDIZED TEST

Teacher-made test ialah tes ang disusun oeh seorang guru untuk mengetahui sampai

dimana siswanya menguasai materi yang telah diajarkannya. Sedangkan standardized

test dibuat oleh suatu team yang terdiri dari para ahli, dan tes itu sudah diuji cobakan

beberapa kali dengan hasil yang baik. Tes seperti TOEFL (test of English as a foreign

language), ALIGU (American Linguistics George Town University), IELTS

(International English Language Testing System), UMPTN (jian masuk perguran tingi

negeri), dan TOEIC (Test of English for International Communication) adalah

merupakan contoh dari standardized test. TOEFL dan ALIGU tes yang dipakai untuk

mengukur apakah seseorang dapat mengikuti kuliah pada perguruan tinggi di Amerika,

IELTS untuk di Australia, Canada, dan Inggris.

2. ESSAY, SUBJECTIVE, DAN OBJECTIVE TEST

Essay test adalah test yang memerlukan jawaban dengan penguraian, penjelasan,

pengorganisasian, kreativitas, dan pemecahan masalah. Oral dan essay test termasuk

kedalam subjective test yaitu tes yang penilaiannya dapat dipengaruhi oleh faktor-faktor

lain selain jawaban, seperti tulisan, bahasa, organisasi, keadaan penguji dan lain-lain.

Objective test ialah tes yang penilaiannya dapat dilakukan dengan obyektif artinya tanpa

dipengaruhi faktor-faktor lain selain dari isi jawaban, dan dapat diskor oleh mesin atau

orang yang tidak tahu mata pelajaran itu.

3. SPEED, POWER, DAN MASTERY TEST

Speed test ialah tes yang harus dikerjakan dalam waktu yang singkat dan pertanyaan

dengan tingkat kesukaran yang rendah. Power test ialah test yang taraf kesukarannya

dibagi-bagi dari yang rendah, sedang, dan tinggi dan waktu yang disediakan untuk

mengerjakannya cukup banyak. Mastery test ialah test yang taraf kesukarannya rendah

dan waktu yang diberikan untuk mengerjakannya cukup.

4. VERBAL, NON-VERBAL, DAN PERFORMANCE TEST

Verbal rest ialah test yang dijawab dengan bahasa tertulis atau lisan. Non-verbal test

ialah test yang dijawab dengan pantomime atau gerakan-gerakan, tidak memakai bahasa.

Performance test ialah test yang mengukur keterampilan atau perbuatan (psychomotoric

skills).

3
5. PRETEST, READINESS PRETEST, DAN PLACEMENT TEST

Pretest ialah test yang diberikan kepada siswa sebelum pelajaran itu diajarkan kepada

mereka. Readiness Pretest ialah pretest yang digunakan untuk mengukur apakah siswa

telah memiliki persyaratan untuk pelajaran itu. Placement Pretest ialah pretest yang

digunakan untuk mengukur sampai dimana siswa telah menguasai bahan barulah akan

diajarkan kepada siswa. Hal ini bergina supaya guru dapat memfokuskan pelajarn pada

hal-hal yang belum dikuasai siswa, mengurangi penekanan pada hal-hal yang telah

dikuasai siswa, menentukan strategi, dan supaya dapat melihat hasil pelajaran dengan

membandingkan hasil pretest dan post test.

6. ACHIEVEMENT, FORMATIVE DAN SUMMATIVE TEST

Achievement test ialah test yang digunakan untuk mengukur sampai dimana para siswa

menguasai bahan yang telah diajarkan. Formative dan summative test kedua-duanya

termasuk achievement test. Formative test ialah achievement test yang diadakan sesudah

tiap satu unit atau sebagian dari unit pelajaran. Arti sebenarnya dari formative test

adalah tes yang diadakan sementara pelajaran (during the instruction). Summative test

ialah test yang diadakan pada akhir semester, akhir tahun atau akhir pelajaran.

7. DIAGNOSTIC TEST

Diagnostic test ialah tes yang diadakan untuk mengetahui kesulitan-kesulitan yang

dihadapi siswa atau kelemahan dan kebaikannya.

8. PROGNOSTIC TEST (APTITUDE)

Tes yang digunakan untuk meramalkan tingkat keberhasilan seorang siswa untuk belajar

sesuatu disebut Prognostic test. Dengan tes ini, apakah seseorang mempunyai bakat

(talent) dalam hal yang dipelajari atau tidak dapat diketahui.

9. GENERAL PROFICIENCY TEST

General proficiency atau proficiency test ialah test yang dipakai untuk mengukur

kemampuan seseorang dalam suatu hal dari kumpulan hasil belajarnya.

10. PLACEMENT TEST

Placement test ialah test yang digunakan untuk menempatkan/mengklasifikasikan siswa

sesuai dengan kemampuannya.

11. TAKE HOME TEST.

Take home test ialah test yang dikerjakan di rumah masing-masing siswa.

4
12. OPEN BOOK TEST

Open book test ialah test yang waktu mengerjakannya dapat membuka buku.

13. ENTRANCE/ADMISSION TEST

Entrance/Admission test adalah tes untuk menentukan apakah seseorang dapat diterima

masuk pada perguruan tinggi atau institusi lainnya.

14. ORAL TEST

Oral test ialah test yang diberikan dengan lisan dan dijawab juga dengan bicara secara

langsung. Istilah lain untuk tes seperti ini ialah oral-oral. Selain itu biasa juga disebut

dengan oral-written yang berarti bahwa pertanyaan secara lisan tetapi jawabannya

dengan tertulis. Bentuk soal tentu bisa bermacam-macam, tetapi kebanyakan pada oral

test pemberian skor sama dengan pada essay yaitu sama-sama subjective dan

materi/tujuan yang tercakup sangat terbatas. Selain itu oral test sangat memakan waktu

karena harus dilaksanakan satu persatu. Jadi kalau 10 menit saja satu orang maka kita

memerlukan waktu 5 jam untuk 30 orang. Dalam pelajaran bahasa, oral test dipakai

untuk mengukur kemampuan speaking. Pada tes listening dapat dikatakan kita

melaksanakan oral-written, karena tes listening dilaksanakan dengan memperdengarkan

sebuah teks dan pertanyaan dengan lisan, kemudian siswa menjawab dengan tertulis.

5
III. KLASIFIKASI TUJUAN PENDIDIKAN

Tujuan pendidikan dapat diklasifikasikan menjadi beberapa tingkat. Salah satu klasifikasi

yang banyak dipakai ialah klasifikasi Bloom (Bloom’s Taxonomy of Educational

Objectives). Karena sistem ini beranggapan bahwa hasil belajar sebaiknya dijelaskan dalam

istilah perubahan tingkah laku, guru dianjurkan menyatakan tujuan pengajarannya dalam

istilah tingkah laku pula. Klasifikasi ini dibagi menjadi tiga, yaitu: cognitive domain,

affective domain, psychomotor domain. Cognitive domain meliputi tujuan yang menekankan

kemampuan berpikir (intelektual) seperti pengetahuan, pengertian, dan keterampilan

berpikir. Affective domain meliputi tujuan yang menekankan perasaan dan emosi seperti

moral, melakukan hal-hal yang baik, menahan napsu, menahan emosi, minat, budi pekerti,

sikap, apresiasi, dan penyesuaian. Psychomotor domain meliputi tujuan yang menekankan

keterampilan menggunakan anggota badan untuk sesuatu (motor skills) seperti menulis

dengan tangan, mengetik, berenang, menjalankan mesin-mesin, menari, menyetir mobil, dll.

A. COGNITIVE DOMAIN

Bidang ini dibagi lagi enam yang diurutkan dari yang paling sederhana ke yang

makin kompleks. Keenam tingkat itu adalah knowledge, comprehension, application,

analysis, synthesis, dan evaluation. Setiap tingkat meliputi tingkat yang dibawahnya,

seperti tingkat comprehension meliputi pula knowledge.

Knowledge diartikan sebagai mengingat materi dari apa yang telah dipelajari

sebelumnya, jadi termasuk menghafalkan fakta-fakta atau teori-teori. Tetapi semua ini

hanyalah mengingat kembali. Tingkat inilah tingkat paling rendah dari bidang cognitive.

Kata kerja yang dapat dipakai untuk ini seperti: menyebutkan, menunjukkan, mengenal,

mengingat kembali, memberikan definisi, menjodohkan, memilih, dll.

Misalnya:

Tujuan instruksional khusus: siswa dapat memberikan sinonim kata “happy” atau siswa

dapat menjodohkan kata itu dengan sinonimnya kata yang telah disediakan. Knowledge

ini dibagi menjadi tiga, yaitu:

a) Knowledge of specifics, yaitu: mengingat kembali potongan informasi yang khusus

dan terpisah

6
b) Knowledge of ways and means of dealing with specifics, yaitu mengingat kembali

cara-cara organisasi, belajar, mengadili, mengkritik, dan urutan kronologis. Hal lain

yang masuk bagian ini pengetahuan tentang klasifikasi, kriteria, dan metode.

c) Knowledge of the universal and abstractions in a field, yaitu pengetahuan tentang

skema dan pola utama yang merupakan alat untuk mengorganisasi fenomena.

Didalamnya termasuk pengetahuan tentang prinsip, generalisasi, teori dan struktur.

Comprehensive diartikan sebagai kemampuan menangkap (memahami) arti dari

materi, atau kemampuan mengerti materi yang disampaikan baik secara tertulis maupun

lisan dan dapat menggunakan materi itu. Hal ini bisa ditunjukkan dengan

menerjemahkan atau mengubah materi dari suatu bentuk ke bentuk lain, atau

menginterpretasi, menjelaskan, meringkaskan, dan meramalkan keadaan yang akan

datang. Kata kerja yang dapat dipakai untuk tingkat ini seperti membedakan,

menginterpretasikan, menjelaskan, memberikan contoh, mengambil kesimpulan,

membuat ringkasan, menjawab pertanyaan yang jawabannya implisit (dalam membaca).

Misalnya:

Tujuan instruksional khusus: siswa dapat menjawab pertanyaan-pertanyaan yang

diberikan tentang isi bacaan. Kemampuan ini dapat dibagi tiga yaitu:

a) Translation, yaitu kemampuan mengubah materi dari satu bentuk ke bentuk lain

seperti paraphrasing, translating atau dari bentuk teks menjadi bentuk gambar.

b) Interpretation, yaitu kemampuan memberikan penjelasan atau ringkasan apa yang

diterima. Hal lain yang masuk dalam hal ini adalah reordering, rearranging.

c) Extrapolation, yaitu kemampuan mengerti sesuatu yang diluar dari data yang

diberikan, seperti implikasi, konsekuensi, dan corollary (inference, deduction).

Application (aplikasi) berhubungan dengan kemampuan menggunakan materi

yang telah dipelajari dalam situasi yang baru dan konkrit. Hal ini termasuk aplikasi dari

peraturan, metode, konsep, prinsip, dan teori. Kemampuan ini menuntut juga dua

kemampuan yang dibawahnya yaitu knowledge dan comprehension. Kata kerja yang

dapat dipakai untuk tingkat ini: menggunakan, menerapkan, menghubungkan,

menyusun, mengklarifikasikan, memilih atau menyempurnakan (dalam structure).

Contoh:

Tujuan khusus: Siswa dapat mengubah kata benda tunggal menjadi bentuk jamak.

7
Analysis (analisis) berhubungan dengan menguraikan suatu materi menjadi

bagian-bagiannya yang menunjukkan bahwa susunan organisasinya dimengerti. Hal ini

mungkin saja identifikasi bagian-bagiannya, analisis hunungan antara bagian dan

pengenalan dari prinsip organisasi yang terlibat. Kemampuan ini menghendaki

pengertian dari isi maupun bentuk struktural dari materi. Kata kerja yang cocok untuk

tingkat ini seperti: mengklasifikasikan, membedakan, menyebut bagian-bagian,

membandingkan, memisahkan, dll. Contoh:

TIK: Siswa dapat menunjukkan pernyataan yang menunjukkan fakta dan yang

menunjukkan kesimpulan.

Synthesis berhubungan dengan kemampuan menggabungkan bagian-bagian

kedalam suatu bagian yang utuh. Hal ini mungkin berupa menyusun suatu tulisan, atau

proposal penelitian dengan penekanan pada tingkah laku kreatif. Kata kerja yang cocok

untuk ini seperti: menghubungkan, menggabungkan, menyimpulkan, dll. Contoh:

TIK: Siswa dapat menulis suatu teks pidato dengan organisasi yang baik

Evaluation (evaluasi) berhubungan dengan kemampuan menilai materi (seperti

pernyataan, ide, pemecahan, metode, novel, syair/poem, laporan) untuk sesuatu maksud.

Penilaian ini didasarkan atas kriteria yang tertentu. Kriteria ini mungkin internal

(organisasi) dan eksternal (relevansi dan maksud) dan siswa boleh pula menentukan

kriteria, kalau bukan diberikan. Beberapa kata kerja yang dapat dipakai pada tingkat ini

seperti: menafsirkan, menilai, menentukan, membandingkan, mengeritik, dll. Contoh:

TIK: Siswa dapat menjelaskan kebaikan dan kekurangan sebuah laporan.

Informasi Tambahan

a) Klasifikasi knowledge lebih lanjut adalah sbb:

Knowledge:

1) Knowledge of specifics:
i. knowledge of terms
ii. knowledge of specific facts

2) Knowledge of ways and means of dealing with specifics


i. knowledge of conventions
ii. knowledge of trends and sequences
iii. knowledge of classification and categories
iv. knowledge of criteria
v. knowledge of methodology

3) Knowledge of the universal and abstraction in a field:


i. knowledge of principles and generalization
ii. knowledge of theories and structures

8
b) Contoh verba yang dipakai untuk tiap kategori
1) knowledge : identify, name, define, describe, list, match, select, outline
2) Comprehension : classify, explain, summarize, convert, predict, distinguish
3) application : demonstrate, compute, solve, modify, arrange, operate,
relate
4) analysis : differentiate, diagram, estimate, separate, infer, order,
subdivide
5) synthesis : combine, create, formulate, design, compose, construct,
rearrange, revise
6) evaluate : judge, criticize, compare, justify, conclude, discriminate,
support

c) Keterangan pertanyaan pada tiap tingkat

What to Teach How to Teach


A Hierarchy of Skills Types of Comprehension
Questions/exercises
1) Knowledge
Ability to recall Fact The ‘wh’ questions (who, what,
Ability to recall Events which, why, when)
Ideas Point to the word . . .
Relation among Say the sentence that means . . .
Facts, Ideass Find the word that describe . . .
Sequence of events
2) Comprehension
Ability to re-express in own word Use your own word to . . .
Infer hidden meaning Why, do you think, that . . .
Explain metaphor, Explain the meaning of . . .
Idioms, Imagine that . . .
Translate from word to Tell the passage is about . . .
other media and vice versa Tell the story in 5 sentences . . .
Summarise main points Draw a picture, using the information
Infer writer’s intention How do you know that the writer is
angry?
3) Application
Ability to: Imagine that you, too, werr lost in the
Imagine similar situation applied to self forest . . .
Imagine similar situation applied to Imagine that your dog is telling the
others story . . .
Imagine similar situation applied to Imagine that instead of Greenland, the
other geographical, historical, cultural travelers were in a dessert
settings, What would they do . . .
Provide illustration from own Can you think of a day when you too
background knowledge were unlucky . . .
Apply ideas, principles, concepts to Using the information given, draw a
other situations diagram/make a lantern . . .
Make use of knowledge to apply in a
practical way (e.g. make an object,
construct a model, etc)
4) Analysis
Ability to break up/analyse: What are the similarities and the
A concrete object into its separate differences
components Compare and contrast
A story into its connecting parts Which part of the story is the most
An idea into its separate elements exciting
An argument into its separate ideas Which of the things mentioned are
An artistic whole into its separate useful to man, and which to animal
organizing principles Which of the argments againt smoking
have nothing to do with health?
Look carefully at the picture
What different shapes/colours does the
artist make use of? why?

9
5) Synthesis
Ability to put together/combine: Suppose, like Ali, you have a rope, a
Different components of an object to brick, a bundle of hay
form a new object Instead of making a . . . as he did,
Different element of a story to form a what could you make?
new story Imagine you have 3 wiches, what
Different elements of a solution to form would you wish for?
a new solution to a problem Compose a story about an ald man and
a dog
Change the story to give it a sad/happy
ending
6) Evaluation
Ability to: Give merit points to each of the six
See both good and bad sides of a thing objects and then arrange them in
Weigh good and bad and make a order of usefulness
judgment How did you feel when you read the
Rank things/persons in order of marit poem?
Describe own feelings and reactions to
something or someone

B. AFFECTIVE DOMAIN

Seperti sudah dijelaskan didepan domain ini berkenaan dengan perasaan, emosi,

sikap, minat, mental, apresiasi, mengontrol diri dari napsu-napsu yang tidak baik (makan

berlebihan, seks yang tidak pada tempatnya, gila harta, gila pangkat, gila kehormatan,

dll). Manusia yang baik adalah manusia yang dapat mengontrol diri dari napsu-napsu

yang tidak baik dan bisa menuruti aturan-aturan yang baik, serta berusaha membangun

manusia lain disekitarnya, tidak hanya dirinya sendiri. Mata kuliah/pelajaran yang

masuk dalam kategori ini adalah Budi Pekerti, Agama, Sejarah Kebangsaan,

Kewiraan/civics, Pancasila, dll. Tetapi sering kali mata kuliah itu tidak mencapai tujuan,

karena mengutamakan kognitifnya bukan afektifnya. Bidang ini juga masih dapat dibagi

menjadi 5 bagian:

1. Receive. Hal ini berhubungan dengan kesediaan siswa menghadiri atau mengikuti

suatu kegiatan. Itu berarti siswa sedia menerima atau tidak menolak.

2. Responding. Pada tahap ini siswa diharapkan sudah aktif mengambil bagian bukan

saja menghadiri. Dalam tingkat ini selain dari menerima, juga diharapkan siswa

seida memberi respon seperti membaca dan mengerjakan melebihi dari apa yang

diharuskan. Dia sudah bereaksi menunjukkan perhatiannya.

3. Valuing. Tingkat ini berhubungan dengan harga atau nilai yang diberi siswa kepada

suatu benda, peristiwa, atau tingkah laku. Valuing didasarkan atas nilai yang ada

pada diri siswa tetapi gejala nilai kelihatan jelas dari tingkah lakunya. Tingkah laku

ini adalah tingkah laku yang konsisten dan cukup stabil sehingga nilai ini dapat

10
diketahui. Tujuan pengajaran yang berada dibawah sikap dan apresiasi biasanya

termasuk dalam kategori ini.

4. Organization. Tingkat ini berkenaan dengan menggabungkan beberapa nilai yang

berlainan menjadi satu nilai yang konsisten. Jadi penekanan terletak pada

membandingkan, menghubungkan, dan menyatukan nilai-nilai. Tujuan pengajaran

yang berhubungan dengan perkembangan dari filsafat hidup termasuk dalam

kategori ini.

5. Characterization. Pada tingkat ini seseorang telah mempunyai sistem nilai yang

mengendalikan tingkah lakunya. Jadi nilai-nilai itu telah menjadi cara hidupnya.

Tujuan pengajaran yang berhubungan dengan pola-pola umum dari penyesuaian

cocok untuk ini.

C. PSYCHOMOTOR DOMAIN

Psikomotor domain dibagi menjadi enam tingkatan yang meliputi (Harrow, 1972):

1. Reflex Movements

In this first category the learner responds involuntarily. Reflex movements or actions

are elicited in response to some stimulus without conscious volition (the act of using

one’s will) on the part of the learner. Examples: movements which cause the limb to

move towards the body and away from the ground to avoid or escape harmful or

threatening stimuli and it responds to pain, the eyes are closed to avoid something

entering them, when touching fire, automatically the hand is pulled.

2. Basic Fundamental Movements

The basic fundamental movement patterns occur in the learner during the first yar of

life. These movements emerge without training (instinct). Examples: visually

tracking an object, reaching, grasping, and manipulating an object with hands, and

progressing through developmental stages of crawling, creeping, sucklung, sucking,

and walking. All of these fundamental movement patterns are built upon the

foundation or reflex movements.

3. Perceptual Abilities

Though classification level three appears to suggest cognitive as well as

psychomotor behaviours, it is included in the psychomotor domain because many

investigators claim that perceptual and motor functions are inseparable, and enriched

11
movement experiences usually enhanced a child’s abilities to structure and perceive

more effectively the many events to which he is exposed. Efficiently functioning

perceptual abilities are essential to development of the learner in the affective, the

cognitive, and the psychomotor domains. These abilities assist the learner in

interpreting stimuli thus enabling him to make necessary adjustments tohis

environment. Level ini dibagi lagi menjadi: kinesthetic, discrimination, visual

discrimination, auditory discrimination, tactile discrimination, and coordinated

abilities.

4. Physical Abilities

Physical abilities are essential to the efficient functioning of the learner in the

psychomotor domain. These physical abilities are in fact an essential part of the

foundation for the development of skilled movement. Level ini dibagi menjadi:

1) endures (the ability of the body to supply and utilize oxygen enabling the learner

to continue activity),

2) strength (the ability to exert (put into action or use) tension against resistance),

3) flexibility (the range of motion in the joints that the learner is capable of

achieving),

4) agility (the ability to move quickly).

5. Skilled Movements

Munn defines this skill as proficiency in performing a task; Laban and Lawrence

state that skill is the economy of effort a learner displays while perfecting a complex

movement; they call the skill the final stage of perfection. Mohr defines skill as a

progress toward better performance; While Seashore contends that skill is a degree

of efficiency in performing complex movement. Tis classification level will include

movement tasks that require learning and are considered reasonably complex. This

will serve to distinguish between level two and level five. The movement skill

implies the development of a degree of proficiency or mastery. Skilled movement is

the result of acquisition of a degree of efficiency when performing a complex

movement task. Examples: sawing a piece of wood, which is an adaptation of the

push-pull movement, typing, clerical skills, piano playing, and so on.

12
6. Non-Discursive Communication

Each learner develops a style of moving which communicates his feelings

about his affective self to the perceptive observer. Accurately interpreting

communicative movement behaviors of a learner heightens an educator’s

perceptions of the learner’s feelings, needs, and interest, thereby enabling the

educator to make more meaningful selections of learning strategies for that particular

learner. Behaviors that fall into this classification level are both innate and learned.

Movement communication is accurately termed Non-Discursive Communication.

Non-Discursive Communication is the classification level composed of behaviors

which can be labeled forms of movement communication. This forms of movement

behavior encompass a wide variety of communicative movements ranging from

facial expression, postures, and gestures to sophisticated modern dance

choreographies. This level can be divided into expressive movement (composed of

communicative movements used in everyday life), and interpretive movement

(composed of aesthetic movement and creative movement, which are called art

forms). Discursive means wandering from one topic to another, rambling, digressive.

13
IV. LANGKAH-LANGKAH PENILAIAN

A. Planning

Dalam planning ini pertama-tama kita harus merumuskan tujuan (objectives dari

test itu). Tujuan pengajaran adalah supaya siswa menguasai materi yang diajarkan,

sedangkan tujuan evaluasi adalah untuk mengukur samapi dimana mereka menguasai

materi yang diajarkan untuk menentukan apakah mereka diluluskan, ditamatkan, dan

ditempatkan sesuai dengan kemampuan, diterima pada satu program atau perguruan

tinggi, dan lain-lain sesuai dengan maksud mengadakan tes tersebut. Untuk formative

test tujuan tesi itu disesuaikan dengan tujuan pengajaran (TIU dan TIK). UMPTN

bertujuan untuk menyeleksi mereka yang akan diterima di perguruan tinggi negeri

dilihat dari skor mereka. TOEFL yang bertujuan mengukur kemampuan seseorang

melanjutkan pelajaran di Amerika Serikat berisikan kemampuan-kemampuan diperlukan

untuk mengikuti kuliah di Amerika Serikat seperti listening, reading comprehension,

vocabulary, structure dan written expression.

Hal kedua yang perlu dikerjakan ialah membuat design/table of specification, Tabel

ini berisi garis besar materi yang dites, banyaknya item tiap bagian, klasifikasi item

sesuai dengan taksonomi Bloom, bentuk item, banyaknya item dalam tiap klasifikasi

Bloom, presentase item pada setiap bentuk item, presentase item dalam tiap bentuk soal,

dan jumlah keseluruhanitem. Dalam membuat table of specification untuk mata

pelajaran bukan bahasa Inggris misalnya materi dapat dibagi menjadi reading, listening,

writing, speaking, vocabulary, dan structure. Untuk reading dibagi lagi atas beberapa

teks, dan tiap teks terdiri atas beberapa pertanyaan/item dan item-item harus ditentukan

klasifikasinya/kategorinya apakah knowledge, comprehension, analysis, dll, dan juga

harus ditentukan bentuk soalnya (apakah multiple-choice atau matching, dll). Untuk teks

pertama misalnya mempunyai 5 pertanyaan bisa saja dibagi menjadi 2 untuk knowledge

dan 3 untuk comprehension dan bentuknya semua multiple-choice. Kelompok

vocabulary bisa dibagi sesuai dengan materi itu, apakah kelompok maknanya seperti

sport, aviation, education, dll atau klasifikasi istilah grammar seperti noun, verb

adjective, dll. Untuk tes structure/grammar bisa dibagi dengan seperti tenses, reported

speech, conditional, plural form, negative form, question form, passive/active form,

modal, relative pronoun, gerund, dll; tiap bagian ditentukan jumlahnya dan tentukan

14
juga berapa yang untuk comprehension, berapa untuk analysis, dkk dan tentukan juga

bentuk soalnya.

Tambahan Informasi tentang Planning

#planning an objective classroom Test#

1) “Classroom test plays a central role in the evaluation of pupil learning. They

provide relevant measures of many important learning outcomes. The validity of the

information they provide, however, depends on the care that goes into the planning

and preparation of the test” (Gronlund, 1985:117).

2) Three considerations basic to all educational measurement are validity, reliability

and usability. The likelyhood of developing classroomtests with these three qualities

is increased when the following sequence is used.

C Construct Validity
R Reliability
A Authenticity
P Practicality
I Impact
I Interactiveness

3) Planning a Test

a) Determine the purpose of the testing

b) Clarify the objective of the course or unit

c) Draw up the test specifications or blueprint

d) Decide on types of the items or questions

e) Prepare relevant items

f) Try out the items where possible

g) Undertake an items analysis

h) Edit or rewrite items as appropriate

4) Table of Specification

Drawing up the test specification includes:

(i) Obtaining a list of instructional objectives,

(ii) Outlining the course content,

(iii) Developing a two-way chart of topics and processes.

15
B. Constructing the Test

Sesudah kita menentukan tujuan dan table of specification kita mulai menyusun

item-item sesuai dengan table. Jika sudah selesai, kita memeriksanya kembali dan

memperbaiki yang kurang baik. Untuk mendapatkan tes yang baik, tes itu harus

diujicobakan terlebih dahulu untuk mengetahui sampai dimana kebaikannya.

Untuk itu kita harus menganalisa hasil dari try out tersebut, mana item yang

kurang baik diperbaiki atau dibuang. Disini termasuk juga analisa option. Distractor fari

item yang takk pernah dipilih, diganti. Hal yang penting lagi ialah menghitung reliability

dan validity dari tes itu. Kedua hal ini juga menentukan mutu dari suatu tes. Untuk tes

biasa yang dilaksanakan oleh seorang guru kepada muridnya dalam praktek sehari-hari

tidak dicobakan dahulu.

C. Administering the Test

Langkah berikutnya ialah melaksanakan tes itu kepada siswa yang dikehendaki.

Sehari sebelum pelaksanaan tes kita harus mengadakan persiapan tes itu seperti ruangan,

memperbanyak bahan, menyediakan pengawas, alat-alat dan lain-lain, setelah selesai

mengumpulkan kertasnya. Dalam pelaksanaan tes perlu diperhatikan supaya siswa atau

yang diuji tidak kerja sama dan tidak diberi kesempatan bagi peserta tes membuka buku

atau melihat catatan. Sebab itu jaraj antara peserta harus diatur agar berjauhan dan tidak

ada buku atau catatan didekat mereka. Jika tidak dijaga hal-hal tersebut maka hasil tes

tidak menunjukkan kemampuan yang sebenarnya.

D. Scoring

Setelah melaksanakan tes kita memeriksa kertas ujian dan memberi skor dari

masing-masing anak. Dalam memberi skor ini guru tentu harus mempunyai sistem

sehingga dapat dipertanggungjawabkan. Biji (besarnya point) untuk tiap soal harus jelas

apakah satu atau dua, sesuai dengan sukarnya atau beratnya tugas yang diminta. Dengan

demikian jelas juga berapa skornya kalau benar semua. Dalam memberi skor ini bisa

dipakai dua pemeriksa (scorer) bila dianggap perlu, sebab dengan dua pemeriksa skor itu

makin dipercaya. untuk item yang objektif, pemeriksa bisa memakai mesin pemeriksa

atau alat lain yang mempermudah pemeriksa, seperti kertas plastic, atau kunci jawaban

yang sudah diataur sehingga gampang menghitung jawaban yang benar. Untuk item

esai, pemeriksa harus melihat unsur-unsur yang dinilai dan bagian-bagiannya, sehingga

16
pemberian skor itu sama untuk semua. Jangan dilihat dari panjangnya jawaban tetapi

isisnya yang sesuai dengan yang diminta.

E. Interpreting the Score

Disini guru menafsirkan skor dari siswa menjadi nilai yang mungkin berupa

huruf atau angka sesuai dengan sistem yang dipakai. Cara interpretasi ini bisa dengan

criterion reference (acuan patokan) atau dengan norm reference (acuan norma). Yang

pertama nilai atau grade siswa ditentukan berdasarkan persentase jawaban benar yang

dibuat masing-masing sswa. Sedangkan dengan acuan norma, nilai masing-masing

peserta ditentukan atas rangking masing-masing dalam kelompok, bukan atas dasar

persentase jawaban benar.

F. Reporting

Langkah terakhir ialah melaporkan hasil tes kepada yang berkepentingan, seperti

pengikut tes, kepala sekolah, orang tua siswa, panitia, dan sebagainya.

Table of Specification Form

Course/Subject Matter :
School :
Credit Points :

Materi Aspek dari Taxonomi Bloom


Sub Bentuk Jumlah
Ingatan Pemahaman Aplikasi Analisis Sintesis Evaluasi Persentase
Pokok Soal Soal
Bahasan

Jumlah

Persentase

17
V. TYPES OF ITEM

Dilihat dari cara pemberian skor, tes dapat dibagi menjadi Objective Test dan

Subjective Test. Objective Test memakai bentuk-bentuk seperti True-False, Multiple-

choice, Matching, Short Answer, dan Arrangement sedangkan Subjective Test memakai

bentuk-bentuk item yang subyektif yaitu jawaban yang meminta penjelasan, penguraian,

dan pengorganisasian yang terdiri dari satu atau beberapa kalimat, paragraph, atau

mungkin juga beberapa lembar.

Objective berarti bahwa nilai seseorang benar-benar atas dasar kemampuan siswa,

tidak ada pengaruh faktor lain; misalnya tes yang diperiksa oleh mesin computer adalah

obyektif. Subyektif berarti nilai seseorang tidak benar-benar atas dasar kemampuannya,

tetapi ada faktor lain, seperti hubungan antara peserta tes dan pemeriksa, tulisan yang rapi

dan bagus atau tulisan yang tidak rapi dan tidak bagus, keadaan pemeriksa (mengantuk,

keadaan marah atau senang), disukai atau dibenci oleh pemeriksa, dsb. Dengan demikian,

kalau peserta tes memiliki kesempatan nyontek berarti tes itu tidak obyektif, karena nilai

tes itu tidak menggambarkan kemampuan masing-masing peserta tes.

A. Objective Types

1. True-False (T-F)

Dalam True-False yang diuji dalam memberi jawaban hanya memilih apakah

pernyataan yang diberikan benar atau salah. Dalam mengerjakannya mereka bisa disuruh

menyilang atau melingkari pilihannya. Ada beberapa variasi dari T-F ini, diantaranya

yaitu:

a. Two-Response Type

Bentuk inilah bentuk yang paling sederhana yaitu memilih T atau F. Contoh:

(T – F) Indonesia lies between the Pacific and the Atlantic.

b. Three-Response Type

Tipe ini selain dari menentukan apakah benar atau salah ada pula pilihan lain yaitu

belum tentu (not certain) atau kata lain. Dalam pertanyaan reading comprehension

misalnya dapat diberi pilihan ketiga ‘tak ada dalam teks’, contoh:

(T- F – NC) A person who wears trousers is a man.

18
c. Correction Type

Pada bentuk ini yang diuji selain memilih benar atau salah, dia harus juga memberi

jawaban yang benar kalau pernyataan itu salah, contoh:

(T – F) The opposite of healthy is sad.

Correction: _______________________________

d. Cluster Type

Pada tipe ini yang diuji memilih/menandai satu deretan kata yang termasuk dan

mana yang salah, contoh:

Those belonging to fish are:


(T – F) shark
(T – F) whale
(T – F) sardine
(T – F) puma

Saran-saran dalam menyusun T – F items.

1) Pernyataan itu hendaknya semua salah atau semua benar, jangan setengah salah

setengah benar. Contoh yang kurang baik:

Indonesia lies between Asia and Australia and produces a lot of wine.

2) Item-item itu hendaknya dikelompokkan sesuai dengan isinya.

3) Jawaban yang benar dan jawaban yang salah hendaknya diselang-seling, jangan semua

benar atau semua salah. Untuk menghilangkan skor dari guessing dapat dipakai Net

Score. Untuk mencari Net Score ialah dengan mengurangi jawaban yang benar dari

jumlah jawaban yang salah (R – W). Kalau yang benar 30 dan salah 20 makan Net

Score menjadi 30-20=10. Tetapi banyak orang tidak setuju dengan skor ini, karena

belum pasti testee mendapatkan jawaban dengan guessing. banyak guru menganggap

Net Score ini merugikan yang lemah, karena semakin banyak kesalahan makin banyak

pula pengurangnya.

2. Multiple-choice

Pada item multiple-choice testee diminta memberi jawaban yang benar sesuai

dengan pertanyaan atau perintah. Item ini terdiri dari stem (lead) dan choice/option

(alternative), dan option terdiri dari distractor dan correct answer. Contoh memilih

yang benar:

The capital of USA is:

a. New York b. California c. Washington DC d. Chicago

19
Contoh memilih yang salah:

A cat is:

a. a reptile b. a mamal c. a meat eater d. a four-leg animal

Karena dalam menjawab multiple-choice item kemungkinan ada unsur guessing maka

untuk mendapatkan Net Score dipakai rumus:

= − −

R (right) = jumlah item yang benar


W (wrong) = jumlah item yang salah
n = jumlah option tiap item

Contoh perhitungan:

Jumlah soal 50. Jumlah yang salah 20. Setiap item terdiri dari 4 option, berapa Net Score-

nya? Jawaban dengan rumus diatas adalah:

= − −

= − , = ,
Saran-saran dalam menyusun multiple-choice.

1) Hindari kata-kata yang meragukan: kadang-kadang, sering, jarang, dsb.

2) Setiap item hanya menanyakan satu hal.

3) Pokok persoalan hanya diletakkan pada stem dan bukan pada option.

4) Urutannya ialah stem diikuti oleh option, bukan sebaliknya.

5) Distractor dan jawaban yang benar hendaknya tidak mempunyai perbedaan yang

mencolok baik isi maupun bentuk.

6) Jika option terdiri dari angka hendaknya diurutkan dari kecil ke besar, jika dari

peristiwa supaya kronologis.

7) Hindari kata yang mengandung kunci jawaban.

8) Tiap item hendaknya berdiri sendiri.

9) Stem dan option supaya diusahakan terletak pada halaman yang sama.

10) Jawaban yang benar janganlah tetap pada tempat yang sama tetapi berpindah-

pindah.

11) Jangan ditanyakan hal-hal yang tidak penting.

12) Item itu disusun dari yang mudah kemudian sukar.

13) Seluruhnya harus jelas, bagaimana menjawabnya dan di mana di jawab.

20
3. Matching Test

Matching item terdiri dari dua daftar (deretan) kata atau frasa dan suruhan

(perintah) bagaimana kedua daftar itu dijodohkan. Daftar pertama disebut Premise dan

daftar kedua disebut response. Bila jumlah premise dan response sama maka matching itu

disebut perfect, dan bila response lebih banyak dari premise, matching itu disebut

imperfect matching. Jenis yang pertama mempunyai keburukan yaitu ada kemungkinan

jawaban yang dijawab benar walaupun sebenarnya yang diuji tidak tahu, misalnya kalau

ada 5 pasang dan yang empat sudah tahu maka yang lain juga pasti benar. Contoh:

Match each word on the left with its opposite on the right. Write your answer in the blank!

1. glad a. mad 1. = ………

2. fat b. healthy 2. = ………

3. sick c. red 3. = ………

d. thin

e. sad

Saran-saran dalam menyusun matching item.

1) Usahakan supaya isi dari satu daftar premis maupun response sejenis.

2) Nyatakan dengan jelas atas dasar apakah premis dan response dijodohkan.

3) Urutkan premise dan response dengan urutan yang logis, kalau berhubungan dengan

waktu supaya kronologis, kalau angka mulai dari yang kecil ke besar atau diurutkan

menurut abjad.

4) Pakailah imperfect matching.

5) Usahakan agar daftar response pendek, supaya jangan membutuhkan waktu.

Hendaknya tidak melebihi dari dua belas.

4. Short Answer/Supply Type

Short answer type item ialah tes yang memerlukan jawaban yang singkat. Bentuk

ini dapat dibagi atas:

a. Short Answer.

Item ini suatu pertanyaan yang jawabannya pendek. Contoh:

What comes after Wednesday?

21
b. Listing

Item ini memerlukan jawaban satu deretan kata. Contoh:

Mention the five parts of the plant.

c. Completion

item ini meminta testee melengkapi kalimat yang belum lengkap. Contoh:

A man who leads a football match is called……

d. Analogy

Item ini memerlukan analogy dari testee untuk mendapatkan jawaban. Contoh:

man -------- house bird -------

good -------- bad long -------

e. Identification

Item ini meminta pengenalan dengan menyebutkan sesuatu yang berhubungan

dengan pokok persoalan. Contoh:

Mention the writer of each books below. Write your answer in the blanks.

1. Great Expectation ………………

2. Tom Sawyer ……………..

3. The Old man and the Sea ……………..

4. Robinson Cruesoe ……………..

f. Problem

Item ini meminta jawaban dengan perhitungan. Contoh:

A fruiter bought twenty eight apples one dollar each. Then he sold them 1.50

dollars each. How much benefit did he obtain?

Saran-saran dalam menyusun Supply Type Item.

1) Susunlah item itu sehingga hanya satu kemungkinan jawaban benar dan jawaban

itu pendek.

2) Usahakan supaya bagian yang kosong itu pada akhir kalimat.

3) Hindarkan kata-kata yang memberi kunci jawaban.

Keuntungan Supply Type Item.

1) Tidak ada unsur guessing.

2) Gampang disusun.

22
Kelemahan Supply Type Item.

1) Sukar di sekor kalau dibandingkan dengan objective item lainnya.

2) Hanya cocok untuk recalling item.

5. Arrangement/Rearrangement

Item ini meminta testee menyusun satu daftar kejadian, langkah, ukuran dsb yang

tak berurut menjadi berurut. Contoh:

Make this list of steps of evaluating in order.

1). Scoring a = ……

2) Planning b = ……

3) Interpreting the score c = ……

4) Constructing the test d = ……

5) Administering the test e = ……

6. Cloze Test

Tes ini adalah tes dimana para testee disuruh melengkapi kembali sebuah teks

yang sebagian kata-katanya sudah dihilangkan. Biasanya kata yang dihilangkan itu

adalah setiap kata kelima atau ketujuh. Penghilangan mulai dari baris kedua dan tidak

termasuk nama diri. Tes ini bisa mengukur kemampuan beberapa aspek seperti

Reading, Vocabulary, Listening, Writing, dan juga Structure. Kalau untuk Listening

teks diberikan dulu secara lisan baru kemudian diberikan teks yang sebagian kata-

katanya sudah dihilangkan. Bentuk variasi yang sedikit lain dari versi biasa, yaitu Maze

Test - - - penghilangan kata terdapat pada separuh kata bagian belakang dari setiap kata

kedua dalam teks itu. Variasi lain adalah versi Multiple-choice, artinya untuk setiap

kata yang kosong diberikan pilihan.

Contoh Maze Test:

Complete this text, by providing the missing letters.

When I we….. to Sentani t…. see m….. girl fri……, I go… an acci….t.

My motor…… collided wi…. a big tru…. at Kampung Harapan. I wa… thrown

sev… meters fr…. the ro…. I wa…. fain… for ha… an ho… I wa… taken t…

Sentani hosp…. When I wa… awa… and real…. what ha… happened, I than…

God ve… much, I go,,,, no inj…. and n… pain. Wasn’t i… a mira….

23
The complete text is this.

When I went to Sentani to see my girl friend, I got an accident. My

motorbike collided with a big truck at Kampung Harapan. I was thrown seven

meters from the road. I was fainted for half an hour. I was taken to Sentani

hospital. When I was aware and realized what had happened, I thanked God very

much, I got no injure and no pain. Wasn’t it a miracle???

B. Essay Test

Essay dan kebanyakan oral test termasuk dalam kelompok subjective test.

Pemberian nilai/skor pada tes ini subyektif, artinya penilaiannya gampang dipengaruhi

oleh faktor-faktor lain di luar dari jawaban seperti tulisan, bahasa, cara menjawab,

organisasi jawaban, keadaan pemeriksa (capek, susah, marah, gembira), urutan

pemeriksaan, dll. Kalau essay dijawab dengan tertulis, sedangkan oral test dengan lisan.

Essay test meminta jawaban yang disusun oleh yang diuji dalam satu atau lebih

kalimat. Jawaban memerlukan penguraian atau penjelasan dan pengorganisasian. Tes

ini baik digunakan untuk mengukur kemampuan mengorganisir pengetahuan yang

mereka miliki, dan tes ini jug dapat diukur untuk mengetahui interest dan attitude

siswa. Berdasarkan jawaban yang diminta essay dapat dibagi dua, Extended Response

dan Restricted Response.

Pada Extended Response, testee lebih bebas memberikan jawaban menyangkut

pendapat, kreativitas, dan pengalaman lalu diorganisir dan ditulis. Contoh dari tes ini

ialah mengarang atau menulis makalah (paper).

Pada Restricted Response, jawaban dibatasi atau diarahkan kepada suatu hal yang

sempit. Testee diminta mengingat kembali jawabannya atau memberi jawaban lalu

mengorganisir dan menulisnya. Jawaban mungkin satu kalimat atau mungkin juga satu

paragraph. Contoh pertanyaan:

Apakah sebab-sebab terjadinya perang Diponegoro?

Kata-kata yang dipakai dalam suruhan essay test ialah:

1) Tulislah sebuah karangan dengan judul ……..

2) Jelaskanlah …………..

3) Uraikanlah …… dll

24
Saran-saran untuk memperbaiki cara pemberian skor essay item.

a) Dengan Analytical Method

1) Tulislah jawaban item itu dengan sempurna.


2) Tentukan skor jawaban itu, dan tentukan bagian-bagian jawaban itu.
3) Tentukan skor bagian-bagiannya.
4) Bacalah jawaban siswa item per item dan beri skornya dengan kebenaran
jawabannya.

b) Dengan cara Rating Method

1) Tulislah jawaban item itu


2) Jawaban tidak dianalisis, karena penekan keutuhannya.
3) Bacalah pekerjaan siswa setiap item.
4) Dengan dasar jawaban siswa itu tentukanlah kategori penilaian seperti:
poor, average, good, dan very good.
5) Kemudian baca dua kali dan tentukan masuk kategori mana.
6) Baca ketiga kalinya dan kalau rasanya belum adil bandingkan dengan
pekerjaan siswa yang lain, dan cocokkan kembali.

Hal lain yang baik diikuti adalah:

1) Hilangkanlah nama siswa pada waktu memeriksa kertas pekerjaan siswa atau pakai
saja nomor sebagai pengganti nama.
2) Jika cara penulisan, bahasa dan gaya bahasa dinilai juga, hendaklah dipisahkan dari
penilaian isi jawaban.
3) Jika hasil tes ini sangat penting, sebaiknya pekerjaan siswa diperiksa oleh dua orang.

Keuntungan Essay Test.

1) Mudah disusun.
2) Mengutamakan kebulatan pokok bahasan.
3) Baik untuk mengukur kemampuan tujuan yang penting/sukar.

Kelemahan Essay Test.

1) Pemberian skor kurang reliable.


2) Item yang diberikan sangat terbatas, sehingga tidak mungkin mencakup tujuan yang
banyak dan luas.

Perbandingan antar Essay dan Objective Test.

Essay Test Objective Test


1. Mudah disusun 1. Sukar disusun
2. Sampel sangat terbatas 2. Sampel cukup
3. Biasanya dipakai untuk mengukur 3. Biasanya mengukur comprehension
kemampuan menguraikan, dan pengetahuan
menjelaskan, dsb.
4. Penekanan pada unit yang besar 4. Penekanan pada fakta
5. Siswa menciptakan/menyusun jawaban 5. Siswa memilih jawaban
6. Kemungkinan menerka sedikit 6. Kemungkinan menerka besar
7. Sukar disekor, memakan waktu, kurang 7. Gampang diskor, cepat dan banyak,
reliable dan tinggi reliable.

25
VI. TESTING LISTENING COMPREHENSION

Listening comprehension tes dipakai untuk mengukur kemampuan seseorang

menangkap isi dari kalimat, paragraf, atau teks yang diberikan secara lisan. Selain mentes

dengan listening comprehension ada juga tes membedakan bunyi (sound discrimination

test), karena pengenalan bunyi juga memegang peranan yang penting dalam menangkap ari

suatu ucapan.

A. Sound Discrimination

1. The same or different

Penguji mengucapkan dua kata yang sama atau hampir sama bunyinya dan testee

diminta menjawab apakah kedua kata itu mempunyai bunyi yang sama atau berbeda.

Contoh: Cross S if they are the same and cross D if they are different!

cot caught S----- D

ship sheep S----- D

2. Picture

Penguji menunjukkan dua gambar dan mengucapkan sebuah kalimat atau kata yang

sebagai ari dari salah satu gambar itu. Testee disuruh memilih gambar mana yang

merupakan si dari kalimat itu. Contoh:

Cross A if the sentence means A, and B if it means B!

(show a picture pf a pin and a picture of a pen)

Penguji mengucapkan : “This is a pin.”

B. Listening Comprehension Items

1. Direction Requiring Action Response

Penguji memberi perintah dan testee melaksanakan perintah itu. Contoh:

“Go out and close the door behind you.”

2. Oral Simple Question followed by alternative answers

Contoh: Where is my pen?


a. yesterday
b. good
c. red
d. there

3. Paraphrasing Oral Statements

26
Kalimat pernyataan diucapkan oleh penguji dan testee memilih options yang sama

artinya dengan kalimat pernyataan yang didengarnya itu. Contoh:

Choose the sentence that has the same meaning as the given sentence!

John dropped a letter in the mail box.

a. John sent the letter


b. John opened the letter
c. John lost the letter
d. John destroyed the letter

4. Dialogues

Kepada testee diperdengarkan percakapan antara dua orang kemudian disusul

pertanyaan dari orang ketiga. Testee disuruh memilih jawaban tertulis sebagai jawab

pertanyaan orang ketiga itu. Contoh:

I. Hello, Mary, this is Mr. Smith at the office. Is Bill feeling better today?

II. Oh, yes, Mr. Smith. He’s feeling much better now. But the doctor says he’ll

have to stay in bed until Monday.

III. Where is Bill now?

a. at the office
b. on this way to work
c. home in bed
d. away on vacation

5. Lecture

Tes ini cocol untuk advanced students. Kepada testee diperdengarkan lecture

(ceramah), kemudian diikuti oleh pertanyaan penulis dalam bentuk multiple choice

item. Untuk immature students, baiklah diberikan teks pendek yang terdiri dari satu

atau dua paragraph. Contoh:

Harrison’s Department Store in the Northside Shopping Center


invites you to a winter clearance sale. Check these bargain price:
men’s suits regularly one-hundred eighty dollars, now only one-fifty;
sportcoats regularly one-twenty, nom just eighty dollars. And to along
with these suits and sportcoats, you’ll finddress slacks, long sleeved
sport shirts and ties, all sizes, at low prices.
In the ladies department, better dresses have been added, and the
selection in sizes eight through sixteen is outstanding.
This greatest clearance sale that Harrison’s has ever had.
Thousand of items of winter clothing are on sale.
Shop Harrison’s in the northside Shopping Center and Save.
Open until six Tuesday, Wednesday, and Thursday. Open until nine
Mondays, Fridays, and Saturdays. Closed all day on Sunday.
Come to Harrison’s winter clearance sale today. Bank American
card and Master card welcomed.

27
Pertanyaan:

1. When is the store closed on Monday

2. How much is the sale price of the one-hundred dollar men’s suit

Alternatif:

1. a. all day c. at six o’clock

b. at nine o’clock d. at noon

2. a. $60 b. $120

c. $80 d. $450

Dalam menyusun tes listening dalam bentuk dialogues atau lectures, pertama

susunlah tes itu seperti menyusun tes reading, artinya, susun dulu text, petunjuk,

item (stem dan pilihan), dan lembar jawaban. Kemudian baca dan rekamlah petunjuk

(instruction), text, dan pertanyaan (atau seseorang membaca lalau merekamnya).

Pisahkan lembar pilihan yang akan dibagikan kepada peserta selain dari lembar

jawaban. Jadi pada waktu ujian penguji memperdengarkan rekaman dan peserta

melihat lembar pilihan dan menjawabnya dalam lembar jawaban.

6. Cloze Test

Pertama siswa mendengarkan teks yang dibacakan sekali atau dua kali kemudian

kepada mereka diberikan teks tadi yang sudah diambil satu kata setiap baris untuk

dilengkapi kembali. Contoh:

Teks lengkap:

I have just received a letter from my brother, Tim. He is in Australia.


He has been there for six months. Tim is an engineer. He is working
for a big firm and he has already visited a great number of different
places in Australia. He has just bought an Australian car and has gone
to Alice Springs, a small town in the center of Australia. He will soon
visit Darwin. From there, he will fly to Perth. My brother has never
been abroad before, so he is finding this trip very exciting.

Sesudah dibuang beberapa kata:

I have just . . . . . a letter from my brother, Tim. He is in Australia. He


has been there for six . . . . . . Tim is an engineer. He is working for a
big . . . . . and he has already visited a great number of different . . . . .
in Australia. He has just bought an Australian car and has gone to
Alice Spring, a . . . . . . town in the center of Australia. He will soon
visit . . . . . . From there, he will fly to Perth. My brother has never
been . . . . . before, so he is finding this trip very . . . . . . .

28
7. Dictation

Pada tes ini siswa diminta menulis semua apa yang diucapkan oleh penguji,

Walaupun tes ini kelihatannya sederhana, ternyata tes ini sukar juga, karena orang

bisa menulis benar kalau dia mengerti makna dan struktur bahasa lisan itu. Dictation

termasuk satu tes bahasa yang dapat mewakili semua unsur dan keterampilan,

walaupun disini yang diuji tidak expressive. Korelasi hasil tes yang lengkap dengan

hasil tes dictation amat tinggi.

8. Selecting the Picture According to Recording.

Pada tes ini testee dihadapan kepada beberapa gambar, dan dia harus memilih

gamabar mana yang sesuai dengan recording yang diperdengarkan.

29
VII. TESTING SPEAKING/PRONUNCIATION

Tes speaking berarti mengukur kemampuan testee memakai bahas itu secara lisan, berarti

mengeluarkan pendapat, perasaan, keinginan, bercerita, atau menjawab pertanyaan. Dalam tes

speaking kita mengukur kemampuan seseorang berbicara dalam bahasa asing tertentu dengan

memperhatikan fluency, pronunciation, grammar/structure, dan vocabulary. Dapat juga

dilihat ketepatan bahasa itu dalam situasinya (sosiolinguistically) atau ‘baiknya’. Dalam

istilah bahasa Indonesia disebut ‘baik dan benar.’ Dalam testing pronunciation kita menyuruh

yang diuji berbicara tetapi yang diukur adalah ucapan atau lafalnya saja, bunyi segmentalnya

dan suprasegmentalnya.

Techiniques of eliciting testee’s speaking

1. Scored Interview

Pada scored interview testee diinterview satu persatu. Sesudah selesai langsung diberi

skor. Karena dalam speaking yang kita perhatikan keempat unsur di atas maka dalam

pemberian skor juga diberikan kepada fluency, pronunciation, grammar, dan vocabulary.

Untuk pemberian skor perlu diberi descriptor untuk tiap aspek, misalnya:

a. Untuk Pronunciation

1) jika tanpa kesalahan/sedikit sekali 4


2) walaupun salah tidak membuat salah pengertian 3
3) kesalahan-kesalahan membuat salah pengertian 2
4) sukar sekali tak dapat dimengerti 1

b. Untuk Fluency

1) selancar bahasa sendiri 4


2) sekali-sekali berhenti untuk mencari kata/menyusun kalimat 3
3) sering berhenti 2
4) tidak bersambung/selalu ragu-ragu 1

c. Untuk Grammar

1) tidak ada kesalahan 4


2) kadang-kadang membuat kesalahan 3
3) sering membuat kesalahan 2
4) banyak sekali kesalahan 1

d. Untuk Vocabulary

1) tidak ada kesalahan 4


2) kadang-kadang memakai kata yang tidak tepat 3
3) sering memakai kata yang salah 2
4) sering sekali memakai kata yang tidak tepat 1

30
Saran-saran untuk melaksanakan scored interview

i) Persiapkan semua pertanyaan secara tertulis


ii) Mulailah dengan social question seperti “how are you” “where do you live?”
“where do you come from?”
iii) Mulailah dengan kecepatan berbicara yang normal. Jika testee mendapat
kesulitan dapat diperlambat.
iv) Laksanakan interview dengan ramah dan menyenangkan walaupun banyak
pertanyaan yang tdak dapat terjawab dengan memuaskan dan akhirilah degan
baik, artinya jangan tiba-tiba diakhiri
v) berilah scorenya langsung sesudah selesai. Kalau interview itu direkan boleh
juga kemudian. Cara belakangan ini lebih baik dengan pengertian obyektif.

2. Response to Pictorial Stimuli (Menceritakan Isi Gambar)

Testee disuruh mengamati gambar atau seri gambar dan kemudian testee disuruh

menceritakan isi gambar itu, latar depan maupun latar belakang, dan apa yang terlihat

dalam gambar itu, Kalau perlu tester bisa menanyakan hal-hal tertentu, supaya berjalan

lancar. Pemberian skor juga berdasarkan kemampuan dalam fluency, pronunciation,

grammar, dan vocabulary.

3. Oral Report

Pada oral report yang diuji mempersiapkan suatu laporan dan disajikan secara lisan, yna

giuji meaporkan secara lisan antara 5 sampai 10 menit, tetapi bukan membaca laporan.

Yang diuji bisa mempunyai catatan yang sesekali dia bisa lihat. Dia juga bisa memakai

gambar-gambar atau OHP. Sesudah selesai penguji dapat memberikan pertanyaan dan

penyaji menjawabnya (Finocchiaro, 1983). Skornya dilihat dari keempat komponen

tersebut diatas.

4. Role Play

Yang diuji diminta memainkan peran tertentu dalam satu dialog atau percakapan. Dialog

bisa antara penguji dan yang diuji, atau semua peran diberikan kepada yang diuji yang

terdiri atas dua atau tiga orang. Sebelum dialog atau percakapan dimulai kepada testee

dijelaskan lebih dahulu situasinya, sehingga percakapan dapat berjalan lancar. Di bawah

ini sebuah contoh penjelasan situasinya.

Student A:

You wish to buy a car. You are in a showroom, looking at a second-hand car that
might be suitable. You decide to find out more about it, for example how old it is,
who the previous owner was, how expensive it is to run and whether there is a
guarantee. You can pay up to about $900 in cash.

Student B:

31
You are a car salesman. You see a customer looking at a car in the showroom.
The car is two years old and belonged previously to the leader of local pop group.
it does about twenty miles to the gallon. Your firm offers a three-month guarantee
and can arrange hire purchase. The price you are asking for the car is $1,400
(Littlewood, 1988:56)

5. Discussion

Kegiatan ini hampir sama dengan interview, tetapi berbeda karena disini ditanyakan

pendapat, atau argumentasi dari yang diuji, mengapa dia atau seseorang bertindak sesuatu

atau bersikap sedemikian rupa. Dalam interview percakapan di bawah kontrol penguji

atau penginterview, sedangkan pada discussion atau conversation orang yang diuji berhak

juga menyetir atau mengalihkan arah pembicaraan sesuai dengan pikirannya. Pada diskusi

yang diuji sering juga diminta memecahkan suatu masalah. Selain diskusi bisa juga

dipakai debat, dimana dua pendapat yang berbeda dan saling mempertahankan atau

memberi alasan atas idenya dengan menunjukkan kebaikan dan kekurangan.

6. Telling a story or experience

Dalam kegiatan ini yang diuji diminta menceritakan pengalamannya yang dia bisa pilih

sendiri atau ditentukan oleh penguji. Selain menceritakan pengalaman, bisa juga

menceritakan suatu cerita.

7. Sentence Construction

Testee diminta mengucapkan kalimat/expression untuk situasi tertentu, misalnya:

“You are trying to find the post office in a strange city. Ask a policeman for directions.”

8. Sentence Conversion and Substitution

Testee diminta mengubah kalimat ke bentuk lain, seperti: dari positive ke negative atau

interrogative, dari active ke passive. Cara lain yaitu dengan menyuruh testee

menggantikan kata tertentu dalam satu kalimat dengan kata lain.

Contoh: “Substitute: My hobby is swimming, What is your hobby? Playing football.”

9. Translation

Testee disuruh menterjemahkan kalimat dalam bahasa sendiri ke dalam bahasa Inggris

dengan lisan. Contoh: terjemahkan kalimat ini ke dalam bahasa Inggris. “Kemarin kami

pergi ke pasar Hamadi dan beli lima ekor ikan.”

32
TESTING PRONUNCIATION

1. Reading Passage

Testee disuruh membaca teks dengan ekspresi yang tepat sesudah ia membaca teks itu

dalam hati. Yang dinilai terutama pronunciation dan fluency termasuk ketepatan

menggunakan pause (jedah).

2. Pronuncing certain sounds

Testee disuruh membaca/ucapkan kata tertentu yang mengandung bunyi yang tidak

terdapat dalam bahasa ibu, seperti “bag”, “shop”, “measure”, “usual”, “zoo”, “thin”,

“then”, “very”, “ferry”, “stand”, etc.

3. Minimal Pair

Item ini hanya bisa mengukur kemampuan pronunciation. Testee disuruh membaca dua

kata yang minimal pair yaitu yang berbeda ucapannya hanya satu bunyi (phoneme) seperti

“sheet” dan “shit”, atau “back” dan “bag”, atau “beg” dan “bag”.

4. Paper Pencil Test of Pronunciation

Karena sulitnya membri skor dan banyaknya waktu yang terpakai dalam oral test, maka

dipakai juga test tertulis untuk mengukur production, dengan asumsi bahwa apa yang

seseorang ucapkan dalam hati sama jika ia betul-betul ucapkan dengan keras. Di bawah

ini beberapa tes tertulis untuk kemampuan dalam pronunciation.

a) Rhyme Words/same sound

Testee disuruh memilih kata-kata yang sama bunyinya dengan kata yang ditentukan.

Contoh:

Could rhymes with:


a. blood c. flood
b. wood d. mud
Pay rhymes with
a. ballet c. said
b. mad d. red
So has the same pronunciation with:
a. saw c. sew
b. show d. shore
Th in think has the same sound as in:
a. this c. that
b. then d. thin

33
b) Word Stress

Testee diminta memilih suku kata yang mendapat tekanan utama dalam kata. Contoh:

frequently advantages advantageous


- - - - - - - - - - -
A B C A B CD AB C D

comfortable academic economic


- - - - - - - - - - - -
A BC D ABC D ABC D

stability stable
- -- - - -
ABCD A B

develop development developmental

history historical historic

c) Phrase Stress

Testee diminta memilih kata yang mendapat tekanan utama dalam suatu

phrase/kalimat. Contoh:

I need a map
A B C D

I need a road map


A B C D E

34
VIII. TESTING READING COMPREHENSION

Reading comprehension text dipakai untuk mengukur kemampuan seseorang untuk

menangkap isi bacaan yang dibacanya. Caranya yaitu menyuruh testee membaca text dan

kemudian menjawab pertanyaan-pertanyaan yang disediakan. Teks yang dipilih hendaknya

sesuai dengan tingkat kemampuan yang diuji, baik dalam kosa kata maupun strukturnya,

pendek saja dan isinya berbeda-beda (jika lebih dari satu teks), misalnya yang pertama

mengenai sejarah, yang kedua mengenai binatang, yang ketiga mengenai dongeng, dan

keempat mengenai kejadian-kejadian yang sebenarnya. Panjang teks itu antara 100 sampai

dengan 250 kata diikuti oleh 5 atau 7 pertanyaan. Teks itu hendaknya teks yang belum

pernah dibaca (unseen passagges). Jadi dalam memilih teks, jangan pilih bacaan dari buku

bacaan yang dipakai belajar, tetapi tingkat kesukarannya harus sama.

C. Hal-hal yang ditanya

7. Central/Main Idea

Pertanyaan ini menanyakan pokok pikiran dalam bacaan itu.

Contoh: What is the text about?

Say the statement of the main idea of the passage.

8. Supporting Ideas

Pertanyaan-pertanyaan itu menanyakan hal-hal yang mendukung pokok pikiran seperti:

contoh-contoh, alasan-alasan, atau argumentasi, perbandingan, kontras, sebab-akibat,

dll

Contoh: What are the writer’s reasons to say that . . .

9. Factual Questions

Pertanyaan ini menanyakan fakta-fakta yang jelas dalam teks. Inilah pertanyaan yang

paling mudah. Pertanyaan ini biasanya dimulai dengan what, who, when, where, dsb.

contoh: What did the thief steal from the shop?

10. Summary of the Paragraph or Text

Pertanyaan ini menanyakan ringkasan dari satu paragraph atau teks.

Contoh: Give the summary of paragraph 1 in one sentence.

11. Understanding of the Structure/Vocabulary

35
Pertanyaan ini menanyakan pengertian akan kalimat/phrase dalam susunan tertentu dan

pengertian akan kata/idiom dalam hubungannya dengan teks.

Contoh 1: The meaning of the bill in the text is:

The bill will be ratified next month.

a. bird’s mouth

b. charge of payment

c. proposed law

Contoh 2: If he had studied hard, he would have passed the exam.

Did he pass the exam?

12. Organization

Pertanyaan ini menanyakan organisasi dari bacaan, bagian-bagiannya dan urutannya,

main idea, supporting ideas, conclusion, dll.

Contoh: organisasi dari bacaan diatas ialah:

a. introduction, statement of main idea, closing.

b. examples, conclusion, introduction.

c. introduction, reasons, content.

d. introduction, argument, conclusion.

13. Relation of Two Paragraphs

Ini menanyakan hubungan antara dua paragraph.

Contoh: What is the relation between the first and the last paragraph.

14. Key Word

Pertanyaan ini menanyakan kata yang merupakan kunci dari persoalan.

Contoh: Find a word in paragraph two which shows that the writer does not like the

subject.

15. To Give the Title of a Passage

Give the suitable title of the text.

16. Translation

Siswa disuruh menterjemahkan beberapa kalimat dari teks ke dalam bahasa mereka.

Contoh: Translate the first paragraph into Indonesian.

17. To Relate the daily life/surrounding and to evaluate certain measure, situations
or characters in the Passage

36
Contoh: Does the habits mentioned in the passage apply in your town?

18. Tone and Style

Baik juga menanyakan sikap pengarang dan tujuan pengarang dalam penulisannya

kalau hal itu jelas dalam bacaan. Disamping itu ditanyakan apakah pengarang memakai

susunan kalimat atau kata dan cara yang khusus untuk menyampaikan idenya.

Contoh: The tone of the passage above is:

a. persuasive
b. argumentative
c. serious
d. contemptuous

Instead of using straight forward way the writer many times uses:
a. irony
b. simile
c. metaphor
d. personification

19. Interpretation

Pertanyaan yang jawabannya tidak tersurat (explicit) tetapi tersirat (implicit).

20. Information Transfer

Kegiatan ini mengubah atau mentransfer informasi dari teks ke gambar atau diagram

atau sebaliknya dari gambar ke teks. Contoh:

I bought a new house at Jalan Sentani. The front wall of the house has a door

in the middle and two windows each at the right and at the left of the door.

The form of the window is triangular and that of the door is rectangular.

Please draw the picture of the front wall.

37
IX. TESTING WRITING

Dalam testing writing kita mengukur kemampuan seseorang dalam mengeluarkan

pendapat/idenya dalam tulisan. Untuk itu testee bisa disuruh:

1. Menulis apa yang terjadi pada sebuah gambar

2. Menulis satu ringkasan dari satu paragraph atau passage

3. Menulis satu atau lebih paragraph mengenai sesuatu dalam bentuk description, narration,

atau exposition

4. Menerjemahkan satu atau lebih paragraph dari bahasa sendiri ke bahasa asing (Inggris)

tertulis

5. Menulis surat

6. Menulis peristiwa, pengalaman (kecelakaan, kebakaran, bencana alam, dll), cerita

Cara lain mengukur kemampuan menulis dengan dictation dan cloze test. Pada kedua

tes ini kurang kelihatan ekspresi dari penulis, Tetapi dicatation dan cloze test bahkan dapat

dipakai mengukur kemampuan keseluruhan bahasa. Dari beberapa penelitian menunjukkan

bahwa kemampuan dalam dictation dan cloze test berkorelasi tinggi dengan kemampuan

keseluruhan bahasa.

7. Dictation

Types of dictation

a. Standard Dictation

In standar dictation the examinees are required to write verbal sequences of material

as spoken by an examiner or played back from recording.

b. Partial Dictation

In partial dictation the examinees are given a written of the text (along with the

spoken version) in which the written passage has certain portion left out. The

examinees must listen to the spoken material and fill in the blanks in the written

version.

c. Noise Dictation

During the dictation, noise is added to imitate a natural condition.

d. Dictation-composition (Dictocomp)

In this type of dictation, the examineeds are instructed to listen to a text one or more

times while it is presented either live on or tape at a conversational rate. Then they are

38
asked to write down from memory, as accurately as possible, what they have heard,

not just a summary of the main ideas or events.

e. Dictogloss/natural dictation

It is a dictation where the examiner reads a sentence once after which the examinees

are to jot down the main or key words they can recall, and then to reconstruct the

sentence in writing as accurately as they can.

f. Cloze dictation

It is similar to the standard cloze, i.e. the examinees are given a written version with

blanks and they are to fill thte blanks when they listen to the dictatd passage in its

cloze form.

g. Phonemic item dictation

This is a basic activity for beginners, In the phonemic item dictation the attention is

centred on the sound system. The items can be single sound, words, minimal pairs,

etc., but they must be written in phonemic symbols.

8. Cloze Test

Cloze test adalah melengkapi kembali sebuah teks yang sebagian kata-katanya

telah dihilangkan. Biasanya penghilangan kata itu pada setiap kata kelima atau ketujuh

kecuali kalimat pertama dan kata yang berupa nama, kata yang terdiri dari satu huruf tidak

dihitung.

Ada jenis lain yang disebut C-test yang penghilangan itu dilakukan setengah kata

di akhir pada setiap kata kedua (delete the second half of the second word starting with

the second sentence).

Jenis lain yang hampir sama dengan cloze test tetapi untuk kata yang akan diisi

ada pilihannya disebut maze test.

Hal-hal yang diskor dalam pemberian nilai dalam writing test adalah:

1. Content : ide yang diekspresikan


2. Form : organisasi dari content
3. Language : grammar, vocabulary, and spelling
4. Style : pemakaian kata/grammar
5. Mechanism : tanda-tanda baca

Apakah content itu sesuatu yang baru, kreatif, berguna, menarik, atau merupakan

analisis, membosankan, evaluative, atau sesuatu yang tak berguna. Bagaimana organisasi

tulisan itu, apa bagian-bagiannya dan urutannya, apakah ada introduction, main ideas,

39
supporting ideas, conclusion, apakah isinya sistematis, apakah cohesive dan coherent,

apakah memakai transition words, dll. Ketepatan pemakaian grammar, vocabulary, dan

spelling tentu saja sangat mempengaruhi mutu tulisan. Gaya (style) penulisan dan

pemakaian tanda-tanda baca juga mempengaruhi bagus tidaknya satu tulisan.

Style is the instrument and the writer’s choice of words and arrangement of words

into sentences. The writer’s style usually reveals among other things, his attitude toward

himself, toward his readers, toward his subject. The writer’s attitude are called tone. Most

discussions of style concentrate on what might be thought of as ornament: figurative

language (‘a sea of troubles’), inversion (‘a leader he is not’), repetition and parallelism

(‘governemnet of the people, by the people, for the people’), balance and antithesis (‘it

was the best of times, it was the worst of times’).

There are three level of style: formal, informal, popular or vulgar, Vulgar does not

mean dirty words; rather it refers to the speech characteristic of uneducated people,

speech that uses such expression as ‘ain’t, nohow, and he don’t). Formal writing found

mostly in scholarly articles, textbooks, ceremonial speechs, and scientific writing,

assumes an audience, not only generally well educated but also with special knowledge

of or interest in the writer’s subject. Informal style is usually used in daily conversation

(Barnet, 1908:391).

Selaindari itu, dengan menilai langsung karangan testee, kita bisa juga menilai

kemampuan mereka akan unsur-unsur seperti:

a) Sensitivity to grammatical patterns

Disini kita bkan mentes kemampuan dasar dalam grammar, tetapi grammar yang

biasanya langsung berhubungan dengan writing seperti:

i) substituting word

I have two brothers, Ali and Badu.


The . . . . . . is a doctor and the latter is a soldier.

I have three cars, but the . . . . . .you see here is the newest

The comparison of achievement between the SMP students in Arso


and . . . . . . in Abepura.

ii) parallelism

He wants to be rich and . . . . . .


a. saving c. save
b. safety d. safe

40
iii) Conjunction

I did not come to school yesterday . . . . . . I was sick.


a. although c. but
b. because d. therefore

iv) correlative conjunction

He not . . . . . . tortured the soldier but killed . . . . .


a. only – also c. only – as well
b. either – or d. both – and

b) Error Recognition

Yang diuji diminta mencari kesalahan dalam kalimat. Contoh:

The man who stole the money have been arrested by the police
A B C D

c) Sentence Correction

Disamping mencari kesalahan dalam kalimat, testee disuruh membetulkan kata yang

salah dalam kalimat. Contoh:

After he had broken the glass he hurries into the room and tool
all the valuable things.

d) Ability to organize

Testee diminta menyusun kalimat-kalimat atau beberapa paragraph yang belum

tersusun sehingga menjadi tersusun dengan baik. Contoh:

a. she was American c. there he met a foreigner


b. last week Mr. Kajo went to Bali d. she has been there for a
month

e) Mechanics of Writing

Yang dimaksud mechanics of writing adalah pemakaian tanda-tanda baca dan huruf

besar. Hal ini dapat di test dengan menyuruh melengkapi kalimat-kalimat atau

paragraph dengan tanda-tanda baca yang sengaja dihilangkan tanda-tanda bacanya

pada tempat-tempat tertentu. Contoh:

a. Supply the sentence with suitable punctuation marks.


b. Choose the suitable punctuation if necessary to complete the
sentence.

“Returning to his friend Peter (1) Bill (2) asked whether he still
wished to continue with the trip (3)”
1 2 3
A. A. A. 1=
B, B, B, 2=
C; C; C; 3=
D: D: D:

41
f) Memilih kata yang paling tepat

Dalam menulis penulis harus memakai kata yang paling tepat, sesuai dengan situasi

dan bidang yang dibicarakan. Jadi dalam tes writing siswa bisa diminta memilih kata

yang paling tepat.

Contoh:

He sent the letter to . . . . . . he loved so much.


a. who b. whom c. it d. whose

42
X. TESTING VOCABULARY

Testing Vocabulary adalah testing mengenai kata apa yang di uji kan. Untuk

achievement test kata yang dipilih untuk di test tidak sukar, karena kata-kata yang baru

diajarkan terbatas. Walaupun terbatas, tidak mungkin memasukkannya semua dalam test.

Pilihlah kata yang paling banyak frekuensi atau yang paling banyak digunakan/dipakai.

Untuk menentukan yang paling tinggi frekuensinya boleh dengan perasaan guru

sendiri, tetapi yang paling tepat dengan melihat word list dalam buku kalau ada, misalnya A

General Service List of English Word oleh Michael West. Untuk General Proficiency Test,

biasanya diambil dari word list dengan stratified sample. Kosa kata dapat diklasifikasik atas

dasar word classes: nouns, verbs, adjectives, adverbs, prepositions, conjunctions, articles,

interjections, pronouns, dan numerals. Dan dapat juga dikelompokkan menjadi yang

berhubungan dengan dunia binatang, tanaman/tumbuhan, bagian tubuh, perbuatan, perasaan,

mata pencaharian, makanan/minuman, perkakas, obat, masakan, warna, bentuk, bilangan,

linguistic, geografi, sejarah, hukum, matematika, olah raga, music, bangunan, ukuran,

keadaan, dan lain-lain.

Kalau tes kosa kata untuk jabatan/tugas tertentu, tentukanlah hal-hal yang

berhubungan dengan pekerjaan itu, lalu tentukan kosa katanya. Misalnya kalau

mengevaluasi kosa kata untuk menjadi pemandu pariwisata (guides) maka tentukan dulu

hal-hal yang berhubungan dengan tugas itu seperti: transportasi, hotel, recreation places,

souvenir, dll. Kemudian carilah kosakata yang berhubungan dengan transportasi (bus, taxi,

plane, driver, rent, reserve, dll), recreation places (beach, hiking, festival, movies, zoo,

campus, dll), souvenir (T-shirt, carvings, bow and arrow) dst.

D. Kinds of Questions

21. Definition

a. True-False

T–F A man who sells apples, bananas, papayas and oranges is called a fruiter.

b. Multiple-Choice

A pen is something to . . . . . with


a. read c. write
b. eat d. play

43
c. Matching

Match each definition with the word it defines.

1. something to eat a. a commander


2. something to eat with b. a cake
3. a man who orders c. a teacher
d. a spoon
e. a pen

f. Supply Type

A person who controls plane flying is a . . . . . . .

A man who makes clothes for a man is a . . . . . . . . .

22. Opposite

a. True-False

T–F The opposite of glad is happy

b. Matching

Match each word with its opposite.

1. happy a. sad
2. high b. bad
3. ugly c. beautiful
4. mad d. low

c. The Supply Type

The opposite of long is . . . . . . .

23. Synonym

a. True False

T–F The synonym of happy is glad

b. Multiple-Choice

The synonym of happy is . . . . . . .


a. mad
b. fat
c. sad
d. glad

c. Matching

Match the word in group A with their synonym in group B.


A B
1. happy a. small
2. mad b. healthy
3. big c. crazy
d. large
e. glad

44
d. Supply Type

The synonym of very big is . . . . . . .

24. Sentence Completion and Meaning in Context

a. Multiple Choice

. . . . . . . . . . he is sick, he comes to school.


a) therefore
b) but
c) when
d) although

Word in context.

The Indonesian word for bank in : He is standing on the bank of the river.
a) tepi
b) gedung
c) tengah
d) uang

b. Supply Type

I have eyes to see and . . . . . to hear.

25. Picture

(Draw a picture of a ship)

a. True – False

T–F This is a sheep

b. Multiple-Choice

What is the man doing?


a) he is walking
b) he is running
c) he is dancing
d) he is listening to the radio

c. Supply Test

This is a . . . . . . . . . . .

26. Multiple Context

In this kind of question the testees are asked the meaning of a word after using it in

several contexts. For instance, to ask the meaning of ‘grieved’.

Our family is now grieved because of my grandmother just passed away


two days ago. Our neighbors are also grieved because their houses were
burned yesterday. The meaning of ‘grieved’ in the sentences above is . . . . .

a) mad b) sad c) bad

45
27. Translation

a. Word Idiom Translation

1) Multiple-Choice

He kicked the bucket last year. The meaning of ‘kicked the bucket’ is:
a) died b) got sick c) played football

2) Supply Type

The Indonesian word for run out in: we run out of food is . . . . .

b. Sentence/Paragraph Translation

Translate this sentence into Indonesian

The man who killed the thief has gone abroad.

Translation has been criticized as a technique of test. The criticisms are:

1. The ability to translate does not show the ability to use the language. Someone who is

skilled in translation, many times is bad in speaking, reading, listening, and writing.

2. One of the first objectives of foreign language learning is to free the learner from his

native language interference.

3. Evaluating translation is difficult; criteria of a good translation are still vague.

4. Many word do not have exact equivalents in another language

5. Translation is a complex process.

Menyusun Item Vocabulary

Dalam menguji vocabulary, pertama tentukan tujuan, kisi-kisi, tentukan kata yang

hendak diuji, baru susun soal. Untuk achievement test, sampel kata yang diuji tentu diambil dari

kurikulum/buku teks. Sampel ini dapat diambil dengan random, sistematik, atau purposeful.

Misalnya sesuai dengan kurikulum, vocabulary untuk SLTP 1000 kata, tetapi kita mengambil

sampel hanya 50 kata. Ambil kata 50 dari 1000 itu dengan cara tadi lalu susunlah item untuk tiap

kata itu. Misalkan dalam sampel itu ada kata: good, happy, bad, sick, pilot, ears, plane, rain,

river,etc. Pertama buatlah pertanyaan untuk ‘good’. Sebaiknya kata itu dimasukkan dalam

kalimat dengan konteks yang tepat. Ada bermacam-macam item untuk mengecek apakah siswa

mengerti kata itu.

Masukkan dalam kalimat:

Badu is good student. He always does his homework well.

46
1) cara pertama: tanyalah synonym atau opposite

The opposite of ‘good’ in the sentence is:


a) sick b) healthy c) bad

2) cara kedua: dalam konteks.

Badu always does his homework well and he likes to help other students.

Badu is a . . . . . . student.
a) lazy b) good c) tall

3) cara ketiga: definition

Untuk kata rain

The drops of water that fall from the sky is . . .


a) river b) rain c) snow

Untuk kata river

The water flowing from the mountain to the sea is called . . .


a) rain b) lake c) river

Untuk kata happy

Charles was very . . . . . to know that he passed the exam.


a) sad b) good c) happy

Untuk kata tiger

The tiger is an animal with . . . . .


a) four feet b) three feet c) two feet

Untuk kata pilot

The person who controls the plane flying is called . . . . .


a) a pilot b) a stewardess c) a doctor

Untuk kata ear

a) Supply Type

I have eyes to see and . . . . . . . . to hear.

b) Dengan multiple context seperti ‘grieved’ diatas.

47
XI. TESTING GRAMMATICAL/ STRUCTURE

Testing grammatical structure untuk mengukur kemampuan seseorang dalam

menyusun kata menjadi phrase/kalimat dan bagian kata menjadi kata. Problem dari

grammatical structure terletak pada perbedaan pattern antara bahasa ibu dan bahasa asing

yang dipelajari. Makin banyak perbedaan itu makin banyak problem. Dalam testing

grammatical structure kita mengutamakan pada perbedaan pola bahasa ibu dan bahasa

target.

Dalam tes ini mengukur kemampuan testee terhadap bentuk dan susunan atau

urutan kata atau frasa dalam kalimat yang dalam istilah linguistic disebut morphology

atau sintaksis (frasa, klausa, dan kalimat). Materi tes tergantung kepada jenis tes, apakah

achievement test, proficiency test, atau placement test, dll. Untuk achievement test materi

diambil dari kurikulum yang dipakai, untuk proficiency test tergantung pada tujuan, dan

kalau untuk placement test harus meliputi pengetahuan semua level yang ada.

E. Item Types

28. Multiple Choice

Mary . . . . . . . . . . . in New York since 1960.

29. Sentence-Alternatives-Multiple Choice.

a. Mary is living in New York since 1960.


b. Mary was living in New York since 1960.
c. Mary has lived in New York since 1960.
d. Mary lives in New York since 1960.

30. Sentence-Interpretation-Multiple Choice

If I had gone, he would not have got the accident.


a. He got an accident.
b. He did not go.
c. He did not get an accident.
d. He did not get an accident and go.
31. Scrambled-Sentence-Multiple Choice

a. He like not me does


b. He not like does me
c. He does not like me
d. He not does like me

32. True - False

e.g. He has done his homework last night (T – F).

33. Completion (Supply Type)

(Live). Mary . . . . . . . . . . . here since 1960.

48
Fill in with: in, on, at.
1. She is still . . . . . . . . . . . the office.
2. He came here . . . . . . . . . . . . December 25, 1960.

34. Showing Pictures

(Show a picture: a man hitting a car)

He is hit by the car.

35. Conversion

Change into negative.

He loves her badly.

36. Word Insertion (Supply Choice)

Often. I – come – to – school – late

A B C D

37. Translation

e.g. Translate into English.

Dia digigit anjing kemarin.

PETUNJUK TES

Petunjuk tes hendaknya singkat, jelas dan berisi keterangan tentang:

1. Tujuan tes

2. Waktu yang diberikan untuk mengerjakan tes

3. Bagaimana menjawab tes

4. Apakah tidak ada denda untuk guessing yang salah

5. Contoh cara menjawab, kalau testee belum biasa dengan cara yang

diberikan.

Contoh:

Tes ini untuk mengukur hasil belajar kamu selama bulan-bulan yang

lewat. Hasil tes ini akan banyak menentukan nilai semester ini dalam

raportmu. Tes ini terdiri dari 100 soal dan waktu yang diberikan 90

menit. Pilihlah jawaban yang terbaik untuk menjawab tiap soal dan

lingkarilah huruf jawaban itu pada answer sheet. Bila kamu tidak pasti

jawaban sesuatu soal, jangan dijawab, karena tiap kesalahan akan

didenda.

49
Contoh cara menjawab: Answer Sheet

1. My grandfather is . . . . . . . . . . . 1. a. b. c. d.

a. My mother’s mother

b. My uncle’s sister

c. My father’s father

d. My son’s mother

Jawaban yang benar adalah jawaban c, maka lingkarilah c, pada answer

sheet. Bila ada dua atau lebih types of item, perlu diberi petunjuk selain

dari petunjuk umum. Petunjuk khusus berisi keterangan cara atau dasar

menjawab pertanyaan.

50
XII. INTERPRETASI SKOR

Interpretasi artinya pengubahan atau konversi skor (skor mentah) menjadi nilai (grades)

atau skor tertentu. Skor mentah biasanya dinyatakan dengan angka yang menunjukkan

banyaknya jumlah yang benar jumlah poin yang benar. Sedangkan nilai (grades) dapat

dinyatakan dengan angka 0 – 10 seperti di SD, SLTP, dan SMU. Sedangkan angka 0- 100

dinyatakan dengan huruf seperti A, B, C, D, dan E atau juga dengan kata-kata seperti baik

sekali, baik, sedang, kurang, dll, yang kadang-kadang disebut juga dengan predikat atau

academic standing. Untuk menginterpretasikan skor menjadi nilai boleh dipakai Criterion

Reference (penilaian acuan patokan = PAP) atau Norm Reference (penilaian acuan norma

= PAN).

A. Criterion Reference

Nilai yang didapat dengan cara ini disebut nilai mutlak. Nilai mutlak ini

diperoleh berdasarkan presentase dari jawaban yang benar atau presentase dari tujuan

yang dapat dilaksanakan dengan baik. Biasanya ditentukan dulu penguasaan serendah-

rendahnya yang dianggap memenuhi syarat (lulus).

Kedudukan seseorang dan kedudukan skor-skor siswa yang lain tidak

dipertimbangkan. Contoh: seorang anak dapat menjawab 52 pertanyaan dengan benar

dari 80 item, ini berarti persentase penguasaan adalah 52/80 x 100 = 65%; maka

nilainya menjadi:

x 100 = 6,5 (untuk skala 0 – 10) atau

x 100 = 65 (untuk skala 0 – 100)

Untuk nilai di perguruan tinggi di Indonesia nilai akan menjadi C atau 2, karena skor

60 – 69 masuk kategori C (2).

B. Norm Reference

Adapun beberapa nilai atau skor yang memakai perhitungan kedudukan skor

seseorang dalam kelompok untuk menentukan nilai yaitu:

a. C Score
b. Standard Nine
c. Z Score
d. T Score
e. A G T C Score
f. CEEBT Score
g. Percentile
h. Norma berdasarkan 0 - 4
i. Ranking

51
Dalam mengelola skor mentah menjadi skor diatas, kebanyakan dengan

perhitungan statistic. Kita harus membuat distribusi frekuensi, menghitung standar

deviasi lalu memakai rumus masing-masing atau mengkonversikannya ke skala yang

dimaksud. Nilai yang didapat dengan cara ini bukan berdasarkan persentase jawaban

yang benar, tetapi berdasarkan skor seseorang dibandingkan skor-skor lain.

Nilai ini disebut nilai relative. Nilai ini tidak menunjukkan penguasaan bahan atau

tercapainya tujuan. Untuk mendapatkan mean dan standar deviasi kita harus membuat

distribusi frekuensi berkelompok lebih dahulu kalau jumlah siswanya banyak. Kalau

jumlah siswanya sedikit tidak perlu membuat distribusi frekuensi tunggal. Cara yang

singkat dan gampang ialah dengan memakai kalkulator ilmiah (scientific calculator)

dengan memasukkan datanya satu persatu lalu tekan saja lambing yang menunjukkan

mean dan SD. Berikut ini cara untuk mendapatkan SD dan mean dengan memakai

distribusi frekuensi tunggal terutama untuk data yang siswanya tidak banyak, misalnya

10 orang sbb: 75, 70, 65, 69, 71, 68, 69, 74, 70, 72

Mendapatkan mean adalah jumlah semua skor dibagi jumlah peserta atau dengan

rumus:

MEAN =

Jumlah kesepuluh angka tersebut adalah 703, jadi meannya adalah:

MEAN = = 70,3

Mencari SD:

( )
SD =


SD =

SD = 2,76

Untuk data yang pesertanya banyak dipakai distribusi frekuensi berkelompok.

Langkah-langkah yang kita ikuti adalah sebagai berikut:

1. Carilah nilai yang tertinggi dan terendah

Hitung range dengan mengurangi nilai tertinggi dengan nilai terendah

2. Tentukan interval: 3, 5, 7, dan seterusnya, untuk mendapatkan skor grup (klas

interval) yang tidak terlalu banyak, kira-kira sekitar 10.

52
3. Susunlah score group.

4. Tally banyaknya skor yang masuk ke dalam setiap score group

5. Hitunglah jumlah tally itu dan tulislah pada daftar di bawah f (frekuensi)

6. Tentukan assumed mean (mean dugaan) yaitu midpoint (titik tengah) dari score

group yang mempunyai frekunsi yang tinggi.

7. Tulislah angka deviasi nilai mulai: 1, +2, +3, dst di atas mean dugaan, angka 0

(nol) tepat pada mean duga dan di bawahnya -1 dst.

8. Kalikanlah deviasi dengan f untuk mendapatkan fx pada daftar.

9. Kalikanlah deviasi dengan fx untuk mendapatkan fx2

10. Hitunglah fx dan jumlah fx2

Salah satu cara mencari mean untuk data berinterval dipakai rumus:

( )
Mean =

Dimana: M = mean
AM = mean dugaan (assumed mean)
i = interval
Efx = jumlah fx
N = jumlah pengikut

Untuk mencari SD untuk data berkelompok dipakai rumus:

SD = −

dimana: SD = standar deviasi


= jumlah fx
Σf = jumlah f
N = jumlah pengikut

Contoh: skor mentah dari suatu tes bahasa Inggris yang diikuti 40 peserta adalah

57 36 4 30 54 31 15 22
52 39 47 31 48 32 16 23
40 32 43 25 35 25 16 10
40 26 35 26 33 27 6 11
27 27 28 29 20 20 21 14

Penyelesaiannya:

1. skor tertinggi adalah 57

skor terendah 4

range 53

2. kita pilih interval 5, sehingga score group menjadi 11 diperoleh dari +1

53
3. susunlah score group

4. tally semua score

5. tulislah jumlah tally (dibawah kolom f)

6. assumed mean adalah pertengahan dari 23 – 27 yaitu 25 karena score group inilah

memiliki frekuensi tertinggi

7. tulislah 0 dibawah kolom x lurus pada score group 23 – 27 dan diatasnya +1, +2,

+3, dst dan di bawah -1, -2, -3, dst

8. kalikanlah x dengan f yaitu 2 x 6 = 12 dst. ditulis di bawah kolom fx

9. kalikanlah x dengan fx dan hasilnya ditulis di bawah f , 6 x 12 = 72

10. hitunglah jumlah fx ( ) dan jumlah f (Σf ), yaitu 28 dan 274

11. hitunglah mean dengan rumus mean dan SD dengan rumus SD

Score group Tally Frekuensi Deviation


x fx f
53 - 57 II 2 6 12 72
48 - 52 II 2 5 10 50
43 – 47 II 2 4 8 32
38 – 42 III 3 3 9 27
33 – 37 IIII 4 2 8 16
28 – 32 IIIIIII 7 1 7 7
23 – 27 IIIIIIII 8 0 - -
18 – 22 IIII 4 -1 -4 4
13 – 17 IIII 4 -2 -8 16
8 – 12 II 2 -3 -6 18
3–7 II 2 -4 -8 32
N=40 fx=28 Σf =274

M = 25 + 5 ( ) = 25 + 3,5 = 28,5

SD = − =5 − = 5 6,85 − 0,49 = 5 6,35 = 5 x 2,52 = 12,6

Cara lain untuk menghitung SD untuk data berkelompok adalah dengan rumus sbb:

( )
SD =

dimana: N = jumlah peserta


f = frekuensi
x = nilai tengah (mid point)
Σf = sigma frekuensi kali nilai tengah kuadrat
Σfx = sigma frekuensi kali nilai tengah

54
1) C Score

Unit sigma yang dipakai score ini ialah :

-2.25, -1.75, -1.25,-0.75, -0.25, 0.25, 0.75, 1.25, 1.75, 2.25


1 2 3 4 5 6 7 8 9 10

Skala yang dipakai yaitu dari 0 – 10. Untuk mengubah raw score menjadi C-score

kita harus menghitung score mana yang untuk 10, mana untuk 9, dst. Caranya

sebagai berikut:

Untuk nilai Mulai dari


10 2.5 x 12.6 (SD) + 28.5 (M) = 56.65
9 1.75 x 12.6 (SD) + 28.5 (M) = 50.35
8 1.25 x 12.6 (SD) + 28.5 (M) = 44.05
7 0.75 x 12.6 (SD) + 28.5 (M) = 37.75
6 0.25 x 12.6 (SD) + 28.5 (M) = 31.45
5 -0.25 x 12.6 (SD) + 28.5 (M) = 25.25
4 -0.75 x 12.6 (SD) + 28.5 (M) = 18.85
3 -1.25 x 12.6 (SD) + 28.5 (M) = 12.55
2 -1.75 x 12.6 (SD) + 28.5 (M) = 6.25
1 -2.25 x 12.6 (SD) + 28.5 (M) = - 0.05

Jadi score yang 57 dari test di depan mendapat nilai 10, yang skor 4 mendapat

nilai 1, yang 15 mendapat nilai 3.

Cara lain untuk mendapatkan nilai dalam C-score ialah dengan mencari langsung

Z-score dari masing-masing siswa. Sesudah diperoleh Z-score cocokkan dengan

table C-score, misalnya kalau Z-score dari seorang siswa 1.6 maka nilai dalam C-

score ialah 8 yaitu 1.25 – 1.75

2) Standard Nine (Stanine)

Stanine berskala dari 1 sampai 9, sebab itu disebut Standard Nine.

Populasinya sudah dibagi sebagai berikut:

4% yang mendapat 9
7% yang mendapat 8
12% yang mendapat 7
17% yang mendapat 6
20% yang mendapat 5
17% yang mendapat 4
12% yang mendapat 3
7% yang mendapat 2
4% yang mendapat 1

Kalau kita mengubah skor mental bahasa Inggris yang sudah disebu di

muka, maka yang mendapat 9 adalah 4% dari 40 = 1.16 digenapkan menjadi dua

orang, yaitu skor 53 dan 57. Sedangkan yang mendapat nilai 5 yaitu 20% dari 40 =

8 orang, yakni skor yang diperoleh peserta antara 23 dan 27.

55
3) Z-Score

Kedudukan skor dalam Z-score di antara -3 dan +3 Rumus untuk Z-score adalah:

Z=

Dimana: X = skor mentah


M = Mean skor mentah
SD = Standar Deviasi

Skor mentah dalam tes bahasa Inggris di muka yang skor mentahnya 40 menjadi

– .
Z= = 0.9
.

4) T-Score

Angka yang dipakai dalam T-score ialah 20 – 80 Rumus T-score adalah:

T = 50 + 10 x Z-score

Dimana: x = skor mentah


M = mean skor mentah
SD = standar deviasi/deviasi
50 = angka tetap sebagai mean T-score
10 = angka tetap sebagai SD T-score

Kalau dikehendaki skala 0 – 100 maka angka SD itu diubah menjadi 16.7

Kalau dihubungkan dengan Z-score rumus itu bisa juga:

50 + 10 x Z

Untuk yang skornya 40 pada skala 20 – 80 adalah:

( . )
50 + 10 = 50 + 9 = 59
.

Untuk skala 0 -100 menjadi 50 + 16.7 x (40-28.5)/12.6 = 65.2

5) CEEBT Score

CEEBT (College Entrance Examination Board Test) sama dengan GRE=Score

(Graduate Record Examination) yang dipakai oleh Educational Testing Service,

Princeton, New Jersey. CEEBT score memakai skala 200-800 denga rumus:

( – )
500 + 100

6) AGCT Score

(Army General Classification Test Score).

Skor ini berskala dari 40 – 160. Rumus AGCT-Score adalah:

( – )
100 + 20

56
7) Norma Skala 0 – 4

Dengan norma ini antara 0 – 4, yang mendapat

A 4 mulai dari M+1,5xSD

B 3 mulai dari M+0,5 xSD

C 2 mulai dari M+-0,5xSD

D 1 mulai dari M-1,5xSD

E 0 di bawah dari yang berhak 1.

Dari skor Bahasa Inggris di depan:

Yang berhak nilai 4 adalah 28,5+ 1,5x12,6 = 48

Yang berhak nilai 3 adalah 28,5+ 0,5x12,6 = 35

Yang berhak nilai 2 adalah 28,5+ -0,5x 12,6 = 21

Yang berhak nilai 1 adalah 28,5 + -1,5x12,6 = 9

Jadi peserta yang skor mentahnya 48, 52, 54, dan 57 mendapat nilai 4.

8) Percentile

Angka percentile seseorang menunjukkan jumlah persen dari pengikut yang

berada di bawah pengikut tersebut. Misalnya, percentile si A 75%, berarti pengikut

berada di bawah skor si A. Untuk menghitung percentile seseorang hanyalah

dengan menghitung berapa perserta tes itu yang berada di bawah skor orang

tersebut dibagi dengan jumlah peserta dikali 100. Jika ada beberapa peserta yang

menduduki skor yang sama, perhitungannya menjadi jumlah peserta yang berada

dibawah skor itu ditambaha dengan setengah kali jumlah peserta yang menduduki

skor yang sama dibagi dengan jumlah peserta dikali seratus.

Contoh:

Sepuluh orang peserta tes yang skornya adalah sbb: Abu 80, Bernard

75, Charles 70, David 70, Eka 65, Fince 60, George 60, Hadi 60, Iin

50, Jude 40. Percentile Abu adalah 9/10x100 = 90 (karena jumlah

peserta dibawahnya 9 orang), percentile Charles dan David sama

karena skor mereka sama-sama 70, sehingga hasilnya adalah

(6+1/2x2)/10x100 = 70 (karena jumlah peserta di bawahnya 6 dan

jumlah peserta yang menduduki 70 dua orang; sedangkan untuk Fince,

George, dan Hadi adalah (2+1/2x3)/10x100 = 35 (karena jumlah

57
peserta yang di bawahnya 2 dan peserta yang menduduki skor itu 3

orang.

Dibawah ini sebuah distribusi frekuensi yang datanya berkelompok dengan

frekuensi, beserta kumulatif frekuensi, dan percentilenya.

Score Group f Cumulative Percentile


Frequency
53 – 57 1 40 95(38/40x100)
48 – 52 2 38 92.5(36+1/2x2)/40x100
43 – 47 2 36
38 – 42 3 34
33 – 37 4 31
28 – 32 7 27
23 – 27 8 20 40(12+1/2x8)/40x100
18 – 22 4 12
13 – 17 4 8
8 – 12 2 4
3–7 2 2

Untuk mencari Percentile dipakai rumus:

/
Percentile = x 100

Dimana: F = Frekuensi dari score yang dicari


Cfb = Kumulatif Frekuensi dibawahnya
N = Banyaknya peserta

Percentile yang berskor mentah 23 -27 adalah


/
x 100 = 40

Percentile dari skor 23 – 27 adalah


/
x 100 = 92,5

.
Dalam Distribusi f tunggal Percentile = x 100
(kalau skor dimiliki seorang saja)

9) Stanel

Stanel menggunakan angka dari 0 sampai 10. Sistem ini hampir sama dengan

stanine karena juga menentukan persen banyaknya yang menduduki suatu angka.

Perbedaannya ialah bahwa stanel mempunyai jarak yang sama antara satu angka

dengan angka yang lain yaitu 0,5 SD. Jadi kedudukan angka terdiri dari -2,75

sampai 2,75.

Angka 0 1 2 3 4 5 6 7 8 9 10
% 1 2 5 13 18 22 18 13 5 2 1
Jarak -2,75 -2,20 -1,65 -1,10 -0,55 0 0,55 1,10 1,65 2,20 2,75

58
Mencari Rangking.

Di dalam raport sering dicantumkan rangking setiap murid untuk menentukan

kedudukan murid itu dalam kelasnya. Untuk mencari rangking adalah sbb:

1. Urutkanlah semua siswa dari nilai atau jumlah nilai yang tertinggi sampai yang

terendah.

2. Siswa yang tertinggi, jika dia sendiri yang tertinggi maka dialah rangkin I, jika

siswa nomor 1 dan 2 sama nilainya, maka merekalah menjadi rangking 1,5

3. Jika siswa nomor 5 hanya seorang, maka dia menjadi rangking 5. Tetapi bula sswa

no 5 sama dengan siswa no. 6 dan 7, maka rangking mereka menjadi:

=6

Kalau lebih dari satu orang pada satu skor/angka maka rangking adalah jumlah

urutan dibagi banyaknya urutan yang sama. Contoh:

NO NAMA SISWA JUMLAH NILAI RANGKING


1 Ali 80 1
2 Badu 75
3 Charles 75 2,5
4 Diduk 66 4
5 Dono 64
6 Endang 64 5,5
7 Emilia 60 7
8 Maria 55 8

59
XIII. ITEM ANALYSIS

Item analysis atau Analisis butir adalah kegiatan menganalisis item untuk melihat

apakah item-item itu baik atau jelek. Kegiatan ini diperlukan untuk mendapatkan item-

item yang baik seperti menyusun tes yang standar, untuk alat tes dalam penelitian, dan

untuk membuat bank soal. Tes ini diujicobakan dulu baru dianalisis. Item yang baik akan

dipakai, item yang jelek akan dibuang, kalau sedikit kurang baik bisa diperbaiki. Item yang

baik adalah item yang tidak terlalu sukar, tidak terlalu mudah, dapat membedakan

kelompok siswa yang pandai dan kelompok siswa yang tidak pandai (rendah), dan

mempunyai distraktor yang efektif.

Sesudah tes dicobakan atau dilaksanakan dan di skor, kita menganalisa item-item

itu untuk mengetahui:

a. taraf kesukaran item-item tes itu

b. daya pembeda item

c. keefektifan distraktor

1. Level of Difficulty (Taraf Kesukaran)

Taraf kesukaran adalah presentase dari pengikut yang menjawab item itu dengan

benar. Kalau presentase dari pengikut yang menjawab benar tinggi misalnya 80% atau

lebih maka item itu dianggap mudah, tetapi kalau hanya sedikit misalnya 20% atau

kurang maka item itu dianggap sukar. Untuk mempermudah analisa maka yang

diperhitungkan hanya sepertiga (1/3) dari skor yang tertinggi dan 1/3 dari yang paling

terendah. Sepertiga yang tinggi disebut Upper Group dan yang rendah disebut Lower

Group.

2. Langkah-langkah Mencari Tingkat Kesukaran

a. Aturlah semua ke atas dari skor yang tertinggi sampai ke yang terendah

b. Pilihlah sepertiga yang tertinggi dan sepertiga yang terendah. Kalau pengikut 30

orang berarti 10 orang tertinggi dan 10 orang terendah.

c. Hitunglah jumlah yang benar dari kelompok atas (Upper Group/UG) dan jumlah

yang benar kelompok bawah (Lower Group/LG) untuk tiap item test. Misalnya

untuk item No. 1 jumlah yang benar dari UG 6; jumlah yang benar dari LG 2.

Rumus yang dipakai mencari tingkat kesukaran adalah:

%
TK =

60
dimana: TK = tingkat kesukaran
UG = Upper Group
LG = Lower Group
T = Jumlah pengikut dari UG dan LG

Maka taraf kesukaran item itu adalah:


%
TK = = 40

Kategori tingkat kesukaran:

TK Kategori
≥ 95 Sangat mudah
≥ 80 − < 95 Mudah
≥ 20 − < 80 Sedang
≥ 5 − < 20 Sukar
<5 Sangat sukar

3. Discriminating Power (Daya Pembeda)

Daya pembeda ialah daya dari item itu yang membedakan siswa (pengikut) yang

berhasil baik dan yang kurang baik. Jika jumlah benar dari kelompok atas sama dengan

benar dari kelompok bawah maka item itu dianggap kurang baik karena tidak bisa

membedakan siswa yang baik dan yang kurang baik. Rumus untuk mencari daya

peembeda adalah:

D=
/

Dimana: D = daya pembeda


UG = jumlah jawaban yang benar dari upper group
LG = jumlah jawaban yang benar dari lower group
T = Jumlah pengikut dari UG dan LG

Kalau jumlah yang benar dari UG = 6 dan LG = 2, dan jumlah pengikut UG dan LG

adalah 20, maka:

D= = 0,40

Daya pembeda berkisar antara -1 dan +1. Item daya pembedanya negatif adalah item yang

jelek, sebab: item yang ber-DP = 0 – 0,20 kurang baik

item yang ber-DP = 0,21 – 0,40 memuaskan

item yang ber-DP = 0,41 keatas baik

61
4. Effectiveness of distracters (keefektifan distraktor)

Suatu distraktor dikatakan efektif bila pengikut yang memiliki distraktor itu

lebih banyak dari kelompok bawah dari pada kelompok atas. Contoh:

Option UG LG Difference Status


A 1 3 2 Efektif
B 3 2 -1 Tidak efektif
C 0 0 0 Tidak efektif
D 9 4 Tidak efektif

Steps of item analysis:

1) administer the test,

2) collect the answer sheet,

3) score the sheets,

4) arrange the names based on the scores form the highest to the lowest,

5) get 30% of the students from the highest (HG)

6) get 30% of the students from the lowest (LG)

7) set aside the middle group

8) use the UG and the LG for the analysis

9) compute the LD

10) compute the DP

11) examine the effectiveness of distracters,

12) decide the status of the items (good, revised, discarded)

The revised items can be administered again after being revised and analysed

again. Good items can be put in certain file called bank of items.

62
XIV. RELIABILITAS DAN VALIDITAS TES

Tes yang baik adalah tes yang reliable, valid, dan praktis. Reliabel berarti bahwa

tes itu konsisten (stabil), valid berarti tes itu tepat mengukur apa yang hendak diukur,

praktis berarti gampang diperoleh, gampang dilaksanakan, gampang diinterpretasi

hasilnya, dan tidak memerlukan biaya dan waktu yang besar/lama.

A. Reliabilitas

Suatu tes yang dilaksanakan pada hari ini kepada sejumlah siswa diharapkan

bahwa kalau tes ini diharapkan bahwa kalau tes ini dilaksanakan pada hari berikutnya

atau beberapa hari kemudian hasilnya tidak akan berubah drastis jika tes itu reliable. Jadi

konsep dasar dari reliabilitas tes ialah konsistensi hasil. Reliabilitas tes dapat

didefinisikan sebagai tingkat kekonsistensian dari tes bila dilaksanakan pada kondisi

yang serupa.

Cara Mendapatkan Reliabilitas

a) Tes Re-tes (Test-Retest)

Hal ini dilaksanakan dengan mengadakan tes dua kali kepada testee yang sama.

Untuk mendapatkan reliabilitasnya, dihitunglah koefisien korelasi antara hasil tes

pertama dan hasil tes kedua, angka itulah merupakan reliabilitas tes itu.

b) Paralel Tes (Parallel Test)

Untuk cara ini tes disusun dua tes yang hampir sama. Lalu kedua tes ini disuruh

kerjakan oleh sekelompok siswa. Untuk mendapatkan reliabilitasnya dihitunglah

koefisien korelasi antara hasil kedua tes itu.

c) Metode Internal (Internal Method)

Karena sering kali tidak disukai dilaksanakan dua kali tes atau mengerjakan dua

tes yang sama atau hampir sama, maka dicarilah cara yang lebih sederhana, yaitu

dengan mengerjakan tes yang tunggal pada suatu waktu saja. Dengan cara ini kita

dapat menghitung reliabilitas dari satu tes itu saja, dengan membagi tes itu menjadi

dua bagian (Split-half Method) atau dengan formula Kuder Richardson21.

63
Menghitung Reliabilitas

a. Perhitungan dengan Spearman Brown’s Formula (Gronlund, 1982:132)

Setelah diadakan tes dihitunglah skor siswa pada setengah tes, misalnya skor

pada nomor ganjil, dan skor pada setengah yang lain dan skor pada nomor genap.

Berikutnya dicarilah koefisien korelasi setengah tes. Berikutnya dicari koefisien

korelasi keseluruhan tes. Rumus untuk mencari korelasi adalah sebagai berikut:

– ( )( )
=
(( – ( )( ))(( –( )( ))

N = Jumlah Siswa

Σ = Sigma (Jumlah)

X = skor pada tes pertama

Y = skor pada tes kedua

Misalnya enam siswa mengerjakan sebuah tes. Kemudian skor mereka dibagi

yaitu skor pada nomor ganjil dan skor pada nomor genap. Skor mereka pada nomor

ganjil adalah 5, 6, 5, 7, 6, 7 dan pada nomor genap 6, 6, 7, 8, 7, 7. Carilah reliabilitas

tes. Karena dalam rumus ada sigma XY, sigma X kuadarat, sigma Y kuadrat, maka

harus dibuat seperti di bawah ini:

Perhitungan:

Skor I (X) Skor II (Y) XY X2 Y2

5 6 30 25 36

6 6 36 36 36

5 7 35 25 49

7 8 56 49 64

6 7 42 36 49

7 7 49 49 49

_____________________________________________________________

36 41 248 220 283

6(248) – (36)(41)
=
((6 220 – (36)(36))((6 283 – (41)(41))

64
12
=
4.9 4.1

= 0.597

Korelasi ini barulah korelasi separuh tes karena memakai split-half method.

Selanjutnya pakailah rumus di bawah ini untuk mencari reliabilitas keseluruhan tes.

( )
=
+

= ℎ ( )
1 = ℎ

2 0.597
=
1 + 0.597

= 0.747

b. Perhitungan dengan KR-21

Menghitung reliabilitas dengan cara ini dicari terlebih dahulu mean dan

standard deviasi skor, kemudian pakailah rumus ini:

( ( − )
− =( )( − )
− ( )

K = Jumlah Item
M = Mean
S = standard deviasi

Misalnya sekelompok siswa mengerjakan tes yang mempunyai 30 item. Mean


skor kelompok adalah 20, SDnya 5.

30 (20 (30 − 20)


KR − 21 = ( )(1 − )
30 − 1 (30 x 5x 5)

30
KR − 21 =( )(1 – 0.27)
29
30
KR − 21 = ( )(0.73)
29

KR − 21 = 0.76

65
c. Perhitungan Reliability dengan Kuder Richardson cara proporsi siswa yang
berhasil dan gagal (Lado, 1967:333).

Rumusnya adalah:


=( )

r11 = reliabilitas
n = banyaknya peserta
S = standard deviasi
Σpq = jumlah hasil kali proporsi yang berhasil dan proporsi yang gagal tiap item

Untuk mencari reliabilitas ini harus dicari SD skor dan sigma proporsi yang berhasil

dikali proporsi yang gagal, kemudian masukkan data ke dalam rumus ini.

d. Faktor-faktor yang mempengaruhi reliabilitas

Ada beberapa hal yang dapat mempengaruhi reliabilitas tes, yaitu:

1) Panjangnya tes, yaitu bahwa makin panjang suatu tes makin reliable.

2) Kehomogenan dari soal, makin homogeny soalnya semakin tinggi reliabilitasnya.

3) Daya beda soal, semakin tinggi daya bedanya semakin tinggi pula reliabilitasnya.

4) Variabilitas dari kemampuan pengikut tes, semakin bervariabel pengikutnya

semakin tinggi reliabilitasnya.

5) Cukupnya waktu yang diberikan kepada pengikut tes, semakin cukup waktu

semakin tinggi reliabilitasnya.

e. Cara meningkatkan Reliabilitas

1) increase the number of item

2) increase the number of choice

3) edit the items so as to make the choices more effective and thus reduce the factor of

guessing

B. Validitas

Validitas adalah sampai di mana suatu tes dapat mengukur apa yang hendak di

ukur. Suatu tes mungkin saja valid untuk tujuan tertentu tetapi tidak untuk tujuan yang

lain, ada tiga macam validitas, yaitu:

1) Content Validity (Validitas Isi)

Validitas ini menunjukkan sampai di mana suatu tes mewakili isi dari pokok

atau mata pelajaran. Jadi hal ini menyangkut apakah sampel itu sudah cukup

mewakili. Untuk tes pencapaian tentu dihubungkan dengan kurikulum dan silabus.

66
Cara untuk mendapatkan validitas isi yang tinggi:

a. Mempelajari tujuan yang dalam bentuk tingkah laku dan materi.

b. Membuat Kisi-kisi (table of specification).

c. Menyusun soal sesuai dengan kisi-kisi.

2) Criterion-Related Validity (Validitas Patokan)

Validitas ini dapat didefinisikan sebagai sampai dimana suatu tes

berkorelasi dengan suatu tes yang dianggap sudah menggambarkan kemampuan

seseorang. Atau dengan kata lain sampai dimana suatu tes dapat meramalkan

keberhasilan atau kemampuan dalam suatu hal. Validitas ini ada dua macam

yaitu concurrent validity dan predictive validity.

Concurrent Validity adalah tingkat korelasi antara hasil suatu tes dengan

hasil tes yang sudah baku yang dilaksanakan pada waktu bersamaan atau hampir

bersamaan.

Predictive Validity tingkat korelasi hasil suatu tes dengan hasil tes yang

dilaksanakan beberapa waktu kemudian. Dengan kata lain kemampuan prediksi

suatu tes dengan hasil tes kemudian. Validitas ini disebut juga empirical

validity.

3) Construct Validity (Validitas Konstruk)

Validitas ini adalah hubungan antara hasil tes dengan sifat-sifat psikologis

dari siswa seperti motivasi, harga diri, kekhawatiran dan lain-lain. Definisi lain

mengatakan hubungan antara hasil tes dan teori-teori yang ada. Jadi juga

dikatakan bahwa validitas ini adalah sampai dimana hasil suatu tes dapat

menjelaskan sifat psikologis testee. Dengan hasil suatu tes hendak disimpulkan

sifat-sifat atau kemampuan psikologis seperti kemampuan reasoning. Construct

validity mencoba menentukan faktor yang mempengaruhi hasil suatu tes dan

sampai dimana faktor itu mempengaruhi. Langkah-langkah yang diambil ialah:

a. Mengenal konstruk yang mungkin mempengaruhi tes itu.

b. Formulasikan testable hypothesis dari teori sekitar konstruk itu.

c. Kumpulkan data untuk mentes hypothesis.

67
4) Face Validity (Validitas Tampang)

Jenis validitas yang lain ada pula yang disebut face validity. Validitas ini melihat

mutu suatu tes hanya dari tampang, yaitu dari apa yang dilihat dari luar saja,

misalnya apakah tulisannya jelas, unsur-unsurnya lengkap (petunjuk, contoh, soal,

lembaran jawaban), dan bentuknya kelihatan teratur dan baik, tanpa membaca

isinya.

Faktor-faktor yang mempengaruhi validitas:

a. Perintah yang tidak jelas dalam tes sehingga mungkin siswa tahu jawabannya,

tetapi karena perintah yang tidak jelas siswa jadi salah mengerjakannya.

b. Kata atau kalmia dari soal yang sukar, sehingga para testee tidak mengerti.

c. Taraf kesukaran tes yang tidak sesuai.

d. Adanya unsur yang meragukan.

e. Tes yang tidak sesuai dengan maksud tes

f. Jumlah soal yang kurang memadai.

g. Susunan soal, Jika soal dimulai dari yang sukar lebih dahulu dalam waktu yang

relative singkat, mungkin saja siswa tidak sempat menyelesaikan soal yang

mudah di belakang.

h. Pola jawaban yang dapat diduga.

i. Pengawasan pelaksanaan tes yang kurang baik (cheating).

68
DAFTAR RUJUKAN
Anderson, O.W., Krathwohl, D.R. (eds.) (2001). A taxonomy for learning, teaching, and
assessing: a revision of Bloom’s taxonomy of educational objectives. New York: Addison
Wesley Longman, Inc.

Finocchiaro, M. (1983). Foreign language testing. New York: Regents Publishing Company.

Gronlund, N.E. (1977). Constructing achievement tests. New Jersey: Prentice Hall.

Harris, D. P. (1969). Testing English as a second language. New York: McGraw-Hill.

Harrow, A. J. (1972). A taxonomy of the psychomotor domain. New York: David McKay
Company.

Harrow, A. J. (1972). A taxonomy of the educational objectives. New York: David McKay
Company.

Heaton, J. B. Writing English language tests. Longman.

Krathwohl, D.R., Bloom, B.S., & Masia, B.B. (1973). Taxonomy of educational objectives: the
classification of educational goals. London: Longman Group LTD.

Lado, R. (1969). Language testing: the construction and use of foreign language test. London:
Longman.

Mackey, W.F. (1970). Measurement of language learning: language teaching analysis. London:
Indiana University Press.

Mager, R. (1984). Preparing instructional objectives. New York: Regents Publishing Company.

McNamara, T. (2000). Language testing. Oxford: Oxford University Press.

Phinit, V. (1990). Modern language testing. Belmont: Pitman Learning.

Saifuddin Azwar. (1986). Reliabilitas dan validitas. LIBERTY, YOGYAKARTA.

Anda mungkin juga menyukai