Anda di halaman 1dari 39

NAMA : MARTHEN STEVEN BOINSERA

NIM : 18506031
1. BAB 8 Memilih Tes Standar

CHAPTER 8 Selecting
Standardized Tests
2. DALAM MEMPELAJARI konstruksi pengujian, IN LEARNING ABOUT the construction of tests
Anda sekarang memahami banyak tentang you now understand much about how good
bagaimana pengujian yang baik dibuat dan tests are constructed and the purposes to
tujuan penerapan hasil pengujian. Untuk which test results can be applied. For most
sebagian besar kegiatan penilaian di kelas, assessment activities in the classroom, and for
dan untuk penilaian berkala yang berkaitan periodic assessments related to instructional
dengan umpan balik instruksional untuk guru feedback for both teacher and students, well-
dan siswa, tes buatan guru yang dibangun constructed teacher-made tests will be the
dengan baik akan menjadi cara yang harus way to go. However, there will be situations
dilakukan. Namun, akan ada situasi di mana where existing formal measures, tests, or item
ukuran formal, tes, atau bank soal yang ada banks are available for specialized purposes.
tersedia untuk tujuan khusus. Dengan By using them with little or no modifications,
menggunakannya dengan sedikit atau tanpa you will be able to produce assessments that
modifikasi, Anda akan dapat menghasilkan become a part of an assessment system that
penilaian yang menjadi bagian dari sistem meets both your needs and the needs of the
penilaian yang memenuhi kebutuhan Anda broader educational community.
dan kebutuhan komunitas pendidikan yang
lebih luas.
3. Kebutuhan Anda untuk memahami bahwa Your need to understand that knowing about
mengetahui tentang pemilihan tes the selection of tests is an essential
merupakan persiapan penting dalam preparation in classroom instruction.
pengajaran di kelas. Guru, pada satu waktu Teachers, at one time or another, will be
atau lainnya, akan dilibatkan pada tingkat involved at some level in test selection for
tertentu dalam pemilihan tes untuk intervensi planning interventions, improving curricula,
perencanaan, meningkatkan kurikulum, responding to community inquiries, or
menanggapi pertanyaan masyarakat, atau communicating outcomes related to
mengkomunikasikan hasil yang terkait accountability issues. Of course, you may also
dengan masalah akuntabilitas. Tentu saja, select them independently of others for
Anda juga dapat memilihnya secara specific purposes in your classroom—to
independen dari orang lain untuk tujuan understand how student achievement
tertentu di kelas Anda — untuk memahami compares with externally constructed tests
bagaimana prestasi siswa dibandingkan based on professional standards or when you
dengan tes yang dibuat secara eksternal want to learn about students’ processing,
berdasarkan standar profesional atau ketika including their misconceptualizations, learning
Anda ingin belajar tentang pemrosesan siswa, strategies, or working styles. Such information
termasuk kesalahpahaman mereka, strategi has important implications for instructional
pembelajaran, atau gaya kerja. Informasi improvement. More frequently, however, you
tersebut memiliki implikasi penting untuk will be working cooperatively with other
peningkatan pembelajaran. Namun, lebih professionals, such as educational counselors
sering, Anda akan bekerja sama dengan or school psychologists, in selecting tests to
profesional lain, seperti konselor pendidikan aid planning the placement of students,
atau psikolog sekolah, dalam memilih tes interventions, or remedial programs. You will
untuk membantu perencanaan penempatan certainly need to understand tests selected by
siswa, intervensi, atau program perbaikan. others such as policy makers who have
Anda tentu perlu memahami tes yang dipilih jurisdiction over statewide tests or tests
oleh orang lain seperti pembuat kebijakan dictated by legislation, tests that are
yang memiliki yurisdiksi atas tes di seluruh summative evaluations of student progress
negara bagian atau tes yang ditentukan oleh and are used for accountability. Finally, you
undang-undang, tes yang merupakan evaluasi can count on the fact that parents of your
sumatif kemajuan siswa dan digunakan untuk students will ask you to provide an
akuntabilitas. Terakhir, Anda dapat interpretation of a test that you may know
mengandalkan fakta bahwa orang tua siswa little about.
Anda akan meminta Anda untuk memberikan
interpretasi tentang sebuah tes yang mungkin
hanya sedikit Anda ketahui.
4. ■ Tujuan
■ Objectives
5. Tujuan utama Anda dalam mempelajari Your primary objective in learning about the
tentang pemilihan tes adalah untuk selection of tests is to learn:
mempelajari:
6. • Proses pemilihan tes formal atau standar • The process of selecting formal or
standardized tests
7. • Keuntungan dan batasan dalam • The advantages and limitations in using
menggunakan tes apa pun yang Anda pilih whatever test you have selected
8. • Penggunaan tes apa pun, baik formal atau • The use of any test, whether formal or
informal, baik buatan guru atau komersial, informal, whether teacher-made or
sebagai aspek dari sistem penilaian daripada commercial, as a facet of a system of
tambahan sederhana dari tes lain ke dalam assessment rather than the simple addition of
perlengkapan tes yang digunakan oleh another test to the armamentarium of tests
sekolah used by a school
9. • Bagaimana tes standar cocok dengan proses • How the standardized test fits in with the
penilaian secara keseluruhan overall assessment process
10. • Sumber daya yang tersedia untuk membuat • The resources available for making decisions
keputusan tentang tes yang tepat untuk about the right test to use for achieving
digunakan untuk mencapai tujuan instructional and educational goals
instruksional dan pendidikan
11. • Karakteristik unik dari scoring dan norming • The unique characteristics of scoring and
yang digunakan dalam tes standar, langkah- norming used in standardized tests, steps
langkah yang biasanya dilakukan oleh sumber ordinarily done by external sources such as
eksternal seperti perusahaan komersial dan commercial companies and increasingly with
semakin meningkat dengan penggunaan the use of technology
teknologi
12. • Penilaian tes yang membutuhkan prosedur • Scoring of tests that require special
khusus seperti penggunaan rubrik dalam procedures such as the use of rubrics in
penilaian komposisi atau hasil kinerja lainnya scoring of the composition or other
yang diukur dengan bagian tes — prosedur performance outcomes measured by sections
untuk penilaian otentik yang semakin banyak of the test—procedures for authentic
diminta oleh sekolah dan masyarakat assessments which are increasingly being
demanded by the school and community
13. • Batasan bagaimana hasil tes dapat • Limits on the way test results can be used;
digunakan; kesimpulan dan implikasi untuk the inferences and the implications for
tujuan pendidikan termasuk instruksi, educational purposes including instruction,
penempatan siswa di kelas khusus, desain placement of students in special classes, the
intervensi, dan tujuan serupa design of interventions, and similar purposes
14. • Bagaimana hasil disebarluaskan di berbagai • How the results are disseminated at various
tingkat oleh administrator tes yang berfungsi levels by the administrator of tests that serve
untuk mematuhi kebijakan; penjelasan dan to comply with policy; explanations and
interpretasi harus dikomunikasikan kepada interpretations must be communicated to the
masyarakat umum, orang tua, dan siswa general public, parents, and students in
dengan cara yang bermakna meaningful ways
15. • Keterlibatan siswa dalam mengerjakan tes • Engagement of students in taking the test
dan memahami hasilnya sendiri and understanding the outcomes for
themselves
16. • Apa hasil pilihan tes dan hasilnya untuk • What test selections and their results imply
instruksi, intervensi, dan pengembangan for instruction, intervention, and the
rencana pengujian di masa depan development of future testing plans
17. Sangat penting bagi guru untuk mengetahui It is critical for teachers to know and
dan memahami dasar-dasar untuk setiap understand the bases for any choice or use of
pilihan atau penggunaan tes standar. Bab ini standardized tests. This chapter is devoted to
dikhususkan untuk dasar-dasar identifikasi the bases by which measures potentially
dan pemilihan tindakan yang berpotensi useful to you are identified and chosen. They
berguna bagi Anda. Mereka penting untuk are important for helping you make decisions
membantu Anda membuat keputusan dalam in the process of selecting tests, should you be
proses pemilihan tes, jika Anda terlibat engaged directly in that process. Knowing the
langsung dalam proses itu. Mengetahui bases of test selection will help you
dasar-dasar pemilihan tes akan membantu understand and evaluate the wisdom of
Anda memahami dan mengevaluasi choices made by others such as district or
kebijaksanaan pilihan yang dibuat oleh orang state educational office who may have
lain seperti dinas pendidikan kabupaten atau mandated the use of a test for accountability
negara bagian yang mungkin telah purposes. Understanding the bases for
mengamanatkan penggunaan tes untuk selecting a test is also part of a knowledgeable
tujuan akuntabilitas. Memahami dasar-dasar explanation of assessment outcomes and
pemilihan tes juga merupakan bagian dari interpretation that might be communicated to
penjelasan luas tentang hasil penilaian dan the community (parents, boards of education,
interpretasi yang mungkin dikomunikasikan school administrators). You will see that the
kepada masyarakat (orang tua, dewan principles guiding the development and use of
pendidikan, administrator sekolah). Anda standardized tests are essentially the same as
akan melihat bahwa prinsip-prinsip yang those you would consider, perhaps somewhat
memandu pengembangan dan penggunaan more flexibly, in the development and use of
tes standar pada dasarnya sama dengan yang classroom tests. As such they are an extension
Anda pertimbangkan, mungkin agak lebih of the principles of classroom assessment in
fleksibel, dalam pengembangan dan practice, as you can see from the review in
penggunaan tes kelas. Dengan demikian, Text Box 8.1.
prinsip-prinsip tersebut merupakan perluasan
dari prinsip-prinsip penilaian kelas dalam
praktiknya, seperti yang Anda lihat dari
ulasan di Kotak Teks 8.1.
18. Penggunaan sumber daya pengujian standar The use of standardized testing resources
akan membuat hidup Anda lebih mudah should make your life easier for most phases
untuk sebagian besar fase penilaian seperti of assessment such as the comparison of your
perbandingan kinerja kelas Anda dengan class’s performance with others similar to
orang lain yang serupa dengan Anda yang yours that are represented in disaggregated
direpresentasikan dalam norma terpilah. norms. However, this will be true only if the
Namun, ini hanya benar jika sumber daya resources are readily identifiable, accessible,
mudah diidentifikasi, dapat diakses, dan and align well with the learning objectives for
selaras dengan tujuan pembelajaran untuk the segment that you are teaching.
segmen yang Anda ajar.
19. Variasi dari ukuran penilaian formal yang The varieties of available formal assessment
tersedia memiliki banyak tujuan. Mereka measures serve many purposes. They are used
digunakan oleh psikolog sekolah dan guru by school psychologists and special education
pendidikan khusus untuk mendiagnosis siswa teachers to diagnose students with learning
dengan ketidakmampuan belajar atau untuk disabilities or to determine placement in
menentukan penempatan di kelas khusus. special classes. They are used for summative
Mereka digunakan untuk evaluasi sumatif evaluations in making policy decisions
dalam membuat keputusan kebijakan tentang regarding accountability. Although some
akuntabilitas. Meskipun beberapa tes standar standardized tests must be administered by
harus dilakukan oleh personel sekolah certified school personnel, the classroom
bersertifikat, guru kelas pasti akan terlibat di teacher is certain to be involved at some point
beberapa titik dalam memilih dan mengelola in selecting and administering the tests,
tes, menafsirkan hasilnya, dan menggunakan interpreting the results, and using the results
hasil dalam perencanaan kegiatan dan in planning curricular activities and programs
program kurikuler untuk siswa secara for individual students.
individu.
20. ■ Prinsip Memilih Tes Standar
■ Principles for Selecting
Standardized Tests
21. Langkah-langkah dalam memilih dan The steps in selecting and using formal
menggunakan pengujian standar formal standardized tests are similar to those
serupa dengan yang digunakan dalam employed in determining the adequacy of any
menentukan kecukupan suatu ukuran. Anda measure. You can see that they parallel the
dapat melihat bahwa mereka paralel dengan objectives outlined above. They are:
tujuan yang diuraikan di atas. Mereka:
22. • Identifikasi tujuan penggunaan tes. • Identify the purpose for using the test.

23. • Identifikasi kecukupan tes untuk tujuan • Identify the adequacy of the test for the
yang dimaksudkan. purpose intended.

24. • Mengetahui hubungan tes dengan tes • Know the test’s relation to other tests
lainnya
25. Kotak Teks 8.1 Tinjauan tentang Dasar-dasar
Text Box 8.1 A Review of the Basics
yang Relevan dengan Seleksi Tes
Relevant to Test Selection
26. Prinsip-prinsip yang dibahas sampai saat ini The principles discussed up to this point in the
dalam teks bersatu dalam memilih tes untuk text come together in selecting tests to help
membantu Anda menggunakan tes dengan you to use tests wisely and responsibly. The
bijaksana dan bertanggung jawab. technical knowledge obtained through your
Pengetahuan teknis yang diperoleh melalui education and professional development is
pendidikan dan pengembangan profesional also an essential element in the process. As
Anda juga merupakan elemen penting dalam you investigate the extent to which a test is
proses tersebut. Saat Anda menyelidiki sejauh relevant for your purposes, you will become
mana suatu tes relevan untuk tujuan Anda, knowledgeable and conversant through
Anda akan menjadi berpengetahuan dan reviews, manuals, and observations about the
mahir melalui tinjauan, manual, dan following basic aspects of a test in order for
pengamatan tentang aspek dasar tes berikut you to become proficient in test selection or
agar Anda menjadi mahir dalam pemilihan use:
atau penggunaan tes:
27. • Reliabilitas Hasil Tes. Anda telah menjumpai • Reliability of Test Results. You have come
istilah reliabilitas pada beberapa kesempatan. across the term reliability on a number of
Sejauh mana tes menghasilkan hasil yang occasions. It is the extent to which the test
konsisten (serupa) pada kesempatan yields consistent (similar) results on separate
terpisah. Perkiraan reliabilitas tes dapat occasions. An estimate of test reliability might
diperoleh dengan (a) menghubungkan skor be obtained by (a) correlating test scores at
tes pada waktu yang berbeda (disebut tes-tes separate times (called test-retest); (b) by
ulang); (b) dengan menghubungkan satu correlating one part of the test with another
bagian tes dengan yang lain (seperti skor (such as a score based on all even items with a
berdasarkan semua soal genap dengan skor score based on all odd-numbered items, called
berdasarkan semua soal bernomor ganjil, internal consistency); or (c) by correlating two
disebut konsistensi internal); atau (c) dengan forms of a test (called parallel or equivalent
menghubungkan dua bentuk tes (disebut forms). In the case of an essay test scored by
bentuk paralel atau ekuivalen). Dalam kasus two different raters, the reliability would be
tes esai yang dinilai oleh dua penilai berbeda, obtained by correlating the raters’ scores
reliabilitas akan diperoleh dengan (called interrater reliability). Which method is
menghubungkan skor penilai (disebut used to calculate and estimate reliability
reliabilitas antar penilai). Metode mana yang depends on the purpose for which the test is
digunakan untuk menghitung dan used.
memperkirakan keandalan tergantung pada
tujuan pengujian tersebut digunakan.
28. • Validitas Hasil Tes. Apakah tes mengukur • Validity of Test Results. Does the test
apa yang ingin diukur? Carilah bukti yang measure what it is intended to measure? Look
mendukung interpretasi apa pun yang for evidence that supports whatever
dimaksudkan. Misalnya, apakah itu akan interpretation is intended. For instance, is it to
diartikan sebagai ukuran kemajuan? Sebagai be interpreted as a measure of progress? As a
ukuran sumatif dari status siswa? Sebagai summative measure of the student’s status?
ukuran prestasi sekolah? Sebagai prediktor As a measure of the school’s achievement? As
sukses di perguruan tinggi? Sebagai a predictor for success in college? As a
karakteristik seberapa baik suatu tes characteristic of how well a test achieves its
mencapai tujuannya, ketahuilah bahwa tes goals, recognize that it may have different
tersebut mungkin memiliki validitas yang validity for different purposes. For example,
berbeda untuk tujuan yang berbeda. the test may be highly predictive of reading
Misalnya, tes mungkin sangat prediktif untuk ability, but may have less predictability for
kemampuan membaca, tetapi mungkin first-year grades in college. Look for evidence
kurang dapat diprediksi untuk nilai tahun of potential differences in validity. The validity
pertama di perguruan tinggi. Cari bukti of a test for instructional purposes needs to
perbedaan potensial dalam validitas. Validitas be understood in terms of its alignment to
tes untuk tujuan instruksional perlu dipahami objectives, whether state standards,
dalam hal keselarasannya dengan tujuan, professional content area standards, or
apakah standar negara, standar area konten classroom instructional objectives.
profesional, atau tujuan instruksional kelas.
29. • Skor untuk Hasil Tes. Ketahui dan • Scores for Test Results. Know and identify
identifikasi perbedaan mendasar antara the basic differences between different kinds
berbagai jenis skor. Hanya tes yang secara of scores. Only tests that accurately report the
akurat melaporkan jenis skor dan types of scores and use accurate scoring
menggunakan prosedur penilaian yang akurat procedures should be used. You may recall,
yang harus digunakan. Anda mungkin ingat, for example, our earlier concern with the
misalnya, perhatian kami sebelumnya dengan terms norm-referenced and criterion-
istilah yang merujuk pada norma dan yang referenced; they refer to differences in the
merujuk pada kriteria; mereka mengacu pada ways the scores were interpreted, not to
perbedaan cara skor diinterpretasikan, bukan differences in tests. Evidence for these
pada perbedaan dalam tes. Bukti perbedaan differences may be found in reviews. When
ini dapat ditemukan dalam ulasan. Saat reviewing test characteristics, ask yourself
meninjau karakteristik tes, tanyakan pada diri whether the scores are criterionor norm-
Anda apakah skor tersebut mengacu pada referenced and how the interpretations are
kriteria atau norma dan bagaimana related to the intended use of the test. You
interpretasi terkait dengan tujuan will find other kinds of scores referred to in
penggunaan tes. Anda akan menemukan jenis evaluative reports of tests or in test manuals,
skor lain yang dirujuk dalam laporan evaluasi including part scores; scores based on the
tes atau dalam manual tes, termasuk skor kinds of content (facts, concepts, problem
bagian; skor berdasarkan jenis isi (fakta, solving); and scores based on processes—for
konsep, pemecahan masalah); dan skor example, in reading you might find scores
berdasarkan proses — misalnya, dalam related to reading rate, recall, or
membaca Anda mungkin menemukan skor comprehension. In other situations you will
yang terkait dengan kecepatan membaca, need to discriminate among raw scores,
ingatan, atau pemahaman. Dalam situasi lain, percentage correct, percentile scores, and so
Anda perlu membedakan antara skor mentah, on.
persentase benar, skor persentil, dan
sebagainya.
30. • Variabilitas Hasil Tes. Anda telah • Variability of Test Results. You have come
menemukan gagasan pengaruh insidental across the idea of incidental or random
atau acak pada hasil tes dalam laporan influences on test results in journalistic
jurnalistik hasil jajak pendapat. Misalnya, reports of poll results. For example, a TV
seorang jurnalis TV mungkin mengatakan journalist might say something like the
sesuatu seperti berikut ini, “Dalam jajak following, “In a recent poll, 40 percent of one
pendapat baru-baru ini, 40 persen dari satu group responded favorably while 43 percent
kelompok menanggapi dengan baik of another group responded favorably; as
sementara 43 persen dari kelompok lain such, the difference was too close to say that
menanggapi dengan baik; karena itu, one group was more favorably disposed than
perbedaannya terlalu dekat untuk the other.” The idea here is that you don’t
mengatakan bahwa satu kelompok memiliki want test results to vary too much, but some
kecenderungan yang lebih baik daripada yang variability is to be expected due to
lain. " Idenya di sini adalah Anda tidak ingin extenuating circumstances and must be
hasil tes terlalu bervariasi, tetapi beberapa considered when interpreting the scores. Such
variabilitas diharapkan karena keadaan yang differences can occur because of influences
meringankan dan harus dipertimbangkan saat unrelated to the “true” achievement or
menafsirkan skor. Perbedaan tersebut dapat attitudes of the student; these may include
terjadi karena pengaruh yang tidak terkait differences due to motivation, interpretations
dengan prestasi atau sikap "sebenarnya" of the questions, or perspectives. These
siswa; ini mungkin termasuk perbedaan factors contribute to measurement errors or
karena motivasi, interpretasi pertanyaan, error of measurement; estimations of the
atau perspektif. Faktor-faktor ini error of measurement are reported in reviews
berkontribusi pada kesalahan pengukuran and should be considered when interpreting
atau kesalahan pengukuran; Estimasi scores to support informed decisions.
kesalahan pengukuran dilaporkan dalam
tinjauan dan harus dipertimbangkan saat
menafsirkan skor untuk mendukung
keputusan yang diinformasikan.
31. • Norma untuk Hasil Tes. Periksalah dengan • Norms for Test Results. Examine carefully
cermat cara nilai tes diatur. Anda harus dapat the way the test scores were normed. You
menentukan dari tinjauan apakah kelompok should be able to determine from the reviews
norma untuk membandingkan dengan whether a norm group for comparing with the
kelompok lokal tersedia atau dapat local group is available or defensible for the
dipertahankan untuk interpretasi skor yang appropriate interpretation of scores. For
sesuai. Misalnya, seberapa besar sampel example, how large were the samples of
responden? Apakah norma didasarkan pada respondents? Were the norms based on
responden dari berbagai pengaturan respondents from a diversity of settings
(sekolah, distrik, dan sebagainya) atau dari (schools, districts, and so on) or from one
satu sekolah atau lingkungan? Jika Anda akan school or setting? If you are to make
membuat perbandingan dengan kelas Anda, comparisons with your classes, how
seberapa representatif kelas atau sekolah representative of your class or school was the
Anda sebagai sampel dari sudut pandang sample from the standpoints of their grade
tingkat kelas mereka, instruksi yang mungkin level, the instruction they might have
telah mereka terima, karakteristik distrik received, the characteristics of your school
sekolah Anda, dan seterusnya. Kadang- district, and so on. On occasion you might find
kadang Anda mungkin menemukan data normative data for the performance of all
normatif untuk kinerja semua siswa yang students who took the test (called aggregated
mengikuti tes (disebut skor agregat) atau scores) or you might find the normative data
Anda mungkin menemukan data normatif separated according to specific groups such as
dipisahkan menurut kelompok tertentu areas of the country, state, ethnicity, grade
seperti wilayah negara, negara bagian, etnis, level, and so on (called disaggregated scores).
tingkat kelas, dan sebagainya. pada (disebut
skor terpilah).
32. • Buat interpretasi yang masuk akal tentang • Make reasonable interpretations of the test,
tes, batasi interpretasi Anda pada data yang limiting your interpretations to the data
diberikan oleh norma tes dan karakteristik provided by the test norms and test
tes. characteristics.
33. Saat Anda mengikuti langkah-langkah ini, As you follow these steps, you should use
Anda harus menggunakan sumber apa pun whatever sources are available for learning
yang tersedia untuk mempelajari tentang about a test’s development, the ways it has
pengembangan tes, cara penggunaannya, dan been used, and its desirable and undesirable
karakteristiknya yang diinginkan dan tidak characteristics. Later in this chapter we
diinginkan. Nanti di bab ini kami menjelaskan describe major sources of such information.
sumber utama dari informasi tersebut. By pulling together all the available facts, you
Dengan mengumpulkan semua fakta yang should be able to answer questions like the
tersedia, Anda seharusnya dapat menjawab following:
pertanyaan-pertanyaan seperti berikut ini:
34. • Untuk tujuan apa tes dirancang? Carilah • For what purposes was the test designed?
bukti yang jelas tentang tujuan dari tes Look for clear evidence of what the test is
tersebut, misalnya, pengujian penyandang intended to accomplish, for instance, testing
disabilitas; evaluasi program; atau pengujian of persons with disabilities; program
kemajuan pendidikan untuk tujuan evaluation; or testing of educational progress
akuntabilitas. for purposes of accountability.
35. • Tanyakan pada diri Anda sendiri seberapa • Ask yourself how well the test’s aims suit
cocok tujuan tes tersebut dengan tujuan your own purposes.
Anda sendiri.
36. Sebagai peringatan awal, jangan bergantung As an initial caveat do not depend upon the
pada judul (nama) yang diberikan untuk tes. title (name) given to the test. A test cannot be
Tes tidak dapat dipilih hanya berdasarkan selected solely on the name given to it. For
nama yang diberikan padanya. Misalnya, example, a test may be given the title “A Test
sebuah tes mungkin diberi judul "A Test of of Reading.” It is necessary to look for other
Reading". Bukti lain tentang apa yang evidence regarding exactly what is being
sebenarnya sedang diukur perlu dicari. Item measured. The specific items could be
spesifik dapat diperiksa: Apakah item inspected: Do the items deal with vocabulary?
berhubungan dengan kosakata? Dengan With simple comprehension? With
pemahaman sederhana? Dengan comprehension requiring inferences? Do they
pemahaman yang membutuhkan deal with simple recall of words in a passage,
kesimpulan? Apakah mereka berurusan or with recall of inferences? and so on.
dengan mengingat kata-kata dalam sebuah Important in the selection of tests are such
petikan, atau dengan mengingat kesimpulan? reviews as those in the Mental Measurements
dan seterusnya. Yang penting dalam Yearbook, which we describe later in this
pemilihan tes adalah tinjauan seperti yang chapter. The Yearbook provides expert
ada di Buku Tahunan Pengukuran Mental, reviews based on evidence regarding the
yang kami jelaskan nanti di bab ini. Yearbook quality of the test (its psychometric
memberikan tinjauan ahli berdasarkan bukti characteristics) as well as the appropriate uses
mengenai kualitas tes (karakteristik of the tests.
psikometri) serta penggunaan yang tepat dari
tes tersebut.
37. • Apa sebenarnya yang harus dilakukan oleh • What exactly should the test do? Look for
tes tersebut? Cari bukti mengenai kecukupan evidence regarding the adequacy of the test
tes untuk mendiagnosis kekuatan atau for diagnosing strengths or weaknesses,
kelemahan, mengidentifikasi beberapa identifying some important characteristic such
karakteristik penting seperti kecemasan atau as anxiety or motivation, differentiating the
motivasi, membedakan kinerja beberapa performance of some group relative to
kelompok relatif terhadap yang lain, another, conveying data to reflect student
menyampaikan data untuk mencerminkan progress in achievement—all, of course,
kemajuan siswa dalam pencapaian — semua, depending on what your purposes are.
tentu saja, bergantung tentang tujuan Anda.
38. • Hasil khusus apa yang diukur dengan tes? • What particular outcomes are being
Review pengujian atau manual akan measured by the test? The test review or
menentukan apa yang diukur, bersama manual will specify what is being measured,
dengan data validitas pendukung. Beberapa along with supporting validity data. Some
ukuran khusus yang tersedia akan ditemukan specific measures that are available will be
di bawah topik literasi (penggunaan found under the topics of literacy (use of
penerimaan bahasa seperti dalam membaca language reception as in reading or language
atau produksi bahasa seperti dalam production as in speaking), problem solving (in
berbicara), pemecahan masalah (dalam everyday situations or in specific content
situasi sehari-hari atau dalam area konten areas like math), perceptual-motor skills,
tertentu seperti matematika), keterampilan achievement (in specified subject-matter
motorik perseptual, prestasi (dalam bidang areas), learning styles and strategies, and
materi pelajaran tertentu), gaya dan strategi emotional-motivational tendencies (anxiety,
belajar, dan kecenderungan emosional- self-esteem, classroom motivation).
motivasi (kecemasan, harga diri, motivasi
kelas).
39. • Apa jenis dan mode respons khas yang • What is the typical response type and mode
digunakan dalam pengujian? Secara used in the test? Characteristically, responses
karakteristik, tanggapan akan ditetapkan will be specified as objective or essay; verbal
sebagai objektif atau esai; verbal atau or nonverbal; oral or written. The test taker’s
nonverbal; lisan atau tertulis. Tanggapan response might be as simple as a check mark
peserta tes mungkin sesederhana tanda or as complex as an essay.
centang atau serumit esai.
40. • Bagaimana tes diberikan? Tes dapat • How is the test administered? Tests may be
dilakukan secara individu atau kelompok. administered individually or in groups.
Bergantung pada asumsi tentang kemampuan Depending on assumptions about language
bahasa, tes dapat disampaikan dalam bentuk ability, the test may be delivered in oral or
lisan atau tertulis, dan dapat diatur waktunya written form, and it may be either timed or
atau diatur sendiri. Kondisinya berbeda self-paced. The conditions vary with the test,
dengan ujian, dan itu penting karena and they are important because they affect
memengaruhi norma. Jika, misalnya, Anda the norms. If, for example, you wanted to
ingin memperpanjang waktu pengambilan tes extend your class’s test-taking time, you
kelas Anda, Anda ingin mengetahui apakah would want to know whether the test was
tes tersebut diatur berdasarkan batasan normed on the basis of time restrictions.
waktu.
41. • Dalam bentuk apa skornya? Anda mungkin • In what form is the score? You may receive
menerima skor mentah, skor standar, atau raw scores, standard scores, or percentiles;
persentil; Anda mungkin mendapatkan skor you may get a total score for each student or a
total untuk setiap siswa atau kumpulan collection of subscores.
subskor.
42. • Apa norma yang digunakan dalam • What are the norms used in
standardisasi? Norma menggambarkan standardization? Norms describe the
populasi yang menjadi sasaran penilaian populations against which performances are
kinerja. Mereka mungkin termasuk semua judged. They may include all the students who
siswa yang pernah mengikuti tes (norma ever took the test (aggregated norms) or they
gabungan) atau mereka mungkin may be subgroups (disaggregated norms)
subkelompok (norma terpilah) berdasarkan based on chronological age, grade level,
usia kronologis, tingkat kelas, distrik (lokal, district (local, state, or national), or
negara bagian, atau nasional), atau demographic characteristics (socioeconomic
karakteristik demografis (status sosial status, gender, cultural diversity, ethnicity,
ekonomi, jenis kelamin , keanekaragaman linguistic diversity, first and second language).
budaya, etnis, keanekaragaman bahasa, In addition to looking for limiting
bahasa pertama dan kedua). Selain mencari characteristics of the normative population,
karakteristik pembatas dari populasi look for the recency of norming. The
normatif, carilah keterkinian norming. importance of this criterion is supported in
Pentingnya kriteria ini didukung dalam Theory Theory to Practice Box 8.1, which includes
to Practice Box 8.1, yang mencakup ilustrasi illustrations of how considerations of prior
tentang bagaimana pertimbangan experience in diverse environments affect the
pengalaman sebelumnya di lingkungan yang utility of test results.
beragam memengaruhi kegunaan hasil
pengujian.
43. • Seberapa memadai karakteristik psikometri • How adequate are the psychometric
tes? Cari bukti keandalan yang memadai characteristics of the test? Look for evidence
(stabilitas tes-tes ulang; homogenitas item of adequate reliability (test-retest stability;
dan konsistensi internal; kesepakatan antar- homogeneity of items and internal
penilai). Cari dasar klaim tes untuk validitas consistency; inter-rater agreement). Look for
skor tes. Anda mungkin ingin merujuk the bases of the test’s claim to the validity of
kembali ke Kotak Teks 8.1 untuk meninjau test scores. You may want to refer back to
karakteristik pengujian yang dibangun dengan Text Box 8.1 for a review of the characteristics
baik. of well-constructed tests.
44. • Apa yang dikatakan pengguna atau • What do users or reviewers say about the
pengulas tentang kecukupan dan kegunaan test’s adequacy and usefulness? Look for
tes? Cari komentar peninjau tentang keadilan reviewers’ comments on the test’s fairness,
tes, kecukupan revisinya, dokumentasi the adequacy of its revisions, its supporting
pendukungnya, serta kekuatan dan documentation, and its overall strengths and
kelemahannya secara keseluruhan. weaknesses.
45. Ingatlah bahwa, betapapun mengesankannya Remember that, however impressive a test
sebuah tes terlihat dari luar, skor tunggal saja may look outwardly, single scores alone
tidak boleh digunakan untuk membuat should not be used for making sweeping
keputusan menyeluruh tentang individu — decisions about individuals—for example, in
misalnya, dalam keputusan seperti mereka such decisions as those involved in grade
yang terlibat dalam retensi kelas, retention, placement in special classes, or
penempatan di kelas khusus, atau kelulusan. graduation. The American Psychological
Pernyataan The American Psychological Association’s (2001) statement on test policy
Association (2001) tentang kebijakan tes includes the following caution:
mencakup peringatan berikut:
46. Keputusan apa pun tentang pendidikan Any decision about a student’s continued
lanjutan siswa, seperti retensi, pelacakan, education, such as retention, tracking, or
atau kelulusan, tidak boleh didasarkan pada graduation, should not be based on the results
hasil tes tunggal, tetapi harus menyertakan of a single test, but should include other
informasi lain yang relevan dan valid. relevant and valid information.
47. Hampir semua tes harus menjadi bagian dari Virtually any test should be part of system in
sistem yang dilengkapi dengan sumber which it is supplemented by other sources of
informasi lain. Tes standar biasanya information. Standardized tests are typically
dikembangkan untuk menilai hasil perilaku di developed for assessing behavioral outcomes
luar kelas lokal, misalnya, tes tersebut beyond the local classroom, for instance, they
mungkin telah dikembangkan dari standar may have been developed out of standards
yang disepakati oleh profesi, terlepas dari agreed upon by the profession, irrespective of
kebutuhan lokal. Setelah dikembangkan local needs. Having been developed for
untuk tujuan tertentu, mereka cenderung specific purposes, they are likely to be based
didasarkan pada konten yang berbeda dari on different content than that assigned and
yang ditugaskan dan dipelajari di kelas studied in a particular class, so they must be
tertentu, jadi mereka harus diteliti dengan scrutinized carefully from several vantage
cermat dari beberapa sudut pandang (tingkat points (grade level, norms, age group, locality)
kelas, norma, kelompok usia, lokalitas) before they are considered for grading
sebelum mereka dipertimbangkan untuk purposes, if at all.
tujuan penilaian, jika ada.
48. Prosedur yang dijelaskan adalah refleksi dari The procedures described are reflections of a
pernyataan yang lebih formal tentang kualitas more formal statement of the qualities to look
yang harus dicari dalam memilih tes, seperti for in selecting tests, as summarized by the
yang dirangkum oleh American Psychological American Psychological Association. A
Association. Ringkasan dari bagian summary of the portion of that statement
pernyataan yang berhubungan dengan seleksi dealing with test selection is presented in Text
tes disajikan dalam Kotak Teks 8.2. Box 8.2.
49. Theory to Practice Box 8.1 LE OF BAGAIMANA
PENGALAMAN SEBELUMNYA Theory to Practice Box 8.1 LE OF HOW
MEMPENGARUHI HASIL STANDARISASI PRIOR EXPERIENCES AFFECT
STANDARDIZED SULTS

50. Tes yang dibangun di satu era mungkin tidak A test constructed in one era might not be
dapat digunakan dengan tepat di era lain appropriately used in another era without
tanpa direvisi. Tes sering kali menjadi being revised. Tests frequently become
ketinggalan jaman karena perubahan dalam outmoded because of changes in the
pengalaman yang mempengaruhi skor experiences that affect the scores of
responden, ketika item tes didasarkan pada respondents, when test items are based on
pengalaman tersebut. Perbedaan tersebut those experiences. Such differences are due to
disebabkan oleh pengalaman dalam populasi experiences in unique populations (cohorts) or
unik (kelompok) atau subkelompok subgroups based on locality, culture, ethnicity,
berdasarkan lokalitas, budaya, etnis, atau or other variables. Students from a culture
variabel lain. Siswa dari budaya yang selaras that is aligned with the instruction and
dengan pengajaran dan penilaian akan tampil assessment will perform more adequately on
lebih memadai pada penilaian daripada siswa the assessment than students from another
dari budaya lain yang tidak selaras dengan culture not aligned with that in which the
apa yang menjadi dasar pengajaran dan instruction and assessment are based. One
penilaian. Salah satu pemeriksaan tersebut such examination was a recent revision of the
adalah revisi baru-baru ini dari Tes widely used Stanford Binet Intelligence Test,
Kecerdasan Binet Stanford yang banyak which had been invented in the early part of
digunakan, yang telah ditemukan pada awal the 20th century, but in which some of the
abad ke-20, tetapi di mana beberapa item items became out of date late in the century.
menjadi ketinggalan zaman di akhir abad ini.
51. Kecukupan budaya suatu tes mungkin tidak The cultural adequacy of a test might be
valid karena representasi yang buruk dari invalidated due to the poor representation of
norma-norma yang digunakan untuk the norms that are used for interpretation of
interpretasi skor. Misalnya, norma yang the scores. For example, norms based on
didasarkan pada prestasi siswa di satu student performance in one locality, such as
daerah, seperti daerah perkotaan, mungkin an urban area, might not be useful for
tidak berguna untuk menafsirkan prestasi interpreting student performance in another
siswa di daerah lain, seperti daerah locality, such as a rural area. Similarly, a test
pedesaan. Demikian pula, tes mungkin tidak might be invalidated because the test is biased
valid karena tes tersebut bias (tidak adil) (unfair) to one group or another due to
untuk satu kelompok atau lainnya karena cultural, age, or other differences. Scores
perbedaan budaya, usia, atau lainnya. Skor based on responses to items in which the
yang didasarkan pada respons terhadap item characteristics of groups were ignored can
di mana karakteristik kelompok diabaikan lead to discrepancies in interpretations
dapat menyebabkan ketidaksesuaian dalam regarding achievement level of students in a
interpretasi mengenai tingkat pencapaian program. You can see, for example, that
siswa dalam suatu program. Anda dapat groups composed of your counterparts in the
melihat, misalnya, bahwa grup yang terdiri prespace era (older cohort) undoubtedly had
dari rekan-rekan Anda di era prespace different definitions than you have had (recent
(kelompok yang lebih lama) tidak diragukan cohorts). Your cohort has had considerable
lagi memiliki definisi yang berbeda dari yang everyday experiences with such terms as
Anda miliki (kelompok baru-baru ini). countdown, rap, e-mail, spacewalk, cool, word
Kelompok Anda memiliki pengalaman sehari- processor, digital, gigabyte, and nanosecond.
hari yang cukup banyak dengan istilah seperti Put these content-specific terms into
hitung mundur, rap, email, perjalanan luar standardized test items and a younger cohort
angkasa, keren, pengolah kata, digital, will probably perform well on them. A much
gigabyte, dan nanodetik. Masukkan istilah older cohort will undoubtedly have more
khusus konten ini ke dalam item pengujian difficulty with the items; their aggregate
standar dan kelompok yang lebih muda norms for scores are certain to be much
mungkin akan bekerja dengan baik pada lower. On the other hand, the older cohort
istilah tersebut. Kelompok yang jauh lebih tua will have more knowledge about such events
pasti akan lebih kesulitan dengan item; as the pop music, economics, and politics
norma agregat mereka untuk skor pasti jauh associated with their day; their understanding
lebih rendah. Di sisi lain, kelompok yang lebih of swing music, pony express, depression,
tua akan memiliki lebih banyak pengetahuan isolationism, gold standard, or typewriter
tentang acara-acara seperti musik pop, (even possibly substituting ram for RAM) will
ekonomi, dan politik yang terkait dengan undoubtedly be richly associated with
zaman mereka; pemahaman mereka tentang meanings that will seem to evade the younger
musik swing, ekspresi kuda poni, depresi, cohort. Thus, an item in which the response
isolasionisme, standar emas, atau mesin tik was based on the meaning of these terms
(bahkan mungkin menggantikan ram untuk might not only be elusive to younger cohorts,
RAM) niscaya akan sangat terkait dengan but might actually be unknown to them. Each
makna yang tampaknya menghindari cohort has a better working knowledge of the
kelompok yang lebih muda. Jadi, item yang terms associated with their respective
tanggapannya didasarkan pada arti istilah- experiences in understanding events. As a
istilah ini mungkin tidak hanya sulit dipahami result, their scores of the two cohorts would
oleh kelompok yang lebih muda, tetapi differ considerably on any items in which
mungkin sebenarnya tidak diketahui oleh these terms and their contexts were central.
mereka. Setiap kelompok memiliki The lesson to be learned here for the selection
pengetahuan kerja yang lebih baik tentang of tests is that the available norms have to be
istilah yang terkait dengan pengalaman carefully evaluated for their value in making
masing-masing dalam memahami peristiwa. interpretations of the scores obtained.
Akibatnya, skor mereka dari dua kelompok
akan sangat berbeda pada setiap item di
mana istilah ini dan konteksnya menjadi
pusat. Pelajaran yang bisa dipetik di sini untuk
pemilihan tes adalah bahwa norma yang
tersedia harus dievaluasi dengan cermat
nilainya dalam membuat interpretasi
terhadap skor yang diperoleh.
52. Kotak Teks 8.2 Pertimbangan dalam
Pemilihan Tes Text Box 8.2 Considerations in Selection
of Tests
53. Pengguna tes harus memilih tes yang Test users should select tests that meet the
memenuhi tujuan yang dimaksudkan dan intended purpose and that are appropriate for
yang sesuai untuk peserta tes yang dituju. the intended test takers.
54. 1. Tentukan tujuan tes, konten dan 1. Define the purpose for testing, the content
keterampilan yang akan diuji, dan peserta tes and skills to be tested, and the intended test
yang dituju. Pilih dan gunakan tes yang paling takers. Select and use the most appropriate
sesuai berdasarkan tinjauan menyeluruh atas test based on a thorough review of available
informasi yang tersedia. information.
55. 2. Tinjau dan pilih tes berdasarkan kesesuaian 2. Review and select tests based on the
konten tes, keterampilan yang diuji, dan appropriateness of test content, skills tested,
cakupan konten untuk tujuan tes yang and content coverage for the intended
dimaksudkan. purpose of testing.
56. 3. Tinjau materi yang disediakan oleh 3. Review materials provided by test
pengembang tes dan pilih tes yang developers and select tests for which clear,
informasinya jelas, akurat, dan lengkap. accurate, and complete information is
provided.
57. 4. Pilih tes melalui proses yang mencakup 4. Select tests through a process that includes
orang-orang dengan pengetahuan, persons with appropriate knowledge, skills,
keterampilan, dan pelatihan yang sesuai. and training.
58. 5. Mengevaluasi bukti kualitas teknis 5. Evaluate evidence of the technical quality of
pengujian yang diberikan oleh pengembang the test provided by the test developer and
pengujian dan peninjau independen. any independent reviewers.
59. 6. Mengevaluasi contoh pertanyaan tes atau 6. Evaluate representative samples of test
tes latihan, arahan, lembar jawaban, manual, questions or practice tests, directions, answer
dan laporan skor yang representatif sebelum sheets, manuals, and score reports before
memilih tes. selecting a test.
60. 7. Evaluasi prosedur dan materi yang 7. Evaluate procedures and materials used by
digunakan oleh pengembang pengujian, serta test developers, as well as the resulting test,
pengujian yang dihasilkan, untuk memastikan to ensure that potentially offensive content or
bahwa konten atau bahasa yang berpotensi language is avoided.
menyinggung dihindari.
61. 8. Pilih tes dengan formulir yang dimodifikasi 8. Select tests with appropriately modified
dengan tepat atau prosedur administrasi forms or administration procedures for test
untuk peserta tes penyandang disabilitas takers with disabilities who need special
yang membutuhkan akomodasi khusus. accommodations.

62. 9. Evaluasi bukti yang tersedia tentang kinerja 9. Evaluate the available evidence on the
peserta tes dari berbagai subkelompok. performance of test takers of diverse
Tentukan sejauh mungkin perbedaan kinerja subgroups. Determine to the extent feasible
yang mungkin disebabkan oleh faktor-faktor which performance differences may have
yang tidak terkait dengan keterampilan yang been caused by factors unrelated to the skills
dinilai. being assessed.

63. Sumber: Diadaptasi dari Joint Committee on Source: Adapted from Joint Committee on
Testing Practices (2007). Testing Practices (2007).

64. ■ Sumber untuk Memandu Pemilihan Tes


Standar ■ Sources to Guide Selection of
Standardized Tests

65. Sisa bab ini dikhususkan untuk sumber This rest of this chapter is devoted to sources
informasi penilaian yang dapat digunakan of assessment information that can be used to
untuk membantu saat Anda mengembangkan help as you develop lesson plans and as you
rencana pelajaran dan saat Anda melayani serve on committees that deal with
dalam komite yang menangani keputusan educational decisions, as you certainly will in
pendidikan, seperti yang pasti akan Anda such tasks as developing Individual Education
lakukan dalam tugas-tugas seperti Plans (IEPs) for special education students
mengembangkan Rencana Pendidikan under provisions of inclusion in general
Individual (IEP) untuk siswa pendidikan classes.
khusus di bawah ketentuan inklusi di kelas
umum.
66. Awalnya, kami akan menyajikan contoh Initially, we will present examples of resources
sumber daya yang dapat Anda konsultasikan that you can consult to learn more about a
untuk mempelajari lebih lanjut tentang tes, test, a type of test, or a testing topic. Then we
jenis tes, atau topik pengujian. Kemudian present the current standards by which tests
kami menyajikan standar saat ini yang are judged. The hope is that you will not only
digunakan untuk menilai tes. Harapannya know where to go to get test information, but
adalah Anda tidak hanya mengetahui ke also be able to judge the quality of a test
mana harus pergi untuk mendapatkan based on formal testing parameters such as
informasi pengujian, tetapi juga dapat menilai validity and reliability. Finally, we want to
kualitas suatu pengujian berdasarkan reiterate the caveat that merely because a
parameter pengujian formal seperti validitas test is printed or has a label attached to it, it is
dan reliabilitas. Terakhir, kami ingin not automatically a valid measure.
mengulangi peringatan bahwa hanya karena
tes dicetak atau memiliki label yang melekat
padanya, itu tidak secara otomatis
merupakan ukuran yang valid.
67. ■ Buku Tahunan Pengukuran Mental Buros
dan Tes dalam Cetakan ■ Buros Mental Measurements
Yearbook and Tests in Print

68. The Mental Measurements Yearbook (MMY) The Mental Measurements Yearbook (MMY) is
adalah sumber penting untuk mempelajari an important resource for learning about
hampir setiap tes yang telah diterbitkan. virtually every test that has been published.
Volume diterbitkan oleh Buros Institute of The volumes are published by the Buros
Mental Measurements di University of Institute of Mental Measurements at the
Nebraska – Lincoln dan merupakan sumber University of Nebraska–Lincoln and are a most
informasi paling luas tentang tes formal yang extensive source of information about
tersedia. MMY berisi ulasan dan deskripsi tes available formal tests. The MMY contains
yang diterbitkan secara komersial dalam reviews and descriptions of commercially
bahasa Inggris. Meskipun tidak diterbitkan published tests in the English language.
setiap tahun, namun diperbarui setiap Though not published annually, it is updated
beberapa tahun. every few years.

69. Seri MMY bersifat kumulatif; volume The MMY series is cumulative; later volumes
selanjutnya tidak menggantikan volume do not replace earlier ones. An adjunct
sebelumnya. Dokumen tambahan, Tests in document, Tests in Print (TIP), consists of
Print (TIP), terdiri dari daftar deskriptif, tanpa descriptive listings, without reviews, of
review, dari tes cetak yang diterbitkan secara commercially published tests in print. TIP is
komersial. TIP juga merupakan dokumen also a comprehensive document where the
komprehensif di mana isi Buku Tahunan contents of previously published Mental
Pengukuran Mental yang diterbitkan Measurements Yearbooks are indexed.
sebelumnya diindeks.
70. Ada tiga cara dasar untuk mencari tes yang There are three basic ways to search for an
sesuai di MMY. Anda dapat mencari appropriate test in MMY. You can search by
berdasarkan (a) judul tes (seperti Slosson Test (a) the title of the test (such as Slosson Test of
of Reading Readiness); (b) jenis atau kategori Reading Readiness); (b) the type or category
konten pengujian yang Anda butuhkan of test content that you need (for instance,
(misalnya, membaca); atau (c) nama penulis. reading); or (c) an author’s name. In this last
Dalam kategori terakhir ini, Anda dapat category, you can find the author of (a) a test,
menemukan penulis (a) tes, (b) review, atau (b) a review, or (c) a referenced article in
(c) artikel referensi yang membahas tes which the test is discussed. Each of these
tersebut. Masing-masing pencarian ini searches is described in more detail below.
dijelaskan lebih rinci di bawah.
71. Kotak Teks 8.3 Panduan Pemilihan Tes
Standar: Menggunakan Review Tes Text Box 8.3 Guiding Selection of
Standardized Tests: Using Test Reviews
72. Personel khusus, guru-pendidik, dan anggota Specialized personnel, teacher-educators, and
masyarakat yang merupakan pengguna tes community members who are qualified users
yang memenuhi syarat memahami prinsip- of tests understand the principles of
prinsip pengukuran; derivasi dari skor dan measurement; the derivation of scores and
norma; pelaksanaan administrasi pengujian norms; the conduct of the administration of
menurut prosedur yang ditentukan; the test according to prescribed procedures;
kebutuhan mendasar untuk penilaian yang the underlying necessities for accurate
akurat; interpretasi informasi skor tes untuk scoring; the informed interpretation of test
individu dan kelompok; dan aplikasi hasil scores for individuals and groups; and the
yang berpengetahuan dan produktif. knowledgeable and productive applications of
the results.
73. Review yang akan Anda temukan di Buros The reviews that you will find in the Buros
Mental Measurements Yearbook atau di Mental Measurements Yearbook or in
jurnal teknis akan berisi banyak informasi technical journals will contain much of that
tersebut. Namun demikian, tinjauan akan information. Nevertheless, reviews will vary in
bervariasi sejauh mana informasi tentang the extent to which information about these
karakteristik ini muncul. Meskipun daftar di characteristics appear. Although the list below
bawah memberikan beberapa informasi yang provides some information that will appear in
akan muncul dalam tinjauan tersebut, such reviews, some may add or modify the
beberapa dapat menambah atau mengubah information as required. To help you use the
informasi yang diperlukan. Untuk membantu reviews effectively the checklist will help you
Anda menggunakan tinjauan secara efektif, avoid overlooking any important information
daftar periksa akan membantu Anda that might be contained in the review and
menghindari informasi penting yang mungkin identify information that might be absent in
terkandung dalam tinjauan dan the review.
mengidentifikasi informasi yang mungkin
tidak ada dalam tinjauan.
74. Informasi Terkait Administrasi Tes Information Related to Test Administration
75. Administrasi pengujian memerlukan prosedur Test administration necessarily requires
standar berikut sehingga pengujian digunakan following standard procedures so that the test
dengan cara yang ditentukan oleh is used in the manner specified by the test
pengembang pengujian. Terkadang hal ini developers. Sometimes this requires qualified
memerlukan pengguna yang memenuhi users certified to administer the tests, for
syarat bersertifikat untuk menjalankan tes, example, those professional educators trained
misalnya, para pendidik profesional yang in administering the Stanford Binet
terlatih dalam mengelola tes Stanford Binet Intelligence test. In many instances, test
Intelligence. Dalam banyak kasus, administrators are expected to ensure that
administrator tes diharapkan untuk test takers work within conditions that
memastikan bahwa peserta tes bekerja dalam maximize opportunity for optimum
kondisi yang memaksimalkan peluang untuk performance. All who are involved in the
kinerja yang optimal. Semua yang terlibat various aspects of selecting tests will give
dalam berbagai aspek pemilihan tes akan attention to:
memberikan perhatian pada:
76. • Sejauh mana administrasi tes dilakukan • The extent to which test administration is
oleh personel yang memiliki informasi yang conducted by informed personnel who are
cukup terlatih dalam prosedur pengujian adequately trained in the standard testing
standar procedures
77. • Sejauh mana administrator tes mengikuti • The extent to which test administrators
instruksi dalam manual tes; menunjukkan follow the instructions in the test manual;
kejelasan verbal; gunakan petunjuk kata demi demonstrate verbal clarity; use verbatim
kata; mematuhi petunjuk kata demi kata; directions; adhere to verbatim directions;
ikuti urutan dan waktu yang tepat; dan follow exact sequence and timing; and use
menggunakan materi yang identik dengan materials that are identical to those specified
yang ditentukan oleh penerbit uji by the test publisher
78. • Sejauh mana laporan dibuat tentang faktor- • The extent to which reports are made of
faktor yang dapat membuat kinerja dan hasil factors that may invalidate test performance
tes tidak valid, seperti penyimpangan dari and results, such as deviations from
prosedur administrasi tes yang ditentukan, prescribed test administration procedures,
termasuk informasi tentang masalah, including information on problems,
penyimpangan, dan akomodasi yang mungkin irregularities, and accommodations that may
terjadi have occurred
79. Informasi Terkait Penilaian Tes Information Related to Test Scoring
80. Mungkin terlihat di permukaan bahwa nilai It may appear on the surface that test scores
tes adalah mutlak. Namun, skor yang paling are absolute. However, even the most
obyektif pun bisa mengalami kesalahan. objective scores are subject to errors. For
Misalnya, mungkin ada konstruksi kunci skor example, there can be careless construction
yang ceroboh. Jika dinilai dengan tangan, ofscoring keys. If scored by hand there can be
mungkin ada kesalahan dalam membaca errors in reading the answers. If scored by
jawaban. Jika dinilai dengan mesin, machine, the answers may not have been
jawabannya mungkin tidak dicatat oleh pensil recorded by the proper pencils. Essays can be
yang tepat. Esai dapat memiliki bias yang subject to greater bias if scored without
lebih besar jika dinilai tanpa rubrik rubrics than with rubrics. But rubrics are also
dibandingkan dengan rubrik. Tetapi rubrik subject to error if they do not carefully define
juga dapat mengalami kesalahan jika tidak the criteria required for different levels of
dengan cermat menentukan kriteria yang performance. Accurate measurement
diperlukan untuk berbagai tingkat kinerja. necessitates adequate procedures for scoring
Pengukuran yang akurat memerlukan the responses of test takers. Examine reviews
prosedur yang memadai untuk menilai for the information they provide on:
tanggapan peserta tes. Periksa ulasan untuk
informasi yang mereka berikan tentang:
81. • Penyediaan, penerapan dan pemantauan • The provision, implementation and
prosedur penilaian standar monitoring of standard scoring procedures
82. • Adanya rubrik yang secara jelas • The presence of rubrics that clearly specify
menjelaskan kriteria penilaian; konsistensi the criteria for scoring; scoring consistency
penilaian harus terus dipantau should be constantly monitored
83. • Bagaimana skor dapat dipertahankan ketika • How scores can be defended when they are
ditantang untuk masalah kualitas oleh challenged for quality concerns by end users
pengguna akhir
84. Informasi Terkait Norma Information Related to the Norms
85. Karakteristik dari mereka yang mengikuti tes The characteristics of those taking the test—
— skor siswa yang menjadi dasar norma — those students’ scores on which the norms
akan membantu menentukan apakah were based—will help determine whether the
karakteristik norma tes sesuai untuk audiens characteristics of the test norms are
yang dituju dan memiliki kualitas teknis yang appropriate for the intended audience and are
memadai untuk tujuan yang sedang dihadapi. of sufficient technical quality for the purpose
Beberapa hal yang perlu dipertimbangkan at hand. Some areas to consider include:
termasuk:
86. • Seperti apa peserta tes? Informasi teknis • What were the test takers like? Technical
harus ditinjau untuk menentukan apakah information should be reviewed to determine
karakteristik tes sesuai untuk peserta tes if the test characteristics are appropriate for
(misalnya, usia, tingkat kelas, bahasa, latar the test taker (e.g., age, grade level, language,
belakang budaya). cultural background).

87. • Apakah akomodasi digunakan untuk • Were accommodations employed for special
kelompok khusus? Jika ya, modifikasi apa groups? If so, what modifications were made?
yang dilakukan? Apakah individu penyandang Were individuals with disabilities considered?
disabilitas dipertimbangkan? Bagaimana? How? For instance, were alternative measures
Misalnya, apakah tindakan alternatif found and used? Were accommodations in
ditemukan dan digunakan? Apakah test-taking procedures employed? How did
akomodasi dalam prosedur joki ujian any change in procedure affect
diterapkan? Bagaimana perubahan prosedur interpretations?
mempengaruhi interpretasi?
88. • Apakah karakteristik yang terkait dengan • Were characteristics related to test fairness
keadilan tes dipertimbangkan? Perhatian considered? Care should be taken to make
harus diberikan untuk memastikan bahwa tes certain that the test is fair, that is, that the
tersebut adil, yaitu bahwa tes tersebut tidak test does not bias the results for special-needs
membiaskan hasil untuk siswa berkebutuhan students. Some characteristics of situations
khusus. Beberapa karakteristik situasi may be unrelated (e.g., age, ethnic
mungkin tidak terkait (misalnya, usia, latar background, existence of cheating) to what is
belakang etnis, adanya kecurangan) dengan being measured but nevertheless may bias
apa yang sedang diukur, namun hasil results so that they convey invalid
mungkin bias sehingga menyampaikan information. In instructional situation, fairness
informasi yang tidak valid. Dalam situasi also relates to whether or not the student has
pembelajaran, keadilan juga berkaitan had an opportunity to learn or has had
dengan apakah siswa memiliki kesempatan unequal availability of test-preparation
untuk belajar atau ketersediaan program programs.
persiapan ujian yang tidak merata.
89. Informasi Terkait Interpretasi Tes Information Related to Test Interpretation
90. Apa pun peran yang dimainkan seseorang Whatever role one might play in the use of
dalam penggunaan tes standar, tes tersebut standardized tests, they must be interpreted
harus ditafsirkan secara bertanggung jawab. responsibly. Interpretation requires
Interpretasi membutuhkan pengetahuan knowledge about and experience with the
tentang dan pengalaman dengan tes, skor, test, the scores, and the decisions to be made.
dan keputusan yang akan dibuat. Interpretasi Interpretation of scores on any test should not
nilai pada setiap tes tidak boleh dilakukan take place without a thorough knowledge of
tanpa pengetahuan yang mendalam tentang the technical aspects of the test, the test
aspek teknis tes, hasil tes, dan batasannya. results, and their limitations. Many factors can
Banyak faktor yang dapat memengaruhi impact the valid and useful interpretations of
interpretasi nilai tes yang valid dan berguna. test scores. Reviews will contain some
Review akan berisi beberapa pertimbangan consideration of these factors, which can be
dari faktor-faktor ini, yang dapat grouped into several categories including test
dikelompokkan menjadi beberapa kategori characteristics, knowledge of the respondents
termasuk karakteristik tes, pengetahuan (test takers), and the situations in which the
responden (peserta tes), dan situasi di mana test is given.
tes diberikan.
91. • Tes dan Karakteristiknya. Faktor yang • The Test and Its Characteristics. The factors
dijelaskan dalam Kotak Teks 8.1 penting saat described in Text Box 8.1 are important when
menafsirkan hasil tes. Ciri-ciri dasar tes ini interpreting test results. These basic
harus diketahui, begitu juga dengan cara characteristics of a test should be known, as
masing-masing mempengaruhi skor dan should the way each impacts the scores and
interpretasi hasil tes. the interpretation of test results.

92. • Karakteristik Peserta Tes. Kami telah • The Characteristics of the Test Takers. We
menyentuh peserta tes di sejumlah bagian have touched on the test taker in a number of
buku ini serta di bagian sebelumnya dari sections of this book as well as in the
Kotak Teks ini. Jika Anda mengetahui bahwa foregoing sections of this Text Box. If you
tes tersebut memerlukan interpretasi khusus know that the test requires special
untuk kebutuhan khusus atau persyaratan interpretation for special needs or similar
serupa, lihat ulasan untuk keanggotaan grup requirements, then look in the review for
(kurikulum yang berbeda, kebutuhan khusus, group memberships (different curricula,
tujuan yang berbeda) dan bagaimana special needs, different aims) and how that
keanggotaan tersebut dapat mempengaruhi membership may impact the results of the
hasil tes. Ini merupakan faktor penting dalam test. It is a critical factor in the interpretation
interpretasi hasil tes untuk mengetahui of test results to know that the test norms are
bahwa norma tes didasarkan pada siswa based on vocational students rather than
kejuruan daripada siswa berorientasi college-oriented students; that they are based
perguruan tinggi; bahwa mereka didasarkan on ethnic groups with a language other than
pada kelompok etnis dengan bahasa selain English as their first language rather than one
bahasa Inggris sebagai bahasa pertama in which English is the first language; or that
mereka, bukan bahasa di mana bahasa Inggris the test is a measure of a content-area
adalah bahasa pertama; atau bahwa standard rather than a local standard.
pengujian tersebut adalah ukuran standar Specifically, you will want to interpret test
area konten, bukan standar lokal. Secara results by the evidence regarding the impact
khusus, Anda akan ingin menginterpretasikan of gender, age, ethnicity, race, socioeconomic
hasil tes berdasarkan bukti mengenai dampak status, and so forth.
jenis kelamin, usia, etnis, ras, status sosial
ekonomi, dan sebagainya.
93. • Karakteristik Situasi. Fitur ini • The Characteristics of the Situation. This
memperhitungkan bahwa hasil pada tes apa feature takes into account that the results on
pun akan secara unik dipengaruhi oleh any test will be uniquely affected by the local
konteks lokal. Hasil tes akan mencerminkan context. Test results will reflect the local
program pembelajaran lokal, kesempatan instructional program, opportunity to learn,
untuk belajar, kualitas program pendidikan, quality of the educational program, work and
lingkungan kerja dan rumah, dan faktor home environment, and other factors. Find as
lainnya. Temukan informasi sebanyak much information about the test as possible
mungkin tentang tes untuk membantu Anda to assist you in understanding the limitations
memahami batasan dalam menafsirkan hasil in interpreting test results. For example, a test
tes. Misalnya, tes yang tidak selaras dengan that is not aligned to curriculum standards and
standar kurikulum dan bagaimana standar how those standards are taught in the
tersebut diajarkan di kelas kemungkinan classroom will likely provide limited useful
besar akan memberikan informasi berguna information or, at the least, will limit the
yang terbatas atau, paling tidak, akan extent to which they can be interpreted
membatasi sejauh mana standar tersebut correctly.
dapat diinterpretasikan dengan benar.
94. Informasi tentang Mengkomunikasikan Hasil Information about Communicating Test
Tes Results
95. Komunikasi yang diinformasikan tentang hasil Informed communication of test results rests
tes bertumpu pada dasar pemahaman dasar- on a foundation of understanding the basics of
dasar pengukuran dan penilaian, landasan measurement and assessment, an informed
informasi konstruksi dan interpretasi tes, dan foundation of test construction and
pemahaman tentang tes tertentu yang dipilih interpretation, and an understanding of a
atau digunakan. Landasan ini dapat particular test selected or used. This
disediakan sebagian oleh manual tes dan foundation can be provided in part by the test
dilengkapi dengan sumber daya seperti Buku manual and supplemented by such resources
Tahunan Pengukuran Mental Buros atau as the Buros Mental Measurements Yearbook
dengan tinjauan tes di jurnal profesional dan or by reviews of tests in professional and
teknis. technical journals.
96. Pada akhirnya, hasil tes dan interpretasinya Ultimately, test results and their
harus disampaikan dalam bahasa yang dapat interpretations must be conveyed in a
dipahami oleh pengguna akhir, baik siswa, language that end users, whether students,
orang tua, guru, anggota masyarakat, anggota parents, teachers, community members,
dewan, atau masyarakat umum. Bahasa yang legislators, or the general public can
digunakan adalah elemen kunci dalam understand. The language used is a key
membantu orang lain memahami arti dari element in helping others understand the
hasil tes. Oleh karena itu, penting dalam meaning of the test results. It is essential,
pemilihan tes untuk memastikan bahwa tes then, in the selection of tests to make certain
yang dipilih cukup dipahami dengan baik that the test selected is sufficiently well
sehingga dapat diinterpretasikan dengan cara understood that it can be interpreted in a
yang akan berguna bagi semua pihak. manner that will be useful to all concerned.
Beberapa suplemen dengan informasi latar Some supplementation with background
belakang dapat membantu menjelaskan hasil information can help explain the results with
dengan hati-hati tentang salah tafsir. Tinjauan cautions about misinterpretations. Reviews
akan membantu pengguna tes membuat will help the test user make decisions about
keputusan tentang sejauh mana komunikasi the extent to which the communication can be
dapat dibuat dengan menunjukkan made by indicating how the test results can be
bagaimana hasil tes dapat dan tidak boleh and should not be interpreted.
diinterpretasikan.
97. Sumber: Berdasarkan American Counseling Source: Based on American Counseling
Association (2003); Komite Bersama Praktik Association (2003); Joint Committee on
Pengujian (2007); dan Wall, Augustin, Eberly, Testing Practices (2007); and Wall, Augustin,
Erford, Lundberg, & Vansickle (2003). Eberly, Erford, Lundberg, & Vansickle (2003).

98. Mencari berdasarkan Judul Tes


Searching by the Title of the Test
99. Gunakan Indeks Judul, yang mencantumkan Use the Index of Titles, which lists all the titles
semua judul yang termasuk dalam volume. Ini included in the volume. It includes cross-
mencakup referensi silang untuk pengujian references for tests with superseded or
dengan judul yang digantikan atau alternatif. alternative titles. (The Index of Acronyms is an
(Indeks Akronim adalah indeks alternatif. Ini alternative index. It lists tests sometimes
mencantumkan tes yang terkadang lebih better known by their acronyms than their full
dikenal dengan akronimnya daripada judul titles; SAT and MAT are examples.)
lengkapnya; SAT dan MAT adalah contoh.)
100. Ketika Anda menemukan judul tes dalam When you find the test title in the index, the
indeks, angka-angka yang mengikuti judul numbers immediately following the title refer
mengacu pada nomor entri, bukan nomor to entry numbers, not page numbers. Turn to
halaman. Bukalah item bernomor itu dan that numbered item and you will find the
Anda akan menemukan informasi yang information available on that test. Often, too,
tersedia pada tes itu. Seringkali, juga, Anda you will find a letter notation following the
akan menemukan notasi huruf mengikuti name of the test: (N) indicates a new, recently
nama tes: (N) menunjukkan tes baru yang published test; (R) means that it has been
diterbitkan; (R) berarti telah direvisi atau revised or supplemented since its last
ditambah sejak kemunculan terakhirnya appearance in an MMY.
dalam MMY.
101. Berikut adalah contoh dari Indeks Judul MMY: Here is an example from the MMY’s Index of
Titles:
102. Tes Slosson untuk Kesiapan Membaca, 360 Slosson Test of Reading Readiness, 360 (N)
(N) Social Behavior Assessment Inventory, 361 (R)
Inventaris Penilaian Perilaku Sosial, 361 (R) Social Climate Scales, see Family Environment
Skala Iklim Sosial, lihat Skala Lingkungan Scale, Second Ed., 151
Keluarga, Edisi Kedua, 151 Social Skills Rating System, 362 (N)
Sistem Penilaian Keterampilan Sosial, 362 (N) Softball Skills Test, 363 (N)
Tes Keterampilan Softball, 363 (N)
103. Menelusuri berdasarkan Jenis Tes
Searching by the Type of Test
104. Gunakan Indeks Subjek yang Diklasifikasikan Use the Classified Subject Index to locate
untuk menemukan berbagai kategori tes, various categories of tests, such as
seperti tes prestasi, kecerdasan, dan achievement, intelligence, and personality
kepribadian. Indeks ini mengatur semua tes tests. This index organizes all tests into 18
menjadi 18 kategori area konten utama; tes major content area categories; tests appear
muncul menurut abjad dalam setiap kategori. alphabetically within each category. As you
Seperti yang Anda lihat pada contoh berikut, can see in the following example, the
populasi yang menjadi tujuan pengujian juga population for which the test is intended is
terdaftar. Sekali lagi perlu diingat bahwa also listed. Again keep in mind that citation
nomor kutipan mengacu pada nomor entri, numbers refer to entry numbers, not to page
bukan nomor halaman. numbers.

105. Penilaian Diagnostik Membaca, Kelas 1–12, Diagnostic Assessments of Reading, Grades 1–
lihat 115 12, see 115
Tes Bacaan Lisan Abu-abu, Edisi Ketiga, Usia Gray Oral Reading Tests, Third Edition, Ages 7–
7–0 hingga 18–11, lihat 166 0 to 18–11, see 166
Tes Keterampilan Membaca dan Prestasi Group Diagnostic Reading Aptitude and
Membaca Diagnostik Grup, Bentuk Achievement Tests, Intermediate Form,
Menengah, Kelas 3–9, lihat 170 Grades 3–9, see 170
Tes Membaca Kelompok, Edisi Ketiga, Usia 6– Group Reading Test, Third Edition, Ages 6–4 to
4 hingga 11–11 dan 8–0 hingga 11–11 — di 11–11 and 8–0 to 11–11—below average, see
bawah rata-rata, lihat 171 171
Johnston Informal Reading Inventory, Kelas Johnston Informal Reading Inventory, Grades
7–12, lihat 202 7–12, see 202
106. Menelusuri berdasarkan Nama Penulis Tes
atau Peninjau Searching by the Name of a Test Author
or Reviewer
107. Di sini Anda akan menggunakan Indeks Nama. Here you will use the Index of Names.
Mengikuti setiap nama, indeks ini memberi Following each name, this index tells you what
tahu Anda jenis materi apa yang terlibat: kind of material is involved: “test” refers to a
"test" mengacu pada penulis tes, "rev" untuk test author, “rev” to a review author, and
penulis review, dan "ref" untuk penulis artikel “ref” to the author of a referenced article.
yang direferensikan. Sekali lagi, perhatikan Again, note that numbers refer to entry
bahwa angka mengacu pada nomor entri. numbers. You may also find numbers in
Anda juga dapat menemukan angka dalam parentheses. These refer to another
tanda kurung. Ini mengacu pada tes numbered test in the volume that you can
bernomor lain dalam volume yang dapat turn to if you wish. An “r,” on the other hand,
Anda putar jika Anda mau. Di sisi lain, "r", indicates there is a reference cited by the
menunjukkan ada referensi yang dikutip oleh reviewer, but it is not a numbered reference
pengulas, tetapi itu bukan referensi in the volume. Here is a sample from the Index
bernomor di volume. Berikut adalah contoh of Names:
dari Indeks Nama:
108. Dewey, D.: ref, 353(16) Dewey, M. E.: ref, Dewey, D.: ref, 353(16) Dewey, M. E.: ref,
159(75) DeZolt, D. M.: rev, 68 159(75) DeZolt, D. M.: rev, 68
Diack, H.: ref, 277r Diaferia, G.: ref, 343(78) Diack, H.: ref, 277r Diaferia, G.: ref, 343(78)
Dial, J. G.: test, 284 Dial, J. G.: test, 284
Diamond, E. E.: rev, 258, 328 Diamond, E. E.: rev, 258, 328
Diamond, F.: ref, 36r Diamond, R.: ref, Diamond, F.: ref, 36r Diamond, R.: ref,
343(138) Dick, H.: ref, 343(193) 343(138) Dick, H.: ref, 343(193)
109. Menggunakan Situs Web Buros Institute
Using the Buros Institute Website
110. Selain MMY yang dicetak, Anda dapat In addition to the printed MMY, you can
memperoleh informasi dari situs Buros obtain information from the Buros Institute
Institute (www.unl.edu/buros/). Bagian website (www.unl.edu/buros/). A section
bernama Test Reviews Online menautkan ke called Test Reviews Online links to both an
daftar alfabet nama pengujian dan daftar alphabetical list of test names and a list of
pengujian menurut kategori. Halaman ini juga tests by category. This page also allows you to
memungkinkan Anda untuk mencari search by keywords. For example, the
berdasarkan kata kunci. Misalnya, pencarian keyword search “stress response” finds,
kata kunci "respons stres" menemukan, di among other entries, the Stress
antara entri lain, Stres
111. Skala Respon, ukuran status emosional anak Response Scale, a measure of children’s
yang dikembangkan oleh Louis A. Chandler. emotional status developed by Louis A.
Chandler.
112. Ketika Anda menemukan tes di situs web, klik When you find a test on the website, click on
namanya untuk melihat deskripsi singkatnya, the name to see a brief description of it, as
seperti yang ditunjukkan pada Gambar 8.1. shown in Figure 8.1. From this screen, you can
Dari layar ini, Anda dapat memesan ulasan order a full review for a small fee. As noted in
lengkap dengan sedikit biaya. Sebagaimana Text Box 8.4, the web is a useful, but not
dicatat dalam Kotak Teks 8.4, web adalah exclusive, resource when searching for
sumber daya yang berguna, tetapi tidak information about tests.
eksklusif, ketika mencari informasi tentang
pengujian.
113.

114. Gambar 8.1. Deskripsi Skala Respon Stres dari Figure 8.1. Description of the Stress Response
situs Buros Institute. Digunakan atas izin. Scale from the Buros Institute website. Used
by permission.
115. Kotak Teks 8.4 Mengapa Tidak Mengandalkan
Pencarian Web? Text Box 8.4 Why Not Rely on Web
Searches?
116. Seperti yang ditunjukkan oleh diskusi kami As our discussion of the Buros and ETS
tentang situs web Buros dan ETS, Anda dapat websites indicates, you can find a lot of
menemukan banyak informasi bagus tentang excellent information about formal
langkah-langkah penilaian formal online. assessment measures online. In fact, if you
Faktanya, jika Anda bertanya kepada were to ask undergraduate students how they
mahasiswa sarjana bagaimana mereka bisa might get information regarding tests and
mendapatkan informasi mengenai tes dan assessments (or most anything else for that
penilaian (atau hampir semua hal lainnya), matter), they would most likely say they
mereka kemungkinan besar akan mengatakan would search online with a search engine such
bahwa mereka akan mencari secara online as Google (www.google.com/) or Yahoo!
dengan mesin pencari seperti Google (www.yahoo.com/). Why shouldn’t you get all
(www.google. com /) atau Yahoo! your information that way? Why bother going
(www.yahoo.com/). Mengapa Anda tidak to the Buros database or any other standard
mendapatkan semua informasi seperti itu? site for educational assessment?
Mengapa repot-repot membuka database
Buros atau situs standar lainnya untuk
penilaian pendidikan?
117. Meskipun tidak ada yang salah dengan Although there is nothing wrong with online
pencarian online, masalahnya adalah bahwa searches, the problem is that ordinary search
mesin pencari biasa tidak tunduk pada ulasan engines are not subject to formal or informal
formal atau informal, yang berarti Anda harus reviews, which means that you have to serve
menjadi ahli internal saat meninjau materi. as the in-house expert when reviewing the
Dan, karena beberapa mesin telusur material. And, because some search engines
mengambil anggaran iklan sebagai imbalan take advertising budgets in return for the way
atas cara situs web menampilkan hasil websites display search results, the hits you
penelusuran, klik yang Anda lihat mungkin view may be a function of how advertising
merupakan fungsi dari cara pengeluaran uang dollars are spent.
periklanan.
118. Sebagai contoh, kami melakukan penelusuran As an example, we did a search for “psychic
untuk "tes kekuatan psikis" di Google (situs powers test” on Google (a site containing an
yang berisi indeks miliaran dokumen berbasis index of billions of web-based documents). In
web). Dalam 130 milidetik, kami memperoleh 130 milliseconds, we obtained information on
informasi tentang 76.800 dokumen! Salah 76,800 documents! One of our hits was the
satu hits kami adalah situs Bella Online site Bella Online (www.bellaonline.com) which
(www.bellaonline.com) yang menawarkan offers a Psychic Test and Quiz. Whether you
Tes Psikis dan Kuis. Apakah Anda percaya believe in psychic powers or not, you might
pada kekuatan psikis atau tidak, Anda think this is a genuine attempt to test for such
mungkin berpikir ini adalah upaya tulus untuk powers. Upon further investigation, though,
menguji kekuatan semacam itu. Namun, you will find, buried in the website, an
setelah penyelidikan lebih lanjut, Anda akan acknowledgement that the test is a humorous
menemukan, terkubur di situs web, prank. If you failed to scrutinize the material
pengakuan bahwa tes tersebut adalah lelucon carefully, you might have believed that the
yang lucu. Jika Anda gagal meneliti materi test had some foundation to it.
dengan cermat, Anda mungkin percaya
bahwa tes tersebut memiliki dasar.
119.

120. Gambar 8.2. Daftar sebagian hasil pencarian Figure 8.2. A partial listing of the results of the
kata kunci "sains" di database ETS TestLink. keyword search “science” in the ETS TestLink
database.
121. ■ Koleksi Tes ETS
■ The ETS Test Collection
122. Koleksi Tes ETS adalah database lebih dari The ETS Test Collection is a database of over
20.000 tes dan instrumen penilaian dari 20,000 tests and assessment instruments from
seluruh dunia berbahasa Inggris. Koleksinya throughout the English-speaking world. The
kurang formal daripada yang tercantum collection is less formal than that listed in the
dalam MMY karena banyak penilaian belum MMY because many of the assessments have
dipublikasikan atau ditinjau secara resmi. Tes not been published or formally reviewed. A
dalam jumlah terbatas sebenarnya dapat limited number of the tests can actually be
diunduh dari situs web ETS dengan biaya yang downloaded from the ETS website for a
murah. modest fee.
123. Untuk menggunakan koleksi tes ini, kunjungi To use this test collection, go online to the ETS
situs ETS TestLink secara online TestLink homepage
(www.ets.org/testcoll/index.html), klik (www.ets.org/testcoll/index.html), click on
tombol pencarian, dan pilih jenis pencarian the search button, and choose the type of
yang Anda inginkan. Biasanya Anda ingin search you want. Usually you will want to
mencari berdasarkan judul, pengarang, atau search by title, by author, or by descriptor
deskriptor (kata kunci). Gambar 8.2 (keyword). Figure 8.2 shows a partial listing of
menunjukkan sebagian daftar hasil the search results obtained with the
penelusuran yang diperoleh dengan descriptor “science.” When your search
deskriptor "sains". Saat hasil pencarian Anda results appear, you can click on the name of a
muncul, Anda dapat mengklik nama tes untuk test to learn more about it.
mempelajarinya lebih lanjut.
124. ■ ERIC
■ ERIC
125. Pusat Informasi Sumber Daya Pendidikan The Educational Resources Information Center
(ERIC®) adalah sistem informasi nasional yang (ERIC®) is a national information system
dirancang untuk menyediakan akses siap designed to provide ready access to an
pakai ke banyak literatur terkait pendidikan. extensive body of education-related literature.
ERIC, didirikan pada tahun 1966, diatur ERIC, established in 1966, is organized by
menurut topik topik. Ini menyediakan indeks topical areas. It provides an index of major
jurnal utama terkait pendidikan dan berfungsi educationally related journals and serves as a
sebagai gudang untuk monografi akademik, repository for academic monographs, reports,
laporan, dan makalah. ERIC juga menugaskan and papers. ERIC also commissions internally
laporan yang dihasilkan secara internal generated reports on topics of interest to
tentang topik yang menarik bagi para educators.
pendidik.
126. Yang menarik dalam bab ini, adalah basis data Of particular interest in this chapter, is the
pencari lokasi tes ERICAE.net, yang akan ERICAE.net test locator database, which will
membantu Anda menemukan penilaian yang help you locate assessments that were
dimasukkan sebagai bagian dari artikel jurnal incorporated as part of a journal article or
atau ditambahkan ke laporan penelitian were appended to selected research reports.
tertentu.
127. Untuk mengilustrasikan penggunaannya, To illustrate its use, let’s assume you wanted
anggap saja Anda ingin menemukan tes to find a test on math anxiety. You would first
kecemasan matematika. Pertama-tama Anda go to the address www.eric.gov. Then go to
akan pergi ke alamat www.eric.gov. Lalu pergi Advanced Search. Enter the keyword “math
ke Pencarian Lanjutan. Masukkan kata kunci anxiety,” and under Publication Types, click on
"kecemasan matematika", dan di bawah Jenis “tests/questionnaires.” You would then view a
Publikasi, klik "tes / kuesioner". Anda screen similar to that shown in Figure 8.3.
kemudian akan melihat layar yang mirip
dengan yang ditunjukkan pada Gambar 8.3.
128. Pencarian akan menghasilkan beberapa opsi, The search will produce several options, as
seperti yang ditunjukkan pada Gambar 8.4. shown in Figure 8.4.
129. Dari hasil pencarian, Anda bisa mendapatkan From the search result, you can obtain a
kutipan atau, untuk entri yang lebih baru, citation or, for more recent entries, the full
teks pdf lengkap dari artikel atau instrumen pdf text of the article or instrument.
tersebut.
130. ■ Standar Pendidikan
■ Standards for Educational
131. Pengujian Psikologis Psychological Testing
132. The Standards for Educational and The Standards for Educational and
Psychological Testing (AERA, APA, & NCME, Psychological Testing (AERA, APA, & NCME,
1999) adalah sintesis dari upaya beberapa 1999) is a synthesis of the efforts of several
kelompok untuk mengatur penggunaan tes groups to govern the use of tests in education
dalam pendidikan dan psikologi. Pedoman and psychology. The guidelines were
tersebut dikembangkan terutama oleh tiga developed mainly by three organizations: the
organisasi: American Educational Research American Educational Research Association
Association (AERA), American Psychological (AERA), the American Psychological
Association (APA), dan National Council on Association (APA), and the National Council on
Measurement in Education (NCME). Selain Measurement in Education (NCME). In
itu, lebih dari 60 organisasi lain terlibat dalam addition, more than 60 other organizations
meninjau Standar untuk edisi 1999. Standar were involved in reviewing the Standards for
berkembang selama periode 50 tahun. Sangat the 1999 edition. The Standards evolved over
mungkin bahwa mereka akan terus a 50-year period. It is quite likely that they will
dimodifikasi untuk menanggapi perubahan continue to be modified in response to
adat istiadat dan kepekaan. changing mores and sensitivities.
133. Dengan banyaknya institusi yang terlibat baik With the number of institutions involved in
dalam pengembangan dan peninjauan, jelas both development and review, it is obvious
bahwa Standar menjangkau khalayak yang that the Standards reaches a wide audience.
luas. Namun demikian, kecil kemungkinan Nevertheless, it is unlikely that any
bahwa setiap peserta dalam audiens participants in that audience, whether large
tersebut, baik perusahaan penguji besar atau testing companies or individual teachers, can
guru individu, dapat 100 persen setia pada be 100 percent faithful to each and every
setiap pedoman. Bahkan dengan tes yang guideline. Even with tests that have been
telah diterbitkan selama beberapa tahun, published for a number of years, the
akumulasi bukti adalah proses yang tidak accumulation of evidence is a never-ending
pernah berakhir. Sebuah studi yang dilakukan process. A study conducted in 1986, for
pada tahun 1986, misalnya, mungkin perlu example, may need to be replicated in the
direplikasi pada tahun 2000-an untuk 2000s to determine whether changes in
menentukan apakah perubahan dalam population demographics affect the norms or
demografi populasi mempengaruhi norma other characteristics of the test.
atau karakteristik lain dari tes tersebut.
134. Namun, pentingnya Standar terletak pada Still, the importance of the Standards lies in
kriteria yang ditawarkan untuk menilai the criteria they offer for judging the
kegunaan tes untuk tujuan tertentu. Standar usefulness of a test for given purposes. The
membahas pentingnya bukti terkait Standards discuss the importance of evidence
keandalan dan objektivitas, misalnya. Mereka regarding reliability and objectivity, for
juga mencakup topik seperti pengembangan example. They also cover topics such as test
dan revisi tes, metode administrasi dan development and revision, methods of test
penilaian tes, dan hak dan tanggung jawab administration and scoring, and the rights and
peserta tes. responsibilities of test takers.
135. Sebagai demonstrasi cara kriteria Standar As a demonstration of the way the Standards’
diterapkan, pertimbangkan dua standar criteria are applied, consider the following two
berikut dari Bagian I: Konstruksi Uji, Evaluasi, standards from Part I: Test Construction,
dan Dokumentasi: Evaluation, and Documentation:
136. Norma yang disajikan harus mengacu pada Norms that are presented should refer to
kelompok yang dijelaskan dengan jelas. clearly described groups. These groups should
Kelompok-kelompok ini haruslah orang-orang be the ones with whom users of the test will
yang biasanya ingin dibandingkan dengan ordinarily wish to compare the people who
orang-orang yang diuji oleh pengguna tes. are tested. (p. 33)
(hal. 33)
137. Laporan studi norming harus mencakup Reports of norming studies should include the
tahun di mana data normatif dikumpulkan, year in which normative data were collected,
memberikan statistik deskriptif, dan provide descriptive statistics, and describe the
mendeskripsikan desain pengambilan sampel sampling design and participation rates in
dan tingkat partisipasi secara cukup rinci sufficient detail so that the study can be
sehingga studi tersebut dapat dievaluasi evaluated for appropriateness. (p. 33)
kesesuaiannya. (hal. 33)
138. Penerapan kriteria pertama mendorong revisi The application of the first criterion prompted
Tes Kosakata Gambar Peabody (PPVT) yang a revision of the widely used Peabody Picture
banyak digunakan. PPVT, yang seolah-olah Vocabulary Test (PPVT). The PPVT, ostensibly
merupakan ukuran kecerdasan non-lisan a non-oral (nonvocal) measure of intelligence,
(nonvokal), pada awalnya dirancang untuk was originally designed for developmentally
anak-anak AS yang mengalami keterlambatan delayed U.S. children. The measure had been
perkembangan. Ukuran tersebut telah standardized (normed) on 2,000 white
distandarisasi (normatif) pada 2.000 anak children from rural Kentucky. Because of its
kulit putih dari pedesaan Kentucky. Karena ease in administration, however, the
kemudahan dalam administrasi, instrument became very popular as an
bagaimanapun, instrumen menjadi sangat assessment for immigrant children during the
populer sebagai penilaian untuk anak-anak late 1970s and early 1980s. But comparing the
imigran selama akhir 1970-an dan awal 1980- scores of immigrant children, such as
an. Tetapi membandingkan skor anak-anak Vietnamese refugees, with those of a
imigran, seperti pengungsi Vietnam, dengan normative group of students in Kentucky
skor kelompok siswa normatif di Kentucky clearly failed to comply with the provision that
jelas gagal untuk memenuhi ketentuan the normative groups should be a good match
bahwa kelompok normatif harus cocok for the actual test takers.
dengan peserta tes yang sebenarnya.
139. Menanggapi kritik tersebut, penerbit tes In response to such criticisms, the test
mengumpulkan data tambahan dengan publishers collected additional data with the
penilaian, menggunakan sampel yang lebih assessment, using a more diverse sample to
beragam untuk memastikan keselarasan yang ensure greater alignment between the norms
lebih besar antara norma dan populasi yang and the populations to whom the test was
menerima tes. Laporan penerbit juga being administered. The publishers’ report
memenuhi standar kedua yang dikutip di also complied with the second standard
atas; itu menjelaskan proses pengambilan quoted above; it described the sampling and
sampel dan norming secara rinci sehingga norming process in detail so that users could
pengguna dapat membuat penilaian yang make an informed judgment about the test’s
tepat tentang kegunaan tes. Standar untuk usefulness. The standards for educational and
tes pendidikan dan psikologi diilustrasikan psychological tests are illustrated in Text Box
dalam Kotak Teks 8.5. Sewaktu Anda 8.5. As you study the illustrations you will see
mempelajari ilustrasi tersebut, Anda akan the implementation of important test
melihat implementasi dari karakteristik tes characteristics. Please visit the source if you
yang penting. Silakan kunjungi sumbernya jika wish to see the complete document. It
Anda ingin melihat dokumen lengkapnya. Ini provides a guide for test constructors and test
memberikan panduan untuk konstruktor publishers alike, and is a useful guide for the
pengujian dan penerbit pengujian, dan selection of tests.
merupakan panduan yang berguna untuk
pemilihan pengujian.
140.

141. Gambar 8.3. Pencarian untuk "kecemasan Figure 8.3. A search for “math anxiety” using
matematika" menggunakan ERIC. ERIC.
142.

143. Gambar 8.4. Hasil pencarian. Figure 8.4. The search result.
144. Kotak Teks 8.5 Contoh dari Standar Tes
Pendidikan dan Psikologis Text Box 8.5 An Example from The
Standards for Educational and
Psychological Testing
145. Perhatikan bahwa ini sedang direvisi. Note that this is currently being revised.
146. Menguji Individu dengan Latar Belakang Testing Individuals of Diverse Linguistic
Linguistik yang Beragam Backgrounds
147. Standar 9.1 Praktik pengujian harus dirancang Standard 9.1 Testing practice should be
untuk mengurangi ancaman terhadap designed to reduce threats to the reliability
reliabilitas dan validitas kesimpulan skor tes and validity of test score inferences that may
yang mungkin timbul dari perbedaan bahasa. arise from language differences.
148. Standar 9.2 Ketika bukti penelitian yang Standard 9.2 When credible research evidence
kredibel melaporkan bahwa skor tes berbeda reports that test scores differ in meaning
dalam arti di antara subkelompok peserta tes across subgroups of linguistically diverse test
yang beragam secara linguistik, maka sejauh takers, then to the extent feasible, test
memungkinkan, pengembang tes harus developers should collect for each linguistic
mengumpulkan untuk setiap subkelompok subgroup studied the same form of validity
linguistik mempelajari bentuk yang sama dari evidence collected for the examinee
bukti validitas yang dikumpulkan untuk population as a whole.
populasi peserta ujian secara keseluruhan .
149. Standar 9.3 Saat menguji ahli ujian dalam dua Standard 9.3 When testing an examinee
atau lebih bahasa yang tesnya tersedia, proficient in two or more languages for which
kemahiran bahasa relatif peserta ujian harus the test is available, the examinee’s relative
ditentukan. Tes secara umum harus diberikan language proficiencies should be determined.
dalam bahasa yang paling mahir bagi peserta The test generally should be administered in
tes, kecuali kemahiran dalam bahasa yang the test taker’s most proficient language,
kurang mahir menjadi bagian dari penilaian. unless proficiency in the less proficient
language is part of the assessment.
150. Standar 9.4 Modifikasi linguistik yang Standard 9.4 Linguistic modifications
direkomendasikan oleh penerbit tes, serta recommended by test publishers, as well as
rasional untuk modifikasi, harus dijelaskan the rational for the modifications, should be
secara rinci dalam manual tes. described in detail in the test manual.
151. Standar 9.5 Jika ada bukti yang dapat Standard 9.5 When there is credible evidence
dipercaya tentang perbandingan skor di of score comparability across regular and
seluruh tes atau administrasi reguler dan modified tests or administrations, no flag
yang dimodifikasi, tidak ada tanda yang harus should be attached to a score. When such
dilampirkan ke skor. Jika bukti semacam itu evidence is lacking, specific information about
kurang, informasi spesifik tentang sifat the nature of the modifications should be
modifikasi harus disediakan, jika diizinkan provided, if permitted by law, to assist test
oleh hukum, untuk membantu pengguna tes users properly to interpret and act on test
dengan tepat untuk menafsirkan dan scores.
bertindak berdasarkan nilai tes.
152. Standar 9.6 Ketika tes direkomendasikan Standard 9.6 When a test is recommended for
untuk digunakan dengan peserta tes yang use with linguistically diverse test takers, test
memiliki bahasa yang beragam, pengembang developers and publishers should provide the
dan penerbit tes harus memberikan informasi information necessary for appropriate test use
yang diperlukan untuk penggunaan dan and interpretation.
interpretasi tes yang tepat.
153. Standar 9.7 Ketika sebuah tes diterjemahkan Standard 9.7 When a test is translated from
dari satu bahasa ke bahasa lain, metode yang one language to another, the methods used in
digunakan dalam menetapkan kecukupan establishing the adequacy of the translation
terjemahan harus dijelaskan, dan bukti should be described, and empirical and logical
empiris dan logis harus disediakan untuk evidence should be provided for score
reliabilitas skor dan validitas kesimpulan skor reliability and the validity of the translated
tes yang diterjemahkan untuk penggunaan test’s score inferences for the uses intended in
dimaksudkan dalam kelompok linguistik yang the linguistic groups to be tested.
akan diuji.
154. Standar 9.8 Dalam pengujian ketenagakerjaan Standard 9.8 In employment and credentialing
dan pengesahan, tingkat kemahiran yang testing, the proficiency level required in the
disyaratkan dalam bahasa ujian tidak boleh language of the test should not exceed that
melebihi yang sesuai dengan pekerjaan atau appropriate to the relevant occupation or
profesi yang relevan. profession.
155. Standar 9.9 Ketika beberapa versi bahasa dari Standard 9.9 When multiple language versions
suatu tes dimaksudkan untuk menjadi of a test are intended to be comparable, test
pembanding, pengembang tes harus developers should report evidence of test
melaporkan bukti perbandingan tes. comparability.
156. Standar 9.10 Kesimpulan tentang kemahiran Standard 9.10 Inferences about test takers’
bahasa umum peserta tes harus didasarkan general language proficiency should be based
pada tes yang mengukur berbagai fitur on tests that measure a range of language
bahasa, dan bukan pada satu keterampilan features, and not on a single linguistic skill.
linguistik.
157. Standar 9.11 Ketika penerjemah digunakan Standard 9.11 When an interpreter is used in
dalam pengujian, penerjemah harus fasih testing, the interpreter should be fluent in
dalam bahasa tes dan bahasa asli peserta both the language of the test and the
ujian, harus memiliki keahlian dalam examinee’s native language, should have
menerjemahkan, dan harus memiliki expertise in translating, and should have a
pemahaman dasar tentang proses penilaian. basic understanding of the assessment
process.
158. Sumber: American Educational Research Source: American Educational Research
Association et al. (1999). Association et al. (1999).
159. ■ Tes Standar dan Penilaian Kelas
■ Standardized Tests and
Classroom Assessments
160. Tes standar penting sebagai salah satu Standardized tests are important as one
sumber data penilaian. Namun, mereka source of assessment data. However, they do
biasanya tidak menggantikan tes kelas buatan not ordinarily substitute for the teachermade
guru. Menggunakan tes formal untuk tujuan classroom test. Using formal tests for
instruksional dapat menciptakan masalah instructional purposes can create problems of
interpretasi (Elmore & Rothman, 1999). interpretation (Elmore & Rothman, 1999).
Bahkan jika tes dimodifikasi untuk Even if a test is modified for particular
penggunaan instruksional tertentu di kelas, instructional use in a classroom, the test score
skor tes mungkin disalahartikan sebagai might be misinterpreted as representing what
mewakili apa yang sebenarnya telah diajarkan had actually been taught in the classroom,
di kelas, dengan konsekuensi potensi with the consequent potential for errors in its
kesalahan dalam implikasinya untuk implications for designing instruction or
merancang instruksi atau intervensi. interventions.
161. Sesuai dengan praktik umum yang dianjurkan In keeping with general practices advocated
di seluruh teks ini, kami mengulangi poin ini: throughout this text, we reiterate this point:
Tidak ada satu sumber informasi, tidak ada No single source of information, no single test,
tes tunggal, yang dapat memberikan can provide the complete picture of students
gambaran lengkap tentang siswa yang that may be required for diagnostic,
mungkin diperlukan untuk diagnostik, curriculum-planning, or other classroom
perencanaan kurikulum, atau tujuan kelas purposes. Supplements include teacher-made
lainnya. Suplemen termasuk tes buatan guru, tests, observations, formal tests, and
observasi, tes formal, dan tes akuntabilitas, accountability tests, all of which contribute to
yang semuanya berkontribusi pada gambaran a holistic picture of student performance.
holistik kinerja siswa.
162. Berdasarkan keputusan yang kurang tepat, Based on poorly informed decisions, formal
tes standar formal terkadang dipilih untuk standardized tests are sometimes selected for
tujuan mempersiapkan siswa yang akan the purpose of preparing students who will be
mengambil tes dengan format yang sama. taking similarly formatted tests. The
Prosedur tersebut dikenal dengan istilah procedure is known as teaching to the test.
teaching to the test. Meskipun buktinya Although the evidence is mixed regarding the
beragam mengenai sejauh mana guru atau extent to which teachers or schools engage in
sekolah terlibat dalam praktik ini, tidak jarang this practice, it is not uncommon for schools
sekolah memilih bank tes yang ada dan to select existing, publicly available test banks
tersedia untuk umum dalam mempersiapkan in preparing students for taking statewide
siswa untuk mengikuti tes di seluruh negara tests, commonly referred to as high-stakes
bagian, biasanya disebut tes berisiko tinggi, tests, used for accountability. The practice of
digunakan untuk akuntabilitas. Praktik teaching to the test cannot be judged as
mengajar hingga ujian tidak bisa dinilai anything other than a poor one. It is
sebagai apa pun selain buruk. Hal ini unanimously understood as well as empirically
dipahami dengan suara bulat serta didukung supported that teaching to specific test items
secara empiris bahwa mengajar untuk item limits learning, encourages memorization of
tes tertentu membatasi pembelajaran, items, and may interfere with transfer of
mendorong menghafal item, dan dapat conceptual information; practice on specific
mengganggu transfer informasi konseptual; items does enhance test scores if identical
latihan pada item tertentu memang items appear on a test, but does not enhance
meningkatkan nilai tes jika item yang identik the educationally relevant outcomes of
muncul pada tes, tetapi tidak meningkatkan understanding and application. The positive
hasil pemahaman dan penerapan yang outcomes (if enhancing test scores without
relevan secara pendidikan. Hasil positif (jika enhancing understanding can be called
meningkatkan nilai tes tanpa meningkatkan positive) are achieved by demonstrating to
pemahaman dapat disebut positif) dicapai students the type of item on which they are to
dengan mendemonstrasikan kepada siswa be tested and the kind of response called for
jenis item di mana mereka akan diuji dan in answering the test item, perhaps even
jenis respons yang diminta dalam menjawab calling their attention to memorizing a specific
item tes, bahkan mungkin memanggil mereka fact or term to be memorized for later
perhatian untuk menghafal fakta atau istilah recognition if it appears on the test to be
tertentu yang akan dihafal untuk pengakuan taken. Instruction based on available
nanti jika muncul pada tes yang akan diambil. measures may be acceptable, if the teacher is
Instruksi berdasarkan ukuran yang tersedia cautious in using the item as a guide for
mungkin dapat diterima, jika guru berhati- identifying the underlying standards, skills, or
hati dalam menggunakan item sebagai knowledge of a domain represented in the
panduan untuk mengidentifikasi standar yang test rather than on the assumed similarity of
mendasari, keterampilan, atau pengetahuan the item structure and specific content (fact).
dari domain yang direpresentasikan dalam It must be understood that a test item is a
tes daripada pada kemiripan yang mere representation of some skill or
diasumsikan dari struktur item dan spesifik. knowledge in a domain. And, further, it is only
konten (fakta). Harus dipahami bahwa item one sample of the representation of that skill
tes hanyalah representasi dari beberapa or knowledge.
keterampilan atau pengetahuan dalam suatu
domain. Dan, selanjutnya, itu hanya satu
contoh representasi dari keterampilan atau
pengetahuan itu.
163. Di sini penting untuk mengingatkan pembaca It is important here to remind our readers of
kami tentang pentingnya melibatkan siswa the importance of engaging students in
dalam penilaian diri dan rekan dalam selfand peer-assessment in focusing on
berfokus pada target pembelajaran. Umpan targets for learning. Such feedback informs
balik semacam itu memberi tahu siswa students about the goals of learning and the
tentang tujuan pembelajaran dan kriteria quality criteria that apply to their work. As a
kualitas yang berlaku untuk pekerjaan result, students learn to identify learning goals
mereka. Hasilnya, siswa belajar untuk for which they initially lacked confidence and
mengidentifikasi tujuan pembelajaran yang in which they needed help; they acquire
awalnya kurang mereka percayai dan yang metacognitions related to the requirements
membutuhkan bantuan; mereka memperoleh for their own learning—requirements of
metakognisi yang berkaitan dengan which they were initially unaware. Such
persyaratan untuk pembelajaran mereka orientations in the use of standardized tests
sendiri — persyaratan yang awalnya tidak keep the interdependency of assessment and
mereka sadari. Orientasi seperti itu dalam learning intact rather than treating them as
penggunaan tes standar menjaga keterkaitan separately compartmentalized activities.
antara penilaian dan pembelajaran tetap
utuh daripada memperlakukannya sebagai
kegiatan yang terpisah-pisah.
164. Latihan 8.1: Memilih Tes
Exercise 8.1: Selecting Tests
165. Bagian A. Latihan ini dimaksudkan untuk Section A. This exercise is intended to help
membantu Anda mempelajari tentang hasil you learn about the actual results of a search
sebenarnya dari pencarian informasi yang for information you might use in test
mungkin Anda gunakan dalam pemilihan tes. selection. For an initial attempt:
Untuk percobaan awal:
166. 1. Identifikasi tes yang umum digunakan, 1. Identify a test that is commonly used, such
seperti California Achievement Test (CAT) as the California Achievement Test (CAT) or
atau Stanford Achievement Test (SAT). the Stanford Achievement Test (SAT). Your
Instruktur Anda mungkin ingin Anda mencari instructor may wish to have you search for
informasi tentang tes lain. information about another test.
167. 2. Jika ada perpustakaan tes di sekolah Anda, 2. If there is a test library at your school, look
lihat tes dan manual sehingga Anda terbiasa at the test and manual so that you become
dengan konstruksinya. familiar with its construction.
168. 3. Mulailah tinjauan untuk evaluasi Anda 3. Begin a review for your evaluation by going
dengan membuka Buku Tahunan Pengukuran to the Buros Mental Measurement Yearbook,
Mental Buros, yang mungkin tersedia melalui which is probably available through your
perpustakaan Anda (sebagian besar library (most libraries house this in their
perpustakaan menyimpan ini dalam koleksi reference collection).
referensi mereka).
169. 4. Tindak lanjuti dengan sumber lain untuk 4. Follow up with other sources for finding out
mengetahui tentang tes tersebut. about the test.
170. Dengan kata-kata Anda sendiri, tulis evaluasi In your own words, write an evaluation of the
tes: test:
171. 1. Mulailah dengan pernyataan tujuan yang 1. Begin with a statement of objectives that
akan dicapai oleh ujian. Anda mungkin ingin would be served by the test. You might want
menggunakan materi dalam kotak (misalnya, to use the material in the boxes (e.g., Text Box
Kotak Teks 8.1 atau Kotak Teks 8.4) sebagai 8.1 or Text Box 8.4) as a guide for your report.
panduan untuk laporan Anda.
172. 2. Rangkum sejauh mana tes tersebut 2. Summarize the extent to which the test
memenuhi standar tes yang baik. meets good test standards.
173. 3. Pastikan untuk menyebutkan batasan yang 3. Be certain to mention any limitations that
mungkin telah dicatat oleh pengulas. might have been noted by the reviewers.
174. 4. Rangkum alasan untuk menggunakan atau 4. Summarize reasons for using or not using
tidak menggunakan tes serta tujuan yang the test as well as the purposes that might be
mungkin dilayani dan dalam keadaan apa tes served and under what circumstances it would
itu akan berguna. be useful.
175. Bagian B. Sekarang Anda telah terbiasa Section B. Now that you have become familiar
dengan cara menggunakan sumber: with how to use the sources:
176. 1. Identifikasi tujuan instruksional yang akan 1. Identify an instructional objective that
menjadi penting dalam pengajaran Anda would be important in your own teaching for
sendiri di mana tes standar mungkin sesuai which a standardized test might be
(misalnya, Anda mungkin ingin belajar appropriate (e.g., you might want to learn
tentang tingkat pemahaman bacaan di kelas about the reading comprehension level of
Anda sebelum atau setelah instruksi, atau your class before or after instruction, or you
Anda mungkin ingin mempelajari caranya might want to learn how your students in your
siswa Anda di kelas Anda dibandingkan class compare with those in other schools in
dengan siswa di sekolah lain di negara bagian the state in meeting standards for mastery of
dalam memenuhi standar untuk penguasaan basic arithmetic facts and operations).
fakta dan operasi aritmatika dasar).
177. 2. Cari volume MMY Buros untuk tes yang 2. Search the Buros MMY volumes for
tersedia. available tests.
178. 3. Identifikasi tes yang tampaknya sesuai. 3. Identify tests that seem appropriate. Keep
Ingatlah bahwa pencarian Anda mungkin in mind that your search might be extended to
diperluas ke tes tambahan atau tes berbeda additional or different tests as you progress
saat Anda melanjutkan tinjauan Anda. through your review.
179. 4. Kunjungi sumber tambahan (mis., 4. Go to additional sources (e.g., online
Pencarian online) untuk mendapatkan searches) for information, if it seems
informasi, jika diperlukan. necessary.
180. 5. Dalam laporan tertulis, ringkaslah 5. In a written report summarize the
perbandingan yang Anda buat. (lihat juga comparisons you made. (see also the last
paragraf terakhir di bawah Bagian A di atas). paragraph under Section A above).
181. 6. Sertakan dalam laporan Anda alasan 6. Include in your report the reasons why you
mengapa Anda membuat pilihan dari semua made the selection out of all the tests you
tes yang Anda pilih pada awalnya. initially selected.
182. ■ Ringkasan
■ Summary
183. Ada alasan bagus untuk memperhatikan There are good reasons for attending to the
masalah teknis dalam pemilihan tes. Anda technical concerns in the selection of tests.
akan melakukan banyak hal yang melibatkan You will be doing much that involves tests
tes yang dipilih dari sumber luar. Mereka selected from outside sources. They are
sudah tersedia dan digunakan untuk berbagai readily available and used for a variety of
tujuan yang melayani kebutuhan purposes serving instructional needs within
instruksional di dalam kelas, tetapi, sebagai the classroom, but, additionally, such tests are
tambahan, tes semacam itu umumnya generally available for (a) student selection,
tersedia untuk (a) seleksi siswa, (b) tujuan (b) diagnostic purposes, (c) intervention
diagnostik, (c) perencanaan program program planning, (d) summative evaluation
intervensi, (d) evaluasi sumatif status siswa, of student status, and (e) accountability
dan (e) tujuan akuntabilitas oleh pembuat purposes by policymakers. Attending to the
kebijakan. Memperhatikan detail teknis yang technical details outlined in this chapter will
diuraikan dalam bab ini akan membuat make your final selection from the myriad of
pilihan akhir Anda dari banyak sekali pilihan choices more appropriate for your purposes.
yang lebih sesuai untuk tujuan Anda.
184. Guru dapat terlibat langsung dalam pemilihan Teachers may be involved directly in the
tes standar ketika mereka ingin melengkapi selection of standardized tests when they
data dari pengukuran informal. Tes Prestasi want to supplement data from informal
Stanford, misalnya, dapat digunakan untuk measures. The Stanford Achievement Tests,
menilai kemajuan dalam membaca, sains, for example, can be used for assessing
atau matematika. progress in reading, science, or mathematics.
185. Sebagian besar guru di tingkat SD, setidaknya, Most teachers in the elementary grades, at
akan dilibatkan dalam membuat rekomendasi least, will be involved in making
mengenai pemilihan langkah-langkah yang recommendations regarding the selection of
tepat untuk digunakan dalam Rencana appropriate measures to be used in
Pendidikan Individual. Atau mereka mungkin Individualized Educational Plans. Or they may
terlibat dengan tindakan yang tidak mereka be involved with measures for which they
berikan panduan langsung atau tidak provide no direct or indirect guidance in
langsung dalam seleksi, tetapi itu adalah selection, but that are policy requirements
persyaratan kebijakan yang mempengaruhi that affect evaluations of accountability and
evaluasi pertanggungjawaban dan yang for which they regularly participate in
dengannya mereka secara teratur preparing students to take the tests. These
berpartisipasi dalam mempersiapkan siswa and similar situations require professionally
untuk mengikuti tes. Situasi ini dan situasi informed decisions. Contrary to the opinion of
serupa membutuhkan keputusan yang some, using and interpreting standardized
diinformasikan secara profesional. tests are a critical part of the normal activities
Bertentangan dengan pendapat beberapa of teaching.
orang, menggunakan dan menafsirkan tes
standar adalah bagian penting dari kegiatan
pengajaran normal.
186. Ukuran yang dikembangkan secara formal Formally developed measures go beyond the
melampaui penilaian kemampuan dan assessment of ability and achievement. A
pencapaian. Seorang guru dalam membaca teacher in reading may wish to use a test of
mungkin ingin menggunakan tes metakognisi metacognitions regarding reading, a teacher in
tentang membaca, seorang guru dalam sains science may wish to use a test of
mungkin ingin menggunakan tes misconceptualizations in science, or any
kesalahpahaman dalam sains, atau guru teacher might wish to evaluate the personality
mana pun mungkin ingin mengevaluasi and motivational characteristics of their
kepribadian dan karakteristik motivasi students by measures that are available either
siswanya dengan ukuran yang tersedia. baik from commercial sources or from the
dari sumber komersial maupun dari literatur. literature. A selection of such measures, from
Pemilihan tindakan seperti itu, dari sumber whatever source, necessitates a well-informed
apa pun, membutuhkan basis pengetahuan knowledge base regarding the process.
yang terinformasi dengan baik tentang
prosesnya.
187. Secara umum, peran guru mungkin termasuk In general, the teacher’s roles may include
mengambil bagian dalam administrasi tes taking part in the proper administration of
kelompok formal yang tepat (misalnya, tes formal group tests (e.g., the statewide
pemahaman di seluruh negara bagian) untuk comprehension tests) to assure that
memastikan bahwa kinerja diukur secara performance is being measured accurately
akurat (yaitu, dalam kondisi standar). Guru (i.e., under standardized conditions). Teachers
terlibat dalam pemilihan tes yang terkait engage in the selection of tests related to a
dengan bidang tertentu dan bertugas di particular field and serve on committees that
komite yang terlibat dalam pemilihan untuk engage in the selection for guidance purposes
tujuan bimbingan (persiapan program (preparation of individual educational
pendidikan individu, remediasi, atau programs, remediation, or enrichment
penempatan pengayaan), yang semuanya placement), all of which require an
membutuhkan pemahaman tentang dasar- understanding of the bases for test selection.
dasar pemilihan tes .
188. Dalam situasi ini peran guru dapat mencakup In these situations the role of teachers may
interpretasi hasil tes yang disimpan dan include the interpretation of test results that
diambil untuk digunakan. Mereka are stored and retrieved for their use. They
mengkomunikasikan pemahaman mereka communicate their understanding of tests,
tentang tes, nilai tes, dan fungsi yang test scores, and functions served by tests to
disajikan oleh tes kepada publik melalui the public through interaction with parents,
interaksi dengan orang tua, dewan sekolah, school boards, and groups such as the parent-
dan kelompok seperti asosiasi orang tua-guru. teacher association. Increasingly, the
Semakin banyak, informasi yang diberikan information provided by standardized test
oleh hasil tes standar digunakan oleh results are employed for use by trained
personel terlatih seperti guru yang personnel such as teachers responsible for the
bertanggung jawab atas pendidikan anak- education of children with special needs or by
anak berkebutuhan khusus atau oleh psikolog school psychologists and guidance counselors
sekolah dan konselor pembimbing untuk for placement of children in remedial or
penempatan anak di kelas perbaikan atau enrichment classes. Many of the more formal
pengayaan. Banyak tes yang lebih formal, tests, such as those for diagnostic purposes,
seperti tes untuk tujuan diagnostik, harus must be administered by trained personnel.
dilakukan oleh personel terlatih.
189. Karakteristik tes yang tersedia untuk dipilih The characteristics by which available tests are
adalah inti dari keputusan yang to be selected are central to informed
diinformasikan. Untuk sampai pada decisions. To arrive at valid interpretations or
interpretasi atau kesimpulan yang valid inferences regarding student progress in
mengenai kemajuan siswa dalam understanding and thinking, teachers must
pemahaman dan pemikiran, guru harus use a variety of assessments, both formal and
menggunakan berbagai penilaian, baik formal informal. To achieve the purposes intended in
maupun informal. Untuk mencapai tujuan the use of standardized tests, the technical
yang dimaksudkan dalam penggunaan tes quality of the assessment, the items selected,
standar, kualitas teknis penilaian, item yang and their characteristics must be explicit. A
dipilih, dan karakteristiknya harus eksplisit. test is judged not by its label or by what the
Sebuah tes dinilai bukan berdasarkan author intended the test to measure. It is
labelnya atau oleh apa yang dimaksudkan judged on the basis of its items, the content
oleh penulis untuk diukur oleh tes tersebut. they tap, the standards they represent, the
Itu dinilai berdasarkan itemnya, konten yang extent to which the subject matter is sampled,
mereka ketuk, standar yang mereka wakili, and the underlying processes tapped. The
sejauh mana materi pelajaran diambil items comprising the test must be examined
sampelnya, dan proses yang mendasarinya for what they are measuring and the extent to
disadap. Item yang terdiri dari tes harus which those assessments sample the range of
diperiksa untuk apa yang mereka ukur dan knowledge, understanding, and skills
sejauh mana penilaian tersebut mengambil intended. The overall test and the items on
sampel rentang pengetahuan, pemahaman, which it is based must be sensitive to language
dan keterampilan yang dimaksudkan. Tes and cultural differences as well as the needs of
keseluruhan dan item yang menjadi dasarnya students with special disabilities who are the
harus peka terhadap perbedaan bahasa dan potential examinees. Standardized assessment
budaya serta kebutuhan siswa dengan measures, like instructional assignments, are
disabilitas khusus yang merupakan calon expected to be challenging, not frustrating or
peserta ujian. Pengukuran penilaian standar, unimportant performance tasks.
seperti tugas instruksional, diharapkan
menantang, tidak membuat frustrasi atau
tugas kinerja yang tidak penting.
190. Singkatnya, dasar pemilihan tes adalah In summary, the bases for selection of tests
sebagai berikut: are the following:
191. • Tujuan. Ketahui tujuan pemilihan tes — • Purpose. Know the purpose for which the
akuntabilitas, diagnosis, atau penyelarasan test is being selected—accountability,
dengan standar. diagnosis, or the alignment with standards.
192. • Mengukur. Ketahui karakteristik tes — • Measure. Know the characteristics of the
apakah tes tersebut mampu memberikan test—whether it is capable of providing
informasi yang berguna untuk tujuan yang information useful to the purpose intended.
dimaksudkan.
193. • Kondisi. Ketahui kondisi administrasi tes • Conditions. Know the conditions under
yang sesuai. which administration of the test is
appropriate.
194. • Peserta ujian. Ketahui kesesuaian tes untuk • Student examinees. Know the
karakteristik keragaman, apakah budaya, appropriateness of the test for diversity
usia, tingkat kelas, atau perbedaan individu characteristics, whether cultural, age, grade
lainnya. Ketahui norma yang tersedia. level, or other individual difference. Know the
norms available.
195. • Penilaian. Ketahui dasar penilaian ukuran, • Scoring. Know the basis for the scoring of
akurasinya, dan norma yang tersedia untuk the measures, their accuracy, and the norms
interpretasinya. available for their interpretation.
196. Saat memilih tes dengan hati-hati periksa When selecting tests carefully inspect the
keselarasan antara apa yang diuji dan tujuan alignment between what is tested and the
instruksional (yaitu, apa yang diajarkan) jika instructional objectives (i.e., what is taught) if
Anda berniat menggunakan hasil tes untuk you intend to use the test results for your
instruksi Anda. Penting bahwa pemilihan instruction. It is important that the selection
didasarkan pada pertimbangan informasi be based on consideration of information
tentang program pendidikan dan siswa untuk about the educational program and students
memberikan keseluruhan informasi jika akan to provide a rounded body of information if it
berguna untuk rekomendasi tentang is to be useful for recommendations about
perubahan kurikulum atau program curricular changes or remedial programs for
perbaikan bagi siswa. students.
197. Pemilihan tes yang akan digunakan dengan The selection of tests to be employed in
cara standar melibatkan pertimbangan standardized fashion involves considerations
mengenai administrasi tes. Apakah ada regarding the administration of the test. Are
ketentuan khusus untuk sertifikasi there special provisions for certification of the
penyelenggara tes? Pelatihan khusus apa, jika administrator of the tests? What special
ada, yang diperlukan dari administrator training, if any, is required of the
tindakan tersebut? Apakah persyaratan untuk administrator of the measure? Are the
memenuhi persyaratan administrasi standar conditions for meeting standard
dirinci untuk diikuti oleh administrator? administration requirements detailed for the
Bisakah tes dilakukan dengan tepat oleh administrator of the measure to follow? Can
personel yang ada? (Misalnya, beberapa tes the test be administered appropriately by the
kecerdasan memerlukan administrasi oleh personnel available? (For example, some
psikolog sekolah yang terlatih.) intelligence tests require administration by
trained school psychologists.)
198. Karakteristik siswa yang menerima tes harus The characteristics of students to whom the
diperhatikan. Pertimbangkan apakah tes ini test is being administered must be addressed.
akan digunakan dengan siswa penyandang Consider whether the test is to be used with
disabilitas khusus, siswa dari budaya yang students with special disabilities, students
berbeda, siswa yang bahasa utamanya selain from different cultures, students whose
bahasa Inggris, atau bahkan siswa yang primary language is other than English, or
memiliki pengalaman berbeda karena even students who have different experiences
pendidikan di tempat atau distrik yang due to education in different but adjoining
berbeda tetapi bersebelahan. Usia, tingkat localities or districts. Age, grade level, and
kelas, dan status sosial ekonomi juga menjadi socioeconomic status are all considerations as
pertimbangan. well.
199. Prosedur penilaian harus jelas; mereka harus Scoring procedures must be clear; they should
menghasilkan skor yang konsisten dan akurat yield consistent and accurate scores for
untuk interpretasi. Ketika skor akan interpretation. When the scores are to be
digunakan dalam perbandingan normatif, used in normative comparisons, the
norma yang sesuai harus tersedia mengenai appropriate norm should be available
kelompok khusus yang diuji (norma terpilah) regarding special groups being tested
untuk menghindari kesalahan klasifikasi siswa (disaggregated norms) in order to avoid
dalam kelompok ini. Mereka harus berguna misclassification of students in these groups.
dalam mengidentifikasi siswa yang dapat They should be useful in identifying students
mengambil keuntungan dari intervensi yang who can profit from the interventions
tersedia. available.
200. Mengingat pertimbangan keadilan (dibahas In view of fairness considerations (covered in
dalam Bab 16 tentang akomodasi tes), Chapter 16 on test accommodations) it is
penting untuk mempertimbangkan apakah important to consider whether the test or its
tes atau administrasi tes dapat dimodifikasi administration can be modified for special-
untuk siswa berkebutuhan khusus atau needs students or whether there are
apakah ada bentuk atau ukuran alternatif alternative forms or measures that have been
yang telah divalidasi terhadap formulir validated against the original forms. When
aslinya. Saat memilih tes, pertimbangkan selecting the test consider whether instruction
apakah pengajaran dan kurikulum telah and the curriculum have provided the
memberikan kesempatan untuk belajar sesuai opportunity for learning to the standards
standar yang diukur dalam tes. being measured in the test.
201. Setelah Anda yakin bahwa tes tersebut After you are satisfied that the test is generally
umumnya berorientasi pada tujuan Anda, oriented toward your purpose, examine its
periksa data pendukungnya. Misalnya, jika supporting data. For example, if you want the
Anda ingin tes untuk seleksi siswa yang akan test for selection of students who will succeed
berhasil pada mata kuliah aljabar tingkat in the second-level algebra course, is the data
kedua, apakah datanya mendukung validitas such that it supports predictive validity? That
prediktif? Artinya, apakah skor pada tes is, do the scores on the test correlate with
berkorelasi dengan keberhasilan pada kursus success in the second course? A standardized
kedua? Tes pencapaian standar untuk satu achievement test for one content area can’t
area konten tidak dapat digunakan untuk be used for making predictions about success
membuat prediksi tentang kesuksesan di area in another content area if that was the
konten lain jika itu adalah tujuan yang intended purpose; examine the data to
dimaksudkan; memeriksa data untuk determine how the predictions were made.
menentukan bagaimana prediksi dibuat. Any item or entire test has to be evaluated
Setiap item atau keseluruhan tes harus against reliability and validity criteria.
dievaluasi terhadap kriteria reliabilitas dan
validitas.
202. Jika Anda mencoba menggunakan hasil tes If you are attempting to use standardized test
standar untuk pengajaran Anda sendiri, results for your own teaching, the concern is
perhatiannya adalah sejauh mana ukuran the extent to which the measure serves the
tersebut berfungsi sebagai penilaian formatif; function of formative assessment; that is, the
Artinya, interpretasi hasil tes harus memiliki interpretation of test results should have
implikasi untuk mempengaruhi pengajaran implications for influencing instruction
secara positif, baik dalam konten maupun positively, both in content and instructional
metode pembelajaran. Untungnya, ulasan methods. Fortunately, the easily accessible
yang mudah diakses oleh para ahli, seperti reviews by experts, such as those in the
yang ada di Buku Tahunan Pengukuran Mental Measurements Yearbooks (Buros
Mental (Buros Institute of Mental Institute of Mental Measurements, 2000),
Measurements, 2000), memberikan sumber provide useful resources for teachers involved
daya yang berguna bagi guru yang terlibat di at any level in the selection of tests for specific
tingkat mana pun dalam pemilihan tes untuk outcomes and purposes.
hasil dan tujuan tertentu.
ULASAN :

1. NOMOR 3 “persiapan penting dalam pengajaran di kelas”.

TANGGAPAN : Hal yang harus dipersiapkan guru professional sebelum mengajar juga


merupakan aspek yang penting dan harus diutamakan sebagai seorang guru yang
professional. Guru berperan sebagai model yang dijadikan contoh oleh para peserta didik,
oleh karena itu seorang guru harus memiliki akhlak yang baik dan budi pekerti mulia agar
peserta didik lebih menghormati dan menjadikan seorang guru sebagai pedoman dengan
mengikuti nilai-nilai dasar yang terkandung dalam Pancasila.
2. NOMOR 39 “Bagaimana tes diberikan?”.

TANGGAPAN :
Tes dapat dilakukan secara individu atau kelompok. Bergantung pada asumsi tentang
kemampuan bahasa, tes dapat disampaikan dalam bentuk lisan atau tertulis, dan dapat diatur
waktunya atau diatur sendiri. Kondisinya berbeda dengan ujian, dan itu penting karena
memengaruhi norma. Jika, misalnya, Anda ingin memperpanjang waktu pengambilan tes kelas
Anda, Anda ingin mengetahui apakah tes tersebut diatur berdasarkan batasan waktu.

3. NOMOR 160 “Tes standar penting sebagai salah satu sumber data penilaian”.

TANGGAPAN : data-data penilain juga sangat penting bagi sekolah, sala satunya tes
standar. Daripada menggunakan tes formal untuk tujuan intruksional dapat
menciptakan suatu masalah intrepertasi sering tes ini disala artikan apa yang
sebenarnya yang dia ajarkan kepada siswah.

Anda mungkin juga menyukai