Bahasa inggris
These are all group-administered tests, except so for the peabodyvand the Wide
Range, which are individually administered. Publishers are listed in Appendixes K and L.
Details about each battery can be obtained from the publishers' catalogs and Websites.
Critical reviews are found in the Mental Measurements Yearbooks, Test Critiques, and other
sources in chapter17. Figure 15.4 shows the curriculum areas, subtests, and grade levels
covered by some of the more popular standardized achievement tests.
Although different publishers' survey batter ies are similar in their surface features,
they are not interchangeable, even though subtest names may sound similar.
figure 15.4
The specific content emphasized, the cognitive skills students are required to use to complete
the tasks, and the way the norms and scales are developed will be very different from
publisher to publisher. Tests vary in how well they match any school district's curriculum or
state's standards. In some curricula, such as reading and perhaps mathematics, the curricula
differ very little from one school district to another within a state.
The tests and these curricula may match closely. In other curricula such as science
and social studies, especially among elementary schools, there are much larger an variations
between school districts. For a teacher this means that the different subtests in the battery
have less value in assessing the specifics of what the teacher taught during the year.
However, such subtests can assess general information and general ability to apply
knowledge and Skill.
These differences make it necessary for school officials to actually inspect the test
items before they adopt a battery,matching their local curriculum to the battery's content and
skills emphasis.if there is a wide gap between your local curriculum's learning target and the
battery's tasks,do not adopt the survey battery.
Publishers think of each subtest (e.g., reading comprehension) assesing a continuous
dimension that grows or develops over a range of grades. Because each subtest is a graded
series of assessments, the publisher can use empirical data to link the levels together and to
place the scores of students from every grade on one numerical scale that spans all the grades.
This allows you to use a multilevel subtest to measure a student's year-to-year educational
development and growth in a curricular area. Different types of educational development
scales are explained in Chapter 16.
Each publisher norms and standardizes its tests instru on different samples of
students, so the samples and the resulting norm-referenced scores are not comparable.
However, all the subtests in one publisher's survey battery are administered to the same
national sample of students. The major advantage of administering all subtests to the same
students is that the different subtest results can be referenced to the same norm group,
allowing you to compare a student's relative strengths and weaknesses across the different
curricular areas. You can assess the strengths and weaknesses, however, only by comparing a
student's percentile rank in one curicular area to that student's percentile rank in another.an
example of the kind of comparison you make follows.
Example:
Shanna is better in mathematics than she is in social studies because her score in mathematics
is higher than 98% of the students at her grade level, whereas her score in social studies is
higher than only 60% of students at her grade level. Survey batteries report grade-equivalent
scores and standard scores, too, but you should not use them to compare a student's
achievement in two curricular areas. Percentile ranks, standard scores, and grade-equivalent
scores are explained in Chapter 16.
Common Learning Targets Virtually all published standardized tests cover content
and learning targets judged to be common to many schools rather than one specific school
district. Therefore, standardized achievement tests are not focused on the teaching emphasis
of one teacher, one school,one textbook, or one set of curricular materials. This is an
advantage because it gives you an "external or "objective" view of what your students have
learned. It is also a disadvantage because the cognitive skills and knowledge assessed by the
test may not have been taught to the students before they were tested. Therefore, it is
imperative that a school district carefully compares a test's content and when that content is
taught in their schools, item by item, to the state's standards and the school district's
curriculum framework before deciding to adopt it. Sometimes as few as three or four
misaligned items can have a serious impact on the results. Also, a teacher must develop and
use his or her own assessment procedures for day-to-day instructional decisions (e.g.,whether
a student has mastered a specific concept).
The community may wish to know whether basic skills such as com putation, reading
comprehension, English writing mechanics, and spelling are being learned.
3. Plan to use the chosen test over a period of at least 5 years, so that you can track changes in
your school district.
4. Test at grade levels not tested by the statemandated assessment to avoid overburdening
students and teachers.
Individually Administered Surveys Individually administered achievement batteries are
commonly used for students with special needs, such as students with disabilities who
otherwise would have difficulty taking assessments in group settings. Students who cannot
be assessed in groups often can be validly assessed in individual sessions
where the assessment administrator can provide the special accommodations they need and
can so establish greater rapport than is possible in a group. See Chapter 5, Figure 5.2, for
examples of ways to modify tests.)
Sometimes individual achievement batteries are used as "screening" tests to identify students
with learning difficulties, or as part of a broader series of individual assessments when a
school psychologist conducts a general psychological evaluation. A school district may use
individual achievement survey batteries to assess the general educational development of a
newly transferred student, or as a double-check on a previously administered group Survey
test when the results are being questioned for a particular student. Because both the content
and norm of an individual assessment are different from the group test, you should proceed
very cautiously when double-checking. You can expect a student's results from the two types
of tests to correspond only very roughly.
Two commonly administered individual survey achievement tests are the Wide Range
Achievement Test third Edition (WRAT-3) and the Peabody individual achievement test-
revisef-normative update (piat-r/nu).
These single instruments contain items that span many ages or grades (essentially ages 5 to
adult). Thus, by their very nature they contain few items specifically associated with sing a
given age or grade level. Such tests do not have as much in-depth coverage as group survey
tests that have separate levels for each age or grade level This comment is not necessarily a
criticism of these tests.These wide-range tests make a quick assessment of a student's
strengths in several basic curricular and areas. This quickly obtained assessment helps the
teacher determine relatively weak areas needing more in-depth diagnostic follow-up.
The PIAT-R/NU's items are printed on a small easel. Students do not write responses to the
multiple-choice items, they must only say or point to the option. Within each subtest the
items are arranged in order of difficulty. A student does not take each item, a starting point
(called a basal level) and an ending point (called a ceiling level) are established, based on the
student's pattern of correct answers and errors.
Multilevel Criterion-Referenced Tests Multilevel criterion-referenced tests provide
information about students' status with respect to the
specific learning targets in a domain. Although some survey batteries also provide this
information, most surveys assess very broadly or globally defined educational development.
Multilevel criterion-referenced tests tend to focus on a more narrowly defined set of learning
targets. Some ith publishers make efforts to align their tests with of states' standards.
Other Multilevel Tests Other types of multilevel tests are stand-alone products that cover
one curricular area, such as reading or mathematics, across several grades.These assessments
provide a deeper and broader sampling of content than a corresponding subtest of a survey
battery. Thus, more time is devoted to assessing students in a single curricular area than when
you use a survey battery subtest. However, if the same sample of students was not used to
norm a stand-alone multilevel test concurrently with tests from other curricular areas, you
cannot use the stand-alone tests to compare a student's relative strengths and weaknesses
across curricular areas. For example, you could not say a student is better in reading than in
mathematics.
Terjemahan
Ini semua adalah tes yang diatur oleh kelompok, kecuali untuk peabody dan Wide Range,
yang dikelola secara individual. Penerbit tercantum dalam Apendiks K dan L. Detail tentang
setiap baterai dapat diperoleh dari katalog dan Situs Web penerbit. Ulasan kritis ditemukan
dalam Buku-buku Tahunan Pengukuran Mental, Kritik Uji, dan sumber-sumber lain dalam
bab 17. Gambar 15.4 menunjukkan bidang kurikulum, subtest, dan tingkat kelas yang
dicakup oleh beberapa tes pencapaian standar yang lebih populer.
Meskipun survei penerbit yang berbeda memiliki kesamaan dalam fitur permukaannya,
mereka tidak dapat dipertukarkan, meskipun nama-nama subest mungkin terdengar serupa.
gambar 15.4
Isi spesifik menekankan, keterampilan kognitif siswa diminta untuk menggunakan untuk
menyelesaikan tugas, dan cara norma dan skala dikembangkan akan sangat berbeda dari
penerbit ke penerbit.
Tes bervariasi dalam seberapa baik mereka cocok dengan kurikulum atau standar keadaan
bagian distrik sekolah. Dalam beberapa kurikulum, seperti membaca dan mungkin
matematika, kurikulumnya sangat sedikit berbeda dari satu distrik sekolah ke sekolah lain
dalam suatu keadaan. Tes dan kurikulum ini mungkin cocok erat. Dalam kurikulum lain
seperti ilmu pengetahuan dan studi sosial, terutama di antara sekolah dasar, ada variasi yang
jauh lebih besar antar distrik sekolah. Untuk seorang guru, ini berarti bahwa subtest yang
berbeda dalam baterai memiliki nilai lebih kecil dalam menilai spesifik dari apa yang
diajarkan guru selama tahun tersebut. Namun, subtes semacam itu dapat menilai informasi
umum dan kemampuan umum untuk menerapkan pengetahuan dan Keterampilan.
Perbedaan ini mengharuskan pejabat sekolah untuk benar-benar memeriksa item tes sebelum
mereka mengadopsi baterai, menyesuaikan kurikulum lokal mereka dengan konten baterai
dan penekanan keterampilan. ada kesenjangan yang lebar antara target pembelajaran
kurikulum lokal Anda dan tugas-tugas baterai, jangan mengadopsi baterai survei.
Setiap norma penerbit dan standarisasi tesnya dilakukan pada sampel siswa yang berbeda,
sehingga sampel dan skor yang direferensikan norma yang dihasilkan tidak dapat
dibandingkan. Namun, semua subtest dalam satu baterai survei penerbit diberikan kepada
sampel siswa nasional yang sama. Keuntungan utama dari mengelola semua subtes kepada
siswa yang sama adalah bahwa hasil subtest yang berbeda dapat dirujuk ke kelompok norma
yang sama, memungkinkan Anda untuk membandingkan kekuatan dan kelemahan relatif
siswa di berbagai wilayah kurikuler yang berbeda. Anda dapat menilai kekuatan dan
kelemahan, bagaimanapun, hanya dengan membandingkan peringkat persentil siswa dalam
satu area kurikularis dengan peringkat persentil siswa tersebut dalam contoh lain. Contoh dari
jenis perbandingan yang Anda buat berikut.
Contoh:
Shanna lebih baik dalam matematika daripada dia dalam studi sosial karena nilai dalam
matematika lebih tinggi dari 98% siswa di tingkat kelasnya, sedangkan skornya dalam studi
sosial lebih tinggi daripada hanya 60% siswa di tingkat kelasnya. Baterai survei melaporkan
nilai setara kelas dan skor standar, tetapi Anda tidak boleh menggunakannya untuk
membandingkan prestasi siswa dalam dua bidang kurikuler. Peringkat persentil, skor standar,
dan nilai setara-kelas dijelaskan dalam Bab 16.
Target Pembelajaran Umum Hampir semua tes standar yang dipublikasikan mencakup
konten dan target pembelajaran yang dinilai umum untuk banyak sekolah daripada satu
distrik sekolah tertentu. Oleh karena itu, tes prestasi standar tidak difokuskan pada penekanan
pengajaran dari satu guru, satu sekolah, satu buku pelajaran, atau satu set materi kurikuler. Ini
merupakan keuntungan karena memberi Anda pandangan "eksternal atau" objektif tentang
apa yang telah dipelajari siswa Anda. Ini juga merupakan kerugian karena keterampilan dan
pengetahuan kognitif yang dinilai oleh tes mungkin tidak diajarkan kepada para siswa
sebelum mereka diuji. Oleh karena itu, sangat penting bahwa distrik sekolah dengan hati-hati
membandingkan konten tes dan ketika konten tersebut diajarkan di sekolah mereka, item
demi item, dengan standar keadaan bagian dan kerangka kurikulum distrik sekolah sebelum
memutuskan untuk mengadopsinya. Kadang-kadang sedikitnya tiga atau empat item yang
tidak sejajar dapat berdampak serius pada hasil, juga, seorang guru harus mengembangkan
dan menggunakan prosedur penilaiannya sendiri untuk keputusan instruksional sehari-hari
(misalnya, apakah seorang siswa telah menguasai konsep tertentu).
Bahan Bantu Sebagian besar penerbit tes standar dan terdokumentasi secara empiris
menyediakan bahan bantu untuk membantu Anda menafsirkan dan menggunakan hasil
penilaian. Buku pedoman guru menjelaskan dengan sangat rinci tujuan dan penggunaan yang
diinginkan dari hasil, sering menyarankan cara-cara untuk meningkatkan keterampilan siswa
dengan menggunakan hasil penilaian untuk perencanaan pembelajaran. Beberapa penerbit
menyediakan manual terpisah untuk koordinator kurikulum dan administrator sekolah untuk
membantu mereka menggunakan hasil penilaian dalam evaluasi kurikulum dan laporan ke
dewan sekolah. Penerbit hampir memberikan laporan skor tercetak yang bagus bahwa distrik
sekolah dapat menggunakan baik di dalam sekolah dan dengan siswa dan orang tua.
Survey Achievement Battery Selection Periksa dan tinjau setiap tes secara individual untuk
menilai kelayakannya untuk tujuan Anda. Sebelum memilih baterai survei sekolah dasar,
pertimbangkan empat poin ini: 1. Baterai survei hanya mengukur sebagian dari hasil yang
diinginkan untuk sekolah dasar. Gunakan prosedur penilaian tambahan untuk mengevaluasi
hasil lainnya. 2. Konten spesifik dalam mata pelajaran seperti studi sosial dan sains dapat
dengan cepat menjadi kuno. tes yang dirancang untuk mengukur keterampilan kognitif yang
luas atau tingkat pengembangan pendidikan menjadi tanggal kurang cepat. 3. Tes mengukur
keterampilan kognitif yang luas atau tingkat pengembangan pendidikan perlu dilengkapi
dengan tes buatan guru atau tes standar dari konten tertentu. 4. Setiap baterai memiliki
campuran dan penekanan konten dan keterampilan yang berbeda; masing-masing disertai
dengan berbagai macam alat bantu penafsiran. Periksa baterai uji dengan saksama sebelum
memutuskan untuk membelinya. Karena kurikulum sekolah menengah sangat bervariasi,
memilih baterai survei untuk tingkat pendidikan ini sulit. Pejabat sekolah harus mengingat
enam hal berikut ini sebelum memilih baterai uji sekolah menengah:
5. Anda mungkin merasa perlu untuk melengkapi baterai survei sekolah menengah dengan
penilaian yang mengukur pengetahuan konten dari mata pelajaran tertentu.
6. Pertimbangan praktis adalah kelanjutan pengukuran dari tingkat dasar hingga menengah.
Ini sering berarti membeli baterai sekolah menengah dari perusahaan yang sama yang
menerbitkan baterai sekolah dasar.
Survei yang Diatur secara Individual Baterai pencapaian yang dikelola sendiri biasanya
digunakan untuk siswa berkebutuhan khusus, seperti siswa penyandang cacat yang
dinyatakan akan mengalami kesulitan dalam mengambil penilaian dalam pengaturan
kelompok. Siswa yang tidak dapat dinilai dalam kelompok sering dapat dinilai secara sah
dalam sesi individu di mana administrator penilaian dapat menyediakan akomodasi khusus
yang mereka butuhkan dan dapat membangun hubungan yang lebih baik daripada yang
mungkin dalam kelompok. Lihat Bab 5, Gambar 5.2, untuk contoh-contoh cara memodifikasi
tes.) Kadang-kadang baterai prestasi individu digunakan sebagai tes "penyaringan" untuk
mengidentifikasi siswa dengan kesulitan belajar, atau sebagai bagian dari serangkaian
penilaian individu yang lebih luas ketika psikolog sekolah melakukan evaluasi psikologis
umum. Sebuah distrik sekolah dapat menggunakan baterai survei prestasi individu untuk
menilai pengembangan pendidikan umum siswa yang baru ditransfer, atau sebagai
pemeriksaan ganda pada tes Survei kelompok yang dikelola sebelumnya ketika hasilnya
dipertanyakan untuk siswa tertentu. Karena konten dan norma penilaian individu berbeda dari
tes grup, Anda harus melanjutkan dengan sangat hati-hati ketika memeriksa ulang. Anda
dapat mengharapkan hasil siswa dari dua jenis tes untuk hanya berkorespondensi secara
kasar. Dua tes hasil survei individu yang umumnya diberikan adalah Uji Prestasi Wide Range
Edisi ketiga (WRAT-3) dan tes Prestasi Individu Peabody-pembaruan-normatif (piat-r / nu).
Instrumen tunggal ini berisi item yang mencakup banyak usia atau tingkatan (pada dasarnya
usia 5 hingga dewasa). Dengan demikian, karena sifatnya mereka mengandung beberapa item
yang secara khusus terkait dengan menyanyikan usia atau tingkat kelas tertentu. Tes
semacam itu tidak memiliki cakupan mendalam yang mendalam seperti tes survei kelompok
yang memiliki tingkat terpisah untuk setiap usia atau tingkat kelas. Komentar ini tidak selalu
merupakan kritik terhadap tes ini. Tes-tes yang luas ini membuat penilaian cepat terhadap
kekuatan siswa dalam beberapa kurikulum dasar dan area. Penilaian yang diperoleh dengan
cepat ini membantu guru menentukan area yang relatif lemah membutuhkan tindak lanjut
diagnostik yang lebih mendalam.
Item PIAT-R / NU dicetak pada kuda-kuda kecil. Siswa tidak menulis tanggapan terhadap
item pilihan ganda, mereka hanya harus mengatakan atau menunjuk ke opsi. Dalam setiap
subtes, barang-barang disusun berdasarkan urutan kesulitan. Seorang siswa tidak mengambil
setiap item, titik awal (disebut tingkat basal) dan titik akhir (disebut tingkat langit-langit)
ditetapkan, berdasarkan pada pola siswa dari jawaban dan kesalahan yang benar.
Tes Multilevel Lainnya Jenis lain dari tes multilevel adalah produk yang berdiri sendiri
yang mencakup satu area kurikuler, seperti membaca atau matematika, di beberapa kelas.
Penilaian ini memberikan sampling konten yang lebih dalam dan lebih luas daripada subtes
baterai survei yang sesuai. Dengan demikian, lebih banyak waktu dikhususkan untuk menilai
siswa dalam satu bidang kurikuler daripada ketika Anda menggunakan subtes baterai survei.
Namun, jika sampel siswa yang sama tidak terbiasa dengan tes multilevel yang berdiri sendiri
bersamaan dengan tes dari area kurikuler lainnya, Anda tidak dapat menggunakan tes yang
berdiri sendiri untuk membandingkan kekuatan dan kelemahan relatif siswa di area kurikuler.
Misalnya, Anda tidak bisa mengatakan seorang siswa lebih baik dalam membaca daripada di
bidang matematika.
Tes Standar Tingkat Tunggal jika Anda tidak ingin mengukur pertumbuhan atau
perkembangan, tes tingkat tunggal mungkin berguna. Lebih dari sekadar mencakup beberapa
tingkatan kelas atau usia, tes semacam itu diarahkan ke satu tingkat atau kursus tertentu.
Biasanya penilaian ini dibangun untuk program sekolah menengah dan perguruan tinggi.
Ada, misalnya, tes untuk aljabar I, kimia kuliah tahun pertama, dan kuliah tahun pertama
Prancis. Setiap tes adalah produk yang berdiri sendiri dan tidak terkoordinasi dengan tes lain.
Dengan demikian, tes ini hasilnya tidak dapat digunakan untuk membandingkan berdiri siswa
yang relevan di beberapa mata pelajaran. Skor dari kelompok tes prestasi ini paling sering
ditafsirkan menggunakan skema referensi-norma seperti peringkat persentil dan skor standar.
Jika Anda mengajar di satu bidang mata pelajaran, seperti Aljabar I atau Sastra Inggris abad
ke-19, Anda mungkin tertarik untuk menilai seberapa baik kinerja siswa dalam mata
pelajaran tersebut. Tes multilevel sering tidak sesuai untuk kursus semacam itu karena
mereka menjangkau beberapa kelas dengan item yang relatif sedikit dan dengan demikian
tidak memiliki relevansi konten untuk kursus tertentu. Untuk sebagian besar tujuan, seorang
guru dibuat