Anda di halaman 1dari 11

352-355_evabel

Bahasa inggris
These are all group-administered tests, except so for the peabodyvand the Wide
Range, which are individually administered. Publishers are listed in Appendixes K and L.
Details about each battery can be obtained from the publishers' catalogs and Websites.
Critical reviews are found in the Mental Measurements Yearbooks, Test Critiques, and other
sources in chapter17. Figure 15.4 shows the curriculum areas, subtests, and grade levels
covered by some of the more popular standardized achievement tests.
Although different publishers' survey batter ies are similar in their surface features,
they are not interchangeable, even though subtest names may sound similar.

figure 15.4

The specific content emphasized, the cognitive skills students are required to use to complete
the tasks, and the way the norms and scales are developed will be very different from
publisher to publisher. Tests vary in how well they match any school district's curriculum or
state's standards. In some curricula, such as reading and perhaps mathematics, the curricula
differ very little from one school district to another within a state.
The tests and these curricula may match closely. In other curricula such as science
and social studies, especially among elementary schools, there are much larger an variations
between school districts. For a teacher this means that the different subtests in the battery
have less value in assessing the specifics of what the teacher taught during the year.
However, such subtests can assess general information and general ability to apply
knowledge and Skill.
These differences make it necessary for school officials to actually inspect the test
items before they adopt a battery,matching their local curriculum to the battery's content and
skills emphasis.if there is a wide gap between your local curriculum's learning target and the
battery's tasks,do not adopt the survey battery.
Publishers think of each subtest (e.g., reading comprehension) assesing a continuous
dimension that grows or develops over a range of grades. Because each subtest is a graded
series of assessments, the publisher can use empirical data to link the levels together and to
place the scores of students from every grade on one numerical scale that spans all the grades.
This allows you to use a multilevel subtest to measure a student's year-to-year educational
development and growth in a curricular area. Different types of educational development
scales are explained in Chapter 16.
Each publisher norms and standardizes its tests instru on different samples of
students, so the samples and the resulting norm-referenced scores are not comparable.
However, all the subtests in one publisher's survey battery are administered to the same
national sample of students. The major advantage of administering all subtests to the same
students is that the different subtest results can be referenced to the same norm group,
allowing you to compare a student's relative strengths and weaknesses across the different
curricular areas. You can assess the strengths and weaknesses, however, only by comparing a
student's percentile rank in one curicular area to that student's percentile rank in another.an
example of the kind of comparison you make follows.
Example:
Shanna is better in mathematics than she is in social studies because her score in mathematics
is higher than 98% of the students at her grade level, whereas her score in social studies is
higher than only 60% of students at her grade level. Survey batteries report grade-equivalent
scores and standard scores, too, but you should not use them to compare a student's
achievement in two curricular areas. Percentile ranks, standard scores, and grade-equivalent
scores are explained in Chapter 16.
Common Learning Targets Virtually all published standardized tests cover content
and learning targets judged to be common to many schools rather than one specific school
district. Therefore, standardized achievement tests are not focused on the teaching emphasis
of one teacher, one school,one textbook, or one set of curricular materials. This is an
advantage because it gives you an "external or "objective" view of what your students have
learned. It is also a disadvantage because the cognitive skills and knowledge assessed by the
test may not have been taught to the students before they were tested. Therefore, it is
imperative that a school district carefully compares a test's content and when that content is
taught in their schools, item by item, to the state's standards and the school district's
curriculum framework before deciding to adopt it. Sometimes as few as three or four
misaligned items can have a serious impact on the results. Also, a teacher must develop and
use his or her own assessment procedures for day-to-day instructional decisions (e.g.,whether
a student has mastered a specific concept).

Auxiliary Materials Most publishers of standardized, empirically documented tests provide


auxiliary materials to help you interpret and use the assessment results. Teacher's manuals
describe in considerable detail the intended purpose and uses of the results, often suggesting
ways to improve students' skills by using assessment results for instructional planning. Some
publishers provide separate manuals for curriculum coordinators and school administrators to
help them use assessment results in curriculum evaluation and reports to the school
board.most publishers provide nicely printed score reports that the school district may use
both within the school and with students and parents.
Survey Achievement Battery Selection Examine and review each test individually
to judge its appropriateness for your purposes. Before select ing an elementary school survey
battery, consider these four points:
1. Survey batteries measure only part of the out comes desired for elementary schools.
Use additional assessment procedures to evaluate the other outcomes.
2. Specific content in subjects such as social studies and science may quickly become
dated. test designed to measure broad cognitive skills or levels of educational development
become dated less quickly.
3. Tests measuring broad cognitive skills or levels of educational development need to
be supplemented by teacher-made or standardized tests of specific content.
4. Each battery has a different mix and emphasis of content and skills; each is
accompanied by various kinds of interpretive aids. Examine a test battery carefully before
deciding to purchase it .
Because high school curricula vary so much, choosing a survey battery for this
educational level is difficult. School officials should keep the following six points in mind
before selecting a high school test battery:
1. Survey batteries that emphasize basic skills (reading, mathematics, language) may be more
useful as measures of high school readiness than as measures of high school outcomes (unless
a high school program is especially directed toward basic skills development)
2. Some tests are more oriented toward testing specific content than educational development
broadly defined. If you want a content-oriented test, review each item on the test carefully to
see if the test measures what the school intends.
3. Tests stressing the measurement of levels of educational development that cut across
several subject areas rather than knowledge of specific content tend to measure more
complex skills and global processes.
4. The variety of course offerings at the high school level makes it more necessary than at the
elwmentary level to examine the content of each survey battery carefully.
5. You may find necessary to supplement a high school survey battery with assessments
measuring content knowledge of specific subjects.
6. A practical consideration is the continuity of measurement from elementary to secondary
levels. This often means purchasing a high school battery from the same company that
published the elementary school battery.
Cornplementing Your State Assessment.If your state mandates its own assessment, you
will need to take its coverage into account before choosing a published standardized test.
Most state assessments have accountability as their main purpose. This is not the case for a
published standardized test, which is used primarily to measure individual students'
educational growth. Keep the following four points in mind if you are trying to select
standardized multilevel achievement test when you are also faced with a state-mandated
assessment:
1. All things being equal, choose a standardized test that requires students to demonstrate
learning that is very consistent with your state's standards or curriculum framework .
2. If your community does not like the focus of your state-mandated assessment, choose a
multilevel achievement test that reflects the community's concerns. For example, your
community may not wish to limit assessment the higher order thingking and complex
problem solving on which the state assessment focuses.

The community may wish to know whether basic skills such as com putation, reading
comprehension, English writing mechanics, and spelling are being learned.
3. Plan to use the chosen test over a period of at least 5 years, so that you can track changes in
your school district.
4. Test at grade levels not tested by the statemandated assessment to avoid overburdening
students and teachers.
Individually Administered Surveys Individually administered achievement batteries are
commonly used for students with special needs, such as students with disabilities who
otherwise would have difficulty taking assessments in group settings. Students who cannot
be assessed in groups often can be validly assessed in individual sessions

where the assessment administrator can provide the special accommodations they need and
can so establish greater rapport than is possible in a group. See Chapter 5, Figure 5.2, for
examples of ways to modify tests.)

Sometimes individual achievement batteries are used as "screening" tests to identify students
with learning difficulties, or as part of a broader series of individual assessments when a
school psychologist conducts a general psychological evaluation. A school district may use
individual achievement survey batteries to assess the general educational development of a
newly transferred student, or as a double-check on a previously administered group Survey
test when the results are being questioned for a particular student. Because both the content
and norm of an individual assessment are different from the group test, you should proceed
very cautiously when double-checking. You can expect a student's results from the two types
of tests to correspond only very roughly.

Two commonly administered individual survey achievement tests are the Wide Range
Achievement Test third Edition (WRAT-3) and the Peabody individual achievement test-
revisef-normative update (piat-r/nu).

These single instruments contain items that span many ages or grades (essentially ages 5 to
adult). Thus, by their very nature they contain few items specifically associated with sing a
given age or grade level. Such tests do not have as much in-depth coverage as group survey
tests that have separate levels for each age or grade level This comment is not necessarily a
criticism of these tests.These wide-range tests make a quick assessment of a student's
strengths in several basic curricular and areas. This quickly obtained assessment helps the
teacher determine relatively weak areas needing more in-depth diagnostic follow-up.

The PIAT-R/NU's items are printed on a small easel. Students do not write responses to the
multiple-choice items, they must only say or point to the option. Within each subtest the
items are arranged in order of difficulty. A student does not take each item, a starting point
(called a basal level) and an ending point (called a ceiling level) are established, based on the
student's pattern of correct answers and errors.
Multilevel Criterion-Referenced Tests Multilevel criterion-referenced tests provide
information about students' status with respect to the
specific learning targets in a domain. Although some survey batteries also provide this
information, most surveys assess very broadly or globally defined educational development.
Multilevel criterion-referenced tests tend to focus on a more narrowly defined set of learning
targets. Some ith publishers make efforts to align their tests with of states' standards.
Other Multilevel Tests Other types of multilevel tests are stand-alone products that cover
one curricular area, such as reading or mathematics, across several grades.These assessments
provide a deeper and broader sampling of content than a corresponding subtest of a survey
battery. Thus, more time is devoted to assessing students in a single curricular area than when
you use a survey battery subtest. However, if the same sample of students was not used to
norm a stand-alone multilevel test concurrently with tests from other curricular areas, you
cannot use the stand-alone tests to compare a student's relative strengths and weaknesses
across curricular areas. For example, you could not say a student is better in reading than in
mathematics.

Single-Level Standardized Tests if you do not want to measure growth or development, a


single-level test may be useful.Rather than cover several grade or age levels, such tests are
directed toward one level or a particular course.usually these assessments are built for high
school and college courses. There are, for example, tests the for algebra I, first-year college
chemistry, and first- year college French. Each test is a stand-alone product and is not
coordinated with other tests. Thus, these test the results cannot be used to compare a student's
rel- ative standing in several subjects. Scores from this group of achievement tests are most
often interpreted using norm-referencing schemes such as percentile ranks and standard
scores. If you are teaching in a single subject area, such as Algebra I or 19th-Century English
Literature, you may be interested in assessing how well students are performing in just that
subject. Multilevel tests are often inappropriate for such courses because they span several
grades with relatively few items and thus lack content relevance for a the particular course.
For most purposes, a teacher-made

Terjemahan
Ini semua adalah tes yang diatur oleh kelompok, kecuali untuk peabody dan Wide Range,
yang dikelola secara individual. Penerbit tercantum dalam Apendiks K dan L. Detail tentang
setiap baterai dapat diperoleh dari katalog dan Situs Web penerbit. Ulasan kritis ditemukan
dalam Buku-buku Tahunan Pengukuran Mental, Kritik Uji, dan sumber-sumber lain dalam
bab 17. Gambar 15.4 menunjukkan bidang kurikulum, subtest, dan tingkat kelas yang
dicakup oleh beberapa tes pencapaian standar yang lebih populer.

Meskipun survei penerbit yang berbeda memiliki kesamaan dalam fitur permukaannya,
mereka tidak dapat dipertukarkan, meskipun nama-nama subest mungkin terdengar serupa.

gambar 15.4
Isi spesifik menekankan, keterampilan kognitif siswa diminta untuk menggunakan untuk
menyelesaikan tugas, dan cara norma dan skala dikembangkan akan sangat berbeda dari
penerbit ke penerbit.

Tes bervariasi dalam seberapa baik mereka cocok dengan kurikulum atau standar keadaan
bagian distrik sekolah. Dalam beberapa kurikulum, seperti membaca dan mungkin
matematika, kurikulumnya sangat sedikit berbeda dari satu distrik sekolah ke sekolah lain
dalam suatu keadaan. Tes dan kurikulum ini mungkin cocok erat. Dalam kurikulum lain
seperti ilmu pengetahuan dan studi sosial, terutama di antara sekolah dasar, ada variasi yang
jauh lebih besar antar distrik sekolah. Untuk seorang guru, ini berarti bahwa subtest yang
berbeda dalam baterai memiliki nilai lebih kecil dalam menilai spesifik dari apa yang
diajarkan guru selama tahun tersebut. Namun, subtes semacam itu dapat menilai informasi
umum dan kemampuan umum untuk menerapkan pengetahuan dan Keterampilan.

Perbedaan ini mengharuskan pejabat sekolah untuk benar-benar memeriksa item tes sebelum
mereka mengadopsi baterai, menyesuaikan kurikulum lokal mereka dengan konten baterai
dan penekanan keterampilan. ada kesenjangan yang lebar antara target pembelajaran
kurikulum lokal Anda dan tugas-tugas baterai, jangan mengadopsi baterai survei.

Penayang menganggap setiap subtest (misalnya, pemahaman bacaan) menilai dimensi


berkelanjutan yang tumbuh atau berkembang di berbagai tingkatan. Karena masing-masing
subtes adalah serangkaian penilaian bertingkat, penerbit dapat menggunakan data empiris
untuk menghubungkan level bersama dan menempatkan skor siswa dari setiap kelas pada
satu skala numerik yang mencakup semua nilai. Hal ini memungkinkan Anda menggunakan
subtile bertingkat untuk mengukur perkembangan dan perkembangan pendidikan tahun ke
tahun siswa di bidang kurikuler. Berbagai jenis skala pengembangan pendidikan dijelaskan
dalam Bab 16.

Setiap norma penerbit dan standarisasi tesnya dilakukan pada sampel siswa yang berbeda,
sehingga sampel dan skor yang direferensikan norma yang dihasilkan tidak dapat
dibandingkan. Namun, semua subtest dalam satu baterai survei penerbit diberikan kepada
sampel siswa nasional yang sama. Keuntungan utama dari mengelola semua subtes kepada
siswa yang sama adalah bahwa hasil subtest yang berbeda dapat dirujuk ke kelompok norma
yang sama, memungkinkan Anda untuk membandingkan kekuatan dan kelemahan relatif
siswa di berbagai wilayah kurikuler yang berbeda. Anda dapat menilai kekuatan dan
kelemahan, bagaimanapun, hanya dengan membandingkan peringkat persentil siswa dalam
satu area kurikularis dengan peringkat persentil siswa tersebut dalam contoh lain. Contoh dari
jenis perbandingan yang Anda buat berikut.

Contoh:
Shanna lebih baik dalam matematika daripada dia dalam studi sosial karena nilai dalam
matematika lebih tinggi dari 98% siswa di tingkat kelasnya, sedangkan skornya dalam studi
sosial lebih tinggi daripada hanya 60% siswa di tingkat kelasnya. Baterai survei melaporkan
nilai setara kelas dan skor standar, tetapi Anda tidak boleh menggunakannya untuk
membandingkan prestasi siswa dalam dua bidang kurikuler. Peringkat persentil, skor standar,
dan nilai setara-kelas dijelaskan dalam Bab 16.

Target Pembelajaran Umum Hampir semua tes standar yang dipublikasikan mencakup
konten dan target pembelajaran yang dinilai umum untuk banyak sekolah daripada satu
distrik sekolah tertentu. Oleh karena itu, tes prestasi standar tidak difokuskan pada penekanan
pengajaran dari satu guru, satu sekolah, satu buku pelajaran, atau satu set materi kurikuler. Ini
merupakan keuntungan karena memberi Anda pandangan "eksternal atau" objektif tentang
apa yang telah dipelajari siswa Anda. Ini juga merupakan kerugian karena keterampilan dan
pengetahuan kognitif yang dinilai oleh tes mungkin tidak diajarkan kepada para siswa
sebelum mereka diuji. Oleh karena itu, sangat penting bahwa distrik sekolah dengan hati-hati
membandingkan konten tes dan ketika konten tersebut diajarkan di sekolah mereka, item
demi item, dengan standar keadaan bagian dan kerangka kurikulum distrik sekolah sebelum
memutuskan untuk mengadopsinya. Kadang-kadang sedikitnya tiga atau empat item yang
tidak sejajar dapat berdampak serius pada hasil, juga, seorang guru harus mengembangkan
dan menggunakan prosedur penilaiannya sendiri untuk keputusan instruksional sehari-hari
(misalnya, apakah seorang siswa telah menguasai konsep tertentu).

Bahan Bantu Sebagian besar penerbit tes standar dan terdokumentasi secara empiris
menyediakan bahan bantu untuk membantu Anda menafsirkan dan menggunakan hasil
penilaian. Buku pedoman guru menjelaskan dengan sangat rinci tujuan dan penggunaan yang
diinginkan dari hasil, sering menyarankan cara-cara untuk meningkatkan keterampilan siswa
dengan menggunakan hasil penilaian untuk perencanaan pembelajaran. Beberapa penerbit
menyediakan manual terpisah untuk koordinator kurikulum dan administrator sekolah untuk
membantu mereka menggunakan hasil penilaian dalam evaluasi kurikulum dan laporan ke
dewan sekolah. Penerbit hampir memberikan laporan skor tercetak yang bagus bahwa distrik
sekolah dapat menggunakan baik di dalam sekolah dan dengan siswa dan orang tua.

Survey Achievement Battery Selection Periksa dan tinjau setiap tes secara individual untuk
menilai kelayakannya untuk tujuan Anda. Sebelum memilih baterai survei sekolah dasar,
pertimbangkan empat poin ini: 1. Baterai survei hanya mengukur sebagian dari hasil yang
diinginkan untuk sekolah dasar. Gunakan prosedur penilaian tambahan untuk mengevaluasi
hasil lainnya. 2. Konten spesifik dalam mata pelajaran seperti studi sosial dan sains dapat
dengan cepat menjadi kuno. tes yang dirancang untuk mengukur keterampilan kognitif yang
luas atau tingkat pengembangan pendidikan menjadi tanggal kurang cepat. 3. Tes mengukur
keterampilan kognitif yang luas atau tingkat pengembangan pendidikan perlu dilengkapi
dengan tes buatan guru atau tes standar dari konten tertentu. 4. Setiap baterai memiliki
campuran dan penekanan konten dan keterampilan yang berbeda; masing-masing disertai
dengan berbagai macam alat bantu penafsiran. Periksa baterai uji dengan saksama sebelum
memutuskan untuk membelinya. Karena kurikulum sekolah menengah sangat bervariasi,
memilih baterai survei untuk tingkat pendidikan ini sulit. Pejabat sekolah harus mengingat
enam hal berikut ini sebelum memilih baterai uji sekolah menengah:

1. Baterai survei yang menekankan keterampilan dasar (membaca, matematika, bahasa)


mungkin lebih berguna sebagai ukuran kesiapan sekolah menengah daripada sebagai ukuran
hasil sekolah menengah (kecuali program sekolah menengah terutama diarahkan untuk
pengembangan keterampilan dasar)
2. Beberapa tes lebih berorientasi pada pengujian konten spesifik daripada pengembangan
pendidikan yang didefinisikan secara luas. Jika Anda menginginkan tes yang berorientasi
pada konten, tinjau setiap item pada tes dengan hati-hati untuk melihat apakah tes mengukur
apa yang diinginkan sekolah.
3. Tes yang menekankan pengukuran tingkat pengembangan pendidikan yang melintasi
beberapa bidang pelajaran daripada pengetahuan tentang konten tertentu cenderung untuk
mengukur keterampilan yang lebih kompleks dan proses global.
4. Berbagai penawaran kursus di tingkat sekolah menengah membuatnya lebih diperlukan
daripada di tingkat elwmentary untuk memeriksa isi dari setiap baterai survei dengan hati-
hati.

5. Anda mungkin merasa perlu untuk melengkapi baterai survei sekolah menengah dengan
penilaian yang mengukur pengetahuan konten dari mata pelajaran tertentu.
6. Pertimbangan praktis adalah kelanjutan pengukuran dari tingkat dasar hingga menengah.
Ini sering berarti membeli baterai sekolah menengah dari perusahaan yang sama yang
menerbitkan baterai sekolah dasar.

Cornplementing Penilaian Keadaan Anda. Jika keadaan Anda mengamanatkan


penilaiannya sendiri, Anda perlu mempertimbangkan cakupannya sebelum memilih tes
standar yang dipublikasikan. Sebagian besar penilaian keadaan memiliki akuntabilitas
sebagai tujuan utama mereka. Ini bukan kasus untuk tes standar yang diterbitkan, yang
digunakan terutama untuk mengukur pertumbuhan pendidikan setiap siswa. Ingatlah empat
hal berikut ini jika Anda mencoba untuk memilih tes prestasi tingkat tinggi standar ketika
Anda juga dihadapkan dengan penilaian yang diamanatkan oleh keadaan:
1. Semua hal sama, pilih tes standar yang mengharuskan siswa untuk menunjukkan
pembelajaran yang sangat konsisten dengan standar atau kerangka kurikulum keadaan bagian
Anda.
2. Jika komunitas Anda tidak menyukai fokus penilaian yang diamanatkan oleh keadaan
Anda, pilih tes prestasi multilevel yang mencerminkan kepedulian masyarakat. Misalnya,
komunitas Anda mungkin tidak ingin membatasi penilaian yang lebih tinggi dari pemikir
oeder dan pemecahan masalah kompleks yang menjadi fokus penilaian keadaan. Masyarakat
mungkin ingin tahu apakah keterampilan dasar seperti com putation, pemahaman bacaan,
mekanisme penulisan bahasa Inggris, dan ejaan sedang dipelajari.
3. Rencanakan untuk menggunakan tes yang dipilih selama setidaknya 5 tahun, sehingga
Anda dapat melacak perubahan di distrik sekolah Anda.
4. Tes di tingkat kelas yang tidak diuji oleh penilaian stategandated untuk menghindari
overburdening siswa dan guru.

Survei yang Diatur secara Individual Baterai pencapaian yang dikelola sendiri biasanya
digunakan untuk siswa berkebutuhan khusus, seperti siswa penyandang cacat yang
dinyatakan akan mengalami kesulitan dalam mengambil penilaian dalam pengaturan
kelompok. Siswa yang tidak dapat dinilai dalam kelompok sering dapat dinilai secara sah
dalam sesi individu di mana administrator penilaian dapat menyediakan akomodasi khusus
yang mereka butuhkan dan dapat membangun hubungan yang lebih baik daripada yang
mungkin dalam kelompok. Lihat Bab 5, Gambar 5.2, untuk contoh-contoh cara memodifikasi
tes.) Kadang-kadang baterai prestasi individu digunakan sebagai tes "penyaringan" untuk
mengidentifikasi siswa dengan kesulitan belajar, atau sebagai bagian dari serangkaian
penilaian individu yang lebih luas ketika psikolog sekolah melakukan evaluasi psikologis
umum. Sebuah distrik sekolah dapat menggunakan baterai survei prestasi individu untuk
menilai pengembangan pendidikan umum siswa yang baru ditransfer, atau sebagai
pemeriksaan ganda pada tes Survei kelompok yang dikelola sebelumnya ketika hasilnya
dipertanyakan untuk siswa tertentu. Karena konten dan norma penilaian individu berbeda dari
tes grup, Anda harus melanjutkan dengan sangat hati-hati ketika memeriksa ulang. Anda
dapat mengharapkan hasil siswa dari dua jenis tes untuk hanya berkorespondensi secara
kasar. Dua tes hasil survei individu yang umumnya diberikan adalah Uji Prestasi Wide Range
Edisi ketiga (WRAT-3) dan tes Prestasi Individu Peabody-pembaruan-normatif (piat-r / nu).

Instrumen tunggal ini berisi item yang mencakup banyak usia atau tingkatan (pada dasarnya
usia 5 hingga dewasa). Dengan demikian, karena sifatnya mereka mengandung beberapa item
yang secara khusus terkait dengan menyanyikan usia atau tingkat kelas tertentu. Tes
semacam itu tidak memiliki cakupan mendalam yang mendalam seperti tes survei kelompok
yang memiliki tingkat terpisah untuk setiap usia atau tingkat kelas. Komentar ini tidak selalu
merupakan kritik terhadap tes ini. Tes-tes yang luas ini membuat penilaian cepat terhadap
kekuatan siswa dalam beberapa kurikulum dasar dan area. Penilaian yang diperoleh dengan
cepat ini membantu guru menentukan area yang relatif lemah membutuhkan tindak lanjut
diagnostik yang lebih mendalam.

Item PIAT-R / NU dicetak pada kuda-kuda kecil. Siswa tidak menulis tanggapan terhadap
item pilihan ganda, mereka hanya harus mengatakan atau menunjuk ke opsi. Dalam setiap
subtes, barang-barang disusun berdasarkan urutan kesulitan. Seorang siswa tidak mengambil
setiap item, titik awal (disebut tingkat basal) dan titik akhir (disebut tingkat langit-langit)
ditetapkan, berdasarkan pada pola siswa dari jawaban dan kesalahan yang benar.

Tes Bertingkat Criterion-Bertingkat Tes multilevel criterion-referenced memberikan


informasi tentang status siswa sehubungan dengan target pembelajaran khusus dalam domain.
Meskipun beberapa baterai survei juga memberikan informasi ini, sebagian besar survei
menilai pengembangan pendidikan terdefinisi secara luas atau global. Tes-tes yang merujuk
kriteria multilevel cenderung berfokus pada set target pembelajaran yang lebih sempit.
Beberapa penerbit engan membuat upaya untuk menyelaraskan tes mereka dengan standar
keadaan bagian.

Tes Multilevel Lainnya Jenis lain dari tes multilevel adalah produk yang berdiri sendiri
yang mencakup satu area kurikuler, seperti membaca atau matematika, di beberapa kelas.
Penilaian ini memberikan sampling konten yang lebih dalam dan lebih luas daripada subtes
baterai survei yang sesuai. Dengan demikian, lebih banyak waktu dikhususkan untuk menilai
siswa dalam satu bidang kurikuler daripada ketika Anda menggunakan subtes baterai survei.
Namun, jika sampel siswa yang sama tidak terbiasa dengan tes multilevel yang berdiri sendiri
bersamaan dengan tes dari area kurikuler lainnya, Anda tidak dapat menggunakan tes yang
berdiri sendiri untuk membandingkan kekuatan dan kelemahan relatif siswa di area kurikuler.
Misalnya, Anda tidak bisa mengatakan seorang siswa lebih baik dalam membaca daripada di
bidang matematika.

Tes Standar Tingkat Tunggal jika Anda tidak ingin mengukur pertumbuhan atau
perkembangan, tes tingkat tunggal mungkin berguna. Lebih dari sekadar mencakup beberapa
tingkatan kelas atau usia, tes semacam itu diarahkan ke satu tingkat atau kursus tertentu.
Biasanya penilaian ini dibangun untuk program sekolah menengah dan perguruan tinggi.
Ada, misalnya, tes untuk aljabar I, kimia kuliah tahun pertama, dan kuliah tahun pertama
Prancis. Setiap tes adalah produk yang berdiri sendiri dan tidak terkoordinasi dengan tes lain.
Dengan demikian, tes ini hasilnya tidak dapat digunakan untuk membandingkan berdiri siswa
yang relevan di beberapa mata pelajaran. Skor dari kelompok tes prestasi ini paling sering
ditafsirkan menggunakan skema referensi-norma seperti peringkat persentil dan skor standar.
Jika Anda mengajar di satu bidang mata pelajaran, seperti Aljabar I atau Sastra Inggris abad
ke-19, Anda mungkin tertarik untuk menilai seberapa baik kinerja siswa dalam mata
pelajaran tersebut. Tes multilevel sering tidak sesuai untuk kursus semacam itu karena
mereka menjangkau beberapa kelas dengan item yang relatif sedikit dan dengan demikian
tidak memiliki relevansi konten untuk kursus tertentu. Untuk sebagian besar tujuan, seorang
guru dibuat

Anda mungkin juga menyukai