Disusun Oleh:
1 Tri Kusnawati
kusnawati@uny.ac.id
Kesalahan terbesar yang bisa dibuat oleh manusia
di dalam kehidupannya adalah terus-menerus
mempunyai rasa takut bahwa mereka akan
membuat kesalahan (Elbert Hubbard)
2 Tri Kusnawati
kusnawati@uny.ac.id
KATA PENGANTAR
Puji syukur penulis ucapkan ke hadapan Allah SWT karena berkat rahmat,
hidayah, dan karuniaNyalah penulis dapat menyelesaikan Diktat untuk Mata
Kuliah Teknologi Pengajaran Bahasa Prancis ini.
Ucapan terima kasih penulis sampaikan kepada semua pihak yang telah
membantu penulis dalam menyelesaikan penulisan diktat ini. Akhirnya sumbang
saran sangat penulis harapkan demi kesempurnaan diktat ini. Semoga diktat ini
bermanfaat bagi seluruh pembaca, khususnya mahasiswa dan guru Bahasa
Prancis.
3 Tri Kusnawati
kusnawati@uny.ac.id
BAB 1
HAKIKAT EVALUASI
1.1 Pendahuluan
Kegiatan penilaian tidak mungkin dapat dipisahkan dari kegiatan
pendidikan dan pengajaran. Semua kegiatan pendidikan dan pengajaran
pasti selalu diikuti dengan kegiatan penilaian. Istilah penilaian yang
digunakan pada diktat ini sinonim dengan evaluasi. Untuk itu, seorang
pengajar (calon pengajar) harus mengetahui hakikat evaluasi. Dalam bab
ini kita akan membahas tentang pengukuran dan penilaian, definisi dan
komponen penilaian, penilaian sebagai suatu proses, serta tujuan dan
manfaat evaluasi.
4 Tri Kusnawati
kusnawati@uny.ac.id
merupakan tafsiran terhadap kondisi yang ada sekarang dan
merupakan prediksi penampilan pada masa mendatang.
c. Pembuatan Keputusan. Pembuatan keputusan merupakan
pemilihan di antara sejumlah alternatif. Keputusan yang diambil
menuntut diikuti oleh tindakan. Pihak yang terlibat dalam
pengambilan keputusan tidak harus orang yang membuat
pertimbangan, namun bisa juga orang yang sama.
5 Tri Kusnawati
kusnawati@uny.ac.id
REFERENSI
Burhan Nurgiyantoro. 2001. Penilaian dalam Pengajaran Bahasa dan
Sastra. Yogyakarta: BPFE.
6 Tri Kusnawati
kusnawati@uny.ac.id
BAB 2
PENILAIAN
A. PENDAHULUAN
Pada bab sebelumnya telah dibahas mengenai evaluasi yang di
dalamnya memuat perbedaan antara pengukuran dan penilaian. Penilaian
dalam bidang pendidikan khususnya dilakukan untuk menaksir tingkat
kemampuan seseorang secara tidak langsung melalui respon yang
diberikan. Untuk melakukan penilaian diperlukan alat, yang selanjutnya
disebut sebagai alat penilaian. Secara umum alat penilaian dibedakan
menjadi 2 (dua) macam yaitu tes dan nontes. Uraian berikut ini akan
membahas permasalahan tes dan nontes
2. Nontes
Nontes juga merupakan alat penilaian untuk memperoleh informasi
atau data. Informasi atau data yang diperoleh dari nontes ini umumnya
merupakan data bidang afeksi dan psikomotor yang secara tidak langsung
diperlukan untuk melengkapi data-data bidang kognisi yang diperoleh dari
penilaian secara tes. Data nontes akan memberikan penilaian secara
kualitatif. Ada 3 (tiga) macam nontes yang dapat dibaca sebagai berikut.
a. Kuesioner
Kuesioner (questionnaire) atau disebut juga angket,yaitu
serangkaian pertanyaan yang ditujukan kepada siswa (dalam penelitian
disebut sebagai responden). Pertanyaan tersebut diperlukan untuk
melengkapi data atas masalah-masalah tertentu yang dibutuhkan. Daftar
pertanyaan tersebut dapat bersifat terbuka, artinya siswa diperbolehkan
menuliskan pendapat mereka dan bersifat tertutup, siswa hanya memilih
alternatif jawaban yang telah disediakan. Daftar jawaban siswa
selanjutnya diberi skor dan dimasukkan dalam skala-skala tertentu.
Kuesioner ini merupakan cara yang mudah, murah dan sangat
mungkin dilaksanakan dalam suatu penelitian. Langkah-langkah dalam
melaksanakan kuesioner adalah sebagai berikut: 1) menentukan tujuan
kuesioner, 2)menentukan kelompok sampling (dalam hal ini siswa/
responden), 3)menyusun kuesioner itu sendiri, 4)dokumentasi/ pencatatan
kuesioner, dan 5) interpretasi hasil kuesioner.
7 Tri Kusnawati
kusnawati@uny.ac.id
b. Wawancara
Wawancara (interview) merupakan cara untuk memperoleh
informasi yang dilakukan oleh pewawancara dengan cara mewawancarai
(menanyakan)kepada yang diwawancarai. Dalam hal ini, penanya atau
pewawancara adalag guru atau peneliti, sementara yang diwawancarai
adalah siswa atau responden. Secara umum, wawancara dibedakan
menjadi wawancara terstruktur atau terpimpin dan wawancara bebas.
c. Pengamatan
Sering juga disebut dengan istilah observasi, yaitu metode atau
cara-cara menganalisis dan mengadakan pencatatan secara sistematis
mengenai suatu hal (tingkah laku) secara langsung baik terhadap individu
maupun kelompok. Pengamatan memerlukan pencatatan karena
membutuhkan waktu lebih lama jika dibandingkan dengan tes.
Pengamatan secara garis besar dapat dibedakan menjadi pengamatan
secara tertruktur dan pengamatan tak berstruktur.
C. TEKNIK TES
Ada beberapa definisi tentang tes dari beberapa ahli. Secara sederhana,
tes merupakan tugas (atau tugas-tugas) yang diberikan guru kepada
murid. Biasanya orang awam atau bahkan murid akan menyebutnya
sebagai soal, soal tes, atau soal ujian. Padahal tugas-tugas tersebut
merupalan alat tes atau instrument tes. Kebalikan dari nontes, maka tes ini
berurusan dengan data kuantitatif. Setelah tes dilaksanakan, maka data
yang diperoleh perlu dioleh dan dilambangkan dalam sebuah angka atau
skor. Ada beberapa tes yang dapat dilihat sebagai berikut.
8 Tri Kusnawati
kusnawati@uny.ac.id
3) Speed Test dan Power Test
Keduanya termasuk dalam tes yang dikerjakan secara individu .
Ada yang menyatakan kedua tes ini masuk kategori Aptitude and Ability
Test.
a) Speed Test
Dari kata speed kita sudah dapat menebak, tes ini berhubungan
dengan kecepatan. Tes diberikan untuk diselesaikan dalam
durasi yang sudah ditentukan, pertanyaan terbatas dalam 1
(satu) hal, dan metode mengerjakan dan menjawab juga jelas.
Tes ini menitikberatkan pada banyaknya pertanyaan yang dapat
dijawab dengan tepat. Artinya, semakin banyak soal yang
diselesaikan dengan benar, maka hasil tes akan semakin baik.
b) Power Test
Berbeda dengan Speed test, Power test ini pertanyaan yang
diberikan bersifat kompleks, dengan durasi waktu yang sama
dengan speed test, dan metode penyelesaian jawaban tidak
mudah diketahui. Biasanya model tes ini lebih banyak dipakai
untuk sekolah Pasca Sarjana atau jenjang menejer dan
professional.
Sering dikatakan bahwa hasil speed test dapat untuk
memprediksi hasil power test, karena biasanya seseorang yang
speed testnya bagus akan bagus pula dalam power test.
b) Tes Standar
Tes standar yang dimaksudkan di sini adalah tes pencapaian
atau tes prestasi (achievement test). Tes ini mempunyai
mengertian bahwa butir-butir soalnya dikerjakan oleh semua
9 Tri Kusnawati
kusnawati@uny.ac.id
siswa dengan petunjuk yang sama dalam tingkat yang sama
pula. Misalnya, ada soal tes standar untuk tingkat Pendidikan
Dasar dan Pendidikan Menengah dan bersifat seragam/
nasional. Tes standar ini dapat digunakan berkali-kali. Hal ini
salah satu yang membedakannya dengan tes buatan guru
Setelah menentukan bahan tes, lalu dilakukan penyusunan butir-
butir soal. Selanjutnya butir-butir soal tersebut diujicobakan
terhadap sejumlah siswa. Inilah perbedaan selanjutnya jika
dibandingkan tes buatan guru. Hasil ujicoba selanjutkan
dianalisis untuk mencari koefisien tingkat kesulitan dan daya
beda (Tingkat kesulitan dan daya beda akan dibicarakan lebih
lanjut dalam bab lain). Butir soal yang terlalu sulit dan terlalu
mudah akan direvisi, atau bahkan diganti dengan butir soal baru.
Tes standar ini selain berguna untuk mengetahui tingkat hasil
belajar siswa juga dapat untuk pembanding siswa satu sekolah
dengan siswa sekolah yang lain bahkan siswa satu wilayah
dengan siswa wilayah lain. Satu hal lagi yang membedakan dari
tes buatan guru.
10 Tri Kusnawati
kusnawati@uny.ac.id
awal, maka beberapa ahli menyebut achievement test sebagai
tes kemampuan akhir.
b) Tes Sumatif
Tes sumatif dilaksanakan setelah suatu kegiatan pengajaran
selesai. Misalnya pada akhir semester,akhir term atau pada
akhir tingkat. Oleh sebab itu tes ini juga sering disebut sebagai
ulangan umum atau ulangan/ ujian tingkat.
D. BENTUK TES
1. Tes Objektif
Tes ini sering juga disebut dengan tes jawaban singkat. Butir tes
objektif sangat bermanfaat untuk mengukur hasil belajar kognitif tingkat
rendah. Namun sebaliknya tes ini tidak cocok untuk mengukur hasil
belajar yang bersifat kompkes. Tes hasil belajar ini terdiri dari butir-butir
soal yang harus dijawab oleh siswa dengan cara memilih satu jawaban
benar, menjodohkan, mengisi uraian pendek, dan lain-lain. Tes ini
dikatakan mempunyai kebenaran yang objektif. Dalam tes objektif ini
hanya satu jawaban benar (betuk skor 1, salah skor 0). Tes objektif ini
dapat dijabarkan dalam 4 (empat) macam, yaitu:
a) Tes Objektif Bentuk Benar-Salah (True-False Test)
Contoh:
Vrai-Faux Paris est la capital de France
B - S Paris adalah ibukota Negara Prancis
11 Tri Kusnawati
kusnawati@uny.ac.id
d) Tes Objektif Bentuk Pilihan Ganda (Multiple Choice Test)
Contoh:
1.Anna est étudiante. Je suis étudiante aussi.
Nous………….étudiantes.
a. sont b. sommes c. avons d. allons
2. J’ai un chat. …..chat s’appelle Toto
a. Un b. Le c. La d. L’
2. Tes Esai
Tes ini terdiri dari pertanyaan (pertanyaan) yang menhendaki
jawaban dengan uraian panjang. Bentuk tes ini cocok untuk mengukur
hasil belajar yang bersifat kompleks (tingkat kognisi tinggi). Dalam tes ini,
siswa diharuskan menyusun sendiri kata- kata/ kalimatnya.
Kedua bentuk tes (tes objektif dan tes esai) di atas masing-masing
mempunyai kelebihan dan kelemahan. Guru yang ideal akan mampu
meminimalkan kelemahan sehingga, tetap dapat memberikan penilaian
secara objektif.
1. Cloze Test
Tes ini bertujuan untuk mengetahui pemahaman siswa terhadap
konten suatu teks. Penyusunan cloze test ini dengan cara menghilangkan
beberapa kata dalam 1 (satu) teks. Siswa kemudian diminta untuk mengisi
tempat yang kosong tersebut dengan kata yang tepat, sesuai dengan
12 Tri Kusnawati
kusnawati@uny.ac.id
konteksnya. Selama jawaban itu masih bisa berterima dengan konteks,
maka dimungkinkan ada lebih dari 1 (satu) jawab benar.
Contoh:
To jump to a scene, click _____ Henry's shirt pocket. The note pad _____.
Then, click on the options tab. _____ options page appears. Then, click on
_____ arrows on the right and left _____ of the scene pictured near the
_____ of the page to _____ through the scenes. When you find the scene
_____ want, click the picture to go _____. (Diambil dari tulisan Richard E.
Mayer, Cognitive Education, USA).
2. Tes Lisan
Tes lisan lebih sering terdengar pada jenjang pendidikan yang lebih
tinggi. Tes lisan ini bukan hanya menilai pengetahuan saja, namun juga
keterampilan dalam menyampaikan pengetahuan tersebut. Dalam hal ini
keterampilan berkomunikasi secara lisan juga dinilai. Tes lisan dapat
berlangsung di depan kelas (guru berhadapan langsung dengan seorang
siswa), secara panel, atau dalam 1 (satu) kelas.
Dalam tes lisan secara formal, biasanya sudah terdapat daftar
pertanyaan pada penguji (guru). Siswa harus menjawab pertanyaan
tersebut, menjawab secara tepat, jelas, tidak boleh memberikan informasi
berlebihan kecuali jika diminta. Sebaliknya jika secara informal, siswa
boleh memberikan informasi yang lebih daripada secara formal.
3. Portofolio
Penilaian berdasarkan portofolio bukan hanya sekedar berisi
kumpulan daftar observasi dan karya siswa secara acak, namun
merupakan kumpulan yang dibuat secara sistematis. Observasi tercatat
dan hasil karya siswa harus sesuai dengan tujuan pembelajaran. Misalnya
buku perantara (log book) yang dipegang oleh siswa akan mampu
menampilkan refleksi tingkat perkembangan perilaku dan kebiasaan siswa
dalam membaca. Tingkat perkembangan pemahaman siswa dalam
membaca, kemudian mengkonstruksinya dalam perkembangan perilaku
menulis dapat dijadikan sebagai parameter kemajuan siswa.
13 Tri Kusnawati
kusnawati@uny.ac.id
F. CECRL-DELF
1. CECRL
CECRL atau Cadre Europeen Cadre Reference de Langue adalah
kerangka acuan umum Eropa tentang bahasa. CECRL ini dikembangkan
melalui proses penelitian dan diskusi panjang yang akhirnya
menghasilkan perangkat praktis dan susunan standar yang harus
ditempuh secara bertahap dalam mempelajari bahasa. CECRL juga
sekaligus memuat cara pengajaran dan penilaiannya secara Internasional.
Jadi bukan hanya berlaku untuk bahasa Prancis saja.
Pada tahun 2001 Uni Eropa menyetujuai adanya system validasi
kompetensi bahasa-bahasa di Eropa, yang diikuti juga dengan penetapan
Portofolio bahasa-bahasa di Eropa, dan deklarasi hari bahasa.
CECRL dibagi dalam tingkatan-tingkatan sebagai berikut:
a) Niveau/ tingkat A1
b) Niveau/ tingkat A2
c) Niveau/ tingkat B1
d) Niveau/ tingkat B2
e) Niveau/ tingkat C1
f) Niveau/ tingkat C2
Sampai saat ini ada beberapa Negara di luar Uni Eropa yang juga
mengadopsi CECRL ini, misalnya Jepang dan Taiwan.
2. DELF
DELF atau Diplome D’Etudes en Langue Françaises adalah satu-
satunya sertifikat penguasaan bahasa Prancis sebagai bahasa asing yang
dikeluarkan oleh Kementerian Pendidikan Prancis. Sampai saat ini ujian
DELF diselenggarakan di 163 negara di dunia.
G. TUGAS
H. REFERENSI
Brown, Dauglas.2004. Language Assessment: Principle and Classroom
Practices.New York: Longman
14 Tri Kusnawati
kusnawati@uny.ac.id
http://www.ciel-strasbourg.org/niveau_a1.html
15 Tri Kusnawati
kusnawati@uny.ac.id
BAB 3
KRITERIA INSTRUMEN
A. PENDAHULUAN
Instrumen sebagai alat pengukur hasil belajar siswa, diharapkan
mampu memberikan informasi yang dapat dipertanggungjawabkan
kebenarannya. Artinya, instrument dapat memberikan informasi tentang
siswa sesuai dengan keadaan yang mendekati sesungguhnya. Agar
instrumen dapat memberikan informasi yang dapat
dipertanggungjawabkan, instrumen tersebut harus dapat
dipertanggungjawabkan sebagai alat penilaian yang baik. Untuk itu, kita
membutuhkan informasi apakah alat tes yang disusun telah memenuhi
syarat ”baik” yang dimaksud.
C. PENTINGNYA TUJUAN
Untuk menentukan tingkat kelayakan alat tes, kesesuaian dengan
tujuan merupakan kriteria utama. Tes yang dapat mengukur keluaran hasil
belajar sesuai dengan yang disarankan oleh tujuan itulah tes yang
memenuhi kriteria kelayakan. Tiap butir tes harus secara jelas dapat
mengacu pada tujuan tertentu. Sebaliknya, setiap tujuan harus
mempunyai alat ukurnya dan harus dapat ditunjuk (butir-butir soal nomor
berapa, berapa jumlah, apakah telah sesuai dengan tingkat pentingnya
dan cakupan bahan yang ditunjuk).
Kadang-kadang terjadi adanya satu atau beberapa tujuan yang
tidak mempunyai butir-butir tes yang dimaksudkan untuk mengukur
ketercapaiannya. Atau mungkin sebaliknya, ada sejumlah butir soal yang
tidak mempunyai tujuan, tidak jelas yang dimaksudkan untuk mengukur
ketercapaian tujuan yang mana. Jika kasus seperti ini terjadi, berarti alat
tes tersebut tidak memenuhi kriteria kelayakan, karena itu instrumen
tersebut bukanlah alat ukur yang baik.
16 Tri Kusnawati
kusnawati@uny.ac.id
D. KESESUAIAN DENGAN BAHAN
Tes yang baik adalah yang sesuai dengan bahan pelajaran yang
telah diajarkan. Bahan pelajaran itu sendiri dikembangkan berdasarkan
tujuan. Dengan demikian, kaitan antara ketiga komponen tujuan, bahan,
dan alat penilaian cukup erat. Penyusunan alat tes pada kenyataannya
lebih mendasarkan diri pada bahan pelajaran. Penilaian terhadap
ketercapaian tujuan pada hakikatnya tidak lain dari penilaian terhadap
penguasaan bahan.
Semua bahan (pokok bahasan) yang diajarkan harus diteskan.
Pada kenyataannya, juga sering terjadi terdapat beberapa pokok bahasan
yang diajarkan tidak diteskan, atau pengambilan bahan tes tidak bersifat
mewakili. Sebaliknya, kadang-kadang terjadi adanya sejumlah butir soal
yang dimaksudkan untuk mengukur penguasaan terhadap suatu bahan
(pokok bahasan) yang belum atau tidak diajarkan.
Kesesuaian alat tes dengan tujuan dan bahan pelajaran ini
merupakan salah satu jenis kesahihan, yaitu kesahihan isi (content
validity), suatu jenis kesahihan yang penting dalam tes buatan guru. Agar
alat tes dapat dipertanggungjawabkan tingkat kelayakan atau kesahihan
isinya, penyusun tes itu hendaknya mendasarkan diri pada deskripsi
bahan yang diajarkan. Dengan kata lain, kita perlu membuat deskripsi
bahan yang diajarkan.
E. TUGAS
F. REFERENSI
Brown, Dauglas.2004. Language Assessment: Principle and Classroom
Practices.New York: Longman
17 Tri Kusnawati
kusnawati@uny.ac.id
BAB 4
VALIDITAS DAN RELIABILITAS TES
A. PENDAHULUAN
Ketika kita ingin mengukur sesuatu, kita harus dapat memilih alat
ukur yang sesuai sehingga kita dapat memperoleh hasil pengukuran
dengan tepat. Ketepatan hasil pengukuran inilah yang dinamakan
validitas. Ada beberapa macam validitas yang sudah dibicarakan dalam
bab sebelumnya. Sehubungan dengan penyusunan alat tes, ada istilah
bahwa selain valid, tes juga harus reliabel. Apa itu Reliabilitas? Tes
harus reliabel, artinya jika tes tersebut digunakan lebih dari satu kali pada
kelompok yang sama maka tes tersebut harus dapat memberikan hasil
pengukuran yang tetap. Reliabilitas suatu tes dapat ditingkatkan dengan
cara menambah jumlah butir soal, dengan catatan bahwa soal yang
ditambahkan harus homogen dengan butir soal yang sudah ada.
B. VALIDITAS
1. Teknik t-test
Teknik t-test ini dapat dipakai untuk menghitung koefisien dengan cara
mencari perbedaan nirai rerata hasil tes yang sama pada 2 (dua)
kelompok siswa yang berbeda. Misalnya tes teori sastra yang diberikan
pada kelompok pertama yang sudah memperoleh mata pelajaran teori
sastra, sementara kelompok kedua belum memperoleh teori sastra.
Kelompok pertama sebagai (X1) dan kelompok kedua sebagai (X2).
Contoh penghitungannya, seperti terdapat dalam buku Nurgiyantoro
(2001).
Keterangan=
t = koefisien yang akan dicari
X1 = nilai rerata kelompok pertama (yang sudah memperoleh teori
sastra)
X2 = nilai rerata kelompok kedua (yang belum memperoleh teori
sastra)
n = jumlah subjek
s² = taksiran varian
18 Tri Kusnawati
kusnawati@uny.ac.id
Dari rumus dan keterangan di atas, ternyata kita masih harus mencari nilai
taksiran varian, yaitu s². Dengan rumus berikut di bawah ini kita akan
dapat memperoleh taksiran varian.
(∑X1)² (∑X2)²
(∑ X1² - ______) + (∑ X2² - _____)
n1 n2
S² = ____________________________________________
n2 + n2 - 2
X1 = ∑ X1 = 56 = 7 X2 = ∑X2 = 33 = 4,125
n1 8 n2 8
19 Tri Kusnawati
kusnawati@uny.ac.id
56² 33²
(396 - ______) + (138 - _____)
8 8
S² = ______________________________________
8 + 8 - 2
= 7 - 4,125
__________
√0,42 + 0,42
8 8
= 2,875 = 8,873
0,324
∑D
t = ____________
__________
√ n∑D ² - (∑D)²
N - 1
20 Tri Kusnawati
kusnawati@uny.ac.id
Keterangan
D = Perbedaan skor antara 2 (dua ) tes (X1 – X2)
∑ D = Jumlah perbedaan skor antara X1 – X2
N = Jumlah subjek
Skor X1 dapat diperoleh dari hasil pretest teori sastra, dan skor X2
diperoleh dari hasil posttest. Selanjutnya, langkah yang harus dilakukan
adalah menyusun daftar skor agar lebih mudah dihitung seperti di bawah
ini.
Subjek X1 X2 D D²
1. 4,0 7,0 -3,0 9,00
2. 3,5 7,3 -3,8 14,44
3. 3,5 6,8 -3,3 10,89
4. 4,3 7,5 -3,2 10,24
5. 4,2 7,5 -3,3 10,89
6. 3,3 6,2 -2,9 8,41
7. 4,2 6,8 -2,6 6,76
8. 4,3 7,5 -3,2 10,24
n= 8 ∑ X1= 28,3 ∑ X2 = 56,5 ∑D= -25,3 ∑D²= 80,87
-25,3
t= _________________
_________________
√ 8 x 80,87 - (-25,3)²
8 - 1
-25,3
= ________________
________________
√ 646,96 – 640,09
7
-25,3
= ________________ = -25,53
0,991
21 Tri Kusnawati
kusnawati@uny.ac.id
memperlihatkan koefisien yang sangat jauh dari koefisien dalam tabel.
Artinya, tes teori sastra yang diujikan pada subjek yang sama tadi
mempunyai tingkat kesahihan yang tinggi.
Keterangan:
r1.2 = Koefisioen korelasi yang dicari
N = Jumlah skor
X1 = Skor hasil tes pertama (yaitu Comprehénsion Ecrite )
X2 = Skor hasil tes kedua (yaitu Vocabulaire)
22 Tri Kusnawati
kusnawati@uny.ac.id
No Urut X1 X2 X1² X2² X1 X2
Subjek
1. 6,5 7,0 42,25 49,00 45,50
2. 6,5 6,5 42,25 42,25 42,25
3. 6,0 6,5 36,00 42,25 39,00
4. 5,6 6,5 31,36 42,25 36,40
5. 7,0 6,8 49,00 46,24 47,60
6. 7,0 7,5 49,00 56,25 52,50
7. 6,5 7,0 42,25 49,00 45,50
8. 6,0 6,8 36,00 46,24 40,80
N= 8 ∑X1=51,1
∑ X2= ∑ X1²= ∑ X2 ²= ∑ X1 X2=
54,6 328,11 373,48 349,55
Kemudian masukkan data hasil penghitungan awal di atas ke dalam
rumus korelasi
= 2.796,4 - 2.790,06
______________________
√ (13,67) (6,68)
= 6,34
9,56
= 0,663
C. RELIABILITAS
1. KR20, 21 (Kuder-Richardson 20-21)
Penghitungan koefisien reliabilitas KR20,21 ini hanya dikenakan pada tes
yang mempunyai skor dikotomi. Maksudnya, jawaban benar diberi skor 1
(satu) dan jawaban salah diberi skor 0 (nol).
23 Tri Kusnawati
kusnawati@uny.ac.id
Rumus KR20
n ∑pq
r = _____ ( 1 - _____ )
n–1 S²
Keterangan
r = Koefisien reliabilitas tes
n = Jumlah butir soal
p = Proporsi jawaban betul
q = Proporsi jawaban salah ( q = 1 – p )
S = Simpangan baku
S² = Varian
Rumus KR21
n X(n- X)
r = _____ ( 1 - _________ )
n–1 nS²
Keterangan
r = Koefisien reliabilitas tes
n = Jumlah butir soal
X = Rerata (mean)
S² = Varian
24 Tri Kusnawati
kusnawati@uny.ac.id
2. Koefisien Alpha
Berbeda dengan KR20,21, koefisien Alpha atau lengkapnya Alpha
Cronbach menghitung koefisien reliabilitas tes dengan jawaban
berjenjang. Maksudnya jawaban antara angka 1-5, seperti yang biasa
terdapat dalam pemberian skor angket.
Tes dikatakan mempunyai tingkat ketepercayaan jika dari penghitungan
nilai koefisien menghasilkan angka antara 0,5 – 1,0. Sebaliknya tingkat
koefisien di bawah 0,5 dikatakan tidak tepercaya atau instrumen tes itu
buruk. Sementara ada pendapat lain yang menyatakan bahwa baik
buruknya tes/ instrument tes dengan membandingkan nilai koefisien r
hitung (ɑ)dengan koefisien r dalam tabel. Jika nilai dari hitungan lebih
besar daripada nilai koefisien r (ɑ) tabel, maka dikatakan tes itu
mempunyai tingkat ketepercayaan yang tinggi.
Rumus
K ∑ Si²
r = _____ ( 1 - _______ )
K–1 St²
Keterangan
K = Jumlah butir soal
∑ Si² = Jumlah varian butir-butir soat
St² = Total varian (seluruh butir tes)
3. Spearman Brown
Koefisien Spearman Brown merupakan kelanjutan dari “Teknik Belah Dua”
atau (Split-Half Reliability ) yang hanya menghitung koefisien reliabilitas
separuh soal. Spearman Brown menyempurnakannya sehingga akan
memberikan reliabilitas keseluruhan tes. Nilai koefisien r ini akan sangat
dipengaruhi oleh jumlah subjek (n).
Rumus Spearman Brown
25 Tri Kusnawati
kusnawati@uny.ac.id
D. TUGAS.
Tugas kelompok dengan jumlah anggota 3-5 orang. Silakan mengambil
sampel soal uji coba SNMPTN yang diselenggarakan oleh suatu lembaga
bimbingan belajar di Yogyakarta. Temukan subjek sebanyak 20 orang
agar Anda memperoleh skor sebanyak 20 orang. Selanjutnya analisislah
tingkat kesahihan dan ketepercayaan soal tes tersebut berdasarkan dari
skor 20 subjek dari lembaga bimbingan belajar. Selamat mengerjakan!
E. REFERENSI
Nurgiyantoro, Burhan.2001. Penilaian dalam Pengajaran Bahasa dan
Sastra. Yogyakarta: PT. BPFE.
http://www. azuarjuliandi.com
http://www.scribd.com
26 Tri Kusnawati
kusnawati@uny.ac.id
BAB 5
TABEL SPESIFIKASI
A. PENDAHULUAN
Agar instrumen penilaian yang dibuat memiliki keseimbangan
dalam jumlah dan bobot, sebelum menyusun instrumen perlu dibuat tabel
spesifikasi. Tabel spesifikasi berguna bagi guru atau penyusun soal tes
untuk selalu mendasarkan diri pada rambu-rambu yang telah ditetapkan.
Hal iu penting karena tak jarang guru hanya memfokuskan diri pada
beberapa pokok bahasan dan tingkatan kognitif tertentu, sengaja ataupun
tidak. Misalnya seorang guru bahasa Prancis yang kebetulan menyenangi
tata bahasa, seperti dalam pengajarannya, ia akan lebih banyak membuat
soal tata bahasa saja yang mungkin hampir separuh jumlah seluruh soal.
Akibatnya, pokok soal yang lain kurang mendapat porsi yang semestinya.
27 Tri Kusnawati
kusnawati@uny.ac.id
D. PENGISIAN TABEL SPESIFIKASI
Kegiatan pertama pengisian tabel spesifikasi menentukan pokok-
pokok bahasan yang akan diteskan, kemudian menentukan perimbangan
bobot masing-masing pokok bahasan dan tingkatan aspek kognitif yang
akan diungkap. Setelah itu, kita menentukan jumlah seluruh soal yang
akan diteskan, baik tes yang berbentuk objektif atau esai, dengan
mendasarkan diri pada waktu yang tersedia.
Tabel
Contoh Tabel Spesifikasi dengan Pertimbangan Bobot
per Pokok Bahasan dan Tingkatan Kognitif dalam Persentase
Tingkat Ingata Pemah Aplika Analisi Sintesi Evalua Jumla
an n a si s s si h
Kognitif man
Catatan : jika semua soal berbentuk objektif dengan bobot satu, hasil
perhitungan di atas sekaligus menunjukkan jumlah butir soal.
Pengisian tiap sel selain dengan cara di atas, juga dapat dihitung
langsung berdasarkan besarnya presentase pokok bahasan, tingkatan
kognitif, dan jumlah keseluruhan skor. Berikut dicontohkan dua buah
penghitungan yang dimaksud.
- Sel membaca, ingatan : 20% x 20% x 75 = 3
29 Tri Kusnawati
kusnawati@uny.ac.id
- Sel kosa kata, ingtan : 20% x 20% x 75 = 1,5 (2)
Keterangan :
*) pembulatan angka di atas 0,5 tidak harus ke atas dengan
pertimbangan (-pertimbangan) tertentu, yaitu (i) karena kita
mendasarkan diri pada jumlah butir soal per pokok bahasan atau per
tingkatan kognitif, sehingga jika pembulatan selalu ke atas, ada
kemungkinan jumlah butir soal yang di dapat akan melebihi target; (ii)
pengukuran kemampuan terhadap pokok bahasan yang bersangkutan
dirasa lebih tepat jika tingkatan kognitif yang di bawahnya yang
ditambah porsinya.
30 Tri Kusnawati
kusnawati@uny.ac.id
tertinggi, karena skor tes esai adalah berskala dan belum tentu sama
antara nomor satu dengan yang lain (misalnya: No. 1: 1-4; No. 2:1-5; No.
3:1-6)
Demikian pula halnya dengan penyusunan soal yang menyangkut
tingkatan kognitif, mungkin sekali hanya mengungkap tingkatan C1 dan C2,
atau sedikit tingkatan di atasnya. Sebab, kedua tingkatan tersebut lebih
mudah disusun alat tesnya daripada yang lain.
Dengan selalu melihat kisi-kisi, kita akan mengetahui pokok
bahasan dan tingakatan mana saja yang sudah cukup, masih kurang, atau
belum terisi. Caranya ialah begitu selesai menyusun suatu butir soal,
segera kita tuliskan cacahan (tally) pada tiap sel yang dibuat alat tesnya.
Melalui penghitungan cacahan itulah kita akan tahu sel mana saja yang
sudah memenuhi target dan yang belum. Dengan cara seperti itu dapat
diharapkan tersusunnya sebuah alat penilaian yang komprehensif seperti
yang direncanakan.
31 Tri Kusnawati
kusnawati@uny.ac.id
G. TUGAS
Buatlah tabel spesifikasi tes sumatif bahasa Prancis dengan jumlah
soal 50 butir, 60 butir, dan 90 butir.
H. REFERENSI
32 Tri Kusnawati
kusnawati@uny.ac.id
BAB 6
TES KOMPETENSI KEBAHASAAN
A. PENDAHULUAN
Kompetensi kebahasaan seseorang berhubungan dengan sistem
bahasa, struktur, kosa kata atau seluruh aspek kebahasaan serta
hubungan dari tiap-tiap aspek kebahasaan yang telah tersebut di atas.
Kompetensi kebahasaan tersebut berpengaruh pada kemampuan
seseorang dalam melakukan tindak bahasa. Maksudnya, ada ahli yang
mengatakan bahwa keterampilan berbahasa seseorang itu bergantung
pada kualitas dan kuantitas kosa kata. Bahkan lebih lanjut dikatakan
bahwa penguasaan kosa kata seseorang akan menunjukkan kemampuan
berkomunikasi orang tersebut. Sementara di sisi lain, penguasaan
bahasa lisan maupun tertlis tidak akan pernah dapat dilakukan tanpa
adanya penguasaan struktur bahasa. Bab ini akan menguraikan tes
kompetensi kebahasaan
1. Kemampuan Reseptif.
Salah satu kemampuan seseorang dalam tindakan bahasa bersifat
reseptif. Reseptif maksudnya menyerap, atau pasif. Misalnya dalam mata
kuliah Compréhension Orale dan Compréhension écrite. Secara umum
kegiatan menyimak, mendengarkan dan membaca masuk dalam
kelompok ini.
Menyimak merupakan usaha memahami informasi yang
disampaikan dalam bentuk ujaran. Oleh karena itu siswa membutuhkan
pengetahuan tentang sistem bunyi dan ejaan bahasa yang dipelajari. Tes
kemampuan reseptif menyimak menuntut siswa untuk dapat memahami
informasi lisan wacana sederhana tentang tema-tema tertentu, sesuai
niveau atau tingkat pembelajar/siswa.
Sedangkan membaca merupakan usaha memahami informasi yang
disampaikan dalam bentuk tulisan. Oleh sebab itu siswa bukan hanya
membutuhkan pengetahuan tentang ejaan, namun juga struktur dan kosa
kata. Tes kemampuan reseptif membaca menuntut siswa untuk dapat
memahami informasi tertulis wacana sederhana tentang tema-tema
tertentu, sesuai dengan tingkat an pembelajar.
33 Tri Kusnawati
kusnawati@uny.ac.id
2. Kemampuan Produktif
Kebalikan dari reseptif adalah produktif. Yaitu kemampuan
seseorang dalam menghasilkan tindak bahasa. Hasil di sini maksudnya
adalah hasil bicara, berpidato, monolog, dan menulis. Contoh dari
kemampuan ini misalnya terdapat dalam mata kuliah Expression Orale
dan Expression Ecrite.
Kegiatan berbicara (contoh lain: pidato, monolog) merupakan
kegiatan yang menghasilkan bahasa untuk mengkomunikasikan atau
menginformasikan ide dan pikiran si pembicara. Agar mempunyai
kemampuan berbicara yang prima, siswa bukan hanya membutuhkan
kemampaun tentang sistem bunyi, namun juga unsur bahasa dan ide/
pikiran. Unsur bahasa terdiri dari struktur dan kosa kata. Penyampaian ide
membutuhkan ketepatan pemilihan diksi, alur penyampaian, kejelasan ide
yang semuanya dapat dijadikan komponen untuk menyusun rambu-rambu
tes kemampuan produktif berbicara.
Kegiatan menulis merupakan kegiatan yang menghasilkan bahasa
dan tulisan. Ide dan pikiran dari siswa (atau dalam hal ini disebut penulis)
ditulis dalam rangkaian kata menjadi kalimat. Kalimat demi kalimat
disusun dalam suatu paragraf. Keterampilan menulis membutuhkan
kejelian dalam mengungkapkan ide pokok dalam 1 (satu) paragraf dan
kalimat-kalimat yang mendukung ide tersebut. Tes kemampuan produktif
menulis menuntut siswa agar mampu memberikan kejelasan ide dan
pikiran dengan menggunakan bahasa yang tepat dalam menulis.
1. Tes Struktur
Contoh tes struktur dapat dilihat sebagai berikut:
Choisissez la bonne réponse
-- ???? --
1) Nous étudiants. ( suis, sommes, sont)
--????--
2) Nous allons manger croissants? (un, une, des)
34 Tri Kusnawati
kusnawati@uny.ac.id
--????--
3) Tu as un stylo. C'est stylo.(ton, ta, tes)
-- ???? --
4) Ils le musée. (visite, visites, visitent)
-- ????--
5) Georges et Yves alcool. (bois, buvez, bouvent)
2. Tes Kosakata
Contoh tes kosakata dapat dilihat sebagai berikut:
Complétez ces dialogues avec les mots proposés.
35 Tri Kusnawati
kusnawati@uny.ac.id
dalam soal di atas. Ini yang dinamakan tes diskrit. Jadi tes yang hanya
menekankan 1(satu) aspek kebahasaan atau 1 (satu) keterampilan
berbahasa saja.
Munculnya teori tes diskrit ini sejalan dengan teori strukturalisme
(dalam bidang linguistic) dan teori behaviorisme (dalam bidang psikologi)
(Brown, 1980:217). Aliran ini beranggapan bahwa keseluruhan bahasa itu
dapat dipahami dan dikuasai dengan cara memecah asek dan
kemampaun berbahasa itu menjadi bagian-bagin terpisah(baca= dipisah-
pisahkan). Misalnya bidang fonetik terlihat pada soal di atas tadi yang
hanya mengukur kemampuan menyimak dengan cara membedakan 2
(dua) buah fonem, atau bidang struktur, kosakata, kemampuan membaca,
kemampuan menulis saja, dll. Sementara fungsi bahasa secara
keseluruhan kurang diperhatikan (jika dibandingkan dengan tes integratif
yang akan dibahas di bagian lain dalam bab ini).
Pemahaman bahwa kemampuan dan keterampilan kebahasaan
seseorang tidak dapat dipisah-pisahkan memunculkan ketidaksetujuan/
keraguan akan keberhasilan siswa dalam belajar bahasa. Tes diskrit telah
dianggap gagal untuk mengukur kemampuan kebahasaan siswa.
Munculnya pendekatan baru dalam pengajaran bahasa, yaitu pendekatan
komunikatif melahirkan teori tes yang menolak tes diskrit ini.
2. Tes Integratif
Tes integrative muncul sejalan dengan munculnya pendekatan
komunikatif dalam pengajaran bahasa. Telah dijelaskan pada bagian
sebelumnya bahwa tes integrative ini bertolak belakang dengan tes diskrit.
Tes integrative merupakan tes yang mengukur beberapa aspek
kebahasaan atau beberapa keterampilan berbahasa secara integral
(menjadi satu/ bersama-sama) (Oller, 1979:37). Minimal ada 2 (dua)
aspek kebahasaan atau 2 (dua) keterampilan berbahasa yang dapat
diukur. Bandingkan dengan tes diskrit yang hanya mengukur 1 (satu)
aspek kebahasaan atau 1 (satu) keterampilan berbahasa!
36 Tri Kusnawati
kusnawati@uny.ac.id
menulis tanggal, bagaimana menulis sapaannya, bagaimana salam
pembuka dan penutupnya, dll.
4. Pengalaman apa saja yang akan diceritakan selama liburan ke dalam
kartu pos? Jika menulis cerita tentang liburan, maka sudah pasti
liburan itu sudah dilaksanakan atau sedang dan masih dilaksanakan.
Hal ini akan berpengaruh pada pemilihan temps atau kala waktu, yang
dalam hal ini berbeda cara pengungkapannya dengan cara dalam
bahasa Indonesia.
Dari hanya 1 (satu) soal untuk menulis kartu pos yang lebarnya kira-kira
seperempat kertas folio itu sudah diperlukan lebih dari 2 (dua) aspek
kebahasaan.
3. Tes Pragmatik
Tes pragmatik muncul seiring dengan pendekatan komunikatif
dalam pengajaran bahasa. Sebagaimana diketahui, pendekatan
komunikatif dalam pengajaran bahasa popular pada tahun 1970-1980.
Pendekatan ini menekankan pada pembentukan kompetensi bahasa dan
kemampuan berbahasa dalam fungsi komunikasi yang wajar (seperti
dalam situasi pemakaian bahasa yang sesungguhnya). Dalam konteks
berkomunikasi akan terdapat hubungan sistematis dan timbal balik antara
konteks linguistik (konteks yang ada dalam bahasa) dan konteks
ekstralinguistik (konteks yang ada di luar bahasa).
Tes pragmatik tidak menyajikan tes struktur atau kosakata ataupun
unsur-unsur kebahasaan lainnya secara diskrit. Tes pragmatik lebih
menekankan pada kemampuan siswa untuk berkomunikasi dengan
bahasa dalam situasi tertentu. Mungkin akan terjadi kesalahan atau
kesilapan dalam berbahasa/ berkomunikasi, namun senyampang
kesalahan tersebut tidak mengganggu kelancaran berkomunikasi, maka
hal tersebut (baca= kesalahan/ kesilapan) tidak akan dianggap sebagai
masalah.Tes pragmatik sudah tentu bersifat integrative. Namun tes
integrative belum tentu pragmatik.
37 Tri Kusnawati
kusnawati@uny.ac.id
melengkapi ruang yang kososng dengan kata/ kelompok kata yang sesuai
tengan konteks sehingga teks tersebut menjadi sempurna.
Dikte juga dapat dilaksanakan dengan member semacam “gangguan”
suara. Hal ini dilakukan agar menyerupai peristiwa berbahasa
sesungguhnya yang kadang-kadang bisa jelas, namun juga bisa
terganggu oleh suara lain di sekitarnya. Jika hasil dikte tersebut ditulis,
maka disebut dengan dikte-komposisi atau dictation-composition atau
dicto-compo.Sedangkan yang tidak ditulis, maksudnya disampaikan
secara lisan disebut produksi lisan imitasi.
b) Berbicara
Tes kemampuan berbicara bertujuan untuk mengukur kemampuan siswa
dalam mengekspresikan ide dan gagasannya secara lisan. Tes ini dapat
dilakukan dengan cara menyuruh siswa membangun suatu cerita
berdasarkan gambar (dan atau gambar berseri) yang diperlihatlan oleh
guru. Teknik lain yang dapat dipakai untuk mengadakan tes berbicara
adalah dengan melakukan wawancara, baik wawancara terstruktur
maupun takterstruktur. Penyusunan tes tetap harus mempertimbangkan
tingkat pembelajar/ siswa. 3 (tiga) macam tes berikut ini termasuk dalam
tes berbicara (bercerita, pidato, diskusi)
c) Bercerita
Bercerita juga merupakan tes kemampuan berbicara. Tes dengan teknik
bercerita ini dapat dilakukan dengan memberikam rangsangan berupa
gambar (dan atau gambar berseri) seperti pada tes kemampuan
berbicara. Namun dapat juga dengan menggunakan teknik lain, misalnya
menceritakan aktivitas sehari-hari, olah raga kegemaran, liburan,
pengalaman memasak, naik gunung, dan lain-lain. Untuk siswa
SMA/SMA/MA dapat juga memasukkan tema pengalam lomba cerdas-
cermat, lomba pidato, dll. Sementara untuk tingkat perguruan tinggi, teknik
bercerita dapat dijadikan juga sebagai tes. Misalnya dengan tes bercerita
tentang 1 (satu) bab atau 1 (satu) buku yang harus dibaca.
d) Berpidato
Tes ini hamper sama dengan tes bercerita. Dalam praktinya tes berpidato
ini dapat diberikan dengan cara simulasi. Maksudnya, seorang siswa
bertindak sebagai rektor UNY untuk menyampaikan pidato dies natalis,
atau sebagai presiden RI yang berpidato menyambut kedatangan
presiden AS.
Adapaun model penilaian tes berpidato (dan juga dapat dipakai sebagai
pedoman penilaian bercerita) dapat dilihat di bawah ini (Jakobovits &
Gordon).
38 Tri Kusnawati
kusnawati@uny.ac.id
Model Penilaian TUgas Berpidato (dan bercerita)
No. Aspek yang dinilai Tingkatan Skala
1. Keakuratan informasi (sangat buruk---akurat 0 1 2 3 4 5 6 7 8 9 10
sepenuhnya)
2. Hubungan antarinformasi (sangat sedikit--- 0 1 2 3 4 5 6 7 8 9 10
berhubungan sepenuhnya)
3. Ketepatan struktur dan kosakata (tidak 0 1 2 3 4 5 6 7 8 9 10
tepat---tepat sekali)
4. Kelancaran (terbata-bata---lancar sekali) 0 1 2 3 4 5 6 7 8 9 10
5. Kewajaran urutan wacana (tidak normal--- 0 1 2 3 4 5 6 7 8 9 10
normal)
6. Gaya pengucapan (kaku---wajar) 0 1 2 3 4 5 6 7 8 9 10
Jumlah skor:…..
e) Diskusi
Diskusi adalah kemampuan berbicara sekaligus beradu argumentasi.Tes
dalam diskusi ini tidak hanya bertumpu pada peserta yang selalu aktif
berpendapat atau menolak tanggapan peserta diskusi lain, namun
penilaian dalam diskusi ditekankan pada isi pembicaraan. Jadi kualitas
materi yang dibicarakan dan bukan kuantitas berbicara dalam diskusi.
f) Memahami Parafrase
Tes ini dilakukan dengan cara memberikan wacana singkat kepada siswa,
baik secara lisan atau tertulis, kemudian siswa diminta untuk menentukan
1 (satu) jawaban benar.
Misalnya sebagai berikut.
Dari rekaman audio terdengar.
” Jean c’est Marc. Je vais aller au cinema ce soir avec Sophie. On part à
19h30. Si tu veux venir avec nous, appelle-moi au 06 57 22 15 37. A +”
g) Menjawab Pertanyaan
Bagi yang pernah mengikuti tes TOEFL, pasti sudah pernah mengenal
tipe tes ini. Tes ini berupa kemampuan menyimak (comprehension orale).
Jadi siswa diperdengarkan dengan audio, kemudian diminta memberikan
jawaban yang tepat.
Misalnya sebagai berikut.
Rangsangan audio yang diperdengarkan
A: Bonjour mademoiselle, qu’est-ce que vous desirez?
B: Quel est le plat du jour, S’il vous plait?
A: Du coco vin
B: Parfait, alors un plat du jour.
39 Tri Kusnawati
kusnawati@uny.ac.id
Soal dapat disajikan sebagai berikut.
Où sont-ils?
a. Dans un bar b. Dans un restaurant
c. Dans un hotel d. Dans un magasin
h) Teknik Cloze
Cloze atau close ini dimksudkan sebagai proses “menutup” sesuatu yang
belum lengkap. Tes ini muncul dari teori psikologi Gestal. Teknik
penyusunan tes ini adalah denganmemberikan wacana, namun dalam
wacana tersebut ada bagian-bagian yang sengaja dikosongkan. Wacana
bisa diberikan secara lisan atau tertulis, pada umumnya diberikan secara
tertulis. Penggosongan itupun bisa dilakukan dengan menghilangkan kata
ke-3, atau ke-5, atau ke-7. Singkatnya menghilangkan kata ke-n.
Pemilihan wacana harus mendapatkan perhatian yang cermat, jangan
sampai tes ini hanya berakhir pada hapalan, atau terjadi pengulangan
jawaban berkali-kali.
Contoh Cloze test dapat dilihat di bawah ini. Penyusunan tes dilakukan
dengan cara menghilangkan kata ke-5.
This is a program to help you increase your reading speed as well as your
reading comprehension. The reading passages are (1) in order
according to (2) length. Each short program (3) 15
passages and the 100 (4) , for example, includes the
(5) from 100 to 149 (6) . You time yourself and
(7) to read as fast (8) possible, while understanding
the (9) . You take a quiz (10) you finish reading. Keep
(11) of your results, and (12) your progress. You will
(13) a gradual improvement in (14) reading. Enjoy
reading in English.
4. Tes Komunikatif
Pendekatan komunikatif muncul dalam kurikulum 1994.
Konsekuensi dari pendekatan komunikatif tersebut adalah munculnya
penilaian yang harus komunikatif pula dalam pengajaran bahasa.
Maksudnya penilaian terhadap kemampuan berbahasa siswa tidak
dilakukan secara diskrit (terpisah-pisah) namun meliputi 4 (empat)
keterampilan berbahasa, yaitu menyimak, berbicara, membaca dan
menulis.Kemampuan menyimak dan membaca termasuk ke dalam
pemahaman yang bersifat reseptif. Kemampuan berbicara dan menulis
merupakan kemampuan produksi atau bersifat produktif.
40 Tri Kusnawati
kusnawati@uny.ac.id
Tes prgamatik sebenarnya telah bersifat komunikatif (Oller &
Valette), namun dalam perkembangannnya masih perlu mendapatakan
penekanan pada adanya konteks. Jadi tes komunikatif selain harus
memuat kompetensi gramatikal, sosiolinguistik juga harus kontekstual.
Dengan demikian tes komunikatif akan berupa tes kebahasaan,
pemahaman, dan penggunaan bahasa. Keempat aspek kebahasaan yang
diteskan harus kontekstual, artinya sesuai dengan penggunaan bahasa
yang sesungguhnya. Bagaimana contoh-contoh tes komunikatif?
Perhatikan beberapa contoh di bawah ini.
a) Mencermati siaran langsung kuliah umum Presiden AS Obama di UI
melalui pesawat televisi. Selanjutnya siswa membuat resume tentang
pidato Obama tersebut. Resume dapat disampaikan secara lisan,
dengan tampil secara individu di depan kelas atau dengan cara tertulis.
b) Mengamati seorang guide yang sedang melayani tamu di Borobudur.
Kemudian siswa tersebut mempraktikkan diri sebagai guide.
Dari 2 (dua) contoh soal tersebut akan terlihat konteks yang berbeda
antara pidato dan guide. Ragam bahasa yang dipakai juga akan
memperlihatkan perbedaan. Silakan diamati dan dipraktikkan.
D. TES KESASTRAAN
41 Tri Kusnawati
kusnawati@uny.ac.id
C1 = tingkat ingatan
Quel est l'auteur de Madame Bovary ?
C2 = tingkat pemahaman
Quel est le theme principal de l’existensialism?
C3 = tingkat penerapan
Paraphrasez la poesie ci-dessous
Chanson d'automne
Les sanglots longs
Des violons
De l'automne
Blessent mon coeur
D'une langueur
Monotone.
Tout suffocant
Et blême, quand
Sonne l'heure,
Je me souviens
Des jours anciens
Et je pleure;
Et je m'en vais
Au vent mauvais
Qui m'emporte
Deçà, delà
Pareil à la
Feuille morte.
C4 = tingkat analisis
Analysez le roman Miserables par Victor Hugo.
C5 = tingkat sintesis
C6 = tingkat evaluasi.
42 Tri Kusnawati
kusnawati@uny.ac.id
menerapkan teori yang dipelajarinya untuk membedakan karya fiksi dan
nonfiksi.
c) Persepktif
Pengembangan dari pertanyaan pada tingkat konsep, namun diikuti
dengan penilaian/ justifikasi diri sendiri. Misalnya, “Setelah
menyaksikan teater Moliere, berikan pendapat Anda.”
d) Apresiasi
Pada tingkat apresiasi ini unsur linguistic dalam sastra dapat
dikembangkan sebagai tes. Reseptif pembaca sastra juga diperlukan
dalam tes jenis ini.
E. TUGAS
1. Tugas Kelompok
Lakukan wawancara terhadap guru-guru bahasa Prancis SMA/ SMK/
MA, tentang bagaimana mereka memberikan tes/tugas untuk
siswanya. Selanjutnya kategorikan tes/tugas tersebut berdasarkan
jenis-jenis tes yang telah dibahas dalam bab ini.
2. Tugas Individu
Mencari soal UAS bahasa Prancis di SMA/ SMK/ MA. Analisis jenis-
jenis tes yang muncul, kelompokkan ke dalam tingkat Kognisi (C1, C2,
C3, dan seterusnya sampai C6 jika ada).
H. REFERENSI
Nurgiyantoro, Burhan.2001. Penilaian dalam Pengajaran Bahasa dan
Sastra. Yogyakarta: PT. BPFE
Arikunto S. (1993). Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi
Aksara.
http://www.enpc.fr
http://phonetique.free.fr
http://www.edu365.cat
http://th.alliance_francaise.or.th
http://kkitao.e-leraning-server.com
http://www.feelingsurf.net
43 Tri Kusnawati
kusnawati@uny.ac.id
BAB 7
ANALISIS BUTIR SOAL
A. PENDAHULUAN
Secara keseluruhan sebuah tes mungkin tidak terpercaya, akan
tetapi tentunya tidak semua butir soal yang ada perlu direvisi. Sebab,
tentunya terdapat sejumlah butir soal yang telah memenuhi criteria
kelayakan dan karenanya dapat dipertahankan. Untuk memilih butir-butir
soal yang layak, dan sebaliknya perlu direvisi, dapat ditentukan
berdasarkan kerja analisis butir soal. Analisis butir soal akan memberikan
jawab terhadap maksud itu secara dapat dipertanggungjawabkan karena
ia sanggup memberikan informasi secara rinci tentang “keadaan” masing-
masing butir soal, yaitu berdasarkan tingkat kesulitan (item difficulty) dan
daya pembeda (item discrimination). Sebuah butir soal dinyatakan layak
jika indeks tingkat kesulitan dan daya pembedanya memenuhi standar
yang ditentukan.
44 Tri Kusnawati
kusnawati@uny.ac.id
Tabel
Analisis Butir Soal Kelompok Tinggi dan Kelompok Rendah untuk
Persiapan Penghitungan Indeks Tingkat Kesulitan dan Daya Beda
Kelompok Tinggi
Nomor Nomor Butir Soal Jumlah
urut Skor
1 2 3 4 5 6 7 8 ... ... 40
subjek
1 1 1 1 0 1 1 1 1 ... ... 1 36
2 1 1 0 1 1 1 1 1 ... ... 1 34
3 1 1 1 0 0 1 1 1 ... ... 1 30
4 1 0 1 1 0 1 1 0 ... ... 1 30
5 0 1 1 1 1 0 1 1 ... ... 0 28
6 1 1 1 0 1 0 1 0 ... ... 1 28
Jumlah 5 5 5 3 4 4 6 4 ... ... 5
Kelompok Rendah
Nomor Nomor Butir Soal Jumlah
urut Skor
1 2 3 4 5 6 7 8 ... ... 40
subjek
1 1 1 0 1 0 0 1 1 ... ... 1 20
2 0 0 1 1 1 0 1 1 ... ... 0 19
3 0 1 1 0 0 1 0 1 ... ... 1 19
4 1 1 1 0 0 1 1 0 ... ... 0 18
5 0 1 0 0 1 1 1 0 ... ... 0 16
6 0 0 1 1 1 0 1 1 ... ... 1 15
Jumlah 2 4 3 3 3 3 5 4 ... ... 3
45 Tri Kusnawati
kusnawati@uny.ac.id
0,85. Indeks yang di luar itu berarti soal itu terlalu mudah atau terlalu sulit
sehingga ia perlu diganti atau direvisi.
Untuk menghitung indeks tingkat kesulitan digunakan rumus:
IF = FH + FL
N
Keterangan:
IF = (Item Facility) indeks tingkat kesulitan
FH = (Frequency High) jumlah jawaban betul kelompok tinggi
FL = (Frequency Low) jumlah jawaban betul kelompok rendah
N = Jumlah siswa kedua kelompok
46 Tri Kusnawati
kusnawati@uny.ac.id
dengan rumus indeks daya beda (IDB, atau ID) tersebut adalah sebagai
berikut.
ID =
Berdasarkan data-data yang ada pada Tabel 4.8 di atas kita dapat
menghitung indeks daya pembeda tiap butir soal, misalnya dicontohkan di
bawah ini.
- Butir nomor 1 = = 0,50
Butir soal yang baik indeks daya pembeda paling tidak harus
mencapai 0,25 atau bahkan 0,35 (Oller, 1979: 252). Butir soal yang indeks
daya pembedanya kurang dari 0,25 dianggap tidak layak, dan karenanya
perlu revisi atau diganti. Indeks yang kurang dari 0,25 berarti butir soal
yang bersangkutan kurang mampu membedakan antara kelompok tinggi
dan rendah. Indeks daya pembeda butir 2, 4, dan 7 di atas kurang 0,25,
sedang butir nomor 1, 3, dan 40 di atas 0,25.
Sebuah butir soal dinyatakan layak indeks tingkat kesulitan
maupun daay pembeda dapat memenuhi standar yang telah ditetapkan.
Indeks tingkat kesulitan mungkin telah memenuhi persyaratan, tetapi jika
indeks daya pembedanya rendah, di bawah 0,25, butir soal yang
bersangkutan tetap dinyatakan kurang layak. Demikian pula sebaliknya.
Hal ini biasanya cukup berat dipenuhi terutama yang berkaitan dengan
tuntutan indeks daya pembeda. Akan tetapi, jika butir-butir soal tes
memenuhi persyaratan tersebut, tingkat kepercayaan tes akan menjadi
lebih tinggi.
Penghitungan indeks tingkat dan indeks daya beda dapat dilakukan
dengan cara lain, yaitu dengan mempergunakan tabel analisis butir soal
(Fan, 1952. Item analysis table). Untuk maksud ini, terlebih dahulu kita
harus menghitung proporsi jawaban betul kelompok tinggi (PH) dan
47 Tri Kusnawati
kusnawati@uny.ac.id
proporsi jawaban betul kelompok rendah (PL). Proporsi diperoleh dengan:
jumlah jawaban betul (FH atau FL) dibagi jumlah subjek (n, 27,5 persen).
Setelah besarnya proporsi masing-masing kelompok ditemukan, langkah
selanjutnya adalah konsultasi tabel.
Berdasarkan angka-angka pada tabel 4.10 di atas, misalnya, kita
dapat menghitung besarnya proporsi yang dimaksud. Butir soal nomor 1:
PH = 5: 6 = 0,83 sedang PL = 2: 6 = 0,33 (n, 2,75 persen = 6); butir soal
nomor 2: PH = 5:6 = 0,83 sedang PL = 4: 6 = 0,67. Demikian seterusnya
dengan nomor-nomor butir soal yang lain.
Walau terjadi perbedaan kecil indeks yang dihasilkan,
penghitungan seperti di atas menghasilkan kesimpulan yang sama
dengan yang yang dilakukan seperti pada tabel 4.10 di atas. Artinya,
indeks-indeks butir soal yang dinyatakan layak atau tidak layak pada tabel
4.10 juga dinyatakan secara sama pada tabel 4.11.
Kerja analisis butir soal, selain dapat dilakukan dengan cara-cara
seperti di atas, juga dapat dilakukan dengan mempergunakan jasa
komputer. Misalnya, kita dapat mempergunakan program SPSS
(Statistical Package for Social Sciences), Lisrel, dan Iteman (Item
Analysis)
E. ANALISIS DISTRAKTOR
Penentuan revisi terhadap suatu butir soal tidak semata-mata
berdasarkan besarnya indeks tingkat kesulitan dan daya beda saja,
melainkan juga bagaimana sebaran distribusi frekuensi jawaban pada
alternatif yang disediakan. Dengan kata lain, kita perlu juga menganalisis
efektivitas butir-butir pengecoh (distractors) untuk tiap butir soal.
Dasar pemikiran analisis efektivitas distraktor tersebut tidak
berbeda halnya dengan daya beda suatu butir soal: harus ada perbedaan
frekuensi jawaban antara siswa kelompok tinggi dan kelompok rendah.
Untuk setiap alternatif jawaban yang betul, kelompok tinggi harus memilih
secara lebih banyak karena besarnya selisih jawaban betul inilah yang
akan menentukan besar kecilnya indeks daya beda. Sebaliknya, alternatif-
alternatif jawaban yang merupakan distraktor, kelompok rendah harus
memilih secara lebih banyak. Di samping itu, semua alternatif jawaban
yang disediakan harus ada siswa yang memilihnya. Namun, jika hanya
ada satu orang yang memilih distraktor, ia harus dari kelompok rendah.
Jika yang memilih distraktor itu dari kelompok tinggi dan rendah
dengan jumlah (misalnya sama-sama dua orang), distraktor tersebut
kiranya masih dapat dipandang layak. Jika terjadi penyimpangan,
terhadap hal-hal tersebut, suatu butir soal disarankan untuk direvisi.
Kegiatan butir soal tidak harus mencakup butir soal dengan seluruh
alternatif jawabannya, melainkan cukup pada distraktor yang mengalami
penyimpangan saja.
Untuk mengetahui efektivitas tiap alternatif jawaban, atau
sebaliknya, ada penyimpangan, perlu dilakukan kegiatan analisis
48 Tri Kusnawati
kusnawati@uny.ac.id
distraktor, karena dari kegiatan itulah akan diketahui sebaran (distribusi)
frekuensi jawaban. Langkah pertama yang dilakukan, yaitu setelah kita
memisahkan lembar-lembar jawaban untuk siswa kelompok tinggi dan
kelompok rendah, adalah meneliti pilihan terhadap alternatif-alternatif
jawaban semua butir soal untuk seluruh siswa.
Setelah kita mendapatkan data-data sebaran sebaran distribusi frekuensi
jawaban siswa baik dari kelompok tinggi maupun kelompok rendah seperti
di atas, kita langsung dapat melakukan analisis distraktor tiap butir soal
untuk mengetahui keefektivitasannya. Akan tetapi, kita juga dapat
mengalihkan ke dalam tabel lain yang sekaligus untuk menganalisis butir
soal untuk mencari indeks tingkat kesulitan dan daya beda. Berikut
dicontohkan model yang kedua, dengan pertimbangan bahwa model
tersebut dapat menghemat tempat. Di samping itu, dengan
mempergunakan model itu sekaligus dapat diketahui ketiga hal yang
dianalisis (indeks tingkat kesulitan, indeks daya beda, dan efektivitas
distraktor), sehingga hal-hal yang perlu direvisi dapat dilihat atau
ditentukan secara menyeluruh. Bentuk tabel yang demikian itulah yang
disarankan untuk dilakukan (dan ditampilkan) dalam kegiatan analisis butir
soal.
kesulitan dan indeks daya beda dipergunakan rumus (Noll dkk,1979: 214-
215) berikut
Catatan:
- Butir nomor 1: IF =
= 0,48
ID = = 0,38
- Butir nomor 2: IF =
= 0,38
ID = = 0,42
- Butir nomor 3: IF =
= 0,46
ID = = 0,50
- Butir nomor 4: IF =
= 0,71
ID = = 0,17
50 Tri Kusnawati
kusnawati@uny.ac.id
G. TUGAS
Matrik jawaban siswa terhadap butir soal tertera seperti di bawah ini.
Carilah indeks kesukaran dan Daya Beda butir soal tersebut.
H. REFERENSI
51 Tri Kusnawati
kusnawati@uny.ac.id
BAB 8
UJI COBA INSTRUMEN
A. PENDAHULUAN
Bab ini akan membahas tentang uji coba penghitungan
ketepercayaan alat tes yang jabaran dan rumus-rumusnya terdapat dalam
BAB IV. Selain itu dalam bab ini juga akan membahas tentang analisis
distraktor dan revisi butir soal.
52 Tri Kusnawati
kusnawati@uny.ac.id
c. Ketiga
Mulai hitung koefisien nilai r dengan menggunakan rumus product
moment angka kasar, seperti terlihat di bawah ini.
r₁ .₂ = ( 8 x 91 ) - ( 24 x 29 )
__________________________
√ (8 x 76 - 24²) (8 x 113 - 29²)
= 718 - 686
_________
√ (32 x 63)
= 32
_____
√2.016
= 32
44,9
= 0,713
d. Keempat
Nilai koefisien 0,713 dalam penghitungan di langkah ketiga di atas baru
menghitung koefisien separuh soal. Untuk mengetahui reliabilitas
keseluruhan soal, maka dihitung dengan menggunakan rumus
Spearman Brown sebagai berikut.
2 x 0,713
= ________
1 + 0,713
= 1,426
1,713
= 0,832
e. Kelima
Memberi makna nilai 0,832. Nilai koefisien 0,832 ini termasuk dalam
tingkat keterpercayaan yang tinggi. Biasanya nilai koefisien r adalah
1,0 (pada umumnya di bawah 1,00). Jadi nilai 0,832 itu mendekati
53 Tri Kusnawati
kusnawati@uny.ac.id
angka 1,00. Selain itu menentukan tingkat reliabilitas dapat
menggunakan tabel nilai-nilai korelasi.
2. Rumus KR20
a. Pertama
Sama seperti langkah pertama dalam menganalisis dengan rumus
Spearman Brown. Buat tabulasi jawaban benar (skor 1) dan jawaban
salah (skor 0) (Nurgiyantoro, 2001).
b. Kedua
Dengan menggunakan Excel atau kalkulator, maka akan diketahui
n = 10
S = 1,87
X (rerata) = 6
∑pq = 2,164
c. Ketiga
Data-data pada langkah kedua masukkan ke dalam rumus KR20
n ∑pq
r = _____ ( 1 - ___ )
n-1 S²
10 2,164
54 Tri Kusnawati
kusnawati@uny.ac.id
= ____ ( 1 - _____ )
10-1 1,87²
10 2,164
= _____ ( 1 - ____ )
9 3,5
= 1,11 (1-0,619)
= 1,11 x 0,381
= 0,423
d. Memaknai
Besarnya koefisien korelasi antara 0 samapi dengan 1,0. Jika nilai
koefisien 1,00 maka soal/ instrument tes tersebut dinyatakan sempurna
atau sangat tepercaya. Berdasarkan penghitungan di atas nilai
koefisien 0,423 bahkan lebih kecil dari nilai yang dipersyaratkan bagi
tes buatan guru (minimal tes buatan guru mempunyai koefisien 0,60).
3. Rumus KR21
Dengan data yang sama dengan penghitungan memakai rumus KR20,
maka kita tinggal memasukkan data yang dibutuhkan oleh Rumus
KR21 sebagai berikut ini.
n X(n- X)
r = _________ ( 1 - _________ )
n–1 nS²
10 6 (10-6)
= ______ ( 1 - _________ )
10- 1 10 x 1,87²
10 6 (10-6)
= _____ ( 1 - ___________ )
10- 1 10 x 1,87²
10 6x4
= _____ ( 1 - ________ )
9 10 x 3,5
24
= 1,11 (1 - _______)
34,97
55 Tri Kusnawati
kusnawati@uny.ac.id
= 1,11 (1-0,686)
= 1,11 x 0,314
= 0,348
C. ANALISIS DISTRAKTOR
Dalam mempersiapka alat tes yang sahih dan tepercaya diperlukan
langkah-langkah yang tidak sederhana. Pada bab-bab sebelumnya telah
dibahas tentang analisis butir soal (anabut), tingkat kesulitan dan daya
beda (DB). Revisi terhadap suatu butir soal juga ditentukan oleh efektifitas
distraktor.
Distraktor dari kata distract atau distraire yang artinya mengecoh. Jadi
dalam membuat soal (dalam hal ini pilihan ganda) tim penyusun juga
harus mempersiapkan pengecoh. Bagaimana menyusun soal pilihan
ganda dengan distraktor? Simaklah beberapa kiat berikut ini.
1. Dalam tes pilihan ganda yang disebut dengan distraktor adalah pilihan
jawaban yang bukan jawaban sebenarnya.
2. Distraktor harus mampu mengecoh, jadi harus ada yang memilih
jawaban tersebut, misalnya siswa yang mempunyai kompetensi rendah.
Perlu diingat bahwa di kelas terdapat kelompok atas dan kelompok
bawah.
3. Sebagai akibat dari ketentuan di atas, jika ada distraktor yang tidak
di[ilih, maka distraktor tersebut harus direvisi dengan alternatif jawaban
yang lain.
4. Distraktor memang harus dapat mengecoh atau “menipu” namun bukan
“menjebak” siswa dalam memilih jawaban yang tepat.
Nurgiyantoro (2001) memberikan contoh analisis butir soal sehingga kita
dapat mengetahui soal soal-soal ataupun jawaban yang harus direvisi.
Silakan simak tabel berikut ini.
56 Tri Kusnawati
kusnawati@uny.ac.id
Analisis Butir Soal
Nomor KT KR PH PL P R Keterangan
Butir
Soal dan
Opsi
1. (a) 15 10 0,75 0,50 0,63 0,27 layak
b - 4 dengan
c 2 6 revisi
d 3*) -)
2. a 5 7 0,75 0,35 0,55 0,41 layak
b - 2
c - 4
(d) 15 7
3. a 5 8 0,50 0,35 0,42 0,16*) tak layak
(b) 10 7
c 3*) 2*)
d 2 3
4. a 6 7 0,40 0,40 0,40 0,00*) tak layak
(b) 8 8
c 4*) 3*)
d 2*) 2*)
dst…
Keterangan
KT = Kelompok Tinggi
KR = Keompok Rendah
() = Alternatif jawaban benar
*) = soal atau pilihan tidak layak, sehingga harus direvisi
PH = Proporsi jawaban benar kelompok tinggi
PL = Proporsi jawaban benar kelompok rendah
P = Indeks Tingkat Kesulitan
r = Daya Beda
2. Butir nomor 2 (dua)= soal sangat layak, tidak perlu mengalami revisi.
57 Tri Kusnawati
kusnawati@uny.ac.id
- indeks tingkat kesulitan memenuhi syarat,
- syarat daya beda TIDAK terpenuhi, karena kurang atau tidak
dapat membedakan siswa kelompok tinggi dan siswa kelompok
rendah,
- distraktor pilihan jawaban c harus direvisi karena tidak dapat
membedakan antara kelompok tinggi dan kelompok rendah.
Justru kelompok atas ada yang terkecoh (3 orang), sementara
kelompok rendah yang terkecoh 2 orang.
Kesimpulannya soal HARUS direvisi atau DIGANTI
D. TUGAS.
E. REFERENSI
http://www.scribd.com
58 Tri Kusnawati
kusnawati@uny.ac.id
BAB 9
ANALISIS DATA HASIL TES
1. Distribusi Tunggal
Dalam distribusi tunggal, tiap skor ditulis dan kemudian dihitung
atau ditali (Inggris: tally) sendiri-sendiri. Cara ini lebih
menguntungkan jika jarak sebaran skor yang ada relatif kecil
(maksimal 15). Jarak sebaran skor (range) dihitung dengan cara:
skor tertinggi dikurangi skor terendah ditambah satu. Misalnya: skor
tertinggi 60 dan terendah 25, jarak sebaran = (60-25) + 1 = 36.
Sebagai contoh distribusi tunggal, berikut disajikan skor hasil
bahasa dari 40 orang siswa dengan kemungkinan skor tertinggi 75.
Skor yang dimaksud sebagai berikut:
55 60 57 60 55 53 62 60 55 58
54 62 52 60 54 60 61 61 55 64
58 58 60 63 62 59 59 61 56 54
53 53 55 56 60 57 58 62 63 59
59 Tri Kusnawati
kusnawati@uny.ac.id
dapat melihat perbedaannya. Data yang pertama belum dapat
memberikan gambaran secara jelas, misalnya tentang skor
tertinggi, terendah, jumlah frekuensi masing-masing skor, skor yang
tertinggi frekuensinya atau sebaliknya yang terendah. Padahal, hal-
hal tersebut akan dengan mudah ditemukan jika data-data itu telah
dibuat menjadi distribusi frekuensi seperti di atas. Hal itu akan
menjadi lebih sulit jika jumlah siswa relatif besar, apalagi jika skor-
skornya terdiri dari angka yang tidak bulat.
2. Distribusi Bergolong
Distribusi bergolong dibuat berdasarkan data-data yang telah
dikelompokkan ke dalam kelas-kelas interval tertentu. Tiap kelas
mempunyai angka batas kelas bawah dan batas kelas atas yang
keduanya berjarak interval tertentu. Oleh karena itu, sebelum
membuat distribusi frekuensi bergolong, terlebih dahulu kita perlu
menentukan besarnya kelas dan interval.
Penentuan Besarnya Kelas. Tidak ada ketentuan yang harus
diikuti secara mutlak untuk menentukan jumlah kelas. Sebagai
bahan pertimbangan perlu dikemukakan bahwa jumlah kelas
sebaiknya tidak terlalu kecil, atau sebaliknya terlalu besar. Kelas
yang terlalu kecil akan mengaburkan keterangan-keterangan yang
diperlukan. Sebaliknya, jumlah kelas yang terlampau besar, akan
tidak praktis dan tidak efisien. Sebagai ancar-ancar di sini
dikemukakan bahwa jumlah kelas berkisar antara 7 sampai dengan
15.
Penentuan Besarnya Interval. Meskipun tidak ada keharusan
mutlak yang harus diikuti, sebaiknya interval merupakan bilangan
ganjil agar kita dengan mudah dapat menentukan titik tengah skor-
skor pada tiap kelas. Setelah kita menentukan jumlah kelas,
besarnya interval dapat ditentukan berdasarkan rumus berikut.
=5
60 Tri Kusnawati
kusnawati@uny.ac.id
48 56 44 60 34 35 45 64 53 37
58 63 28 52 69 34 38 44 49 60
23 25 18 54 46 15 22 38 33 57
24 40 44 38 47 44 42 34 30 32
26 36 42 58 65 40 29 58 40 28
Dengan jumlah kelas (11) dan besarnya interval (5) seperti yang
telah ditentukan di atas, kemudian kita susun distribusi bergolong
yang dimaksud.
Perlu ditambahkan bahwa besarnya interval yang umum
digunakan adalah 1, 2, 3, 5, 10, dan 20 (Guilford, 1956, lewat
Nurkancana, 1983: 144), dan Nurkancana sendiri kemudian
menambahkan angka 15.
= 58,1
61 Tri Kusnawati
kusnawati@uny.ac.id
(b) Menghitung Mean dari Data Distribusi Tunggal
Pada hakikatnya, penghitungan mean data yang telah disusun
dalam distribusi tunggal sama dengan cara di atas, yaitu sama-
sama menjumlah seluruh skor kemudian dibagi jumlah subyek.
Rumus yang digunakan adalah:
Sebagai contoh kita ambil data dalam table 10.1 di atas. Dalam
penghitungan table 103 berikut sekaligus akan dihitung X2 dan
ΣX2 sebagai persiapan menghitung simpangan baku.
= mean duga
I = interval
d = derivation
Cara menentukan mean duga. Angka yang diperkirakan
sebagai mean adalah titik tengah pada kelas interval yang
tempatnya di tengah jumlah kelas.
Cara menentukan derivation. d (erivation) menunjukkan
besarnya penyimpangan dari nilai rata-rata (Xd). Oleh karena
itu, kelas interval yang ditempati mean duga, d adalah 0. Kelas
interval di atasnya berturut-turut adalah: +1, +2, +3 dan
seterusnya, sedang kelas di bawahnya berturut-turut -1, -2, -3,
dan seterusnya. Berikut contoh penghitungan konkret yang
diambil dari table di atas.
62 Tri Kusnawati
kusnawati@uny.ac.id
= 42 + 5 (-0,06)
= 42 + 0,3
= 41,7
= 41,98
2. Median
Median (Md) adalah angka sentral atau titik tengah dari
sejumlah skor. Secara teoretis median membagi skor menjadi dua
bagian yang sama, yaitu skor-skor yang berada di atas dan di
bawah median. Itulah sebabnya median disebut juga sebagai rata-
rata posisi. Misalnya kita memiliki 15 skor yang telah diurutkan
dari yang tertinggi: 65, 64, 62, 60, 60, 60, 59, 58, 56, 55, 55, 54,
53, 52, 50, mediannya adalah skor ke-8, yaitu 58.
Median yang dicari berdasarkan cara tersebut dinamakan
median sesungguhnya (true median) karena ditentukan
berdasarkan posisi skor yang telah diurutkan. Dalam penafsiran
63 Tri Kusnawati
kusnawati@uny.ac.id
nilai rata-rata populasi melalui teknik sampel, mean lebih banyak
dipergunakan daripada median.
3. Modus
Modus (mode, simbol: Mo) adalah skor yang memiliki
frekuensi paling tinggi. Mencari modus data skor yang belum
dikelompokkan ke dalam distribusi bergolong tidak sukar. Kita
tinggal menunjuk saja skor tertentu yang berfrekuensi tertinggi,
tanpa melalui penghitungan.
Menghitung modus dari data yang telah dikelompokkan harus
melalui penghitungan. Hasil perhitungan itu merupakan modus
yang diperkirakan, bukan modus yang sebenarnya. Angka yang
diperoleh biasanya tidak sama dengan modus yang
sesungguhnya. Rumus yang digunakan untuk mencari modus
adalah:
4. Simpangan Baku
Simpangan baku (standar deviation, dilambangkan denngan
huruf Yunani: σ) adalah ukuran penyebaran (variabilitas) skor
yang diperoleh para siswa yang didasarkan pada kuadrat
penyimpangan tiap skor dari nilai rata-rata (Tuckman, 1975: 486).
Skor yang diperoleh seorang siswa (disebut skor mentah)
biasanya mempunyai penyimpangan atau perbedaan dengan nilai
rata-rata yang dicapai seluruh siswa. Rumusnya adalah:
x=X–X
64 Tri Kusnawati
kusnawati@uny.ac.id
X = (X bar) nilai rata-rata
65 Tri Kusnawati
kusnawati@uny.ac.id
Data pertama Data kedua Data ketiga
60 60 50 52 40 44
60 60 54 55 45 48
60 60 60 55 56 55 50 54 49,5
60 60 58 60 55 60
= 2,958
66 Tri Kusnawati
kusnawati@uny.ac.id
adalah 21, dengan skor tertinggi 60 dan terendah 40. Hal itu
juga menunjukkan bahwa data kedua lebih bersifat homogeny
daripada data ketiga, atau, data ketiga lebih heterogen
daripada yang kedua.
atau
= 3,246
C. Kurve Normal
Penyebaran skor hasil tes biasanya mempunyai kecenderungan-
kecenderungan tertentu, yaitu sebagian besar skor akan berada di
sekitar mean, di atas atau di bawahnya. Skor yang semakin besar
penyimpangannya dari mean akan semakin kecil frekuensinya, baik
67 Tri Kusnawati
kusnawati@uny.ac.id
penyimpangan ke arah yang lebih rendah. Dengan kata lain, skor
yang berada jauh di atas dan di bawah mean frekuensinya akan jauh
lebih kecil disbanding yang berada di sekitar mean. Penyebaran skor
yang demikian adalah penyebaran yang memenuhi cirri-ciri distribusi
normal – sebuah konsep yang sangat penting untuk menganalisis dan
menaksir skor secara lebih lanjut.
Skor yang berada di titik tengah kurve adalah mean.
Penyimpangan skor dari mean baik ke kanan (atas mean) maupun ke
kiri (bawah mean) bersifat simetris, sama besarnya. Kurve normal
memang disusun berdasarkan distribusi teoretis dengan persamaan
matematis, bukan fakta empiris. Akan tetapi pada umumnya skor yang
diperoleh dari hasil tes cenderung mengikuti distribusi normal, walau
kadar kenromalannya tidak benar-benar simetris seperti dalam kurve
normal.
1. Daerah Kurve Normal
Besarnya penyimpangan skor dari mean dinyatakan dalam
satuan simpangan baku (S). Simpangan ke kanan (di atas mean)
dengan: +1S, +2S, +3S, sedang simpangan ke kiri (di bawah
mean) dengan: -1S, -2S, -3S (tanda plus dan minus selalu
diikutsertakan). Daerah dinyatakan dalam presentase (ada: 100)
atau proporsi (ada: 1).
Sebagai contoh, kita ambil data yang kemudian disusun dalam
table 10.2, dari data tersebut diketahui: N = 50, X = 41,98 dan S =
13,205 (juga diketahui skor tertinggi 69, terendah 15).
Berdasarkan asumsi kurve normal berate siswa yang memiliki
skor dari 28,775 sampai 55,185 (dibulatkan: 29 – 55), yaitu ±
13,205 dari 41,98 adalah 68,26% x 50 = 34,13 (dibulatkan 34)
orang; yang memiliki skor ± 2 x 13,205 dari 41,98: 15,57 sampai
68,39 (16 – 68) adalah 95,44% x 50 = 47,72 (dibulatkan 48)
orang). Dan sisanya yang 2 orang adalah yang mempunyai skor
lebih dari ± 2 x 13,205 dari mean, dan dalam data memang ada
skor itu, yaitu 15 dan 69. Walaupun terdapat perbedaan dengan
keadaan data yang sesungguhnya, hal itu tidak akan menyimpang
jauh.
Perlu ditegaskan bahwa konsep dan asumsi distribusi normal
sangat penting. Penghitungan-penghitungan statistik
mendasarkan diri pada asumsi distribusi normal. Jika kita
bermaksud menguji normalitas data skor yang diperoleh, teknik
statistik juga menyediakan cara itu.
68 Tri Kusnawati
kusnawati@uny.ac.id
2. Kurve Juling
Jika hasil tes ditafsirkan berdasarkan skor yang diperoleh
siswa dalam sebuah kelompok, pada umumnya skor tersebut
cenderung mengikuti asumsi distribusi normal. Pengolahan skor
yang demikian adalah pengolahan skor yang berdasar norma
kelompok (norm reference test). Sebaliknya, jika skor hasil tes
ditafsirkan dengan criteria (patokan, standar) yang telah
ditetapkan sebelumnya – pengolahan skor yang berdasarkan
criteria tertentu (criterion referenced test) – skor hasil tes belum
tentu mengikuti asumsi distribusi normal.
Jika terjadi penyebaran skor tidak berdistribusi secara
normal, maka ada dua kemungkinan penyebaran skor hasil tes
tersebut: skor tes cenderung menyebar ke kiri, atau sebaliknya,
menyebar ke kanan. Jika sebagian besar skor (cenderung)
menyebar ke kiri, berarti sebagian besar siswa memperoleh skor
rendah (dalam kurve normal penyimpangan ke kiri di bawah
mean). Keadaan skor yang menyebar ke kiri, jika digambarkan
dalam bentuk kurve, akan berwujud kurve juling, juling ke kanan
atau juling negatif.
Penyebaran skor yang cenderng menyebar ke kiri
menunjukkan bahwa rata-rata siswa belum menguasai bahan
pelajaran yang diteskan. Butir-butir soal yang diteskan masih
terlampau sulit bagi siswa yang bersangkutan.
Apabila skor cenderung menyebar ke kanan, berarti
sebagian besar siswa memperoleh skor tinggi jika skor hasil tes
mereka ditafsirkan dengan criteria yang telah ditetapkan.
Penyebaran skor yang demikian, jika digambarkan dalam bentuk
kurve, akan berwujud kurve juling, juling kiri atau juling positif.
Gambar kurve juling kiri menunjukkan bahwa sebagian besar
siswa mampu mengerjakan butir-butir soal dengan betul. Butir-
butir soal tersebut dirasakan mudah. Atau, hal itu dapat juga
diartikan bahwa rata-rata siswa menguasai bahan pelajaran yang
diteskan. Keadaan skor yang cenderung menyebar ke kanan atau
ke kiri dapat ditemui jika penafsiran mempergunakan standar
tertentu, tetapi hal itu tidak berlaku jika penafsiran
mempergunakan standar relatif (norma kelompok).
69 Tri Kusnawati
kusnawati@uny.ac.id
D. TUGAS
Seorang guru bahasa memperoleh data skor hasil tes yang diberikan
kepada 44 orang siswanya sebagai berikut.
65 55 58 47 45 54 60 50 52 45 42
46 50 63 54 68 30 34 38 52 66 40
33 37 26 46 36 28 54 45 50 43 44
42 39 35 46 58 65 44 43 50 36 62
E. REFERENSI
70 Tri Kusnawati
kusnawati@uny.ac.id
BAB 10
LAPORAN HASIL BELAJAR SISWA
A. PENDAHULUAN
Nilai akhir pada umumnya diberikan dalam bentuk laporan (raport)
atau tanda tamat belajar. Nilai akhir tersebut bukan semata-mata terdiri
dari nilai sumatif saja, namun juga nilai formatif, tugas-tugas, hasil
pengamatan guru, bahkan kehadiran. Sebelum suatu semester atau term
dimulai seorang guru sebaiknya menjelaskan penentuan nilai akhir (terdiri
dari komponen apa saja, bagaimana bobotnya, dll). Murid berhak
mengetahui cara guru mengevaluasi hasil belajar siswa. Berdasarkan
pada Kurikulum Tingkat Satuan Pedidikan (KTSP), banyak komponen
yang dibutuhkan untuk mengisi laporan kemajuan siswa tersebut. Raport
disebut sebagai Laporan Hasil Belajar Siswa (LHBS).LHBS mempunyai
keunikan karena mencantumkan deskripsi ketercapaian masing-masing
kompetensi dasar (KD) dari setiap mata pelajaran.
B. KOMPONEN LHBS
1. Kriteria Ketuntasan Minimal (KKM)
KKM ditetapkan pada setiap awal tahun pelajaran. Besarnya nilai
KKM ditentukan oleh forum Musyawarah Guru Mata Pelajaran (MGMP).
Nilai KKM ditetapkan mulai rentang 0 sampai dengan 100, dalam bilangan
bulat. Nilai ketuntasan belajar maksimal adalah 100. Pihak sekolah dapat
menetapkan nilai KKM di bawah nilai ketuntasan belajar maksimal.Nilai
KKM harus dicantumkan dalam LHBS.
71 Tri Kusnawati
kusnawati@uny.ac.id
Penulisan KKM Pada LHBS
3. Deskripsi
Terdapat kolom Keterangan Ketercapaian Kompetensi (DESKRIPSI).
Misal” Telah mencapai KKM…..dan…. (hal ini harus mnegacu pada KKM
yang telah ditentukan)
4. Nilai Psikomotor
Nilai ini sifatnya berjenjang dari angka 1 - 4
5. Nilai Praktik
72 Tri Kusnawati
kusnawati@uny.ac.id
6. Nilai Sikap
Nilai Sikap berdasarkan pada rentang nilai sikap sebagai berikut.
Amat Baik = 85 – 100
Baik = 69 - 84
Cukup = 53 – 68
Kurang = 20 – 52
C. LAPORAN
LHBS akan sangat berguna bagi:
1. Siswa yang bersangkutan
LHBS akan membuat siswa memahami kekurangan dan kelebihannya,
sehingga dia dapat menentukan langkah dan strategi belajar dalam
semester berikutnya.
4. Stakeholders
Masyarakat, khususnya para pemakai lulusan sekolah termasuk kelompok
yang turut serta membutuhkan informasi LHBS. Bahkan saat ini untuk
mendaftarkan ke Universitas atau untuk mengikuti seleksi bea siswa,
beberapa universitas dan atau lembaga memasukkan nilai LHBS sebagai
salah satu criteria pertimbangan.
D. TUGAS
Tugas Kelompok. Kelompok terdiri atas 2-3 orang. Kumpulkan contoh
LHBS mulai dari Tingkat Pendidikan Dasar, Menengah, dan Atas. Analisis
LHBS tersebut, kemudian bandingkan dengan contoh Raport (Laporan
hasil Belajar) yang pernah dipakai tahun-tahun sebelumnya. Bagaimana
pendapat Anda?
E. REFERENSI
73 Tri Kusnawati
kusnawati@uny.ac.id
74 Tri Kusnawati
kusnawati@uny.ac.id