Anda di halaman 1dari 36

MAKALAH EVALUASI PEMBELAJARAN FISIKA

VALIDITAS, RELIABILITAS, BIAS, DAN STANDARD ERROR MEASUREMENT

ZAKIRMAN
NIM / TM : 1304186 / 2013 PENDIDIKAN FISIKA

PRODI PENDIDIKAN FISIKA


PASCASARJANA UNIVERSITAS NEGERI PADANG

2014
1

DAFTAR ISI

Halaman DAFTAR ISI .................................................................................................................. KATA PENGANTAR ................................................................................................... BAB I PENDAHULUAN A. Latar Belakang ............................................................................................. B. Rumusan Masalah ........................................................................................ C. Manfaat Penulisan ........................................................................................ D. Tujuan Penulisan .......................................................................................... BAB II KAJIAN TEORITIS A. Tinjauan Pustaka ........................................................................................ 7 4 6 6 6 2 3

BAB III PEMBAHASAN A. B. Implementasi Asesmen dalam Kurikulum 2013 ........................................ 30 Matriks Perbandingan Asesmen pada KTSP dan K.2013 .......................... 45

BAB IV PENUTUP A. B. Kesimpulan ................................................................................................ 47 Saran ........................................................................................................... 47

DAFTAR PUSTAKA .................................................................................................... 48

KATA PENGANTAR

Puji syukur penulis ucapkan kepada Allah Swt, yang telah memberikan rahmat dan karunia-Nya kepada penulis, sehingga penulis dapat menyelesaikan penulisan makalah ini. Selama penulisan makalah ini, penulis banyak mendapatkan bantuan dari berbagai pihak, sehingga makalah ini dapat diselesaikan. Untuk itu, Penulis mengucapkan terima kasih kepada (1) Prof. Dr. Festiyed, M.S, dan Dr. Hj. Djusmaini Djamas, M.Si., selaku dosen Pembina mata kuliah Evaluasi Pembelajaran Fisika dan (2) Rekan-rekan mahasiswa yang telah turut membantu memberikan kritik dan saran guna kesempurnaan makalah ini. Penulis menyadari dalam penulisan dan penyajian makalah ini masih jauh dari kesempurnaan. Oleh karena itu, kritik dan saran dari semua pihak sangat penulis harapkan demi kesempurnaan makalah ini. Atas kritik dan saran yang diberikan, penulis mengucapkan terima kasih. Penulis mengharapkan semoga makalah ini dapat bermanfaat dan menambah wawasan bagi semua pihak.

Padang, Februari 2014

Penulis

BAB I PENDAHULUAN

A. Latar Belakang Masalah Keberhasilan seorang guru dalam mengajar dapat ditinjau dari hasil belajar siswa. Hasil belajar merupakan suatu gambaran bagaimana suatu proses pembelajaran itu berlangsung serta bagaimana keadaan siswa selama mengikuti proses pembelajaran tersebut. Pertimabangan atau umpan balik dapat dilihat dengan adanya pengkajian terhadap hasil belajar. Ada beberapa istilah yang sangat erat kaitannya dan sering dipakai dalam menentukan hasil belajar siswa. Beberapa istilah tersebut diantaranya evaluasi,

penilaian/asesmen, pengukuran dan tes. Evaluasi merupakan gabungan dari kegiatan pengukuran dan proses penilaian. Dalam evaluasi nantinya akan terlihat serta tergambar bagaimana hasil belajar siswa secara keseluruhan, baik sikap, keterampilan ataupun pengetahuan siswa. Istilah lainnya adalah penilaian dan pengukuran dimana urutan kegiatannya adalah melakukan pengukuran terlebih dahulu, setelah itu diikuti dengan penilaian. Untuk menilai diperlukan kegiatan yang disebut pengukuran. Salah satu alat yang digunakan untuk melakukan pengukuran adalah tes. Tes bisa meliputi tes tertulis, tes lisan, dan masih banyak lainnya sesuai dengan tujuan dari pengukuran tersebut. Dengan memberikan tes kepada siswa, guru dapat menjadikan hasil tes tersebut sebagai pertimbangan dalam melakukan penilaian hasil belajar. Tidak dapat dipungkiri lagi bahwa kebanyakan dari guru atau tenaga pendidik menjadikan hasil dari tes sebagai pertimbangan utuh dalam memberikan penilaian. Pada hakekatnya, jika didasarkan pada kurikulum yang digunakan pada saat sekarang khususnya penggunaan kurikulum 2013 dimana tenaga pendidik atau guru dituntut untuk mampu menilai siswa tidak hanya dari segi pengetahuannya saja, tetapi juga

sikap dan keterampilan sehingga nantinya siswa mendapatkan nilai sesuai dengan kemampuan masing-masing yang mereka miliki. Penilaian

keterampilan dan penilaian sikap dapat dilakukan dengan metode obeservasi langsung yang dilakukan oleh guru atau rekan sejawat yang masih selingkungan dengan profesi tenaga kependidikan. Penilaian capaian pengetahuan siswa dapat digunakan alat berupa tes sehingga data yang didapatkan mudah untuk diolah dan menjadi bahan pertimbangan penilaian hasil belajar siswa. Tes yang baik dan bagus digunakan adalah tes yang mampu mengukur kemampuan siswa sebagaimana mestinya sehingga saat dilakukan pengukuran berulang tidak akan terjadi kesalahan dalam menentukan kemampuan siswa. Menurut Arikunto (2008:57), menyatakan bahwa sebuah tes dikatakan baik apabila memenuhi persyaratan tes sebagai berikut: a. Validitas, sebuah tes dikatakan valid apabila sesuai dengan keadaan semestinya atau keadaan sebenarnya. Jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa instrument yang digunakan valid karena dapat memberikan gambaran tentang data secara benar sesuai dengan kenyataan atau keadaan sesungguhnya. Sebuah tes dikatakan valid jika tes itu dapat mengukur apa yang hendaknya harus diukur. b. Reliabilitas, dapat diartikan dapat dipercaya, ajeg, dan tidak berubah dari waktu ke waktu. Jika dihubungkan dengan validitas maka validitas adalah ketepatan dan reliabilitas adalah ketetapan. c. Objektif, sebuah tes dikatakan memiliki objektivitas apabila dalam melakukan tes itu tidak ada faktor subjekti yang mempengaruhi. Suatu tes dapat dikatakan layak untuk digunakan sebagai instrument pengukuran apabila tes tersebut telah dinyatakan valid, reliabil, serta dilakukan secara objektif. Soal-soal tes yang akan dibuat terlebih dahulu didasarkan pada kisi-kisi soal yang telah dirancang. Setelah pembuatan soal

selesai, soal tidak diperkenankan langsung diujikan kepada siswa, tetapi soal tersebut harus diujikan terlebih dahulu sehingga hasil dari pengujian menggunakan soal tersebut bisa terlaksana dengan baik dan mendapatkan hasil yang sebagaimana mestinya. Jika soal yang digunakan tidak valid dan tidak reliabel, maka hal ini akan berdampak terhadap siswa. Soal yang tidak valid dan tidak reliabel bisa saja merugikan siswa sehingga siswa tidak mendapatkan penilaian sebagaimana mestinya. Oleh karena itu, penting untuk seorang guru memahami tentang reliabilitas, validitas, bias, serta standard error measurement sebelum melaksanakan kegiatan pengukuran terhadap hasil belajar siswa.

B. Batasan Masalah Berdasarkan latar belakang masalah, maka makalah ini hanya membahas tentang: 1. Validitas, 2. Reliabilitas, 3. Bias, 4. Standard Error Measurement.

C. Tujuan Tujuan dari penulisan makalah ini adalah untuk: 1. Menjelaskan mengenai validitas, reliabilitas, bias dan standard error measurement. 2. Memberikan gambaran serta contoh implementasi dari validitas, reliabilitas, bias dan standard error measurement.

D. Manfaat Penulisan Hasil dari penulisan ini diharapkan bermanfaat untuk : 1.Guru/Tenaga pendidik sebagai tambahan wawasan mengenai penilaian, evaluasi, pengukuran, dan tes. 2.Sumber ide dan referensi bagi penulis lain. 3.Penulis, sebagai modal dasar untuk mengembangkan diri dalam bidang penulisan, menambah pengetahuan dan pengalaman.

BAB II TINJAUAN PUSTAKA

Sebelum menentukan tingkat validitas dan reliabilitas soal, terlebih dahulu guru atau tenaga pendidik melakukan analisis terhadap soal yang digunakan sebagai instrument pengukuran. Analisis soal dilakukan untuk mengetahui berfungsi atau tidaknya sebuah soal. Dalam menganalisis soal, nantinya akan terlihat gambaran bagaimana soal tersebut dapat menunjukkan kekonsistensian hasil pengukuran, mampu membedakan tingkat pengetahuan siswa serta soal yang dibuat praktis dan mudah dipahami oleh siswa. Analisis umumnya dilakukan dengan dua cara, yaitu analisis kualitatif (qualitatatif control) dan analisis kuantitatif (quantitative control). Analisis kualitatif dilakukan sebelum soal yang akan digunakan sebagai instrument pengukuran diujikan kepada siswa. Sebelum digunakan soal akan diuji tingkat validitas berupa daya beda dan kevalidan soal dalam mengukur tingkat pengetahuan siswa. Sedangkan analisis kuantitatif adalah analisis yang sering dikenal dengan analisis empiris (empirical validity) yang dilakukan untuk melihat lebih berfungsi atau tidaknya sebuah soal, setelah soal tersebut diujicobakan kepada sampel yang repesentatif. A. Validitas 1. Pengertian Suatu hasil pengukuran dikatakan baik apabila hasil pengukuran tersebut sesuai dengan keadaan yang dievaluasi. Data evaluasi yang baik sesuai dengan kenyataan disebut dengan data valid. Agar dapat diperoleh hasil data yang valid, alat ukur atau instrument yang digunakan untuk mengevaluasi juga harus dalamm kategori valid. Ada dua jenis validitas, yaitu validitas pertama menyangkut soal secara keseluruhan dan yang kedua adalah validitas yang menyangkut butir soal atau item dan validitas faktor yang menyangkut bagian materi.

Validitas berhubungan dengan kesahihan dari suatu produk yang dikembangkan dan sesuai dengan kriteria pembelajaran yang terdapat pada suatu sekolah. Hal ini sesuai dengan Kamus Besar Bahasa Indonesia (KBBI) (1996: 1116), valid adalah sahih, berlaku, dan menurut cara yang semestinya. Validitas adalah suatu konsep yang berkaitan dengan sejauhmana tes telah mengukur apa yang seharusnya diukur. Validitas tes perlu dilakukan untuk mengetahui kualitas tes dalam kaitannya dengan mengukur hal yang seharusnya diukur. Beberapa pengertian validitas menurut para ahli: Nunnaly (1972), menyatakan bahwa validitas senantiasa dikaitkan dengan penelitian empiris dan pembuktiannya bergantung kepada macam validitas yang digunakan. Anastasi (1988), validitas adalah suatu tingkatan yang menyatakan bahwa suatu alat ukur telah sesuai dengan apa yang diukur. Gronlund (1985), mengatakan bahwa validitas berkaitan dengan hasil suatu alat ukur, menunjukkan tingkatan, dan bersifat khusus sesuai dengan tujuan pengukuran yang akan dilakukan. Para pengembang tes memiliki tanggung jawab untuk menyusun dan membuat tes yang benar-benar reliable dan valid. Oleh karenanya validitas dapat digunakan untuk memeriksa secara langsung sejauh mana alat pengukuran yang digunakan telah berfungsi dengan baik. 2. Jenis-jenis Validitas Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil pengalaman. Hal pertama yang akan diperoleh adalah validitas logis atau logical validity dan yang kedua adalah validitas empiris atau empirical validity. Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris. a. Validitas Logis Kemunculan istilah logis dalam validitas berasal dari kata logis yang berarti penalaran. Validitas logis untuk sebuah instrument evaluasi menunjuk pada kondisi bagi sebuah instrument yang memnuhi

persyaratan valid berdasarkan hasil penalaran. Kondisi valid dipandang terpenuhi karena instrument yang digunakan telah dirancang secara baik mengikuti teori dan ketentuan yang telah ada. Validitas logis dapat dicapai apabila instrument disusun mengikuti ketentuan yang ada. Validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah instrument tersebut disusun. Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrument, yaitu: validitas isi dan validitas konstrak. Validitas isi bagi sebuah instrument menunjuk suatu kondisi sebuah instrument dimana yang dikaji dari instrument tersebut adalah isi materi yang akan dievaluasi. Sedangkan validitas konstrak sebuah instrument menunjuk suatu kondisi sebuah instrument yang disusun berdasarkan konstrak aspek-aspek kejiwaan yang harus dievaluasi. b. Validitas Empiris Validitas emipris mengacu pada dasar kata empiris yang berarti pengalaman. Sebuah instrument dapat dikatakan memiliki validitas empiris apabila sudah diuji berdasarkan pengalaman. Validitas empiris tidak dapat diperoleh hanya dengan menyusun instrument berdasarkan ketentuan seperti pada validitas logis, tetapi harus dibuktikan melalui pengalaman. Ada dua cara untuk dapat dilakukan untuk menguji bahwa sebuah instrument Pengujian tersebut layak dikatakan valid secara empiris.

dilakukan dengan membandingkan kondisi

instrument yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang digunakan sebagai pembanding kondisi instrument dimaksud ada dua cara, yaitu: yang sudah tersedia dan belum ada tetapi terjadi diwaktu yang akan datang. Bagi instrument yang kondisinya sesuai dengan kriterium yamg sudah tersedia atau yang telah ada disebut memiliki concurrent validity. Sedangkan instrument yang kondisinya sesuai dengan kriterium yang diramalkan akan terjadi disebut sebagai predictive validity.

10

Berdasarkan uraian dua macam validitas yang telah dijelaskan, maka validitas dapat dikelompokkan lagi berdasarkan logis dan empiris-nya menjadi empat jenis, yaitu validitas isi, konstruksi, ada sekarang(konkuren), dan validitas prediksi(prediktif). a. Validitas Isi Validitas isi sering disebut dengan validitas kurikulum, mengandung arti bahwa suatu alat ukur dipandang valid apabila sesuai dengan isi kurikulum yang hendak diukur. Salah satu cara yang digunakan untuk menentukan validitas isi adalah dengan mengkaji isi tes tersebut. Validitas isi ditentukan dengan melihat apakah soal-soal yang digunakan telah menunjukkan sampel atribut yang telah diukur. Menurut Guion dalam Surapranata (2005:51), validitas isi sangat bergantung kepada dua hal yaitu tes itu sendiri dan proses yang mempengaruhi dalam merespon tes. Salah satu cara yang digunakan untuk memperoleh validitas isi adalah dengan melihat soal-soal yang membentuk tes itu. Jika keseluruhan soal nampak mengukur apa yang seharusnya tes itu gunakan, dapat dikatakan bahwa validitas isi telah terpenuhi. Sebuah tes dikatakan memiliki yang baik apabila mengukur sesuai dengan domain dan tujuan khusus tertentu yang sama dengan isi pelajaran yang telah diberikan dikelas. Contohnya soal Fisika dikatakan valid apabila hanya mengukur kemampuan Fisika, bukannya kemampuan bahasa. Sebagian ahli tes berpendapat bahwa tidak ada satupun pendekatan statistic yang dapat digunakan untuk menentukan validitas isi suatu tes. Menurut Guion, validitas isi hanya dapat ditentukan dengan beradasrkan judgment para ahli. Prosedur yang dapat digunakan antara lain: Mendefenisikan domain yang hendak diukur Menentukan domain yang akan diukur oleh masing-masing soal

11

Membandingkan masing-masing soal dengan domain yang sudah ditetapkan

Ada beberapa kesulitan dalam mempraktekkan prosedur diatas, diantaranya sulit dalam mendefenisikan domain yang hendak diukur (membuat kisi-kisi). Sebagai contoh misalnya dalam menentukan soal fisika yang berkaitan dengan problem solving atau reasoning beberapa ahli mungkin masih berdebat apakah suatu soal telah benar-benar masuk ke dalam kategori problem solving atau reasoning. Hal yang terpenting adalah, adanya kesepakatan antara beberapa penulis tentang kemampuan yang diukur oleh suatu soal. Validitas isi dapat diusahakan tercapai dengan cara merinci materi kurikulum atau materi yang ada pada buku saat proses perancangan. Tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. b. Validitas Konstruksi Konstruk adalah sesuatu yang berkaitan dengan fenomena dan objek yang abstrak, tetapi gejalanya dapat diamati dan diukur. Validitas konstruk mengandung arti bahwa suatu alat ukur dikatakan valid apabila telah cocok dengan konstruksi teoritik dimana tes itu dibuat. Dengan kata lain, sebuah tes dikatakan memiliki validitas konstruksi apabila soal-soalnya mengukur setiap aspek berpikir seperti yang diuraikan dalam standar kompetensi, kompetensi dasar, maupun indicator yang terdapat dalam kurikulum. Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam tujuan instruktusional khusus. c. Validitas Prediksi Predictive validity menunjukkan kepada hubungan antara tes skor yang diperoleh peserta dengan keadaan yang akan terjadi diwaktu yang akan datang. Sebuah tes dikatakan memiliki validitas prediksi apabila

12

mempunyai kemampuan untuk memprediksikan apa yang akan terjadi dimasa yang akan datang. Misalnya tes masuk perguruan tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggirendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin nilainya kelak. Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika peserta yang memiliki nilai tinggi ternyata gagal dalam ujian semester 1 (nilainya rendah), maka dapat disimpulkan bahwa tes masuk PT yang digunakan tidak memiliki validitas prediksi. d. Validitas Konkuren Validitas konkuren menunjuk pada hubungan antara tes skor dengan yang dicapai pada keadaan sekarang. Sebuah tes dikatakan memiliki validitas konkuren apabila hasilnya sesuai dengan pengalaman. Dalam membandingkan hasil sebuah tes maka diperlukan suatu alat banding. Contohnya seperti berikut: seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk itu diperlukan sebuah alat banding masa lalu yang sekarang datanya masih dimiliki. Seperti guru dapat menggunakan nilai ulangan harian/nilai ulangan sumatif yang lalu. 3. Mengukur Validitas Salah satu cara yang dapat digunakan untuk menentukan validitas alat ukur adalah dengan menggunakan korelasi product moment. Rumus korelasi product moment oleh Person ada dua macam, yaitu dengan simpangan dan dengan angka kasar. Rumus korelasi dengan simpangan sebagai berikut: ( Keterangan: )( )

13

= koefisien korelasi antara variabel x dan variabel y, dua variabel lain yang dikorelasikan = jumlah perkalian antara x dan y = kuadrat dari x = kuadrat dari y Rumus korelasi produk moment dengan angka kasar sebagai berikut: ( * Dimana : = koefisien korelasi antara variabel X dan Y, dua variabel yang dikorelasikan Dua jenis korelasi product moment menurut Pearson ini dapat digunakan sesuai dengan data yang telah tersedia atau terukur. Kebanyakan dari pengolah data menggunakan rumus korelasi product moment menggunakan simpangan karena dianggap lebih praktis dan mudah untuk digunakan. Suatu tes dianggap baik adalah yang dikatakan memiliki standar atau kriterium. Tes terstandar adalah tes yang telah dicobakan berkali-kali sehingga dapat menjamin kebaikannya. Cara menentukan validitas soal yang menggunakan tes terstandar sebagai kriterium dilakukan dengan mengalikan koefisien validitas yang diperoleh dengan koefisien validitas tes terstandar tersebut. Tabel 1. Interpretasi koefisien korelasi Angka Korelasi 0,80 < x 1,00 0,60 < x 0,80 0,40 < x 0,60 0,20 < x 0,40 0,00 x 0,20 Makna Sangat Tinggi Tinggi Cukup Rendah Sangat Rendah ( ) +* )( ) ( ) +

Dimodifikasi Surapranata (2005: 59).

14

4. Validitas Soal Tujuan validitas soal adalah untuk menentukan dapat tidaknya suatu soal tersebut membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada dalam kelompok itu. Validitas soal adalah indeks diskriminasi dalam membedakan antara peserta tes yang memiliki kemampuan tinggi dengan peserta yang memiliki kemampuan rendah. Pada prinsipnya, validitas soal sama dengan daya pembeda soal yaitu daya dalam membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang memiliki kemampuan rendah. Angka yang menunjukkan besarnya validitas soal disebut indeks validitas soal yang besarnya berkisar antara -1 sampai dengan +1. Tanda min menunjukkan bahwa peserta tes yang kemampuannya rendah menjawab soal dengan benar sedangkan peserta yang berkemampuan tinggi menjawab salah. Dapat disimpulkan bahwa soal yang memiliki validitas negative menunjukkan terbaliknya kualitas peserta tes. Untuk menentukan validitas butir soal dan menentukan validitas soal pengecoh, dapat digunakan persamaan korelasi produk momen oleh person dengan menggunakan angka kasar.

B. Reliabilitas 1. Pengertian Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat menghasilkan atau memberikan tes yang tetap. Pengertian reliabilitas berhubungan dengan masalah ketetapan hasil. Instrumen yang baik dan dianggap reliable adalah instrument yang dapat dengan ajeg memberikan data sesuai dengan kenyataan. Scarvia dalam Arikunto (2008:87) menyatakan bahwa persyaratan bagi tes yaitu adanya validitas dan reliabilitas. Secara garis besar ada beberapa hal yang sedikit banyak mempengaruhi hasil tes, diantaranya:

15

a. Hal-hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-butir soalnya. Tes yang terdiri dari banyak butir lebih valid dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal saja. Tinggi rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes. Semakin panjang tes maka semakin tinggi pula reliabilitasnya. Dalam menghitung besarnya reliabilitas berhubungan dengan penambahan banyaknya butir soal dalam tes dapat digunakan persamaan Spearman dan Brown seperti berikut: ( Dimana: = besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru = berapa kali butir soal ditambahkan = besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambahkan )

b. Hal-hal yang berhubungan dengan tercoba (testee) Suatu banyak tes yang dicobakan kepada kelompok yang terdiri dari siswa akan mencerminkan keragaman hasil yang

menggambarkan besar-kecilnya reliabilitas tes. Tes yang dicobakan kepada bukan kelompok terpilih, akan menunjukkan reliabilitas yang lebih besar dari pada yang diujicobakan pada kelompok tertentu yang diambil secara dipilih. c. Hal-hal yang berhubungan dengan penyelenggaraan tes, hali ini ditentukan oleh faktor administratif. 2. Cara-cara Menentukan Besarnya Reliabilitas Reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk mengetahui ketetapan tes ini pada dasarnya dilihat dari kesejajaran hasil.

16

a. Metode Bentuk Paralel Tes parallel adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan tetapi memiliki butir-butir soal yang berbeda. Dalam menggunakan metode tes parallel ini pengetes harus menyiapkan dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang sama. Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes, serta dibutuhkan waktu ekstra untuk mengujikan dua tipe soal.
b. Metode Tes Ulang

Metode ini dilakukan untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi diujicobakan dua kali. Kemudian hasil dari kedua tes tersebut dihitung korelasinya. Untuk tes yang banyak mengungkap pengetahuan atau hafalan, cara ini kurang tepat karena peserta tes akan gampang mengingat butir soalnya. Oleh karenanya diperlukan selang waktu yang cukup lama untuk mengujikan soal kembali. Pada umunya hasil tes yang kedua cendrung lebih baik dari hasil tes yang pertama. Ini tidak menjadi persoalan, yang terpenting adalah adanya kesejajaran hasil atau ketepatan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi. c. Metode Belah Dua Dengan menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Metode ini sering disebut dengan metode single-test-trial method. Untuk mengetahui reliabilitas seluruh tes harus digunakan persamaan SpearmanBrown sebagai berikut: ( )

17

Dimana: = korelasi antara skor-skor setiap belahan tes = koefisien reliabilitas yang sudah disesuaikan Ada dua cara dalam membelah butir soal ini: 1. Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut belahan ganjil genap 2. Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada nomor-nomor awal dan separo pada nomor-nomor akhir dan sering disebut belahan awal akhir Penggunaan rumus Flanagan Rumus: ( Dimana: = reliabilitas tes = varians belahan pertama (1) atau varians skor item ganjil = varians belahan kedua atau varians item genap = varians total

Penggunaan rumus Rulon Rumus:

Dimana: = varians beda = perbedaan antara skor belahan pertama dengan skor belahan kedua Penggunaan rumus K-R 20 Rumus:

18

( Dimana:

= reliabilitas tes secara keseluruhan = proporsi subjek yang menjawab item dengan benar = proporsi item yang menjawab salah = jumlah hasil perkalian antara p dan q = banyaknya item = Standar deviasi dari hasil tes Penggunaan rumus Hoyt Rumus:

Dimana: = Reliabilitas seluruh soal = Varians responden = Varians sisa

C. Bias (Differential Item Function/DIF) Soal yang bias atau differential item functioning (DIF) adalah soal yang membedakan kelompok. DIF muncul ketika dua kelompok seperti kelompok jenis kelamin, suku atau kelompok usia memiliki peluang yang berbeda dalam menjawab soal. DIF bisa juga muncul dikarenakan perbedaan pengetahuan, kemampuan atau keterampilan. Bila hal ini terjadi maka soal dikatakan telah bias terhadap kelompok tertentu. DIF terkadang dapat merusak hasil penilaian dan dikatakan sangat tidak adil karena membedakan kelompok berdasarkan hasil atau nilai yang diperoleh peserta tes.

19

D. Standar Kesalahan Pengukuran (Standard Error of Measurement) Indeks reliabilitas menyatakan atau menyajikan informasi yang sangat berguna untuk mengevaluasi tes. Untuk mengetahui adanya pengaruh skor sebenarnya dan skor kesalahan, indeks reliabilitas dapat digunakan dengan mengestimasi seberapa besar skor berfluktuasi sebagai adanya kesalahan pengukuran. Terkadang indeks reliabilitas tidak menyajikan secara tepat hasil pengukuran. Indeks reliabilitas harus juga memperhitungkan besarnya variabilitas yang terjadi. Untuk mengetahui secara nyata skor, harus diperhitungkan standar kesalahan pengukuran. Standar kesalahan pengukuran merupakan fungsi reliabilitas tes dan variabilitas skor dengan persamaan: Standar kesalahan pengukuran menyajikan ukuran variabilitas dalam skor sebagai dasar dari adanya kesalahan pengukuran. Standar kesalahan pengukuran dapat digunakan untuk menentukan interval, seberapa besar skor yang diperoleh sudah akurat.

20

BAB III PEMBAHASAN

A. Implementasi dalam Menentukan Validitas Dalam memilih soal yang digunakan sebagai instrument pengukuran, perlu diperhatikan beberapa hal, diantaranya: tingkat kesukaran soal, daya pembeda dan distribusi jawaban untuk setiap soal. Hasil analisis soal pada umunya dibedakan menjadi tiga, yaitu: diterima tanpa perbaikan, diterima dengan perbaikan dan ditolak atau dibuang untuk tidak digunakan. Dalam pemilihan soal berdasarkan teori klasik ini biasanya diperhitungkan tiga parameter soal yaitu tingkat kesukaran (p), daya pembeda, dan distribusi jawaban. Berdasarkan aturan Nitko dalam Surapranata (2005:47), menyatakan bahwa kumpulan criteria dalam pemilihan soal pilihan ganda sebagai berikut: Kriteria Koefisien 0.30 s.d 0.70 0.10 s.d 0.29 atau 0.70 s.d 0.90 < 0.10 atau > 0.90 Besar dari 0.3 Daya Pembeda 0.10 s.d 0.29 < 0.10 Proporsi Jawaban 0.05 Ditolak Diterima Direvisi Ditolak Keputusan Diterima Direvisi

Tingkat Kesukaran

21

Tabel 2. Analisis Item untuk Perhitungan Validitas Item No 1 2 3 4 5 6 7 8 9 10 Annisa Delly Yolanda Ezhi Anggreyni Fitri Andayeni Hossy Sri Ramadani Indah Sintia May Jelita Mira Kartika Sari Nurhayati Biabdihil H. Rani Ariska Nama Siswa Butir Soal/Item 1 1 1 0 1 1 1 0 1 1 0 2 1 1 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 1 1 1 1 4 0 0 0 1 0 1 0 1 0 0 5 0 1 0 1 1 1 1 1 1 0 6 1 1 0 0 0 1 0 1 1 1 7 1 1 0 1 1 1 0 1 0 0 8 1 1 1 1 1 1 1 1 1 1 9 0 1 0 1 0 0 0 0 0 1 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 1 0 1 1 1 0 1 0 0 1 0 0 1 1 1 0 1 0 0 1 0 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 0 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 0 0 1 1 0 0 0 1 1 0 0 1 1 0 1 1 1 1 1 0 1 0 1 0 1 1 1 1 0 0 1 1 0 1 1 0 0 1 0 0 1 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 1 1 0 0 1 1 0 1 0 1 0 0 1 1 1 1 1 1 1 0 0 1 0 0 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 0 1 1 1 1 1 1 1 19 17 8 20 19 21 15 20 14 15 Skor Total

22

11 12

Resi Arisandi Resti Nilfia Putri

1 1

1 1

1 1

0 0

1 1

1 1

0 0

1 1

1 1

0 0

1 0

1 1

1 0

0 0

0 0

1 1

1 1

1 0

1 1

1 1

1 0

0 1

1 1

1 1

1 1

18 16

23

Pengolahan Data untuk Menentukan Validitas: A. Validitas Soal dengan Produk Moment Sebagai contoh dipilih soal Nomor 14 dengan kunci jawaban E. Nama Siswa Annisa Delly Yolanda Ezhi Anggreyni Fitri Andayeni Hossy Sri Ramadani Indah Sintia May Jelita Mira Kartika Sari Nurhayati Biabdihil H. Xa 0 1 0 0 0 0 0 1 0 Xb 0 0 0 0 0 0 0 0 0 Xc 0 0 0 0 0 0 0 0 0 Xd 0 0 0 1 0 0 0 0 0 Xe 1 0 1 0 1 1 1 0 1 Y 19 17 8 20 19 21 15 20 14 Y 361 289 64 400 361 441 225 400 196 XaY 0 17 0 0 0 0 0 20 0 XbY 0 0 0 0 0 0 0 0 0 XcY 0 0 0 0 0 0 0 0 0 XdY 0 0 0 20 0 0 0 0 0 XeY 19 0 8 0 19 21 15 0 14 Xa 0 1 0 0 0 0 0 1 0 Xb 0 0 0 0 0 0 0 0 0 Xc 0 0 0 0 0 0 0 0 0 Xd 0 0 0 1 0 0 0 0 0 Xe 1 0 1 0 1 1 1 0 1

24

Rani Ariska Resi Arisandi Resti Nilfia Putri Jumlah

0 1 1 4

0 0 0 0

0 0 0 0

0 0 0 1

1 0 0 7

15 18 16 202

225 324 256 3542

0 18 16 71

0 0 0 0

0 0 0 0

0 0 0 20

15 0 0 111

0 1 1 4

0 0 0 0

0 0 0 0

0 0 0 1

1 0 0 7

Dengan memasukkan angka ke persamaan product moment dengan angka kasar, maka: ( )( * ( ) +* ) ( ) +

Sehingga didapatkan nilai

yaitu: 0.42. Mengacu pada tabel yang telah dimodifikasi dari surapranata, dapat

disimpulkan bahwasanya validitas untuk soal tes nomor 14 berada dalam kategori cukup. Untuk lebih memperbaiki kulitas tes, kedepannya dilakukan beberapa perbaikan sehingga didapatkan soal tes yang baik dan sempurna.

25

B. Menentukan Validitas Pengecoh dengan Produk Moment

Sebagai contoh dipilih soal Nomor 14 dengan kunci jawaban E dan jawaban pengecoh A Nama Siswa Annisa Delly Yolanda Ezhi Anggreyni Fitri Andayeni Hossy Sri Ramadani Indah Sintia May Jelita Mira Kartika Sari Nurhayati Biabdihil H. Xa 0 1 0 0 0 0 0 1 0 Xb 0 0 0 0 0 0 0 0 0 Xc 0 0 0 0 0 0 0 0 0 Xd 0 0 0 1 0 0 0 0 0 Xe 1 0 1 0 1 1 1 0 1 Y 19 17 8 20 19 21 15 20 14 Y 361 289 64 400 361 441 225 400 196 XaY 0 17 0 0 0 0 0 20 0 XbY 0 0 0 0 0 0 0 0 0 XcY 0 0 0 0 0 0 0 0 0 XdY 0 0 0 20 0 0 0 0 0 XeY 19 0 8 0 19 21 15 0 14 Xa 0 1 0 0 0 0 0 1 0 Xb 0 0 0 0 0 0 0 0 0 Xc 0 0 0 0 0 0 0 0 0 Xd 0 0 0 1 0 0 0 0 0 Xe 1 0 1 0 1 1 1 0 1

26

Rani Ariska Resi Arisandi Resti Nilfia Putri Jumlah

0 1 1 4

0 0 0 0

0 0 0 0

0 0 0 1

1 0 0 7

15 18 16 202

225 324 256 3542

0 18 16 71

0 0 0 0

0 0 0 0

0 0 0 20

15 0 0 111

0 1 1 4

0 0 0 0

0 0 0 0

0 0 0 1

1 0 0 7

Validitas pengecoh A ditentukan berdasarkan respon peserta tes pada pengecoh A. Peserta tes yang merespon jawaban A diberi skor 1, sedangkan respon lainnya diberi nol. Dengan demikian dapat dilakukan perhitungan untuk soal pengecoh A sebagai berikut: ( )( * ( ) +* ) ( ) +

Sehingga didapatkan nilai setelah perhitungan menggunakan korelasi product moment sebesar: 0.48. Tanda positif pada soal menunjukkan bahwa soal memiliki tingkat kekeliruan atau menimbulkan keraguan yang cukup tinggi bagi peserta tes. Nilai positif pada alternative jawaban menunjukkan bahwa soal pengecoh banyak dipilih oleh peserta tes yang kemampuannya tinggi. Tanda negative pada validitas pengecoh menunjukkan bahwa pengecoh sudah berfungsi dengan baik dimana peserta tes yang skornya rendah memilih pengecoh sebagai jawaban benar.

27

Validitas sebuah soal yang dapat dinyatakan dengan angka adalah validitas item soal dan validitas pengecoh soal. Sedangkan jenis validitas lain untuk memperhitungkannya membutuhkan waktu yang cukup lama dalam mengumpulkan data serta dibutuhkan beberapa ahli untuk menyelesaikan pembahasan mengenai validitas tersebut.

C. Pengolahan Data untuk Menetukan Reliabilitas: Sebagai contoh dipilih perhitungan menggunakan Pembelahan Ganjil-Genap Tabel 3. Distribusi Genap Ganjil Item Soal No 1 2 3 4 5 6 7 8 9 10 11 12 Annisa Delly Yolanda Ezhi Anggreyni Fitri Andayeni Hossy Sri Ramadani Indah Sintia May Jelita Mira Kartika Sari Nurhayati Biabdihil H. Rani Ariska Resi Arisandi Resti Nilfia Putri Nama Item Ganjil 10 9 1 12 10 10 7 9 7 7 11 8 Item Genap 9 8 7 9 9 11 8 11 7 8 8 8

28

Jumlah

X = 101 X = 10201 XY = 889

Y = 103 Y = 10609

Selanjutnya dilakukan perhitungan untuk mengetahui reliabilitas separo tes atau yang sering dikenal dengan (reliabilitas ganjil-

genap) menggunakan rumus korelasi produk moment dengan angka kasar : ( * + * )( ) +

sehingga didapatkan nilai

= 0,047.

Untuk mencari reliabilitas tes secara keseluruhan digunakan rumus Spearman-Brown dengan persamaan:

Sehingga didapatkan nilai korelasi tes secara keseluruhan adalah 0.089. Mengacu kepada tabel korelasi yang telah disusun oleh surapranata, dapat disimpulkan bahwa tes yang digunakan memiliki tingkat reliabilitas yang sangat rendah, sehingga diharapkan nantinya perlu perbaikan dalam penggunaan instrument atau tes pada tahap selanjutnya.

29

30

Sampel Soal

SOAL UJIAN AKHIR SEKOLAH TP. 2013/2014 Bid. Studi : Fisika Kelas : X-Keperawatan : 60 Menit

Waktu

Pilihlah salah satu jawaban a, b, c, d, atau e yang kamu anggap benar! 1. Berikut ini yang kelompok besaran adalah a. Massa b. Berat e. Panjang 2. Intensitas cahaya merupakan salah satu besaran yang dikategorikan sebagai besaran pokok. Satuan yang tepat untuk besaran tersebut adalah a. Candela c. Kilogram b.Ampere e. Mol 3. Perhatikan besaran berikut! 1. Berat 2. Kuat Arus 3. Kecepatan 4. Massa 5. Kelajuan Besaran yang termasuk kedalam besaran pokok adalah a. semua benar c. 1, 3, 5 b. 2 dan 4 e. 1, 3, 4 4. Dimensi untuk satuan meter/sekon (m/s) adalah a. [ L ] c. [L ] b. [ M ] d. [ L ] d. 2, 4, 5 7. Adit mengukur panjang sebuah buku sebanyak lima kali pengukuran. Hasil yang didapatkan adalah 5,6 cm, 5,5 cm, 5,8 cm, 5,5 cm, dan 5,6 cm. Ratarata hasil pengukuran adit adalah a. 5,5 cm c. 5,55 cm d. Kelvin Jenis keseimbangan untuk gambar diatas disebut sebagai keseimbangan? a. Labil b. Kuat e. Tepat 6. Diketahui massa sebuah batu adalah 4,560732 gram. Pembulatan yang benar jika hasil yang diinginkan dua angka dibelakang koma adalah a. 4,57 gram b. 4,56 gram e. 4,51 gram c. 4,53 gram d. 4,52 gram c. Netral d. Stabil d. Waktu termasuk turunan e. [ L M] 5. Perhatikan gambar berikut!

c.Intensitas cahaya

31

b. 5,50 cm e. 5,66 cm

d. 5,6 cm

Hasil pembacaan yang benar adalah a. 38,7 mm b. 3,87 mm e. 3,37 mm 12. Panjang lintasan yang ditempuh oleh suatu benda yang bergerak disebut sebagai a. Perpindahan c. Kecepatan b. Kelajuan e. Percepatan 13. Mobil yang mula-mula diam bergerak ke arah barat sejauh 20 km, sesaat kemudian mobil tersebut berbalik arah dan bergerak ketimur sejauh 2 km. Besar perpindahan mobil tersebut adalah a. 21 km b. 20 km e. 22 km 14. Andini berangkat dari Pariaman menuju Padang menggunakan sepeda motor. Sesampainya di padang Andini memutuskan untuk mengunjungi temannya yang tinggal di Lubuk Alung. Jika panjang lintasan Pariaman-Padang adalah 55 km dan Padang-Lubuk Alung 38 km. Maka jarak total yang ditempuh Andini adalah sejauh a. 17 km b. 88 km e. 93 km 15. Sebuah bola yang diam ditendang sejauh 3 m, tiba- tiba bola tersebut ditendang kembali berlawanan
32

8. Hasil pengukuran panjang sebuah kayu adalah 0,08319 mm. Banyaknya angka penting dalam bilangan tersebut adalah a. Empat angka c. Tiga angka b. Lima angka d. Dua angka e. Satu angka 9. Diantara alat pengukur panjang berikut yang memiliki hasil pengukuran paling teliti adalah a. Mikrometer sekrup c. Mistar b. Meteran e. Rol 10. Perhatikan gambar pembacaan jangka sorong berikut! d. Jangka Sorong

c. 3,87 cm d. 38,7 cm

d. Jarak

c. 18 km d. 8 km

Hasil pembacaan yang benar adalah a. 43,5 mm b. 4,35 mm e. 4,35 dm 11. Berikut adalah hasil pengukuran menggunakan micrometer sekrup! c. 4,85 mm d. 48,5 cm

c. 90 km d. 92 km

arah sehingga bola tersebut sampai di posisi semula. Besarnya perpindahan bola tersebut adalah a. 6 m b. 3 m e. -3 m 16. Sebuah sepeda motor dapat menempuh jarak 50 km dalam waktu 2 jam. Berapakah kelajuan motor tersebut? a. 25 km/jam e. 6000 km/jam 17. Perhatikan peristiwa berikut! 1. Bola yang dilempar ke vertikal ke atas 2. Mobil ketika melakukan pengereman 3. Buah kelapa yang jatuh dari pohonnya 4. Pesawat yang akan lepas landas Hal yang menunjukkan benda dipercepat adalah a. 1, 2, dan 4 b. 3 dan 4 e. semua benar 18. Percepatan sebuah benda akan bernilai nol apabila benda tersebut mengalami a. GLBB dipercepat c. GLB b. GLBB diperlambat d. GMB e. Gerak melingkar 19. Perhatikan gambar! c. 1 dan 2 d. 1 dan 3 c. 100 km/jam b. 50 km/jam d. 600 km/jam c. 2 m d. 0 m

Gambar diatas menunjukkan benda mengalami a. GLBB dipercepat c. GLB b. GLBB diperlambat d. GMB e. Gerak semu 20. Perhatikan grafik berikut!
3 1 2

Jika sumbu x menyatakan waktu yang ditempuh oleh benda, dan sumbu y menyatakan kecepatan benda. Grafik yang sesuai untuk benda yang mengalami gerak lurus beraturan adalah a. 2 b. 1 e. semua salah 21. Berikut ini yang merupakan besaran vektor dalam gerak lurus adalah a. kelajuan b. jarak e. kecepatan c. perlajuan d. distance c. 3 d. 1 dan 3

33

22. Perhatikan gambar!


1 2 3

5 4

Gambar yang sesuai untuk menunjukkan gaya normal (N) adalah a. 5 b. 4 e. 1 23. Amati gambar arah gaya berikut! c. 3 d. 2

F2

F1

F3

Jumlah komponen gaya yang berada pada sumbu x adalah a. F1+F2+(-F3) b. F1+(-F2)+F3 e. F1+F2+F3 24. Berikut ini yang merupakan keuntungan dari gaya gesek adalah a. gesekan pada roda gigi b. gesekan antara poros e. sistem rem 25. Sebuah balok diletakkan pada sebuah meja. Massa balok 5 kg, jika besarnya gravitasi bumi adalah 10 m/s, berapakah besarnya gaya berat yang dimiliki oleh benda? a. 30 N b. 20 N e. 50 N c. 15 N d.10 N c. gesekan piston d.gesekan silinder c. F1+(-F2)+(-F3) d.(-F1)+(-F2)+(-F3)

BAB IV PENUTUP

A. Kesimpulan Ada beberapa hal yang perlu diperhitungkan sebelum menggunakan suatu instrument sebagai alat pengukur hasil belajar siswa. Sebelum menggunakan soal tes, perlu di analisis tingkat atau taraf kesukaran serta daya pembeda soal. Jika kedua syarat tersebut telah terpenuhi, barulah kita dapat menggunakan soal tersebut untuk diujikan langsung kepada siswa. Setelah digunakan sebagai alat ukur, pengetes perlu melakukan analisis validitas, reliabilitas, bias dan standar kesalahan dalam pengukuran. Penentuan validitas bertujuan untuk menentukan kevalidan dari sebuah tes, reliabilitas menentukan keajegan dari tes atau soal yang digunakan serta standar kesalahan pengukuran berguna untuk melihat sejauh mana penyimpangan atau kemungkinan penyimpangan dari data hasil pnegukuran menggunakan instrument soal.

B. Saran Sebelum merancang soal tes sebaiknya guru atau pengetes menggambarkan rancangan soal dalam bentuk kisi-kisi soal. Dengan adanya kisi-kisi soal akan membantu guru dalam menyusun soal serta dapat memudahkan guru dalam mengelompokan soal berdasarkan ranah dan indikatornya. Soal yang baik adalah soal yang valid, dan reliable. Perbaikan yang dilakukan guru dalam pembuatan atau instrument perancangan instrument soal diharapkan mampu memperbaiki dan meningkatkan kualitas dari hasil belajar peserta didik.

DAFTAR PUSTAKA
Arikunto, Suharsimi. 2008. Dasar-dasar Evaluasi Pendidikan Edisi Revisi, Jakarta, Bumi Aksara. Surapranata, Sumarna. 2005. Analisis Validitas, Reliabilitas, dan Interpretasi Hasil Tes, Bandung, Remaja Rosdakarya.