Anda di halaman 1dari 62

INSTRUMEN PENELITIAN

DOSEN PEMBIMBING

Ns. I Dewa Putu Gede Putra Yasa, M.Kep.,Sp.Mb

DISUSUN OLEH :
1. Gusti Ayu Agung Dwi Apriliani (19089014002)
2. Amanda Patrissia (19089014003)
3. Luh Arris Ophelia Pavita (19089014010)
4. Luh Eka Yuliantini (19089014024)
5. Ni Putu Ina Agresia Sintamaylani (19089014025)
6. Komng Irma Suprianti (19089014026)
7. Kadek Setiani (19089014040)
8. Putu Sinta Wahyuni (19089014041)
9. Ni Putu Tarisa Adnyani (19089014046)
10. Komang Tian Novita Dewi (19089014047)
11. Luh Komang Tiara Purnama Cahyani (19089014048)
12. Putu Vingky Tamalia (19089014052)
13. Kadek Yunia Kartika Dewi (19089014056)

PROGRAM STUDI S1 KEPERAWATAN


SEKOLAH TINGGI ILMU KESEHATAN BULELENG
2022
KATA PENGANTAR

Puji syukur kami panjatkat kepada Tuhan yang Maha Esa atau Ida Sang
Hyang Widhi Wasa karena berkat rahmat-Nya lah penulis dapat menyelesaikan
makalah ini dengan tepat waktu.

Salah satu tujuan penulisan makalah yang berjudul Instrumen Penelitian ini
adalah sebagai acuan penilaian dalam tugas kelompok mata kuliah Metodologi
Penelitian. Penulis menyampaikan terimakasih kepada beberapa pihak yang
mendukung proses pembuatan makalah ini hingga selesai yaitu :
1. Dosen pembimbing mata kuliah Ns. I Dewa Putu Gede Putra Yasa,
M.Kep.,Sp.Mb yang sudah membimbing penulis dalam menyelesaikan
makalah ini
2. Kelompok 3, yang sudah bekerja sama dalam mencari materi atau literatur
dan juga membantu dalam proses pembuatan makalah ini

Penulis menyadari atas ketidaksempurnaan penyusunan makalah ini.


Namun, penulis tetap berharap makalah ini dapat memberikan manfaat bagi
pembaca. Demi kemajuan makalah ini, penulis juga mengharapkan adanya
masukan berupa kritik dan saran yang berguna.

Singaraja, 18 September 2022

Penulis

ii
DAFTAR ISI

HALAMAN COVER ............................................................................................. i

KATA PENGANTAR ........................................................................................... ii

DAFTAR ISI ......................................................................................................... iii

BAB I PENDAHULUAN ...................................................................................... 6

1.1 Latar Belakang .................................................................................................. 6

1.2 Rumusan Masalah ............................................................................................. 6

1.3 Tujuan Penulisan ............................................................................................... 6

1.3.1 Tujuan Umum ................................................................................................ 6

1.3.2 Tujuan Khusus................................................................................................ 6

1.4 Manfaat Penulisan ............................................................................................. 7

1.4.1 Bagi Penulis.................................................................................................... 7

1.4.2 Bagi Pembaca ................................................................................................. 7

1.4.3 Bagi Instansi ................................................................................................... 7

BAB II PEMBAHASAN ....................................................................................... 8

2.1 Pengertian Instrumen Penelitian........................................................................ 8

2.2 Jenis Instrumen .................................................................................................. 8

2.3 Mengembangkan Instrumen ............................................................................ 12

2.4 Mengkaji dan Menilai Instrumen .................................................................... 13

2.5 Memilih Alat Pengumpulan Data .................................................................... 14

2.6 Uji Validitas Instrumen ................................................................................... 17

2.7 Theory Related Validity Dan Criteriorelated Validity .................................... 21

2.8 Uji Reabilitas................................................................................................... 28

2.9 Homogenitas.................................................................................................... 31

iii
2.10 Ekuivalensi dan Analisis Item ....................................................................... 33

BAB III PENUTUP ............................................................................................. 60

3.1 Kesimpulan...................................................................................................... 60

3.2 Saran ................................................................................................................ 60

3.2.1 Untuk Penulis ............................................................................................... 60

3.2.2 Untuk Pembaca/Masyarakat ......................................................................... 60

3.2.3 Untuk Instansi .............................................................................................. 60

DAFTAR PUSTAKA .......................................................................................... 62

iv
v
BAB I

PENDAHULUAN

1.1 Latar Belakang


Penelitian pada dasarnya merupakan proses menemukan kebenaran dari
suatu permasalah dengan menggunakan metode ilmiah. Salah satu tahapan
dalam melakukan metode ilmiah adalah pengumpulan data. Dalam
pengumpulan data instrume sangat penting dalam penelitian, karena instrumen
merupakan alat ukur dan akan memberikan insformasi tentang yang kita teliti.
Mutu alat ukur yang digunakan untuk pengambilan data penelitian sangat
berpengaruh terhadap keterpercayaan data yang diperoleh. Dengan demikian
ketepatan dan keterpercayaan hasil penelitian sangat ditentukan oleh mutu
intrumen yang digunakan untuk mengumpulkan data.
Pada penelitian terdapat suatu variabel, yang ingin diketahui
karakteristiknya, dapat dilakukan dengan cara melakukan pengukuran. Untuk
mengukur karaktersitik suatu variabel diperlukan alat ukur yang disebut dengan
instrumen. Instrumen penelitian adalah suatu alat yang digunakan untuk
mengukur fenomena alam maupun sosial yang diamati.
Instrumen penelitian dibuat untuk satu tujuan penelitian tertentu yang tidak bisa
digunakan oleh penelitian yang lain, sehingga peneliti harus merancang sendiri
instrumen yang akan digunakan.
1.2 Rumusan Masalah
Berdasarkan latar belakang diatas, dapat penulis simpulkan rumusan masalah
pada makalah ini adalah bagaimana instrument dalam penelitian ?
1.3 Tujuan Penulisan
Adapun tujuan dari penulisan makalah ini, ialah sebagai berikut :
1.3.1 Tujuan Umum
Untuk mengetahui dan menambah wawasan terkait insrumen penelitian
1.3.2 Tujuan Khusus
1.3.2.1 Untuk mengetahui definisi instrumen penelitian
1.3.2.2 Untuk mengetahui jenis instrumen penelitan

6
7

1.3.2.3 Untuk mengetahui cara mengembangkan instrumen penelitian


1.3.2.4 Untuk mengetahui cara mengkaji dan menilai instrumen
1.3.2.5 Untuk menegetahui cara memilih alat pengumpulan data
1.3.2.6 Untuk mengetahui cara menguji validitas instrumen
1.3.2.7 Untuk mengetahui theory related validity dan criteriorelated validiy
1.3.2.8 Untuk mengetahui cara menguji reliabititas
1.3.2.9 Untuk mengetahui homogenitas
1.3.2.10 Untuk mengetahui ekuivalensi dan analisis item
1.4 Manfaat Penulisan
Adapun manfaat dalam penulisan makalah ini, sebagai berikut :
1.4.1 Bagi Penulis
Manfaat bagi penulis yakni agar dapat memenuhi tugas dan untuk
mengetahui lebih dalam terkait dengan metodologi penelitian
1.4.2 Bagi Pembaca
Manfaat bagi pembaca yakni agar para pembaca dapat mengetahui terkait
instrumen penelitian
1.4.3 Bagi Instansi
Manfaat bagi instansi yakni agar dapat memenuhi kepentingan mahasiswa
dalam pembuatan tugas sebagai kerangka acuan atau referensi dalam
pembuatan makalah dan untuk mengetahui, mengasah kemampuan
mahasiswa dalam mengerjakan tugas pada mata kuliah Metodologi
Penelitian
BAB II

PEMBAHASAN
2.1 Pengertian Instrumen Penelitian
Instrument penelitian adalah alat yang digunakan untuk
mengumpulkan data dalam penelitian, intrumen penelitian dibuat sesai
dengan tujuan pengukuran dan teori yang digunakan sebagai dasar.
Instrumen penelitian dibuat untuk satu tujuan penelitian tertentu yang tidak
bisa digunakan oleh peneliti yang lain, sehingga peneliti harus merancang
sendiri instrumen yang akan digunakan. Selain membuat instrumen sendiri,
untuk mengumpulkan data dalam suatu penelitian, dapat digunakan
instrumen yang telah tersedia (instrumen baku) (Internasional & 2017, n.d.).
2.2 Jenis Instrumen
1. Instrumen Tes
Menurut Arikunto (2002:127) tes adalah serentetan pertanyaan atau latihan
atau alat lain yang digunakan untuk mengukur keterampilan, pengetahuan
intelegensi, kemampuan atau bakat yang dimiliki individu atau kelompok.
Macam-macam Instrumen tes:
a. Tes kepribadian yaitu tes yang digunakan untuk mengungkap
kepribadian seseorang. Yang diukur bisa self-concept, kreativitas,
disiplin, kemampuan khusus,dll.
b. Tes bakat yaitu tes yang digunakan untuk mengukur atau
mengetahui bakat seseorang.
c. Tes intelegensi yaitu tes yang digunakan untuk mengadakan
estimasi atau perkiraan terhadap tingkat intelektual seseorang
dengan cara memberikan berbagai tugas kepada orang yang akan
diukur intelegensinya.
d. Tes sikap yaitu alat yang digunakan untuk mengadakan pengukuran
terhadap berbagai sikap seseorang.
e. Tes minat yaitu alat untuk menggali minat seseorang terhadap
sesuatu.

8
9

f. Tes prestasi yaitu tes yang digunakan untuk mengukur pencapaian


seseorang setelah mempelajari sesuatu.

2. Instrumen Nontest
a. Angket atau kuesioner
Kuesioner adalah sejumlah pertanyaan tertulis yang digunakan untuk
memperoleh informasi dari responden dalam arti laporan tentang
pribadinya, atau hal-hal yang ia ketahui. Ditinjau dari bentuknya Kuesioner
dapat dibedakan menjadi 4 kelompok yaitu :
1. Kuesioner pilihan ganda
2. Kuesioner isian
3. Check list yaitu responden tinggal membubuhkan tanda check (√)
4. Rating-scale yaitu sebuah pernyataan diikuti oleh kolom-kolom yang
menunjukkan tingkatan-tingkatan misalnya mulai dari sangat setuju
sampai ke sangat tidak setuju.
a) Keuntungan kuesioner :
1. Tidak memerlukan hadirnya peneliti.
2. Dapat dibagikan secara serentak kepada banyak responden.
3. Dapat dijawab oleh responden menurut waktu senggang responden.
b) Kelemahan kuesioner :
1. Seringkali sukar dicari validitasnya
2. Walaupun dibuat anonim, kadang-kadang responden dengan sengaja
memberikan jawaban yang tidak betul atau tidak jujur.
3. Waktu pengembaliannya tidak bersama-sama, bahka kadang-kadang ada
yang terlalu lama sehingga terlambat.
b. Interview
Interview yang sering disebut juga dengan wawancara atau kuesioer lisan
adalah sebuah dialog yang dilakukan oleh pewawancara untuk memperoleh
informasi dari terwawancara. Interview digunakan oleh peneliti untuk
meneliti keadaan seseorang misalnya untuk mencari data tentang variabel
latar belakang murid, orang tua, pendidikan, perhatian, sikap terhadap
sesuatu.
10

Ditinjau dari pelaksanaannya, maka interview dibedakan atas :


1. Interview bebas di mana pewawancara bebas menanyakan apa saja, tetapi
juga mengingat akan data apa yang akan dikumpulkan.
2. Interview terpimpin di mana pewawancara deng membawa sederetan
pertanyaan lengkap dan terperinci.
3. Interview bebas terpimpin yaitu antara kombinasi antara interview bebas
dan interview terpimpin.
Keunggulan teknik interview adalah:
1. Peneliti memiliki peluang atau kesempatan memeperoleh respon atau
jawaban yang relatif tinggi dari responden
2. Peneliti dapat memebantu menjelaskan lebih, jika ternyata responden
mengalami kesulitan menjawab yang diakibatkan ketidak jelasan
pertanyaan
3. Peneliti dapat mengontrol jawaban responden secara lebih teliti dengan
mengamati reaksi atau tingkah laku yang diakibatkan oleh pertanyaan dalam
proses interview
4. Peneliti dapat memperoleh informasi yang tidak dapat diungkapkan
dengan cara kuesioner ataupun observasi.
c. Observasi
Di dalam pengertian psikologik, observasi atau yang disebut pula dengan
pengamatan, meliputi kegiatan pemuatan perhatian terhadap sesuatu objek
dengan menggunakan seluruh alat indra. Jadi, mengobservasi dapat
dilakukan melalui penglihatan, penciuman, pendengaran, peraba, dan
pengecap. Apa yang di katakan ini sebenarnya adalah pengamatan langsung.
Di dalam artian penelitian observasi dapat dilakuka dengan tes, kuesioner,
rekaman gambar, rekaman suara.
Observasi dapat di bagi menjadi 2 jenis yaitu:
1. Observasi non-sistematis yang dilakukan oleh pengamat dengan tiak
menggunakan instrumen pengamatan.
2. Observasi sistematis yang dilakukan oleh pengamat dengan
menggunakan pedoman ebagai instrumen pengamatan.
Sedangkan observasi dilakukan dengan 2 cara yaitu:
11

1. Sign system digunakan sebagai instrumen pengamatan situasi


pengajaran sebagai sebuah potret sesuai pengajaran. Instrumen tersebut
berisi sederetan sub-variabel. Misalnya gur menerangkan, guru menulis
di papan tulis, guru bertanya kepada kelompok, guru bertanya kepada
seorang anak, guru menjawab, murid berteriak,dsb. Setelah pengamatan
dalam satu periode tertentu misalnya5 menit, semua kejadian yang telah
muncul di cek. Kejadian yang muncul lebih ari satu kali dalam satu
periode pengamatan, hanya di cek satu kali. Dengan demikian akan
diperoeh gambar tentang apa kejadian yang muncul dalam situasi
pengajaran.
2. Category system adalah sistem pengamatan yang membatasi pada
sejumlah variabel misalnya pengamatan ingin mengetahui keaktivan
atau partisipasi murid dalam proes belajar-mengajar. Dalam hal ini
pengamat hanya memperhatikan kejadian-kejadian yang masuk ke
dalam kategori keaktifan atau partisipasi murid misalnya : murid
bertanya, murid berdebat dengan guru, murid membahas pertanyaan,
dsb.
Dalam penelitian pendidikan, pengambilan data dengan menggunakan
metode observasi dapat dibedakan menjadi tiga macam, yaitu:
1. Observasi terbuka, yaitu pada posisi ini kehadiran peneliti dalam
menjalankan tugasnya di tengah-tengah kegiatan responden diketahui
secara terbuka, sehingga antara responden dengan peneliti terjadi interaksi
secara langsung.
2. Observasi tertutup, yaitu pada kondisi ini kehadiran peneliti dalam
menjalankan misinya, yaitu mengambil data dari responden, tidak diketahui
responden yang bersangkutan.
3. Observasi tidak langsung, yaitu pada kondisi inipeneliti dapat melakukan
pengambilan data dari responden walaupun mereka tidak hadir secara
langsung di tengah-tengah responden.
12

d. Dokumentasi
Dalam uraian tentang studi pendahulan, telah disinggung pula bahwa
sebagai objek yang diperhatikan (ditatap) dalam memperoleh informasi,
kita memperhatikan tiga macam sumber, yaitu tulisan (paper), tempat
(place), dan kertas atau orang (people). Dalam mengadakan penelitian yang
bersumber pada tulisan inilah kita telah menggunakan metode dokumentasi.
Dokumentasi, dari asal katanya dokumen, yang artinya barang-barang
tertulis. Di dalam melaksanakan metode dokumentasi, peneliti menyelidiki
benda-benda tertulis seperti buku-buku, majalah, dokumen, peraturan-
peraturan, notulen rapat, catatan harian, dsb.
Metode dokumentasi dapat dilaksanakan dengan :
1. Pedoman dokumentasi yang memuat garis-garis besar atau kategori yang
akan dicari datanya.
2. Check-list, yaitu daftar variabel yang akan dikumpulkan datanya.dalam
hal ini peneliti tinggal memberikan tanda atau tally setiap pemunculan
gejala yang dimaksud (kebudayaan, 2017)
2.3 Mengembangkan Instrumen
Dalam pelaksanaan pengembangan instrumen penelitian dapat
mengikuti prosedur Research and Development atau R&D dan insturmen
yang dihasilkan menjadi produk yang dihasilkan dari pelaksanaan R&D.
Menurut Borg and Gall (2003,784) dalam.... menentukan 10 langkah
berurut dalam penelitian dan pengembangan seperti berikut :
a. Research and information collecting, dilakukan melalui studi awal
dengan pengumpulan informasi pada kondisi kontekstual dimana
penelitian akan dilakukan, reviw literatur, observasi lapangan
penelitian, kelas atau laboratorium
b. Planning, menentukan tujuan, identifikasi keterampilan,
menentukan performance yang akan dinilai.
c. Develop preliminary form of product, mengembangkan instrumen
awal menyiapkan kisi-kisi instrumen, metode pengumpulan data,
dan asesmen.
13

d. Preliminary testing, memvalidasi instrumen (produk) awal yang


dihasilkan pada tahap 3.
e. Main product revision, melakukan revisi produk berdasarkan
masukan dari tes awal. Melakukan interview, observasi dan angket
terhadap subyek penelitian.
f. Main field testing, melakukan ujicoba lapangan terhadap 50
responden atau lebih sebagai responden pengguna produk.
Mengumpulkan data kuantitatif.
g. Operational product revision,merevisi produk berdasarkan masukan
pada ujicoba lapangan.
h. Operational fiels testing, melakukan ujicoba lapangan melibat 100
responden pengguna produk, mengumpulkan data kuantitatif.
i. Final product revision, merevisi instrumen berdasarkan masukan
dari ujicoba lapangan operasional hingga menghasilkan produk
akhir.u
j. Dissemination and implementation, membuat laporan produk akhir
dan dipresentasikan melalui seminar hasil penelitian (Ekonomi &
2016, 2016).
2.4 Mengkaji dan Menilai Instrumen
Berdasarkan lampiran Permendikbud Nomor 66 Tahun 2013 tentang
standar penilaian, intrumen penilaian harus memenuhi syarat :
1. Substansi yang mempresentasikan kompetensi yang dinilai
2. Konstruksi yang memenuhi persyaratan teknis sesuai dengan bentuk
instrumen yang digunakan
3. Penggunaan bahasa yang baik dan benar serta komunikatif sesuai
dengan tingkat perkembangan peserta didik
Untuk mencapai tujuan secara efektif dan efisien intrumen harus baik
sebagai alat ukur. Menurut Yusuf (2015) dalam (Hidayat, 2021)
menyatakan bahwa instrument yang baik harus memenuhi persyaratan yaitu
sebagai berikut :
a. Valid
14

Suatu instrume merujuk kepada ketepatan untuk menilai apa yang


dinilai. Instrumen dikatakan mempunyai validitas tinggi apabila alat itu
betul – betul mampu mengukur dan menilai apa yang ingin diukur.
Validasi instrumen meliputi isi (content validity) dan validitas butir
b. Reliabel
Reliabilitas suatu instrumen merujuk pada ketetapan, konsistens, atau
stabilitas. Tahapan reliabilitas dilakukan setelah instrumen dikatakan
valid
c. Objektif
Objektif suatu instrumen artinya penskor hendaknya menilai adanya
tanpa dipengaruhi subjektivitas penskor atau faktor lain diluar data yang
tersedia.
d. Praktis dan Mudah dilaksanakan
Suatu instrumen dikatakan praktis apabila biaya ukur mudah dan murah.
Mudah diaministrasikan, di skor dan diinterpretasikan. Murah merujuk
pada biaya pelaksana dan peserta tidak terlalu tinggi
e. Norma
Norma diartika sebagai patokan, kriteria atau ukuran yang digunakan
untuk menentukan standar minimal batas kelulusan
2.5 Memilih Alat Pengumpulan Data
Secara umum ada tiga cara untuk mengumpulka data yaitu melalui metode
observasi, metode wawancara, dan metode kuisioner
1. Metode observasi
Pengumpulan data dengan observasi langsung atau dengan
pengamatan langsung adalah cara pengambilan data dengan
menggunakan mata tanpa ada pertolongan alat standar lain untuk
keperluan tersebut. Pengamatan baru tergolong sebagai teknik
mengumpulkan data, jika pengamatan tersebut mempunyai kriteria
berikut:
a. Pengamatan digunakan untuk penelitian dan telah direncanakan
secara sistematik.
15

b. Pengamatan harus berkaitan dengan tujuan penelitian yang telah


direncanakan.
c. Pengamatan tersebut dicatat secara sistematis dan dihubungkan
dengan proposisi umum dan bukan dipaparkan sebagai suatu set
yang menarik perhatian saja.
Pengamatan dapat dicek dan dikontrol atas validitas dan
reliabilitasnya. Penggunaan pengamatan langsung sebagai cara
mengumpulkan data mempunyai beberapa keuntungan antara lain :
Pertama. Dengan cara pengamatan langsung, terdapat kemungkinan
untuk mencatat hal-hal, perilaku, pertumbuhan, dan sebagainya,
sewaktu kejadian tersebut berlaku, atau sewaktu perilaku tersebut
terjadi. Dengan cara pengamatan, data yang langsung mengenai
perilaku yang tipikal dari objek dapat dicatat segera, dantidak
menggantungkan data dari ingatan seseorang;
Kedua. Pengamatan langsung dapat memperoleh data dari subjek
baik tidak dapat berkomunikasi secara verbal atau yang tak mau
berkomunikasi secara verbal. Adakalanya subjek tidak mau
berkomunikasi, secara verbal dengan enumerator atau peneliti, baik
karena takut, karena tidak ada waktu atau karena enggan. Dengan
pengamatan langsung, hal di atas dapat ditanggulangi. Selain dari
keuntungan yang telah diberikan di atas, pengamatan secara
langsung sebagai salah satu metode dalam mengumpulkan data,
mempunyai kelemahan-kelemahan.
2. Metode Wawancara
Yang dimaksud dengan wawancara adalah proses memperoleh
keterangan untuk tujuan penelitian dengan cara tanya jawab, sambil
bertatap muka antara si penanya atau pewawancara dengan si penjawab
atau responden dengan menggunakan alat yang dinamakan interview
guide (panduan wawancara). Wawancara dapat dilakukan dengan tatap
muka maupun melalui telpon.
a. Wawancara tatap muka
Beberapa kelebihan wawancara tatap muka antara lain :
16

 Bisa membangun hubungan dan memotivasi


responden
 Bisa mengklarifikasi pertanyaan, menjernihkan
keraguan, menambah pertanyaan baru
 Bisa membaca isyarat non verbal
 Bisa memperoleh data yang banyak
Sementara kekurangannya adalah :
 Membutuhkan waktu yang lama
 Biaya besar jika responden yang akan diwawancara
berada di beberapa daerah terpisah
 Responden mungkin meragukan kerahasiaan
informasi yang diberikan
 Pewawancara perlu dilatih
 Bisa menimbulkan bias pewawancara
 Responden bias menghentikan wawancara kapanpun
b. Wawacara via phone
Kelebihan
 Biaya lebih sedikit dan lebih cepat dari warancara
tatap muka
 Bisa menjangkau daerah geografis yang luas
 Anomalitas lebih besar dibanding wawancara pribadi
(tatap muka)
Kelemahan
 Isyarat non verbal tidak bisa dibaca
 Wawancara harus diusahakan singkat
 Nomor telpon yang tidak terpakai bisa dihubungi,
dan nomor yang tidak terdaftar pun dihilangkan dari
sampel
3. Metode Kuisioner
Kuesioner adalah daftar pertanyaan tertulis yang telah
disusun sebelumnya. Pertanyaan-pertanyaan yang terdapat dalam
kuesioner, atau daftar pertanyaan tersebut cukup terperinci dan
17

lengkap dan biasanya sudah menyediakan pilihan jawaban


(kuesioner tertutup) atau memberikan kesempatan responden
menjawab secara bebas (kuesioner terbuka). Penyebaran kuesioner
dapat dilakukan dengan beberapa cara seperti penyerahan kuesioner
secara pribadi, melalui surat, dan melalui email. Masing-masing
cara ini memiliki kelebihan dan kelemahan, seperti kuesioner yang
diserahkan secara pribadi dapat membangun hubungan dan
memotivasi respoinden, lebih murah jika pemberiannya dilakukan
langsung dalam satu kelompok, respon cukup tinggi. Namun
kelemahannya adalah organisasi kemungkinan menolak
memberikan waktu perusahaan untuk survey dengan kelompok
karyawan yang dikumpulkan untuk tujuan tersebut.
2.6 Uji Validitas Instrumen
Validitas berasal dari kata validity yang berarti sejauh mana
ketepatan dan juga kecermatan suatu alat ukur dalam melakukam fungsi
ukurannya (Azwar, 2000 dalam (Pembelajaran, 2019)). Dalam penelitian
validitas menyatakan suatu derajat ketepatan alat ukur dalam suatu
instrument penelitian terhadap isi atau variabel yang sebenarnya diukur.
Untuk mengetahui sejauh mana suatu alat ukur yang dalan hal ini adalah
instrumen penelitian dapat mengukur apa yang seharusnya diukur, maka
dilakukan uji validitas atau memberi bukti validitas instrumen penelitian.
Uji validitas dilakukan untuk mengetahui apakah suatu isntrumen
sah atau valid untuk mengukur suatu variable, misalnya pada kuesioner.
Angket atau kuesioner dinayatakan valid jika variabel yang akan diukur
dapat diunggap melalui angket tersebut. Sehinga dapat dikatakan bahwa
variabel dapat diukur secara tepat oleh instrumen tersebut. Validitas dalam
instrumen penelitian menunjukkan derajat ketepatan instrumen sebagai alat
ukur terhadap isi atau apa yang diukur. Suatu tes akan mempunyai validitas
yang tinggi jika mampu menjalankan fungsinya sebagai alat ukur. Mampu
memberikan hasil pengukuran yang tepat dan akurat sesuai dengan tujuan
dari dikembangkannya instrument tersebut. Jika suatu instrument tes
misalnya mempunyai validitas yang rendah maka data yang dihasilkan
18

melalui tes tersebut akan diterima sebagai hasil yang tidka relevan atau tidak
akurat. Selain merujuk pada ketepatan dalam melakukan pengukuran,
validitas instrumen juga dapat merujuk pada keakuratan instrumen.
Instrumen yang valid akan memiliki tingkat kecermatan yang tinggi dalam
pengukuran. Kecermatan dalam hal ini adalah kemampuan instrumen
mendeteksi perbedaan-perbedaan pada atribut yang diukur walaupun
perbedaan itu sangat kecil.
Validitas item intrumen digunakan untuk mengetahui dukungan
suatu item terhadap skor total. Untuk menguji validitas setiap butir
instrumen, skor-skor yang ada pada butir intrumen yang dimaksud
dikorelasikan dengan skor total. Sebuah item akan memiliki validitas yang
tinggi jika skor tersebut memiliki dukungan yang besar terhadap skor total.
Dukungan setiap butir item dinyatakan dalam bentuk korelasi sehingga
untuk mendapatkan validitas suatu item digunakan rumus korelasi.
Perhitungan dilakukan dengan menggunakan rumus product moment
Pearson. Interpretasi besarnya koefisien korelasi seperti Tabel
Berikut (Novikasari, 2017):
Koefisien Korelasi interpretasi
0,80 < rxy ≤ 1,00 Sangat tinggi
0,60 < rxy ≤ 0,80 Tinggi
0,40 < rxy ≤ 0,60 Cukup
0,20 < rxy ≤ 0,60 Rendah
rxy ≤ 0,20 Sangat rendah

Pengolahan data dengan SPSS uji validitas


(1) Buka file Uji Coba
(2) Dari menu utama SPSS, pilih menu Analyze, kemudian pilih submenu
Correlate. Lalu pilih Bivariate
19

Nampak di layar kotak dialog, dengan pengisian Bivariate Correlations .


Masukkan semua item ke kotak variables. Pada bagian Correlation
Coefficients beri tanda pada Pearson. Selanjutnya pada Test of
Significance pilih two-tailed. Beri tanda pada Flag significant
correlations, kemudian klik OK untuk
proses data
20

Output SPSS disajikan pada tabel berikut:

Berdasarkan output di atas kita dapat mengetahui item-item instrumen yang


valid atau tidak. Untuk menginterpretasikan data di atas kita memerlukan
21

tabel r. Nilai r tabel digunakan untuk membanding r dari output. Nilai rtabel
diperoleh dari N = 30 dan α = 0,05, yaitu rtabel = 0,36.
Pengambilan keputusan uji validitas adalah:
Jika rhitung ≥ rtabel, maka data valid
Jika rhitung < rtabel, maka data tidak valid
Keputusan:

Item rxy Rtabel Kategori Keterangan


1 0,338 0,36 Rendah Tidak Valid
2 0,679 0,36 Sedang Valid
3 0,628 0,36 Sedang Valid
4 0,662 0,36 Sedang Valid
5 0,619 0,36 Sedang Valid
6 0,644 0,36 Sedang Valid

Hasil pada tabel di atas menunjukkan bahwa item 1 tidak valid sehingga
item instrumen tersebut dapat dihilangkan dalam penelitian. Instrumen yang
digunakan dalam penelitian hanya item 2, 3, 4, 5, dan 6 yang bisa dijadikan
alat pengumpul data pada aspek yang diteliti.

2.7 Theory Related Validity Dan Criteriorelated Validity


1. Theory Related Validity
Validitas berasal dari kata validity yang berarti sejauh mana
ketepatan dan juga kecermatan suatu alat ukur dalam melakukam
fungsi ukurannya (Azwar, 2000 dalam(Pembelajaran, 2019)).
Beberapa ahli memberikan pendapatnya tentang validitas dalam
pengembangan instrument penelitian, khususnya yang berhubungan
dengan bidang Pendidikan. Menurut Reynold (2010) validitas
diartikan sebagai keputusan evaluatif yang terintegrasi dari sejauh
mana bukti empiris dan alasan-alasan teoritis mendukung
kecukupan dan kesesuaian kesimpulan dan tindakan berdasarkan
skor tes atau modus lain dari penilaian. Selain itu Ebel (1986) ketika
22

validitas ditetapkan pada suatu nilai tes, maka validitas tersebut


mengacu pada concistency (akurasi). Pendapat lain mengemukakan
bahwa validitas instrumen menggambarkan sejauh
mana instrumen itu mampu mengukur apa yang seharusnya harus
diukur (Allen & Yen, 1979; Azwar, 2000; Kerlinger, 1986). Jadi
secara singkat, kesimpulannya adalah sebuah instrumen yang valid
akan mengukur apa yang memang seharusnya diukur. Validitas tes
dibagi dalam 3 kelompok utama, yaitu validitas isi, validitas
hubungan kriteria (criterion-related), dan validitas konstruk (Allen
& Yen, 1979; Kerlinger, 1986). Meskipun validasi dapat dilakukan
dengan berbagai jenis validitas tersebut, tetapi peneliti dapat
memilih salah satu jenis validasi yang disesuaikan dengan tujuan
pengembangan instrumen. Ketika menggunakan validitas kriteria,
maka penelti akan berhubungan dengan perhitungan, statistic
ataupun pemeriksaan korelasi. Sedangkan ketika menggunakan
validtas isi, maka penentuannya tidak berhubungan dengan statistik
tertentu. Validitas isi lebih dipahami berdasarkan telaah ahli
terhadap kisi-kisi instrumen. Oleh karena itu, pembuktian validitas
isi sebenarnya lebih berdasar pada analisis logika dan tidak memiliki
koefisien validtas untuk menunjukkan derajat ketepatannya.
2. Validitas Isi
Validitas isi merujuk pada sejauh mana isi dari suatu
perangkat instrumen penelitian dapat mengukur apa yang
seharusnya diukur. Jika dikaitkan dengan pembelajaran, maka
validitas isi adalah kesesuaian sola-soal atau materi dalam ujian
dengan apa yang telah dipelajari siswa (Mardapi, 2008). Pengujian
terhadap validitas isi menggunakan logika atau analisis rasioanal
dengan melihat apakah item-item soal telah sesuai dengan kisi-
kisinya. Dengan kata lain validitas isi dapat dikatakan sebagai
penilaian yang ditentukan berdasarkan indvidu atau secara subjektif.
Validitas isi dibagi kedalam dua kelompok yaitu face validity
(validitas muka) dan logical validity (validitas logis). Validitas
23

muka terpenuhi jika seseorang yang ahli menilai tes dan


menyimpulkan bahwa tes tersebut mengukur ciri yang relevan.
Seseorang yang dapat melakukan penilaian adalah seseorang yang
ahli dalam melakukan penilaian. Jika orang yang ahli tersebut
menganggap instrumen tidak sesuai, maka validitas muka
dipertanyakan. Sebagai contoh sebuah tes aritmetika, dalam “muka”
tes tersebut, mengukur kemampuan aritmetik. validitas muka dapat
menjadi sangat penting digunakan dalam tes, meskipun dalam
beberapa kasus validitas muka tidak perlu jika tes valid dalam cara
yang lain. Validitas logis merupakan tipe yang lebih canggih dan
modern dari validitas muka. Validitas logis melibatkan definisi dari
tingkah laku untuk diukur menggunakan sebuah tes atau design item
yang logis. Validitas logis sangat berguna dalam mengembangkan
tes khususnya dalam bidang akdemik misalnya prestasi. Validitas isi
didasarkan pada keputusan subjektif. Oleh karena itu untuk
menentukan jenis validitas isi, seseorang lebih cenderung
melakukan kesalahan daripada validitas yang lain. Namun secara
umum, menentukan validitas isi adalah perhatian pertama dalam
mengembangkan semua instrumen.
3. Validitas Kriteria
Validitas kriteria dikenal dengan nama lain yaitu validitas
empiris. Validitas kriteria digunakan ketika nilai atau skor tes
dihubungkan dengan suatu kriteria. Kriteria adalah beberapa
perilaku dimana nilai tes dapat digunakan untuk memprediksi.
Sebagai contoh misalnya, untuk mendapatkan validitas hubungan
kriteria, skor dalam suatu instrumen tes yang dikembangkan untuk
penyeleksian pelamar pekerjaan harus dihubungkan dengan kriteria
keefektifan kinerja. Validitas hubungan kriteria diekspresikan
sebagai sebuah koefisien korelasi antara skor tes atau predictor
dengan skor kriteria. Simbol korelasinya adalah r𝑥𝑦 dimana X
adalah skor tes sedangkan Y adalah skor kriterianya. Untuk
menghitung besarnya korelasi, dapat digunakan rumus korelasi
24

Product Moment Pearson. Terdapat beberapa rumus yang berbeda


untuk menghitung koefisien korelasi Pearson (Reynold, 2010), salah
satu diantaranya adalah sebagai berikut :
r𝑥𝑦 = 𝑁 Σ 𝑋𝑌 − (Σ 𝑋)(Σ 𝑌)
√𝑁 Σ 𝑋2 − (Σ 𝑋)2 √𝑁 Σ 𝑌2 − (Σ 𝑌)2
N = Banyaknya peserta tes
𝑋𝑌 = jumlah dari perkalian 𝑋𝑌
𝑋 = jumlah dari skor prediktor
𝑌 = jumlah dari skor kriteria
𝑋2 = jumlah dari kuadrat skor prediktor
𝑌2 = jumlah dari kuadrat skor kriteria
Ada dua jenis validitas kriteria yaitu validitas kriteria
internal dan eksternal. Kriteria internal menggunakan tes itu sendiri
sebagai kriteria. Validitas internal (validitas butir) diukur dengan
mengkorelasikan item ke keseluruhan tes sebagai kriteria, sehingga
sering juga disebut dengan validitas butir. Dengan demikian
validitas butir dapat terlihat dari nilai koefisien korelasi antara skor
item atau butir dengan skor total. Sedang kriteria eksternal
menggunakan skor dari tes lain untuk menjadi kriteria, misalnya tes
lain yang telah dianggap baku atau dapat dipercaya. Menurut
penggunaannya validitas kriteria akan berfungsi dalam penentuan
validitas konkurent (concurrent validity) seandainya digunakan
dalam waktu yang sama atau berdekatan. Jika dimanfaatkan pada
waktu yang akan dating, maka disebut sebagai validitas prediktif
(predictive validity). Koefisien validitas r𝑥𝑦 menghasilkan sebuah
prediksi atau perkiraan validitas yang bersama-sama (concurrent
validity). Validitas prediksi melibatkan skor tes untuk
memperkirakan sikap yang akan terjadi. Validitas prediktif
berhubungan dengan koefisien korelasi antara skor tes dengan suatu
kriteria tertentu yang terjadi di kemudian hari (Ary, 1985 dalam
(Pembelajaran, 2019)). Misalnya jika seorang peneliti memberikan
tes matematika kepada siswa ketika ia masuk di kelas empat.
25

Kemudian ketika siswa selesai menempuh pelajaran di kelas empat,


peneliti dapat menilai validitas kongkurensinya dengan jalan
mengkorelasikan skor tes matematika tersebut dengan angka yang
diterima subjek dalam pelajaran matematika selama di kelas empat.
Kegiatan ini akan menghasilkan validitas kongruen karena dlakukan
pada waktu yang sama atau relative sama. Jika dikemudian hari
ingin mengetahui validitas prediktifnya, maka dapat dilakukan
dengan jalan mengkorelasikan skor tes tersebut dengan angka
pelajaran matematika mereka dikelas 12 SMA misalnya.
4. Validitas Konstruk
Validitas konstruk adalah validitas yang berhubungan
dengan perluasan suatu tes yang mengukur suatu karakteristik
khusus atau konstruk tertentu. Validitas konstruk adalah validitas
yang utama untuk menilai individu-individu pada kemampuan dan
karakteristik psikologi tertentu. Beberapa contoh yang umum dari
konstruk adalah ,kedisiplinan, kecemasan, self-efficacy, kecerdasan,
motivasi, kemampuan berargumen , kemampuan berpikir kritis,
kreatif, bakat dalam berbagai bidang, kemampuan membaca, dan
lain-lain. Validitas konstruk menggambarkan seberapa jauh suatu
instrument khususnya tes mengukur suatu konstruk teoretik atau
trait yang akan diukurnya. Konstruk diartikan sebagai faktor-faktor
yang berkaitan dengan variabel tertentu, misalnya aspek kognitif,
afektif dan psikomotorik. Terdapat beberapa teknik atau cara yang
bisa digunakan untuk memberi menguji validtas konstruk. Salah
satunya dengan mencocokkan faktor-faktor dalam instrumen dengan
aspek yang akan diukur oleh instrumen tersebut. Dengan cara ini
maka kajian atau telaah teori harus dilakukan secara mendalam.
Cara lain yang disarankan untuk menguji validitas konstruk dan
dianggap lebih sederhana adalah dengan cara multi trait multi-
method (Saifuddin Azwar, 2000 dalam (Pembelajaran, 2019)).
Validasi konstruk mengkombinasikan pendekatan logis dan
pendekatan empiris. Salah satu aspek dari pendekatan logis adalah
26

untuk menanyakan jika unsur-unsur tes pengukuran adalah unsur-


unsur yang membangun konstruk. Aspek lain dari pendekatan logis
adalah untuk memeriksa butir-butir untuk menentukan jika mereka
tampak tepat untuk menilai unsur-unsur dalam konstruk. Ada
beberapa
aspek empiris validitas konstruk: (1) Secara internal, hubungan
dalam tes seharusnya diprediksi oleh konstruk. (2) Secara eksternal,
hubungan antara skor pada tes dan pengamatan-pengamatan yang
lain seharusnya konsisten dengan konstruk. Jika hubungan dari
unsur-unsur dalam suatu tes bukan apa yang diprediksi oleh
konstruk, maka konstruk tersebut tidak tepat atau tes itu gagal
mengukur unsur-unsur dalam konstruk. Apabila pada tes yang
dibuat dan diatur kita menemukan bahwa unsur-unsur tersebut tidak
berelasi secara positif, kita akan menyimpulkan bahwa validitas
konstruk pengukuran kurang dan bahwa tes atau konstruk itu sendiri
seharusnya direvisi. Skor pada suatu tes seharusnya dihubungkan
dengan pengukuran eksternal dalam suatu cara yang konsisten
dengan konstruk. Suatu pengukuran dari suatu konstruk khusus
sebisa mungkin tidak tergantung dari pengukuran konstruk-konstruk
yang lain.
Pendekatan yang sering digunakan dalam pengujian validasi
konstruk adalah matriks multitrait-multimethod dan analisis faktor.
Analisis faktor lebih popular karena sering digunakana dalam
berbagai penelitian. Analisis faktor merupakan suatu metode untuk
mengkorelasikan suatu ukuran dengan sejumlah besar ukuran yang
lain untuk mengetahui ukuran-ukuran apa sajakah yang mengukur
hal yang sama. Analisis faktor merupakan teknik untuk
menyederhanakan, mengurangi ataupun meringkas ukuran suatu
variabel yang besar atau banyak menjadi ukuran yang lebih sedikit
yang nantinya disebut sebagai faktor. Penyederhanaan dilakukan
dengan menyelidiki faktor-faktor mana yang sebenarnya sama atau
mempunyai tujuan yang sama dan menjadikannyi satu faktor dengan
27

penamaan baru yang mewakli fakorfaktor sebelumnya. Misalnya,


ketika mengembangkan instrumen yang terdiri dari 20 butir soal
yang diharapkan mewakili 20 indikator tertentu. Ternyata setelah
dilakukan analisis factor 20 item tersebut hanya mengukur 8 indiktor
saja.
5. Criteriorelated Validity
Validitas berdasarkan kriteria (criterion related validity) merupakan
prosedur pendekatan validitas berdasarkan kriteria menghendaki
tesedianya kriteria eksternal yang dapat dijadikan dasar pengujian
skor tes. Suatu kriteria adalah variabel prilaku yang akan diprediksi
oleh skor tes atau berupa suatu ukuran lain yang relevan. Untuk
melihat tingginya validitas berdasarkan kriteria dilakukan
komputasi korelasi antara skor tes dengan skor kriteria. Koefisien
ini merupakan koefisien validitas bagi tes yang bersangkutan, yaitu
𝑟𝑥𝑦 dimana xmelambanagkan skor tes dan y melambangkan skor
kriteria. Criterion-related Validity, konsep pengukuran validitas
yang menguji tingkat akurasi dari instrumen yang baru
dikembangkan. Uji Criterion-related Validity ini, dilakukan dengan
cara menghitung koefisien korelasi antara skor yang diperoleh dari
penggunaan instrumen baru dengan skor dari penggunaan instrumen
lain yang telah ada sebelumnya dan memilki kriteria relevan.
Instrumen baru yang memiliki validitas yang tinggi jika koevisien
korelasinya tinggi.
Ada tiga jenis Criterion-related Validity, yaitu:
a) Concurrent Validity, jika pengujian korelasi dilakukan terhadap
skor instrumen baru dengan instrumen yang mempunyai kriteria
relevan.
b) Predictive Validity, jika korelasi skor kedua instrumen
merupakan hasil pengukuran sebelum pengukuran pada saat yang
berbeda. Dimana pengukuran instrumen yang baru dilakukan
sebelum pengukuran instrumen lain yang memilki kriteria relevan.
c) Construct Validity, suatu instrument dirancang untuk menukur
28

contruct tertentu. Construct Validitymerupakan konsep pengukuran


validitas dengan cara menguji apakah suatu instrumen mengukur
constructsesuai dengan yang diharapkan. Ada dua cara pengujian
Cinstruct Validity, yaitu:
1. Convergent Validity, dimana validitas suatu instrumen ditentukan
berdasarkan konvergensinya dengan instrumen lain yang sejenis
dalam mengukur construct.
2. Discriminant Validaty, dimana validitas suatu instrumen
ditentukan berdasarkan rendahnya korelasi dengan instrumen lain
yang digunakan untuk mengukur construct lain (Theory Related
Validity Dan Criteria Related Validity, 2015)
2.8 Uji Reabilitas
1. Menurut Sugiono (2005), reliabilitas adalah serangkaian pengukuran atau
serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang
dilakukan dengan alat ukur itu dilakukan secara berulang.
2. Menurut Sukadji (2000), uji reliabilitas adalah seberapa besar derajat tes
mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan
dalam bentuk angka, biasanya sebagai koefesien. Koefisien yang tinggi
berarti reliabilitas yang tinggi.
3. Menurut Anastasia dan Susana (1997), reliabilitas adalah sesuatu yang
merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika
mereka diuji ulang dengan tes yang sama pada kesempatan yang berbeda,
atau dengan seperangkat butir-butir ekuivalen (equivalent items) yang
berbeda, atau di bawah kondisi pengujian yang berbeda.
Uji Validitas dan Reliabilitas
Persyaratan bagi sebuah test instrumen penelitian, yaitu validitas dan reliabilitas ini
penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena
menyokong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid.
Sebaliknya, sebuah tes yang valid biasanya reliabel.”
29

Jenis Reliabilitas
Secara garis besar, kita mengenal ada dua jenis reliabilitas, yaitu reliabilitas
eksternal dan reliabilitas internal. Pada tulisan ini kita hanya membatasi membahas
mengenai reliabilitas internal. Pada dasarnya, reliabilitas ini diperoleh dengan cara
menganalisis data dari satu kali hasil pengetesan.

Jenis Uji Reliabilitas


Terdapat bermacam-macam cara yang dapat kita gunakan untuk mengetahui dan
menghitung reliabilitas internal. Pemilihan teknik mana yang digunakan biasanya
didasarkan atas bentuk instrumen maupun selera kita sebagai peneliti. Penggunaan
teknik yang berbeda tentunya akan menghasilkan indeks reliabilitas yang berbeda
pula. Hal ini secara sederhana dapat kita pahami karena wajar saja pengaruh sifat
atau karakteristik data menyebabkan perhitungan menghasilkan angka yang
berbeda, salah satunya akibat pembulatan angka. Secara khusus, beberapa teknik
memerlukan persyaratan tertentu sehingga peneliti tidak dapat begitu saja memilih
teknik tersebut. Beberapa teknik mencari reliabilitas yang akan digunakan adalah:

 Spearman-Brown
 Flanagan
 Rulon
 Kuder-Richardson (K-R) 20
 K-R 21
 Hoyt
 Alpha.
Pentingnya Uji Reliabilitas
Dalam penelitian yang menggunakan metoda kuantitatif, kualitas pengumpulan
data sangat ditentukan oleh kualitas instrumen atau alat pengumpul data yang
digunakan. Suatu instrumen penelitian dikatakan berkualitas dan dapat
dipertanggungjawabkan jika sudah terbukti validitas dan reliabilitasnya. Pengujian
validitas dan reliabilitas instrumen, tentunya harus disesuaikan dengan bentuk
instrumen yang akan digunakan dalam penelitian. Reliabilitas adalah tingkat
ketetapan suatu instrumen mengukur apa yang harus diukur. Ada tiga cara
30

pelaksanaan untuk menguji reliabilitas suatu tes, yaitu: (1) tes tunggal (single test),
(2) tes ulang (test retest), dan (3) tes ekuivalen (alternate test).
Rumus Uji Reliabilitas Dengan EXCEL
Reliabilitas Tes Tunggal
Pada bahasan kali ini, kita hanya akan membahas tentang Reliabilitas Tes Tunggal
(Internal Consistency Reliability)
Tes tunggal adalah tes yang terdiri dari satu set yang diberikan terhadap
sekelompok subjek dalam satu kali pengetesan, sehingga dari hasil pengetesan
hanya diperoleh satu kelompok data. Ada dua teknik untuk perhitungan reliabilitas
tes, yaitu:

1. Rumus Uji Reliabilitas Teknik Belah Dua (Split-Half Technique)


Rumus Uji Reliabilitas Teknik Belah Dua dilakukan dengan cara membagi tes
menjadi dua bagian yang relatif sama (banyaknya soal sama), sehingga masing-
masing test mempunyai dua macam skor, yaitu skor belahan pertama (awal / soal
nomor ganjil) dan skor belahan kedua (akhir / soal nomor genap). Koefisien
reliabilitas belahan tes dinotasikan dengan r1/2 1/2 dan dapat dihitung dengan
menggunakan rumus yaitu korelasi angka kasar Pearson. Selanjutnya koefisien
reliabilitas keseluruhan tes dihitung menggunakan formula Spearman-Brown,
yaitu:

Kategori koefisien reliabilitas (Guilford, 1956: 145) adalah sebagai berikut:

0,80 < r11 1,00 reliabilitas sangat tinggi


0,60 < r11 0,80 reliabilitas tinggi
0,40 < r11 0,60 reliabilitas sedang
0,20 < r11 0,40 reliabilitas rendah.
-1,00 r11 0,20 reliabilitas sangat rendah (tidak reliable).
Rumus Uji Reliabilitas Teknik Non Belah Dua (Non Split-Half Technique).
31

Rumus uji Reliabilitas teknik non belah dua: Salah satu kelemahan perhitungan
koefisien reliabilitas dengan menggunakan teknik belah dua adalah (1) banyaknya
butir soal harus genap, dan (2) dapat dilakukan dengan cara yang berbeda sehingga
menghasilkan nilai yang berbeda pula seperti terlihat pada contoh c.1 dan contoh
c.2. Untuk mengatasi masalah tersebut dapat dilakukan dengan menggunakan
teknik non belah dua. Untuk perhitungan koefisien reliabilitas dapat dilakukan
dengan menggunakan rumus Kuder-Richardson (KR-20) dan Kuder-Richardson
(KR-21). Pada Bahasan kali ini kita tidak membahas lebih lanjut tentang Rumus
KR ini, karena akan dijelaskan pada postingan artikel berikutnya: KR 20.

Uji Reliabilitas Tes Uraian


Untuk menghitung uji reliabilitas tes bentuk uraian dapat dilakukan dengan
menggunakan rumus Cronbach-Alpha, yaitu:

2.9 Homogenitas
Uji homogenitas adalah pengujian mengenai sama tidaknya variansi-
variansi dua buah distribusi atau lebih. Uji homogenitas yang akan dibahas
dalam tulisan ini adalah Uji Homogenitas Variansi dan Uji Bartlett. Uji
homogenitas dilakukan untuk mengetahui apakah data dalam variabel X dan
Y bersifat homogen atau tidak.
UJI HOMOGENITAS VARIANSI
32

Langkah-langkah menghitung uji homogenitas :


1. Mencari Varians/Standar deviasi Variabel X dan Y, dengan rumus :

2. Mencari F hitung dengan dari varians X dan Y, dengan rumus :

Catatan:

 Pembilang: S besar artinya Variance dari kelompok dengan variance


terbesar (lebih banyak)
 Penyebut: S kecil artinya Variance dari kelompok dengan variance terkecil
(lebih sedikit)
 Jika variance sama pada kedua kelompok, maka bebas tentukan pembilang
dan penyebut.
3. Membandingkan F hitung dengan Tabel F: F Tabel dalam Excel pada
tabel distribusi F, dengan:
 Untuk varians dari kelompok dengan variance terbesar adalah dk
pembilang n- 1
 Untuk varians dari kelompok dengan variance terkecil adalah dk
penyebut n-1
 Jika F hitung < Tabel F: F Tabel dalam Excel, berarti homogen
 Jika F hitung > Tabel F: F Tabel dalam Excel, berarti tidak homogen
Contoh :

Data tentang hubungan antara Penguasaan kosakata(X) dan kemampuan membaca


(Y):
33

Kemudian dilakukan penghitungan, dengan rumus yang ada:

Kemudian dicari F hitung :

Dari penghitungan diatas diperoleh F hitung 2.81 dan dari grafik daftar distribusi F
dengan dk pembilang = 10-1 = 9. Dk penyebut = 10-1 = 9. Dan α = 0.05 dan F tabel
= 3.18. Tampak bahwa F hitung < Tabel F: F Tabel dalam Excel. Hal ini berarti
data variabel X dan Y homogen.

2.10 Ekuivalensi dan Analisis Item

Setelah perumusan indikator perilaku jelas, maka penulisan item baru dapat
dilakukan. Setiap item mengacu pada satu indikator perilaku tertentu (Azwar,
2009). Tes yang baik adalah tes yang reliabel dan valid. Jika demikian maka
item-item dalam tes itu pun harus baik. Item yang baik adalah item yang reliabel
dan valid, di mana item dapat berfungsi membedakan kemampuan antar
individu penempuh tes (Cohen & Swerdlik, 2005). Untuk mengetahui
karakteristik item yang baik tersebut maka dilakukanlah proses analisis
terhadap item.
34

Analisis item merupakan prosedur statistika yang digunakan untuk


membantu membuat keputusan tentang item-item mana yang baik, mana item
yang perlu direvisi dan mana item yang harus dibuang (Cohen & Swerdlik,
2005). Azwar (2009) juga berpendapat serupa di mana menurutnya analisis item
merupakan proses pengujian parameter item (daya beda dan tingkat kesulitan
item) guna mengetahui apakah item memenuhi persyaratan psikometris untuk
disertakan sebagai bagian dari tes. Lebih lanjut lagi, Azwar (2009) mengatakan
bahwa hasil analisis item menjadi dasar dalam seleksi item, di mana item-item
yang tidak memenuhi syarat psikometris akan disingkirkan atau direvisi terlebih
dahulu.

Teknik untuk melakukan analisis item dapat dilakukan secara kualitatif dan
kuantitatif. Secara garis besar analisis kualitatif dilakukan terkait dengan
validitas isi dan prosedur penulisan yang baik, sedangkan analisis kuantitatif
terkait dengan pengukuran tingkat kesulitan item dan daya beda (Anastasi &
Urbina, 1997). Analisis secara kualitatif dilakukan untuk mengetahui apakah
item telah mewakili domain atau ranah perilaku sesuai dengan konstruk yang
hendak diukur dan apakah dari segi prosedur penulisan, item tersebut sudah
dibuat dengan baik (Anastasi & Urbina, 1997). Untuk melihat apakah item telah
ditulis sesuai dengan indikator perilaku yang hendak diungkap sebaiknya
melibatkan pakar yang memang ahli dalam masalah atribut yang hendak diukur
(Azwar, 2009). Sedangkan, terkait dengan penulisan item, Azwar (2009)
memaparkan beberapa kaidah penulisan item yang baik, diantaranya
menggunakan kalimat yang sederhana, jelas dan mudah dimengerti oleh
responden, namun tetap harus mengikuti tata tulis dan bahasa yang baku,
hindari penafsiran ganda pada kalimat item, penulisan item mengacu pada
indikator perilaku atau pada komponen atribut, oleh karena itu sebaiknya jangan
menulis item yang secara langsung menanyakan atribut yang hendak diungkap,
perhatikan indikator perilaku yang hendak diungkap sehingga stimulus dan
pilihan jawaban tetap relevan dengan tujuan pengukuran, isi item tidak boleh
mengandung social desirability atau item yang sesuai dengan keinginan sosial
pada umumnya atau dianggap baik dari sudut pandang norma sosial karena item
yang mengandung social desirability akan cenderung disetujui oleh semua
35

orang karena orang akan berpikir normatif dan bukan karena sesuai dengan
keadaan dirinya, hindari stereotip jawaban, maka sebaiknya sebagian dari item-
item dibuat dalam arah favorable dan sebagian lagi unfavorable.

Setelah tahap analisis kualitatif selesai, yaitu termasuk setelah terkumpul


jumlah item yang dinilai cukup, di mana menurut Cohen dan Swerdlik (2005)
sebaiknya jumlah item yang dibuat sebanyak 2 kali lipat item akhir yang
direncakaan, sedangkan menurut Azwar (2009) jumlahnya biasanya tiga kali
lipat dari jumlah item akhir yang direncanakan, maka setelah itu item-item
tersebut disusun dalam format semi-final dan siap dilakukan uji coba secara
empiris kepada subjek tes (Azwar, 2009). Setelah dilakukan pengujian empiris
(field-tested) maka hasil uji coba terebut dianalisis dengan teknik analisis
kuantitatif, seperti yang telah dikemukakan sebelumnya, dengan melihat
bagaimana tingkat kesulitan item dan daya bedanya, serta daya pengecoh jika
item tersebut dalam format pilihan ganda.

Pengertian tingkat kesulitan item terkait dengan persentase (proporsi)


orang/subjek yang menjawab benar pada item tertentu. Semakin besar
persentasenya maka berarti semakin banyak orang yang bisa menjawab atau
semakin mudahnya item tersebut (Anastasi & Urbina, 1997).

Teknik selanjutnya, selain analisis tingkat kesulitan item, adalah analisis


terhadap daya beda item. Menurut Anastasi dan Urbina (1997), daya beda item
mengacu pada sejauh mana item dapat membedakan dengan tepat antara peserta
tes yang memiliki kemampuan dengan yang tidak terhadap perilaku yang
menjadi objek pengukuran. Teknik analisis ini dapat dilakukan dengan
perhitungan indeks diskriminasi dengan menggunakan metode kelompok-
kelompok ekstrem dan indeks korelasi (Crocker & Algina, 1986).

Teknik analisis item berikutnya berlaku pada item yang bersifat pilihan
ganda. Menurut Cohen dan Swerdlik (2005), meski tidak menyebutkan istilah
‘Daya Pengecoh’ namun analisis alternatif pilihan jawaban yang dimaksudkan
serupa dengan makna analisis daya pengecoh ini digunakan untuk melihat
apakah alternatif pilihan jawaban yang salah bekerja dengan baik pada subjek
36

yang berada pada upper group dan lower group. Teknik ini dilakukan dengan
cara membandingkan berapa subjek pada upper group dengan lower group yang
memilih masing-masing alternatif jawaban pada item tertentu. Alternatif
jawaban terdiri dari satu jawaban yang benar dan yang dimaksud dengan
jawaban pengecoh adalah beberapa pilihan jawaban lainnya yang salah. Pada
prinsipnya, untuk mengetahui apakah pengecoh berfungsi baik pada suatu item
atau tidak adalah dengan melihat apakah jawaban yang benar (kunci jawaban)
banyak dipilih oleh kelompok subjek yang tergolong dalam upper group
dibanding lower group (Cohen & Swerdlik, 2005).

Seperti yang telah dikemukakan sebelumnya, tes yang baik adalah tes yang
reliabel dan valid, dan dengan begitu sama pula artinya bahwa item tes yang
baik pun yang reliabel dan valid (Cohen & Swerdlik, 2005). Baik-tidaknya
suatu tes tidak dapat mengacu pada berapa jumlah item-item yang ada di
dalamnya. Meski banyaknya item dalam tes dapat saja berpotensi meningkatkan
reliabilitas hasil pengukuran (Azwar, 2009), namun tidak dapat dipastikan
berapa batas jumlah item yang dapat dikatakan membuat tes menjadi tes yang
baik.

Selain itu, meski tes yang dikatakan baik adalah tes yang reliabel dan valid,
namun tes yang baik tidak cukup jika hanya reliabel dan valid saja, tergantung
pula dari kualitas item-item yang membangunnya, apakah item-item tersebut
memiliki fungsi yang sama dengan fungsi pengukuran yaitu dapat membedakan
subjek berkemampuan tinggi dengan yang berkemampuan rendah. Dengan kata
lain, tidak cukup hanya dikatakan bahwa semakin banyak item pada suatu tes
maka tes dapat semakin baik, yang lebih tepat adalah semakin banyak item-item
tes yang baik (secara kualitatif dan kuantitatif seperti yang telah dipaparkan
pada sub-bab sebelumnya) maka semakin baik tes tersebut (Lababa, 2008). Bisa
saja apabila tes dengan jumlah item yang banyak (atau bahkan jumlahnya
sedikit) tetapi hasil analisis terhadap item-item tersebut menunjukkan bahwa
banyak item-item yang tidak berfungsi dengan baik sesuai dengan tujuan
pengukuran, maka tes tersebut tidak dapat dikatakan sebagai tes yang baik.
37

Adaptasi tes sama dengan mengadaptasi pada sejumlah item yang


membangun tes tersebut. Ada beberapa hal yang perlu diperhatikan ketika ingin
melakukan adaptasi tes. International Test Commision (ITC) menyarankan
langkah-langkah yang dianggap cukup baik untuk dapat menjadi panduan
peneliti atau pengembang tes ketika melakukan adaptasi pada sebuah tes
(Hambleton & Patsula, 1999).

Tahapan itu antara lain:

 Yakinkan bahwa terdapat konstruk yang setara dengan konstruk yang ingin
diukur pada budaya dan sesuai bahasa kelompok subjek target tes. Untuk
itu perlu dilakukan konsultasi atau diskusi dengan psikolog atau pakar
dalam konstruk yang dimaksud.

 Putuskan apakah mengadaptasi tes yang sudah ada atau mengembangkan


tes baru. Perhatikan tujuan mengadaptasi tes, keuntungan dan kerugian jika
mengadaptasi dibanding membuat tes baru.

 Pilihlah pakar alih bahasa yang baik atau kredibel. Sebaiknya libatkan lebih
dari seorang pakar ahli bahasa. Selain itu libatkan pula pakar yang ahli
dalam konstruk yang akan diukur.

 Menerjemahkan dan mengadaptasi tes. Gunakan metode forward-backward


translation pada item-item tes, dimana setelah menerjemahkan bahasa asli
tes ke dalam bahasa target adaptasi, lalu terjemahkan kembali bahasa target
adaptasi tersebut ke bahasa asli tes untuk melihat apakah makna dari
maksud item tersebut tidak berbeda.

 Ulas kembali tes yang telah diadaptasi dan lakukan revisi bila perlu.

 Lakukan uji coba terhadap tes yang telah diadaptasi tersebut. Upaya
melakukan uji coba dengan pilot test perlu dilakukan terhadap sejumlah
kecil orang-orang yang memiliki karakteristik serupa dengan subjek yang
sebenarnya.
38

 Lakukan field-test dengan melibatkan subjek yang lebih besar.

 Pilih desain statistika yang tepat untuk mengkaitkan skor hasil tes yang telah
diadaptasi dengan tes aslinya.

 Jika pengembang tes menekankan pada perbandingan antar-budaya,


yakinkan bahwa bahasa pada tes asli dan tes adaptasi adalah setara.

 Lakukan uji validitas pada tes yang diadaptasi.

 Catat seluruh proses konstruksi dalam mengadaptasi hingga pengujian


validitas (tahap 1 hingga 10) dan buatlah manual/ pedoman administrasi tes
yang telah diadaptasi tersebut.

 Latihlah para pengguna tes secara langsung, meskipun telah disediakan


manual administrasi tes.

 Lakukan pemantauan dan evaluasi terhadap tes yang diadaptasi.

A. Teknis Analisis Item

Teknik untuk melakukan analisis item dapat dilakukan secara kualitatif dan
kuantitatif. Secara garis besar analisis kualitatif dilakukan terkait dengan
validitas isi dan prosedur penulisan yang baik, sedangkan analisis kuantitatif
terkait dengan pengukuran tingkat kesulitan item dan daya beda (Anastasi &
Urbina, 1997).

1. Teknik Analisis Secara Kualitatif

Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal
secara kualitatif, diantaranya adalah teknik moderator dan teknik panel. Teknik
moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang
sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara
bersama-sama dengan beberapa ahli seperti guru yang mengajarkan materi, ahli
materi, penyusun atau pengembang kurikulum, ahli penilaian, ahli bahasa,
berlatar belakang psikologi.
39

Teknik ini sangat baik karena setiap butir soal dilihat secara bersama-sama
berdasarkan kaidah penulisannya. Di samping itu, para penelaah dipersilakan
mengomentari berdasarkan kompetensinya masing-masing. Setiap komentar
atau masukan dari peserta diskusi dicatat. Setiap butir soal dapat dituntaskan
secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini
memiliki kelemahan karena memerlukan waktu lama untuk rnendiskusikan
setiap satu butir soal.

Teknik berikutnya adalah Teknik Panel yakni suatu teknik menelaah butir
soal berdasarkan kaidah penulisan butir soal. Kaidah itu diantaranya materi,
konstruksi, bahasa atau budaya, kebenaran kunci jawaban atau pedoman
penskoran. Caranya beberapa penelaah diberikan butir-butir soal yang akan
ditelaah, format penelaahan, dan pedoman penilaian atau penelaahan. Pada
tahap awal, semua orang yang terlibat dalam kegiatan penelaahan disamakan
persepsinya, kemudian mereka berkerja sendiri-sendiri di tempat berbeda. Para
penelaah dipersilakan memperbaiki langsung pada teks soal dan memberikan
komentarnya serta memberikan nilai pada setiap butir soal dengan kriteria: soal
baik, perlu diperbaiki, atau diganti.

Dalam menganalisis butir soal secara kualitatif, penggunaan format


penelaahan soal akan sangat membantu dan mempermudah prosedur
pelaksanaannya. Format penelaahan soal digunakan sebagai dasar untuk
menganalisis setiap butir soal. Format penelaahan soal yang dimaksud adalah
format penelaahan butir soal: uraian, pilihan ganda, instrumen non-tes. Berikut
disajikan keempat format penelaahan butir soal.

a. Format Penelaahan Butir Soal Bentuk Uraian

Mata pelajaran :

Kelas/semester :

Penelaah :
40

No Aspek yang ditelaah Nomor soal

A Materi 1 2 3 4 5 …

1 Soal sesuai dengan indikator (menuntut tes


tertulis untuk bentuk Uraian)

2 Batasan pertanyaan dan jawaban yang


diharapkan sudah sesuai

3 Materi yang ditanyakan sesuai dengan


kompetensi (urgensi, relevansi, kontinuitas,
keterpakaian sehari-hari tinggi)

4 Isi materi yang ditanyakan sesuai dengan


jenjang jenis sekolah atau tingkat kelas

B Konstruksi

1 Menggunakan kata tanya atau perintah yang


menuntut jawaban uraian

2 Ada petunjuk yang jelas tentang cara


mengerjakan soal

3 Ada pedoman penskorannya

4 Tabel, gambar, grafik, peta, atau


41

yang sejenisnya disajikan dengan jelas dan


terbaca

C Bahasa/Budaya

1 Rumusan kalimat komunikatif

2 Butir soal menggunakan bahasa Indonesia yang


baku

3 Tidak menggunakan kata/ungkapan yang


menimbulkan penafsiran ganda atau salah
pengertian

4 Tidak menggunakan bahasa yang berlaku


setempat/tabu

Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

b. Format Penelaahan Butir Soal Bentuk Pilihan Ganda

Mata pelajaran :

Kelas/semester :

Penelaah :

No Aspek yang ditelaah Nomor soal

A Materi 1 2 3 4 5 …
42

1 Soal sesuai dengan indikator (menuntut tes


tertulis untuk bentuk pilihan ganda)

2 Materi yang ditanyakan sesuai dengan


kompetensi (urgensi, relevansi, kontinuitas,
keterpakaian sehari-hari tinggi)

3 Pilihan jawaban homogen dan logis

4 Hanya ada satu jawaban

B Konstruksi

1 Pokok soal dirumuskan dengan singkat, jelas,


dan tegas

2 Rumusan pokok soal dan pilihan jawaban


merupakan pernyataan yang diperlukan saja

3 Pokok soal tidak memberi petunjuk kunci


jawaban

4 Pokok soal bebas dan pernyataan yang bersifat


negatif ganda

5 Pilihan jawaban homogen dan logis ditinjau dari


segi materi
43

6 Gambar, grafik, tabel, diagram, atau sejenisnya


jelas dan berfungsi

7 Panjang pilihan jawaban relatif sama

8 Pilihan jawaban tidak menggunakan pernyataan


"semua jawaban di atas salah/benar" dan
sejenisnya

9 Pilihan jawaban yang berbentuk angka/waktu


disusun berdasarkan urutan besar kecilnya
angka atau kronologisnya

10 Butir soal tidak bergantung pada jawaban soal


sebelumnya

C Bahasa/Budaya

1 Menggunakan bahasa yang sesuai dengan


kaidah bahasa Indonesia

2 Menggunakan bahasa yang komunikatif

3 Tidak menggunakan bahasa yang berlaku


setempat/tabu

4 Pilihan jawaban tidak mengulang


kata/kelompok kata yang sama, kecuali
merupakan satu kesatuan pengertian
44

Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

c. Format Penelaahan untuk Instrumen Non-Tes

Mata pelajaran :

Kelas/semester :

Penelaah :

No Aspek yang ditelaah Nomor soal

A Materi 1 2 3 4 5 …

1 Pernyataan/soal sudah sesuai dengan rumusan


indikator dalam kisi-kisi

2 Aspek yang diukur pada setiap pernyataan sudah


sesuai dengan tuntutan dalam kisi-kisi (misal
untuk tes sikap: aspek koginisi, afeksi, atau
konasi dan pernyataan positif atau negatifnya

B Konstruksi

1 Pernyataan dirumuskan dengan singkat (tidak


melebihi 20 kata) dan jelas

2 Kalimatnya bebas dari pernyaatn yang tidak


relevan objek yang dipersoalkan atau kalimatnya
merupakan pernyataan yang diperlukan saja
45

3 Kalimatnya bebas dari pernyataan yang bersifat


negatif ganda

4 Kalimatnya bebas dari pernyataan yang


mengacu pada masa lalu

5 Kalimatnya bebas dari pernyataan faktual atau


dapat diinterpretasikan sebagai fakta

6 Kalimatnya bebas dari pernyataan yang


mungkin disetujui atau dikosongkan oleh hampir
semua responden

7 Setiap pernyataan hanya berisi satu gagasan


secara lengkap

8 Kalimatnya bebas dari pernyataan yang tidak


pasti pasti seperti semua, selalu, kadang-kadang,
tidak satu pun, tidak pernah

9 Kalimatnya tidak banyak menggunakan kata


hanya, sekedar, semata-mata

C Bahasa/Budaya

1 Bahasa soal harus komunikatif dan sesuai


dengan jenjang pendidikan siswa atau responden

2 Soal menggunakan bahasa Indonesia baku


46

3 Tidak menggunakan bahasa yang berlaku


setempat/tabu

Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

2. Teknis Analisis Secara Kuantitatif


Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan
pada data empirik. Data empirik ini diperoleh dari soal yang telah diujikan. Ada
dua pendekatan dalam analisis secara kuantitatif, yaitu pendekatan secara klasik
dan modern.
Analisis butir soal secara klasik adalah proses penelaahan butir soal
melalui informasi dari jawaban peserta didik tes guna meningkatkan mutu butir
soal yang bersangkutan dengan menggunakan teori tes klasik. Kelebihan analisis
butir soal secara klasik adalah murah, sederhana, familiar, dapat dilaksanakan
sehari-hari dengan cepat menggunakan komputer, dan dapat menggunakan data
dari beberapa peserta didik atau sampel kecil (Millman dan Greene, 1993: 358).
Analisis jenis butir ini yang lazim digunakan dalam praktik di lapangan,
terutama oleh guru disekolah.
Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik adalah
setiap butir soal ditelaah dari segi: tingkat kesukaran butir, daya pembeda butir,
dan penyebaran pilihan jawaban (untuk soal bentuk obyektif) atau fungsi
pengecoh pada setiap pilihan jawaban, reliabilitas dan validitas soal.
1. Tingkat Kesukaran
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu
soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam
bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan
dalam bentuk proporsi yang besarnya berkisar 0,00 - 1,00 (Aiken (1994:
66). Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil
hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK= 0,00
artinya bahwa tidak ada siswa yang menjawab benar dan bila memiliki TK=
1,00 artinya bahwa siswa menjawab benar. Perhitungan indeks tingkat
kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-
47

rata yang diperoleh peserta didik pada butir soal yang bersangkutan
dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan untuk
soal selected response item, yaitu (Nitko, 1996: 310).

𝑇𝑖𝑛𝑔𝑘𝑎𝑡 𝐾𝑒𝑠𝑢𝑘𝑎𝑟𝑎𝑛 (𝑇𝐾)


𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑖𝑠𝑤𝑎 𝑦𝑎𝑛𝑔 𝑚𝑒𝑛𝑗𝑎𝑤𝑎𝑏 𝑏𝑒𝑛𝑎𝑟 𝑏𝑢𝑡𝑖𝑟 𝑠𝑜𝑎𝑙
=
𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑖𝑠𝑤𝑎 𝑦𝑎𝑛𝑔 𝑚𝑒𝑛𝑔𝑖𝑘𝑢𝑡𝑖 𝑡𝑒𝑠

Atau dengan menggunakan rumus:

𝐵
𝑃=
𝑁

P = proporsi (indeks kesukaran)


B = jumlah siswa yang menjawab benar
N = jumlah peserta tes
Tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes.
Misalnya untuk keperluan ujian semester digunakan butir soal yang
memiliki tingkat kesukaran sedang, untuk keperluan seleksi digunakan butir
soal yang memiliki tingkat kesukaran tinggi atau sukar, dan untuk keperluan
diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran
rendah atau mudah.
Klasifikasi tingkat kesulitan soal dapat menggunakan kriteria berikut:
No Range Tingkat Kategori Keputusan
Kesukaran
1 0,8-1,0 Mudah Ditolak/direvisi
2 0,3-0,7 Sedang Diterima
3 0,0-0,3 Sulit Ditolak/direvisi

Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan


bagi guru dan kegunaan bagi pengujian dan pengajaran (Nitko, 1996: 310-
313). Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep
terhadap pembelajaran ulang dan memberi masukan kepada siswa tentang
hasil belajar mereka, (2) memperoleh informasi tentang penekanan
kurikulum atau mencurigai terhadap butir soal yang bias. Adapun
48

kegunaannya bagi pengujian dan pengajaran adalah: (a) pengenalan konsep


yang diperlukan untuk diajarkan ulang, (b) tanda-tanda terhadap kelebihan
dan kelemahan pada kurikulum sekolah, (c) memberi masukan kepada
siswa, (d) tanda-tanda kemungkinan adanya butir soal yang bias, (e) merakit
tes yang memiliki ketepatan data soal.

Contoh : Tes formatif IPA, 10 soal bentuk pilihan ganda, option 4, dengan
proporsi 2 soal mudah, 6 soal sedang dan 2 soal sukar, jumlah siswa = 20
orang.

No Kemampuan Judgment Jumlah siswa Nilai indeks Keteranagn


yang diukur p soal yang kesukaran indeks
menjawab kesukaran

1 Pengetahuan Mudah 18 0,90 Mudah

2 Pengetahuan Mudah 12 0,60 Sedang

3 Pemahaman Sedang 10 0,50 Sedang

4 Aplikasi Sedang 12 0,60 Sedang

5 Aplikasi Sedang 9 0,45 Sedang

6 Pemahaman Sedang 20 1,00 Mudah

7 Analisa Sedang 6 0,30 Sukar

8 Pemahaman Sedang 10 0,50 Sedang


49

9 Sintesa Sukar 4 0,20 Sukar

10 Sintesa Sukar 9 0,45 Sedang

Dalam mencari indeks kesukaran menggunakan rumus yang telah ditulis di


atas:

𝐵 18
𝑃= = = 0,90
𝑁 20

Dari contoh di atas diperoleh hasil, yaitu : soal nomor 1, 3, 4, 5, 8


dan 9, terdapat kesesuaian antara judgement dengan hasil analisa, soal
nomor 2 yang di judgement mudah ternyata termasuk soal sedang, soal
nomor 6 yang di judgement sedang ternyata termasuk soal mudah, soal
nomor 7 yang dijudgement sedang, ternyata termasuk sukar dan soal nomor
10 yang dijudgement sukar, ternyata termasuk soal sedang.

Atas dasar hasil di atas, soal yang harus diperbaiki adalah:

Soal nomor 2, diturunkan ke dalam kategori mudah,

Soal nomor 6, dinaikkan ke dalam kategori sedang,

Soal nomor 7 diturunkan ke dalam kategori sedang,

Soal nomor 10, dinaikkan ke dalam kategori sukar.

2. Daya Pembeda

Daya pembeda soal adalah kemampuan suatu butir soal dapat


membedakan antara siswa yang menguasai materi yang ditanyakan dan
siswa yang belum menguasai materi yang diujikan. Daya pembeda butir soal
memiliki manfaat berikut. Pertama untuk meningkatkan mutu setiap butir
soal melalui data empiriknya. Berdasarkan indeks daya pembeda, setiap
butir soal dapat diketahui apakah butir soal itu baik, direvisi atau ditolak.
50

Kedua, untuk mengetahui seberapa jauh masing-masing soal dapat


mendeteksi atau membedakan kemampuan siswa, yaitu siswa yang telah
memahami atau belum memahami materi yang diajarkan guru. Apabila
suatu soal tidak dapat membedakan kedua kemampuan siswa itu maka butir
soal itu dapat dicurigai kemungkinannya: a) Kunci jawaban butir soal itu
tidak tepat. b) Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar.
c) Kompetensi yang diukur tidak jelas. d) Pengecoh tidak berfungsi. e)
Materi yang ditanyakan terlalu sulit, sehingga banyak siswa yang menebak
dan f) Sebagian besar siswa yang memahami materi yang ditanyakan
berpikir ada yang salah informasi dalam butir soalnya.

Untuk menentukan daya pembeda dibedakan menjadi kelompok


kecil (kurang dari 100 orang) dan kelompok besar (100 orang ke atas).

a) Untuk kelompok kecil

Seluruh kelompok test dibagi dua sama besar, 50% kelompok atas dan
50% kelompok bawah.

b) Untuk Kelompok Besar


51

Mengingat biaya dan waktu untuk menganalisis, maka untuk


kelompok besar biasanya hanya di ambil kedua kutubnya saja, yaitu
27% skor teratas sebagai kelompok atas ( JA) dan 27% skor terbawah
sebagai kelompok bawah (JB ).

JA = jumlah kelompok atas


JB = jumlah kelompok bawah
52

Hasil perhitungan dengan menggunakan rumus di atas dapat


menggambarkan tingkat kemampuan soal dalam membedakan antar peserta
tes yang sudah memahami materi yang diujikan dengan peserta tes yang
belum atau tidak memahami materi yang diujikan. Adapun klasifikasinya
sebagai berikut :
D = 0,00 – 0,20 = jelek (poor)
D = 0,20 – 0,40 = cukup (satisfactory)
D = 0,40 – 0,70 = baik (good)
D = 0,70 – 1,00 = baik sekali (excellent)
D = negative, semuanya tidak baik, jadi semua butir soal yang mempunyai
nilai D negative sebaiknya di buang saja.

Contoh perhitungan: Dari hasil analisis tes yang terdiri dari 10 butir soal
yang dikerjakan oleh 14 orang siswa, terdapat dalam tabel sebagai berikut :
53

Dari angka-angka yang belum teratur kemudian dibuat array (urutan


penyebaran), dari skor yang paling tinggi ke skor yang paling rendah.
Kelompok atas Kelompok bawah
10 6
8 6
8 6
7 5
7 5
7 5
7 3
7 orang 7 orang

Array ini sekaligus menunjukkan adanya kelompok atas (JA ) dan


kelompok bawah (JB) dengan pemiliknya sebagai berikut:

Kelompok atas (JA) Kelompok bawah (JB)


54

B=7 A = 5
C=8 D = 5
E = 10 F = 6
I=8 G = 6
J=7 H = 6
K=7 L = 5
N=7 M=3
7 orang 7 orang

Perhatikan pada tabel analisis 10 butir soal 14 siswa.


Di belakang nama siswa di tuliskan huruf A atau B sebagai tanda
kelompok. Hal ini untuk mempermudah menentukan BA dan BB
BA = Banyaknya siswa yang menjawab benar pada kelompok atas (A)
BB = Banyaknya siswa yang menjawab benar pada kelompok bawah (B)

Sudah disebutkan diatas bahwa soal yang baik adalah soal yang
dapat membedakan antara anak pandai dan anak kurang pandai, dilihat dari
dapat dan tidaknya megerjakan soal itu.

Marilah kita lihat kita perhatikan analisis lagi, khusus untuk butir soal
nomor 1.

 Dari kelompok atas yang dapat menjawab betul 8 orang.


 Dari kelompok bawah yang menjawab betul 3 orang.

Kita tetapkan dalam rumus diskriminasi:


55

Dengan demikian maka indeks diskriminasi untuk soal ni 1 adalah 0,5.


Sekarang kita perhatikan butir soal nomor 8 :

Butir soal ini jelek karena lebih banyak di jawab benar oleh
kelompok bawah dibandingkan dengan jawaban benar dari kelompok atas.
Ini berarti bahwa untuk menjawab soal dengan benar, dapat dialakukan
dengan menebak. Butir soal yang baik adalah butir-butir soal yang
mempunyai indeks diskriminasi 0,4 sampai 0,7.

3. Teknik Analisis Fungsi Distraktor


Pada saat membicarakan tentang tes obyektif bentuk multiple choice
item telah dikemukakan bahwa pada tes obyektif multiple choice item
tersebut untuk setiap butir item yang dikeluarkan dalam tes telah dilengkapi
dengan beberapa kemungkian jawaban atau yang sering dikenal dengan
istilah option atau alternative.
Option atau alternatif itu jumlahnya berkisar antara tiga smpai
dengan lima buah, dan dari kemungkinan – kemungkinan jawab yang
56

terpasang pada setiap pada setiap butir item itu salah satunya adalah
merupakan jawaban betul atu disebut dengan kunci jawaban, sedangakan
sisanya adalah merupakan jawaban salah. Jawaban – jawaban salah itulah
yang bisa dikenal denag istilah distraktor (distraktor merupakan jawaban
pengecoh).
Tujuan utama dari pemasangan distraktor pada setiap butir item itu
adalah agar dari sekian banyak test, yang mengikuti tes ada yang tertarik
memilihnya, sebab mereka menyangka bahwa distraktor yang mereka pilih
itu merupakan jawaban betul. Jadi mereka terkecoh, menganggap bahwa
distraktor yang terpasang pada item itu sebagai kunci jawaban item, pada
hal bukan. Tentu saja, makin banyak siswa yang terkecoh, maka kita dapat
menyatakan bahwa distraktor itu semakin dapat menjalankan
fungsinyadengan sebaik – baiknya. Sebaliknya, apabila distraktor yang
dipasang pada setiap butir item itu tidak laku maksudnya tak ada seorang
pun dari sekian banyak testee yang merasa tertarik atau terangsang untuk
memilih distraktor tersebut sebagai jawaban betul, maka hal ini
mengandung makna bahwa distraktor tersebut tidak menjalankan fungsinya
dengan baik.
Berikut ini dikemukakan sebuah contoh bagaimana cara
menganalisis fungsi distraktor. Misalnya tes dibidang studi pendidikan
moral pancasila diikuti oleh 50 siswa madrasah tsanawiyah. Bentuk soalnya
adalah multiple choice dengan item sebanyak 40 butir, dimana setiap butir
item dilengkapi dengan lima alternatif yaitu A,B,C,D dan E. dari 40 butir
item tersebut diatas, khusus untuk butir item no 1, 2, dan 3.
Dengan pola penyebaran jawaban item sebagaimana tergambar pada
analisis di atas maka dengan mudah dapat diketahui, berapa persen testee
yang telah terkecoh untuk memilih distraktor yang dipasangkan pada item
1, 2 dan 3 yaitu :
1. Untuk kunci jawaban adalah E, sedangkan pengecoh/distraktornya
adalah A, B, C, dan D.
57

Pengecoh A dipilih oleh 4 orang, berarti 4/50 * 100% = 8%. Jadi


pengecoh A sudah dapat menjalankan fungsinya dengan baik, sebab
angka persentasenya sudah lebih dari 5%.
Pengecoh B dipilih oleh 6 orang , berarti 6/50 * 100% = 12% maka
distraktornya berfungsi dengan baik.
Pengecoh C dipilih oleh 5 orang , berarti 5/50 * 100% = 10% maka
distraktornya berfungsi dengan baik.
Pengecoh D dipilih oleh 5 orang , berarti 5/50 * 100% = 10% maka
distraktornya berfungsi dengan baik.
Jadi keempat pengecoh yang dipasangkan pada item nomor 1 itu sudah
dapat menjalankan fungsinya dengan sebaik – baiknya.
2. Untuk item no 2, kunci jawaban adalah C, sedangkan pengecohnya
adalah A, B, D dan E.
Pengecoh A dipilih oleh 1orang, berarti 1/50 * 100% = 2%. Jadi
pengecoh A belum dapat menjalankan fungsinya dengan baik, sebab
angka persentasenya kurang dari 5%.
Pengecoh C dipilih oleh 2 orang , berarti 2/50 * 100% = 4% maka
distraktornya tidak berfungsi dengan baik.
Pengecoh D dipilih oleh 1 orang , berarti 1/50 * 100% = 2% maka
distraktornya tidak berfungsi dengan baik.
Pengecoh E dipilih oleh 2 orang , berarti 2/50 * 100% = 4% maka
distraktornya tidak berfungsi dengan baik.
Jadi keempat pengecoh yang dipasangkan pada item nomor 2 itu belum
dapat dijalankan fungsinya seperti yang diharapkan.
3. Untuk item nomor 3, kunci jawaban adalah A, sedangkan pengecohnya
adalah C, B, D, dan E.
Pengecoh A,B dan D masing – masing dipilih oleh 1 orang berarti 1/50
* 100% = 2% jadi tiga buah pengecoh itu belum berfungsi.
Pengecoh E dipilih oleh 37 orang, berarti 37 /50* 100% = 74% maka
distraktornya berfungsi dengan baik.
Untuk butir item nomor 1 siswa yang menjawab benar sebanyak 30
orang, berarti indeks kesukaran itemnya (P) = 30/50 = 0,60 (drajat
58

kesukaran itemnya baik, yaitu terletak antara 0,30 sampai 0,70). Untuk
butir item nomor 2, jumlah siswa yang jawabannya betul adalah 44
orang, berarti angka indeks kesukaran itemnya = 44/50 = 0,88 (butir
item nomor 2 ini termasuk kategori terlalu mudah). Sedangkan butir
item nomor 3 dijawab betul oleh 10 orang siswa: berarti angka indeks
kesukarannya itemnya = 10/50 = 0,20 (butir item nomor 3 termasuk
kategori terlalu sukar).

B. Tujuan dan manfaat menganalisis butir soal


Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harus
dilakukan guru untuk meningkatkan mutu soal yang telah ditulis. Kegiatan ini
merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari
jawaban siswa untuk membuat keputusan tentang setiap penilaian. Soal yang
bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya sesuai
dengan tujuannya di antaranya dapat menentukan peserta didik mana yang
sudah atau belum menguasai materi yang diajarkan guru.

Tujuan menganalisis butir soal adalah :

1. Untuk mengkaji dan menelaah setiap butir soal agar diperoleh soal yang
bermutu sebelum soal digunakan.
2. Untuk membantu meningkatkan tes melalui revisi atau membuang soal
yang tidak efektif, serta untuk mengetahui informasi diagnostik pada siswa
apakah mereka sudah/belum memahami materi yang telah diajarkan.

Manfaat dari kegiatan menganalisis butir soal, diantaranya adalah:

1. Dapat membantu para pengguna tes dalam evaluasi atas tes yang
digunakan,
2. Sangat relevan bagi penyusunan tes informal dan lokal seperti tes yang
disiapkan guru untuk siswa dikelas,
3. Mendukung penulisan butir soal yang efektif,
4. Secara materi dapat memperbaiki tes di kelas,
5. Meningkatkan validitas soal dan reliabilitas
59

6. Menentukan apakah suatu fungsi butir soal sesuai dengan yang


diharapkan,
7. Memberi masukan kepada guru tentang kesulitan siswa,
8. Memberi masukan pada aspek tertentu untuk pengembangan kurikulum,
9. Merevisi materi yang dinilai atau diukur,
10. Meningkatkan keterampilan penulisan soal

Menganalisis butir soal dapat dilakukan secara kualitatif maupun


kuantitatif. Analisis secara kualitatif biasanya yang ditelaah antara lain dari
segi materi, konstruksi, bahasa/budaya, kebenaran kunci jawaban atau
pedoman penskorannya. Sedangkan analisis secara kuantitatif, yang ditelaah
adalah tingkat kesukaran butir soal, daya pembeda butir soal, dan penyebaran
pilihan jawaban (untuk soal bentuk obyektif) atau frekuensi jawaban pada
setiap pilihan jawaban.

Untuk menganalisis secara kuantitatif, terutama untuk jenis soal (1)


gabungan antara soal pilihan ganda dan Uraian, atau (2) soal uraian saja, maka
dalam proses penghitungannya kita dapat menggunakan kalkulator, atau
memanfaatkan kelebihan dari program computer. Program computer yang
sudah dikenal secara umum, seperti EXCEL, SPSS, atau program khusus
seperti ITEMAN, RASCAL, ASCAL, BILOG, FACETS tentunya dapat kita
manfaatkan sebesar-besarnya. Akan tetapi, dari sekian program computer yang
ada, ternyata program excel yang paling banyak digunakan oleh sebagian besar
guru, karena sudah memasyarakat dikalangan guru (Hidayat, 2021).
BAB III

PENUTUP
3.1 Kesimpulan
Instrument penelitian adalah alat yang digunakan untuk mengumpulkan
data dalam penelitian, intrumen penelitian dibuat sesai dengan tujuan
pengukuran dan teori yang digunakan sebagai dasar. Instrumen
penelitian dibuat untuk satu tujuan penelitian tertentu yang tidak bisa
digunakan oleh peneliti yang lain, sehingga peneliti harus merancang
sendiri instrumen yang akan digunakan. Selain membuat instrumen
sendiri, untuk mengumpulkan data dalam suatu penelitian, dapat
digunakan instrumen yang telah tersedia (instrumen baku). Ada
beberapa teknik yang dapat digunakan untuk menganalisis butir soal
secara kualitatif, diantaranya adalah teknik moderator dan teknik panel.
Teknik moderator merupakan teknik berdiskusi yang di dalamnya
terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap
butir soal didiskusikan secara bersama-sama dengan beberapa ahli
seperti guru yang mengajarkan materi, ahli materi, penyusun atau
pengembang kurikulum, ahli penilaian, ahli bahasa, berlatar belakang
psikologi.
3.2 Saran
3.2.1 Untuk Penulis
Kami Selaku penulis menyarankan perlu adanya penambahan
wawasan atau pengetahuan terkait dengan instrume penelitian ini
3.2.2 Untuk Pembaca/Masyarakat
Dengan ini kami menyarankan kepada pembaca khususnya perawat
agar mengetahui tentang instrumen penelitian
3.2.3 Untuk Instansi
Berkaitan dengan penulisan makalah ini, kami sangat membutuhkan
atau perlu adanya penelitian lebih lanjut tentang penulisan makalah
ini agar bisa lebih baik lagi dan bisa menjadi panutan bagi orang
banyak nantinya. Dan dapat memahami tentang instrumen

60
61

penelitian,serta dapat menjadi acuan bagi perawat atau mahasiswa


yang akan melakukan penelitian.
DAFTAR PUSTAKA
Ekonomi, H. N.-A.-M. J. I., & 2016, U. (2016). Instrumen penelitian dan
urgensinya dalam penelitian kuantitatif. Repo.Iain-Padangsidimpuan.Ac.Id.
http://repo.iain-padangsidimpuan.ac.id/326/1/416-1276-1-PB.pdf
Hidayat, A. (2021). Menyusun Instrumen Penelitian & Uji Validitas-Reliabilitas.
https://books.google.com/books?hl=id&lr=&id=0dAeEAAAQBAJ&oi=fn
d&pg=PA8&dq=INSTRUMEN+PENELITIAN&ots=4AAN9mfAyb&sig
=FWGq9rxSTXHeNaDE6G3NQqQgd0o
Internasional, H. A.-P. S. N. &, & 2017, undefined. (n.d.). Teknik Pengembangan
Instrumen Penelitian Ilmiah Di Perguruan Tinggi Keagamaan Islam.
Jurnal.Unimus.Ac.Id. Retrieved October 2, 2022, from
https://jurnal.unimus.ac.id/index.php/psn12012010/article/view/3054
kebudayaan, B. S. (2017). Konsep instrumen penelitian pendidikan.
Researchgate.Net. https://www.researchgate.net/profile/Baso-Intang-
Sappaile/publication/338630469_KONSEP_INSTRUMEN_PENELITIAN
_PENDIDIKAN/links/5e206c1292851cafc38a7232/KONSEP-
INSTRUMEN-PENELITIAN-PENDIDIKAN.pdf
Novikasari, I. (2017). Uji Validitas Instrumen. Seminar Nasional Riset Inovatif
2017, 1(1), 530–535.
Pembelajaran, A. T. (2019). Validitas Instrumen Penelitian.
Theory Related validity dan criteria related validity. (2015). 1–2.

Anda mungkin juga menyukai