Makalah Kel. 2

MAKALAH
Konsep Validitas, Reliabilitas, dan Daya Beda

Untuk Memenuhi Tugas Mata Kuliah Asesmen Psikologis: Teknik Tes
Dosen Pengampu : Irene Maya Simon, S.Pd., M.Pd
Anggota Kelompok 2 :
MAFRIKHAH UYUNNIMAH 200111600490

NURIL RAHMADIYAH 200111600427
SEKAR ELFA RIANI 200111600460
PROGRAM STUDI S1 BIMBINGAN DAN KONSELING

FAKULTAS ILMU PENDIDIKAN
UNIVERSITAS NEGERI MALANG
2021
KATA PENGANTAR
Assalamu’alaikum Wr. Wb.

Alhamdulillah, segala puji bagi Allah S.W.T., Tuhan Yang Maha Esa, pada
akhirnya kami dapat menyelesaikan tugas makalah yang berjudul “Konsep Validitas,
Reliabilitas dan Daya Beda” ini telah diselesaikan sesuai dengan waktu yang
ditetapkan. Adapun tujuan dari penulisan dari makalah ini adalah untuk memenuhi
tugas pada mata kuliah Teori dan Pengembangan Multimedia BK. Selain itu, makalah
ini juga bertujuan untuk menambah wawasan bagi para pembaca dan juga bagi
penulis.
Makalah ini disusun dengan mengacu pada beberapa sumber bacaan dan akses
internet. Tulisan ini sebagian besar hanyalah kutipan-kutipan dari beberapa sumber
sebagaimana yang tercantum dalam Daftar Pustaka, dengan beberapa ulasan pribadi.
Ulasan pribadi sifatnya hanyalah analisis dan sintesis dari beberapa kutipan yang
berasal dari bahan bacaan.
Pada kesempatan ini, penulis ingin mengucapkan terima kasih yang yang sebesar-
besarnya kepada dosen yang telah membantu penulis dalam menyelesaikan
penyusunan makalah tentang “Konsep Validitas, Reliabilitas, dan Daya Beda”,
Semoga dengan adanya makalah ini, dapat membantu memenuhi nilai tugas yang
diberikan dosen pengajar.
Dengan ini penulis mengharapkan kritik dan saran para pembaca yang nantinya
akan kami jadikan sebagai bahan perbaikan di kemudian hari. Mudah mudahan
makalah sederhana ini dapat dipahami oleh semua orang. Dan kami mohon maaf jika
ada kata kata yang kurang berkenan. Akhir kata, semoga makalah ini dapat
bermanfaat bagi kita semua dan semoga Allah SWT selalu memberikan rahmat dan
ridho-Nya kepada kita.
Wassalamu’alaikum Wr. Wb.
Malang, 21 September 2021
Penyusun
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan evaluasi
sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga hasil
pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur.
Instrumen ini memang harus memiliki akurasi ketika digunakan. Konsisten dan stabil
dalam arti tidak mengalami perubahan dari waktu pengukuran satu ke pengukuran
yang lain.
Data yang kurang memiliki validitas , akan menghasilkan kesimpulan yang bisa,
kurang sesuai dengan yang seharusnya, dan bahkan bisa saja bertentangan dengan
kelaziman. Untuk membuat alat ukur instrumen itu, diperlukan kajian teori, pendapat
para ahli serta pengalaman-pengalaman yang kadangkala diperlukan bila definisi
operasional variabelnya tidak kita temukan dalam teori. Alat ukur atau instrumen
yang akan disusun itu tentu saja harus memiliki validitas , agar data yang diperoleh
dari alat ukur itu bisa reliabel, valid dan disebut dengan validitas.
Tes biasanya dilakukan dengan cara memberikan pertanyaan yang berupa soal
pilihan ganda maupun bentuk soal uraian. Oleh karena itu, ciri-ciri soal yang baik
dijadikan sebagai alat ukur harus memenuhi beberapa persyaratan untuk melakukan
tes, yaitu antara lain validitas, reliabilitas, dan daya pembeda.
Penyusunana soal yang baik harus disususun secara prinsip dan prosedur soal
yang baik. Sehingga untuk mengetahui apakah soal yang dibuat itu baik atau tidak,
maka perlu dilakukan analisis butir soal. Validitas yang dimaksutkan untuk
menyatakan sejauh mana data yang ditampung pada suatu soal yang diaman akan
diukur apa yang diukur. Sehingga validitas bisa dikatakan dengan berdasarkan
pengukuran. Bahwa reliabilitas berhubungan dengan kemampuan alat ukur untuk
melakukan pengukuran secara cermat, yang dimana reliabilitas merupakan alat ukur
dalam melakukan pengukuran. Oleh karena itu, reliabilitas mendasari pengukuran
pengukuran yang mungkin terjadi pada suatu proses pengukuran.
Kemampuan tinggi yang ditunjukkan dengan perolehan skor yang tinggi dan
kemampuan rendah ditunjukkan dengan perolehan skor yang rendah. Sehingga, daya
pembeda sebagai alat pengukuran butir soal yang dilakukan untuk membedakan
kepada anak berprestasi tinggi dan anak berprestasi rendah. Tingkat kesukaran item
digunakan untuk mengukur tingkat kemudahan dan kesukaran soal. Jadi, tingkat
kesukaran merupakan suatu soal yang menunjukan tingkat kesukaran atau kemudahan
suatu soal.
1.2 Rumusan Masalah
1. Bagaimana pengertian konsep validitas, reliabilitas dan daya beda?

2. Apa saja jenis dan bentuk dari validitas dan reliabilitas?
3. Apa saja prinsip reliabilitas?
4. Bagaimana langkah-langkah pengujian validitas data?
5. Apa saja tujuan dari reliabilitas dan daya beda?
6. Apa saja faktor yang mempengaruhi daya beda?
7. Apa saja manfaat dari daya beda?
8. Bagaimana cara menentukan daya beda?
1.3 Tujuan
Tujuan yang ingin dicapai dari disusunnya makalah ini secara umum adalah agar
setiap pembaca memhami konsep Validitas, Reliabilitas, dan Daya Beda. Yang
didalamnya memuat :
1. Pengertian konsep validitas, reliabilitas dan daya beda.
2. Jenis dan bentuk dari validitas dan reliabilitas.
3. Prinsip reliabilitas.
4. Langkah-langkah pengujian validitas data.
5. Tujuan dari reliabilitas dan daya beda.
6. Faktor yang mempengaruhi daya beda.
7. Manfaat dari daya beda.
8. Cara menentukan daya beda.
DAFTAR ISI
MAKALAH 1
KATA PENGANTAR 2
BAB 1 3
PENDAHULUAN 3
1.1 Latar Belakang 3
1.2 Rumusan Masalah 4
1.3 Tujuan 4
BAB 2 6
PEMBAHASAN 6
2.1 Validitas 6
2.1.1 Pengertian Validitas 6
2.1.2 Jenis Validitas 7
2.1.3 Prinsip Validitas 9
2.1.4 Langkah-Langkah Pengujian Validitas Data 10
2.2 Reliabilitas 12
2.2.1 Pengertian Reliabilitas 12
2.2.2 Tujuan Reliabilitas 14
2.2.3 Karakteristik Reliabilitas 15
2.2.4 Pengujian Reliabilitas Instrumen 15
2.2.5 Faktor yang Mempengaruhi Reliabilitas 17
2.2.6 Rumus Reliabilitas Instrumen 17
2.3 Daya Beda 20
2.3.1 Pengertian Daya Beda 20
2.3.2 Tujuan Daya Beda 21
2.3.3 Manfaat Daya Beda 21
2.3.4 Cara Menentukan Daya Beda 22
2.4 Studi Kasus 30
BAB 3 35
PENUTUP 35
3.1 Kesimpulan 35
3.2 Saran 36
DAFTAR PUSTAKA 37
BAB 2
PEMBAHASAN
2.1 Validitas
2.1.1 Pengertian Validitas
Pengertian validitas menurut para ahli :
1. Sudjana (2004:12) Pengertian validitas menurut Sudjana adalah ketepatan

alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa
yang harus dinilai.
2. Suryabrata (2000:41) Pengertian validitas menurut Suryabrata adalah derajat
fungsi pengukuran suatu tes, atau derajat kecermatan ukurnya sesuatu tes.
Validitas suatu tes mempermasalahkan apakah tes tersebut benar-benar
mengukur atap yang hendak diukur.
3. Azwar (1987:173) Pengertian validitas menurut Azwar adalah sejauh mana
ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan
fungsi ukurnya. Suatu tes dikatakan memiliki validitas yang tinggi apabila
alat tersebut menjalankan fungsi ukur secara tepat atau memberikan hasil
ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut.
4. Arikunto (1999:65) Pengertian validitas menurut Arikunto adalah suatu
ukuran yang menunjukkan tingkat kesahihan suatu tes. Suatu tes dikatakan
valid apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki
validitas yang tinggi jika hasilnya sesuai denga kriteria, dalam arti memiliki
kesejajaran antara tes dan kriteria.
5. Neuman (2007) Pengertian validitas menurut Neuman adalah menunjukkan
keadaan yang sebenarnya dan mengacu pada kesesuaian antara konstruk, atau
cara seorang peneliti mengkonseptualisasikan ide dalam definisi konseptual
dan suatu ukuran. Hal ini mengacu pada seberapa baik ide tentang realitas
“sesuai” dengan realitas aktual. Dalam istilah sederhana, validitas membahas
pertanyaan mengenai seberapa baik realitas sosial yang diukur melalui
penelitian sesuai dengan konstruk yang peneliti gunakan untuk
memahaminya.
6. Anastasia dan Urbina (1998) Pengertian validitas menurut Anastasia dan
Urbina adalah mengenai apa dan seberapa baik suatu alat tes dapat
mengukur, sedangkan reliabilitas merujuk pada konsistensi skor yang dicapai
oleh orang yang sama ketika diuji berulang kali dengan tes yang sama pada
kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen
(equivalent items) yang berbeda, atau dibawah kondisi pengujian yang
berbeda.
Berdasarkan pendapat-pendapat ahli di atas, dapat diambil simpulan bahwa

validitas data adalah suatu kecermatan atau ketepatan suatu alat ukur dalam mengukur
sesuatu atau secara khusus mengukur data penelitian. Validitas data sendiri digunakan
untuk mengukur benar atau salah mengenai data yang digunakan pada suatu
penelitian yang bersifat kuantitatif.
2.1.2 Jenis Validitas
Jenis validitas data dibagi menjadi dua (2), yaitu validitas logis dan empiris.
Penjelasan mengenai validitas logis dan empiris seperti di bawah ini.
1. Validitas Logis
Istilah validitas logis mengandung kata logis, berasal dari kata “logika” yaitu
penalaran. Dengan demikian dapat dikatakan bahwa validitas logis merujuk pada
kondisi instrumen valid berdasarkan hasil penalaran (Arikunto, 2008:65).Secara
umum, validitas tes dibagi menjadi tiga (3) jenis, yaitu, validitas isi, berdasar kriteria,
dan konstruk. Penjelasannya adalah sebagai berikut.
a) Validitas isi (content validity)

Ary (dalam Sujarwadi, 2011) menjelaskan bahwa validitas isi adalah
hubungan isi dengan item atau pertanyaan-pertanyaan di dalam tes yang
representatif dari semua domain-domain isi pelajaran atau sesuai dengan tujuan
instruksional khusus yang telah ditentukan sebelumnya.
Validitas isi berkaitan dengan butir-butir pernyataan yang tersusun dalam
kuesioner atau tes sudah mencakup semua materi yang hendak diukur. Misalnya,
seorang peneliti ingin meneliti mengenai gaya kepemimpinan kepala sekolah
dalam era Manajemen Berbasis Sekolah (MBS). Untuk tujuan tersebut, peneliti
harus melakukan kajian literatur mengenai gaya-gaya kepemimpinan kepala
sekolah pada era MBS. Berdasarkan literatur tersebut, peneliti menyusun
kuesioner pada beberapa bagian, seperti di bawah ini.
Bagian 1: informasi demografis (latar belakang responden)
Bagian 2: gaya kepemimpinan distributif
Bagian 3: gaya kepemimpinan autentik
Bagian 4: gaya kepemimpinan moral
Bagian 5: gaya kepemimpinan transformasional
Bagian 6: gaya kepemimpinan situasional
(Budiastuti & Bandur, 2018:147).
b) Validitas berdasarkan kriteria (criterion-related validity)

Validitas kriteria adalah suatu ukuran validitas yang ditentukan dengan
adanya pembandingan skor-skor tes yang telah didapatkan dengan suatu kinerja
tertentu pada sebuah ukuran luar. Ukuran luar dari tes tersebut harus memiliki
hubungan secara teoretis dengan variabel yang diukur menggunakan tes tersebut.
Validitas kriteria atau criterion validity adalah validitas yang berkaitan
dengan alat apakah alat pengukuran sudah tepat dengan dan sesuai dengan
instrumen pengukuran lainnya yang dianggap sebagai model atau telah dipakai
secara luas dalam bidang ilmu tertentu. Dalam konteks ini, peneliti perlu
membandingkan instrumen penelitian yang baru dengan instrumen penelitian
lainnya (Budiastuti & Bandur, 2018:146).
c) Validitas konstruk (construct validity)

Validitas konstruk merujuk pada kualitas alat ukur yang digunakan apakah
sudah benar-benar menggambarkan konstruk teoritis yang digunakan sebagai
dasar operasionalisasi ataukah belum. Secara singkat, dapat dikatakan bahwa
validitas konstruk adalah penilaian tentang seberapa baik seorang peneliti
menerjemahkan teori yang digunakan dalam alat ukur tersebut (Widodo, 2006:3).
Budiastuti & Bandur (2018:148) menjelaskan bahwa validitas ini berkaitan
dengan apakah alat penelitian yang dipakai telah disusun berdasarkan kerangka
(construct) teoretis yang tepat dan relevan. Kuesioner yang memiliki validitas
konstruk tinggi selalu berdasarkan definisi atau batasan para ahli tentang konsep
tersebut, bukan pada definisi kamus.
Construct Validity digunakan jika: Tes homogenous, mengukur konstruk
tunggal, Skor tes ditentukan usia partisipan, atau waktu pelaksanaan, atau tes
yang digunakan mengukur proses mental dalam eksperimen sesuai dengan
teori tertentu.
2. Validitas Empiris
Arikunto (2008:66) menjelaskan bahwa istilah validitas empiris memuat kata
empiris yang artinya pengalaman. Sebuah instrumen dapat dikatakan memiliki
validitas empiris apabila sudah diuji secara empiris. Pada validitas empiris dibagi
menjadi dua (2), yaitu validitas internal dan eksternal. Penjelasannya seperti di bawah
ini.
a) Validitas internal
Validitas internal atau internal validity menyatakan seberapa jauh kecocokan

sesuatu yang diamati, diukur, dan dianalisis dengan realitas. Artinya, validitas
internal itu merujuk pada kesesuaian penelitian dengan realitas. Jadi, penjelasan
mengenai apakah gejala yang diamati mendekati realitas atau kebenaran, dan
derajat kecermatan penjelasan tersebut menunjukkan validitas internal suatu
penelitian (Sutama, 2016:88).
a) Validitas eksternal
Berbeda dengan validitas internal, validitas eksternal atau external

validity mengacu pada generalitas atau universalitas produk penelitian.
Pertanyaan yang mendasar adalah seberapa jauh hasil dan konklusinya dapat
digeneralisasi kepada orang (masyarakat) dan latar (setting) lain. Dengan
perkataan lain, validitas eksternal perlu menjawab masalah, apakah temuan
peneliti itu dapat diterapkan (diaplikasikan) pada situasi lain (Sutama, 2016:88).
2.1.3 Prinsip Validitas
Ada beberapa prinsip ketika melakukan uji validitas, yaitu antara lain:
b) Interpretasi yang diberikan pada asesmen hanya valid terhadap derajat yang
diarahkan ke suatu bukti yang mendukung kecocokan dan kebenarannya.
c) Penggunaan yang bisa dibuat dari hasil asesmen hanya valid terhadap derajat
yang arahnya ke suatu bukti yang mendorong kecocokan dan kebenarannya.
d) Interpretasi dan kegunaan dari hasil asesmen yang valid ketika nilai (values)
yang didapatkan sesuai
e) Interpretasi dan kegunaan dari hasil asesmen hanya valid ketika konsekuensi
(consequences) dari interpretasi dan kegunaan ini konsisten dengan nilai
kecocokan.
2.1.4 Langkah-Langkah Pengujian Validitas Data
Ada beberapa langkah atau strategi yang bisa dilakukan untuk mencapai validitas
penelitian kualitatif. Strateginya menurut Budiastuti & Bandur (2018:140-144) adalah
seperti di bawah ini.
1) Uji Kredibilitas (Validitas Internal)

Kredibel maksudnya adalah seorang peneliti dipercaya telah mengumpulkan data
yang real di lapangan serta menginterpretasi data autentik tersebut dengan akurat.
Pada uji kredibilitas ada beberapa poin penting, penjelasannya seperti di bawah ini.
a) Triangulasi
Triangulasi terdiri atas, triangulasi teknik pengumpulan data, triangulasi sumber

data, triangulasi teori, dan triangulasi peneliti.
Triangulasi teknik pengumpulan data digunakan untuk mengecek atau mencari

tahu mengenai keabsahan data dengan berbagai teknik pengumpulan data yang sesuai,
misalnya adalah wawancara, FGDs, dan observasi.
Triangulasi sumber data digunakan untuk mengecek atau mencari tahu mengenai
keabsahan sumber-sumber yang digunakan untuk penelitian
Triangulasi teori digunakan untuk mengecek atau mencari tahu keabsahan dari
teori-teori yang digunakan dalam suatu penelitian
Triangulasi peneliti digunakan untuk mengecek atau mencari tahu keabsahan data
berdasarkan pandangan para peneliti-peneliti (ahli) yang sesuai dengan penelitian
tersebut.
b) Feedback
Feedback sangat penting untuk mengurangi bias personal peneliti. Untuk itu,

peneliti kualitatif perlu mendapatkan masukan dari orang-orang yang familiar dengan
masalah penelitian dan orang-orang lain yang asing dengan penelitian tersebut.
Masing-masing feedback yang diberikan dari kedua kelompok tersebut berbeda, tapi
semua itu akan bernilai untuk validitas penelitian.
c) Member check
Peneliti kualitatif perlu mendapatkan masukan dari orang-orang yang telah

diteliti. Masukan mereka sangat signifikan untuk mengukur apakah analisis sesuai
dengan harapan dan kenyataan yang mereka alami. Pada praktiknya, member
check ini dapat diperoleh peneliti dengan meminta informan kunci penelitian untuk
memberikan masukan terhadap laporan penelitian yang telah dilaksanakan.
d) Perbandingan hasil penelitian
Studi-studi kualitatif yang berasal dari lingkungan yang berbeda (multi-studies)

dan kasus-kasus yang banyak (multi-case studies) perlu dibandingkan untuk
meningkatkan validitas keutuhan studi tersebut. Kasus-kasus yang diteliti juga perlu
dibandingkan dengan studi-studi lain yang pernah dilakukan orang lain dalam konteks
yang berbeda, sehingga dengan membandingkannya, peneliti dapat memberikan
informasi dan hasil analisis data yang khas sesuai dengan kasus yang dialaminya.
e) Pernyataan kesediaan informasi
Peneliti harus menyertakan beberapa kesepakatan yang berkaitan dengan peran

partisipan dalam penelitian. Pertama, peneliti perlu menjelaskan siapa peneliti dan
untuk apa penelitian tersebut dilakukan. Peneliti juga perlu menyertakan bahwa
keikutsertaan partisipan dalam penelitian adalah bersifat sukarela dan dia berhak
untuk mengundurkan diri tanpa paksaan selama proses pengumpulan data
berlangsung. Consent form dalam penelitian kualitatif menjadi mutlak dilakukan demi
menjaga kejujuran partisipan penelitian.
f) Memahami setting penelitian
Peneliti kualitatif disarankan perlu mengenal setting penelitian dengan baik

sebelum melakukan penelitian, sehingga proses pengumpulan data dapat dilakukan
dengan baik. Oleh karena itu, peneliti dituntut untuk melakukan kontak awal dengan
para informan kunci dalam komunitas atau organisasi yang hendak diteliti.
g) Pertanyaan iteratif
Salah satu keahlian yang dituntut bagi seorang peneliti kualitatif adalah
kemampuannya mengajukan pertanyaan-pertanyaan feedback berdasarkan alur tema
diskusi atau wawancara. Pertanyaan-pertanyaan tersebut diajukan untuk
mengonfirmasi apa yang telah disampaikan informan selama proses wawancara atau
FGDs.
h) Kualifikasi dan pengalaman peneliti

Kredibilitas penelitian kualitatif juga dapat ditentukan oleh latar belakang
pendidikan, kualifikasi, dan pengalaman peneliti dalam melakukan penelitian. Oleh
karena itu, perlu diperhatikan bahwa penelitian pada dasarnya bertujuan untuk
memberikan kontribusi pada perkembangan ilmu pengetahuan dalam bidang tertentu
atau demi inovasi kebijakan dan perbaikan praktik yang sedang berkembang.
i) Temuan yang beda dengan kajian literatur
Agar hasil analisis data memiliki validitas internal yang baik, peneliti juga perlu
mencantumkan tema-tema utama yang muncul dari lapangan penelitian, akan tetapi
tidak sesuai dengan kajian literatur atau kerangka teoritis. Yang perlu dijelaskan
peneliti di sini adalah mengapa data-data tersebut muncul dalam setting penelitian dan
bagaimana situasi nyata tema-tema tersebut.
2.2 Reliabilitas
2.2.1 Pengertian Reliabilitas
Reliabilitas berasal dari kata reliability yang artinya sejauh mana hasil suatu
pengukuran dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila dalam
beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama,
diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri
subyek memang belum berubah. Nur (1987: 47) menyatakan bahwa reliabilitas
ukuran menyangkut seberapa jauh skor deviasi individu, atau skor-z, relatif konsisten
apabila dilakukan pengulangan pengadministrasian dengan tes yang sama atau tes
yang ekivalen. Azwar (2003: 176) menyatakan bahwa reliabilitas merupakan salah
satu ciri atau karakter utama instrumen pengukuran yang baik. Arifin (1991: 122)
menyatakan bahwa suatu tes dikatakan reliabel jika selalu memberikan hasil yang
sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang
berbeda.
Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan
masalah kekeliruan pengukuran. Kekeliruan pengukuran sendiri menunjukkan sejauh
mana inkonsistensi hasil pengukuran terjadi apabila dilakukan pengukuran ulang
terhadap kelompok subyek yang sama. Sedangkan konsep reliabilitas dalam arti
reliabilitas hasil ukur berkaitan erat dengan kekeliruan dalam pengambilan sampel
yang mengacu pada inkonsistensi hasil ukur apabila pengukuran dilakukan ulang pada
kelompok yang berbeda. Sudjana (2004: 16) menyatakan bahwa reliabilitas alat
penilaian adalah ketepatan atau keajegan alat tersebut dalam menilai apa yang
dinilainya. Artinya, penggunaan alat penilaian tersebut, akan memberikan hasil yang
relatif sama.
Dari beberapa pengertian di atas jadi reliabilitas tes merupakan suatu alat ukur
yang digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya
menunjukan keajegan. Seorang dikatakan dapat dipercaya apabila orang tersebut
berbicara ajeg, tidak berubah-ubah pembicaraannya dari waktu ke waktu. Dalam
sebuah tes pentingnya diamati keajegan dan kepastian tes tersebut dilihat dari hasil tes
yang didapat.
Dengan demikian reliabilitas dalam evaluasi pembelajaran merupakan sifat

yang ada pada data atau skor yang dihasilkan oleh instrumen, namun untuk
memudahkan, reliabilitas dapat dikatakan merupakan sifat dari instrumen juga.
Maksudnya reliabilitas bukanlah bersifat dikotomis, tetapi merupakan rentangan yang
biasanya dinyatakan dalam bentuk angka 0 – 1
Djaali (2000: 81) menyatakan bahwa reliabilitas dibedakan atas dua macam,
yaitu reliabilitas konsistensi tanggapan, dan reliabilitas konsistensi gabungan butir.
Reliabilitas konsistensi tanggapan responden mempersoalkan apakah tanggapan
responden atau obyek ukur terhadap tes atau instrumen tersebut sudah baik atau
konsisten. Dalam hal ini apabila suatu tes atau instrumen digunakan untuk melakukan
pengukuran terhadap obyek ukur kemudian dilakukan pengukuran kembali terhadap
obyek ukur yang sama, apakah hasilnya masih tetap sama dengan pengukuran
sebelumnya. Jika hasil pengukuran kedua menunjukkan ketidakkonsistenan maka
jelas hasil pengukuran itu tidak mencerminkan keadaan obyek ukur yang
sesungguhnya.
2.2.2 Tujuan Reliabilitas

Tujan adanya realibilitas adalah mengkonsep satu variabel dengan jelas. Setiap
pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel
harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.
Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat level
pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang
dimiliki semakin mendetail.
Prinsip dasarnya adalah mencoba melakukan pengukuran pada level paling

tepat yang mungkin diperoleh. Gunakan lebih dari satu indikator. Dengan adanya
lebih dari satu indicator yang spesifik, peneliti dapat melakukan pengukuran dari
range yang lebih luas terhadapkonten definisi konseptual. Gunakan tes pilot, yakni
dengan membuat satu atau lebih draftatau dalam sebuah pengukuran sebelum menuju
ke tahap hipotesis (pretest). Dalam penggunaan pilot studies, prinsipnya adalah
mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari
literature-literatur yag berkaitan.
Selanjutnya, pengukuran terdahulu dapat dipergunakan sebagai patokan dari

pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan
dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti
kemudian tetap sama.
Pada konstruksi alat ukur, perhitungan reliabilitas berguna untuk melakukan

perbaikan pada alat ukur yang dikonstruksi. Dimana perbaikan alat ukur dilakukan
melalui analisis butir untuk mengetahui butir mana yang perlu diperbaiki. Namun
pada pengukuran sesungguhnya, perhitungan reliabilitas dilakukan untuk memberi
informasi tentang kualitas sekor hasil ukur kepada mereka yang memerlukannya.
Tentunya perolehan tersebut bisa di jadikan acuan bagi peneliti untuk menghasilkan
penelitian yang bisa dipertanggung jawabkan di kemudian hari.
Sehingga, jika realibilitas baik, akan menunjukkan kalahan varian yang

minim. Jika tes mempunyai reabilitas tinggi maka pengaruh kesalahan pengukuran
telah terkurangi.
2.2.3 Karakteristik Reliabilitas

Sebuah tes dianggap memiliki reliabilitas yang baik apabila memiliki
karakteristik sebagai berikut:
1. Reliabilitas merupakan milik dari satu set nilai tes bukan milik tes itu sendiri,
artinya suatu tes dikatakan baik apabila dapat menghasilkan skor yang cukup
akurat, apabila tes tersebut diberikan pada kelas tertentu, maka bisa juga
menghasilkan skor yang cukup konsisten bila diberikan pada kelas yang berbeda
atau ketika diberikan pada kelas yang sama pada waktu yang berbeda.
2. Suatu tes dikatakan reliable jika dua buah tes dilakukan pada jarak waktu yang
berbeda dan menunjukkan skor yang tidak jauh berbeda.
3. Reliabilitas dapat dinyatakan untuk dua atau lebih pengukuran independen yang
diperoleh dari tes yang sama untuk setiap anggota kelompok
2.2.4 Pengujian Reliabilitas Instrumen
Dalam kaitanya dengan sebuah penelitian, berikut ini adalah macam-macam

reliabilitas dan prosedur pelaksanaan pengukuran reliabilitas yang sering ditemui
dalam instrument evaluasi maupun penelitian yaitu:
a. Teknik pengukuran ulang (test-retest)
Uji reliabilitas dengan metode tes ulang digunakan untuk mengetahui sejauh
mana suatu pengukuran dapat diandalkan. Uji ini dilakukan sebanyak dua kali,
pengukuran pertama dan ulangnya. Kedua pengukuran dapat dilakukan oleh orang
yang sama atau berbeda. Dalam hal ini perlu diatur bahwa proses pengukuran kedua,
keadaan yang diukur itu harus benar-benar sama. Selanjutnya hasil pengukuran yang
pertama dan yang kedua dikorelasikan dan hasilnya menunjukkan reliabilitas dari tes
ini.
Hal penting yang perlu diperhatikan dalam pengukuran reliabilitas tes ulang
adalah;
1. Jangka waktu antara kedua pengambilan penilaian,

2. Stabilitas yang diharapkan dari kinerja yang diukur.
Secara umum, semakin lama antara interval pelaksanaan tes yang berulang,
semakin rendah tingkat reliabilitasnya. Pendekatan tes ulang merupakan pemberian
perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan
selang waktu yang berbeda. Asumsinya adalah bahwa skor yang dihasilkan oleh tes
yang sama akan menghasilkan skor tampak yang relatif sama.
Estimasi reliabilitas dengan pendekatan tes ulang akan menghasilkan koefisien
stabilitas (stability). Untuk memperoleh koefisien reliabilitas melalui pendekatan tes
ulang dapat dilakukan dengan menghitung koefisien korelasi linier antara distribusi
skor subyek pada pemberian tes pertama dengan skor subjek pada pemberian tes
kedua.
b. Metode Bentuk Paralel (Equivalent)
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran dan susunan tetapi butir-butir soalnya berbeda, dalam istilah
bahasa Inggris disebut alternate-forms method (parallel forms).
Pengujian reliabilitas instrument dengan cara ini cukup dilakukan sekali, tetapi
instrumennya dua, pada responden yang sama, waktu sama, instrument berbeda.
Reliabilitas instrument dihitung dengan cara mengkorelasikan antara data instrument
yang satu dengan data instrument yang dijadikan ekuivalen. Bila korelasi positif dan
signifikan, maka instrument dapat danyatakan reliable.
c. Metode Gabungan (paralel form and alternative form reliability estamete)
Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrument

yang ekuivalen itu beberapa kali, ke responden yang sama. Reliabilitas instrument
dilakukan dengan mengkorelasikan dua instrument, setelah itu dikorelasikan pada
pengujian kedua dan selanjutnya dikorelasikan silang. Jika dengan dua kali pengujian
dalam waktu yang berbeda maka akan dapat dianalisis keenam koefesien reliabilitas.
Bila keenam koefesien korelasi itu semuanya positif dan signifikan maka dapat
dinyatakan bahwa instrument tersebut reliable
2.2.5 Faktor yang Mempengaruhi Reliabilitas
Reliabilitas dapat dipengaruhi oleh waktu penyelenggaran tes-retes. Interval

penyelengaraan yang terlalu dekat atau jauh, akan mempengruhi koefisien reliabilitas.
Faktor-factor lain yang mempengaruhi di antaranya;
1. Panjang test, semakin panjang test evaluasi, semakin banyak jumlah item materi
pembelajaran diukur. Ini menunjukan dua kemungkinan yaitu test semakin
mendekati kebenaran, dan dalam memgikuti test, semakin kecil siswa menebak.
Berarti semakin tinggi koefisien reliabilitas.
2. Penyebaran skor koefisien reliabiltas secara langsung dipengeruhioleh bentuk

sebaranskor dalam kelompok siswa yang diukur. Semakin tinggi sebaran semakin
tingi estimasi koefisien reliabilitas. Hal ini tejadi karena posisi skor siswa, secara
individual mempunyai kedudukan sama pada tes retest lain,sebagai acuan.
3. Kesulitan test; test normative yang terlalu mudah atau terlalu sulitskor untuk
siswa cenderung menghasilkan reliabilitas rendah. Fenomena tersebut, akan
menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi.
4. Untuk test yang terlalu mudah skor jawaban siswa akan mengumpul ada sisi atas,
untuk tes terlalu sulit skor jawaban siswa akan cenderung mengumpul pada ujung
bawah. Dua kejadian tersebut mempunyai kesamaan yaitu bahwa perbedaan di
antara individu adalah kecil dan cenderung tidak relevan
5. Objektivitas; yang di maksud objekif yaitu derajat dimana siswa dengan

kompetensi sama mencapai hasil sama. Ketika prosedur test evaluasi memiliki
objektivitas tinggi, maka reliabilitas test tidak dipengaruhi oleh prosedur teknik
penskoran. Item test objektif yang dihasilkan tidak dipengaruhi pertimbangan
atau opini seorang evaluator.
2.2.6 Rumus Reliabilitas Instrumen
Terdapat beberapa rumus dalam pengujian reliabilitas instrumen, antara lain;

Spearman Brown, Flanagan, Rulon, Kuder Richardson (KR) dan Cronbanch Alpha.
a) Rumus Spearman-Brown
Keterangan:
ri = reliabilitas instrument
rb = indeks korelasi antara dua belahan instrument
N = banyaknya responden
X = belahan pertama
Y = belahan kedua
b) Rumus Flanagan
Keterangan:
v1 = varians belahan pertama (varian skor butir-butir ganjil)
v2 = varians belahan kedua (varian skor butir-butir genap)
vt = varians skor total
c) Rumus Rulon
Keterangan:
Vt = varians total atau varians skor total
Vd = varians (varians difference)
d = skor pada belahan awal dikurangi skor pada belahan akhir
d) Rumus KR 20
Keterangan:
k = banyaknya butir pertanyaan atau banyaknya soal
pi = proporsi subjek yang menjawab betul pada suatu butir (proporsi subjek yang
mendapat skor 1)
e) Rumus KR 21
Keterangan:
p = skor rata-rata
f) Rumus Cornbanch Alpha

Keterangan:
ri = reliabilitas instrumen
2.3 Daya Beda
2.3.1 Pengertian Daya Beda
Daya pembeda adalah kemampuan suatu soal untuk membedakan antara siswa
yang pandai prestasi tinggi dengan siswa yang kurang pandai prestasi rendah Arifiani
2011:25. Subrayata dalam Rasyid, 2007:229 mengatakan bahwa tujuan pokok
mencari daya beda soal adalah untuk menentukan apakah butir soal tersebut memiliki
kemampuan membedakan kelompok dalam aspek yang diukur sesuai dengan
perbedaan yang ada pada kelompok tersebut. Salah satu tujuan analisis kuantitatif soal
adalah untuk menentukan dapat tidaknya suatu soal membedakan kelompok dalam
aspek yang di ukur sesuai dengan perbedaan yang ada dlam kelompok itu. Indeks
yang di gunakan dalam membedakan peserta tes yang berkemampuan tinggi dengan
peserta tes yang berkemampuan rendah adalah indeks daya pembeda. Indeks ini
menunjukkan kesesuaian antara fungsi soal dengan fungsi tes secara keseluruhan.
Dengan demikian validitas soal ini sama dengan daya pembeda soal yaitu daya yang
membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang
berkemampuan rendah.
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk
dapat membedakan (mendiskriminasi) antara testee yang berkemampuan tinggi
(pandai) dengan testee yang berkemampuan rendah (tidak pandai) sehingga sebagian
testee yang berkemampuan tinggi untuk menjawab butir item tersebut lebih banyak
yang menjawab benar, sementara testee yang berkemempuan rendah untuk menjawab
item tes terrsebut sebagian besar tidak dapat menjawab item soal dengan benar.
Dengan kata lain, bahwa analisis daya beda item adalah analisis yang mengungkapkan
seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan
siswa kelompok rendah. Salah satu ciri butir yang baik adalah yang mampu
membedakan antara kelompok atas (yang mampu) dan kelompok bawah (kurang
mampu).Ini dianggap sangat penting karena ada anggapan bahwa kemampuan setiap
testee akan berbeda dengan testee yang lainnya.
Berdasarkan pengertian daya pembeda diatas dapat disimpulkan bahwa daya

pembeda adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai
prestasi tinggi dengan siswa yang kurang pandai prestasi rendah dalam aspek yang
diukur sesuai dengan perbedaan yang ada pada kelompok tersebut.
2.3.2 Tujuan Daya Beda
Analisis daya pembeda mengkaji butir-butir soal dengan tujuan untuk

mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu
(tinggi prestasinya) dengan siswa yang tergolong kurang atau lemah prestasinya.
Artinya, bila soal tersebut diberikan kepada anak yang mampu, hasilnya
menunujukkan prestasi yang tinggi; dan bila diberikan kepada siswa yang lemah,
hasilnya rendah. Tes dikatakan tidak memiliki daya pembeda apalagi tes tersebut, jika
diujikan kepada anak yang lemah, hasilnya lebih tinggi. Atau bila diberikan kepada
kedua kategori siswa tersebut, hasilnya sama saja. Dengan demikian, tes yang tidak
memiliki daya pembeda, tidak akan menghasilkan gambaran hasil yang sesuai dengan
kemampuan siswa yang sebenarnya. Sungguh aneh bila anak pandai tidak lulus, tetapi
anak bodoh lulus dengan baik tanpa dilakukan manipulasi oleh penilai atau diluar
faktor kebetulan (Sudjana, 2010:141)
2.3.3 Manfaat Daya Beda

1. Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi
ataumembedakan kemampuan siswa, yaitu siswa yang telah memahami atau
belum memahami materi yang diajarkan guru.
2. Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan
indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik,
direvisi, atau ditolak.
3. Apabila suatu butir soal tidak dapat membedakan kedua kemampuan siswa itu,
maka butir soal itu dapat dicurigai "kemungkinannya" seperti berikut ini.
a) Kunci jawaban butir soal itu tidak tepat.

b) Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar.
c) Kompetensi yang diukur tidak jelas.
d) Pengecoh tidak berfungsi.
e) Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang menebak.
f) Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada
yang salah informasi dalam butir soalnya.
Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam bentuk
proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang
bersangkutan membedakan siswa yang telah memahami materi dengan peserta didik
yang belum memahami materi.
2.3.4 Cara Menentukan Daya Beda
Ada Dua Perhitungan Dalam Menentukan Daya Pembeda
1. Untuk Menghitung Daya Pembeda Setiap Butir Soal
a) Untuk menghitung daya pembeda setiap butir soal dapat digunakan rumus
sebagai berikut:
(WL - WH)
DP= --------------
n
Keterangan:
DP = daya pembeda
WL = jumlah peserta didik yang gagal dari kelompok bawah
WH = jumlah peserta yang gagal dari kelompok atas
N = 27% X N
Untuk menginterpretasikan koefisien daya pembeda sebagai berikut:
0,40 keatas = baik
0,30-0,39 = cukup baik
0,20-0,29 = kurang baik
0,19 kebawah = sangat kurang
Daya beda soal adalah kemampuan suatu soal untuk membedakan antara
peserta didik yang sudah menguasai materi, dan peserta didik yang belum menguasai
materi kompetensi dasar (Kunandar, 2014:240-241).
b) Rumus menghitung tingkat daya pembeda soal adalah:
D = 2 (A-B) : T
Keterangan:
D = daya pembeda soal
A = jumlah peserta tes pada kelompok atas yang menjawab benar
B = jumlah peserta tes pada kelompok bawah yang menjawab benar
T = jumlah peserta yang ikut tas

Hasil penghitungan tingkat daya pembeda soal dapat dikategorikan menjadi
empat sebagai berikut:
D = 0,00 – 0,20 Kurang
D = 0,21 – 0,40 Cukup
D = 0,41 – 0,70 Baik
D = 0,71 – 1,00 Baik sekali
Langkah-langkah menghitung daya beda soal sebagai berikut:
1) Buatlah rangking dari seluruh peserta tes
2) Kelompokkan peserta tes menjadi dua kelompok berdasarkan peringkat

(skor) tes
3) Buatlah skor untuk masing-masing peserta tes
4) 50% peserta tes peringkat atas masuk kelompok A, dan 50% peserta tes
peringkat bawah masuk kelompok B.
5) Masukan kategori kelompok ke dalam masing-masing peserta tes
6) Masukkan rumus daya beda, D= 2(A-B) : T
7) Hasil perhitungan daya beda konfirmasikan dengan kategori daya beda

soal dan berikan rekomendasi sesuai dengan kriteria.
Daya pembeda ini maksudnya adalah untuk mengetahui perbedaan antara

peserta didik yang sudah menguasai materi dengan peserta didik yang belum
menguasai materi. Sehingga guru dengan mudah bila suatu saat guru membuat sebuah
soal lagi dengan adanya daya pembeda tersebut. Peneliti dalam penelitian ini
menggunakan rumus Zaenal Arifin, hal ini digunakan karena bagi peneliti mudah
untuk dipahami rumusnya tersebut.
2. Cara mencari daya beda perangkat tes

Diketahui,
memasukkan data ke dalam rumus:
Berdasarkan kriteria daya beda tes, daya beda perangkat tes di atas dengan Dp = 0,22
termasuk ke dalam kriteria cukup baik
a) Daya Beda Butir Tes
Rumus untuk menghitung tingkat daya beda butir tes hasil belajar adalah sebagai
berikut.
Kriteria daya beda (D) menurut Agung (2011:55) adalah sebagai berikut
0,00 – 0,19 = kurang baik

0,20 – 0,39 = cukup baik
0,40 – 0,70 = baik
0,71 – 1,00 = sangat baik
Jika “D” negatif berarti soal tersebut buruk dan harus dibuang. Tes yang baik apabila
memiliki nilai D antara 0,15 - 0,20 atau lebih
Daya beda butir soal yang sering digunakan dalam tes hasil belajar adalah dengan
cara menggunakan indeks korelasi antara skor butir dengan skor totalnya
b) Daya Beda Perangkat Tes

Rumus untuk menghitung tingkat daya beda perangkat tes hasil belajar adalah sebagai
berikut
Misalnya sebuah data diperoleh dari hasil ulangan matematika kelas 2 SD. Bentuk
soal adalah pilihan ganda.
Apabila siswa menjawab dengan benar, maka diberikan poin 1 (satu). Apabila siswa
salah menjawab atau tidak menjawab soal, maka diberikan poin 0 (nol).
Jika kalian menggunakan hp, lihatlah dengan mode landscape (layar

putar otomatis)
Nomor Butir Soal
Nama Total
Siswa Skor
1 2 3 4 5 6 7 8 9 10
Budi 1 1 0 0 1 1 1 0 0 1 7
Anton 1 1 1 1 1 1 0 1 1 1 9
Putri 1 1 0 0 1 1 1 1 1 1 8
Cantika 1 1 0 1 1 1 1 1 1 1 9
David 0 1 1 1 1 1 1 0 1 1 8
Valen 1 1 1 0 1 1 0 1 0 1 7
Era 0 1 0 0 1 1 0 1 1 1 6
Ahmad 1 1 1 1 1 1 1 0 1 0 8
Adit 0 1 0 1 1 1 1 1 1 0 7
Dewani 0 1 0 1 1 1 0 0 0 1 5
Sekarang data dipecah menjadi kelompok atas dan kelompok bawah. Kelompok atas
adalah yang memiliki skor total lebih tinggi dari kelompok bawah.
Jumlah siswa pada tabel tersebut adalah 10 orang, maka 5 orang kelompok atas dan 5
orang kelompok bawah.
Agar lebih mudah mengelompokkannya. Urutkan siswa dengan total skor tertinggi ke
skor terendah di aplikasi Microsoft Excel. Caranya : blok nama siswa beserta nilai
totalnya, pilih logo sort & liter lalu Costum sort. Setting sesuai yang dikehendaki lalu
tekan OK
Kelompok Atas
Nomor Butir Soal

Nama Total
Siswa Skor
1 2 3 4 5 6 7 8 9 10
Anton 1 1 1 1 1 1 0 1 1 1 9
Cantika 1 1 0 1 1 1 1 1 1 1 9
Putri 1 1 0 0 1 1 1 1 1 1 8
David 0 1 1 1 1 1 1 0 1 1 8
Ahmad 1 1 1 1 1 1 1 0 1 0 8
PA 0,8 1 0,6 0,8 1 1 0,8 0,6 1 0,8
Nilai PA diperoleh dengan menjumlahkan soal yang benar secara vertikal lalu dibagi
jumlah penjawab soal. Soal yang dijawab benar sebanyak 4 dan jumlah siswa
kelompok atas 5. PA diperoleh dari 4 dibagi 5 maka hasilnya 0,8. Berlaku seterusnya
Kelompok Bawah
Nomor Butir Soal
Nama Total
Siswa Skor
1 2 3 4 5 6 7 8 9 10
Valen 1 1 1 0 1 1 0 1 0 1 7
Adit 0 1 0 1 1 1 1 1 1 0 7
Budi 1 1 0 0 1 1 1 0 0 1 7
Era 0 1 0 0 1 1 0 1 1 1 6
Dewani 0 1 0 1 1 1 0 0 0 1 5
PB 0,4 1 0,2 0,4 1 1 0,4 0,6 0,4 0,8
a) Cara Menghitung Daya Beda Tes
Cara mencari daya beda butir tes yaitu
Contoh cara mencari daya beda butir tes nomor 1 adalah sebagai berikut,
Diketahui:

b) Cara mencari daya beda perangkat tes yaitu
Diketahui,

Berdasarkan kriteria daya beda tes, daya beda perangkat tes di atas dengan Dp = 0,22
termasuk ke dalam kriteria cukup baik
2.4 Studi Kasus
A. Pendahuluan
Salah satu karakter yang perlu dikembangkan siswa di sekolah adalah cinta
damai. Galtung (1967) mengkonsep makna damai itu sendiri adalah sebagai suatu
kondisi internal manusia yang memiliki pikiran damai terhadap dirinya sendiri ketika
dihadapkan pada situasi tertentu. Seseorang yang memiliki karakter cinta damai
cenderung menjadi ribadi yang tenang dan tidak mudah meluapkan amarahnya terlalu
berlebihan dan memunculkan perilaku yang menyakiti orang lain secara sengaja atau
disebut dengan perilaku agresi.
Kondisi yang diharapkan sesuai dengan uraian di atas belum semuanya berjalan
dengan maksimal. Hal ini ditunjukkan dengan berbagai hasil penelitian yang
menunjukkan bahwa berbagai perilaku agresi masih dilakukan oleh remaja.
Berdasarkan penelitian yang dilakukan oleh Hidayat, Yusri & Ilyas (2013)
menyimpulkan terkait profil perilaku agresi siswa bahwa perilaku agresi siswa dapat
dilihat dari menyakiti orang lain secara fisik dengan persentase 35,32%,sedangkan
tindakan agresi yang dilakukan siswa dilihat dari menyakiti orang secara verbal
41,30%, dan tindakan agresi dilihat dari merusak dan menghancurkan harta benda
dengan persentase 30,42%.
Penelitian di atas ditunjukkan secara nyata di Yogyakarta dengan munculnya
fenomena yang disebut dengan klitih. Fenomena klitih adalah sebutan untuk gaya
kriminalitas yang dilakukan pelajar di wilayah provinsi Daerah Istimewa Yogyakarta.
Kasus yang terjadi adalah sekelompok pelajar yang berkeliaran pada malam hari
dengan membawa senjata dalam keadaan mabuk, sehingga menimbulkan kasus
tawuran pelajar hingga kasus pembacokan antar pelajar. Fenomena ini adalah salah
satu bentuk krisis karakter yang dialami pelajar di provinsi Daerah Istimewa
Yogyakarta yang terkenal dengan kota pelajar atau kota seni budaya.
Fenomena klitih ini termasuk salah satu contoh perilaku agresi yang dilakukan
remaja karena berusaha menyakiti orang lain baik verbal maupun nonverbal dengan
sengaja. Hal ini sesuai dengan pernyataan Ramirez (2009) yang menyatakan bahwa
perilaku agresi adalah fenomena kompleks yang beroperasi pada beberapa tingkat,
dengan berbagai macam makna, dan dimunculkan dalam berbagai bentuk perilaku
yang dalam hal ini adalah klitih.
Permasalahan di atas mendorong untuk dikembangkannya sebuah alat ukur yang
berguna mengukur tingkat perilaku agresi pada remaja di provinsi Daerah Istimewa
Yogyakarta. Alat ukur yang dikembangkan berupa skala perilaku agresi. Skala
perilaku agresi yang dikembangkan dengan mendasarkan pada teori yang
dikembangkan oleh Buss & Perry (1992) yang menyatakan perilaku agresif sebagai
perilaku atau kecenderungan perilaku yang niatnya untuk menyakiti orang lain baik
secara fisik maupun secara psikologis. Pada teori tersebut dijelaskan bahwa perilaku
agresi memiliki empat aspek utama, yaitu fisik, verbal, kemarahan, dan kebencian.
Alat ukur ini akan sangat berguna untuk mengukur tingkat perilaku agresi yang
dialami siswa. Hasil pengukuran akan menjadi acuan atau dasar pihak-pihak yang
bertanggung jawab seperti guru, konselor, atau orang tua siswa untuk meminimalisir
permasalahan agresi yang dilakukan siswa. Ini menjadi masalah serius sekaligus
tantangan bagi pihak-pihak yang bertanggung jawab tersebut untuk mencegah siswa
terlampau tinggi tingkat perilaku agresi yang dilakukan.
Perilaku agresi menjadi masalah serius dan dapat berdampak negatif bagi
berbagai kalangan jika tidak segera disadari dan dicari jalan keluarnya. Goldstein,
Young & Boyd (2008) dalam penelitiannya menyatakan bahwa perilaku agresi
berkaitan erat dengan persepsi remaja tentang dari iklim sekolah. Senada dengan
penelitian sebelumnya, Marsh, McGee & Williams (2014) melalui penelitiannya
menyatakan bahwa perilaku agresi menjadi pendorong bagi munculnya persepsi
buruk siswa terhadap iklim sekolah. Sehingga dampak terbesar dari persepsi siswa
tentang iklim sekolah yang buruk adalah menurunnya prestasi belajar siswa.
Dampak negatif yang dijelaskan di atas menunjukkan bahwa tingkat perilaku
agresi perlu segera disadari oleh pihak-pihak yang bertanggung jawab. Hal ini
dimaksudkan agar perilaku maladaptif tersebut segera mendapat penanganan jika
memang terjadi di kalangan pelajar. Oleh sebab itu, diperlukan instrumen yang salah
satunya adalah skala psikologis yang berupa skala perilaku agresi. Akan tetapi sebuah
skala psikologis sebelum diimplementasikan sebagai alat ukur perlu untuk diuji coba
dahulu sehingga akan diketahui kelayakan instrumen berdasarkan hasil uji validitas
dan reliabilitas. Artikel ini akan memaparkan tentang hasil uji validitas dan reliabilitas
skala perilaku agresi sehingga skala psikologis tersebut menjadi skala yang layak
untuk mengukur tingkat perilaku agresi yang dilakukan oleh siswa.
B. Metode Penelitian
Penelitian ini bertujuan untuk menganalisis tingkat validitas dan reliabilitas
instrumen skala perilaku agresi. Skala perilaku agresi sebelum digunakan perlu
dilakukan uji coba untuk mengetahui validititas dan reliabilitasnya. Penelitian ini
menggunakan korelasi product moment untuk menentukan tingkat validitasnya dan
menggunakan rumus alpha cronbach untuk menentukan tingkat reliabilitasnya. Uji
validitas dan reliabilitas skala perilaku agresi dibantu dengan aplikasi SPSS 16.
C. Hasil dan Pembahasan

Uji coba instrumen skala perilaku agresi dilaksanakan pada 112 responden. Uji
validitas dan reliabilitas skala perilaku agresi dibantu dengan aplikasi SPSS 16.
Berdasarkan hasil analisis korelasi product moment dapat disimpulkan bahwa dari 50
jumlah total item, 38 item diataranya dinyatakan valid, sehingga 38 item
dipertahankan dan sisanya, 12 item dinyatakan gugur. Sedangkan hasil analisis Alpha
Cronbach, koefisien reliabilitasnya adalah 0,826 yang termasuk dalam kategori
reliabilitas tinggi. Hasil analisis di atas dapat menjadi dasar untuk menentukan bahwa
instrumen skala perilaku agresi layak untuk digunakan untuk mengukur tingkat
perilaku agresi siswa.
Skala perilaku agresi menjadi sebuah alat yang penting untuk dikembangkan.
Layaknya penelitian Orpinas & Frankowski (2001) yang menyatakan bahwa skala
perilaku agresi dapat digunakan untuk mengukur tingkat perilaku agresi dan berupaya
untuk melakukan pencegahan terhadap munculnya perilaku agresi. Penelitian yang
dilakukan oleh Perlman & Hirdes (2008) juga menghasilkan bahwa skala perilaku
agresi yang telah melalui tahap uji coba dapat digunakan untuk mengukur kualitas
perilaku agresi dan membuat perencanaan untuk mereduksi perilaku agresi tersebut.
Berdasarkan penelitian terdahulu, disimpulkan bahwa skala perilaku agresi dapat
digunakan untuk mengukur tingkat agresi siswa. Tingkat agresi siswa yang diketahui
dari skala perilaku agresi dapat menjadi dasar untuk menyusun rencana tindakan
untuk mencegah dan mereduksi perilaku agresi yang dilakukan oleh siswa. Rencana
tersebut akan tertuang dalam program Bimbingan dan Konseling yang memandu
konselor dalam memberikan layanan kepada siswa.
Perilaku agresi jika tidak dicegah dan direduksi, tentunya akan berdampak negatif
terhadap siswa.Penelitian yang dilakukan oleh Klein, Cornell & Konold (2012)
menyebutkan bahwa salah satu bentuk perilaku agresi, yaitu bullying dapat
berdampak pada buruknya persepsi siswa terhadap iklim sekolah. Penekitian tersebut
didukung oleh Giovazolias dkk. (2010) yang menyimpulkan bahwa persepsi negatif
tentang iklim sekolah dipengaruhi salah satunya adalah perilaku bullying yang
dilakukan siswa. Siswa akan mempersepsi negatif iklim sekolah dan hal ini akan
berpengaruh terhadap performa akademik mereka dalam memperoleh prestasi
akademik yang baik (Kozina dkk., 2010; Kutsyuruba, Klinger & Hussain, 2015;
Makewa dkk., 2011).
Skala perilaku agresi yang dikembangkan ini diharapkan dapat digunakan
konselor di sekolah untuk mengidentifikasi tingkat perilaku agresi siswa. Sehingga
konselor dapat merancang sebuah strategi untuk mereduksi dan mencegah munculnya
perilaku agresi yang dilakukan siswa. Ini menjadi penting bagi sekolah karena siswa
akan memiliki persepsi yang positif pada iklim sekolah dan mampu mencapai prestasi
akademik yang baik.
D. Kesimpulan
Penelitian ini dilakukan untuk menganalisis tingkat validitas dan reliabilitas
instrumen skala perilaku agresi. Berdasarkan hasil uji coba pada 112 responden maka
didapatkan hasil bahwa dari 50 butir item, 38 butir item dinyatakan valid dan sisanya
12 item dinyatakan tidak valid. Sedangkan koefisien reliabilitasnya adalah 0,826 yang
termasuk dalam kategori reliabilitas tinggi. Berdasarkan hasil penelitian ini,
seyogyanya konselor dapat menggunakan instrumen skala perilaku agresi ini untuk
mengidentifikasi tingkat perilaku agresi siswa.
Sumber Jurnal :
Saputra, W. N. E., & Handaka, I. B. (2017, August). Analisis Validitas dan Reliabilitas Skala
Perilaku Agresi. In Seminar Nasional Bimbingan Konseling Universitas Ahmad
Dahlan (Vol. 2).
BAB 3
PENUTUP
3.1 Kesimpulan
Validitas data adalah suatu kecermatan atau ketepatan suatu alat ukur dalam
mengukur sesuatu atau secara khusus mengukur data penelitian. Validitas data sendiri
digunakan untuk mengukur benar atau salah mengenai data yang digunakan pada
suatu penelitian yang bersifat kuantitatif.
Reliabilitas alat penilaian adalah ketepatan atau keajegan alat tersebut dalam
menilai apa yang dinilainya. Artinya, penggunaan alat penilaian tersebut, akan
memberikan hasil yang relatif sama
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk
dapat membedakan (mendiskriminasi) antara testee yang berkemampuan tinggi
(pandai) dengan testee yang berkemampuan rendah (tidak pandai) sehingga sebagian
testee yang berkemampuan tinggi untuk menjawab butir item tersebut lebih banyak
yang menjawab benar, sementara testee yang berkemempuan rendah untuk menjawab
item tes terrsebut sebagian besar tidak dapat menjawab item soal dengan benar.
Analisis daya pembeda mengkaji butir-butir soal dengan tujuan untuk

mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu
(tinggi prestasinya) dengan siswa yang tergolong kurang atau lemah prestasinya.
Artinya, bila soal tersebut diberikan kepada anak yang mampu, hasilnya
menunujukkan prestasi yang tinggi; dan bila diberikan kepada siswa yang lemah,
hasilnya rendah
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalusukar.
Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggiusaha
pemecahannya. Sebaliknya soal yang terlalu sukar akan menyebabkansiswa menjadi
putus asa dan tidak mempunyai semangat untuk mencoba lagikarena diluar
jangkauannya.Daya pembeda soal yaitu kemampuan sesuatu soal untuk
membedakanantara siswa yang berkemampuan tinggi dengan siswa yang
berkemampuanrendah. Angka yang menunjukkan besarnya daya pembeda disebut
indeksdiskriminasi ( D), dan nilainya berkisar antara 0,00 sampai 1,00. Pada daya
pembeda ini berlaku tanda negatif yang digunakan jika sesuatu soal “terbalik”
menunjukkan kualitas testee yaitu anak pandai disebut bodoh dan anak bodoh disebut
pandai.
3.2 Saran
Penulis mengharapkan kritik dan saran yang membangun demi kesempurnaan

makalah ini dan penulisan makalah di kesempatan-kesempatan berikutnya dan
semoga makalah ini dapat memberikan beberapa informasi yang bermanfaat bagi
Anda semua.
DAFTAR PUSTAKA
RELIABILITAS DAN VALIDITAS KONSTRUK SKALA KONSEP DIRI UNTUK

MAHASISWA INDONESIA. (2006). Jurnal Psikologi Undip, 3(1), 1-9–9.
https://doi.org/10.14710/jpu.3.1.1
Siswanto, S. 2014. “Validitas Sebagai Alat Penentuan Kehandalan Tes Hasil Belajar”.
dalam Jurnal Pendidikan Akuntasi Indonesia Volume 6 (hal. 107-117).
Matondang, Z. (2009). Validitas dan reliabilitas suatu instrumen penelitian. Jurnal

tabularasa, 6(1), 87-97.
Azwar, Saifuddin. 2003. Reliabilitas dan Validitas. Yogyakarta: Pustaka pelajar.
H.M, Sukardi. 2008. EVALUASI PENDIDIKAN Prinsip & Operasionalnya. Jakarta:

PT Bumi Aksara.
Supranata, Suparman. 2004. ANALISIS, VALIDITAS, RELIABLITAS, DAN

INTERPRETASI HASIL TES. Bandung: PT Remaja Rosdakarya.
Sudjana, Nana. 2010. Penilaian Hasil Proses Belajar Mengajar. Bandung: PT Remaja

Rosdakarya
Sudjana, Nana dan Ibrahim.Penelitian dan Penilaian Pendidikan. Bandung: Sinar

Baru Algesindo.
Sudrajat, A. 2008. Penilaian Hasil

Belajar. http://akhmadsudrajat.wordpress.com /2008/05/01/Penilaian-Hasil-Bela
jar/.
Sudijono, A. 2009. Pengantar Evaluasi Pendidikan. Jakarta: PT Raja Grafindo

Persada.
Arifin, Zaenal. 2014. Evaluasi Pembelajaran. Bandung: PT Remaja Rosdakarya.
Arifin, Zaenal. 2009. Evaluasi Pembelajaran: Prinsip, Teknik, dan

Prosedur. Bandung: Bumi Aksara
WATI, Ni Nyoman Kurnia. Implementasi Metode Demonstrasi Berbantuan Google

Classroom Untuk Meningkatkan Minat Belajar Mahasiswa Kelas A Prodi
PGSD. Edukasi: Jurnal Pendidikan Dasar, 2020, 1.1: 29-37
Kunandar. 2014. Penilaian Autetik (Penilaian Hasil Belajar Peserta Didik

Berdasarkan Kurikulum 2013). Jakarta: PT Rajagrafindo Persada.
Sudjana. 2005. Metode Statistika Edisi ke 6. Bandung: Tarsito.
Suryabrata, S. 2000. Metodologi Penelitian. Jakarta: Raja Grafindo Persada

Saputra, W. N. E., & Handaka, I. B. (2017, August). Analisis Validitas dan
Reliabilitas Skala Perilaku Agresi. In Seminar Nasional Bimbingan Konseling
Universitas Ahmad Dahlan (Vol. 2).

Makalah Kel. 2

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makalah Kel. 2

Diunggah oleh

Hak Cipta:

Format Tersedia

MAKALAH

Konsep Validitas, Reliabilitas, dan Daya Beda

MAFRIKHAH UYUNNIMAH 200111600490

PROGRAM STUDI S1 BIMBINGAN DAN KONSELING

Assalamu’alaikum Wr. Wb.

Malang, 21 September 2021

1.1 Latar Belakang

1.2 Rumusan Masalah

1. Bagaimana pengertian konsep validitas, reliabilitas dan daya beda?

2.1.1 Pengertian Validitas

Pengertian validitas menurut para ahli :

1. Sudjana (2004:12) Pengertian validitas menurut Sudjana adalah ketepatan

Berdasarkan pendapat-pendapat ahli di atas, dapat diambil simpulan bahwa

2.1.2 Jenis Validitas

a) Validitas isi (content validity)

b) Validitas berdasarkan kriteria (criterion-related validity)

c) Validitas konstruk (construct validity)

Validitas internal atau internal validity menyatakan seberapa jauh kecocokan

Berbeda dengan validitas internal, validitas eksternal atau external

2.1.3 Prinsip Validitas

2.1.4 Langkah-Langkah Pengujian Validitas Data

1) Uji Kredibilitas (Validitas Internal)

Triangulasi terdiri atas, triangulasi teknik pengumpulan data, triangulasi sumber

Triangulasi teknik pengumpulan data digunakan untuk mengecek atau mencari

Feedback sangat penting untuk mengurangi bias personal peneliti. Untuk itu,

Peneliti kualitatif perlu mendapatkan masukan dari orang-orang yang telah

Studi-studi kualitatif yang berasal dari lingkungan yang berbeda (multi-studies)

e) Pernyataan kesediaan informasi

Peneliti harus menyertakan beberapa kesepakatan yang berkaitan dengan peran

f) Memahami setting penelitian

Peneliti kualitatif disarankan perlu mengenal setting penelitian dengan baik

h) Kualifikasi dan pengalaman peneliti

i) Temuan yang beda dengan kajian literatur

2.2.1 Pengertian Reliabilitas

Dengan demikian reliabilitas dalam evaluasi pembelajaran merupakan sifat

2.2.2 Tujuan Reliabilitas

Prinsip dasarnya adalah mencoba melakukan pengukuran pada level paling

Selanjutnya, pengukuran terdahulu dapat dipergunakan sebagai patokan dari

Pada konstruksi alat ukur, perhitungan reliabilitas berguna untuk melakukan

Sehingga, jika realibilitas baik, akan menunjukkan kalahan varian yang

2.2.3 Karakteristik Reliabilitas

2.2.4 Pengujian Reliabilitas Instrumen

Dalam kaitanya dengan sebuah penelitian, berikut ini adalah macam-macam

a. Teknik pengukuran ulang (test-retest)

1. Jangka waktu antara kedua pengambilan penilaian,

b. Metode Bentuk Paralel (Equivalent)

c. Metode Gabungan (paralel form and alternative form reliability estamete)

Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrument

Reliabilitas dapat dipengaruhi oleh waktu penyelenggaran tes-retes. Interval

2. Penyebaran skor koefisien reliabiltas secara langsung dipengeruhioleh bentuk

5. Objektivitas; yang di maksud objekif yaitu derajat dimana siswa dengan

2.2.6 Rumus Reliabilitas Instrumen

Terdapat beberapa rumus dalam pengujian reliabilitas instrumen, antara lain;

f) Rumus Cornbanch Alpha

2.3 Daya Beda

2.3.1 Pengertian Daya Beda

Berdasarkan pengertian daya pembeda diatas dapat disimpulkan bahwa daya

2.3.2 Tujuan Daya Beda

Analisis daya pembeda mengkaji butir-butir soal dengan tujuan untuk

2.3.3 Manfaat Daya Beda

a) Kunci jawaban butir soal itu tidak tepat.

2.3.4 Cara Menentukan Daya Beda