Anggota Kelompok 2 :
2021
KATA PENGANTAR
Penyusun
BAB 1
PENDAHULUAN
Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan evaluasi
sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga hasil
pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur.
Instrumen ini memang harus memiliki akurasi ketika digunakan. Konsisten dan stabil
dalam arti tidak mengalami perubahan dari waktu pengukuran satu ke pengukuran
yang lain.
Data yang kurang memiliki validitas , akan menghasilkan kesimpulan yang bisa,
kurang sesuai dengan yang seharusnya, dan bahkan bisa saja bertentangan dengan
kelaziman. Untuk membuat alat ukur instrumen itu, diperlukan kajian teori, pendapat
para ahli serta pengalaman-pengalaman yang kadangkala diperlukan bila definisi
operasional variabelnya tidak kita temukan dalam teori. Alat ukur atau instrumen
yang akan disusun itu tentu saja harus memiliki validitas , agar data yang diperoleh
dari alat ukur itu bisa reliabel, valid dan disebut dengan validitas.
Tes biasanya dilakukan dengan cara memberikan pertanyaan yang berupa soal
pilihan ganda maupun bentuk soal uraian. Oleh karena itu, ciri-ciri soal yang baik
dijadikan sebagai alat ukur harus memenuhi beberapa persyaratan untuk melakukan
tes, yaitu antara lain validitas, reliabilitas, dan daya pembeda.
Penyusunana soal yang baik harus disususun secara prinsip dan prosedur soal
yang baik. Sehingga untuk mengetahui apakah soal yang dibuat itu baik atau tidak,
maka perlu dilakukan analisis butir soal. Validitas yang dimaksutkan untuk
menyatakan sejauh mana data yang ditampung pada suatu soal yang diaman akan
diukur apa yang diukur. Sehingga validitas bisa dikatakan dengan berdasarkan
pengukuran. Bahwa reliabilitas berhubungan dengan kemampuan alat ukur untuk
melakukan pengukuran secara cermat, yang dimana reliabilitas merupakan alat ukur
dalam melakukan pengukuran. Oleh karena itu, reliabilitas mendasari pengukuran
pengukuran yang mungkin terjadi pada suatu proses pengukuran.
Kemampuan tinggi yang ditunjukkan dengan perolehan skor yang tinggi dan
kemampuan rendah ditunjukkan dengan perolehan skor yang rendah. Sehingga, daya
pembeda sebagai alat pengukuran butir soal yang dilakukan untuk membedakan
kepada anak berprestasi tinggi dan anak berprestasi rendah. Tingkat kesukaran item
digunakan untuk mengukur tingkat kemudahan dan kesukaran soal. Jadi, tingkat
kesukaran merupakan suatu soal yang menunjukan tingkat kesukaran atau kemudahan
suatu soal.
1.3 Tujuan
Tujuan yang ingin dicapai dari disusunnya makalah ini secara umum adalah agar
setiap pembaca memhami konsep Validitas, Reliabilitas, dan Daya Beda. Yang
didalamnya memuat :
1. Pengertian konsep validitas, reliabilitas dan daya beda.
2. Jenis dan bentuk dari validitas dan reliabilitas.
3. Prinsip reliabilitas.
4. Langkah-langkah pengujian validitas data.
5. Tujuan dari reliabilitas dan daya beda.
6. Faktor yang mempengaruhi daya beda.
7. Manfaat dari daya beda.
8. Cara menentukan daya beda.
DAFTAR ISI
MAKALAH 1
KATA PENGANTAR 2
BAB 1 3
PENDAHULUAN 3
1.1 Latar Belakang 3
1.2 Rumusan Masalah 4
1.3 Tujuan 4
BAB 2 6
PEMBAHASAN 6
2.1 Validitas 6
2.1.1 Pengertian Validitas 6
2.1.2 Jenis Validitas 7
2.1.3 Prinsip Validitas 9
2.1.4 Langkah-Langkah Pengujian Validitas Data 10
2.2 Reliabilitas 12
2.2.1 Pengertian Reliabilitas 12
2.2.2 Tujuan Reliabilitas 14
2.2.3 Karakteristik Reliabilitas 15
2.2.4 Pengujian Reliabilitas Instrumen 15
2.2.5 Faktor yang Mempengaruhi Reliabilitas 17
2.2.6 Rumus Reliabilitas Instrumen 17
2.3 Daya Beda 20
2.3.1 Pengertian Daya Beda 20
2.3.2 Tujuan Daya Beda 21
2.3.3 Manfaat Daya Beda 21
2.3.4 Cara Menentukan Daya Beda 22
2.4 Studi Kasus 30
BAB 3 35
PENUTUP 35
3.1 Kesimpulan 35
3.2 Saran 36
DAFTAR PUSTAKA 37
BAB 2
PEMBAHASAN
2.1 Validitas
Jenis validitas data dibagi menjadi dua (2), yaitu validitas logis dan empiris.
Penjelasan mengenai validitas logis dan empiris seperti di bawah ini.
1. Validitas Logis
Istilah validitas logis mengandung kata logis, berasal dari kata “logika” yaitu
penalaran. Dengan demikian dapat dikatakan bahwa validitas logis merujuk pada
kondisi instrumen valid berdasarkan hasil penalaran (Arikunto, 2008:65).Secara
umum, validitas tes dibagi menjadi tiga (3) jenis, yaitu, validitas isi, berdasar kriteria,
dan konstruk. Penjelasannya adalah sebagai berikut.
2. Validitas Empiris
Arikunto (2008:66) menjelaskan bahwa istilah validitas empiris memuat kata
empiris yang artinya pengalaman. Sebuah instrumen dapat dikatakan memiliki
validitas empiris apabila sudah diuji secara empiris. Pada validitas empiris dibagi
menjadi dua (2), yaitu validitas internal dan eksternal. Penjelasannya seperti di bawah
ini.
a) Validitas internal
a) Validitas eksternal
Ada beberapa prinsip ketika melakukan uji validitas, yaitu antara lain:
b) Interpretasi yang diberikan pada asesmen hanya valid terhadap derajat yang
diarahkan ke suatu bukti yang mendukung kecocokan dan kebenarannya.
c) Penggunaan yang bisa dibuat dari hasil asesmen hanya valid terhadap derajat
yang arahnya ke suatu bukti yang mendorong kecocokan dan kebenarannya.
d) Interpretasi dan kegunaan dari hasil asesmen yang valid ketika nilai (values)
yang didapatkan sesuai
e) Interpretasi dan kegunaan dari hasil asesmen hanya valid ketika konsekuensi
(consequences) dari interpretasi dan kegunaan ini konsisten dengan nilai
kecocokan.
Ada beberapa langkah atau strategi yang bisa dilakukan untuk mencapai validitas
penelitian kualitatif. Strateginya menurut Budiastuti & Bandur (2018:140-144) adalah
seperti di bawah ini.
a) Triangulasi
Triangulasi sumber data digunakan untuk mengecek atau mencari tahu mengenai
keabsahan sumber-sumber yang digunakan untuk penelitian
Triangulasi teori digunakan untuk mengecek atau mencari tahu keabsahan dari
teori-teori yang digunakan dalam suatu penelitian
Triangulasi peneliti digunakan untuk mengecek atau mencari tahu keabsahan data
berdasarkan pandangan para peneliti-peneliti (ahli) yang sesuai dengan penelitian
tersebut.
b) Feedback
c) Member check
g) Pertanyaan iteratif
Salah satu keahlian yang dituntut bagi seorang peneliti kualitatif adalah
kemampuannya mengajukan pertanyaan-pertanyaan feedback berdasarkan alur tema
diskusi atau wawancara. Pertanyaan-pertanyaan tersebut diajukan untuk
mengonfirmasi apa yang telah disampaikan informan selama proses wawancara atau
FGDs.
Agar hasil analisis data memiliki validitas internal yang baik, peneliti juga perlu
mencantumkan tema-tema utama yang muncul dari lapangan penelitian, akan tetapi
tidak sesuai dengan kajian literatur atau kerangka teoritis. Yang perlu dijelaskan
peneliti di sini adalah mengapa data-data tersebut muncul dalam setting penelitian dan
bagaimana situasi nyata tema-tema tersebut.
2.2 Reliabilitas
Reliabilitas berasal dari kata reliability yang artinya sejauh mana hasil suatu
pengukuran dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila dalam
beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama,
diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri
subyek memang belum berubah. Nur (1987: 47) menyatakan bahwa reliabilitas
ukuran menyangkut seberapa jauh skor deviasi individu, atau skor-z, relatif konsisten
apabila dilakukan pengulangan pengadministrasian dengan tes yang sama atau tes
yang ekivalen. Azwar (2003: 176) menyatakan bahwa reliabilitas merupakan salah
satu ciri atau karakter utama instrumen pengukuran yang baik. Arifin (1991: 122)
menyatakan bahwa suatu tes dikatakan reliabel jika selalu memberikan hasil yang
sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang
berbeda.
Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan
masalah kekeliruan pengukuran. Kekeliruan pengukuran sendiri menunjukkan sejauh
mana inkonsistensi hasil pengukuran terjadi apabila dilakukan pengukuran ulang
terhadap kelompok subyek yang sama. Sedangkan konsep reliabilitas dalam arti
reliabilitas hasil ukur berkaitan erat dengan kekeliruan dalam pengambilan sampel
yang mengacu pada inkonsistensi hasil ukur apabila pengukuran dilakukan ulang pada
kelompok yang berbeda. Sudjana (2004: 16) menyatakan bahwa reliabilitas alat
penilaian adalah ketepatan atau keajegan alat tersebut dalam menilai apa yang
dinilainya. Artinya, penggunaan alat penilaian tersebut, akan memberikan hasil yang
relatif sama.
Dari beberapa pengertian di atas jadi reliabilitas tes merupakan suatu alat ukur
yang digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya
menunjukan keajegan. Seorang dikatakan dapat dipercaya apabila orang tersebut
berbicara ajeg, tidak berubah-ubah pembicaraannya dari waktu ke waktu. Dalam
sebuah tes pentingnya diamati keajegan dan kepastian tes tersebut dilihat dari hasil tes
yang didapat.
Djaali (2000: 81) menyatakan bahwa reliabilitas dibedakan atas dua macam,
yaitu reliabilitas konsistensi tanggapan, dan reliabilitas konsistensi gabungan butir.
Reliabilitas konsistensi tanggapan responden mempersoalkan apakah tanggapan
responden atau obyek ukur terhadap tes atau instrumen tersebut sudah baik atau
konsisten. Dalam hal ini apabila suatu tes atau instrumen digunakan untuk melakukan
pengukuran terhadap obyek ukur kemudian dilakukan pengukuran kembali terhadap
obyek ukur yang sama, apakah hasilnya masih tetap sama dengan pengukuran
sebelumnya. Jika hasil pengukuran kedua menunjukkan ketidakkonsistenan maka
jelas hasil pengukuran itu tidak mencerminkan keadaan obyek ukur yang
sesungguhnya.
Uji reliabilitas dengan metode tes ulang digunakan untuk mengetahui sejauh
mana suatu pengukuran dapat diandalkan. Uji ini dilakukan sebanyak dua kali,
pengukuran pertama dan ulangnya. Kedua pengukuran dapat dilakukan oleh orang
yang sama atau berbeda. Dalam hal ini perlu diatur bahwa proses pengukuran kedua,
keadaan yang diukur itu harus benar-benar sama. Selanjutnya hasil pengukuran yang
pertama dan yang kedua dikorelasikan dan hasilnya menunjukkan reliabilitas dari tes
ini.
Hal penting yang perlu diperhatikan dalam pengukuran reliabilitas tes ulang
adalah;
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran dan susunan tetapi butir-butir soalnya berbeda, dalam istilah
bahasa Inggris disebut alternate-forms method (parallel forms).
Pengujian reliabilitas instrument dengan cara ini cukup dilakukan sekali, tetapi
instrumennya dua, pada responden yang sama, waktu sama, instrument berbeda.
Reliabilitas instrument dihitung dengan cara mengkorelasikan antara data instrument
yang satu dengan data instrument yang dijadikan ekuivalen. Bila korelasi positif dan
signifikan, maka instrument dapat danyatakan reliable.
1. Panjang test, semakin panjang test evaluasi, semakin banyak jumlah item materi
pembelajaran diukur. Ini menunjukan dua kemungkinan yaitu test semakin
mendekati kebenaran, dan dalam memgikuti test, semakin kecil siswa menebak.
Berarti semakin tinggi koefisien reliabilitas.
3. Kesulitan test; test normative yang terlalu mudah atau terlalu sulitskor untuk
siswa cenderung menghasilkan reliabilitas rendah. Fenomena tersebut, akan
menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi.
4. Untuk test yang terlalu mudah skor jawaban siswa akan mengumpul ada sisi atas,
untuk tes terlalu sulit skor jawaban siswa akan cenderung mengumpul pada ujung
bawah. Dua kejadian tersebut mempunyai kesamaan yaitu bahwa perbedaan di
antara individu adalah kecil dan cenderung tidak relevan
Keterangan:
ri = reliabilitas instrument
rb = indeks korelasi antara dua belahan instrument
N = banyaknya responden
X = belahan pertama
Y = belahan kedua
b) Rumus Flanagan
Keterangan:
ri = reliabilitas instrument
v1 = varians belahan pertama (varian skor butir-butir ganjil)
v2 = varians belahan kedua (varian skor butir-butir genap)
vt = varians skor total
c) Rumus Rulon
Keterangan:
ri = reliabilitas instrument
Vt = varians total atau varians skor total
Vd = varians (varians difference)
d = skor pada belahan awal dikurangi skor pada belahan akhir
d) Rumus KR 20
Keterangan:
ri = reliabilitas instrument
k = banyaknya butir pertanyaan atau banyaknya soal
pi = proporsi subjek yang menjawab betul pada suatu butir (proporsi subjek yang
mendapat skor 1)
e) Rumus KR 21
Keterangan:
ri = reliabilitas instrument
k = banyaknya butir pertanyaan atau banyaknya soal
p = skor rata-rata
Daya pembeda adalah kemampuan suatu soal untuk membedakan antara siswa
yang pandai prestasi tinggi dengan siswa yang kurang pandai prestasi rendah Arifiani
2011:25. Subrayata dalam Rasyid, 2007:229 mengatakan bahwa tujuan pokok
mencari daya beda soal adalah untuk menentukan apakah butir soal tersebut memiliki
kemampuan membedakan kelompok dalam aspek yang diukur sesuai dengan
perbedaan yang ada pada kelompok tersebut. Salah satu tujuan analisis kuantitatif soal
adalah untuk menentukan dapat tidaknya suatu soal membedakan kelompok dalam
aspek yang di ukur sesuai dengan perbedaan yang ada dlam kelompok itu. Indeks
yang di gunakan dalam membedakan peserta tes yang berkemampuan tinggi dengan
peserta tes yang berkemampuan rendah adalah indeks daya pembeda. Indeks ini
menunjukkan kesesuaian antara fungsi soal dengan fungsi tes secara keseluruhan.
Dengan demikian validitas soal ini sama dengan daya pembeda soal yaitu daya yang
membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang
berkemampuan rendah.
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk
dapat membedakan (mendiskriminasi) antara testee yang berkemampuan tinggi
(pandai) dengan testee yang berkemampuan rendah (tidak pandai) sehingga sebagian
testee yang berkemampuan tinggi untuk menjawab butir item tersebut lebih banyak
yang menjawab benar, sementara testee yang berkemempuan rendah untuk menjawab
item tes terrsebut sebagian besar tidak dapat menjawab item soal dengan benar.
Dengan kata lain, bahwa analisis daya beda item adalah analisis yang mengungkapkan
seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan
siswa kelompok rendah. Salah satu ciri butir yang baik adalah yang mampu
membedakan antara kelompok atas (yang mampu) dan kelompok bawah (kurang
mampu).Ini dianggap sangat penting karena ada anggapan bahwa kemampuan setiap
testee akan berbeda dengan testee yang lainnya.
Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam bentuk
proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang
bersangkutan membedakan siswa yang telah memahami materi dengan peserta didik
yang belum memahami materi.
a) Untuk menghitung daya pembeda setiap butir soal dapat digunakan rumus
sebagai berikut:
DP= --------------
n
Keterangan:
N = 27% X N
0,20-0,29 = kurang baik
Daya beda soal adalah kemampuan suatu soal untuk membedakan antara
peserta didik yang sudah menguasai materi, dan peserta didik yang belum menguasai
materi kompetensi dasar (Kunandar, 2014:240-241).
D = 2 (A-B) : T
Keterangan:
4) 50% peserta tes peringkat atas masuk kelompok A, dan 50% peserta tes
peringkat bawah masuk kelompok B.
Berdasarkan kriteria daya beda tes, daya beda perangkat tes di atas dengan Dp = 0,22
termasuk ke dalam kriteria cukup baik
Rumus untuk menghitung tingkat daya beda butir tes hasil belajar adalah sebagai
berikut.
Kriteria daya beda (D) menurut Agung (2011:55) adalah sebagai berikut
Jika “D” negatif berarti soal tersebut buruk dan harus dibuang. Tes yang baik apabila
memiliki nilai D antara 0,15 - 0,20 atau lebih
Daya beda butir soal yang sering digunakan dalam tes hasil belajar adalah dengan
cara menggunakan indeks korelasi antara skor butir dengan skor totalnya
Misalnya sebuah data diperoleh dari hasil ulangan matematika kelas 2 SD. Bentuk
soal adalah pilihan ganda.
Apabila siswa menjawab dengan benar, maka diberikan poin 1 (satu). Apabila siswa
salah menjawab atau tidak menjawab soal, maka diberikan poin 0 (nol).
Nama Total
Siswa Skor
1 2 3 4 5 6 7 8 9 10
Budi 1 1 0 0 1 1 1 0 0 1 7
Anton 1 1 1 1 1 1 0 1 1 1 9
Putri 1 1 0 0 1 1 1 1 1 1 8
Cantika 1 1 0 1 1 1 1 1 1 1 9
David 0 1 1 1 1 1 1 0 1 1 8
Valen 1 1 1 0 1 1 0 1 0 1 7
Era 0 1 0 0 1 1 0 1 1 1 6
Ahmad 1 1 1 1 1 1 1 0 1 0 8
Adit 0 1 0 1 1 1 1 1 1 0 7
Dewani 0 1 0 1 1 1 0 0 0 1 5
Sekarang data dipecah menjadi kelompok atas dan kelompok bawah. Kelompok atas
adalah yang memiliki skor total lebih tinggi dari kelompok bawah.
Jumlah siswa pada tabel tersebut adalah 10 orang, maka 5 orang kelompok atas dan 5
orang kelompok bawah.
Agar lebih mudah mengelompokkannya. Urutkan siswa dengan total skor tertinggi ke
skor terendah di aplikasi Microsoft Excel. Caranya : blok nama siswa beserta nilai
totalnya, pilih logo sort & liter lalu Costum sort. Setting sesuai yang dikehendaki lalu
tekan OK
Kelompok Atas
Anton 1 1 1 1 1 1 0 1 1 1 9
Cantika 1 1 0 1 1 1 1 1 1 1 9
Putri 1 1 0 0 1 1 1 1 1 1 8
David 0 1 1 1 1 1 1 0 1 1 8
Ahmad 1 1 1 1 1 1 1 0 1 0 8
Nilai PA diperoleh dengan menjumlahkan soal yang benar secara vertikal lalu dibagi
jumlah penjawab soal. Soal yang dijawab benar sebanyak 4 dan jumlah siswa
kelompok atas 5. PA diperoleh dari 4 dibagi 5 maka hasilnya 0,8. Berlaku seterusnya
Kelompok Bawah
Nomor Butir Soal
Nama Total
Siswa Skor
1 2 3 4 5 6 7 8 9 10
Valen 1 1 1 0 1 1 0 1 0 1 7
Adit 0 1 0 1 1 1 1 1 1 0 7
Budi 1 1 0 0 1 1 1 0 0 1 7
Era 0 1 0 0 1 1 0 1 1 1 6
Dewani 0 1 0 1 1 1 0 0 0 1 5
Contoh cara mencari daya beda butir tes nomor 1 adalah sebagai berikut,
Diketahui:
A. Pendahuluan
Salah satu karakter yang perlu dikembangkan siswa di sekolah adalah cinta
damai. Galtung (1967) mengkonsep makna damai itu sendiri adalah sebagai suatu
kondisi internal manusia yang memiliki pikiran damai terhadap dirinya sendiri ketika
dihadapkan pada situasi tertentu. Seseorang yang memiliki karakter cinta damai
cenderung menjadi ribadi yang tenang dan tidak mudah meluapkan amarahnya terlalu
berlebihan dan memunculkan perilaku yang menyakiti orang lain secara sengaja atau
disebut dengan perilaku agresi.
Kondisi yang diharapkan sesuai dengan uraian di atas belum semuanya berjalan
dengan maksimal. Hal ini ditunjukkan dengan berbagai hasil penelitian yang
menunjukkan bahwa berbagai perilaku agresi masih dilakukan oleh remaja.
Berdasarkan penelitian yang dilakukan oleh Hidayat, Yusri & Ilyas (2013)
menyimpulkan terkait profil perilaku agresi siswa bahwa perilaku agresi siswa dapat
dilihat dari menyakiti orang lain secara fisik dengan persentase 35,32%,sedangkan
tindakan agresi yang dilakukan siswa dilihat dari menyakiti orang secara verbal
41,30%, dan tindakan agresi dilihat dari merusak dan menghancurkan harta benda
dengan persentase 30,42%.
Penelitian di atas ditunjukkan secara nyata di Yogyakarta dengan munculnya
fenomena yang disebut dengan klitih. Fenomena klitih adalah sebutan untuk gaya
kriminalitas yang dilakukan pelajar di wilayah provinsi Daerah Istimewa Yogyakarta.
Kasus yang terjadi adalah sekelompok pelajar yang berkeliaran pada malam hari
dengan membawa senjata dalam keadaan mabuk, sehingga menimbulkan kasus
tawuran pelajar hingga kasus pembacokan antar pelajar. Fenomena ini adalah salah
satu bentuk krisis karakter yang dialami pelajar di provinsi Daerah Istimewa
Yogyakarta yang terkenal dengan kota pelajar atau kota seni budaya.
Fenomena klitih ini termasuk salah satu contoh perilaku agresi yang dilakukan
remaja karena berusaha menyakiti orang lain baik verbal maupun nonverbal dengan
sengaja. Hal ini sesuai dengan pernyataan Ramirez (2009) yang menyatakan bahwa
perilaku agresi adalah fenomena kompleks yang beroperasi pada beberapa tingkat,
dengan berbagai macam makna, dan dimunculkan dalam berbagai bentuk perilaku
yang dalam hal ini adalah klitih.
Permasalahan di atas mendorong untuk dikembangkannya sebuah alat ukur yang
berguna mengukur tingkat perilaku agresi pada remaja di provinsi Daerah Istimewa
Yogyakarta. Alat ukur yang dikembangkan berupa skala perilaku agresi. Skala
perilaku agresi yang dikembangkan dengan mendasarkan pada teori yang
dikembangkan oleh Buss & Perry (1992) yang menyatakan perilaku agresif sebagai
perilaku atau kecenderungan perilaku yang niatnya untuk menyakiti orang lain baik
secara fisik maupun secara psikologis. Pada teori tersebut dijelaskan bahwa perilaku
agresi memiliki empat aspek utama, yaitu fisik, verbal, kemarahan, dan kebencian.
Alat ukur ini akan sangat berguna untuk mengukur tingkat perilaku agresi yang
dialami siswa. Hasil pengukuran akan menjadi acuan atau dasar pihak-pihak yang
bertanggung jawab seperti guru, konselor, atau orang tua siswa untuk meminimalisir
permasalahan agresi yang dilakukan siswa. Ini menjadi masalah serius sekaligus
tantangan bagi pihak-pihak yang bertanggung jawab tersebut untuk mencegah siswa
terlampau tinggi tingkat perilaku agresi yang dilakukan.
Perilaku agresi menjadi masalah serius dan dapat berdampak negatif bagi
berbagai kalangan jika tidak segera disadari dan dicari jalan keluarnya. Goldstein,
Young & Boyd (2008) dalam penelitiannya menyatakan bahwa perilaku agresi
berkaitan erat dengan persepsi remaja tentang dari iklim sekolah. Senada dengan
penelitian sebelumnya, Marsh, McGee & Williams (2014) melalui penelitiannya
menyatakan bahwa perilaku agresi menjadi pendorong bagi munculnya persepsi
buruk siswa terhadap iklim sekolah. Sehingga dampak terbesar dari persepsi siswa
tentang iklim sekolah yang buruk adalah menurunnya prestasi belajar siswa.
Dampak negatif yang dijelaskan di atas menunjukkan bahwa tingkat perilaku
agresi perlu segera disadari oleh pihak-pihak yang bertanggung jawab. Hal ini
dimaksudkan agar perilaku maladaptif tersebut segera mendapat penanganan jika
memang terjadi di kalangan pelajar. Oleh sebab itu, diperlukan instrumen yang salah
satunya adalah skala psikologis yang berupa skala perilaku agresi. Akan tetapi sebuah
skala psikologis sebelum diimplementasikan sebagai alat ukur perlu untuk diuji coba
dahulu sehingga akan diketahui kelayakan instrumen berdasarkan hasil uji validitas
dan reliabilitas. Artikel ini akan memaparkan tentang hasil uji validitas dan reliabilitas
skala perilaku agresi sehingga skala psikologis tersebut menjadi skala yang layak
untuk mengukur tingkat perilaku agresi yang dilakukan oleh siswa.
B. Metode Penelitian
Penelitian ini bertujuan untuk menganalisis tingkat validitas dan reliabilitas
instrumen skala perilaku agresi. Skala perilaku agresi sebelum digunakan perlu
dilakukan uji coba untuk mengetahui validititas dan reliabilitasnya. Penelitian ini
menggunakan korelasi product moment untuk menentukan tingkat validitasnya dan
menggunakan rumus alpha cronbach untuk menentukan tingkat reliabilitasnya. Uji
validitas dan reliabilitas skala perilaku agresi dibantu dengan aplikasi SPSS 16.
D. Kesimpulan
Penelitian ini dilakukan untuk menganalisis tingkat validitas dan reliabilitas
instrumen skala perilaku agresi. Berdasarkan hasil uji coba pada 112 responden maka
didapatkan hasil bahwa dari 50 butir item, 38 butir item dinyatakan valid dan sisanya
12 item dinyatakan tidak valid. Sedangkan koefisien reliabilitasnya adalah 0,826 yang
termasuk dalam kategori reliabilitas tinggi. Berdasarkan hasil penelitian ini,
seyogyanya konselor dapat menggunakan instrumen skala perilaku agresi ini untuk
mengidentifikasi tingkat perilaku agresi siswa.
Sumber Jurnal :
Saputra, W. N. E., & Handaka, I. B. (2017, August). Analisis Validitas dan Reliabilitas Skala
Perilaku Agresi. In Seminar Nasional Bimbingan Konseling Universitas Ahmad
Dahlan (Vol. 2).
BAB 3
PENUTUP
3.1 Kesimpulan
Validitas data adalah suatu kecermatan atau ketepatan suatu alat ukur dalam
mengukur sesuatu atau secara khusus mengukur data penelitian. Validitas data sendiri
digunakan untuk mengukur benar atau salah mengenai data yang digunakan pada
suatu penelitian yang bersifat kuantitatif.
Reliabilitas alat penilaian adalah ketepatan atau keajegan alat tersebut dalam
menilai apa yang dinilainya. Artinya, penggunaan alat penilaian tersebut, akan
memberikan hasil yang relatif sama
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk
dapat membedakan (mendiskriminasi) antara testee yang berkemampuan tinggi
(pandai) dengan testee yang berkemampuan rendah (tidak pandai) sehingga sebagian
testee yang berkemampuan tinggi untuk menjawab butir item tersebut lebih banyak
yang menjawab benar, sementara testee yang berkemempuan rendah untuk menjawab
item tes terrsebut sebagian besar tidak dapat menjawab item soal dengan benar.
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalusukar.
Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggiusaha
pemecahannya. Sebaliknya soal yang terlalu sukar akan menyebabkansiswa menjadi
putus asa dan tidak mempunyai semangat untuk mencoba lagikarena diluar
jangkauannya.Daya pembeda soal yaitu kemampuan sesuatu soal untuk
membedakanantara siswa yang berkemampuan tinggi dengan siswa yang
berkemampuanrendah. Angka yang menunjukkan besarnya daya pembeda disebut
indeksdiskriminasi ( D), dan nilainya berkisar antara 0,00 sampai 1,00. Pada daya
pembeda ini berlaku tanda negatif yang digunakan jika sesuatu soal “terbalik”
menunjukkan kualitas testee yaitu anak pandai disebut bodoh dan anak bodoh disebut
pandai.
3.2 Saran
Siswanto, S. 2014. “Validitas Sebagai Alat Penentuan Kehandalan Tes Hasil Belajar”.
dalam Jurnal Pendidikan Akuntasi Indonesia Volume 6 (hal. 107-117).