Anda di halaman 1dari 8

Materi 11

Pengukuran sikap memiliki sejarah yang agak kotak-kotak sejak kemungkinan


pencapaiannya berhasil ditunjukkan oleh Thurstone pada tahun 1929. Ini telah
menjadi area penting dalam pendidikan sains, khususnya dalam konteks penurunan
serapan dalam ilmu fisika di banyak negara, dan ada banyak upaya untuk mengukur
sikap pelajar untuk mengeksplorasi mengapa mereka meninggalkan studi dalam
mata pelajaran tersebut. Makalah ini mengeksplorasi tempat pengukuran sikap
dalam pendidikan sains dan menelusuri pendekatan utama yang telah
dikembangkan. Tempat dan sifat teknik penskalaan sikap dianalisis dan ditunjukkan
bahwa teknik semacam itu memiliki banyak kelemahan mendasar. Kelemahan ini
membuat pendekatan semacam itu tidak mungkin menawarkan jenis presisi yang
dibutuhkan untuk membawa pemahaman kita tentang pengembangan sikap ke
depan dalam konteks pendidikan sains. Pendekatan alternatif diuraikan dan sangat
disarankan agar penelitian pendidikan sains menolak teknik penskalaan seperti itu
dan bergerak maju untuk mengembangkan pendekatan baru yang dapat
memberikan jenis analisis terperinci yang akan terbukti positif dan bermanfaat.
Makalah ini berusaha mengumpulkan bukti dari banyak sumber, untuk menantang
banyak asumsi yang tidak dipertanyakan di balik metodologi yang digunakan dalam
banyak studi terkait sikap saat ini dan untuk memberikan kontribusi positif dalam
mendorong metodologi yang lebih tepat untuk diadopsi secara lebih luas.

Thurstone menantang posisi ini ketika dia menerbitkan makalahnya tahun 1929 yang
berjudul 'Sikap dapat diukur'. Tekniknya cerdik tetapi sangat rumit (Thurstone &
Chave, 1929). Meskipun demikian, karyanya membuka area baru dan ia segera
diikuti oleh Likert (1932). Likert menggunakan pertanyaan yang membutuhkan
tanggapan mulai dari 'sangat setuju' hingga 'sangat tidak setuju' (pada skala lima
poin) atau dari 'sangat setuju' hingga 'sangat tidak setuju' (pada skala tujuh poin).
Gaya pertanyaan ini mungkin merupakan bentuk pertanyaan yang paling umum
digunakan saat ini. Pengukuran sikap menerima dorongan baru setelah Perang
Dunia II, ketika dana yang cukup besar tersedia di AS untuk penelitian. Teks seperti
Komunikasi dan persuasi Hovland (Hovland et al., 1953) telah menawarkan
wawasan yang kuat yang telah teruji oleh waktu.
Salah satu aspek sikap yang kurang lebih memiliki kesepakatan universal adalah
menyangkut aspek kognitif, afektif, dan perilaku. Jadi, misalnya, sikap siswa
terhadap fisika memang membutuhkan pengetahuan tentang apa yang sebenarnya
terlibat dalam fisika, perasaan apa yang dimiliki siswa terhadap fisika dan hal itu
dapat mengarah pada komitmen untuk mengambil kursus fisika berikutnya.
Demikian pula, sikap terhadap industri kimia mungkin sangat bergantung pada
informasi tentang sifat, tujuan dan aktivitas industri kimia, serta semua jenis
perasaan tentang tempatnya di masyarakat dan dalam menghasilkan produk yang
berguna dan, mungkin, polusi yang berbahaya. Perilaku mungkin terlihat kemudian
dalam keinginan untuk bekerja di industri tersebut, untuk membeli rumah di dekat
industri tersebut atau bahkan untuk mendukung partai politik yang mendukung atau
mengutuk aspek tertentu dari industri tersebut. Keseimbangan antara kognitif,
afektif dan perilaku dapat bervariasi tetapi, dalam satu penelitian, ide keseimbangan
agak diperluas ketika 'sikap kognitif' dijelaskan. Dalam studi ini, sikap seperti itu
sangat bergantung pada pengetahuan dan pengalaman dan pekerjaan menunjukkan
bahwa sikap seperti itu relatif mudah dikembangkan, sedangkan sikap yang lebih
pribadi jauh lebih tahan terhadap perubahan.

Pengukuran Sikap
Salah satu model hubungan antara sikap dan perilaku yang lebih diterima secara
umum dikembangkan oleh Ajzen dan Fishbein (1980). Mereka menemukan bahwa
perilaku diprediksi dengan baik dari niat perilaku (apakah Anda berniat
melakukannya ...?). Niat perilaku ini pada gilirannya dapat dijelaskan dan diprediksi
dari sikap dan norma sosial (pendapat orang lain). Pada tahun 1988, Ajzen
memodifikasi model ini dengan menambahkan kontrol perilaku yang dirasakan
(bisakah saya melakukan ...?) sebagai faktor penjelas tambahan dalam model. Jadi,
menurut Theory of Planned Behaviour, perilaku individu dipengaruhi oleh sikap
mereka terhadap perilaku tertentu, sikap rekan mereka (misalnya, teman sebaya,
keluarga, dan mentor) terhadap perilaku tersebut, dan kontrol individu atas perilaku
tersebut. Ajzen, 1985). Hasil dari karya Skryabina (Reid & Skryabina, 2002a) pada
sikap terhadap fisika ditemukan cocok dengan model ini.

Pentingnya sikap dalam semua aspek pendidikan di semua jenjang berarti perlu
adanya pengukuran sikap. Pengukuran ini harus dapat memberikan gambaran yang
akurat dan valid tentang sikap pembelajar terhadap beberapa aspek tertentu dari
pembelajaran dalam mata pelajaran IPA. Harus ditekankan bahwa semua sikap
harus disimpulkan dari perilaku yang diamati. Sikap tetap merupakan konstruksi
laten yang tidak terbuka untuk pengukuran langsung tetapi hanya toinferensi. Ini
tidak seserius kedengarannya. Guru dan dosen dengan senang hati memberikan nilai
dan bahkan derajat atas dasar menandai sampel pekerjaan siswa (perilaku) dan
mampu membuat segala macam pernyataan tentang kepercayaan diri mereka pada
pemahaman pelajar atas bukti tersebut. Inferensi adalah 'hal-hal pendidikan'.
Perhatian diperlukan dengan kognitif. Sikap hati-hati juga diperlukan. Dalam diskusi
penting yang telah teruji oleh waktu, Cook & Selltiz (1964) mengkategorikan teknik
pengukuran sikap menjadi lima jenis. Di sekolah, teknik kertas dan pensil harus
mendominasi. Mereka dapat diterima secara sosial dan pendekatan semacam itu
dapat menangani sejumlah besar di sekolah dan universitas. Ada dua pendekatan:
kita dapat meminta pelajar untuk memberi tahu kita (secara tertulis atau
wawancara) apa yang mereka pikirkan atau kita dapat mencoba merancang tes,
tanggapan yang dapat menyoroti sikap pelajar. Yang pertama terbuka untuk
kesalahan dalam pelaporan diri yang mungkin condong oleh hal-hal seperti
keinginan untuk memberikan jawaban yang 'diinginkan', sedangkan jenis pertanyaan
yang terakhir sangat sulit untuk dirancang.

Meskipun demikian, pengalaman dengan teknik laporan diri (seperti teknik Likert,
1932) menunjukkan bahwa, dalam sebagian besar kondisi, responden sangat jujur
dan konsisten dalam tanggapan mereka. Hasil dari beberapa materi kurikulum baru
untuk siswa biologi, tercatat bahwa, dengan dua kelompok tahun berturut-turut (550
dan 750) siswa biologi, gambaran keseluruhan pada masing-masing dari sembilan
pertanyaan yang diajukan (pertanyaan tipe Likert) ditemukan berbeda kurang dari
1% dalam setiap kategori tanggapan (lihat Clarkburn et al., 2000, untuk garis besar
penyelidikan). Kesepakatan urutan ini sangat tinggi dan menegaskan bahwa, dengan
sampel besar, data survei dapat menjadi kuat. Dalam melihat teknik kertas dan
pensil, beberapa jenis pertanyaan telah diidentifikasi: (a) pertanyaan dengan format
yang mirip dengan yang dikembangkan oleh Osgood;(b) pertanyaan dengan format
yang mirip dengan yang dikembangkan oleh Likert;(c) pertanyaan peringkat; dan (d)
set pertanyaan situasional.

Pendekatan-pendekatan ini telah dibahas secara singkat di tempat lain, dengan


contoh-contoh yang diberikan dari literatur dan kekuatan dan kelemahannya
diringkas (Reid, 2004). Empat contoh pertanyaan tertulis dikutip dari sumber ini di
Lampiran. Wawancara dapat menawarkan wawasan yang sangat kaya. Mereka bisa
sangat terstruktur atau benar-benar terbuka, tetapi seringkali wawancara dapat
digambarkan sebagai semi-terstruktur. Di sini pewawancara memiliki serangkaian
pertanyaan untuk diskusi tetapi ada kebebasan untuk menguraikan atau berpindah
dari agenda yang sesuai. Jika wawancara sangat terstruktur, maka analisis data bisa
lebih sederhana. Sebagai contoh, kita cukup mencatat proporsi siswa yang menyukai
laboratorium, menggunakan buku teks yang diberikan secara teratur, menulis ulang
catatan kuliah mereka setelah kuliah dan sebagainya. Namun, sebagian besar
wawancara, dalam beberapa hal, tidak begitu terstruktur dan siswa dapat
merespons dengan cara yang sangat berbeda menggunakan bahasa yang sangat
berbeda. Memang, dalam wawancara terbuka, siswa bahkan dapat menentukan
agenda. Ada cukup banyak penelitian yang mengikuti paradigma yang terakhir ini

Skoring Sikap
Misalkan tes sains diatur dengan sepuluh pertanyaan, masing-masing membawa
sepuluh nilai. Sepuluh pertanyaan biasanya dikembangkan untuk mencakup sepuluh
tema berbeda dari pekerjaan yang akan diuji atau sepuluh bidang keterampilan yang
berbeda. Upaya dilakukan untuk membuat sepuluh pertanyaan dari tingkat
permintaan yang serupa sehingga nilai dalam satu pertanyaan bernilai sesuatu yang
mirip dengan tanda di pertanyaan lain. Kertas-kertas tersebut ditandai dan skor
untuk setiap pertanyaan dijumlahkan untuk memberikan skor total. Diasumsikan
bahwa semua nilai yang diberikan memiliki bobot yang sama (dan, dengan hati-hati,
ini bukan asumsi yang tidak masuk akal). Diasumsikan bahwa nilai total
mencerminkan kemampuan atau kinerja siswa terkait dengan mata kuliah yang
dinilai. Ini mungkin benar atau tidak, tergantung pada seberapa baik sepuluh
pertanyaan mencerminkan tujuan kursus dan seberapa baik mereka menawarkan
cakupan tujuan ini. Idealnya, tanda harus distandarisasi sebelum ditambahkan. Ini
jarang dilakukan dalam kertas ujian tetapi harus dilakukan ketika menambahkan
tanda dari kertas terpisah di mana rata-rata dan standar deviasi dapat sangat
bervariasi. Hal ini telah dibahas dalam Reid (2004). Apa yang terjadi dengan sikap?
Pendidikan cenderung mengikuti petunjuk dari psikologi dan menggunakan teknik
penskalaan.
Di sini item diberi skor, misalnya:
'sangat setuju' = 5, 'setuju' = 4, 'netral' = 3, 'tidak setuju' = 2 dan 'sangat tidak
setuju' = 1.

Skor untuk semua item kemudian dijumlahkan untuk memberikan skor total.
Seringkali, skor ini ditafsirkan menggunakan semua jenis teknik statistik, beberapa di
antaranya membuat asumsi yang sulit dipertahankan. Diasumsikan bahwa
pertanyaan-pertanyaan tersebut mengukur hal yang sama dan menambahkannya
bersama-sama akan memberikan akurasi yang lebih besar. Psikolog menggunakan
pendekatan ini karena, seringkali, mereka melihat semacam konstruksi laten. Ini
tidak serta merta membenarkan apa yang mereka lakukan tetapi menawarkan
semacam penjelasan mengapa mereka bekerja dengan cara ini. Tujuan dalam
pendidikan berbeda. Dengan cara yang sama seperti tes, misalnya kesehatan
reproduksi, mungkin berusaha untuk mendapatkan bukti tentang keterampilan dan
pemahaman siswa atas berbagai topik, survei sikap mungkin ingin mengeksplorasi
banyak aspek, katakanlah, pandangan siswa tentang kesehatan reproduksi dan
pembelajaran kesehatan reproduksi. Hal-hal seperti itu tidak dapat 'ditambahkan'
untuk memberikan hasil yang berarti. Meskipun demikian, hal ini sering dilakukan.
Sebuah contoh menggambarkan hal ini. Tiga pertanyaan berikut diajukan sebagai
bagian dari kuesioner bersama, yang dirancang dalam format Likert.
1) Saya percaya bahwa diskusi dengan rekan sebaya adalah bagian penting
dalam pembelajaran kesehatan reproduksi.
2) Diskusi rekan sebaya membantu pemahaman saya tentang topik kesehatan
reproduksi.
3) Diskusi rekan sebaya meningkatkan pemahaman saya

Masalah dengan penskalaan Mungkin untuk membuat daftar masalah dengan teknik
penskalaan:
1) Tidak ada cara untuk memastikan bahwa langkah-langkah pada skala
memiliki jarak yang sama. Tidak mungkin mengukur jarak.
2) Nilai pada satu pertanyaan mungkin tidak sebanding dengan yang lain.
Hampir pasti, ini tidak dan kita tidak memiliki cara untuk mengetahui nilai
relatifnya.
3) Korelasi sering kali mengasumsikan normalitas yang seringkali tidak ada.
Memang, kemiringan besar mungkin 'diinginkan' dan polarisasi mungkin
sering diamati.
4) Korelasi tidak selalu menyiratkan hubungan langsung.
5) Skor serupa dapat diperoleh untuk pola sikap yang sangat berbeda.
6) Ada masalah yang terkait dengan kesalahan dan 'kelembutan' data kategoris.
Untuk individu, ini mungkin sebesar 20%.
7) Menggabungkan skor menyembunyikan detail kaya yang muncul dari setiap
pertanyaan. Distribusi dalam setiap pertanyaan terpisah adalah yang
terpenting.
Prinsip-prinsip umum yang penting (1) Pengembangan sikap sangat penting
karena akan mempengaruhi perilaku di masa depan dan perilaku tersebut
mungkin memiliki konsekuensi yang sangat signifikan bagi individu dan
masyarakat. (2) Pengukuran sikap, oleh karena itu, sangat penting dan
diperlukan untuk validitas pendekatan yang akurat dan menawarkan wawasan
yang kaya. (3) Sebagian besar sikap yang terkait dengan pendidikan sains
memiliki banyak segi dan setiap upaya untuk mengurangi pengukuran ke skor
akhir untuk setiap individu akan cenderung memberikan angka yang tidak
berarti. (4) Pengukuran sikap yang absolut tidak mungkin dilakukan. Hanya
perbandingan yang dapat dibuat. (5) Ada banyak pendekatan kertas-dan-pensil:
berdasarkan Likert, Osgood serta pertanyaan peringkat dan pertanyaan
situasional, wawancara dapat menawarkan wawasan yang berguna. Prinsip
analisis (6) Data yang diperoleh dari pertanyaan kuesioner adalah bersifat
kategoris dan perhatian harus diberikan pada sifat data ini dalam menentukan
teknik statistik apa yang harus digunakan.(7) Data yang diperoleh dari
pertanyaan kuesioner 'lunak' dalam arti bahwa, untuk individu, batas
kesalahannya tinggi. Setiap 'skor' yang diperoleh untuk seorang individu, oleh
karena itu, akan terbuka untuk kesalahan yang cukup besar, meskipun jumlah
pertanyaan sangat besar.(8) Secara umum, statistik parametrik hanya boleh
digunakan dengan hati-hati dalam setiap pengukuran sikap di mana kondisi
untuk penggunaan teknik seperti itu sering tidak memuaskan. (9) Keandalan
tidak dapat diukur dengan metode tradisional seperti 'split half' dan Cron-bach's
Alpha: ini mengukur konsistensi, yang bahkan mungkin tidak diinginkan. (10)
Analisis Komponen Utama harus digunakan dengan peringatan. Ini mungkin
mengandalkan asumsi perkiraan normalitas. Meskipun tidak mungkin mengarah
pada kesimpulan yang salah, hal itu mungkin berakhir dengan mengurangi data
sedemikian rupa sehingga detail yang kaya hilang. Namun demikian, ini dapat
memberikan wawasan yang bermanfaat

Validitas dan reliabilitas Variabel Sikap


Validitas dapat diperiksa dengan:
(i) mencari pendapat dari sekelompok orang yang mengetahui populasi, sikap
yang dipertimbangkan dan konteks sosial.
(ii) mengembangkan pertanyaan berdasarkan populasi (misalnya, dengan cara
diskusi atau kuesioner sebelumnya).
(iii) wawancara sampel;
(iv) membandingkan kesimpulan yang diambil dari pengukuran sikap dengan
pengamatan independen lainnya.
Reliabilitas dapat diperiksa dengan prosedur tes dan tes ulang.
Meskipun ini tidak memberikan pemeriksaan, reliabilitas dijamin dengan baik
oleh: (i) menggunakan sampel besar; (ii) pra-pengujian yang cermat; (iii)
memeriksa bahwa kondisi pengujian dapat diterima secara sosial; (iv)
menggunakan pertanyaan yang cukup, dengan pemeriksaan silang (misalnya
pertanyaan berulang, pertanyaan serupa).

Validitas jauh lebih penting daripada reliabilitas. Dimungkinkan untuk memiliki


tes yang tidak valid secara reliabel. Tes yang tidak dapat diandalkan akan selalu
tidak valid.

Anda mungkin juga menyukai