Anda di halaman 1dari 47

MATERI 3.

2
DEFINING AND MEASURING VARIABLES
(Gravetter & Forzano, 2018, chapter 3)

KODE MATA KULIAH : PS33016


MATA KULIAH : METODOLOGI PENELITIAN KUANTITATIF
TANGGAL PEMBUATAN : 25 AGUSTUS 2020
REVISI KE - : 1 (17072021)
PENYUSUN : MEYLISA PERMATA SARI, S.PSI., M.SC.
Pembahasan
▪ Constructs and Operational Definitions
▪ Validity and Reliability of Measurement
▪ Scales of Measurement
▪ Modalities of Measurement
▪ Other Aspects of Measurement
Pendahuluan
▪ Variabel psikologi bervariasi:
• Objektif, konkrit, mudah didefinisikan, mudah diukur.
o Contoh: Peran warna t-shirt terhadap jumlah tip yang ditinggalkan.
• Abstrak, sulit didefinisikan dan diukur.
o Contoh: rasa malu.
▪ Perlu berhati-hati dan teliti dalam mendefinisikan variabel.
Pendahuluan
▪ Setelah kita mendefinisikan variabel, maka dapat mengukur variabel
tersebut.
• Memilih ALAT UKUR yang tepat sangatlah penting.
• Apakah alat ukur variabel sesuai dengan definisi yang digunakan?
• Dan ada dua kriteria yang perlu digunakan dalam mengevaluasi kualitas
prosedur pengukuran:
o Validitas (Kesesuaian)
o Reliabilitas (Konsistensi)
Hypothetical Constructs
▪ Penelitian psikologi melakukan studi pada proses mental seseorang
• Sifatnya abstrak dan tidak berwujud (intangible)
▪ Disebut sebagai KONSTRUK (construct)
▪ Atribut atau mekanisme yang dapat menjelaskan dan memprediksi
perilaku secara teoritis.
▪ Konsep teoritis yang dibentuk menjelaskan perilaku-perilaku yang dapat
dilihat.
• Contoh: Intelegensi
Hypothetical Constructs
▪ Can you see intelligence?
▪ What about self-esteem?
▪ Then, depression?
▪ Dalam psikologi, kita sering kali meneliti construct.
Hypothetical Constructs: Operational Definitions
▪ Konstruk psikologi (cth: agresi, self-esteem, intelegensi, etc) harus
didefinisikan dengan metode yang spesifik agar dapat diukur atau
dimanipulasi.
▪ Agar dapat diukur dan dimanipulasi kita memerlukan definisi operasional
(operational definition)
Hypothetical Constructs: Operational Definitions
▪ Definisi operasional (operational definition)
• Prosedur untuk mengukur dan mendefinisikan sebuah konstruk yang tidak
dapat diobservasi atau diukur secara langsung.
• Menjelaskan secara mendetail prosedur pengukuran untuk mengukur
perilaku eksternal yang terlihat dan menggunakan hasil pengukuran
sebagai definisi dan pengukuran dari konstruk hipotesis.
• Definisi operasional juga dapat digunakan untuk mendefinisikan bagaimana
sebuah konstruk dimanipulasi.
Hypothetical Constructs 🡪 Variabel
▪ Variabel 🡪 konstruk psikologis yang terukur atau dimanipulasi secara
objektif.
▪ Karakteristik atau kondisi yang dapat berubah atau berbeda bagi setiap
individu.
• Contoh: self-esteem
▪ Penelitian ingin mengetahui penyebab suatu kondisi, atau bagaimana
sebuah variabel berbeda dari satu individu dengan individu lainnya.
• Contoh:
o Training berbicara di depan umum 🡪 skor self-esteem
o Perbedaan tingkat stres siswa SMA kelas X, XI, XII.
Hypothetical construct 🡪 Variabel
▪ Cara kita mendefinisikan konstruk menentukan cara variabel tersebut
diukur/dimanipulasi.
▪ Definisi yang berbeda, berbeda pula cara mengukurnya/manipulasi.
▪ Contoh: Materialisme (Shrum et al .,2012, h. 1179)
• Personal value that reflects the importance that people place on
possessions (Richins & Dawson, 1992).
• As a collection of personality traits that manifests itself in orientations to
possessions (Belk, 1985).
• As a function of how people use products and their perception of the value
the products hold (Holt, 1995).
Hypothetical construct 🡪 Variabel
▪ (Wimmer et al., 1992) pengaruh kurang tidur terhadap atensi
• Kurang tidur 🡪 Saat seseorang tidak tidur selama 2 x 24 jam
• Atensi 🡪 short term cognitive task
Operational Definition for Sleep Deprivation

Tidur

Experimental group Control group

Kurang Tidur Cukup Tidur


(2x24h) (9h)
Operational Definition for Attention

Attention

Working memory Task Trail-making task


(Dobbs & Rule, 1989) (Shallice, 1986)
Partisipan

Experimental group Control group


Sleep
Kurang Tidur Cukup Tidur
(2x24h) (9h)

Working memory Task


& Attention
Trail-making task
Partisipan

Experimental group Control group

Kurang Tidur Cukup Tidur


(2x24h) (9h)

Working memory Task


& Attention
Trail-making task
Operational definition (OD): Limitation
▪ Operational definition ≠ construct
▪ Saat mendefinisikan dan mengukur variabel, kita hanya mengukur
manifestasi eksternal yang mengindikasikan variabel yang mendasarinya.
▪ Contoh: Pengetahuan
• Hasil Kuis, UTS, UAS, Tugas (Performance)
• Pengetahuan ≠ Performance
▪ Cara untuk mengatasi keterbatasan: beberapa cara untuk menilai suatu
variabel.
Operational definition (OD): Penggunaan
▪ Saat variabel penelitian adalah konstruk hipotesis, wajib menggunakan
definisi operasional untuk mendefinisikan dan mengukur variabel.
▪ Tidak membuat Operational Definitions sendiri.
• Cara terbaik untuk menentukan bagaimana variabel diukur adalah dengan
melihat penelitian sebelumnya yang menggunakan variabel serupa.
• Contoh: Penelitian Wimmer et al. (1992)
Validitas dan Reliabilitas Pengukuran
▪ Untuk mengukur suatu variabel dapat menggunakan beberapa alat ukur
yang berbeda.
▪ Bagaimana memilih metode yang terbaik?
▪ Seberapa yang alat ukur yang kita pilih mengukur konstruk psikologis
dengan tepat?
▪ Peneliti membuat dua kriteria untuk mengukur kualitas pengukuran
konstruk psikologi:

Validitas Reliabilitas
Standard (1999)

Validitas Reliabilitas
Validitas
▪ Seberapa jauh bukti dan teori mendukung interpretasi dan penggunaan
skor yang didapat.
▪ Yang dievaluasi adalah interpretasi dari skor alat ukur tersebut berikan,
bukan alat ukurnya.
▪ Validitas sebuah pengukuran dievaluasi berdasarkan bukti-bukti yang
mendukung bahwa alat ukur tersebut valid.
Validitas: 5 Sumber Bukti (Standard, 1999)
▪ Test content
▪ Response process
▪ Internal structure
▪ Relation to other variable
▪ Consequences of testing
Bukti validitas: Test content
▪ Analisis hubungan antara isi dari alat ukur, dengan konstruk yang ingin diukur.
▪ Isi: tema, bahasa yang digunakan, format soal, tugas, pertanyaan yang ada
▪ Bukti:
• Analisis logis dan empiris di mana isi tes merepresentasikan isi dari konstruk, dan
relevansi dari bagian konten dengan interpretasi dari skor alat ukur (blueprint)
• Evaluasi pakar/ahli
▪ Contoh: Pembelajaran 🡪 Kuis
• Soal dibuat berdasarkan tujuan pembelajaran.
• Diberikan ke ahli bidang tersebut, sesuai atau tidak.
Bukti validitas: Responses process
▪ Sejauh apa tugas atau tipe respon yang dibutuhkan oleh partisipan
sesuai dengan konstruk yang ingin diukur.
• Bukti. Cara menjawab partisipan.
• Contoh: untuk pengukuran konstruk psikologi (affective domain)
menggunakan survei 🡪 buktinya adalah kalau partisipan tidak memberikan
jawaban yang diharapkan oleh orang lain (socially desirable answers)

▪ Proses merespon tidak terbatas pada partisipan saja. Pengukuran juga


sering bergantung pada penilai.
• Bukti: Cara penilai memberikan penilaian.
• Contoh: Penilaian terhadap pemahaman mahasiswa 🡪 Rubrik
Bukti validitas: Internal structure
▪ Sejauh apa hubungan antar soal dan komponen alat ukur/tes sesuai
dengan konstruk yang ingin diukur.
▪ Bukti: Analisis statistik, contohnya adalah Analisis Faktor (Exploratory and
Confirmatory Factor Analysis (EFA & CFA))
▪ Contoh: Pembelajaran 🡪 Kuis
• Apakah soal-soal dalam kuis mengukur hal yang sama?
Bukti validitas: Relation to other variable
▪ Sejauh apa skor dari sebuah pengukuran konstruk yang diukur,
berhubungan dengan skor alat ukur/tes lain yang mengukur konstruk
sama (convergent), DAN tidak berhubungan dengan skor alat ukur lain
yang mengukur konstruk berbeda (discriminant).
▪ Bukti: analisis hubungan (korelasi) dengan alat ukur/tes lain
▪ Contoh: Mengukur depresi – Beck’s Depression Inventory–II
▪ Convergent: berkorelasi kuat dengan Hamilton Depression Rating Scale
▪ Discriminant: tidak berkorelasi dengan Burnout & Anxiety Scale
Bukti validitas: Consequences of testing
▪ Sejauh apa konsekuensi dari penggunaan skor tersebut sesuai dengan
penggunaan hasil pengukuran konstruk.
▪ Alat ukur/tes sering diberikan agar keuntungan dapat dihasilkan dari
penggunaan skor tes. Contohnya penempatan pekerja pada kerjaan
yang sesuai, mencegah orang yang tidak memiliki kualifikasi untuk
dipekerjakan, untuk meningkatkan instruksi.
▪ Bukti: skor dari tes sesuai dengan perilaku masa depan yang diharapkan
▪ Contoh: Kuis 🡪 Hasil Tugas
Selengkapnya: Goodwin & Leech (2003)

http://www.bwgriffin.com/gsu/courses/edur9131/2018spr-content/07-val
idity/07-2003-Goodwin-validity-standards.pdf
Reliabilitas 🡪 Presisi
▪ Reliabilitas/Presisi 🡪 seberapa besar skor bervariasi di seluruh
pengulangan prosedur pengujian.
• Kalau hasilnya tidak terlalu bervariasi/konsisten, maka reliabel.
▪ Analisis reliabilitas/presisi bergantung pada variasi yang terjadi pada
prosedur pengukuran (cth: jika diukur beda waktu, beda konteks, beda
penguji).
▪ Konsep reliabilitas didasari oleh asumsi bahwa variabel yang diuji adalah
stabil atau konstan.
Reliabilitas/Presisi
▪ Konsep reliabilitas didasari oleh asumsi bahwa variabel yang diuji adalah
stabil atau konstan.
• Contoh: Intelegensi, Kepribadian.
▪ Namun saat mengukur variabel, prosedur pengukuran akan melibatkan
elemen error. Persamaan sebagai berikut:
Measured score = True Score + Error
• Contoh: saat mengukur intelegensi, performa dipengaruhi banyak hal:
mood, lucky guess, etc. 🡪 ERROR.
Individu yang melakukan
pengukuran dapat memasukan
Reliabilitas/Presisi human eror dalam proses
Observer pengukuran.
Contoh: Saat dosen memberikan
penilaian terhadap skripsi
mahasiswa. Hari ini A, besok B.

Partisipan dapat
berubah antar
pengukuran.
Contoh: Sumber
mengerjakan tes IQ Eror
waktu lapar Variabel lingkungan
(seperti waktu, udara, dll)
Perubahan dapat mengubah hasil
Perubahan
pada pengukuran.
Lingkungan
Partisipan Contoh: Diukur waktu
mendung, dengan waktu
panas, hasilnyabisa beda
INTERNAL
EKSTERNAL
(konsistensi hasil antar aitem
(konsistensi antar pengukuran)
dalam tes)
Tipe Reliabilitas

Split-half reliability
membagi aitem kuesioner/tes Test-retest reliability
dalam dua bagian, lalu stabilitas hasil tes antar waktu
menghitung tingkat konsistensi pengukuran
antar dua skor tersebut.
Item-score reliability
Inter-rater reliability
seberapa jauh skor sebuah aitem
konsistensi penilaian antar dua
berhubungan dengan skor total
atau lebih penilai
dari tes
Validitas dan Reliabilitas Alat Ukur

https://images.app.goo.gl/vJxV517d2rphavfo6
Scales of Measurement
▪ Pengukuran merupakan prosedur untuk mengelompokkan individu ke
dalam kategori. Kategori disebut sebagai skala pengukuran (scale of
measurement).
▪ Proses pengukuran melibatkan dua komponen:
• Satuan pengukuran
• Prosedur untuk mengelompokkan individu ke dalam kategori.
Scales of Measurement
Dealing with Equivocal Measurements
▪ Seringkali dalam penelitian psikologi, skala yang digunakan tidak dapat
dikategorikan dalam tipe apa secara jelas.
• Contoh: IQ merupakan interval, namun apakah IQ 85 dan 86, dengan IQ
141 dan 142 memiliki perbedaan yang sama persis?
• Ya = Interval
• Tidak = Ordinal
▪ Penelitian psikologi juga sering menggunakan skala likert untuk
mengukur variabel.
• Contoh: Satisfaction with Life Scale (Diener et al., 1985)
Dealing with Equivocal Measurements
▪ Walaupun kelihatannya muncul dalam bentuk skala interval, dengan jarak yang
sama, namun apakah jarak antara 2 dan 3 dengan 6 dan 7 sama?

1 2 3 4 5 6 7
Strongly Slightly Slightly Strongly
Disagree Neutral Agree
Disagree Disagree Agree Agree

▪ Mengenai hal ini, peneliti secara terus menerus memperlakukan level


ambigu (seperti IQ, dan Likert) sebagai skala interval. Mereka
menambahkan dan mengalikannya seperti angka biasa.
▪ Menggunakan pendekatan matematika. Baca Norman (2010).
Modalities of Measurement
▪ Bagaimana cara mengukur konstruk?
• Self-report 🡪 partisipan mengisinya sendiri
• Physiological measures 🡪 manifestasi fisiologis dari konstruk yang diukur
• Behavioral measures 🡪 manifestasi perilaku dari konstruk yang diukur
▪ Contoh: Takut tikut
• Self-report 🡪 Apakah Anda takut sama tikus?
• Physiological 🡪 Berkeringat, detak jantung meningkat saat lihat tikus
• Behavioral 🡪 memerlukan operational definition 🡪 tutup mata, berteriak,
menangis saat lihat tikus
Other Aspects of Measurement
▪ Saat memilih prosedur pengukuran, kita perlu memperhatikan beberapa
hal selain (a) validitas dan reliabilitas pengukuran, (b) skala pengukuran,
dan (c) modalitas pengukuran.

Sensitivity &
Multiple Measures Artifacts
Range Effects
Other Aspects: Multiple Measures
▪ Menggunakan beberapa prosedur yang berbeda untuk mengukur
variabel yang sama.
• Contoh: Depresi
• Interview, kuesioner screening, observasi terstruktur
Other Aspects: Sensitivity and Range Effects
▪ Di awal penelitian, biasa peneliti memiliki ekspektasi bagaimana variabel
akan muncul, secara spesifik mengenai arah dan tingkat perubahannya.
▪ Perlu dipertimbangkan apakah prosedur pengukuran cukup sensitif
untuk mendeteksi perubahan yang diharapkan.
• Contoh: Apakah CBT efektif mengurangi gejala depresi. Kalau alat ukur
depresinya kurang sensitif, maka perubahan yang terjadi tidak terlihat dari
hasil tes.
▪ Permasalahan sensitivity dapat muncul saat skor yang diperoleh
cenderung berkumpul di salah satu ujung skala.
Other Aspects: Sensitivity and Range Effects
▪ Permasalahan sensitivity dapat muncul saat skor yang diperoleh
cenderung berkumpul di salah satu ujung skala (range effect).
• Mayoritas skor tinggi (ceiling effect), atau mayoritas rendah (floor effect).
▪ Contoh: Apakah CBT efektif mengurangi tingkat depresi.
• Kalau ternyata partisipan yang diteliti skor depresinya rendah, maka
diberikan CBT perubahannya tidak terlalu banyak (floor effect)
▪ Contoh: Apakah program mengajar baru efektif dalam meningkatkan
pemahaman mahasiswa?
• 95% mahasiswa di kelas tersebut skor awalnya sudah tinggi. Maka saat
diberikan program baru juga perubahannya tidak signifikan (ceiling effect)
Other Aspects
Partisipan mengubah perilakunya
secara sadar atau tidak sadar
Reactivity karena mengetahui sedang diteliti

Experimenter
Bias Artifacts
Isyarat atau fitur apapun dari
penelitian yang memberikan (a)
Demand gambaran kepada partisipan
tujuan atau hipotesis penelitian,
Characteristics
dan (b) mempengaruhi partisipan
Ekspektasi eksperimenter/peneliti untuk merespon dalam cara
mempengaruhi hasil penelitian tertentu.
Artifacts: Experimenter Bias
▪ Peneliti dapat mempengaruhi hasil akhir dari penelitian, sesuai dengan
prediksi yang dibuat (baik secara sengaja maupun tidak).
• Contoh: Dalam penelitian tidur, bisa jadi ruang tes untuk kelompok kontrol
(cukup tidur) lebih nyaman dibandingkan ruang tes kelompok
eksperimental (kurang tidur) karena prediksinya adalah atensi kelompok
kurang tidur lebih buruk.
▪ Peneliti memanipulasi HASIL AKHIR dari segi prosedur, setting, dll.
▪ Bagaimana cara mengatasi experimenter bias?
• Single-blind atau double-blind research
Artifacts: Demand Characteristics & Reactivity
▪ Individu dapat mengadopsi cara yang berbeda dalam merespon
treatment eksperimental, berdasarkan apa yang mereka anggap sesuai
dalam situasi tersebut.
▪ Weber dan Cook (1972) 🡪 4 Peran Subjek
• Good 🡪 merespon sesuai dengan hipotesis peneliti
• Negativistic 🡪 merespon berlawanan dengan hipotesis peneliti
• Apprehensive 🡪 sangat khawatir penelitian ini untuk mengukur kemampuan
• Faithful 🡪 mengikuti instruksi, tidak berperilaku dibuat-buat, natural
Artifacts: Demand Characteristics & Reactivity
▪ Reactivity biasa muncul dalam penelitian laboratorium
• Partisipan sepenuhnya sadar bahwa mereka diteliti
▪ Untuk melihat perilaku sehari-hari dapat menggunakan penelitian
lapangan (field)
• Partisipan diobservasi dalam kondisi alamiah, dan tanpa diatur
Jadi bagaimana kita memilih prosedur pengukuran?
▪ Lihat penelitian sebelumnya
• Memiliki reliabilitas dan validitas yang baik
▪ Menggunakan beberapa prosedur dalam mengukur variabel yang sama

Anda mungkin juga menyukai