Anda di halaman 1dari 63

Chapter 11

Dosen Pengampu: Bayu Aji Aritejo, MM., M.Si., Ph.D

Presented by:
Arwanda Wahyu Irawan
Danang Pudjo Setiawan
Muthia Cita Hapsari
Rini Ramdiani Muchtar
Trisna Rama Fani Lubis
The Nature of Measurement
“Anda berusaha terlalu keras untuk menemukan korelasi di sini.
Anda tidak mengenal orang-orang ini dan Anda tidak tahu apa
tujuan mereka. Anda berusaha untuk menyusun statistik dan
mengkorelasikannya untuk sebuah hasil yang tidak membentuk
apapun selain spekulasi,”

-Marc Racicot, Mantan Gubernur Montana serta ketua Partai


Republik
• Pengukuran (measurement) dalam penelitian terdiri atas angka-angka yang
ditempatkan pada peristiwa empiris, atribut, atau aktivitas, sesuai dengan
serangkaian aturan.
• Tujuan pengukuran adalah untuk menyediakan data paling berkualitas dengan
kesalahan terendah untuk menguji hipotesis, estimasi atau prediksi, dan deskripsi.
• Pengukuran merupakan proses dengan tiga bagian:
1. Memilih peristiwa empiris yang dapat diamati.
2. Mengembangkan serangkaian aturan pemetaan (mapping rules) .
3. Menerapkan aturan pemetaan untuk setiap pengamatan dan peristiwa
tersebut.
Apa Saja yang Diukur?
Objek (Objects), meliputi konsep pengalaman biasa, seperti item-item
berwujud. Objek juga meliputi hal-hal yang tidak konkret seperti gen,
sikap, dan tekanan kelompok.
Properti atau atribut (properties) adalah karakteristik dari objek.
• Properti fisik : Dinyatakan dalam bentuk berat, tinggi, dan postur.
• Properti psikologis : Sikap dan intelegensi.
• Properti Sosial : Kemampuan kepemimpinan, afiliasi kelas, dan
status.
Tinjauan Istilah-Istilah Penting dalam
Pengukuran
• Konsep: Sekumpulan arti atau karakteristik yang dihubungkan dengan
peristiwa, objek, kondisi, situasi, atau perilaku tertentu.
• Gagasan: Gambaran atau ide yang secara spesifik ditemukan untuk tujuan
penelitian dan/atau membangun teori tertentu.
• Variabel: Peristiwa, tindakan, karakteristik, ciri, atau atribut yang dapat
diukur dan di mana kita memberikan nilai; sinonim untuk gagasan atau properti
yang sedang dipelajari.
• Definisi operasional: Definisi untuk suatu gagasan yang dinyatakan dalam
bentuk kriteria spesifik untuk pengujian atau pengukuran.
Skala Pengukuran
(Measurement Scales)
Skala Nominal
Dengan skala nominal (nominal scale), kita dapat mengumpulkan informasi
dari variabel yang secara alami atau berdasarkan desain dapat dikelompokkan ke
dalam dua atau lebih kategori yang saling lepas dan lengkap secara kolektif.

Klasifikasi nominal terdiri atas angka dari kelompok yang terpisah jika
kelompok tersebut saling lepas dan secara kolektif lengkap.

Skala nominal merupakan skala yang paling lemah, karena tidak


menyarankan adanya urutan atau hubungan jarak dan tidak memiliki asal usul
aritmetika
Skala Ordinal
Skala ordinal memasukkan karakteristik dari skala nominal ditambah indikasi
urutan.

Data ordinal memerlukan kesesuaian terhadap dalil logis seperti : Jika a > b, b > c,
maka a > c.

Contoh dari data ordinal termasuk sikap dan skala preferensi.


Skala Interval

Skala interval menyatukan konsep persamaan interval (jarak


skala antara 1 dan sama dengan jarak 2 dan 3).

Skala temperatur seperti Celcius dan Fahrenheit merupankan


contoh skala interval klasik.
Skala Rasio
Skala rasio memasukkan semua kekuatan dari skala sebelumnya ditambah
provisi untuk nol absolut atau awal.

Data rasio menyajikan jumlah aktual dari suatu variable.

Ukuran dimensi fisik, seperti berat, tinggi, jarak dan wilayah merupakan
contoh dari skala rasio.
Sumber Perbedaan Pengukuran

Sumber Kesalahan
✘ Responden
✘ Faktor Situasional
✘ Pengukur
✘ Instrumen

14
Karakteristik Pengukuran Yang Baik

Tiga kriteria utama untuk mengevaluasi alat pengukuran:


1. Validitas
Sejauh mana suatu tes mengukur apa yang ingin kita ukur.
2. Reliabilitas
Berkaitan dengan keakuratan dan ketepatan dariprosedur
pengukuran
3. Kepraktisan
Berkenaan dengan faktor-faktor ekonomi, kenyamanan, dan dapat
diiterpretasikan

15
Karakteristik Pengukuran Yang Baik

Tiga kriteria utama untuk mengevaluasi alat pengukuran:


1. Validitas
Sejauh mana suatu tes mengukur apa yang ingin kita ukur.
2. Reliabilitas
Berkaitan dengan keakuratan dan ketepatan dariprosedur
pengukuran
3. Kepraktisan
Berkenaan dengan faktor-faktor ekonomi, kenyamanan, dan dapat
diiterpretasikan

16
Validitas
✘ 3 bentuk utama validitas yang diterima
secara luas
✗ Content validity
✗ Criterion –related validity
✗ Construct validity

17
Validitas
Content validity
Sejauh mana instrumern menyediakan cakupan
pertanyaan penyelidikan yang memadai sebagai
panduan studi.

Penentuan validitas ini melibatkan beberapa


pertimbangan:
1. Menentukan pertimbangan melalui definisi topik
yang teliti, item yang akan diskala, dan skala yang
akan di gunakan.
2. Menggunakan suatu panel untuk menilai seberapa
18 baik instrumen memenuhi standar.
Validitas
Criterion-related validity
Merefleksikan keberhasilan dari ukuran prediksi atau
estimasi.

Setiap ukuran kriteria harus dinilai terkait dengan empat


kualitas:
1. Relevansi
2. Bebas dari bias
3. Reliabilitas
4. Ketersediaan

19
Validitas
Construct validity

20
Validitas
Jenis Apa yang diukur Metode
Isi Tingkatan dimana isi dari item secara memadai • Judgemental
menyajikan bidang dari semua item yang relevan • Evaluasi panel
dengan studi dengan rasio validitas
isi
Terkait Kriteria Tingkatan dimana prediktor mencatat aspek- • Korelasi
aspek relevan dari kriteria dengan cukup jelas.

Bersamaan Deskripsi keadaan saat ini; data kriteria tersedia


pada waktu yang sama seperti skor prediktor. • Korelasi

Prediktif Prediksi keadaan dimasa yang akan datang; data


kriteria diukur setelah berlalunya waktu. • Korelasi

Gagasan Menjawab pertanyaan, “apa yang membentuk • Judgemental


varians dalam ukuran?”; berusaha untuk • Korelasi dari uji yang
mengidentifikasi gagasan dasar yang sedang diusulkan dengan uji
diukur dan menentukan seberapa baik pengujia yang sudah ada
mewakili gagasan. • Teknik konvergen
diskriminan
• Analisis faktor
21 • Analisis metode
ganda, ciri ganda
Reliabilitas
✘ Reliabilitas adalah kontributor yang
dibutuhkan untuk validitas, tapi bukan
kondisi yang cukup memadai untuk validitas.
Reliabilitas adalah kontributor yang
dibutuhkan untuk validitas, tapi bukan
kondisi yang cukup memadai untuk validitas.

22
Reliabilitas
Stabilitas
Suatu ukuran dikatakan memiliki stabilitas ketika
mampu mendapatkan hasil yang konsisten
dengan pengukuran berulang dari orang yang
sama dengan instrumen yang sama.

23
Reliabilitas
equivalence
Stabilitas berkenaan dengan fluktuasi personal
dan situasional dari satu waktu ke waktu lainnya,
sementara ekuivalensi berkenaan dengan variasi
pada satu titik waktu antara pengamat dan
sampel item.

24
Kepraktisan
Persyaratan ilmiah dari suatu proyek
membutuhkan pegukuran yang dapat
diandalkan dan valid, sementara persyaratan
operasional memnutuhkan proses pengukuran
yang praktis. Kepraktisan didefinisikan sebagai
ke ekonomisan, kenyamanan, dan dapat
diinterpretasikan.

25
Chapter 12
Measurment Scales
Dosen Pengampu: Bayu Aji Aritejo, MM., M.Si., Ph.D

Presented by:
Arwanda Wahyu Irawan
Danang Pudjo Setiawan
Muthia Cita Hapsari
Rini Ramdiani Muchtar
Trisna Fani Lubis
The Scaling Process
PENDAHULUAN
✘ Bab ini membahas prosedur yang akan membantu untuk
memahami skala pengukuran sehingga dapat memilih atau
merancang langkah-langkah sesuai untuk riset yang akan
dilakukan.
✘ Skala dalam riset bisnis umumnya dibangun untuk mengukur
perilaku, pengetahuan, dan sikap.

28
Tujuan Pembelajaran

Sifat dari sikap dan hubungan mereka dengan


perilaku.

Keputusan penting yang terlibat dalam


memilih skala pengukuran yang tepat.

Karakteristik dan penggunaan rating, ranking,


sorting, dan skala preferensi lainnya.

29
THE NATURE OF ATTITUDE
✘ Sikap (attitude) kecenderungan/ predeposisi stabil
yang dipelajari untuk menanggapi diri sendiri, orang lain, Ini mewakili
ingatan,
objek, atau masalah secara konsisten dengan cara evaluasi, dan
mendukung dengan tidak mendkungnya. keyakinan
tentang sifat-
sifat objek.
Dia yakin bahwa MindWriter memiliki bakat luar biasa, keyakinan,
Cognitive produk hebat, dan peluang unggul untuk tumbuh.
kesadaran
watak perilaku
Affective Dia suka bekerja di MindWriter. seperti perasaan,
minat, sikap,
Dia berharap untuk tetap bersama perusahaan dan emosi, dan nilai.
Behavioral bekerja keras untuk mencapai promosi cepat
untuk visibilitas dan pengaruh yang lebih besar. Perilaku
kebiasaan
30
Hubungan antara Sikap dan Perilaku

✘ Hubungan sikap-perilaku bersifat tidak


langsung
✘ Perilaku dapat memengaruhi sikap
✘ Hubungan timbal balik

31
Beberapa faktor memiliki efek terhadap
penerapan penelitian mengenai sikap:

Specific
attitudes

Multiple
measures Strong
attitudes

Factors

Reference Direct
groups experiences

based
attitudes
(Congnitive
or affective)
32
PENSKALAAN SIKAP (ATTITUDE SCALING )

✘ Penskalaan Sikap merupakan proses menilai disposisi


sikap dengan menggunakan angka yang
merepresentasikan skor seseorang pada kontinum sikap
yang berkisar dari disposisi yang sangat mendukung
hingga disposisi yang sangat tidak mendukung.
✘ Penskalaan adalah prosedur penempatan angka (atau
simbol lain) pada properti/atribut objek untuk
menyampaikan beberapa karakteristik angka ke
properti/atribut yang dipertanyakan.

33
MEMILIH SKALA PENGUKURAN
Memilih dan membentuk pengukuran memerlukan pertimbangan beberapa
faktor yang memengaruhi reliabilitas, validitas dan kepraktisan dari skala:
✘ Tujuan penelitian
✘ Jenis respons
✘ Sifat data
✘ Jumlah dimensi
✘ Seimbang atau tidak seimbang
✘ Pilihan yang dipaksakan atau tidak dipaksakan
✘ Jumlah titik skala
✘ Kesalahan penilai
34
TUJUAN PENELITIAN

✘ Untuk mengukur karakteristik partisipan


yang berpartisipasi dalam studi
✘ Untuk menggunakan partisipan sebagai
penilai objek atau indicant yang disajikan
kepada mereka

35
JENIS RESPONS
Skala pengukuran menjadi salah satu dari empat jenis umum skala : penilaian,
peringkat, kategorisasi dan penyortiran.
✘ Skala penilaian (rating scale) digunakan ketika partisipan memberikan skor
untuk suatu objek tanpa membuat perbandingan langsung dengan objek atau
sikap lain.
✘ Skala peringkat (rangking scale) membatasi partisipan studi untuk
melakukan perbandingan dan menentukan urutan diantara dua atau lebih
properti/objek.
✘ Kategorisasi (categorization) meminta partisipan untuk menempatkan diri
mereka atau indicant properti ke dalam kelompok atau kategori.
✘ Penyortiran (sorting)mengharuskan partisipan untuk menyortir kartu
(mewakili konsep/gagasan) ke dalam tumpukan dengan menggunakan
36 kriteria yang ditetapkan oleh peneliti.
PROPERTI/ATRIBUT DATA

✘ Keputusan mengenai pilihan skala


pengukuran sering kali dibuat terkait dengan
properti data yang dihasilkan oleh setip
skala(Nominal, ordinal, interval atau rasio).
✘ Sifat data terkait dengan properti data yang
dihasilkan oleh setiap skala

37
JUMLAH DIMENSI

Skala satu dimensi, seseorang


Unidimensional hanya bisa mengukur satu
atribut daripartisipan atau objek.

Skala multidimensi, mengetahui


Multi-dimensional bahwa objek lebih baik
dideskripsikan dengan beberapa
dimensi daripada satu dimensi

38
SEIMBANG ATAU TIDAK SEIMBANG - (BALANCED OR UNBALANCED)

✘ Seimbang artinya memiliki jumlah sama untuk


kategori yang beradadiatas, dibawah dan di tengah.
✘ Tidak seimbang artinya, memiliki angka yang tidak
seimbang daripilah respon yang mendukung atau
tidak mendukung

12-
39
PILIHAN YANG DIPAKSAKAN ATAU TIDAK DIPAKSAKAN –
FORCED OR UNFORCED CHOICES

✘ Skala penilaian tidak dipaksakan dimaknai dengan


memberikanpartisipan kesempatan untuk tidak
menyatakan opini ketika merekamampu membuat
pilihan diantara alternatif yang ditawarkan.
✘ Skala penilaian dipaksakan, dimaknai dengan
mengharuskan partisipan memilh satu dari alternatif
yang ditawarkan.
12-
40
JUMLAH TITIK SKALA
✘ Jumlah titik skala harus sesuai tujuannya, skala harus
mencocokkan stimulus yang disajikan
dan mengekstrak informasi yang sebanding dengan
kompleksitas objek, konsep, atau gagasan dari sikap
sehingga skala tersebut bermanfaat.

12-41
12-42

RATER ERRORS – KESALAHAN RATING

• Menyesuaikan kata sifat deskriptif


• Memberi jarak pada frase
Cara mengatasi:
deskriptif di tengah
Error of central tendency
• Memberi perbedaan kecil
Error of leniency
pada makna
• Menggunakan lebih banyak titik
dalam skala
RATING SCALES
(Skala Penilaian)

Kita menggunakan skala penilaian untuk menilai properti objek tanpa melakukan
referensi ke objek lain yang serupa.

Penilaian tersebut mungkin dalam bentuk seperti “suka--tidak suka”; “setuju--


tidak peduli--tidak setuju”, atau klasifikasi lainnya.

43
SIMPPLE ATTITUDE SCALE
(Skala Sikap Sederhana)
Simple Category Scale
• Disebut juga skala dikotomi
• Menawarkan dua pilihan respons

Multiple-choice, single-response scale


• Terdapat banyak pilihan jawaban, dan hanya satu jawaban
yang dicari

Multiple-choice, multiple-response scale


• Suatu Variasi
• Memungkinkan penilai memilih satu atau beberapa alternatif

44
Lanjutan…

45
LIKERT SCALES
(Skala Likert)
Skala likert merupakan variasi yang paling sering digunakan dari skala penilaian yang dijumlahkan.

Skala penilaian yang dijumlahkan terdiri atas pernyataan yang mengekspresikan baik sikap
mendukung dan tidak mendukung terhadap objek kepentingan.

Partisipan diminta untuk setuju atau tidak setuju dengan setiap pernyataan. Setiap respons
diberikan skor numerik untuk menyatakan tingkat dukungan sikap dan skor tersebut mungkin
dijumlahkan untuk mengukur sikap keseluruhan partisipan.

46
SEMANTIK DIFFERENTIAL SCALES
(Skala Diferensial Semantik)
SD Scale mengukur pengertian psikologis dari objek sikap dengan menggunkan kata sifat bipolar.
Peneliti menggunakan skala ini untuk studi seperti citra merek dan institusi.

Skala ini didasarkan pada proposisi bahwa suatu objek dapat memiliki beberapa dimensi
pengertian konotatif. Pengertian ini terletak pada ruang sifat multidimensi, yang disebut ruang
semantik.

Skala diferensial semantik merupakan cara yang efisien dan mudah untuk mendapatkan sikap dari
suatu sampel besar. Sikap tersebut mungkin diukur baik berdasarkan arah maupun intensitas.

47
Lanjutan...

48
NUMERICAL/MULTIPLE RATING LIST SCALES
(Skala Daftar Penilaian Numerik/ Berganda)

Skala numerik memiliki interval yang sama yang memisahkan titik skala numeriknya. Titik
panduan/jangkar verbal berperan sebagai label untuk titik ekstrim. Skala numerik sering kali
adalah skala 5 titik, tetapi mungkin juga memiliki 7 atau 10 titik. Partisipan menuliskan angka dari
skala di samping setiap item. Ini menghasilkan data ordinal atau interval.

Skala daftar penilaian berganda hampir sama dengan numerik, tetapi berbeda dalam 2 hal : (1)
Skala ini menerima respons yang dilingkari oleh penilai; dan (2) tata letak mempermudah
visualisasi hasil. Skala ini menghasilkan data interval.

49
Lanjutan…

50
STAPEL SCALES
(Skala Stapel)
Skala Stapel digunakan sebagai alternatif untuk diferensial semantik, terutama ketika sulit
untuk menemukan kata sifat bipolar yang sesuai dengan pertanyaan penyelidikan.

Skala stapel biasanya menghasilkan data interval.


CONSTANT-SUM SCALES
( Skala Jumlah Konstan)

Skala jumlah konstan membantu peneliti menemukan proporsi. Peserta mengalokasikan titik
ke lebih dari satu atribut atau indicant properti, sehingga mereka menghitung jumah yang
konstan, biasanya 100 atau 10.

Keuntungannya adalah kosesuaian dengan persen dan fakta bahwa alternatif yang diyakini akan
sama bisa didapatkan.

Skala ini digunakan untuk mencatat sikap, perilaku, dan tujuan perilaku. Skala ini menghasilkan
data interval.
.
Lanjutan…
GRAPHIC RATING SCALE
(Skala Penilaian Grafis)
Skala penilaian grafis pada mulanya diciptakan untuk memungkinkan peneliti memahami perbedaan
yang tipis.

Secara teoritis, jumlah yang tidak terbatas adalah mungkin jika partisipan cukup paham untuk
membedakan dan mencatat nilainya. Hasilnya diperlakukan sebagai data interval.

Kesulitannya dalam pengkodean dan analisis.

Skala penilaian grafis menggunakan gambar, ikon, atau visual lain untuk berkomunikasi dengan penilai
dan menyajikan beragam jenis data.
Ranking Scales
✘ Partisipan secara langsung membandingkan
dua atau lebih objek dan membuat pilihan
diantara objek tersebut.
✘ Partisipan diminta untuk memilih satu objek
sebagai “yang terbaik” atau “yang paling
disukai”
✘ Ambiguitas dapat dihindari dengan
menggunakan Teknik Paired-Comparison
Scale, Forced Ranking Scale, Comparative
Scale

55
Paired-Comparison Scale
(Skala Perbandingan Berpasangan)

✘ Partisipan dapat mengekspresikan sikap secara


tidak ambigu dengan memilih dua objek
✘ [(n)(n-1)/2], dimana n adalah jumlah objek yang
akan dinilai.
✘ Contoh: ketika 4 mobil dievaluasi, partisipan
mengevaluasi 6 perbandingan berpasangan
[(4)(4-1)/2]
Forced Ranking Scale
(Skala Peringkat yang Dipaksakan)

✘ Mencatat atribut yang diperingkat relative


terhadap satu sama lain
✘ Kekurangan metode ini adalah berkaitan
dengan jumlah stimulus yang dapat ditangani
oleh metode ini. Ketika terdapat 5 stimulus
masih dapat dilakukan tetapi ketika 10 akan
menjadi ceroboh.

57
Comparative Scale (Skala Komparatif)

✘ Ideal untuk membandingkan


suatu standar program,
proses, merek, promosi point
of sale ketika partisipan
familier dengan standar

58
Sorting (Penyortiran)
✘ Q-Sort memerlukan penyortiran satu bungkus ✘ Setelah dibuat, kartu dikocok dan partisipan
kartu menjadi tumpukan yang menyajikan titik diinstruksikan untuk menyortir kartu ke dalam
disepanjang kontinum serangkaian tumpukan, masing-masing
✘ Partisipan mengelompokkan kartu berdasarkan tumpukan menunjukkan suatu titik di kontinum
responnya terhadap konsep yang ditulis di kartu penilaian
✘ Peneliti yang menggunakan Q-sort ✘ Tumpukan paling kiri menyajikan pernyataan
memecahkan tiga masalah khusus: pemilihan konsep yang “paling berharga”, “mendukung”,
item, pilihan terstruktur atau tidak struktur “disetujui”.
dalam penyortiran, dan analisis data ✘ Tujuan dari penyortiran adalah untuk
✘ Untuk stabilitas statistic, jumlah kartu memperoleh penyajian konseptual dari sikap
seharusnya tidak kurang dari 60 dan tidak lebih penyortir terhadap objek sikap dan
dari 120 membandingkan hubungan antar-orang
Sorting (Penyortiran)
Cumulative Scale (Skala Kumulatif)

✘ Analisis skalogram adalah suatu ✘ Contoh: Survey desain sepatu


prosedur untuk menentukan lari
apakah serangkaian item 1. Airsole memiliki tampilan yang
membentuk suatu skala satu menarik
dimensi
2. Saya akan bersikeras untuk
✘ Skala dinyatakan satu dimensi membeli Airsole lagi karena
jika respons berada dalam suatu sepatu ini memiliki tampilan yang
pola dimana pembenaran dari menarik
item yang merefleksikan posisi
ekstrem menghasilkan 3. Tamplan Airsole dapat saya
pembenaran semua item yang terima
kurang ekstrem 4. Saya lebih menyukai desain
Airsole daripada desain yang lain
61
Cumulative Scale (Skala Kumulatif)

✘ Contoh: Survey desain sepatu lari Pola Respons Skalogram Ideal


1. Airsole memiliki tampilan yang
menarik
2. Saya akan bersikeras untuk membeli
Airsole lagi karena sepatu ini memiliki
tampilan yang menarik
3. Tamplan Airsole dapat saya terima
4. Saya lebih menyukai desain Airsole
daripada desain yang lain

62
THANKS!

63