Anda di halaman 1dari 22

MAKALAH

The Method of Summated Ratings

“Metode peringkat yang dijumlahkan”

Kelompok 3 :

SRI WAHYUNI 1811440006

ANDI ILHAM AKBAR H. 1811440007

MUH. ISNAIN ABD. WAFI 1811440008

PENDIDIKAN MATEMATIKA ICP 2018


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI MAKASSAR
2020
KATA PENGANTAR

Puji dan syukur kita panjatkan kepada Allah SWT, karena berkat rahmat


dan karunia-Nyalah sehingga penulis dapat menyelesaikan makalah Assessment
of Mathematics Education ini sesuai  waktu yang telah di tentukan.
Penulis juga sangat berterima kasih kepada pihak-pihak atas kerja sama
yang baik kami bisa mengerjakan laporan ini. Semoga tugas serta makalah ini
dapat memberikan wawasan dan ilmu pengetahuan khusus bagi penyusun umum
bagi pembaca. Makalah ini disusun dalam  rangka memenuhi salah satu  tugas
mata kuliah Assessment of Mathematics Education.
Tiada gading yang tak retak. Dari peribahasa itu, penulis menyadari
makalah ini bukanlah karya yang sempurna karena memiliki banyak kekurangan
baik dalam hal isi maupun sistematika dan teknik penulisan. Oleh sebab itu,
penulis sangat mengharapkan adanya  kritik dan saran yang membangun demi
kesempurnaan makalah ini. Akhir kata, semoga makalah ini bisa memberikan
manfaat bagi penulis dan pembaca.

Makassar, 01 Maret 2020

Penyusun

ii
DAFTAR ISI

KATA PENGANTAR……………………………………………………………ii
DAFTAR ISI…………………………………………………………… ……..iii
BAB I PENDAHULUAN
A. Latar Belakang………………………………………………………1
B. Rumusan Masalah...…………………………………………………1
C. Tujuan……….………………………………………………………1
BAB II PEMBAHASAN
A. Normal deviasi berpengaruh pada kategori respons………………….2
B. Pemilihan barang……………………………………………………..3
C. Interpretasi skor………………………………………………………5
D. Mengekspresikan skor sikap sebagai skor T…………………………7
E. Keandalan skor sikap…………………………………………………8
F. Nilai skala pernyataan thurstone dalam skala tautan ………………..11
G. Studi edwards dan kenney………………………………………….. 12
H. Kemudahan konstruksi Penjumlahan – Rating dan
Skala Interval yang tampak sama………………………………….. 14
I. Pertanyaan dan masalah …………………………………………….15
BAB III PENUTUP
Kesimpulan….……………………………………………………………….…..16
DAFTAR PUSTAKA……………………………………………..……………17

iii
BAB I

PENDAHULUAN
A. LATAR BELAKANG
Metode ini digunakan agar kita bisa mengetahui bagaimana metode ini
digunakan untuk menentukan peringkat, Misalnya jumlah besar pernyataan
yang nilai skala pada kontinum psikologis tidak diketahui. namun disini kita
berasumsi bahwa kita dapat memperoleh persetujuan dalam
mengklasifikasikan pernyataan tersebut ke dalam dua kelas, tidak disukai dan
tidak menguntungkan, dengan perkiraan jumlah pernyataan yang sama di
setiap kelas. Pernyataan ini kemudian diberikan kepada sekelompok subjek
yang diminta untuk menanggapi masing-masing dalam hal mereka sendiri.
Kesepakatan atau ketidaksepakatan dengan pernyataan. Dalam memperoleh
tanggapan dari subjek, kami mengizinkan mereka untuk menggunakan salah
satu dari lima kategori: Sangat setuju, setuju, ragu-ragu, tidak setuju, atau
sangat tidak setuju. Untuk setiap pernyataan yang diberikan, kami telah
menyediakan proporsi subjek yang memberikan masing-masing dari lima
kategori respons. Kami ingin mempertimbangkan kategori tanggapan ini.
Kami ingin memberi bobot pada kategori-kategori respons ini sedemikian
rupa sehingga respons yang dibuat oleh individu dengan sikap paling
menguntungkan akan selalu memiliki bobot positif tertinggi. Untuk
pernyataan yang menguntungkan, kami menganggap bahwa ini dalam
kategori "sangat setuju", dan untuk pernyataan yang tidak menguntungkan,
kami menganggap bahwa itu adalah kategori "sangat tidak setuju".
B. RUMUSAN MASALAH
Apa yang dimaksud dengan Metode peringkat yang dijumlahkan ?
C. TUJUAN
Makalah ini dibuat bertujuan untuk mengetahui bagaimana cara
Normal deviasi itu berpengaruh pada kategori respons, dan juga bagaimana
mengekspresikan skor terhadap sikap seseorang

1
BAB II
PEMBAHASAN
A. NORMAL DEVIASI BERPENGARUH PADA KATEGORI
RESPONS

Tabel 1.1
Proporsi pada subjek ( ͷ = 200) masuk pada masing-masing dari 5
kategori tanggapan untuk pertanyaan yang menguntungkan dan stadar
deviasi digunakan untuk kategori responds yang berdasarkan proporsi.
pernyataan. Pada baris (2) dari table kami memberikan ukuran kumulatif ,
dan pada baris (3) Ukuran yang kategorinya dibawah akan ditambahkan
1/2.
Contoh : Entri kedua pada baris (3) diperoleh:
130 + 1/2 (430) = 345.

Dari table kurva normal, kita temukan normal deviasi yang sesuai dengan
ukuran baris (3) . Normal deviasi ditunjukkan pada baris (4) dan itu semua
adalah pengaruh yang mungkin kita gunakan untuk kategori respons. Kita
dapat pempengaruhi semua yang positif dengan menambahkan nilai
negatif terbesar (-1.514) , untuk semua entri lainnya pada baris (4) dengan
demikian memperoleh nilai yang ditunjukkan berada pada baris (5). Tapi
dapat diamati bahwa jika kita membulatkan entri pada baris (5) ke
bilangan bulat terdekat, maka kita akan mendapatkan pengaruh 0, 1, 2, 2, 3
dan ini dekat dengan nilai 0, 1, 2, 3, 4.

2
B. PEMILIHAN OBJEK
Dalam metode interval yang tampak sama, kita memiliki dasar
untuk menolak pernyataan dalam hal Q dan kriteria yang tidak relevan.
Sebagai dasar untuk menolak pernyataan dalam metode ini dari
penilaian, Penggunaan dibuat dari beberapa bentuk hal-hal yang di
analisis. Kami mempertimbangkan distribusi frekuensi skor berdasarkan
tanggapan terhadap semua pernyataan. Kemudian disini kita dapat
mengambil 25
( atau yang lainnya )% dari subjek dengan skor total tertinggi dan juga
25% dari subjek dengan skor terendah. Disini kami berasumsi bahwa
kedua kelompok ini menyediakan kelompok kriteria untuk mengevakuasi
pernyataan individu. Dalam mengevakuasi respond yang tinggi dan
kelompok rendah kepernyataan individual yang mungkin kita akan
menemukan rasionya.

3
Ket :
1. Skor rata-rata pada pernyataan yang diberikan untuk kelompok yang
tinggi
2. Skor rata-rata pada pernyataan yang sama untuk kelompok yang
rendah.
3. Varians dari distribusi respond dari kelompok tinggi ke kelompok
rendah.
4. Varians dari distribusi tanggapan dari keelompok rendah terhadap
pernyataan
5. Jumlah subjek dari kelompok tinggi
6. Jumlah subjek dari kelompok rendah

4
Jika nH = nL = n, seperti halnya jika kita memilih yang sama dgn
presentasi dari jumlah total mata pelajaran untuk kelompok tinggi
dan rendah maka rumusnya dapat ditulis :

Perhitungan t dalam rumus di atas dapat di ilustrasikan pada table di


bawah.
Nilai t adalah ukuran sejauh mana pernyataan yang diberikan
membedakan antara kelompok tinggi dan redah. Sebagai aturan dasar
kasar, kita dapat menganggap nilai t sama dengan atau lebih besar
dari 1,75 yang mengidikasikan bahwa respond rata-rata kelompok
tinggi dan rendah terhadap pernyataan berbeda secara signifikan
asalkan kita memiliki 25 atau lebih subjek dalam kelompok tinggi
dan juga rendah. Dalam metode rangkuman peringkat yang di
inginkan adalah nominal 20-25 yang akan membedakan pernyataan
tinggi dan kurus

5
C. INTERPRETASI SKOR
Dalam skala interval yang tampak sama, skor sikap yang diperoleh
oleh subjek tunggal memiliki interpretasi absolut dalam hal kontinum
psikologis nilai skala dari pernyataan yang menyusun skala. Itu karena
skor sikap diambil sebagai median dari nilai skala pernyataan yang
disetujui subjek. Dengan demikian, masing-masing skor sikap itu sendiri

6
merupakan nilai skala pada kontinum psikologis di mana pernyataan
tersebut telah diskalakan. Dalam penskalaan pernyataan, salah satu
ujung kontinum ini telah didefinisikan sebagai tidak menguntungkan dan
yang lainnya menguntungkan, dengan kategori tengah didefinisikan
sebagai "netral." Jika skor sikap dengan demikian jatuh di bagian tengah
dari kontinum psikologis, maka, pada gilirannya, dapat digambarkan
sebagai "netral." Jika jatuh ke akhir yang menguntungkan dari kontinum,
itu dapat digambarkan sebagai menguntungkan, dan jika jatuh ke akhir
yang tidak menguntungkan, itu dapat digambarkan sebagai tidak
menguntungkan.
Interpretasi skor sikap pada skala interval yang tampak sama
dapat dibuat secara independen dari distribusi skor untuk kelompok
subjek tertentu. Secara umum, interpretasi skor sikap pada skala
peringkat yang dijumlahkan tidak dapat dibuat secara independen dari
distribusi skor beberapa kelompok tertentu. Jika subjek memperoleh
skor 0 pada skala penilaian jumlah-25 item, kita bisa menafsirkan skor
ini sebagai indikasi sikap yang tidak menguntungkan, karena, untuk
mendapatkan skor ini, subjek harus memberikan menyetujui tanggapan
untuk setiap pernyataan yang tidak menguntungkan dan tanggapan yang
sangat tidak setuju untuk setiap pernyataan yang menguntungkan dalam
skala. Sama halnya, kita bisa menafsirkan skor 100 sebagai menunjukkan
sikap yang menguntungkan, karena skor ini hanya dapat diperoleh jika
subjek memberikan respons yang sangat setuju untuk setiap pernyataan
yang menguntungkan dan respons yang sangat tidak setuju untuk setiap
pernyataan yang tidak menguntungkan. Interpretasi skor yang jatuh di
antara skor maksimum dan minimum yang mungkin lebih sulit, jika
minat kita dalam menggambarkan individu memiliki sikap yang baik atau
tidak baik terhadap objek yang sedang dipertimbangkan. Itu karena skor
peringkat penjumlahan yang sesuai dengan titik nol atau "netral" pada
kontinum yang tidak menguntungkan tidak diketahui karena diasumsikan
diketahui dalam kasus skor interval yang tampak sama. Juga tidak ada

7
bukti yang menunjukkan bahwa titik "netral" pada skala peringkat-
rangkuman harus sesuai dengan titik tengah dari kisaran skor yang
mungkin, yaitu skor 50 pada skala 25-item. Tidak adanya pengetahuan
tentang hal tersebut adalah cacat hanya jika minat utama kami adalah
mampu menetapkan, berdasarkan-nilai skor sikap, subjek tunggal ke
kelas mereka yang suka atau tidak menguntungkan dalam sikap terhadap
objek psikologis di bawah pertimbangan. Jika, dalam hal penelitian,
minat kami adalah membandingkan perubahan rata-rata dalam skor sikap
sebagai hasil dari memperkenalkan beberapa variabel eksperimental,
seperti film layar lebar, maka kurangnya pengetahuan tentang titik nol
seharusnya tidak menimbulkan kekhawatiran. Demikian pula, jika minat
kita adalah dalam membandingkan skor sikap rata-rata dari dua
kelompok atau lebih, ini dapat dilakukan dengan skala peringkat
penjumlahan serta dengan skala interval yang tampak sama. Atau jika
kita ingin mengkorelasikan skor pada skala sikap dengan skor pada skala
lain atau dengan ukuran minat lain, ini juga dapat dilakukan tanpa
referensi ke titik nol pada kontinum menguntungkan-tidak
menguntungkan. "" Salah satu pendekatan yang paling menjanjikan
untuk lokasi titik nol adalah analisis intensitas Guttman dan Suchman
(1947). Lihat juga Suchman (1950) dan katz(1944).

D. MENGEKSPRESIKAN SKOR SIKAP SEBAGAI SKOR T


Jika minat kami adalah pada sikap subjek tunggal relatif terhadap
sikap subyek lain, maka skor pada skala penilaian yang dirangkum dapat
diinterpretasikan dalam pengertian relatif ini - sebagaimana juga skor pada
skala interval yang tampak sama .
Interpretasi relatif skor sikap dibuat dengan cara yang sama di
mana interpretasi relatif skor pada tes psikologi lainnya dibuat, yaitu,
dalam hal distribusi skor yang diperoleh dari kelompok tertentu.
. Kita dapat mendefinisikan skor tes sikap rata-rata untuk
kelompok mata pelajaran tertentu sebagai :

8
ƸX
X '=
n

Dimana : X’ = Adalah bilangan aritmatika

Ƹ X = Jumlah skor semua mata pelajaran pada skala sikap

n = Jumlah subjek dalam kelompok yang diperjuangkan

Jika kita menggunakan mean dalam kelompok sebagai titik asal ,


maka masing-mmasing skor sikap individu dapat dinyatakan sebagai
deviasi normal. Kita berasumsi bahwa mean mewakili sikap khas atau
rata-rata kelompok. Kemudian skor yang lebih tinggi dari rata-rata dapat
diartikan sebagai skor yang lebih menguntungkan dari pada rata-rata untuk
kelompok dan skor yang lebih rendah dari rata-rata dapat diartikan sebagai
nilai yang kurang menguntungkan rata-rata.
Sebagai kerangka acuan yang jelas, distribusi skor sikap untuk kelompok
tertentu dapat di terjemahkan kedalam skor T dalam rumus berikut :

Dimana :

T = Skor T
X = Nilai yang diberikan subjek
X’ = Rata-rata aritmetika dari distribusi

9
S = Standar deviasi dari distribusi skor

E. KEANDALAN SKOR SIKAP


Beberapa kebingungan telah berpusat di sekitar subjek reliabilitas
komparatif skala yang dibangun oleh metode peringkat yang dirangkum
dan dengan metode interval yang tampak sama, sebagian besar sebagai
hasil dari studi Likert tentang keandalan skala tipe Thurstone. yang dinilai
dengan kedua metode. Dua bentuk skala diberikan kepada sekelompok
subjek dengan instruksi untuk memeriksa pernyataan sesuai dengan
instruksi Thurstone yang biasa. Skala yang sama kemudian diberikan
kepada subyek dengan instruksi untuk memeriksa setiap item satu dari
lima alternatif (sangat setuju, setuju, ragu-ragu, tidak setuju, sangat tidak
setuju) sesuai dengan instruksi Likert yang biasa. Empat dari pernyataan
pada skala Thurstone tidak dapat disesuaikan dengan respon tipe-Likert
dan dihilangkan ketika subjek diminta untuk memeriksa mereka. reaksi
menurut metode penjumlahan sistem penilaian peringkat.
Koefisien reliabilitas antara dua bentuk skala (22 vs 22 item),
ketika dinilai dengan metode interval yang sama muncul, adalah 0,88,
dikoreksi oleh rumus Spearman-Brown. Koefisien reliabilitas untuk dua
bentuk (18 vs 18 item), seperti yang dicetak oleh metode peringkat yang
dijumlahkan adalah 0,94, dikoreksi oleh rumus Spearman-Brown. Apa
yang diperlihatkan ini, tentu saja, adalah bahwa dimungkinkan untuk
mengambil skala yang dibangun dengan metode interval yang tampak
sama dan menerapkan sebagian besar pernyataan pada sistem penilaian
metode penilaian peringkat. Ketika ini dilakukan, koefisien reliabilitas
yang agak lebih tinggi akan, secara umum, diperoleh.
. Ferguson (1941), bagaimanapun, dalam mengkritik metode
peringkat yang dijumlahkan, tampaknya percaya bahwa Likert, karena ia
menemukan koefisien reliabilitas yang lebih tinggi dengan metode
penilaiannya daripada dengan metode penilaian skor interval yang tampak
sama, dengan keliru menyimpulkan bahwa "nya teknik adalah yang lebih

10
baik ". ). Koefisien reliabilitas yang lebih tinggi yang diperoleh dengan
metode skor Likert, Ferguson mencatat, mungkin disebabkan oleh fakta
bahwa "meningkatkan jumlah langkah pada skala psikologis
meningkatkan reliabilitas" (hal. 52). Sebagai catatan, ini adalah penjelasan
yang persis sama yang ditawarkan pada awalnya oleh Murphy dan Likert
(1937, hlm. 47 dan hlm. 55) untuk koefisien reliabilitas lebih tinggi yang
diperoleh dengan metode skoring Likert. Seluruh diskusi, pro dan kontra,
mengenai hal ini tidak banyak berpengaruh pada pertanyaan apakah
metode peringkat yang dijumlahkan atau metode interval yang tampak
sama akan menghasilkan skala tanggung jawab yang lebih tinggi.
Masalah sebenarnya menyangkut keandalan skala yang dibangun oleh dua
metode, bukan keandalan skema skoring khusus yang diisolasi dari teknik
konstruksi skala yang merupakan bagiannya.
Ferguson (1939) telah mengutip Thurstone sebagai melaporkan
keandalan skala yang dibangun dengan metode interval yang tampak
sama, di bawah arahannya, sebagai "seluruh 0,8, kebanyakan dari mereka
lebih dari 0,9" (hal. 670).
Ferguson menambahkan bahwa dalam studinya sendiri ia telah
menemukan reliabilitas untuk skala interval yang nampak sama mulai
dari ".52 hingga .80 untuk formulir 20 item dan dari .68 hingga .89 untuk
bentuk 40 item" (hal. 670) . Jika kita menganggap koefisien ini sebagai
representatif, bagaimana mereka membandingkannya dengan yang
dilaporkan untuk skala yang dibangun dengan metode penjumlahan-
peringkat? Murphy dan Likert (1937, p. 48) menemukan koefisien
reliabilitas untuk Skala Internasionalisme mereka yang terdiri dari 24
item mulai dari 0,81 hingga 0,90. Skala Imperialisme 12 pernyataan
mereka memberikan koefisien mulai dari 0,80 hingga 0,92; Skala Negro
dari 14 pernyataan menghasilkan koefisien mulai dari 0,79 hingga 0,91.
Rundquist dan Sletto (1936, hlm. 110) melaporkan koefisien mulai dari
0,78 hingga 0,88 untuk berbagai skala rangkuman-peringkat masing-
masing 22 pernyataan. Timbangan tipe-Likert dengan pernyataan yang

11
bahkan lebih sedikit akan memberikan koefisien reliabilitas yang tinggi
ditunjukkan oleh Hall (1934, hlm. 19). Koefisien reliabilitas untuk skala
10 pernyataannya yang mengukur sikap terhadap agama berkisar dari
0,91 hingga 0,93; untuk skala 7 pernyataannya yang mengukur sikap
terhadap para majikan, koefisien berkisar dari 0,77 hingga 0,87; dan
skala moralnya 5 pernyataan memberikan koefisien dari 0,69 ke 0,84.
Semua koefisien ini lebih baik dibandingkan dengan yang diperoleh dari
skala yang dibangun dengan metode equal- * Koefisien reliabilitas dari
skala penilaian yang disimpulkan didasarkan pada korelasi separuh-
setengah, dan semua yang dilaporkan di sini telah "diperbaiki" untuk
menunjukkan skala reliabilitas diambil secara keseluruhan. Untuk
tujuan perbandingan, tidak tepat untuk menaikkan koefisien untuk skala
interval yang tampak sama yang didasarkan pada bentuk ekivalen
masing-masing 20 hingga 22 item. Untuk melakukannya, akan
menunjukkan keandalan yang diharapkan dari skala Thurstone dari 40
hingga 44 pernyataan, sedangkan dalam praktiknya skala yang umum
digunakan hanya memuat setengah pernyataan. muncul interval.
Menurut bukti yang ada, tidak ada alasan untuk meragukan bahwa skala
yang dibangun dengan metode penjumlahan-peringkat akan
menghasilkan koefisien reliabilitas setinggi atau lebih tinggi dari skala
yang diperoleh dengan skala yang dibangun dengan metode interval yang
tampak sama.

F. NILAI SKALA PERNYATAAN THURSTONE DALAM SKALA


TAUTAN
Dari uraian tentang, metode peringkat-terangkum, jelaslah bahwa
tidak ada pertimbangan yang diberikan pada masalah nilai skala dari
masing-masing pernyataan. Cukuplah jika pernyataan yang berkaitan
dengan objek psikologis tertentu dapat diklasifikasikan sebagai
menguntungkan atau tidak menguntungkan. Klasifikasi ini menentukan
arah sistem pembobotan yang akan ditetapkan ke kategori respons.

12
Namun, dalam metode penskalaan seperti metode interval kemunculan
yang sama, diperlukan kelompok penilai untuk menentukan terlebih
dahulu nilai skala pernyataan pada kontinum yang menguntungkan dan
tidak menguntungkan.
Kebingungan yang mengikuti penyelarasan pernyataan Likert
dalam skala interval yang tampak sama dengan metode respons
tertimbang, sayangnya, tidak terbatas pada subjek keandalan; itu
menyebar untuk melibatkan pertanyaan apakah atau tidak ada kebutuhan
untuk kelompok penilai dalam pembangunan skala sikap. Ferguson
(1941) misalnya, tampaknya percaya bahwa Likert tersirat, sebagai hasil
dari memperoleh koefisien reliabilitas yang lebih tinggi dengan metode
penilaiannya daripada dengan metode penilaian Thurstone yang biasa,
bahwa ia telah menunjukkan bahwa metode penjumlahan-peringkat tidak
menghilangkan sepenuhnya dengan kebutuhan akan kelompok penilai.
Ferguson menentang hal ini dan mendasarkan kritiknya atas dasar berikut
(hlm. 52):
Karena pernyataan (yang digunakan oleh Likert dalam
penelitian di atas) telah disaring melalui prosedur penyortiran
(Thurstone's), sepertinya dibenarkan untuk menyimpulkan bahwa metode
Likert melakukan jauh dengan kebutuhan untuk kelompok menilai. Untuk
menguji titik ini cukup satu harus membandingkan timbangan dibangun
(independen dari metode Thurstone) dengan teknik Likert dengan yang
dibangun dengan metode interval yang sama-muncul. Kami berada dalam
perjanjian lengkap dengan argumen ini Ferguson.
Oleh karena itu agak sulit untuk memahami mengapa ia
melanjutkan untuk melakukan tepat apa yang ia mengkritik Likert untuk
melakukan. Ferguson mengusulkan, misalnya (p 52.), Bahwa: Sebuah tes
yang lebih memadai (? Dari dua metode) dapat disediakan oleh rescaling
item menggunakan metode Thurstone di skala dibangun dengan teknik
Likert. Jika teknik Likert tidak jauh dengan kebutuhan untuk kelompok
menilai, dua metode untuk mengobati laporan harus memberikan hasil

13
yang sama. Tapi desain eksperimental tertentu tidak akan memberikan tes
dari dua metode konstruksi skala; itu adalah penyelidikan dari mana
pernyataan Likert yang dipilih akan l jatuh di sepanjang kontinum
diasumsikan oleh Thurstone atau, menyatakan agak berbeda, apa yang
Thurstone nilai skala akan melekat laporan tertentu termasuk dalam skala
Likert-jenis tertentu.

G. STUDI EDWARDS DAN KENNEY

Sebuah perbandingan yang valid dari metode interval yang sama-


muncul dan metode penilaian dijumlahkan, harus dimulai dengan set asli
dari pernyataan, bukan dengan pernyataan yang sudah diayak dengan
prosedur Thurstone dan kemudian mencetak gol dengan metode Likert,
dan tidak dengan pernyataan diayak dengan Likert prosedur dan kemudian
ditingkatkan dengan teknik Thurstone. Kelompok yang sama subyek
kemudian harus digunakan dalam pembangunan dua skala, tetapi langkah-
langkah untuk setiap metode harus dilakukan melalui mandiri. Untuk
melaksanakan perbandingan ini, Edwards dan Kenney (1946) digunakan
laporan asli dari Thurstone dan Chave dalam studi mereka dari sikap
terhadap gereja.
Subyek yang digunakan dalam pembangunan skala itu 72 anggota
dari kelas psikologi pengantar di University of Maryland. Setengah kelas,
yang dipilih secara acak, diminta untuk menilai tingkat favourableness
atau unfavourableness diungkapkan oleh laporan sesuai dengan metode
Thurstone, sementara separuh lainnya dari kelas diminta untuk
memberikan tanggapan Likert-jenis laporan yang sama. Dua hari
kemudian prosedur terbalik; paruh pertama kelas memberi tanggapan
Likert-jenis laporan, sementara separuh lainnya memberi Thurstone-jenis
penilaian. Seashore dan Hevner (1933) metode item Peringkat digunakan
sebagai pengganti Thurstone dan Chave prosedur pemilahan item dalam
kategori.

14
Laporan dipilih untuk dua "setara" bentuk skala interval sama-
muncul, setiap form yang berisi 20 pernyataan. Pemilihan pernyataan itu
dibuat atas dasar standar resmi, nilai Q, nilai-nilai, dan skala Thurstone ini.
Sejauh mungkin, timbangan akhir berisi pernyataan dengan Q rendah,
nilai-nilai dan dengan nilai skala yang tersebar di sepanjang seluruh skala
pada jarak yang relatif sama-spasi. Karena hanya beberapa pernyataan,
bagaimanapun, ditemukan memiliki nilai skala dekat pusat kontinum dan,
pada saat yang sama, nilai rendah, ini tidak sepenuhnya mungkin.
Dalam membangun skala Likert, 25 pernyataan dipilih semua
dengan perbedaan rata-rata antara tanggapan pernyataan dari kelompok
tinggi dan kelompok rendah 1,8 atau lebih besar. Dalam sekitar setengah
dari laporan yang sangat setuju respon ditugaskan berat maksimum dan
setengah lainnya yang sangat setuju respon ditugaskan berat minimum.
Dari 25 laporan yang dipilih untuk skala Likert, tiga juga digunakan dalam
Formulir A dari skala interval sama-muncul dan dua digunakan kesamaan
dengan Formulir B
Untuk mendapatkan data tentang reliabilitas dari skala dan untuk
mengetahui hubungan yang ada antara skor pada Likert dan Thurstone
timbangan dibangun secara independen, anggota kelas psikologi lain
pengantar dan kelas psikologi terapan diuji. Satu kelompok mata pelajaran
disajikan dengan skala Thurstone diikuti oleh skala Likert; untuk
kelompok kedua mata pelajaran urutan presentasi terbalik. Ada 80 mata
pelajaran sama sekali, masing-masing kelompok berisi sekitar setengah
nomor ini. Koefisien reliabilitas untuk skala Likert dari 25 item adalah
0,94. Koefisien ini membandingkan mendukung cakap dengan mereka
biasanya dilaporkan untuk skala dibangun dengan metode dijumlahkan-
peringkat. Koefisien reliabilitas untuk dua bentuk skala interval yang
sama-muncul dari 20 item masing-masing adalah 0,88. Hal ini sebanding
dengan koefisien keandalan 0,85 dan 0,89 yang Thurstone dan Chave
(1929, p. 66) awalnya dilaporkan untuk skor pada Formulir mereka A dan
B untuk dua kelompok yang berbeda dari mata pelajaran.

15
H. KEMUDAHAN KONSTRUKSI PENJUMLAHAN – RATING DAN
SKALA INTERVAL YANG TAMPAK SAMA
Telah diklaim oleh Likert (1932) bahwa metode peringkat
dijumlahkan lebih sederhana dan lebih mudah untuk diterapkan dalam
pengembangan skala sikap daripada metode interval yang sama-muncul.
Beberapa dukungan untuk klaim ini telah diberikan oleh orang lain yang
telah menggunakan metode peringkat dijumlahkan. Hall (1934), misalnya,
menyatakan bahwa ia menggunakan metode peringkat dijumlahkan dalam
survei tentang sikap laki-laki yang bekerja dan menganggur karena relatif
sederhana. Rundquist dan Sletto (1936) menggunakan metode peringkat
dijumlahkan dalam mengembangkan skala sikap yang terkandung dalam
Survei Minnesota dari Opini dan mereka juga mengekspresikan keyakinan
mereka bahwa metode "kurang melelahkan dari itu dikembangkan oleh
Thurstone" (p. 5).
Edwards dan Kenney (1946), dalam studi komparatif mereka dari
metode interval yang sama-muncul dan metode penilaian dijumlahkan,
memperkirakan bahwa waktu yang dibutuhkan untuk membangun skala
interval sama-muncul adalah sekitar dua kali lipat dibutuhkan oleh metode
peringkat dijumlahkan. Namun, kita sekarang tahu bahwa itu tidak perlu
menggunakan sebuah kelompok terlalu besar hakim untuk mendapatkan
nilai-nilai skala diandalkan. Hal ini juga benar bahwa penilaian dapat
diperoleh dengan cepat dan mudah dalam hal metode yang digunakan oleh
Seashore dan Hevner (1933) atau Ballin dan Farnsworth (1941). Setelah
penilaian telah diperoleh, skala dan Q, nilai-nilai dapat dengan cepat
ditentukan melalui penggunaan nomograph, seperti yang dijelaskan oleh
Jurgensen (1943) atau perangkat seperti yang digunakan oleh Edwards dan
Kilpatrick (1948).

I. PERTANYAAN DAN MASALAH


1. Periksa pernyataan dengan "netral" nilai-nilai skala diperoleh ketika
laporan dicocokkan dengan metode interval yang sama-muncul dalam

16
latihan sebelumnya. Bisa pernyataan ini, pada umumnya, akan
mencetak dalam hal metode penilaian dijumlahkan? Jika tidak,
mengapa tidak?
2. Berikan laporan sebelumnya skala dengan metode interval muncul
sama dengan kelompok baru sekitar 100 subyek dengan arah Likert.
Pilih beberapa laporan dan menemukan proporsi di setiap ia kategori
respon. Cari bobot menyimpang normal untuk kategori respon.
Apakah bobot kurang lebih sama seperti bobot 0, I, 2, 3, dan 4
digunakan oleh Likert?
3. Menggunakan data yang diperoleh di atas, membangun skala
dijumlahkan-rating sekitar 20 hingga 22 pernyataan dan memberikan
skala untuk kelompok baru 100 mata pelajaran.
4. Karena nilai-nilai skala interval sama-muncul dikenal karena
pernyataan di atas, adalah mungkin untuk menemukan nilai pada
kontinum Thurstone menggunakan metode rata-rata mencetak gol
bagi mereka pernyataan bahwa subjek setuju dengan. Berkorelasi nilai
ini dengan yang diperoleh dengan mencetak laporan dalam hal metode
peringkat dijumlahkan. Apakah hasil Anda setuju dengan yang
dilaporkan oleh Likert? Metode yang mencetak gol akan Anda
memprediksi dengan hasil dalam koefisien keandalan yang lebih
tinggi? Mengapa?
5. Apa alasan yang mungkin ditawarkan untuk mendukung gagasan
bahwa tidak banyak Thurstone "netral" pernyataan akan diharapkan
untuk dimasukkan dalam skala yang dibangun dengan metode
penilaian dijumlahkan?
6. Bagaimana satu menafsirkan skor pada skala dijumlahkan-rating? Pada
skala interval sama-muncul?
7. Baca artikel oleh Edwards (1946). Apa adalah beberapa karakteristik
"netral" pernyataan bahwa ia ditemukan?

17
BAB III

PENUTUP

A. KESIMPULAN

Metode peringkat yang dijumlahkan merupakan metode yang memiliki


banyak macam cara atau rumus untuk menghitung skor atau nilai suatu
kelompok sehingga dari beberapa cara tersebut kita dapat memilih mana
yang lebih efektif untuk kita gunakan dalam menghitung

18
DAFTAR PUSTAKA
Edwards, Allen L. 1957. Technique of Attitude Construction. Appelton Century
Crofts. New York.

19

Anda mungkin juga menyukai