com
Metode untuk Mendeteksi Respons yang Tidak Valid dalam Data Survei
Paul G. Curran
Universitas Kenyon
Edisi Khusus: “Metode Ketat dan Dapat Direplikasi dalam Psikologi Sosial”
CATATAN: Ini adalah versi pra-cetak dari artikel ini, dan versi cetak terakhir dapat ditemukan di sini di
http://dx.doi.org/10.1016/j.jesp.2015.07.006 .
Catatan Penulis: Penulis ingin mengucapkan terima kasih kepada Katherine S. Corker, Brent M. Donnellan,
Fred L. Oswald, dan John F. Binning atas komentar dan saran yang berharga pada draf awal makalah ini.
Selain itu, penulis ingin mengucapkan terima kasih kepada editor edisi khusus ini, Edward Lemay dan Chuck
Stangor, serta dua pengulas anonim, atas umpan balik dan saran mereka yang berharga.
MENDETEKSI KECERDASAN 2
Abstrak
Pengumpulan data laporan diri, terutama melalui pengukuran online, ada di mana-mana di keduanya
psikologi eksperimental dan non-eksperimental. Data yang tidak valid dapat hadir dalam data tersebut
koleksi karena beberapa alasan. Salah satu alasannya adalah upaya yang ceroboh atau tidak cukup (C/IE)
menanggapi. Dekade terakhir telah melihat peningkatan dalam penelitian tentang teknik untuk mendeteksi dan menghapus ini
data sebelum analisis normal (Huang, Curran, Keeney, Poposki, & DeShon, 2012; Johnson, 2005;
Meade & Craig, 2012). Penggunaan yang ketat dari teknik ini adalah alat yang berharga untuk menghilangkan
kesalahan yang dapat memengaruhi hasil survei (Huang, Liu, & Bowling, 2015). Penelitian ini memiliki
mencakup sejumlah sub-bidang psikologi, dan makalah ini bertujuan untuk mengintegrasikan berbagai
perspektif ke dalam tinjauan dan penilaian teknik saat ini, pengenalan baru
teknik, dan generasi rekomendasi untuk penggunaan praktis. Kekhawatiran tentang C/IE
menanggapi adalah faktor setiap kali data laporan diri dikumpulkan, dan semua peneliti tersebut harus
Data psikologis laporan diri adalah sumber informasi yang ada di mana-mana di banyak bidang
penelitian psikologi. Laporan diri ini digunakan dalam eksperimen dan non-eksperimental
pengumpulan telah membuat proses ini lebih mudah diakses dan tersebar luas dalam beberapa tahun terakhir, tetapi ada
juga banyak sumber di mana kesalahan dapat memasuki proses ini. Salah satu jenis kesalahan ini berasal dari
responden yang memberikan data yang tidak valid untuk pertanyaan survei. Untungnya, ini adalah kesalahan yang bisa terjadi
dihapus dari proses pengumpulan data survei agar lebih stabil dan konsisten
hasil (Huang, Liu, & Bowling, 2015; Maniaci & Rogge, 2014).
Ada sejumlah alasan mengapa peserta penelitian dapat memberikan tanggapan yang:
dalam beberapa hal tidak valid; yaitu, data yang tidak mewakili nilai 'benar' yang sebenarnya. Johnson (2005)
mengidentifikasi tiga kelas utama dari data yang tidak valid ini: (1) ketidakmampuan linguistik atau
kesalahpahaman, (2) salah tafsir, dan (3) respon ceroboh atau lalai. Linguistik
inkompetensi berhubungan dengan konstruksi item dan proses dimana survei ditujukan
(dengan benar atau tidak tepat) pada populasi yang diinginkan. Kekeliruan berkaitan dengan masalah
curang, atau berpura-pura (Griffith & Peterson, 2006), perilaku yang kemungkinan besar berisiko tinggi
Respons yang ceroboh atau lalai berurusan dengan masalah yang berpotensi berdampak pada siapa pun
yang melakukan penelitian dengan peserta dalam pengaturan berisiko rendah hingga menengah (misalnya kumpulan subjek
peserta, pekerja MTurk, kurang dari sampel tempat kerja yang termotivasi penuh). Sayangnya, beberapa
peserta tidak akan melakukan upaya yang diperlukan untuk merespons secara akurat atau penuh perhatian terhadap semua
pertanyaan yang diajukan kepada mereka. Dimasukkannya tanggapan ini ke dalam satu set data yang akurat
dapat memiliki sejumlah efek tak terduga dan tidak diinginkan pada hubungan yang sedang diperiksa (Huang et
al., 2015).
MENDETEKSI KECERDASAN 4
Masalah ini terkait tetapi berbeda dari masalah lain yang ditemukan dalam data, seperti:
kekurangan. Akibatnya, penanggap C/IE kehilangan data yang sebenarnya tidak hilang. C/IE
responden telah memberikan respons ketika mereka mungkin membiarkan respons itu kosong. Ketika
beberapa metode untuk mengatasi kehilangan mungkin berguna setelah orang-orang ini disingkirkan,
ini di luar cakupan makalah ini, karena individu-individu ini harus dideteksi terlebih dahulu.
Untungnya, banyak metode telah dibuat untuk mendeteksi dan menghapus ketidakabsahan ini
responden dari kumpulan data. Meskipun ada sejumlah ulasan tentang beberapa di antaranya
metode (misalnya, Desimone, Harms, & Desimone, 2015; Johnson, 2005), makalah ini bertujuan untuk
meringkas, menghubungkan, dan memperluas alat metodologis modern ini, serta untuk menjelaskan
cara-cara yang dapat ditindaklanjuti untuk mengimplementasikannya. Ini akan dicapai dengan meringkas jenis ini terlebih dahulu
data dan konsep umum deteksi sebelum menguraikan teknik khusus secara rinci. Mengikuti
ini, rekomendasi untuk penggunaan dan masalah umum akan disorot dengan tujuan untuk membantu
meningkatkan pemahaman tentang metode ini. Akan direkomendasikan bahwa sejumlah ini
metode digunakan secara seri dengan tujuan masing-masing untuk mengurangi data yang tidak valid menjadi yang terbaik
terdeteksi oleh teknik tertentu, dan bahwa proses ini transparan dan dapat direplikasi dalam
Salah satu cara yang paling jitu untuk memeriksa dampak yang dirasakan dari tanggapan-tanggapan ini adalah dengan:
melihat bahasa yang digunakan untuk menggambarkan mereka. Selama bertahun-tahun, individu yang memamerkan ini
metode tanggapan disebut responden acak (misalnya, Pantai, 1989). Hal ini dipengaruhi oleh
gagasan bahwa tanggapan dari individu-individu ini dihasilkan oleh beberapa orang yang benar-benar acak
proses, seperti melempar koin atau melempar dadu. Dari sudut pandang validitas skala ini berarti bahwa
kesalahan acak dimasukkan ke dalam data. Ini sebagian benar, tetapi bukan cerita lengkapnya.
MENDETEKSI KECERDASAN 5
Penelitian yang lebih baru telah menunjukkan bahwa bahkan para pengambil survei yang diinstruksikan untuk menyelesaikan a
survei secepat mungkin tanpa berpikir masih akan menghasilkan beberapa pola non-acak dalam
data mereka. Pola-pola ini, di permukaan, dapat meniru respons yang bijaksana, tanpa
komitmen waktu dan pikiran (Huang, Curran, Keeney, Poposki, & DeShon, 2012). Ini
data dapat mengambil banyak pola, dan masing-masing pola ini dapat memiliki dampak yang sangat berbeda pada
hasil survei seperti sarana, penyimpangan, dan keandalan (Curran & Kotrba, 2012). Menangkal-
secara intuitif, karakteristik data yang valid dalam situasi ini bisa sama pentingnya dengan
karakteristik data yang tidak valid. Huang dkk. (2015), misalnya, telah menunjukkan bahwa
lokasi skala berarti dalam data yang valid akan menyebabkan pengenalan data yang ceroboh untuk menghasilkan
Kesalahan sedang diproduksi oleh responden ini, hanya saja tidak harus melalui sepenuhnya acak
proses. Motif yang berbeda dapat menyebabkan strategi dan pola respons yang berbeda, atau sama
motif dapat menghasilkan pola yang berbeda dari individu yang berbeda. Motif-motif tersebut memiliki
potensi untuk menggeser kesalahan ini dari kesalahan yang benar-benar acak ke sesuatu yang lebih berpola. NS
bahasa yang digunakan untuk menggambarkan individu-individu ini juga telah bergeser dari waktu ke waktu dari konsep a
responden 'acak' untuk a ceroboh (Meade & Craig, 2012) atau usaha yang tidak memadai (Huang et
al., 2012) responden (penanggap C/IE). Klasifikasi ini mencerminkan fakta bahwa beberapa upaya mungkin
masih diberikan, tidak cukup untuk tanggapan 'benar' yang bijaksana. Ini mencerminkan yang mendasari
membangun masalah validitas yang diwakili oleh individu-individu ini: kurangnya perhatian dan kecerobohan
harus memoderasi hubungan antara sifat dan keadaan aktual individu dan laporan diri
Perkiraan praktis penanggap C/IE dalam studi tipikal berkisar dari sekitar 1%
(Gough & Bradley, 1996) hingga sekitar 30% (Burns, Christiansen, Morris, Periard, &
MENDETEKSI KECERDASAN 6
Coaster, 2014), dengan beberapa konsensus di antara studi penelitian yang menunjukkan bahwa modal rate adalah
suatu tempat dekat 8-12% (Curran, Kotrba, & Denison, 2010; DeRight & Jorgensen, 2015; Maniaci
& Roge, 2014; Meade & Craig, 2012). Pencantuman bahkan sebagian kecil dari tanggapan ini dalam
kumpulan data berdampak pada kegunaan data tersebut (Curran & Kotrba, 2012; Huang et al., 2015; Maniaci
& Roge, 2014; Woods, 2006), dan jelas bahwa upaya harus dilakukan untuk mencegah hal tersebut
Jika ada satu konsensus yang dapat disetujui oleh semua peneliti C/IE adalah bahwa jenis-jenis
responden ada. Ini mungkin tampak sepele, tetapi penerimaan sederhana bahwa perilaku ini tidak
fenomena yang dibayangkan menimbulkan lebih dari pertanyaan sederhana di atas mengenai tingkat tipikal
individu-individu ini. Ini menimbulkan pertanyaan tentang seberapa banyak perilaku ini bervariasi di seluruh studi.
Ada sedikit pekerjaan yang secara konkret menetapkan kisaran nilai-nilai ini. Hauser
dan Schwarz (dalam pers) memeriksa tingkat kegagalan pada pemeriksaan manipulasi instruksional, atau IMCs,
di sejumlah sampel yang berbeda dari Klein, et al (2014). Pemeriksaan ini mengungkapkan kisaran
tingkat kegagalan, berdasarkan sampel, mulai dari kurang dari 10% hingga hampir 50%. Tingkat varians seperti itu
sangat membingungkan bila digabungkan dengan hasil Huang et al. (2015): bahwa
penyertaan responden C/IE dapat meningkatkan dan melemahkan efek statistik, dan bahwa dampak ini
terkait dengan proporsi responden C/IE dalam sampel. Dengan kata-kata mereka sendiri: “kehadiran
dari 10% (dan bahkan 5%) … bisa menyebabkan hubungan palsu di antara yang tidak berkorelasi
Jika diabaikan, penanggap C/IE ini merupakan ancaman besar bagi replikasi di sejumlah:
cara. Pertama dan terpenting, studi yang secara tidak sengaja menarik sebagian besar responden ini
memiliki potensi yang lebih besar untuk positif palsu atau negatif palsu. Ini dapat menyebabkan temuan yang benar menjadi
MENDETEKSI KECERDASAN 7
disembunyikan oleh respons C/IE ini, dan menyebabkan studi yang berhasil merana dalam file
laci. Ini juga dapat menyebabkan hasil palsu dipublikasikan yang hanya merupakan produk dari yang tinggi
tingkat responden C/IE dalam sampel itu, dan bukan efek mendasar yang sebenarnya.
Dalam kasus terbaik mengikuti contoh pertama, peneliti lain kemudian dapat mencoba hal yang sama
belajar dan sukses, hanya menyebabkan potensi duplikasi usaha. Pada contoh kedua,
kasus terbaik lebih sulit didapat. Hasil palsu seperti itu dapat dipertanyakan melalui
replikasi, tetapi tanpa pemahaman yang jelas tentang penanggap C/IE sebagai mekanismenya
perbedaan hasil yang bertentangan ini mungkin membutuhkan banyak waktu dan upaya untuk menguraikannya. Di luar
ini, replikasi itu sendiri mungkin terganggu oleh masalah yang sama, baik membenarkan atau menyangkal
Ini mungkin tampak seperti proklamasi yang serius, dan memang demikian. Responden C/IE adalah sumber potensial
kebisingan yang tidak bias, kesalahan yang dapat menggeser hasil ke segala arah. Jika tingkat responden C/IE adalah
cukup konstan ini akan menjadi berita yang cukup buruk, tetapi prospek bahwa tarif dapat bervariasi sebanyak
mereka tampaknya memang mengerikan. Huang dkk. (2014) dilayani dengan baik untuk mengidentifikasi tanggapan ini sebagai
Ada banyak potensi penyebab data tidak valid dalam penelitian umum. Data tidak valid pada tinggi-
tes dan survei pasak, karena sifat berharga dari tindakan ini (misalnya, penilaian klinis
dan seleksi personel), telah dipelajari secara mendalam selama beberapa dekade (misalnya, Berry, Baer, &
Haris, 1991; Jagal, Dahlstrom, Graham, Tellegen, & Kaemmer, 1989; Birkeland, Manson,
Kisamore, Brannick, & Smith, 2006; Dunnette, McCartney, Carlson, & Kirchner, 1962; Orpen,
1971). Peneliti yang mempelajari pemalsuan dan kecurangan mendapatkan keuntungan bahwa perilaku ini hanya
dimanifestasikan dengan cara yang sangat spesifik. Individu tidak menipu atau memalsukan untuk menghasilkan yang tidak diinginkan
MENDETEKSI KECERDASAN 8
hasil; mereka menipu atau memalsukan untuk menghasilkan hasil yang diinginkan (pekerjaan, diagnosis klinis tertentu).
Meskipun mungkin ada manifestasi berbeda dari perilaku ini yang berpotensi mencerminkan spektrum
motivasi (misalnya, individu yang berbeda dapat memalsukan penyakit atau kesehatan palsu pada klinis yang sama)
persediaan), memalsukan masih merupakan manipulasi respons yang mudah terhadap beberapa tujuan.
Respons C/IE tidak memiliki tujuan yang direferensikan dengan jelas yang dapat dibedakan dalam
hasil tanggapan survei. Tujuan tanggapan C/IE bukanlah tujuan yang dicapai oleh
penerapan usaha, melainkan melalui minimalisasi usaha. Ini membedakannya dari yang lain
konsep serupa tetapi berbeda seperti keinginan sosial atau manajemen kesan, di mana upaya
sedang diterapkan untuk mengubah tanggapan terhadap beberapa tujuan. Karena tujuan akhir pemfokusan ini tidak ada (atau
tujuannya hanya untuk menghemat tenaga atau waktu), pola respons C/IE dapat mengambil beberapa bentuk.
Peserta dapat memanifestasikan respons C/IE dengan memilih beberapa opsi respons tunggal untuk setiap
pertanyaan. Mereka juga dapat memilih satu opsi sebagian besar waktu, tetapi kadang-kadang bervariasi itu
respon terhadap satu pilihan yang lebih tinggi atau lebih rendah pada skala. Ada juga kemungkinan bahwa seorang peserta dapat
cukup berikan sesuatu yang dekat dengan data acak. Semua ini mewakili motivasi inti yang serupa
(atau kurangnya motivasi), tetapi dimanifestasikan dalam cara yang sangat berbeda. Oleh karena itu sulit untuk
menghasilkan satu metode tunggal yang menangkap semua kasus, dan ini membuat deteksi C/IE secara inheren
kompleks.
Penelitian tentang pendeteksian data yang tidak valid dari penanggap C/IE malah menghasilkan
sejumlah metode potensial, masing-masing ditujukan untuk mengidentifikasi dan berpotensi menghilangkan
pola respons C/IE yang mungkin tampak valid untuk metode lain. Misalnya, beberapa metode
menilai konsistensi respons sebagai karakteristik negatif (misalnya, analisis string panjang), sedangkan
metode lain menggunakannya sebagai indikator positif (misalnya, konsistensi ganjil-genap). Ketidaksepakatan
MENDETEKSI KECERDASAN 9
antara teknik ini sederhana mencerminkan fakta bahwa mereka menilai berbeda
indikator respon C/IE. Metode-metode ini akan dibahas secara rinci di bagian berikut.
Hubungan negatif yang diketahui antara metrik yang berbeda (Meade & Craig, 2012)
berarti bahwa penerapan teknik yang berbeda memiliki potensi untuk menghilangkan set tertentu dari
Responden C/IE sambil mempertahankan orang lain yang sama-sama tidak valid. Misalnya, cukup menggunakan
metode yang menguji konsistensi respons sebagai karakteristik positif dan mengabaikan a
metode yang melihat konsistensi respons yang berlebihan sebagai karakteristik negatif cenderung
hapus orang-orang yang memberikan respons tidak valid yang sangat bervariasi sambil mempertahankan yang
secara fungsional invarian (misalnya, semua tanggapan 'Sangat Setuju'). Penggunaan salah satu dari ini
teknik tidak boleh diterapkan dalam ruang hampa dari teknik lain. Bahkan, sebagian
penerapan atau pemahaman metode ini memiliki kemungkinan untuk melemahkan efek yang ada atau
bahkan membuat efek palsu. Meskipun ini adalah skenario terburuk, ada baiknya membangun yang kuat
praktik penyaringan data bahkan untuk situasi di mana penghapusan kasus tersebut tidak
mengubah hasil studi. Jika data yang dihapus benar-benar tidak valid, maka ini mengakibatkan
kesalahan, penghalang untuk replikasi di masa depan, masih layak dihilangkan (Huang et al., 2015).
Bagian berikut akan merinci sejumlah metode yang ada dan baru untuk pembuatannya
statistik dalam-orang yang dapat digunakan dalam penghapusan berbagai jenis tidak valid
menanggapi. Ini akan mengikuti beberapa klasifikasi, dari waktu respons yang sederhana dan lama
pola respons yang sama terhadap perhitungan konsistensi internal respons individu dan
pengenalan item khusus dan instruksi dalam timbangan sebagai jebakan potensial untuk C/IE ini
responden.
MENDETEKSI KECERDASAN 10
Waktu respons, waktu yang dibutuhkan seseorang untuk merespons satu set item, mungkin
alat yang paling banyak digunakan untuk menghilangkan penanggap C/IE. Ini adalah yang paling mungkin untuk digunakan
secara intuitif bahkan oleh mereka yang tidak memiliki pengetahuan tentang literatur C/IE. Intuitif ini
penggunaan waktu respons dapat diturunkan secara independen dengan perpanjangan praktis dari satu sederhana
asumsi: ada waktu minimum yang diperlukan untuk menyelesaikan survei secara sah.
Waktu respons normal atau rata-rata jelas akan berbeda untuk survei yang berbeda.
Waktu respons cenderung berkorelasi dengan jumlah item, tetapi beberapa item membutuhkan waktu lebih lama untuk
lengkap dari yang lain. Oleh karena itu, sulit untuk membuat aturan konkret untuk waktu respons yang
berbeda dari analisis outlier normal kecuali status peserta sebagai penanggap C/IE adalah
sudah diketahui (tidak mungkin), atau dimanipulasi secara eksperimental (misalnya, Huang et al., 2012).
Untuk kreditnya, waktu respons tampaknya menjadi salah satu metrik tersulit dari C/IE
menanggapi orang bodoh dengan cara yang konsisten dengan perilaku C/IE karena satu fakta sederhana: a
dugaan motif utama yang mendasari responden C/IE adalah menyelesaikan penilaian secepat
mungkin. Ketika peserta diinstruksikan untuk menanggapi seolah-olah mereka tidak peduli dengan survei tetapi
juga tidak ingin diidentifikasi sebagai responden C/IE (seperti dalam Huang et al., 2012), para peserta tersebut
mampu menghasilkan pola respons yang sangat mirip dengan respons normal, saat masih
memiliki waktu respons yang jauh lebih konsisten dengan peserta yang diinstruksikan untuk hanya merespons seolah-olah
mereka tidak peduli sama sekali. Cara terbaik untuk mengelabui waktu respons adalah dengan mengulur waktu pada titik-titik tertentu dalam penelitian;
jika ini terjadi sebagai strategi yang valid, sulit untuk memahami mengapa peserta tidak melakukannya begitu saja
Dalam banyak aspek, waktu respons cukup sederhana. Pada saat yang sama, ada alasan yang masuk akal
tingkat variasi normal dalam diri orang mengenai seberapa cepat individu dapat merespons
MENDETEKSI KECERDASAN 11
survei. Tidak mengherankan bagi siapa saja yang telah melakukan penelitian survei adalah gagasan bahwa waktu itu
membutuhkan satu individu untuk merespons dengan serius mungkin berbeda secara drastis dari waktu yang dibutuhkan
lain. Tidak begitu jelas fakta bahwa variasi juga ada dalam waktu yang dibutuhkan
individu untuk merespon dengan ceroboh atau dengan usaha yang tidak memadai.
Metode deteksi C/IE lainnya telah mendapat manfaat dari simulasi pola respons, tetapi
waktu respons sangat sulit untuk disimulasikan karena sejumlah asumsi yang mendasarinya
mengenai waktu yang dibutuhkan seseorang untuk menyelesaikan survei. Yang mengatakan, efek umum dan
Kesulitan menggunakan metode ini dapat ditunjukkan dengan latihan sampling sederhana. NS
pembaca dapat dengan mudah mereplikasi latihan ini dengan berbagai parameter yang dimodifikasi, tetapi untuk
tujuan makalah ini kami akan mempertimbangkan survei yang membutuhkan waktu 10 menit (600 detik) untuk
menyelesaikan, rata-rata, untuk responden yang normal dan bijaksana. Kita dapat, sebagai skenario kasus terbaik,
bayangkan bahwa standar deviasi responden ini relatif kecil. Untuk tujuan ini,
kita dapat menggunakan standar deviasi 100 detik, atau sedikit lebih dari satu setengah menit.
Untuk mensimulasikan penanggap C/IE, kami juga dapat memperkenalkan 10% individu yang memiliki
menjawab lebih cepat, rata-rata, dari responden normal kami. Kita dapat mencoba ini di sejumlah
ukuran efek yang berbeda menggunakan Cohen's D, dan dalam setiap kasus tambahkan 10 sampel dari acak ini
distribusi normal ke distribusi keseluruhan. Gambar 1 menunjukkan inklusi ini pada tiga
tingkat yang berbeda: D = 1 (rata-rata 500 detik untuk responden C/IE), D = 2 (rata-rata 400 detik
untuk responden C/IE), dan D = 3 (rata-rata 300 detik untuk responden C/IE). Karena kami adalah
mensimulasikan data ini, kita dapat memeriksa keduanya bagaimana hal ini akan tampak bagi seorang peneliti dalam praktiknya (kiri
kolom gambar 1), tetapi juga bagaimana tumpang tindih diferensial yang sebenarnya ini terjadi secara diferensial
mewarnai data normal lebih gelap dan membiarkan data C/IE lebih terang (kolom kanan gambar 1).
MENDETEKSI KECERDASAN 12
Kolom kanan gambar 1 menunjukkan betapa sulitnya menghapus semua C/IE ini
individu bahkan dalam kasus yang cukup ekstrim; D = 3 mewakili kasus di mana responden C/IE berada, pada
rata-rata, menyelesaikan tanggapan mereka dalam setengah waktu peserta normal (300 detik vs 600
detik). Kesulitan tersebut berasal dari fakta bahwa penghapusan responden C/IE dalam kasus ini
melibatkan pemisahan dua normal yang tumpang tindih (atau, untuk lebih memperumit masalah, dua)
berpotensi non-normal atau tidak diketahui) distribusi dari satu sama lain. Proses ini menuntut
pertimbangan bijaksana dari pertukaran yang dapat diterima antara kesalahan Tipe I dan Tipe II (Curran,
Namun, ini seharusnya tidak menjadi penghalang untuk mengumpulkan waktu respons. Jika peneliti bisa
mengumpulkan waktu respons (misalnya, melalui pengumpulan online atau terkomputerisasi), seharusnya
dikumpulkan. Bahkan jika tidak digunakan, itu datang dengan biaya minimal. Selanjutnya, setelah seorang peneliti gagal untuk
mengumpulkan waktu respons tidak mungkin lagi untuk kembali dan mendapatkannya secara surut.
Huang dkk. (2012) telah menyarankan skor potong untuk waktu respons pada 2 detik item,
yang secara anekdot tampaknya mendapatkan daya tarik informal di lapangan. Meskipun ini mungkin
skor potongan yang agak konservatif, dan meninggalkan beberapa responden yang ceroboh dalam sampel, itu akan menjadi
sikap makalah ini bahwa peneliti melakukan kesalahan dengan cara ini pada semua teknik. Pada waktu bersamaan,
peneliti harus mempertimbangkan kemungkinan bahwa responden yang bijaksana mungkin dapat memberikan
tanggapan yang begitu cepat pada instrumen survei khusus mereka. Bahkan skor potong yang ditetapkan seperti
Akhirnya, meskipun masalah ini terlalu kompleks untuk dibahas secara memadai di sini, hal itu harus diperhatikan
bahwa analisis waktu respons dalam deteksi C/IE saat ini merupakan analisis satu arah. Responden adalah
hanya diperiksa untuk kecepatan respon yang terlalu cepat. Ekor lain dari distribusi ini, respons
waktu yang terlalu lambat, juga berpotensi bermanfaat untuk diperiksa. Namun, lebih banyak faktor
MENDETEKSI KECERDASAN 13
dapat berkontribusi pada waktu respons yang terlalu lambat, dan hingga saat ini belum ada penelitian yang meneliti hal ini
situasi. Mungkin ada keuntungan tambahan dari memeriksa responden 'terlalu lambat' ini tidak layak
Mungkin teknik paling intuitif berikutnya untuk digunakan dalam mendeteksi penanggap C/IE adalah
analisis rangkaian tanggapan, yang dikenal dalam literatur sebagai 'analisis rangkaian panjang' atau 'tanggapan'
indeks pola '(Huang et al., 2012; Meade & Craig, 2012). Teknik ini tampaknya memiliki
secara resmi dimulai dengan penggunaan teknik pinjaman Johnson (2005) untuk kemudian dijelaskan dalam
karya Costa dan McCrae (2008). Teknik ini melibatkan pemeriksaan string terpanjang dari
tanggapan yang sama dari setiap peserta. Ini dapat dihitung secara tunggal, pada respons
pilihan yang paling sering dipilih (Huang et al., 2012; Meade & Craig, 2012), atau
beberapa kali, sekali pada setiap opsi untuk setiap peserta (Johnson, 2005). Selain itu, ada
jumlah cara untuk memperlakukan nilai yang dihitung ini, mulai dari hitungan murni hingga rata-rata terpanjang
string per halaman ke nilai yang ditimbang oleh panjang rata-rata keseluruhan string dari respons itu.
Misalnya, ambil pola respons berikut pada satu set 10 item, dengan asumsi 1 sampai
[3, 3, 4, 4, 4, 3, 5, 3, 3, 4]
Dalam hal ini, string terpanjang dari respons yang sama ada pada respons ketiga hingga kelima. Dia
urutan tanggapan '4' yang panjangnya tiga. Jika hanya memeriksa panjang terpanjang
serangkaian tanggapan, skor untuk individu ini akan menjadi nilai 3. Jika setiap opsi tanggapan
diperiksa, individu ini akan memiliki satu set skor untuk tanggapan dari 1 hingga 5 sebagai
berikut: 0, 0, 2, 3, 1. Perhatikan bahwa sebenarnya ada lebih banyak jawaban '3' dalam contoh ini daripada
MENDETEKSI KECERDASAN 14
ada '4' tanggapan, kebetulan ada lebih banyak '4' tanggapan yang tidak terputus
urutan. Urutan yang tidak terputus inilah yang diidentifikasi oleh metode deteksi string panjang ini.
menanggapi sembarangan dapat melakukannya dengan memilih opsi jawaban yang sama untuk setiap pertanyaan. NS
perpanjangan dari asumsi ini adalah bahwa individu yang merespon dengan hati-hati, dan dengan cukup
upaya, tidak akan menggunakan opsi respons yang sama untuk jangka waktu yang lama. Ini menyoroti fakta bahwa
teknik ini, seperti banyak teknik yang akan dibahas dalam makalah ini, adalah bentuk-
statistik ketergantungan. Ini berarti bahwa skor mentah akan bervariasi sebagai produk dari bentuk yang digunakan untuk
mengumpulkan data. Skala 10 item memiliki 10 sebagai batas atas statistik ini, sedangkan skala 20 item memiliki
batas atas 20. Karena nilai adalah hitungan sederhana dari kecocokan berurutan, nilai akan
selalu mengambil bilangan bulat dibatasi oleh 1 dan panjang penilaian. Selain itu, skala yang
memiliki pertanyaan dengan intensitas yang berbeda-beda (misalnya 'Saya punya banyak teman' vs 'Saya berteman dengan siapa saja
orang yang saya temui') harus mendorong responden yang berhati-hati untuk lebih sering mengubah opsi respons mereka
daripada pada skala yang memiliki pertanyaan semua diarahkan pada tingkat yang kira-kira sama.
Teknik ini juga cenderung bergantung pada pilihan respon. Artinya, khas
frekuensi string panjang pada opsi respons tertentu cenderung lebih tinggi daripada yang lain; 'Setuju'
adalah pilihan yang sangat populer pada skala tipikal (Curran, Kotrba, & Denison, 2010; Johnson, 2005).
Properti ini akan bervariasi dari skala ke skala dan sampel ke sampel (Johnson, 2005). Karena
faktor-faktor ini, analisis string panjang bisa sulit untuk dibandingkan di seluruh koleksi data yang berbeda
Selain itu, pertimbangkan keterbatasan teknik ini pada skala yang lebih pendek (misalnya, 20-item
Mini-IPIP oleh Donnellan, Oswald, Baird, & Lucas, 2006). Kecuali pengukuran rinci dari beberapa
konstruk atau kelompok konstruksi terkait adalah fokus utama dari sebuah studi, skala yang lebih pendek dari jenis ini
MENDETEKSI KECERDASAN 15
kemungkinan besar akan digunakan. Ini memiliki efek kompresi, melalui efek langit-langit dan/atau lantai,
sejumlah kategori sederhana di mana individu dapat dikelompokkan. Seperti disebutkan sebelumnya,
rangkaian respons terpanjang pada skala tertentu memiliki batas bawah 1, batas atas
jumlah item pada skala itu, dan harus mengambil nilai bilangan bulat.
Teknik ini menangkap apa yang dapat dianggap sebagai buah C/IE yang menggantung rendah
responden: mereka yang mengambil sedikit atau tidak ada upaya untuk mengubah tanggapan mereka selama survei.
Mirip dengan waktu respons, bagaimanapun, kemudahan teknik ini dapat membedakan antara
responden yang valid dan tidak valid akan berkurang karena responden mulai menyimpang dari kasus ideal ini
respon yang sepenuhnya invarian. Distribusi tumpang tindih yang serupa, seperti pada gambar 1, perlu dipisahkan
untuk membedakan responden, dan kesalahan di kedua arah (Tipe I & Tipe II) harus selalu a
perhatian utama. Responden yang meluangkan waktu untuk sesekali memvariasikan respons mereka secara minimal
cara juga dapat dengan mudah menipu metode ini. Ini adalah batasan yang melekat dalam metode ini, dan setiap
upaya untuk memperbaiki cacat seperti itu mungkin lebih baik dibandingkan dengan gagasan untuk melengkapi model. Sebagai gantinya,
pengakuan bahwa setiap teknik memiliki titik buta justru menjadi alasan untuk menggunakan angka
teknik dalam konser, masing-masing seimbang untuk memberikan cakupan penuh dari jebakan potensial ini.
Analisis string panjang memiliki potensi untuk menghilangkan beberapa yang terburuk dari yang terburuk
responden, tetapi mungkin mengalami kesulitan melakukan lebih banyak. Dalam hubungannya dengan layar untuk sebagian besar
waktu respons yang ekstrem, kedua teknik ini diajukan sebagai minimum yang direkomendasikan untuk
penghapusan responden C/IE, dan awal yang baik sebelum implementasi yang lebih kompleks
teknik. Terlepas dari beberapa keterbatasan, penghapusan responden terburuk ini lebih baik daripada
Karena sifat skala khusus dari teknik ini, tidak ada pemotongan global yang mapan
skor di tempat untuk itu. Sesuai dengan pendekatan Huang et al. (2012) tentang
MENDETEKSI KECERDASAN 16
skor pemotongan konservatif untuk waktu respons, makalah ini akan menyarankan aturan dasar praktis bahwa
individu dengan serangkaian tanggapan yang konsisten sama atau lebih besar dari setengah panjang total
skala dianggap sebagai responden C/IE dengan teknik ini. Jelas ini bukan skor potong terbaik
untuk semua skala (terutama, ini mungkin terlalu ketat pada skala dengan item yang sangat mirip, atau terlalu
lunak pada skala dengan variasi item yang mudah dikenali), tetapi setidaknya memberikan poin untuk
Analisis outlier adalah konsep yang cukup sederhana yang sering diajarkan pada tahap awal
pelatihan statistik. Secara umum, outlier dapat dianggap sebagai titik data yang tidak biasa relatif terhadap
sisa distribusi (Peck & Devore, 2012). Pencilan bisa ada karena berbagai alasan, dan C/IE
menanggapi tentu saja di antara mereka. Individu yang merespons tanpa usaha yang cukup adalah
mungkin berbeda dari rekan-rekan mereka yang bijaksana dalam beberapa hal, dan itu tidak masuk akal untuk
Metode dasar analisis outlier memeriksa satu nilai dari distribusi relatif terhadap yang lain
nilai dalam distribusi tersebut. Misalnya, nilai yang ada 1,5 standar deviasi dari mean
(atau 1,5 rentang interkuartil dari median) biasanya diperlakukan sebagai outlier saat membersihkan
data, atau menghasilkan visualisasi seperti boxplot (Peck & Devore, 2012). Teknik ini bisa
berpotensi digunakan sebagai metode C/IE untuk mendeteksi respons yang tidak biasa untuk setiap item skala, atau bahkan
untuk skor skala keseluruhan. Ini bukan praktik umum dalam deteksi respons C/IE untuk beberapa
alasan. Menggunakan teknik ini pada tingkat item menghasilkan situasi di mana hanya beberapa bagian dari
tanggapan item dianggap valid. Menggunakannya pada tingkat skala mengabaikan fakta bahwa ada
banyak alasan mengapa individu mungkin ada sebagai outlier statistik dasar. Di antara alasan tersebut adalah
posisi aktual individu pada sifat laten yang diukur. Analisis outlier sederhana di
MENDETEKSI KECERDASAN 17
tingkat skala juga mengasumsikan bahwa penanggap C/IE harus ada di bagian ekor distribusi skor seperti itu.
Ini hanya akan terjadi jika metode respons mereka adalah memilih banyak dari nilai tinggi atau yang sama
opsi respons rendah, taktik yang sudah ditargetkan dengan cara yang lebih tepat menggunakan
Ada teknik analisis outlier yang ada di luar metode sederhana ini.
Jarak Mahalanobis, atau Mahalanobis D, adalah teknik outlier multivariat yang sederhana
perluasan analisis outlier normal ke dalam ruang multivariat (Mahalanobis, 1936). Teknik ini
telah menunjukkan beberapa janji sebagai metode deteksi C/IE (Ehlers, Greene-Shortridge, Weekley, &
Zajak, 2009; Maniaci & Rogge, 2014; Meade & Craig, 2012). Cara termudah untuk menjelaskan
Jarak Mahalanobis adalah meskipun dua variabel kasus, yang akan diuraikan di sini. Untuk banyak
penjelasan lebih dalam tentang jarak Mahalanobis, lihat Maesschalck, Jouan-Rimbaud, dan Massart
(2000).
Dalam kasus satu dimensi, outlier diperiksa dengan jaraknya ke beberapa pusat a
distribusi. Ini paling sering melalui penggunaan sarana dan standar deviasi, seperti di atas.
Titik-titik dalam distribusi ini ada dalam ruang satu dimensi (garis), dan jarak dari
pusat dapat dinyatakan sebagai perbedaan sederhana, seperti perbedaan antara pengamatan
dan artinya:
!"#$%&'( = * *
Ini adalah jarak yang masih dalam satuan skala aslinya, tetapi dapat diubah
menjadi jarak tak satuan dengan skala sederhana jarak dengan standar deviasi, menghasilkan z-
skor:
*- *
, # '-.( =
0
MENDETEKSI KECERDASAN 18
Konsep yang sama ini dapat diterapkan ketika memeriksa sistem multivariat. Ekstensi
Konsep-konsep ini mencerminkan pergeseran dari jarak pada garis satu dimensi ke jarak pada garis dua dimensi.
bidang dimensi, dan seterusnya. Alih-alih titik pada garis yang membentuk distribusi, dua-
distribusi multivariat dimensi (bivariat) didefinisikan sebagai titik-titik pada bidang: sebuah scatterplot. NS
jarak sederhana dari setiap titik dari pusat multivariat distribusi ini (*1, *3) dapat ditemukan
oleh:
!"#$%&'( = *1 * 3 +1 *3 *3 3
Jarak ini, seperti jarak mentah dalam kasus satu dimensi, tidak memperhitungkan
memperhitungkan standar deviasi dari masing-masing variabel ini. Gerakan sepanjang x1 diperlakukan
sama dengan gerakan sepanjang x2, bahkan jika distribusi x1 jauh lebih rapat. Di dalam
kontras, jarak Mahalanobis memperhitungkan struktur varians yang mendasari ini dengan
menggabungkan matriks kovarians dari dua variabel ini (C). Untuk sebuah nilaixSaya pada orang ini oleh
matriks item, X, Mahalanobis D dengan demikian dapat ditemukan dengan persamaan berikut (Maesschalck,
Sekali lagi, pembaca diarahkan ke Maesschalck, Jouan-Rimbaud, dan Massart (2000) untuk a
diskusi matematika yang lebih dalam. Yang penting untuk diskusi saat ini adalah
pemahaman konseptual bahwa Mahalanobis D dapat digunakan sebagai metode multivariat outlier
analisis dalam data survei laporan diri (Ehlers, et al., 2009; Maniaci & Rogge, 2014; Meade & Craig,
2012). Alih-alih mengetahui bahwa seorang individu berada di ekor distribusi pada satu item,
Mahalanobis D dapat memberi tahu peneliti bahwa seorang individu berada di pinggiran multivariat
Metrik ini tampaknya berkorelasi baik dengan beberapa metrik lain dari respons C/IE
deteksi (Maniaci & Rogge, 2014; Meade & Craig, 2012), tetapi memiliki beberapa keterbatasan. Pertama, sebagai
Meade & Craig (2012) mencatat, Mahalanobis D adalah prosedur komputasi intensif, dan mereka
dipaksa untuk menjalankan serangkaian perhitungan yang dikurangi pada data mereka, yang kemudian dirata-ratakan. Ini
adalah batasan yang akan berkurang oleh derap waktu dan teknologi, tetapi perlu diperhatikan.
Kedua, teknik ini dibangun dari dasar analisis outlier menggunakan spread from center
metrik, seperti skor-z. Metrik ini bergantung pada tingkat normalitas tertentu dalam data, dan dapat
dipengaruhi oleh penyimpangan dari normalitas dalam item, serta dari terlalu banyak normalitas dalam C/IE
responden (Meade & Craig, 2012). Sekali lagi, penanggap C/IE mungkin berpengalaman dalam merespons
Secara konseptual, pelanggaran kewajaran ini dapat bermanifestasi dalam beberapa cara yang berbeda.
Meade dan Craig (2012) menyoroti kasus di mana distribusi barang sangat condong ke keduanya
akhir skala dengan efek lantai dan langit-langit. Dalam kasus ini, Mahalanobis D tampil
sangat baik, karena tanggapan C/IE di ujung lain skala menonjol dengan sangat jelas. Tidak seperti
contoh sebelumnya dengan outlier univariat dan garis bilangan, aplikasi praktis dari
Mahalanobis D di C/IE menanggapi harus berurusan dengan fakta bahwa tanggapan berada pada skala dengan
batas yang dibatasi. Meskipun tidak ditemui oleh Meade dan Craig (2012), situasi lain yang mungkin terjadi
adalah item di mana semua opsi respons digunakan, menciptakan lebih banyak distribusi seragam di
tingkat barang. Dalam hal ini, outlier multivariat mungkin hanya ada di luar batas skala (yaitu,
Jarak Mahalanobis hanya diteliti dalam segelintir kecil penelitian yang melibatkan
C/IE menanggapi poin ini, dan pemahaman penuh tentang propertinya masih belum jelas. Sebagai cukup
MENDETEKSI KECERDASAN 20
metrik yang belum diuji untuk respons C/IE, ini harus digunakan sebagai cara untuk menandai individu lebih dalam
pemeriksaan, tetapi mungkin belum menjadi cara yang jelas untuk menghilangkan penanggap C/IE dengan sendirinya.
Konsistensi Individu
konsistensi string respons dalam individu. Ada sejumlah teknik yang semuanya
mengukur konsistensi ini, dan yang masing-masing akan diperiksa di setiap bagian berikut.
Asumsi yang mendasari metode konsistensi individu ini adalah, sederhananya, bahwa
responden yang penuh perhatian memberikan pola tanggapan yang konsisten secara internal.
Pertimbangkan penelitian awal, ketika tanggapan dari individu masih dianggap hampir
sepenuhnya acak. Ini adalah asumsi yang adil bahwa pola respons lengkap individu, penuh dengan
data acak seperti itu, harus mudah diidentifikasi sebagai noise dengan latar belakang valid
tanggapan. Ini adalah asal usul teknik semacam itu, meskipun asumsi yang mendasari keacakan
tidak lagi begitu sederhana. Semua teknik yang akan dibahas dalam beberapa bagian berikutnya adalah
didasarkan pada asumsi bahwa rangkaian respons individu memiliki hubungan internal yang stabil
antara tanggapan untuk item individu. Ini berdasarkan sifat unidimensional yang diasumsikan
skala, dan korelasi antar-item positif yang disiratkan oleh unidimensionalitas ini. Banyak dari ini
teknik berasal dari langkah-langkah konsistensi dari tingkat sampel, seperti keandalan, hanya
Perlu dicatat, bahkan pada titik melebih-lebihkannya, bahwa semua teknik ini adalah
dirancang untuk membuat statistik dalam-orang yang kemudian dapat dibandingkan pada tingkat sampel. Ini adalah
pola pikir yang relatif tidak umum, dan tempat yang mudah untuk tersesat dalam diskusi ini. Di deskripsi
konsistensi dalam diri orang. Meskipun ini secara konseptual merupakan jenis konsistensi internal, seharusnya tidak
MENDETEKSI KECERDASAN 21
bingung dengan teknik agregat yang lebih luas yang membahas tingkat skala atau antar-mata pelajaran
Salah satu teknik konsistensi individu yang paling sederhana dikenal sebagai konsistensi ganjil-genap
(Meade & Craig, 2012) atau keandalan individu (Huang et al., 2012, Huang et al., 2014, Jackson,
1977; Johnson, 2005). Penggunaan kedua istilah ini untuk menggambarkan teknik yang sama adalah indikasi dari
konsep yang berpotensi hilang dalam perbedaan antara keduanya. Perbedaan ini sulit untuk dijelaskan
tanpa menjelaskan teknik saat ini yang berbagi nama-nama ini, jadi deskripsi tersebut adalah
Dalam penggunaan saat ini, konsistensi ganjil-genap (nama yang akan disarankan untuk digunakan dengan ini
subskala unidimensional atau segi ukuran menjadi dua set item: satu set tanggapan terhadap
item genap, dan satu set tanggapan untuk item ganjil. Jika ada item dengan kata-kata terbalik, mereka
dikodekan ulang untuk mencerminkan arah item lain sebelum penilaian ini. Subskala yang dibelah dua ini
kemudian dirata-ratakan untuk memberikan perkiraan skor individu pada subset item tersebut.
Nilai-nilai ini dipasangkan berdasarkan skala; jumlah pasangan yang dihasilkan tergantung pada jumlah
kelompok unidimensional item yang dapat dibuat dalam skala yang lebih besar. Ini menghasilkan dua vektor
untuk perhitungan lebih lanjut, untuk setiap orang: [skala 1A, skala 2A, skala 3A…] dan [skala 1B, skala
2B, skala 3B…]. Kedua vektor ini kemudian dikorelasikan, menghasilkan korelasi untuk itu
individu yang bertindak sebagai skornya pada metrik ini. Koefisien korelasi ini dapat berupa
(Johnson, 2005). Koefisien ganjil-genap yang konsisten ini dapat dihitung pada satu skala dengan
aspek berkorelasi, atau di serangkaian skala yang sama menggunakan format respon yang sama (misalnya Likert).
MENDETEKSI KECERDASAN 22
Meskipun Jackson (1976; 1977) memang membuat saran tentang skor potensial ini
metrik yang akan digunakan untuk menghilangkan string respons, skor potong ini tampaknya cukup bergantung pada skala,
bekerja di beberapa penelitian tetapi semuanya tidak dapat digunakan di penelitian lain (Curran et al., 2010). skala ini
ketergantungan harus terkait dengan tingkat korelasi antar item, serta jumlah
subskala yang dapat dibuat. Bahkan jika subskala ada sebagai dua pasangan item (satu subskala item
tidak berguna di sini), korelasi yang dihasilkan memiliki N maksimum setengah dari jumlah item dalam
survei total. Dalam pengaturan yang ekstrem (tidak disarankan), skor item berfungsi sebagai
rata-rata skor skala, dan teknik ini secara efektif tidak lebih dari penerapan
sinonim semantik, yang akan dijelaskan nanti dalam makalah ini. Fakta bahwa ukuran sampel untuk
korelasi ini dibatasi bukan oleh ukuran sampel, melainkan jumlah subskala
dan/atau item dalam skala, merupakan batasan penting dari teknik ini.
Terlepas dari perubahan monumental dalam daya komputasi sejak awal berdirinya
korelasi ganjil-genap, sedikit yang berubah dalam perhitungannya. Pemilihan satu pasangan tunggal
item untuk membagi skala (item ganjil vs item genap) kemungkinan besar merupakan produk sederhana saat itu,
diterima sebagai praktik terbaik selama beberapa dekade yang dihasilkan. Ada banyak ruang untuk teknologi dan
peningkatan komputasi dalam konsep ini tanpa mengubah inti gagasan: item
mengukur konstruk laten yang sama harus berkorelasi positif dalam diri orang. Ide ini adalah apa
akan dipertimbangkan di sini sebagai konsep yang lebih luas dari keandalan individu, di antaranya ganjil-genap
Konsep menyeluruh dari keandalan individu mengambil keuntungan dari fakta bahwa item
dari skala yang sama harus mengukur konsep yang sama, dan skor skala yang dihasilkan oleh
item ini harus berkorelasi positif dalam individu. Konsistensi ganjil-genap, sekali lagi, adalah
MENDETEKSI KECERDASAN 23
hanya kasus spesifik dari konsep yang lebih umum ini yang hanya menggunakan satu pasangan item (konstan)
set.
Dalam kasus yang paling sederhana, mari kita mulai dengan skala unidimensional dari 18 item. Jika kita juga
bayangkan bahwa skala ini berisi tiga subskala berurutan, A, B, dan C, kita dapat menemukan
Skor untuk orang ini dalam hal konsistensi ganjil-genap adalah korelasinya
antara vektor (Aaneh, Baneh, Caneh) dan (Abahkan, Bbahkan, Cbahkan), dikoreksi dengan Spearman-
Rumus ramalan coklat, jika diinginkan. Perhatikan bahwa ini adalah batasan matematis dari ini
teknik bahwa varians harus ada pada tingkat skala setengah ini. Untungnya, seorang individu yang
tidak memberikan varians (dan dengan demikian tidak dapat dinilai pada teknik ini) akan mudah ditangkap oleh orang lain
Sekali lagi, ini tampaknya merupakan penyederhanaan yang cerdas dari era tersebut, yang tidak lagi
diperlukan. Perlu diingat, ini bukan korelasi sampel, tetapi korelasi yang dihitung untuk masing-masing
individu dalam sampel. Meskipun mungkin tampak cukup mudah untuk melakukan ini
korelasi untuk setiap individu dalam sampel hari ini, bayangkan melakukannya hampir 40 tahun yang lalu (seperti pada
Jackson, 1977). Pemilihan satu kasus spesifik yang stabil (konsistensi ganjil-genap) akan memiliki
menjadi usaha yang mengesankan dengan sendirinya, dan tidak mengherankan bahwa para peneliti dari
Yang mengatakan, peneliti modern dibanjiri dengan kekuatan komputasi, dan tidak lagi membutuhkan
dibatasi hingga 20 seperti ituth pemikiran abad. Ketika mempertimbangkan konsep yang lebih luas dari
MENDETEKSI KECERDASAN 24
keandalan individu, skor subskala yang dihasilkan dari setengah acak dari setiap subskala yang dipasangkan dengan
subskala dari separuh yang tersisa masih harus menilai konsistensi mendasar yang sama seperti apa adanya
dinilai dengan konsistensi ganjil-genap. Misalnya, item dalam contoh di atas dikaitkan
Tidak ada yang khusus secara inheren tentang pengelompokan ini, dan perhitungan yang sama
harus berlaku untuk bagian subskala yang ditarik secara acak yang dipasangkan dengan bagian yang tersisa, seperti pada
mengikuti:
Ide inti dari keandalan individu adalah gagasan bahwa tanggapan harus serupa pada
item mengukur konstruk yang sama, dan dua set pasangan ini masih menghormati gagasan ini. Bukan itu
secara sederhana ini pasang item, namun, melainkan mekanisme yang dihasilkan.
Dengan pengambilan sampel secara acak, tanpa pengembalian, distribusi bilangan bulat antara 1 dan
jumlah item di setiap subskala, peneliti dapat membuat sejumlah besar pasangan ini.
Tidak ada pasangan acak dari item ini yang lebih baik dari yang sudah ada
praktek: penggunaan standar set ganjil dan genap berpasangan dalam setiap subskala. Manfaat dari
kekuatan komputasi modern adalah bahwa kita tidak perlu menggunakan hanya salah satu dari yang dihasilkan secara acak
pasangan. Kami malah dapat menggunakan sebanyak yang kami inginkan, lalu rata-rata hasilnya. Ini hanyalah
MENDETEKSI KECERDASAN 25
metodologi dimaksudkan untuk menilai konsep yang lebih dalam dari keandalan individu.
Metode baru ini Contoh Keandalan Individu (RIR), diusulkan di sini, menyediakan
gambaran yang lebih kuat tentang konsistensi dan keandalan respons individu terhadap item
mengukur setiap konstruksi unidimensional yang diberikan. Penggunaan satu set pasangan item ini dapat
dipengaruhi oleh pasangan ganjil acak; teknik resampling ini seharusnya memungkinkan kesalahan acak ini
Barang-barang acak ini tidak terlalu penting seperti halnya sistem yang digunakannya
dihasilkan. Melalui ini, RIR disajikan sebagai implementasi yang lebih ketat dari aslinya
semangat keandalan individu daripada yang dapat diperoleh dengan implementasi kasus spesifik yang sederhana
konsistensi ganjil-genap. Sementara nilai dari RIR harus berkorelasi tinggi dengan nilai yang dihitung
dari konsistensi ganjil-genap, memvalidasi RIR sebagai sarana deteksi C/IE berada di luar cakupan
makalah ini. Tolok ukur skor potongan awal harus identik dengan yang digunakan dalam ganjil-genap
konsistensi, tetapi diinformasikan oleh pengalaman dan praktik di masa depan. Peneliti tertarik untuk menggunakan ini
metode dapat mengeksplorasi pertanyaan ini, dan untuk saat ini, gunakan teknik baru ini dengan hati-hati.
Keluarga teknik berikutnya melibatkan empat teknik yang merupakan hasil dari persilangan dua
ide-ide dikotomis. Bagian pertama dari ini adalah perbedaan sederhana antara antonim dan
sinonim. Antonim menggunakan pasangan item yang berlawanan, sedangkan sinonim menggunakan pasangan yang serupa
item. Perbedaan kedua adalah antara pasangan semantik dan pasangan psikometrik. Pasangan semantik
adalah mereka yang dipasangkan dari pendekatan linguistik murni (misalnya, senang/sedih), sedangkan
pasangan psikometrik adalah pasangan yang dipasangkan dari pendekatan berbasis data yang akan dijelaskan di bawah ini.
MENDETEKSI KECERDASAN 26
Persilangan konsep-konsep ini menghasilkan empat metrik C/IE yang berbeda: (1) antonim psikometrik,
(2) sinonim psikometrik, (3) antonim semantik, dan (4) sinonim semantik.
antonim semantik, yaitu pasangan item yang berlawanan secara semantik (Goldberg & Kilkowski,
1985). Pasangan ini bertekad untuk menjadi berlawanan hanya pada konten mereka, dan pasangan seperti itu bisa
(dan harus) dibuat tanpa adanya data. Antonim semantik, dan semantik terkait
sinonim, adalah pasangan apriori. Ekstensi alami dari pasangan apriori ke data-driven
pasangan mengarah pada pemeriksaan antonim psikometrik, pasangan item berlawanan yang ditemukan
dengan mencari korelasi negatif yang besar antara item individual dalam sampel penuh atau dalam a
kumpulan data sekunder (Johnson, 2005). Tidak ada nilai konkrit besaran korelasi yaitu
dianggap cukup besar, meninggalkan pasangan item ini hingga korelasi terbesar yang ditemukan di
data. Menurut pendapat penulis ini, korelasi ini harus memiliki besaran setidaknya
. 60, tetapi tidak ada dasar yang kuat untuk aturan praktis ini.
Mengingat makna linguistik yang berlawanan ini antara item dalam pasangan, dan/atau negatif
korelasi dalam sampel non-C/IE, dapat diasumsikan bahwa responden yang lebih berhati-hati harus menjawab
berlawanan dengan pasangan antonim ini, sedangkan lebih banyak responden C/IE seharusnya tidak. Itu adalah
korelasi dalam-orang antara semua item pertama dalam pasangan antonim ini terhadap semua
item kedua dalam pasangan antonim ini harus negatif. Sebaliknya, korelasi ini seharusnya
positif untuk sinonim. Perhitungan ini pertama-tama akan dijelaskan untuk antonim psikometrik dan
kemudian digeneralisasikan ke kasus-kasus yang tersisa (sinonim psikometrik, antonim semantik dan
sinonim).
data untuk setiap responden. Pasangan di seluruh kumpulan data ini adalah masing-masing pasangan secara psikometri
MENDETEKSI KECERDASAN 27
item yang berlawanan, dan koefisien korelasi dihasilkan untuk setiap individu. Sebagai contoh,
pertimbangkan kasus di mana tiga pasang antonim psikometrik diidentifikasi dalam urutan sepuluh
item: (x1, x2), (y1, kamu2), dan (z1, z2). barang x1 mungkin ungkapan 'Saya bahagia sekarang,'
sedangkan barang x2 mungkin sebaliknya, seperti 'Saya sedih sekarang.' Pasangan item ini mungkin
[Item 1, Butir 2, y1, Butir 4, y2, x1, z1, z2, Butir 9, x2]
Pada skala Likert lima poin, ini mungkin menghasilkan pola respons seperti:
[4, 5, 4, 3, 2, 3, 5, 1, 3, 2]
Di permukaan, rangkaian tanggapan ini tidak banyak memberi tahu kita. Tapi, karena kita tahu
sesuatu tentang korelasi negatif antara tanggapan pada pasangan item ini, kita dapat menggunakan
informasi ini untuk menghitung antonim psikometrik. Korelasi yang dihasilkan kemudian dilakukan
[3, 4, 5]
[2, 2, 1]
Koefisien antonim psikometrik untuk individu yang memberikan tanggapan terhadap ini
pasangan item berkorelasi negatif adalah nilai korelasi antara vektor-vektor tersebut. Di dalam
kasus, nilai ini adalah -.866. Nilai untuk semua koefisien ini dibatasi oleh nilai yang sama
sebagai korelasi, dan, seperti korelasi, nilai -0,866 cukup tinggi. Ini menunjukkan sebuah
individu yang merespon secara berlawanan terhadap item-item yang berkorelasi negatif ini.
MENDETEKSI KECERDASAN 28
Perhatikan bahwa n untuk korelasi ini sama dengan jumlah pasangan item yang
digunakan dalam proses ini. Maksimaln untuk setiap set item yang diberikan adalah setengah dari jumlah item,
dengan asumsi semua item digunakan untuk membuat pasangan, tanpa penggantian, dalam proses ini. Yang mengatakan, itu
tidak disarankan untuk menggunakan semua item, atau untuk item yang digunakan lebih dari sekali. Individu yang
memiliki korelasi negatif yang lebih kuat dianggap merespons lebih hati-hati daripada mereka yang
gunakan teknik yang sama, tetapi cari korelasi positif antara orang yang tinggi antar item
untuk menghasilkan pasangan. Metode semantik cukup mulai dengan pasangan item yang sudah mapan dan lewati ini
langkah pencarian korelasi antar-orang. Sebaliknya, metode ini bergerak langsung ke menghitung
Antonim psikometrik tampaknya yang paling populer dari teknik ini, meskipun beberapa
penelitian telah mulai juga menguji konsep sinonim psikometrik (Meade & Craig, 2012).
Menariknya, nilai tingkat sampel untuk kedua teknik ini (antonim psikometrik dan
sinonim) tampaknya hanya berkorelasi (antar individu) di R = .44 (n = 385) dalam satu studi
Selain itu, dan mirip dengan konsistensi ganjil-genap, teknik ini tampaknya menghasilkan
distribusi tergantung skala agak, dengan rata-rata koefisien ini didorong oleh
besarnya korelasi ini dalam data asli (Curran et al., 2010). Jika pasangan item
digunakan memiliki korelasi yang sangat tinggi, maka skor keseluruhan pada metrik ini harus lebih tinggi daripada jika
pasangan memiliki korelasi yang lebih rendah. Pemeriksaan hubungan ini berada di luar cakupan ini
kertas, tetapi tidak menghentikan teknik ini untuk digunakan dengan cara yang hati-hati dan bijaksana.
MENDETEKSI KECERDASAN 29
Mirip dengan waktu respons, ada skor yang hampir pasti menunjukkan C/IE
menanggapi. Misalnya, korelasi negatif dalam diri orang pada sinonim psikometrik atau
korelasi positif dalam-orang pada antonim psikometrik dapat berfungsi serupa dengan keduanya
detik per item waktu respon cutoff dikemukakan oleh Huang et al. (2012). Ini terlalu
sikap konservatif memastikan bahwa responden terburuk dihilangkan, dan juga memberikan ruang untuk
peneliti bijaksana untuk menaikkan (atau bahkan lebih rendah) skor potong ini ketika diinformasikan oleh praktek.
Di ujung yang jauh berlawanan dari analisis dawai panjang terletak metode yang relatif baru dari inter-
standar deviasi barang. Teknik ini, diusulkan dan diuji oleh Marjanovic, Holden, Struthers,
Cribbie, dan Greenglass (2015), mengukur seberapa banyak individu menyimpang dari miliknya sendiri
titik tengah pribadi di seluruh set item skala. Langkah ini dicapai melalui
B 3
@C1 A@ A:
?09@ =
D1
Pada kasus ini, A@ mewakili respons terhadap item apa pun, dan A: mewakili
skor rata-rata responden di semua item. k hanyalah jumlah item dalam skala. sebagai
namanya menyiratkan, ini tidak lebih dari standar deviasi dalam-individu, mirip dengan bagaimana
konsistensi ganjil-genap atau antonim psikometrik tidak lebih dari di dalam individu
korelasi.
Penggunaan metrik yang disarankan ini dapat dijelaskan dengan contoh sederhana. Pertimbangkan
Orang 1: 3, 3, 3, 3, 3, 3, 3, 3, 3, 3
Orang 2: 1, 2, 3, 4, 5, 1, 2, 3, 4, 5
MENDETEKSI KECERDASAN 30
Orang 3: 1, 1, 1, 1, 1, 5, 5, 5, 5, 5
Respon rata-rata untuk masing-masing individu ini adalah 3, meskipun ISD mereka akan sangat bervariasi.
Bahkan, untuk skala sepuluh item (k = 10) dengan 5 pilihan jawaban, orang 1 dan orang 3 mewakili
batas bawah dan atas metrik ini, masing-masing. Tidak ada perbedaan antara orang 1
tanggapan dan rata-rata orang 1, dan ISD mereka akan menjadi nol. Ada jarak maksimal (untuk
skenario ini) antara tanggapan orang 3 dan rata-rata orang 3, dan ISD mereka akan besar (untuk
mereka yang tertarik, itu adalah 2.11). Orang 2 akan berada di antara dua ekstrem ini (sekali lagi,
Hal ini dikemukakan oleh Marjanovic, dkk. (2015) bahwa nilai yang lebih tinggi pada ISD lebih indikatif
dari respon acak. Penting di sini untuk terus membedakan konsep spesifik yang lebih tua ini
respons acak dari konsep respons C/IE yang lebih modern dan umum.
Marjanovic dkk. (2015) menguji keefektifan ISD dalam mendeteksi respons acak murni
(tanggapan yang diambil dari distribusi acak yang seragam, secara independen pada setiap item), sesuatu
bahwa itu cukup mudah dilakukan dengan hampir semua metrik ini. Namun, skor pada teknik ini tidak
tampaknya tidak terkait secara linier dengan keacakan, per contoh di atas.
Perhatikan kembali ketiga kasus di atas. Orang 1 akan menerima skor terbaik pada
ISD, dan diklasifikasikan oleh Marjanovic et al. (2015) sebagai teliti, sebagai lawan dari acak. Ini
adalah penilaian yang adil selama dikotomi antara hati-hati dan acak, tapi hampir tidak
berguna jika dikotomi antara hati nurani dan C/IE. Jika ada individu dalam sampel
bunga diklasifikasikan sebagai acak, maka orang 3 juga akan (mereka memiliki nilai maksimum).
Meskipun dapat dikatakan bahwa orang 3 harus dihapus, data mereka hampir tidak lebih acak daripada
orang 1. Orang 2, yang mewakili kasus ideal dari data yang jauh lebih acak, sebenarnya jatuh
Teknik ini (ISD) harus digunakan dengan hati-hati. Meskipun itu menunjukkan beberapa janji potensial sebagai
metode baru deteksi C/IE, dirancang dan diuji secara khusus hanya untuk acak
kasus responden, dan memiliki kelemahan mendasar bahkan dalam situasi itu. Penggunaan aktual dalam praktik membutuhkan
pemahaman yang jauh lebih dalam tentang distribusi skor dan rekonseptualisasi yang mendasarinya
dikotomi hasil. Sebenarnya mungkin ada penggunaan untuk teknik ini di masa depan
Deteksi C/IE, tetapi pekerjaan yang diperlukan untuk menunjukkan ini berada di luar cakupan makalah ini.
Kesalahan Guttman (Guttman, 1944; Guttman, 1950) adalah konsep yang awalnya dirancang untuk
aplikasi pada item tes dikotomis. Premis penskalaan Guttman yang sempurna adalah ketika
item dipesan berdasarkan kesulitan, individu harus mendapatkan item mudah dengan benar sampai titik tertentu, lalu dapatkan
semua item yang tersisa, dan yang lebih sulit, salah. Istirahat dalam urutan yang diharapkan ini disebut
kesalahan Guttman.
perbandingan berpasangan yang berdekatan antara item dipesan pada kesulitan. Pasangan ini tercipta
dari 1) respon setiap item dan 2) respon pada item yang langsung lebih sulit.
Setiap kali item yang lebih sulit dalam pasangan ini benar dan item yang lebih mudah dalam pasangan ini salah
kesalahan Guttman terdaftar. Hal ini dapat dinyatakan (seperti dalam Karabatsos, 2003, hal 294-295) sebagai:
F= AGH 1 AGI
HAI
Dalam situasi ini, xtidak mewakili skor peserta tes (benar = 1, salah = 0) pada
lebih sulit dari dua item, sementara xtidak mewakili skor peserta tes pada dua item yang lebih mudah.
Jika kedua nilai sama (0,0 atau 1,1), persamaan ini menjadi 0. Jika item yang lebih mudah benar dan
item yang lebih sulit salah, persamaan ini juga menjadi 0. Hanya jika semakin sulit
item benar dan item yang lebih mudah salah sehingga menghasilkan nilai 1, menandakan
MENDETEKSI KECERDASAN 32
kesalahan Guttman. Jumlah dari semua pasangan item ini memberikan jumlah total kesalahan Guttman untuk
seorang individu.
Meskipun metrik ini awalnya dirancang untuk item tes dikotomis, metrik ini bisa menjadi
diperluas menjadi item polytomous (misalnya, item tipe Likert) juga (Emons, 2008). Namun,
Emons (2008) perhitungan nilai ini saat ini membutuhkan pemahaman tentang penskalaan Mokken dan
Teori Respon Item Politomus Nonparametrik (Emons, 2008, Sijtsma & Molenaar, 2002).
Karena cakupan kecil dari banyak studi yang menggunakan metrik C/IE ini, implementasi
Emons (2008) metode untuk menghasilkan metrik seperti itu dalam praktik umum tidak mungkin, paling banter. Sebagai gantinya,
diusulkan bahwa metrik yang lebih sederhana dapat digunakan untuk mengukur Kesalahan Polytomous Guttman:
kesulitan item sebagaimana dioperasionalkan dengan sampel (atau populasi) sarana item.
Dengan cara ini, item dengan rata-rata '4' yang diketahui atau dihitung pada skala lima poin (dari
'sangat tidak setuju' hingga 'sangat setuju) dianggap lebih mudah daripada item yang diketahui atau
dihitung rata-rata '3' pada skala lima poin yang sama. Peringkat kesulitan relatif ini hanyalah
produk fakta bahwa item dengan rata-rata '3' lebih kecil kemungkinannya memiliki skor individu yang lebih tinggi pada
barang. Ini sangat sesuai dengan semangat kesalahan Guttman pada item dikotomis, tapi itu
Oleh karena itu, peserta yang aktif membaca dan memikirkan masing-masing
item akan lebih cenderung mengikuti pola umum item 'kesulitan' saat mereka bergerak
skala. Ini masih merupakan metrik konsistensi internal orang, tetapi hanya memanfaatkan
sampel tambahan (atau dalam kasus ideal, populasi) informasi agregat tingkat tentang item yang
diabaikan oleh banyak teknik lainnya. Proses dimana skor ini dihitung adalah
perpanjangan sederhana dari karya asli Guttman, dengan penambahan lebih dari dua level untuk item
MENDETEKSI KECERDASAN 33
skor dan pergeseran yang dihasilkan dari skor item dikotomis ke nilai dikotomis yang diperoleh
Perhatikan bahwa beberapa kesalahan Guttman diharapkan! Seperti teknik lainnya, metode ini
lebih tentang membangun distribusi di seluruh individu di mana keputusan dapat dibuat.
Kesalahan Guttman hanya terdaftar ketika skor individu lebih rendah pada item di setiap pasangan yang
memiliki rata-rata yang lebih tinggi, dan tidak terdaftar ketika skor pada item-item ini identik atau benar
pesanan hadir.
Ada batasan jumlah maksimum kesalahan Guttman yang dapat dilakukan pada semua
skala yang diberikan. Karena sifat perbandingan berpasangan, maksimum absolut adalah satu kurang
daripada jumlah item. Namun, ini mengasumsikan bahwa jumlah opsi respons adalah sama
atau lebih besar dari jumlah item. Jika jumlah pilihan jawaban kurang dari jumlah
item, maka kesalahan maksimal membutuhkan ruang untuk mengulang kembali ke ujung skala yang lain (yang kemudian
itu sendiri bukan kesalahan Guttman). Jikak adalah jumlah item dan x adalah jumlah pilihan jawaban,
maka Kesalahan Guttman Polytomous maksimum ditemukan dengan mengurangkan hasil bagi bilangan bulat dari k/x
Sebagai metrik baru untuk deteksi C/IE ini, sama seperti RIR, cobalah memahami praktiknya
penggunaan diperlukan, tetapi beberapa tolok ukur konservatif masih dapat disarankan. Ini adalah saran dari
makalah ini bahwa individu yang memiliki jumlah Kesalahan Guttman Polytomous sama atau lebih besar dari
setengah dari kemungkinan Kesalahan Polytomous Guttman ini dianggap sebagai penanggap C/IE oleh ini
teknik. Sekali lagi, ini jelas bukan skor potong terbaik untuk semua skala, tetapi juga di
setidaknya memberikan titik bagi peneliti untuk memulai pertimbangan yang lebih dalam.
MENDETEKSI KECERDASAN 34
yang dapat dipelajari dari penelitian lama tentang deteksi pola respons yang menyimpang
dalam menguji data. Salah satu teknik tersebut dari literatur pengujian adalah "biserial pribadi"
korelasi (Donlon & Fischer, 1968). Konsep ini sendiri merupakan perpanjangan dari ide item-total
korelasi, dan karena itu diskusi singkat tentang korelasi item-total diperlukan.
Korelasi item-total pada beberapa item dalam skala dihitung sebagai antar-orang
korelasi skor pada item tersebut dengan skor skala pada keseluruhan set item. Sebuah dikoreksi atau
korelasi item-total yang disesuaikan menghilangkan nilai item yang bersangkutan dari perhitungan
skor skala. Formulir yang dikoreksi ini lebih disukai, meskipun untuk kesederhanaan dalam makalah ini semua referensi
asumsi bahwa bentuk yang tidak dikoreksi tidak pernah digunakan dan penggunaan umum 'item-total'
Sama seperti ini memeriksa item di antara satu set item, hal yang sama dapat dibangun untuk
individu dalam sampel orang yang lebih besar. Secara konseptual, inikorelasi orang-total adalah
ukuran seberapa konsisten setiap orang bertindak seperti orang lain. Ini kemudian menjadi ukuran
tentang seberapa konsisten setiap orang, relatif terhadap pola yang diharapkan yang dihasilkan oleh semua orang lain
Inti dari ide korelasi orang-total ini, seperti yang dinyatakan di atas, adalah perpanjangan dari pekerjaan
pada tes yang dilakukan oleh Donlon dan Fischer (1968). Donlon dan Fischer menjelaskan proses yang tepat ini di
data uji dikotomis, dan menyarankan bahwa itu dapat digunakan untuk memberikan informasi tambahan tentang
peserta ujian dan tanggapannya. Pekerjaan selanjutnya dalam literatur pengujian, terutama pekerjaan yang berhubungan dengan
MENDETEKSI KECERDASAN 35
deteksi respons menyimpang pada tes, telah menunjukkan teknik Donlon dan Fischer (1968) untuk
Korelasi orang-total, seperti yang diusulkan untuk digunakan dalam deteksi respons C/IE, adalah sederhana
penerapan ide ini untuk data polytomous. Tidak seperti kesalahan Guttman, yang memerlukan revisi
perhitungan, teknik ini bekerja secara identik dalam kedua situasi (dikotomis dan politomus).
Meskipun perhitungannya mungkin sama, istilah baru ini dimaksudkan untuk membedakan penggunaannya dalam hal ini
Dalam praktiknya, perhitungan korelasi person-total pertama-tama melibatkan transpos sederhana dari
orang demi orang menjadi matriks butir demi orang. Korelasi item-total (sebagai bagian dari
analisis keandalan dalam perangkat lunak statistik tipikal) yang dilakukan pada matriks yang dialihkan ini (di mana:
item adalah baris dan orang adalah kolom) sekarang akan menghasilkan korelasi person-total. Ini
nilai kemudian dapat dengan mudah disimpan, dialihkan, dan ditambahkan ke data asli untuk masing-masing
individu. Sekali lagi, ini identik dengan prosedur yang diuraikan dalam Donlon dan Fischer (1968).
Jelas, ini bergantung pada satu asumsi besar: mayoritas responden di tempat tertentu
sampel menanggapi serius. Mengingat bahwa beberapa perkiraan tertinggi dari perilaku ini
sekitar 30%, ini tampaknya asumsi yang aman. Namun, kondisi yang mungkin merusak ini
asumsi dapat membatalkan metrik ini. Faktanya, jika mayoritas responden dalam sampel adalah
C/IE responders, metode ini berpotensi merekomendasikan untuk menghapus responder yang bijaksana!
responden dalam sampel, bahkan jika mereka tidak merupakan mayoritas. Dalam kedua kasus, teknik ini
harus digunakan dengan hati-hati dalam situasi di mana sebagian besar sampel diduga
Responden C/IE.
MENDETEKSI KECERDASAN 36
Mengingat pemahaman yang agak ada di mana-mana tentang korelasi item-total, person-total
korelasi berpotensi menjadi salah satu metrik C/IE termudah untuk dipahami, dihitung, dan dinormalkan
di seluruh sampel dan formulir. Misalnya, korelasi item-total negatif selalu bergejala
masalah, seperti yang akan terjadi pada korelasi orang-total negatif. Seorang individu dengan
korelasi orang-total negatif bertindak berlawanan dengan pola yang diharapkan yang ditetapkan oleh orang lain
individu.
Seperti RIR dan perhitungan makalah ini tentang Kesalahan Polytomous Guttman, ini adalah metrik baru
dalam kerangka deteksi C/IE, dan pekerjaan di masa depan harus memeriksa karakteristiknya dalam
penggunaan praktis di luar penggunaan yang ditetapkan pada data uji, terutama dibandingkan dengan yang lain
metode. Namun, beberapa tolok ukur konservatif dapat diterapkan dari apa yang sudah terkenal
tentang korelasi item-total. Ini adalah rekomendasi dari makalah ini bahwa individu dengan
korelasi orang-total negatif dianggap sebagai responden C/IE dengan teknik ini. Sementara ini
tidak akan menghilangkan semua penanggap C/IE, ini lagi-lagi berfungsi sebagai titik awal untuk individu
peneliti untuk melakukan diskusi yang bijaksana tentang penggunaan skor potong yang berbeda seperti yang diinformasikan oleh
Teknik yang dibahas sampai saat ini mengandalkan statistik post-hoc dalam-orang
dihitung dari sampel bunga. Teknik-teknik ini dapat diterapkan pada data dari yang sudah
pengumpulan data survei yang lengkap, selama jenis item yang tepat ada di kanan
kuantitas. Sederhananya, tidak banyak yang bisa dihitung dalam hal konsistensi pada a
Sebaliknya, keluarga teknik yang berbeda menggunakan penyertaan item tertentu dalam skala
untuk memeriksa perhatian responden. Dengan menambahkan item ini sebelum pengumpulan data, tanggapan atas ini
MENDETEKSI KECERDASAN 37
item tertentu dapat diamati dan digunakan untuk membuat keputusan kualitas data. Konten ini
item bervariasi, tetapi tema yang mendasarinya adalah bahwa ada satu respons atau rentang yang 'benar'
tanggapan, dan satu tanggapan 'salah' atau berbagai tanggapan. Mirip dengan waktu respons, ini
Salah satu teknik yang umum dan cukup transparan menginstruksikan responden untuk menjawab dengan
opsi respons tertentu, seperti "Silakan pilih Cukup Tidak Akurat untuk item ini" (Huang et
al., 2012). Individu yang merespons dengan respons yang diminta dianggap benar, dan
individu yang merespon dengan yang lain dianggap tidak benar. Asumsi sederhana di sini adalah
bahwa setiap individu yang telah membaca item tersebut harus merespon dengan benar. Meskipun barang-barang ini adalah
relatif transparan, tidak jelas bagaimana peserta melihatnya atau apa yang sebenarnya mendorong tanggapan
pada barang-barang ini. Curran dan Hauser (2015) telah menemukan, melalui analisis protokol verbal, bahwa
ada sebagian responden yang tidak menjawab pertanyaan ini dengan benar, bahkan setelah
membacanya dengan suara keras. Meskipun proporsi individu ini kecil (<10%), hal ini menunjukkan bahwa
hubungan antara sekadar membaca item-item ini dan merespons dengan benar mungkin tidak sempurna,
Item yang meminta jawaban yang benar dan jelas mewakili transparansi yang hampir penuh untuk
pengambil survei. Namun, ada aliran pemikiran lain: barang-barang ini harus kurang transparan
untuk bekerja tanpa menonjol dari item lain (Huang et al., 2014; Meade & Craig,
2012). Dalam kerangka ini, item dibangun agar tampak valid pada inspeksi visual cepat,
tapi jelas atau tidak masuk akal pada pemeriksaan lebih dalam. Item-item ini meliputi: “Saya tertarik untuk mengejar
gelar dalam parabanjology" (Huang et al., 2014) dan "Saya dibayar dua mingguan oleh leprechauns" (Meade
& Craig, 2012). Dikenal sebagai item palsu atau jarang, asumsinya adalah bahwa ada berbagai
tanggapan yang benar dan salah untuk item-item ini. Penggunaan saat ini membuat pemotongan pada ekstrem
MENDETEKSI KECERDASAN 38
akhir skala yang benar, sehingga jawaban yang benar untuk "Saya dibayar dua mingguan oleh leprechauns"
mungkin 'sangat tidak setuju' dan 'tidak setuju'. Jawaban yang salah dapat mencakup 'sedikit tidak setuju',
'tidak setuju atau tidak setuju', dan semua opsi 'setuju' dicerminkan secara identik. Hal-hal yang ditulis dalam
arah yang berlawanan (di mana 'setuju' akan menunjukkan perhatian) cukup gunakan opsi itu
Untuk sebagian besar, barang-barang ini tampaknya berfungsi sebaik barang-barang mapan lainnya
metode dalam makalah ini (Huang et al., 2014; Meade & Craig, 2012). Dengan menggunakan sejumlah item
seluruh skala, dan menghitung skor total yang benar untuk setiap peserta, keanehan kecil dan
kesalahan dalam menanggapi umumnya dirata-ratakan. Sementara makalah ini umumnya akan merekomendasikan penggunaan
item ini untuk deteksi C/IE, ia akan melakukannya dengan sejumlah peringatan dan saran kecil
Seperti disebutkan, beberapa pekerjaan awal telah mulai memeriksa alasan yang sah mengapa
individu memilih apa yang akan dianggap sebagai tanggapan yang tidak valid (Curran & Hauser, 2015).
Meskipun pendekatan item palsu / jarang dapat bekerja paling baik pada item yang ekstrem seperti "Saya dibayar"
dua mingguan oleh leprechauns,” seorang peserta yang bijaksana mungkin sebenarnya setuju dengan item “All my
teman-teman mengatakan saya akan membuat pudel yang bagus,” (keduanya dari Meade & Craig, 2012) memberikan
pembenaran bahwa teman-teman mereka menganggap mereka memiliki sifat seperti anjing seperti kesetiaan (Curran &
Hauser, 2015). Dalam kasus terbaik, identifikasi responden yang valid ditandai sebagai C/IE
hanya menyoroti beberapa kesalahan Tipe I yang sudah dianggap ada di semua teknik. Di dalam
sebenarnya, harus tersirat dalam penggunaan teknik ini bahwa ada potensi kebaikan untuk menjadi
dibuang dengan yang buruk. Dalam kasus terburuk, hasil seperti ini (Curran & Hauser, 2015) berarti
bahwa beberapa segmen responden tertentu dihapus karena alasan yang tidak valid. Peneliti
menggunakan item ini harus memastikan bahwa mereka digunakan secara konsisten dengan cara di mana mereka
MENDETEKSI KECERDASAN 39
telah divalidasi. Memetik ceri satu atau dua item dari timbangan ini untuk digunakan sebagai yang dipersingkat
metode membuka peneliti hingga risiko tinggi dari jenis kesalahan ini, karena ada lebih sedikit
Mungkin sebenarnya item yang bekerja paling baik dalam situasi ini adalah item yang
adalah yang paling ekstrim (misalnya "Saya tidak pernah menggunakan komputer"; Huang et al., 2014), dan pada intinya,
yang paling mirip dengan item sederhana yang menginstruksikan respons spesifik yang dijelaskan di atas (mis
pilih Cukup Tidak Akurat untuk item ini"). Item-item dengan interpretasi yang lebih longgar, yang
mungkin tampak wajah yang paling valid dalam skala kepribadian normal (misalnya “Saya bisa makan sebanyak
kuda"; Curran & Hauser, 2015), mungkin saja lebih terbuka terhadap interpretasi yang berada di luar
apa yang peneliti maksudkan. Jika barang-barang ini digunakan tanpa pertanyaan, atau diproduksi ac-hoc oleh
peneliti tanpa pertimbangan yang tepat, kesalahan ini mungkin tidak dinilai. Pekerjaan masa depan di bidang ini
harus diarahkan untuk menemukan properti dari barang-barang ini yang paling cocok untuk keseimbangan ini antara
validitas wajah dalam skala dan validitas konstruk dalam hal deteksi C/IE.
Metode lain, yang dikenal sebagai pemeriksaan manipulasi instruksional atau IMCs (Oppenheimer,
Meyvis, & Davidenko, 2009), menambahkan frasa kunci ke rangkaian instruksi yang lebih panjang, biasanya pada beberapa
item panjang dengan satu respon. Frasa ini dapat bervariasi panjangnya, tetapi secara fungsional harus terlihat adil
seperti sisa teks instruksional untuk suatu item. Frasa ini umumnya menginstruksikan responden untuk
abaikan sisa pertanyaan yang ada dan tanggapi dengan cara lain. Dari pada
merespons secara normal, maka, responden yang penuh perhatian harus merespons dengan cara yang tidak mungkin diuraikan
dalam kalimat ini. Frasa ini mungkin menginstruksikan responden untuk mengabaikan tanggapan item dan
opsi 'lanjutkan', menginstruksikan mereka untuk mengklik teks judul atau bagian halaman yang tidak biasa
(Oppenheimer et al., 2009). Responden mungkin juga diinstruksikan untuk memilih dua atau lebih yang berbeda
atau pilihan yang tidak mungkin dari daftar tanggapan 'pilih semua yang sesuai', atau untuk memilih opsi 'lainnya'
MENDETEKSI KECERDASAN 40
dan kemudian masukkan ke dalam pilihan itu serangkaian teks yang ditentukan oleh eksperimen (Hauser & Schwarz, dalam
tekan). Contoh bagaimana hal ini dapat disajikan kepada peserta dapat ditemukan pada gambar 3.
Di permukaan, teknik ini bisa sangat berharga jika manipulasi penelitian disembunyikan
dalam teks serupa di tempat lain dalam penelitian itu (misalnya bahasa pembingkaian tujuan). Jika peserta gagal
untuk membaca keseluruhan instruksi dari item semacam itu, kemungkinan mereka juga gagal membaca
teks instruksional yang berisi manipulasi pembelajaran. Dengan cara ini, teknik ini, seperti namanya
akan menunjukkan, cek manipulasi. Pada survei tanpa instruksi seperti itu, bagaimanapun, ini
Bahkan, bahkan digunakan dalam penelitian dengan item serupa, beberapa pekerjaan sudah mulai menemukan sampel
efek dalam hal apa yang tampaknya menjadi keterampilan yang dipelajari pada item ini. Secara khusus, Hauser dan
Schwarz (dalam pers) telah menemukan bahwa peserta dari Amazon's Mechanical Turk (MTurk)
tampaknya ditangkap oleh IMC ini pada tingkat yang jauh lebih rendah daripada peserta dari lainnya
sampel, meskipun tingkat kelulusan yang lebih rendah dari individu-individu ini hanya beberapa tahun yang lalu (Oppenheimer et al.,
2009). Ada sejumlah studi dan penjelasan yang saling bertentangan tentang topik ini, tetapi salah satunya
hasil umum tampaknya bahwa peserta penelitian yang sering (misalnya, MTurkers) memiliki, lebih dari
waktu, berpotensi mempelajari struktur barang-barang ini yang dimaksudkan untuk menangkap ketidakpedulian mereka, dan
disesuaikan. Inti dari masalah ini tampaknya adalah bahwa ada dasar
pengetahuan tentang hal-hal tersebut yang dapat dipelajari. Setidaknya sebagian dari pengetahuan ini adalah yang sederhana
fakta bahwa barang-barang ini ada di tempat pertama. Peneliti harus ingat bahwa MTurk
peserta pada umumnya berpartisipasi untuk menghasilkan uang, dan menjadi lebih berpengetahuan
peserta dapat memiliki dampak langsung pada jumlah uang yang dihasilkan. Seluruh situs web (mis
www.turkernation.com) ada untuk membantu para peserta ini mengumpulkan dan berbagi pengetahuan tentang
Penghapusan individu yang telah gagal dalam IMC ini tampaknya tidak ada hasilnya
efek substantif pada hasil studi, bahkan dalam sampel multi-situs besar (Klein, Vianello, &
Ratliff, 2015). Topik ini, seperti banyak topik lain dalam makalah ini, membutuhkan studi lebih lanjut, tetapi tampaknya
pengetahuan responden tentang teknik ini, khususnya pada sampel MTurk, mungkin sudah
Di semua teknik pemeriksaan perhatian umum ini, peneliti harus berpikir dengan hati-hati
tentang bagaimana item atau instruksi yang disisipkan akan bekerja dalam penelitian yang sedang dilakukan. Ada banyak kasus
di mana item tersebut mungkin dianggap sebagai penghinaan terhadap sampel yang sudah sangat termotivasi (misalnya, a
survei kepuasan klien). Paling tidak, barang-barang seperti itu dan waktu yang mereka butuhkan mungkin saja
tidak perlu. Selain itu, paradoks yang tidak menguntungkan muncul dalam rekomendasi praktis
mengenai barang-barang tersebut. Di satu sisi, peneliti seharusnya tidak hanya membuat jenis item ini untuk
sekali pakai tanpa validasi apa pun, tetapi harus melihat yang sudah ada
divalidasi secara psikometri atau menggunakan studi percontohan untuk memastikan item baru berfungsi seperti yang diinginkan. Pada
pada saat yang sama, penggunaan kembali item dan cek yang sama cenderung menyebabkan aklimatisasi responden untuk
barang-barang stok itu dari waktu ke waktu. Barang-barang ini mungkin paling baik dikonsep melalui lensa barang
keamanan dan eksposur item yang digunakan dalam pengujian (Davey & Nering, 2002). Misalnya, setiap responden
yang memiliki pengetahuan tentang Huang et al. (2014) atau Meade dan Craig (2012) secara efektif tahu apa yang harus
mencari dan bagaimana menanggapi item dalam skala tersebut. Ini mungkin bagian kecil dari apapun
sampel, tetapi tren keterpaparan terhadap barang-barang tersebut dianggap meningkat secara monoton.
Karena sifat transparan dari teknik ini, menghasilkan skor potong pada mereka adalah
jauh lebih sering dibiarkan (atau dibiarkan beristirahat dengan) penilaian peneliti. Tentang
cek perhatian dan item palsu/infrekuensi, makalah ini akan kembali keliru pada konservatif
saran ketidakakuratan 50% sebagai sinyal bahwa peserta harus dianggap sebagai C/IE
MENDETEKSI KECERDASAN 42
responden dengan teknik ini, dengan asumsi bahwa sejumlah item yang masuk akal sedang
digunakan. IMC lebih berbeda, keduanya karena kurang rentan terhadap kesalahan tipe II (lebih
sulit untuk memperbaikinya secara tidak sengaja) dan kemungkinan akan digunakan dalam jumlah yang lebih kecil dari ini
item lain yang lebih pendek. Pemeriksaan manipulasi jenis apa pun, karena keterkaitannya yang jelas dengan
manipulasi penelitian, lebih mudah untuk dibingkai sebagai keputusan semua-atau-tidak sama sekali. Karena itu
jauh lebih transparan dan intuitif dari item ini, makalah ini akan menyarankan skor potong
keputusan sepenuhnya diserahkan kepada peneliti, tetapi dengan peringatan bahwa keputusan tersebut harus
Teknik lain untuk mengidentifikasi responden C/IE hadir dengan perpaduan transparansi,
kesederhanaan, dan pemikiran. Sederhananya, adalah mungkin untuk bertanya kepada responden apakah mereka telah menjawab
dengan cara yang mereka yakini valid (meskipun mungkin tidak cukup dalam kata-kata itu). Meade dan Craig
(2012) membuat dan menguji skala keterlibatan peserta yang menghasilkan dua faktor:
ketekunan dan salah satu minat. Skala ketekunan ini berkorelasi cukup baik dengan beberapa
teknik lain dari deteksi C/IE dalam studi mereka (besarnya R mulai dari kira-kira 0,16-,51),
dan mungkin terbukti berguna seperti beberapa teknik ini pada sampel yang tidak memiliki alasan untuk
penipuan. Meade dan Craig (2012) juga menguji sejumlah ukuran item tunggal perhatian dan
usaha, serta ukuran satu item hanya menanyakan “Menurut pendapat jujur Anda, haruskah kami menggunakan . Anda?
data?" Masing-masing item ini memiliki korelasi yang serupa tetapi lebih lemah dibandingkan dengan ketekunan yang lebih lama
skala.
Teknik-teknik ini tampaknya menjanjikan, setidaknya dalam situasi berisiko rendah di mana
responden tidak akan rugi dengan bersikap jujur. Bahkan dalam situasi di mana penghargaan sedang
ditawarkan untuk penyelesaian survei (misalnya, kumpulan subjek psikologi, MTurk), jujur dan terbuka
MENDETEKSI KECERDASAN 43
menanyai individu di akhir penelitian mungkin masih menghasilkan beberapa hal yang berguna dan dapat ditindaklanjuti
data, terutama jika dicatat bahwa penghargaan akan terpenuhi terlepas dari responsnya. Secara anekdot,
penulis ini dapat mengkonfirmasi bahwa melalui penggunaan awal dan terbatas dari skala ini beberapa segmen kecil dari
peserta (~3-5%) tampaknya bersedia mengakui bahwa data mereka mungkin layak untuk dibuang.
Jika dilakukan secara akurat, jauh lebih baik bagi peneliti bahwa seorang responden hanya mengakui bahwa
data mereka berkualitas buruk, daripada harus menentukan fakta yang sama melalui analisis
data mereka. Masalah kesalahan Tipe I yang sama (membuang data yang baik sebagai data yang buruk) berlaku, bagaimanapun, di
kemungkinan bahwa kebanyakan responden yang cermat mungkin mengidentifikasi data mereka sebagai kualitas yang buruk bahkan jika
itu adalah data yang, menurut standar yang wajar, seharusnya disimpan. Peserta mungkin juga tidak memiliki
gagasan tentang apa yang memenuhi syarat sebagai 'data yang dapat digunakan', dan tanggapan yang dianggap baik oleh satu peserta
kualitas dapat dianggap kualitas buruk oleh peserta lain. Juga, lebih sadar diri
peserta mungkin memperhatikan perhatian mereka berkurang sementara kurang sadar diri (atau lebih lalai!)
peserta tidak. Terlepas dari risiko ini, penggunaan timbangan seperti itu adalah area yang menjanjikan yang juga
Ada banyak aspek respons C/IE yang belum diperiksa secara detail
dalam penelitian sebelumnya. Mirip dengan menambahkan serangkaian kondisi lain ke eksperimen, banyak di antaranya
aspek secara efektif menggandakan kompleksitas dari setiap pemeriksaan atau pemahaman yang diberikan. Ketua
di antaranya adalah konsep item dengan kata-kata terbalik. Item dengan kata-kata terbalik hanyalah itu
yang secara terarah berbeda dari item 'normal' dalam skala. Artinya, individu dengan
tingkat yang lebih tinggi dari konstruk laten yang mendasari harus menghasilkan skor yang lebih rendah pada ini
item. Dengan demikian, item-item ini perlu diberi skor terbalik sebelum banyak jenis analisis.
MENDETEKSI KECERDASAN 44
Item ini juga harus dikodekan terbalik sebelum penerapan beberapa C/IE ini
teknik deteksi, meskipun tidak harus semuanya. Beberapa teknik ini dapat digunakan pada keduanya
data mentah dan recoded, untuk efek yang sama atau berbeda (Curran & Kotrba, 2012). Perbedaan ini
diringkas dalam tabel 1, yang menyoroti penggunaan yang direkomendasikan dari teknik ini dalam tiga
pengaturan yang berbeda: 1) data tanpa item dengan kata terbalik, 2) data dengan item dengan kata terbalik
yang belum dikodekan ulang, dan 3) data dengan item kata terbalik yang telah dikodekan ulang.
Dalam kasus timbangan tanpa item dengan kata-kata terbalik, teknik ini bekerja dengan cukup baik
cara langsung seperti yang dijelaskan di atas. Perbedaan penting di sini datang dalam kasus
antonim psikometrik dan semantik. Antonim semantik, menurut definisinya, menyiratkan bahwa
item dengan kata terbalik dimasukkan dalam skala (misalnya, 'Saya senang' vs 'Saya sedih'). Sebuah skala
tanpa item dengan kata-kata terbalik ini kemungkinan akan kekurangan item yang benar-benar berlawanan secara semantik. Ketika
antonim psikometrik tidak dibatasi hanya berfungsi dengan item dengan kata-kata terbalik, mereka melakukannya
memanfaatkan barang-barang tersebut dalam pencarian mereka untuk barang-barang yang memiliki negatif besar
korelasi. Dalam situasi tanpa item berkode terbalik, korelasi negatif seperti itu cenderung
Jika item dengan kata-kata terbalik digunakan, ada informasi yang dapat diperoleh dari keduanya
data mentah sebelum item tersebut dikodekan terbalik, dan data yang sama setelah pengodean ulang. Pertama dan
terutama, sinonim dan antonim semantik dan psikometrik keduanya akan bekerja secara normal di masing-masing
dari situasi-situasi ini. Pasangan sinonim tidak mungkin dipengaruhi oleh pengodean ulang apa pun. Antonim
akan bekerja untuk menghasilkan korelasi dalam-orang dalam kedua kasus, meskipun harus dicatat bahwa
korelasi negatif yang lebih tinggi seharusnya hanya menunjukkan respons yang bijaksana sebelum item-item itu ada
dikodekan ulang. Setelah pengodean ulang, korelasi positif yang lebih tinggi antara item-item ini akan menunjukkan perhatian
tanggapan. Terlepas dari perhitungan ini, pasangan antonim psikometrik harus diidentifikasi pada data
MENDETEKSI KECERDASAN 45
sebelum pengodean ulang untuk mengisolasi korelasi negatif ini secara jelas dari positif normal
korelasi.
Analisis string panjang unik karena bekerja di kedua situasi juga, tetapi berbeda
efek. Sebelum pengodean ulang item dengan kata-kata terbalik, analisis string panjang akan mendeteksi individu yang
benar-benar merindukan kehadiran item dengan kata-kata terbalik ini. Ini mewakili ekstrim
kecerobohan, dan sebenarnya tidak akan terdeteksi jika tanggapan ini dikodekan ulang. Sebenarnya, seperti itu
pengodean ulang akan membuat respons ini terlihat lebih sah untuk analisis string panjang! Ini bukan untuk
katakan tidak ada tempat untuk analisis string panjang pada data yang dikodekan ulang; analisis string panjang pada recoded
data membantu mengidentifikasi peserta yang memiliki pikiran minimal untuk memperhatikan kebalikannya
item kata dan ubah tanggapan mereka sesuai (misalnya, di antara serangkaian tanggapan 'setuju'
peserta bergeser ke 'tidak setuju' untuk setiap item dengan kata-kata terbalik). Ini mungkin cukup spesifik
aplikasi, tetapi tidak sulit untuk membayangkan seorang peserta yang hanya mencari kata-kata seperti
'tidak pernah' dan 'tidak' dan 'jangan', ciri khas item dengan kata-kata terbalik. minimal ini
perhatian mungkin cukup bagi peserta untuk percaya bahwa data mereka tidak akan ditangkap oleh layar,
tetapi mungkin tidak cukup untuk dianggap bijaksana, seperti di Huang et al. (2012).
Beberapa teknik tidak bekerja dalam kedua situasi ini, atau belum teruji. Ganjil genap
konsistensi dan keandalan internal yang disampel ulang sama sekali tidak memiliki asumsi dasarnya
terpenuhi ketika item dengan kode terbalik digunakan dan tidak dikodekan ulang. Penggunaannya dalam situasi ini tidak hanya tidak
direkomendasikan, tetapi akan menghasilkan hasil yang sama sekali tidak berarti. Teknik-teknik ini membutuhkan
unidimensionalitas (bahkan jika unidimensionalitas itu agak dipaksakan, seperti dalam kasus kebalikannya
pengkodean item dengan kata-kata terbalik). Kesalahan Polytomous Guttman dan korelasi total orang, sebagai
ketergantungan pada item berarti dalam proses ini menunjukkan bahwa perbedaan akan ada di antara keduanya
MENDETEKSI KECERDASAN 46
perhitungan. Studi lebih lanjut dapat memeriksa perbedaan ini dan bagaimana hal itu dapat dikonseptualisasikan,
tetapi teknik ini hanya disarankan untuk penggunaan saat ini dalam kasus di mana data baik
unidimensional oleh alam atau recoding. Ini mungkin berubah di masa depan karena mereka menjadi lebih baik
dipahami.
Beberapa pekerjaan awal telah menunjukkan bahwa item dengan kata-kata terbalik tidak mengurangi keberadaan
tanggapan yang tidak valid (Sonderen, Sanderman, & Coyne, 2013), dan mereka tidak boleh digunakan atau
dianggap sebagai obat mujarab untuk masalah ini. Selain itu, ada sejarah yang cukup panjang tentang
memeriksa dampak respons C/IE (dan pola tidak valid lainnya) pada item dengan kata-kata terbalik
(Schmitt & Stults, 1985; Spector, Van Katwyk, Brannick, & Chen, 1997). Baru-baru ini, Woods
(2006) memeriksa penyertaan data C/IE dalam proses konstruksi skala dan menemukan bahwa
kira-kira 10% responden C/IE sudah cukup untuk mulai menghasilkan faktor metode palsu di luar
dari kerangka unidimensional. Anehnya ini tumpang tindih dengan perkiraan terbaik untuk data C/IE secara normal
sampel, dan menyarankan motif lain untuk menghilangkan peserta ini jika kata-kata terbalik
Ada masalah kompleks yang harus dipecahkan terkait penggunaan item dengan kata-kata terbalik di
proses survei, dan bahkan ada masalah yang lebih kompleks terkait hubungannya dengan C/IE
teknik deteksi. Namun, sebagai bidang penelitian tentang respons C/IE, kasus unidimensional
tanpa item kata terbalik masih belum sepenuhnya dipahami. Ini adalah rekomendasi yang kuat untuk ini
makalah bahwa penelitian masa depan tentang teknik ini pertama-tama berfokus pada kasus tanpa kata-kata terbalik
item. Hanya setelah pemahaman yang cukup tentang kasus yang lebih sederhana ini, benar-benar dibenarkan untuk pindah ke
Dalam praktiknya, timbangan dengan item dengan kata terbalik akan terus digunakan. ini sebelumnya
paragraf tidak dimaksudkan sebagai seruan untuk penghapusan total barang-barang ini. Selanjutnya, ini sebelumnya
MENDETEKSI KECERDASAN 47
paragraf tidak boleh menjadi alasan untuk mempertimbangkan penggunaan teknik ini tidak relevan pada skala dengan
item kata terbalik. Ada banyak alasan untuk memasukkan item dengan kata-kata terbalik selain dari
deteksi responden C/IE, dan alasan ini diserahkan kepada pertimbangan individu
peneliti. Mungkin saja item dengan kata terbalik memainkan bagian integral di masa depan penelitian ini,
atau bahwa penghapusan penanggap C/IE memperbaiki beberapa masalah saat ini dari kata-kata terbalik
Sejumlah metode telah diilustrasikan di sini, dan ringkasan teknik ini dapat
dapat ditemukan pada tabel 2. Pembaca mungkin mengingat atau mengenali bahwa tidak semua teknik ini mengukur
konstruksi yang sama, dan mungkin berkorelasi positif, negatif, atau tidak sama sekali satu sama lain (Meade
& Craig, 2012). Sebagai perpanjangan dari ini, individu yang diidentifikasi dengan satu teknik tidak
harus diidentifikasi oleh orang lain. Faktanya, identifikasi dengan satu teknik terkadang berarti
mengurangi kemungkinan deteksi oleh yang lain (misalnya, analisis string panjang dan konsistensi ganjil-genap).
Karena itu, menggunakan hitungan mentah dari jumlah metrik yang mengidentifikasi individu adalah
Setiap kelas teknik ini memiliki pro dan kontra, dan dirancang untuk mengidentifikasi perbedaan
Tipe dari data yang tidak valid. Penggunaan paling kuat dari metode ini adalah menggunakannya secara bersama-sama; untuk menyeimbangkan
kelemahan masing-masing teknik dan tidak sekedar menghilangkan individu berdasarkan tolak ukur yang
peneliti tidak sepenuhnya memahami atau tidak dapat mempertahankan secara memadai. Untuk mencoba menemukan ini
keseimbangan, penggunaan metode ini secara berurutan dapat mengidentifikasi individu untuk pemeriksaan lebih dalam,
Telah disebutkan beberapa kali selama makalah ini, tetapi perlu dikemukakan kembali: ada
keputusan mendasar tentang kesalahan Tipe I dan Tipe II dalam eliminasi individu dari a
MENDETEKSI KECERDASAN 48
kumpulan data yang harus dipikirkan secara mendalam oleh semua peneliti yang mempertimbangkan teknik ini. Itu juga harus
diakui bahwa tidak menggunakan teknik ini sama sekali default untuk kesalahan Tipe II maksimum. NS
rekomendasi keseluruhan dari makalah ini adalah untuk berbuat salah di sisi kesalahan Tipe II di masing-masing ini
teknik, kecuali penilaian individu mengungkapkan konsekuensi yang lebih besar secara drastis dari Tipe II
kesalahan relatif terhadap kesalahan Tipe I. Pendekatan konservatif ini sebagian disebabkan oleh fakta sederhana bahwa
teknik ini, bahkan yang telah digunakan selama beberapa dekade, tidak sepenuhnya dipahami. Dia
demikian juga halnya, kecuali data berkualitas sangat rendah, responden yang valid akan selalu
melebihi jumlah responden yang tidak valid. Penghapusan yang terburuk dari responden ini dari apa pun yang diberikan
teknik akan menghilangkan yang paling mudah untuk diidentifikasi, dan, berpotensi yang paling berdampak. Ini juga
meminimalkan risiko juga menghilangkan responden normal yang valid dengan membuat pemotongan yang terlalu dalam dengan apa pun
teknik yang diberikan. Semakin banyak teknik ini didorong ke batasnya (yaitu semakin banyak Tipe II
kesalahan berkurang), semakin besar akan tumbuh rasio data yang valid dibuang dengan data yang tidak valid ini.
Sebagai lindung nilai terhadap penggunaan terbatas ini (dan mengakibatkan efektivitas terbatas) dari masing-masing
teknik individu, kemudian juga disarankan agar teknik ini digunakan secara berurutan. Ini
beberapa metode dapat dilihat masing-masing sebagai rintangan yang harus dilewati responden, dan yang
paling ekstrim untuk setiap teknik diidentifikasi. Dengan menggunakan banyak rintangan, dan mengatur standar untuk
masing-masing teknik ini lebih rendah daripada jika teknik itu digunakan secara terpisah, yang paling mungkin-
individu yang tidak valid akan diidentifikasi dan dihilangkan dengan setiap teknik tanpa membuat terlalu dalam
dipotong menjadi mereka yang telah meluangkan waktu untuk memberikan data yang valid.
Misalnya, pemotongan awal pada waktu respons dapat mengidentifikasi individu-individu yang
hanya menanggapi di bawah ambang batas di mana tanggapan yang bijaksana dapat tidak pernah menjadi
diproduksi. Perhatikan gambar 1 sekali lagi. Ini digunakan untuk menunjukkan kesulitan
menghilangkan semua responden yang tidak valid tanpa menghapus responden yang valid, tugas yang
MENDETEKSI KECERDASAN 49
sangat sulit atau terkadang tidak mungkin dengan informasi waktu respons dari kiri
kolom gambar 1 saja. Namun, identifikasi dan eliminasi proporsi yang lebih kecil dari
responden yang tidak valid, bahkan hanya satu atau dua, hampir pasti akan menghapus beberapa responden yang tidak valid
dengan pengurangan risiko menghapus data yang valid. Proporsi yang lebih kecil ini yang dihilangkan juga
memiliki keutamaan sebagai orang-orang yang mungkin paling sedikit memberikan perhatian atau perhatian dalam hal apa pun
kelompok ini.
Jika metode digunakan sebagai rintangan berurutan, sisa individu yang lulus ini
layar waktu respon masih belum bebas dan jelas. Meninggalkan beberapa individu yang berada di perbatasan
waktu respons berarti individu-individu ini akan diuji oleh setiap metode yang tersisa secara bergantian.
Pertimbangkan seorang individu yang merespons dengan respons yang sama untuk setiap item, tetapi siapa yang melakukannya
cukup lambat untuk melewati layar waktu respons (keanehan, tetapi tentu saja bukan tidak mungkin). Ini
individu tidak akan diidentifikasi oleh waktu respons sebagai penanggap C/IE, tetapi akan mudah
diidentifikasi seperti itu dengan analisis string panjang. Individu yang melewati kedua layar ini
Beberapa teknik mungkin tidak setuju dalam klasifikasi penanggap C/IE, dan ini menjadi
mengharapkan. Misalnya, individu yang memberikan rangkaian panjang dari respons yang sama mungkin sangat baik
menghasilkan string respons yang tampak sangat konsisten dengan metode lain, seperti ganjil-genap
konsistensi atau sinonim psikometrik.1 Meskipun ini mungkin mewakili bintik-bintik buta yang ada di masing-masing
teknik ini tidak mewakili cacat dalam penggunaannya secara keseluruhan. Bahkan, ia menyediakan
kasus terkuat untuk menggunakan lebih dari satu teknik ini, karena semakin banyak yang digunakan semakin sedikit
titik buta akan tetap tidak tertangani. Peneliti harus mempertimbangkan fakta ini ketika memilih
1 Perhatikan bahwa dalam beberapa situasi beberapa teknik ini bahkan tidak dapat dihitung, seperti individu yang tidak
memberikan variasi dalam tanggapan.
MENDETEKSI KECERDASAN 50
teknik, dan memastikan bahwa kelemahan dari setiap teknik yang diberikan seimbang terhadap
kekuatan orang lain. Menggunakan teknik yang berkorelasi positif seharusnya tidak lebih dari
Penggunaan konservatif dan serial dari setiap teknik ini mempertahankan beberapa responden yang tidak valid, tetapi
juga menyediakan teknik lain dengan kesempatan tindak lanjut untuk mengidentifikasi mereka yang tidak valid
responden yang tersisa. Proses berkelanjutan ini kemudian memiliki kekuatan untuk berpotensi menghapus lebih banyak
dan lebih banyak individu melalui proses ini. Ini keduanya mengurangi tekanan pada masing-masing ini
teknik melalui pengurangan ukuran sampel (setiap teknik dalam urutan ini berpotensi
memiliki lebih sedikit individu untuk diperiksa daripada teknik sebelumnya) dan distribusi pekerjaan (masing-masing
teknik membawa bagian dari tanggung jawab total untuk menghapus individu). Selain itu, ini
pembagian kerja juga menghasilkan spesialisasi fungsi: masing-masing teknik hanya bertugas untuk
hapus responden yang tidak valid yang dapat dihilangkan secara meyakinkan. Alih-alih menghapus
individu karena mereka diidentifikasi oleh beberapa hitungan metrik total tanpa sepenuhnya
memahami mengapa individu-individu itu dihapus, setiap individu dieliminasi karena mereka
melanggar beberapa patokan tertentu atau konseptual yang ditetapkan oleh peneliti (misalnya, selesai
Sejumlah nilai potong telah disorot dari penelitian sebelumnya atau direkomendasikan dalam
makalah ini. Saat ini, ini telah diajukan sebagai titik awal konservatif untuk masing-masing
teknik, dan lunak sebagai pengalaman dan praktek mendikte. Di atas segalanya, peneliti menggunakan
teknik ini harus memiliki pemahaman tentang kapan dan bagaimana penerapannya, dan
bagaimana dan kemudian teknik tersebut menghilangkan individu dari kumpulan data yang lebih besar. Kapan pun
mungkin, ini harus dilaporkan seperti itu. Melaporkan proses berurutan ini memungkinkan untuk lebih dalam
MENDETEKSI KECERDASAN 51
pemahaman tentang mengapa setiap individu disingkirkan, terutama bila dibandingkan dengan banyak
pernyataan yang lebih sederhana bahwa jumlah X individu telah dihapus untuk merespons C/IE.
Secara umum, teknik-teknik ini, dan rekomendasi yang agak carte blanche ini untuk mereka
implementasi, tidak boleh dilihat sebagai ajakan atau kesempatan untuk P-hacking (Kepala, Holman,
Lanfear, Kahn, & Jennions, 2015) atau penyesuaian data lainnya. Peneliti harus mempertimbangkan penggunaan
metode ini di muka, dan bersedia untuk mengakui apa penghapusan orang-orang ini
mungkin lakukan untuk data mereka. Responden yang tidak valid ini mewakili bentuk kesalahan, dan manifestasi dari
kesalahan itu bisa bermacam-macam bentuknya. Penghapusan responden yang tidak valid ini dapat memperkuat efek dengan
mengurangi kesalahan, tetapi mungkin dengan mudah melemahkan atau menghilangkan efek yang hanya merupakan produk dari itu
kesalahan yang sama (Huang et al., 2015). Peneliti dalam situasi seperti itu perlu menahan godaan untuk
ganti orang-orang ini, karena penggantian semacam itu mungkin hanya dalam upaya untuk menyelamatkan secara potensial
hasil palsu.
Sebagai perpanjangan dari ini, disarankan agar peneliti menjalankan analisis pada kedua dokumen asli
data dan data dibersihkan melalui teknik ini. Situasi di mana analisis ini tidak setuju (jika
semua) dapat disorot dan dibuat transparan untuk orang lain yang mengerjakan ide yang sama. Untuk kecil
efek penyertaan responden C/IE ini berpotensi mengubah hasil, tetapi untuk sebagian besar
efek pergeseran mungkin sepele. Terlepas dari hal sepele dari perubahan ini, apakah itu nyata atau
dirasakan, teknik ini masih dimaksudkan untuk mengurangi kebisingan dan kesalahan dalam data. yang dihasilkan
Kesimpulan
Secara keseluruhan, ada beberapa cara untuk menyaring data survei untuk responden C/IE. Kertas ini
telah menyajikan sejumlah teknik tambahan baru, dan seluruh kelompok teknik ini harus
secara teratur digunakan oleh peneliti survei. Penghapusan responden yang tidak valid ini telah ditunjukkan
MENDETEKSI KECERDASAN 52
untuk mengurangi kesalahan dan memberikan hasil yang lebih valid. Tebakan terbaik menempatkan inklusi rata-rata C/IE
responden sekitar 10% (Curran et al., 2010; DeRight & Jorgensen, 2015; Maniaci & Rogge,
2014; Meade & Craig, 2012), tetapi dengan varians yang berpotensi tinggi pada perkiraan itu secara normal
studi penelitian (misalnya Burns, Christiansen, Morris, Periard, & Coaster, 2014; Gough & Bradley,
1996). Sederhananya, perkiraan terbaik kami berpotensi tidak tepat, tetapi individu-individu ini dan mereka
Selama dapat diterima bahwa jumlah individu yang terbatas ini ada, bahkan kecil
jumlah individu-individu ini dalam sampel telah terbukti memiliki konsekuensi yang berarti pada
sifat skala (misalnya sarana, varians, keandalan), dan hubungan antara skala
(Curran & Kotrba, 2012; Huang et al., 2015; Maniaci & Rogge, 2014; Woods, 2006). NS
penghapusan data yang tidak valid ini harus menjadi prioritas untuk semua penelitian di mana tanggapan tersebut
mungkin cukup diharapkan. Sebagai perpanjangan dari ini, pengetahuan bahwa individu-individu ini
ada dan dapat mempengaruhi hasil studi memiliki kepentingan yang mendalam untuk replikasi dari apa pun yang diberikan
efek dan/atau studi. Jika dibiarkan bebas bervariasi, sampel yang berbeda mungkin memiliki tingkat C/IE yang berbeda
responden. Sebuah studi dengan 20% responden C/IE mungkin menghasilkan efek palsu yang tidak mungkin
direplikasi oleh penelitian selanjutnya yang secara acak atau sistematis memiliki proporsi yang lebih rendah
individu. Hal yang sama dapat bekerja secara terbalik, dengan efek asli dikaburkan oleh responden C/IE di
replikasi selanjutnya. Tanpa melihat ini sebagai masalah potensial, dan tidak melihat perbedaan lain
Cara terbaik untuk menstandardisasi dan mempertahankan tingkat responden C/IE yang konstan di seluruh
sampel adalah melalui upaya terbaik untuk mengurangi proporsinya dalam sampel apa pun hingga mendekati nol
adalah mungkin. Untuk tujuan ini, peneliti dan praktisi harus diingat a
MENDETEKSI KECERDASAN 53
sejumlah poin dari sebelumnya dalam makalah ini, serta sejumlah ekstensi sebelumnya
argumen:
(1) Peneliti tidak boleh terlalu bergantung pada salah satu teknik, dan sebaliknya menggunakan host
(2) Metode tidak boleh diterapkan secara membabi buta, karena merencanakan proses ini untuk setiap metode yang diberikan
studi kemungkinan akan menghasilkan proses yang lebih akurat selaras dengan situasi itu.
(4) Pertimbangan harus diberikan, selama perencanaan studi, untuk memasukkan adat
item atau set instruksi untuk digunakan nanti sebagai metode deteksi.
(5) Setiap metode yang dipilih harus digunakan secara konservatif, secara berurutan, sebagai keluarga
teknik, daripada melihat setiap teknik secara terpisah atau mengandalkan kesepakatan langsung atau
(6) Jika teknik ini digunakan untuk mengurangi ukuran sampel, analisis harus dijalankan
baik sampel asli maupun sampel yang dikurangi, dan perbedaan antara sampel ini harus dicatat.
(7) Bahkan jika penerapan teknik-teknik ini tampaknya tidak berpengaruh apa pun yang sedang dipelajari
dalam set data apa pun, peneliti harus memperhatikan bahwa pembersihan kesalahan yang penting mungkin masih ada
muncul. Data yang tidak valid ini terkadang memperkuat efek dan terkadang melemahkannya, dan
Para peneliti harus menyadari bahwa bahkan dengan pendekatan yang sebagian besar konservatif seperti yang digariskan
di sini, kesalahan Tipe I dalam teknik ini hampir selalu ada. Beberapa data yang bagus kemungkinan akan
dihapus saat membersihkan yang buruk. Jika menghapus beberapa data bagus saat menghapus
data yang tidak valid tidak dapat diterima dalam pengumpulan data tertentu, teknik ini sama sekali tidak
direkomendasikan. Sebaliknya, kemungkinan masuknya individu-individu ini malah harus dianggap sebagai
MENDETEKSI KECERDASAN 54
keterbatasan potensial (terutama sesuai dengan Huang et al., 2015), dan dicatat terus terang dan
Faktanya, apakah individu harus dihilangkan atau tidak, teknik ini harus diterapkan secara luas
digunakan sebagai bagian dari penyaringan dan pelaporan data normal. Melalui penggunaan teknik ini banyak
lebih banyak yang bisa dipelajari tentang proses psikologis menanggapi tindakan laporan diri.
Pemahaman umum tentang teknik ini dapat membantu memastikan tren menuju masa depan
Referensi
103.
Berry, DTR, Baer, RA, & Harris, MJ (1991). Deteksi malingering pada MMPI: A
Birkeland, SA, Manson, TM, Kisamore, JL, Brannick, MT, & Smith, MA (2006). A
Jagal, JN, Dahlstrom, WG, Graham, JR, Tellegen, A., & Kaemmer, B. (1989).
Luka bakar, GN, Christiansen, ND, Morris, MB, Periard, DA, & Coaster, JA (2014). Efek
19.
Costa, PT, Jr., & McCrae, RR (2008). Inventarisasi Kepribadian NEO Revisi (NEO-PI-R).
Dalam DH Saklofske (Ed.), Buku pegangan SAGE tentang teori dan penilaian kepribadian. Jil.
2: Pengukuran dan pengujian kepribadian (P. 179–198). Thousand Oaks, CA: Sage.
Curran, PG, & Hauser, KA (2015). Memahami tanggapan untuk memeriksa item: A verbal
untuk Psikologi Industri dan Organisasi, Philadelphia, PA, 23-25 April 2015.
Curran, P. & Kotrba, LM (2012). Dampak dari respon yang tidak valid: Sebuah studi simulasi.
Curran, P., Kotrba, L., & Denison, D. (2010). Ceroboh menanggapi dalam survei: Melamar
teknik tradisional untuk pengaturan organisasi. Poster dipresentasikan pada 25th Tahunan
Davey, T. & Nering, M. (2002). Mengontrol eksposur item dan menjaga keamanan item. Di dalam
Mills, CN, Potenza, MT, Fremer, JJ & Ward, WC (Eds.), Pengujian berbasis komputer:
DeRight, J. & Jorgensen, RS (2015). Saya hanya ingin kredit penelitian saya: Frekuensi suboptimal
29, 101-117.
Desimone, JA, Harms, PD, & Desimone, AJ (2015). Rekomendasi praktik terbaik untuk
kesulitan item yang ditentukan. Pengukuran Pendidikan dan Psikologis, 28, 105-113.
Donnellan, MB, Oswald, FL, Baird, BM, & Lucas, RE (2006). Skala mini-IPIP:
Ukuran kecil namun efektif dari Lima Besar faktor kepribadian. Psikologis
Dunnette, MD, McCartney, J., Carlson, HC, & Kirchner, WK (1962). Sebuah studi tentang berpura-pura
perilaku pada daftar periksa deskripsi diri pilihan paksa. Psikologi Personalia, 15,
13-24.
Emons, WH M (2008). Analisis kecocokan orang nonparametrik dari skor item politomus.Terapan
Ehlers, C., Greene-Shortridge, TM, Weekley, JA, & Zajack, MD (2009). Penjelajahan
metode statistik dalam mendeteksi respon acak. Makalah dipresentasikan pada acara tahunan
Goldberg, LR, & Kilkowski, JM (1985). Prediksi konsistensi semantik dalam diri
tanggapan terhadap pasangan sinonim dan antonim. Jurnal Psikologi Kepribadian dan Sosial,
48, 82–98.
Griffith, RL & Peterson, MH, (Eds.) (2006). Pemeriksaan Pelamar Lebih Dekat
Guttman, L. (1944). Dasar untuk penskalaan data kualitatif.Ulasan Sosiologi Amerika, 9, 139–
150.
Hauser, DJ & Schwartz, N. (sedang dicetak). Peserta MTurk tampil lebih baik dalam perhatian online
Kepala, ML, Holman, L., Lanfear, R., Kahn, AT, Jennions, MD (2015). Luas dan
Huang, JL, Curran, PG, Keeney, J., Poposki, EM, & DeShon, RP (2012). Mendeteksi dan
menghalangi upaya yang tidak memadai untuk menanggapi survei. Jurnal Bisnis dan Psikologi,
27, 99-114.
MENDETEKSI KECERDASAN 58
Huang, JL, Bowling, NA, Liu, M., & Li, Y. (2014). Mendeteksi upaya yang tidak mencukupi untuk merespons
dengan skala frekuensi: Mengevaluasi validitas dan reaksi peserta. Jurnal dari
Huang, JL, Liu, M., & Bowling, NA (2015). Upaya yang tidak cukup untuk merespons: Meneliti dan
membingungkan berbahaya dalam data survei. Jurnal Psikologi Terapan, 100, 828-845.
Jackson, DN (1977). Manual Survei Minat Kejuruan Jackson. Port Huron, MI: Penelitian
Psikolog Pers.
Karabatsos, G. (2003). Membandingkan kinerja deteksi respons yang menyimpang dari tiga puluh enam
Klein, RA, Ratliff, KA, Vianello, M., Adams Jr, RB, Bahník, ., Bernstein, MJ, ... &
142-152.
Klein, RA, Vianelli, M., & Ratliff, KA (2015). Perhatian memeriksa "Banyak Labs"
peserta: Apakah perhatian peserta memoderasi efek yang disertakan? Poster dipresentasikan di
Pertemuan Tahunan Keenambelas Masyarakat untuk Kepribadian dan Psikologi Sosial, Long
Pantai, CA.
Maniaci, MR & Rogge, RD (2014). Peduli terhadap kecerobohan: Kurangnya perhatian peserta dan
Marjanovic, Z., Holden, R., Struthers, W., Cribbie, R., & Greenglass, E. (2015). antar-item
standar deviasi (ISD): Indeks yang membedakan antara teliti dan acak
Meade, AW, & Craig, SB (2012). Mengidentifikasi tanggapan ceroboh dalam data survei.
Oppenheimer, DM, Meyvis, T., & Davidenko, N. (2009). Pemeriksaan manipulasi instruksional:
Orpen, C. (1971). Fakability dari Jadwal Preferensi Pribadi Edwards dalam personil
Peck, R. & Devore, JL (2012). Statistik: Eksplorasi & analisis data. Boston, MA:
Brooks/Cole.
Schmitt, N. & Stults, DM (1985). Faktor-faktor yang ditentukan oleh item dengan kunci negatif: Hasil dari
Spector, PE, Van Katwyk, PT, Brannick, MT, & Chen, PY (1997). Ketika dua faktor
tidak mencerminkan dua konstruksi: Bagaimana karakteristik item dapat menghasilkan faktor buatan.
Sijtsma, K., & Molenaar, IW (2002). Pengantar teori respons item nonparametrik.
Sonder. E.v., Sanderman. R., & Coyne, JC (2013). Ketidakefektifan kata terbalik dari
MENDETEKSI KECERDASAN 60
item kuesioner: Mari kita belajar dari sapi di tengah hujan. PLoS SATU, 8: e68967.
doi:10.1371/journal.pone.0068967
Woods, CM (2006). Kecerobohan menanggapi item dengan kata-kata terbalik: Implikasi untuk
28, 189-194.
Running head: MENDETEKSI KECERDASAN 61
Tabel 1
Rekomendasi penggunaan teknik pada data berdasarkan inklusi dan pengkodean ulang item kata terbalik.
Data mentah, tidak ada item Membalikkan item dengan kata-kata, Membalikkan item dengan kata-kata, setelah
Jarak Mahalanobis
direkomendasikan gunakan dengan hati-hati direkomendasikan
Konsistensi ganjil-genap
direkomendasikan tidak direkomendasikan direkomendasikan
Antonim/sinonim semantik
direkomendasikan perhatikan tanda koefisien yang diharapkan perhatikan tanda koefisien yang diharapkan
Antonim/sinonim psikometrik
gunakan dengan hati-hati perhatikan tanda koefisien yang diharapkan perhatikan tanda koefisien yang diharapkan
Meja 2
Analisis string panjang invarian Panjang string berurutan terpanjang dari respons yang sama.
Jarak Mahalanobis orang asing Jarak pola respons dari pusat multidimensi semua respons.
Konsistensi ganjil-genap konsistensi Korelasi dalam-orang dari skor skala bernomor ganjil dengan skor skala bernomor
genap.
Contoh Keandalan Individu konsistensi Korelasi sampel ulang pada skor skala parsial dari dua bagian acak dari tanggapan
mereka pada setiap skala.
Antonim/sinonim semantik konsistensi Korelasi dalam-orang pada set pasangan item yang cocok secara semantik dengan makna
yang berlawanan atau serupa.
Psikometrik konsistensi Korelasi dalam-orang pada set pasangan item yang cocok berdasarkan korelasi dengan makna yang
antonim/sinonim berlawanan atau serupa.
Standar Deviasi Antar-item konsistensi Derajat penyimpangan dalam respons dari rata-rata pola respons individu.
Kesalahan Polytomous Guttman konsistensi Hitung jumlah contoh di mana seorang responden memecahkan pola respons yang meningkat
secara monoton pada set item survei yang diurutkan berdasarkan tingkat kesulitan. Korelasi
Korelasi total orang konsistensi string respons individu dengan respons rata-rata semua orang lain.
Item palsu/infrekuensi cek barang Item ganjil ditempatkan dalam skala untuk meminta tanggapan tertentu.
item cek perhatian cek barang Item ditempatkan dalam skala dengan respons yang benar secara eksplisit (misalnya, Jawab dengan 'setuju')
Pemeriksaan manipulasi cek barang Butir-butir dengan instruksi tambahan yang mencakup menginstruksikan peserta untuk menjawab
instruksional dengan cara yang unik.
Timbangan laporan diri laporan pribadi Item yang menanyakan kepada peserta seberapa banyak upaya yang mereka terapkan atau bagaimana mereka menilai
kualitas data mereka.
Running head: MENDETEKSI KECERDASAN 63
Gambar 1. Penyertaan 10% simulasi respons ceroboh dengan besaran berbeda dalam kasus yang diketahui (kanan) dan tidak
diketahui (kiri). Catatan: di kolom kanan data normal berwarna gelap; data yang tidak valid ringan.
MENDETEKSI KECERDASAN 64
Gambar 2. Demonstrasi perbedaan antara korelasi item-total untuk Item 1 dan korelasi person-
total untuk Person 1.
MENDETEKSI KECERDASAN 65