Anda di halaman 1dari 25

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

pengantar
ke Nonparametrik

GAMBARAN

Pelatihan penelitian dalam ilmu-ilmu sosial harus mencakup berbagai kursus


metodologis dan statistik dalam beberapa tahun studi doktoral. Seringkali,
mahasiswa doktoral mengambil dua atau tiga mata kuliah statistik untuk
mempelajari teknik analitik dasar, dan mahasiswa yang mengambil mata kuliah
tambahan sering melakukannya untuk mempelajari teknik inferensial tingkat
lanjut, seperti Hierarchical Linear Modeling (HLM) dan Structural Equation
Modeling (SEM). Teknik-teknik ini bisa sangat berguna ketika seseorang bekerja
dengan kumpulan data yang besar dan data yang terdistribusi secara normal.
Namun, para peneliti secara teratur menemukan diri mereka bekerja dengan
kumpulan data kecil, dan ini sangat umum untuk studi penelitian intervensi, yang
merupakan ciri khas penelitian ilmu sosial. Demikian pula, peneliti mungkin
menemukan diri mereka dengan kumpulan data yang sama sekali tidak memenuhi
asumsi yang diperlukan untuk teknik parametrik yang mereka latih untuk digunakan.
Namun sangat sedikit, jika ada, waktu dalam pelatihan penelitian mereka yang
dikhususkan untuk teknik analitik yang memungkinkan mereka menganalisis jenis data
ini—statistik nonparametrik dengan tepat. Kesenjangan dalam pendidikan ini membuat
individu tidak memiliki alat yang diperlukan untuk melakukan yang sesuai

1
2 Analisis Data dengan Sampel Kecil dan Data Non-Normal

analisis data mereka, atau yang lebih penting, kurangnya paparan dapat
mencegah peneliti mengenali bahwa alat nonparametrik tersedia untuk mereka.
Pilihan utama para peneliti adalah mengharapkan ketangguhan ketika mereka
menggunakan metode parametrik, dan ini memiliki potensi untuk memandu
orang tersebut ke kesimpulan yang salah berdasarkan penggunaan prosedur
statistik ini yang tidak tepat.
Buku ini ditulis dalam bahasa yang jelas dan dapat dimengerti oleh
nonstatistik yang ingin melakukan analisis statistik pada sampel kecil dan/atau
variabel yang tidak terdistribusi normal. Prosedur nonparametrik yang tercakup
di sini menjelaskan bagaimana peneliti dapat menganalisis data yang jika tidak
demikian mungkin akan gagal. Misalnya, proposal hibah yang berhasil sering kali
didukung oleh data percontohan yang dapat dipercaya, dan percontohan ini
sering kali terdiri dari sampel kecil. Pendanaan mungkin bergantung pada
kemampuan peneliti untuk menunjukkan temuan yang signifikan, dan
menggunakan metode parametrik untuk data yang tidak memenuhi asumsi atau
tidak memiliki kekuatan yang cukup dapat menghasilkan temuan yang tidak
signifikan ketika temuan yang signifikan benar-benar ada. Sebaliknya, peneliti
mungkin menemukan hasil signifikan yang merupakan artefak dari penggunaan
teknik analitik yang tidak tepat.
Dalam buku ini, kami berasumsi bahwa Anda, pembaca, ingin memahami statistik
nonparametrik secara konseptual, dan kemudian mempelajari langkah-langkah untuk
menyelesaikan uji statistik nonparametrik. Kami bermaksud agar buku ini menjadi
sumber referensi lebih dari sekadar buku teks, jadi kami telah memformat informasinya
dengan cara yang mudah dipahami. Misalnya, Anda akan menemukan bagian dalam
buku ini di mana kami telah menggunakan poin-poin daripada teks standar dalam
paragraf. Hal ini untuk membuat informasi mudah ditemukan dan mudah dibaca.

Kami juga tidak membahas rumus matematika, kami juga tidak memandu Anda
melalui derivasi aktual tentang cara mendapatkan nilai kritis untuk pengujian hipotesis.
Selain itu, kami tidak membahas cara melakukan pengujian nonparametrik dengan
tangan, karena kami menganggap Anda memiliki akses ke PC dan memiliki
pemahaman dasar tentang perangkat lunak IBM® SPSS® Statistics software (SPSS).
Kami telah memilih perangkat lunak SPSS karena menawarkan proses tunjuk dan klik
untuk prosedur nonparametrik yang cukup mudah diikuti. Jadi, buku ini tidak
menawarkan kode kepada pengguna R atau SAS untuk melakukan pengujian
nonparametrik; namun, kami menyertakan sintaks SPSS dalam Lampiran A. Oleh karena
itu, buku ini ditulis untuk ahli nonstatistik, namun mungkin berguna juga untuk ahli
statistik terapan, karena kami menyediakan tautan ke
Pengantar Nonparametrik 3

sumber daya tambahan yang akan memenuhi kebutuhan mereka yang


tertarik pada dasar matematika nonparametrik.
Topik penting lainnya yang tidak terintegrasi ke dalam bab adalah
perbedaan antara signifikansi statistik (yaitu, hasil dari uji statistik) dan
kepentingan praktis. Tes statistik adalah prosedur matematis yang
memberikan tes matematis dari suatu hipotesis. Menemukan signifikansi
dari uji statistik tidak sama dengan menentukan seberapa penting temuan
statistik untuk pertanyaan penelitian tertentu. Analisis data Anda mungkin
menunjukkan signifikansi statistik, ketika di dunia nyata, perbedaannya
praktis tidak penting. Kami sangat mendesak siapa pun yang melakukan
analisis statistik, terutama mereka yang membuat keputusan dari temuan
statistik, untuk meninjau sepenuhnya topik kepentingan praktis yang terkait
dengan statistik. (Untuk informasi lebih lanjut tentang signifikansi statistik
versus kepentingan praktis, lihat Hojat & Xu,
Akhirnya, kami tidak memperkenalkan bootstrap sebagai opsi dalam bab kami.
Bootstrapping adalah pilihan lain bagi peneliti yang berurusan dengan kumpulan data
kecil, dan dalam istilah sederhana, ini menarik kesimpulan tentang populasi yang
sedang diselidiki dengan mengambil sampel kembali kumpulan data dari mana sampel
populasi berasal. Sejak pengenalan bootstrap (Efron, 1979), prosedur telah diperbaiki
dan penggunaannya telah terbukti menjadi alternatif yang layak ketika berhadapan
dengan data yang menantang (Davidson & Hinkley, 1998; Janssen & Pauls, 2003; Wu,
1986). Karena bootstrap adalah teknik lanjutan, kami menyerahkan pembahasan dan
cara menggunakannya kepada orang lain.

ORGANISASI

Buku ini disusun sehingga Anda dapat dengan cepat menemukan teknik
nonparametrik yang optimal untuk data Anda, dan kemudian ikuti petunjuk
langkah demi langkah yang jelas untuk menggunakan SPSS untuk melakukan
analisis Anda. Setiap bab mencakup skenario yang biasanya ditemukan dalam
penelitian ilmu sosial untuk mengontekstualisasikan teknik analitik, termasuk
rincian tentang desain penelitian, populasi, sampel, kelompok dalam sampel,
jumlah kasus/pengamatan/titik data, waktu (jika relevan), variabel, tingkat
pengukuran, deskripsi distribusi variabel, dan serangkaian pertanyaan penelitian
dan hipotesis. Selanjutnya, dengan menggunakan skenario sebagai contoh,
pertanyaan penelitian dan hipotesis yang relevan memandu diskusi tentang
metode nonparametrik yang dapat digunakan untuk menjawabnya.
4 Analisis Data dengan Sampel Kecil dan Data Non-Normal

Dengan cara ini, Anda dapat dengan mudah mencocokkan pertanyaan khusus Anda
dengan teknik yang sesuai, dan kemudian mengikuti contoh hingga kesimpulan dan
interpretasinya.
Dimulai dengan Bab 2, setiap bab dimulai dengan daftar tujuan bab,
skenario yang berfungsi sebagai latar belakang untuk pertanyaan penelitian
bab, dan tabel metode nonparametrik yang dibahas dalam bab ini. Bab 2
mencakup metode nonparametrik menggunakan variabel tunggal atau
kelompok. Bab 3 menyajikan prosedur untuk membandingkan dua atau
lebih kelompok independen pada karakteristik tertentu, dan Bab 4
menjelaskan teknik untuk membandingkan dua atau lebih kelompok terkait.
Bab kelima menjelaskan metode untuk memprediksi nilai atau level tertentu
berdasarkan sekumpulan variabel independen, ketika data tidak memenuhi
asumsi untuk regresi kuadrat terkecil.
Perangkat lunak utama yang digunakan di seluruh buku ini adalah SPSS, tetapi
karena SPSS saat ini tidak menyertakan teknik regresi nonparametrik dalam perangkat
lunaknya, kami menggunakan add-in untuk Excel—XLSTAT—untuk langkah-langkah
melakukan analisis prediktif.
Informasi tambahan yang berguna disediakan dalam Lampiran (misalnya, sintaks
SPSS, kekurangan) dan dari Bantuan SPSS (misalnya, bagaimana menyiapkan data Anda
untuk analisis). Kami juga menyarankan sumber daya tambahan (yaitu, tautan web,
artikel, buku) yang akan memberikan informasi dan rumus dasar yang terperinci. Di
situs web pendamping buku ini, Anda akan menemukan semua kumpulan data yang
digunakan dalam analisis buku. Setelah mengunduh kumpulan data, Anda dapat
mengikuti langkah-langkah untuk setiap metode nonparametrik menggunakan contoh
data untuk memperkuat pembelajaran dan pemahaman Anda tentang proses tersebut.

Anda mungkin tergoda untuk langsung ke bab analisis data pada saat ini,
tetapi jika Anda melakukannya, Anda belum tentu memahami dasar dari apa yang
Anda lakukan. Akibatnya, Anda mungkin salah dalam menjelaskan prosedur Anda
kepada orang lain, atau dalam menyajikan kesimpulan dan interpretasi analisis
Anda. Kami mendorong Anda untuk meninjau dengan cermat semua informasi
dalam bab ini sebelum melanjutkan.

APA ITU STATISTIK NONPARAMETRIK?

Bagi sebagian orang, statistik atau tes nonparametrik mungkin sulit dipahami pada
awalnya, karena sebagian besar kursus "Pengantar Statistik" didasarkan pada
Pengantar Nonparametrik 5

prosedur parametrik. Statistik nonparametrik adalah serangkaian tes yang


didasarkan pada peringkat, dan sering disebut statistik bebas distribusi,
yang berarti bahwa teknik nonparametrik “bergantung pada tidak ada atau
sedikit asumsi tentang bentuk atau parameter distribusi populasi dari mana
sampel diambil” (Hoskin, nd, hal. 2). Selain itu, prosedur nonparametrik
dapat digunakan dengan data nominal dan ordinal, serta variabel interval
dan rasio yang diperlukan untuk banyak prosedur parametrik.

ISTILAH KUNCI

Beberapa istilah kunci yang digunakan digunakan di seluruh buku ini. Istilah-istilah tersebut adalah

sebagai berikut:

• Hipotesis — proposisi yang dapat diuji yang memandu studi Anda.


Hipotesis nol menunjukkan tidak ada perbedaan yang signifikan
secara statistik antara dua kelompok atau fenomena yang
diukur; yaitu, mereka diambil dari sampel yang sama. Dengan
demikian, setiap perbedaan dalam variabel hasil adalah karena
kesalahan pengambilan sampel, dan variabel independen tidak
akan membuat perbedaan. Hipotesis alternatif (penelitian)
menunjukkan bahwa hipotesis nol tidak benar, dan bahwa
memang ada hubungan. Hipotesis alternatif dapat berupa
nondirectional atau directional. Dalam hipotesis nondirectional,
ada perbedaan, tetapi arah hubungan (misalnya, lebih tinggi
atau lebih rendah) tidak diketahui. Hipotesis alternatif terarah
menunjukkan arah hipotesis (misalnya, skor rata-rata di X lebih
besar daripada skor rata-rata di Y),

• Tingkat pengukuran — skema klasifikasi yang menggambarkan jenis


informasi yang dianggap berasal dari nilai yang mewakili variabel.
• Asumsi parametrik — pedoman yang harus dipenuhi oleh data yang
mewakili variabel sebelum digunakan dalam prosedur statistik
parametrik.
• Kekokohan — properti dari teknik statistik di mana pelanggaran asumsi tidak
akan mempengaruhi hasil pengujian secara negatif (yaitu, tingkat
kesalahan Tipe I pengujian yang sebenarnya mendekati pedoman .05).
6 Analisis Data dengan Sampel Kecil dan Data Non-Normal

• P-nilai — kemungkinan mendapatkan hasilsetidaknya sama ekstrimnya


seperti yang Anda amati, mengingat hipotesis nol (hipotesis tidak ada
pengaruh/tidak ada perbedaan) adalah benar.
• Independensi — ketika satu responden tidak mempengaruhi bagaimana
orang lain menanggapi pertanyaan.
• Ukuran sampel — jumlah subjek atau catatan dalam kumpulan data.
• Ukuran efek — ukuran kuantitatif dari besarnya perbedaan atau
hubungan (misalnya, korelasi antara dua variabel, perbedaan
rata-rata, atau pengaruh intervensi) yang tidak dipengaruhi oleh
ukuran sampel. Ukuran efek khas untuk ilmu-ilmu sosial (lihat
Cohen, 1988, 1992) adalah: .1 = efek kecil,
. 3 = efek sedang, .5 = efek besar.
• Signifikansi — dalam buku ini, istilah untuk signifikansi statistik, yang
berarti bahwaP-nilai kurang dari tingkat alfa apriori yang dipilih
untuk penelitian. Signifikansi praktis, atau pentingnya temuan di
dunia nyata, diberi label demikian.
• Cakupan respons — sejauh mana responden memberikan data
untuk semua opsi respons yang mungkin untuk item atau variabel.

• Pencilan — respons yang nilainya ekstrem, baik rendah maupun tinggi,


dari sebagian besar respons lainnya.
• Ties — ketika dua responden atau pengamatan memberikan nilai yang
sama.

KAPAN PROSEDUR NONPARAMETRIK HARUS DIGUNAKAN?

Metode nonparametrik adalah metode pilihan ketika sampel kecil dan/


atau tidak memenuhi asumsi untuk metode parametrik. Asumsi
parametrik ini sangat penting, karena mereka adalah perekat yang
menyatukan proses matematika. Jika data Anda tidak memenuhi satu
atau lebih asumsi dan Anda tetap menggunakan prosedur parametrik
(ya, perangkat lunak statistik akan memberikan hasil untuk prosedur
parametrik meskipun asumsi tidak terpenuhi), Anda mungkin akan
sampai pada kesimpulan yang salah. Selain itu, jika sampelnya kecil,
kemampuan untuk memverifikasi bahwa data Anda memenuhi asumsi
parametrik menjadi sulit dan terkadang tidak mungkin.
Pengantar Nonparametrik 7

Meskipun tidak semua prosedur parametrik memiliki kumpulan asumsi


yang sama, asumsi parametrik utama adalah sebagai berikut:

1. Data populasi berdistribusi hampir normal.


2. Varians populasi adalah sama (yaitu, homogenitas
varians antar kelompok hadir).
3. Sampel cukup besar.
4. Ada hubungan linier antara atau di antara variabel-variabel.
5. Homoskedastisitas hadir dalam model regresi.
6. Residual (kesalahan) mengikuti distribusi normal.

Asumsi metodologis lainnya sangat mendasar ketika melakukan segala jenis


analisis statistik. Asumsi-asumsi tersebut adalah sebagai berikut:

7. Data diambil secara acak dari populasi yang ditentukan.


8. Data terdiri dari pengamatan independen (terlepas dari data
berpasangan).
9. Tingkat pengukuran sesuai dengan desain variabel.

Mari kita periksa asumsi ini, satu per satu, untuk memahami, secara
konseptual, keadaan di mana pelanggaran asumsi mungkin
memerlukan penggunaan strategi nonparametrik.

ASUMSI PARAMETRIK

Asumsi 1. Data Kependudukan Kira-kira Berdistribusi Normal

Bahwa data kira-kira terdistribusi normal mungkin merupakan asumsi parametrik


yang paling umum (Hoskins, nd, p. 4). Asumsi normalitas penting setiap kali
variabel skala (yaitu, variabel kontinu) digunakan dalam uji statistik parametrik.
Kebanyakan tes parametrik melibatkan variabel skala yang diasumsikan mewakili
data dari distribusi kurva berbentuk lonceng simetris. Penyimpangan kecil dari
kurva lonceng simetris seringkali memiliki konsekuensi negatif yang terbatas
untuk suatu analisis, tetapi penyimpangan yang lebih besar dari normalitas dapat
membuat hasil sepenuhnya salah dan/atau tidak dapat diinterpretasikan. Selain
itu, meskipun beberapa tes parametrik seperti ANOVA dimaksudkan untuk
menjadi kuat
8 Analisis Data dengan Sampel Kecil dan Data Non-Normal

terhadap pelanggaran ringan normalitas, ini tidak berarti bahwa Anda dapat
mengabaikan asumsi normalitas, terutama dengan sampel kecil. Selain itu,
Anda harus menjawab pertanyaan tentang apa, tepatnya, yang merupakan
penyimpangan ringan dari normalitas.
Semua variabel skala harus diuji normalitasnya sebelum dimasukkan ke
dalam uji parametrik. Hal ini terutama benar ketika melakukan analisis
multivariabel di mana beberapa variabel skala dimasukkan dalam model
statistik tunggal (misalnya, regresi multivariat). Setiap variabel harus
menunjukkan hubungannya dengan distribusi yang mulus, kontinu, dan
berbentuk lonceng. Namun, ketika ukuran sampel kecil, kesenjangan antara
nilai (yaitu, titik data pada kurva) membuat uji normalitas lebih cenderung
gagal. Hal ini terutama benar ketika menguji variabel respons tipe Likert
yang digunakan sebagai variabel skala daripada variabel ordinal, dan
terlebih lagi ketika opsi respons berjumlah lima atau lebih sedikit. Jadi,
meskipun banyak ilmuwan sosial cenderung menggunakan opsi respons
skala Likert seolah-olah mereka mewakili variabel kontinu, kita harus yakin
untuk mempertimbangkan ukuran sampel. Misalnya, lebih mudah untuk
membenarkan penggunaan variabel tipe Likert jika ukuran sampel adalah
1.000 dan opsi respons berkisar dari 1 hingga 7 atau 1 hingga 9 daripada jika
ukuran sampel adalah 50 dan opsi respons Likert adalah 1 hingga 4.
Pengujian untuk menentukan apakah suatu variabel dapat diperlakukan
sebagai variabel skala disertakan dalam bab-bab mendatang.
Anda memiliki dua opsi utama ketika variabel Anda gagal dalam
uji normalitas. Pilihan pertama Anda adalah menggunakan strategi
transformasi untuk menormalkan variabel Anda sehingga akan lulus
uji normalitas (misalnya, transformasi log atau kuadrat). Tidak
semua variabel dapat diubah menjadi distribusi normal (misalnya,
data dengan nol dan nilai negatif tidak dapat ditransformasikan ke
log), dan ketika upaya transformasi Anda gagal, Anda tetap tidak
dapat menggunakannya begitu saja, dengan harapan pengujian
Anda akan kuat terhadap pelanggaran normalitas . Ketika variabel
non-normal merespon dengan baik terhadap transformasi, Anda
dapat menggunakannya dalam prosedur parametrik, tetapi
kemudian Anda tidak dapat menginterpretasikan temuan Anda
seolah-olah variabel tersebut tidak diubah. Anda dihadapkan pada
pemahaman tentang variabel yang diubah dalam analisis dan
temuan Anda, dan ini bisa rumit, jika bukan tidak mungkin.
Pengantar Nonparametrik 9

Tantangan lain untuk memverifikasi normalitas adalah ketika data Anda


memiliki outlier. Karena variabel skala diasumsikan berasal dari kurva normal
berbentuk lonceng, ini mencakup asumsi bahwa setiap nilai di sepanjang kurva
adalah nilai yang mungkin untuk variabel Anda (yaitu, ini adalah perwakilan yang
masuk akal dari sampel Anda). Pencilan adalah titik data yang jauh dari nilai rata-
rata dan merupakan simpangan baku berganda dari pusat kurva normal. Oleh
karena itu, variabel dengan data yang termasuk outlier lebih sulit melewati uji
normalitas. Ketika variabel Anda gagal dalam uji normalitas karena potensi
outlier, Anda harus menyelidiki validitas termasuk kasus dengan outlier. Jika Anda
memiliki bukti tak terbantahkan bahwa outlier bukanlah anggota sah dari sampel
Anda (misalnya, itu adalah kesalahan entri data), Anda dapat memilih untuk
menghapusnya atau memperbaiki kesalahannya. Jika memang mewakili titik data
yang sah, meskipun ekstrem, itu harus dimasukkan dalam analisis Anda,
meskipun berkontribusi pada non-normalitas. Dalam situasi ini, Anda tidak boleh
menjalankan tes parametrik, berharap outlier tidak berpengaruh. Sebagai
gantinya, gunakan prosedur nonparametrik. (Untuk informasi lebih lanjut tentang
outlier, lihat Aguinis, Gottfredson, & Joo, 2013; Barnett & Lewis, 1978; Taylor, nd)
Barnett & Lewis, 1978; Taylor, nd) Barnett & Lewis, 1978; Taylor, nd)

Akhirnya, kita harus menyebutkan penggunaan simulasi Monte Carlo. Anda


mungkin menemukan dalam literatur referensi yang menunjukkan bahwa seseorang
telah membuktikan bahwa masuk akal untuk mengabaikan pelanggaran asumsi karena
mereka (atau orang lain, sering merujuk Glass, 1972) melakukan studi Monte Carlo —
pada dasarnya penelitian yang dilakukan dengan banyak kumpulan data dummy.
Kumpulan data dummy dibuat dengan menggambar nilai untuk variabel yang mewakili
distribusi hipotetis. Dengan ratusan kumpulan data yang sedikit berbeda satu sama
lain, peneliti dapat mengeksplorasi seberapa sensitif suatu prosedur terhadap
pelanggaran dalam suatu asumsi. Tantangannya adalah untuk sepenuhnya memahami
seberapa dekat situasi data Anda dengan kumpulan data dummy yang dipelajari dan
oleh karena itu pentingnya asumsi untuk analisis Anda. Dengan kata lain, simulasi
Monte Carlo pada dasarnya adalah pembuatan banyak kumpulan data menggunakan
prosedur otomatis untuk mewakili model data tertentu. Kumpulan data memungkinkan
peneliti untuk melakukan risiko atau analisis serupa lainnya untuk mengidentifikasi
hasil yang dapat digeneralisasikan terkait dengan model data. Namun, dengan
kumpulan data kecil, informasi terbatas yang disediakan kumpulan data kecil
membatasi kemampuan untuk mengidentifikasi model aktual yang diwakili data.
Karena statistik parametrik dibangun dengan asumsi dan karena
10 Analisis Data dengan Sampel Kecil dan Data Non-Normal

setiap kumpulan data unik, dengan asumsi kumpulan data Anda adalah yang sesuai
dengan studi simulasi sebelumnya ini dapat menempatkan temuan Anda pada risiko
jika Anda memilih untuk mengabaikan asumsi parametrik.

Asumsi 2. Varians Populasi Sama (yaitu, Homogenitas Varians Antara Kelompok Ada), di

mana Skor dalam Kelompok yang Berbeda Memiliki Varians yang Sama

Varians adalah seberapa jauh sekelompok angka menyebar. Tidak ada


varians berarti titik-titik data sama, varians kecil berarti titik-titik data
berdekatan di sekitar mean, dan varians besar berarti mereka tersebar jauh
satu sama lain. Asumsi varians yang sama penting untuk tes parametrik
yang menyelidiki perbedaan antara atau di antara kelompok dalam populasi
yang Anda targetkan. Contoh yang umum digunakan untuk menjelaskan
varians yang sama adalah pengujian perbedaan tinggi badan antara pria
dan wanita. Saat memeriksa perbedaan antara pria dan wanita, pikirkan
distribusi tinggi untuk pria dan wanita sebagai kelompok yang terpisah.
Varians tinggi badan laki-laki diharapkan sama dengan varians tinggi badan
perempuan, sehingga memenuhi asumsi varians yang sama antar
kelompok.
Beberapa tes parametrik sesuai untuk situasi ketika asumsi varians yang
sama tidak terpenuhi, tetapi asumsi varians yang sama bukan satu-satunya
asumsi untuk pengujian ini (misalnya, normalitas, ukuran sampel). Oleh karena
itu, ketika melakukan uji parametrik untuk mencari perbedaan kelompok, penting
untuk mengetahui apakah varians berbeda antar kelompok. Ketika varians grup
Anda berbeda, Anda tidak bisa begitu saja bergerak maju seolah-olah mereka
memenuhi asumsi. Sebaliknya, Anda memiliki dua pilihan. Pertama, gunakan uji
parametrik yang memungkinkan varians yang tidak sama saat memenuhi semua
asumsi lainnya, atau kedua, gunakan uji nonparametrik yang tidak
mengasumsikan varians yang sama atau tidak sama. (Untuk informasi lebih lanjut
tentang pengujian varians yang sama, lihat Elliott, 2015.)

Asumsi 3. Sampel Cukup Besar


Istilah dalam literatur statistik seperti "cukup besar" atau "kecil" pada dasarnya
adalah istilah relatif. Misalnya, peneliti yang bekerja dengan kumpulan data
sekunder yang besar mungkin percaya bahwa 500 kasus merupakan sampel kecil,
tetapi banyak peneliti intervensi akan menemukan 500 kasus sebagai sampel
yang luar biasa besar. Dalam aplikasi praktis, bagaimanapun,
Pengantar Nonparametrik 11

konseptualisasi ukuran sampel seringkali hanya terkait dengan metode


statistik yang digunakan. Jika sampel yang digunakan tidak memenuhi
aturan untuk metode statistik yang ingin digunakan peneliti — misalnya,
praktik yang diterima dari 10 hingga 15 kasus per variabel dalam kasus
regresi kuadrat terkecil biasa (OLS) — maka sampel menjadi "terlalu kecil."
Selain itu, ketika ukuran sampel berkurang, kemungkinan verifikasi bahwa
asumsi untuk melakukan prosedur parametrik terpenuhi juga berkurang.
Ingatlah bahwa prosedur parametrik memerlukan data yang kira-kira terdistribusi
normal, dan sebagian besar teks merekomendasikan sampel minimal 100 kasus
untuk menyelidiki normalitas. Dengan demikian, Anda mungkin menyimpulkan
bahwa sampel kurang dari 100 kasus tidak dapat secara memadai memverifikasi
asumsi distribusi normal, dan prosedur nonparametrik harus digunakan. Karena
sebagian besar teks nonparametrik menyarankan bahwa sampel dari 30 kasus
atau kurang harus selalu menggunakan prosedur nonparametrik (Hoskins, nd;
Mathews, 2010; Ryan, 2013), sampel antara 30 dan 100 kasus tidak jelas, dan
Anda harus memeriksa variabel dalam sampel ini dengan cermat sebelum
melanjutkan.
Sampel kecil juga bermasalah untuk analisis parametrik karena ukuran sampel
terkait dengan kekuatan statistik yang diperlukan untuk membuat kesimpulan tentang
populasi dari sampel Anda. Sederhananya, sampel kecil membuat kemungkinan besar
Anda tidak akan menemukan efek signifikan dalam analisis Anda, terutama jika ukuran
efek (misalnya, intervensi) kecil. Ketika dihadapkan dengan sampel kecil, Anda memiliki
dua pilihan. Pertama, Anda selalu dapat menggunakan prosedur nonparametrik
dengan sampel kecil. Kedua, Anda dapat menggunakan uji parametrik bersama dengan
uji nonparametrik paralelnya dan menyertakan keduanya dalam laporan dan publikasi
apa pun, menjelaskan kekuatan dan keterbatasan temuan untuk masing-masing.

Asumsi 4. Ada Hubungan Linier Antara atau Diantara Variabel

Linearitas adalah asumsi penting untuk tes parametrik seperti korelasi dan
regresi. Misalnya, memperoleh nilai untuk korelasi antara dua variabel
adalah akurat hanya jika hubungan mereka dapat diwakili oleh kombinasi
parameter linier. Dalam regresi sederhana, dua parameter yang disebut
koefisien regresi menjelaskan hubungan antara variabel dependen (yaitu,
variabel hasil) dan variabel independen (yaitu, variabel prediktor). Dua
parameter (yaitu, intersep dan kemiringan) dapat digunakan untuk
membuat grafik garis lurus, dengan kemiringan garis adalah
12 Analisis Data dengan Sampel Kecil dan Data Non-Normal

nilai korelasi yang mewakili hubungan antara variabel terikat dan variabel
bebas. Tentu saja, penempatan garis yang paling sesuai dengan plot pencar
untuk dua variabel selalu memungkinkan, tetapi karena plot pencar
menunjukkan penyimpangan dari garis lurus, nilai korelasi mungkin tidak
lagi mewakili hubungan antara variabel. Asumsi hubungan linier
menyatakan bahwa garis lurus dapat mewakili hubungan tersebut.
Regresi sederhana dan regresi berganda adalah model parametrik
yang mengasumsikan hubungan linier, dan model tersebut digunakan
untuk memprediksi nilai variabel terikat berdasarkan nilai dari satu
variabel bebas atau beberapa variabel bebas. Untuk membuat prediksi,
hubungan antara variabel independen dan dependen harus jelas.
Dengan kata lain, variabel independen dalam model statistik seperti
regresi berganda harus menyarankan hanya satu nilai untuk variabel
dependen. Memiliki hubungan linier antara variabel independen dan
dependen memungkinkan prediksi.
Dalam regresi sederhana (yaitu, regresi dengan hanya satu variabel
independen), hubungan antara variabel dependen dan independen
dapat dilihat dengan grafik sebar nilai-nilai. Namun, dalam regresi
berganda (yaitu, regresi dengan beberapa variabel independen),
memverifikasi hubungan linier sedikit lebih rumit. Selain itu,
menambahkan koefisien regresi daya yang lebih tinggi dapat
memodelkan hubungan lengkung antara variabel dependen dan
independen. (Untuk informasi lebih lanjut tentang pengujian asumsi
hubungan linier, lihat StatSoft, 2000.)
Melakukan regresi sederhana atau berganda ketika asumsi tidak terpenuhi
berpotensi menimbulkan salah tafsir tentang hubungan antara variabel
independen dan dependen, atau lebih buruk lagi, Anda dapat mengidentifikasi
nilai prediksi untuk variabel dependen yang benar-benar tidak berdasar. Anda
memiliki beberapa opsi dalam situasi ini. Salah satu pilihannya adalah mencoba
mengubah satu atau beberapa variabel Anda agar lebih menyerupai distribusi
normal, meskipun transformasi membuat menjelaskan hubungan variabel jauh
lebih sulit. Pilihan lain adalah menggunakan regresi nonparametrik atau
nonlinier, yang dibahas dalam Bab 5.

Asumsi 5. Homoskedastisitas Hadir dalam Model Regresi

Setara dengan asumsi tentang varians yang sama, asumsi


homoskedastisitas diperlukan ketika melakukan regresi parametrik.
Pengantar Nonparametrik 13

Secara sederhana, Anda mengasumsikan bahwa titik data untuk hubungan antara
variabel dependen dan independen memiliki variabilitas yang serupa di
sepanjang rentang garis prediksi. Misalnya, jika Anda memeriksa plot pencar dari
garis prediksi dan titik data, homoskedastisitas muncul jika titik di sepanjang garis
prediksi menunjukkan pola yang sama di sepanjang seluruh rentang garis
prediksi. Pelanggaran asumsi ini (yaitu, heteroskedastisitas) menghasilkan
beberapa kasus memiliki tarikan lebih dari yang lain, seperti yang ditunjukkan
oleh plot pencar yang terkadang terlihat seperti kerucut atau kipas.
Heteroskedastisitas dapat mengakibatkan nilai prediksi yang tidak valid atau
estimasi hubungan variabel yang tidak akurat. Ketika dihadapkan dengan
heteroskedastisitas, Anda memiliki dua pilihan. Pertama, Anda dapat mencari
variabel yang menyebabkan heteroskedastisitas dan memeriksa kasus yang
tampaknya bermasalah untuk melihat apakah Anda dapat menggantinya secara
sah. Namun, tidak tepat untuk pergi "belanja kasus", karena setiap kasus yang
mewakili responden nyata tidak dapat dikecualikan tanpa sebab. Pilihan lainnya
adalah dengan menggunakan pendekatan nonparametrik, seperti regresi
nonparametrik atau nonlinier, seperti yang dibahas dalam Bab 5. (Untuk
informasi lebih lanjut tentang pengujian asumsi homoskedastisitas, lihat Gaskin,
2015.)

Asumsi 6. Residual (Error) Mengikuti Distribusi Normal

Saat melakukan regresi, jarang, jika pernah, saat variabel dependen dan
independen menyarankan garis prediksi yang cocok dengan data. Perbedaan
antara garis prediksi yang diestimasi dan data yang digunakan untuk
menetapkan garis disebut residual atau kesalahan. Nilai sisa ini membantu
menjelaskan seberapa cocok garis prediksi Anda dengan data. Nilai sisa yang
lebih besar menunjukkan lebih sedikit dukungan untuk nilai prediksi, sementara
nilai yang lebih kecil menunjukkan lebih banyak dukungan untuk nilai prediksi
(yaitu, model prediksi yang buruk versus model prediksi yang lebih baik, masing-
masing). Mengingat hal ini, distribusi nilai sisa diasumsikan mengikuti distribusi
normal. Jika tidak, potensi untuk membuat prediksi yang salah atau menarik
kesimpulan yang salah tentang hubungan variabel tinggi. Residu non-normal
menunjukkan bahwa model Anda tidak dibangun dengan tepat untuk
memprediksi variabel dependen. Ketika dihadapkan dengan distribusi residual
yang tidak normal, pilihan Anda adalah menemukan variabel yang menyebabkan
masalah dan menentukan apakah Anda dapat mengecualikannya secara sah dari
model, atau menggunakan
14 Analisis Data dengan Sampel Kecil dan Data Non-Normal

proses nonparametrik, seperti regresi nonparametrik atau nonlinier.


(Untuk informasi lebih lanjut tentang pengujian asumsi distribusi
residual normal, lihat NIST/SEMATECH, 2012.)

ASUMSI LAINNYA

Asumsi yang dipertimbangkan selanjutnya berlaku untuk teknik statistik parametrik


dan nonparametrik, dan merupakan produk dari studi yang dirancang dengan baik.
Melanggar salah satu asumsi di bawah ini melemahkan atau mungkin membatalkan
kesimpulan apa pun yang Anda ambil dari analisis statistik Anda.

Asumsi 7. Data Diambil Secara Acak dari Populasi


Tertentu — Sampel Probabilitas

Jika Anda merencanakan studi penelitian yang akan memilih responden secara
acak dari suatu populasi, Anda harus meluangkan banyak waktu untuk
mengidentifikasi populasi target Anda dan mempelajari semua perbedaan dan
persamaan potensial dalam populasi. Anda harus menetapkan kriteria inklusi dan
eksklusi yang jelas sehingga populasi Anda terdefinisi dengan jelas. Selanjutnya,
Anda mungkin akan memutuskan untuk mengumpulkan data dari sampel
populasi daripada seluruh populasi, karena salah satu dari sejumlah alasan —
misalnya, Anda tidak memiliki akses atau cukup waktu atau uang untuk
mengumpulkan data dari semua anggota populasi. Dengan demikian,
kepercayaan studi Anda dan kesimpulan yang Anda tarik tentang populasi akan
didasarkan pada sampel Anda. Yang penting, sampel Anda harus mencerminkan
perbedaan dan persamaan yang sama yang Anda identifikasi dalam populasi.
Untuk menyelesaikan ini, Anda harus menggunakan metode pengambilan sampel
probabilitas yang memberi setiap orang dalam populasi target Anda kesempatan
yang sama untuk menjadi sampel Anda. Ini meyakinkan konsumen penelitian
Anda bahwa sampel Anda mewakili populasi.
Anda tidak akan selalu dapat menggunakan strategi pengambilan sampel
probabilitas untuk penelitian Anda, dan terkadang data sekunder Anda tidak akan
berasal dari sampel acak. Dalam situasi ini, Anda harus memahami dengan jelas
dan kemudian menjelaskan bahwa analisis dan temuan berasal dari sampel
praktis (yaitu sampel non-acak dari suatu populasi). Sampel kenyamanan adalah
hal biasa dalam penelitian ilmu sosial, dan terutama jika populasi yang diinginkan
adalah populasi klinis. Namun demikian,
Pengantar Nonparametrik 15

salah memperlakukan sampel kenyamanan sebagai sampel probabilitas sangat


berisiko, karena merusak kemampuan Anda untuk menarik kesimpulan yang akurat
dari data Anda. Menggunakan sampel nonprobabilitas harus dibenarkan oleh
pertanyaan penelitian dan harus dijelaskan dengan hati-hati dalam setiap laporan atau
publikasi sebagai batasan potensial.

Asumsi 8. Data Terdiri dari Pengamatan Independen (Selain Data


Berpasangan, tetapi Pasangannya Harus Independen)

Pengamatan independen melibatkan asumsi bahwa informasi yang diberikan


satu responden tidak mempengaruhi informasi yang diberikan oleh responden
lainnya. Dengan kata lain, satu tanggapan dari seorang individu tidak ada
hubungannya dengan tanggapan dari orang lain, kecuali apa yang diukur.
Sayangnya, mencoba mengantisipasi semua kemungkinan ancaman untuk
mengumpulkan pengamatan independen sangat menantang, tetapi jika
tantangan ini diabaikan, hal itu dapat menambah bias yang merusak pada
penelitian Anda. Jika tidak dikenali, itu dapat memiliki efek yang berpotensi
menghancurkan keakuratan temuan Anda. Asumsi observasi independen terkait
dengan kemampuan Anda untuk memahami sepenuhnya potensi pengaruh pada
data yang Anda kumpulkan. Contoh-contohnya tidak terbatas dan berkisar dari
tidak dapat melakukan sampel probabilitas yang tidak bias hingga kejadian alami
dari subjek yang jatuh ke dalam kelompok yang sebelumnya tidak dikenali.
Langkah paling penting dalam memverifikasi pengamatan independen adalah
memeriksa dengan cermat bagaimana data dikumpulkan, baik secara prosedural
maupun teoretis.
Jika pengamatan Anda tidak independen dan Anda dapat mengidentifikasi masalah
ketergantungan, salah satu pilihan adalah menggunakan pemodelan bertingkat, yang
menyediakan cara untuk memodelkan ketergantungan di antara pengamatan Anda
(misalnya, siswa di dalam kelas di sekolah). Sayangnya, sebagian besar model ini
membutuhkan kumpulan data yang besar. Mengabaikan masalah ketergantungan
yang dikenali bukanlah pilihan dalam strategi parametrik atau nonparametrik.

Asumsi 9. Tingkat Kesesuaian Pengukuran Desain Variabel

Tingkat pengukuran merupakan masalah penting untuk semua prosedur statistik (lihat
Kotak 1.1, “Tingkat Pengukuran”). Asumsi ini mengharuskan Anda untuk
mengidentifikasi tingkat pengukuran yang tepat secara akurat untuk setiap variabel
yang digunakan dalam analisis statistik. Dalam ilmu sosial, data rasio adalah
Kotak 1.1Tingkat Pengukuran

Nominal—Informasi kualitatif (yaitu, nama atau label) yang sering diklasifikasikan ke


dalam tipologi dikotomis (misalnya, kepala atau ekor, ya atau tidak) atau lebih dari dua
(misalnya, ras, agama). Kategori tidak memiliki urutan tersirat. Kita dapat menentukan
apakah kasus sama atau berbeda pada variabel, tetapi tidak ada yang lain. Modus
adalah satu-satunya ukuran tendensi sentral.

Ordinal -Informasi kualitatif yang diurutkan peringkat, menunjukkan arah


perbedaan, tetapi tidak memiliki jarak yang sama antara titik-titik data
(misalnya, jarak antara sangat tidak setuju, tidak setuju, setuju, dan sangat
setuju). Kita dapat menentukan apakah kasus sama atau tidak sama, dan lebih
besar atau lebih kecil dari pada variabel saja. Median dan modus adalah
ukuran tendensi sentral.
Selang—Informasi yang mencakup titik data dengan jarak yang sama di antara mereka,
sehingga kita dapat menentukan jumlah perbedaan, tetapi tanpa nol yang berubah-ubah
(misalnya, skor orang pada ukuran ringkasan). Kita dapat menentukan apakah kasus sama
atau tidak, lebih besar atau lebih kecil dari, dan kita dapat menambah atau mengurangi.
Modus, median, dan mean aritmatika adalah ukuran tendensi sentral.

Perbandingan—Informasi yang mencakup angka nol yang bermakna dan tidak berubah-ubah
dan yang sering digunakan dalam usia atau penghitungan (misalnya, 2 dua kali lipat 4; 50 tahun
lima kali lebih tua dari 10 tahun). Kita dapat menentukan apakah kasus sama atau tidak, lebih
besar atau lebih kecil dari, dan kita dapat menambah, mengurangi, mengalikan, dan membagi.
Modus, median, mean aritmatika, dan mean geometrik adalah ukuran tendensi sentral.

Pengukuran Level di SPSS


kategoris
• Nominal — lihat di bagian “Tingkat Pengukuran dari Buku Teks dan
Kursus Penelitian”
• Ordinal — lihat di bagian “Tingkat Pengukuran dari Buku Teks dan
Kursus Penelitian”
• Item tunggal dengan skala opsi respons tipe Likert dengan kurang dari 6
poin

Skala -Variabel apa pun yang dapat diperlakukan sebagai kontinu, seperti

• Item tunggal dengan skala opsi respons tipe Likert dengan 6 poin
atau lebih
• Beberapa item dalam ukuran, dijumlahkan untuk skor skala
• Interval atau rasio — lihat di bagian “Tingkat Pengukuran dari Buku Teks dan
Kursus Penelitian”
Pengantar Nonparametrik 17

tidak umum, karena memerlukan nilai nol yang bermakna dan tidak
berubah-ubah. Namun, bahkan data interval jarang terjadi, karena titik
data harus memiliki jarak yang sama di antara mereka. Untuk variabel
skala, asumsi interval yang sama sangat penting. (Syaratinterval yang
samamengacu pada ruang tersirat antara nilai bilangan bulat variabel
Anda.) Misalnya, jika ruang teoretis antara nilai 8 dan 10 tidak sama
dengan ruang antara 20 dan 22, Anda tidak memiliki variabel dengan
interval yang sama . Tidak memiliki interval yang sama berarti variabel
Anda sebenarnya bukan variabel skala; sebaliknya, itu sebenarnya
adalah variabel ordinal.
Namun demikian, peneliti ilmu sosial sering memperlakukan
variabel dengan ukuran seperti Likert seolah-olah mereka
adalah ukuran interval atau skala, dengan asumsi bahwa
tanggapan yang dipesan (misalnya, tidak pernah, kadang-
kadang, sering, selalu) sama-sama terpisah. Dengan kata lain,
jarak antara “tidak pernah” dan “kadang-kadang” sama dengan
jarak antara “kadang-kadang” dan “sering”. Ini bisa menjadi
masalah, karena peneliti yang merancang pertanyaan mungkin
percaya bahwa ruang antara pilihan jawaban adalah sama,
tetapi responden mungkin percaya sebaliknya. Agar pertanyaan
dapat diandalkan, setiap responden harus melihat opsi jawaban
dengan cara yang sama. Dengan kata lain, jika beberapa
responden merasakan ruang yang sama antara pilihan jawaban
dan responden lain tidak, penelitian mungkin tidak menangkap
informasi dengan cara yang diinginkan peneliti.
Cakupan respons adalah masalah konseptual lain yang penting yang terkait
dengan tingkat pengukuran dan asumsi normalitas. Cakupan respons mengacu
pada apakah Anda memiliki cukup respons untuk setiap opsi respons dalam
sebuah pertanyaan. Misalnya, asumsikan bahwa 100 orang merespons variabel
tipe Likert 4 poin dengan opsi responssangat tidak setuju, tidak setuju, setuju,dan
sangat setuju.Jika 37 orang memilihsangat tidak setuju dan 57 orang memilih
sangat setuju, Anda hanya memiliki enam tanggapan total ditidak setujudan
setujupilihan. Informasi yang Anda miliki untuksetuju dantidak setujutidak
mendukung penggunaan skala opsi respons tipe Likert 4 poin, dan Anda tidak
boleh menggunakan respons sebagai variabel kontinu. Sebagai gantinya, Anda
mungkin perlu mengubah tanggapan menjadi variabel dikotomis (yaitu, variabel
dengan hanya dua kategori). Meskipun Anda mungkin perlu memilih uji statistik
yang berbeda, validitas transformasi
18 Analisis Data dengan Sampel Kecil dan Data Non-Normal

kontribusi variabel sangat meningkat. Keputusan ini bisa jadi menantang dan
Anda tidak boleh mendasarkannya secara eksklusif pada pedoman matematika.
Pemahaman konseptual yang kuat tentang apa yang diwakili oleh variabel
merupakan pertimbangan penting dalam situasi ini.
Singkatnya, peneliti yang dihadapkan dengan ukuran yang tidak memenuhi
persyaratan untuk teknik parametrik tidak boleh menggunakannya dan hanya
berharap bahwa hasilnya bermakna. Ini mudah dilakukan, karena paket
perangkat lunak statistik seperti SPSS mengasumsikan bahwa variabel diukur dan
didefinisikan secara akurat. Terus terang, beberapa jurnal akan menerbitkan
artikel berdasarkan analisis parametrik menggunakan tingkat pengukuran yang
tidak tepat untuk variabel, karena praktiknya sudah menjadi hal biasa. Namun
praktik ini mengurangi kepercayaan temuan dan melemahkan reputasi penelitian
ilmu sosial. Untungnya, teknik nonparametrik menawarkan strategi analitik
alternatif yang layak. Ketika peneliti menemukan diri mereka dengan data
nominal atau ordinal, termasuk tindakan seperti Likert dengan sedikit pilihan
respons, dan mereka cenderung menggunakan teknik parametrik, strategi yang
solid adalah menindaklanjuti analisis parametrik dengan analisis nonparametrik
paralel untuk menentukan apakah ada perbedaan yang berarti di antara
keduanya. Memasukkan kedua temuan akan berfungsi untuk memperkuat ilmu
pengetahuan dengan cara yang berarti.

KEUNTUNGAN DAN KERUGIAN PROSEDUR NONPARAMETRIK

Teknik analitik nonparametrik menawarkan sejumlah keuntungan


penting.

• Mereka memiliki sedikit, jika ada, asumsi.


• Teknik ini berguna untuk menangani sampel yang mengandung outlier,
terutama outlier ekstrim yang tidak dapat dihilangkan secara logika,
karena teknik nonparametrik mengurangi pengaruh outlier yang
berlebihan.
• Mereka mengurangi efek heterogenitas varians.
• Beberapa tes nonparametrik memberikan hasil yang pastiP-nilai, yang merupakan

probabilitas hipotesis nol benar mengingat data yang digunakan dalam pengujian.

• Mereka dapat digunakan ketika (a) variabel melanggar asumsi


normalitas, (b) mengubah variabel tidak menyelesaikan
Pengantar Nonparametrik 19

persyaratan normalitas, atau (c) mengubah variabel membuat


interpretasinya tidak dapat dipahami.
• Mereka berguna untuk analisis data ordinal (misalnya, tanggapan
tipe Likert 5 poin).

Jadi mengapa seorang peneliti tidak selalu menggunakan teknik


nonparametrik? Teknik analitik nonparametrik disertai dengan
beberapa kelemahan.

• Yang paling penting, ketika data terdistribusi normal, teknik parametrik


paralel lebih kuat. Teknik parametrik memiliki kemungkinan yang lebih
tinggi bahwa prosedur akan mengungkapkan temuan yang signifikan -
misalnya, bahwa dua variabel terkait satu sama lain ketika mereka benar-
benar terkait. Namun, memiliki lebih banyak kekuatan membenarkan
penggunaan statistik parametrik hanya ketika semua asumsi untuk teknik
parametrik terpenuhi.
• Prosedur nonparametrik tidak memberikan estimasi varians dan sering
kali tidak memberikan interval kepercayaan.
• Karena prosedur nonparametrik sering menggunakan
peringkat daripada data aktual, hasil statistik terkadang
lebih sulit untuk ditafsirkan.
• Nilai terikat dapat menjadi masalah jika terlalu banyak nilai yang ada dalam
kumpulan data, dan paket perangkat lunak tidak selalu langsung
menjelaskan bagaimana nilai tersebut menangani ikatan. Contoh dasi adalah
ketika dua responden memberikan nilai atau tanggapan yang sama untuk
pertanyaan jenis skala.
• Menghitung daya kurang mudah, membutuhkan metode simulasi Monte
Carlo (Mumby, 2002). Simulasi Monte Carlo akan memungkinkan
pengujian berbagai kombinasi ukuran sampel, perbandingan anggota
kelompok (jika berlaku), ukuran efek, dll., semuanya apriori untuk
memperkirakan sensitivitas pengujian di masa depan untuk menolak
hipotesis nol dengan skenario data yang berbeda.

KESALAHAN TENTANG TES NONPARAMETRIK

Kesalahpahaman adalah hal biasa tentang kondisi di mana statistik


nonparametrik harus diterapkan dan tentang karakteristiknya
20 Analisis Data dengan Sampel Kecil dan Data Non-Normal

yang membedakannya dari prosedur parametrik. Selama bertahun-tahun, banyak


orang telah menyebarkan kesalahpahaman, sementara yang lain telah
membantahnya (misalnya, Hunter, 1993; Sawilowsky, 2005). Namun, penolakan
tersebut tampaknya tidak berdampak banyak dalam mengoreksi keyakinan
masyarakat. Kami mengaitkan ini, sebagian besar, dengan kurangnya inklusi
pelatihan nonparametrik dalam kursus statistik. Kebingungan tentang
kesalahpahaman ini membuat sulit untuk menghindari kesalahan saat memilih
strategi statistik Anda. Daftar kesalahpahaman ini cukup panjang, tetapi beberapa
yang tampaknya lebih sering muncul daripada yang lain adalah sebagai berikut:

• Prosedur parametrik selalu lebih kuat daripada prosedur


nonparametrik.Ini sama sekali tidak benar, terutama ketika
berhadapan dengan data non-normal.
• Statistik nonparametrik harus dihindari karena peninjau artikel tidak
memahami prosedur ini.Tidak benar. Peninjau dipilih berdasarkan
keahlian dan kemampuan mereka untuk meninjau konten artikel. Jika
Anda ingin artikel Anda diterima, menggunakan prosedur yang sesuai
untuk data Anda akan sangat meningkatkan peluang Anda. Pastikan
untuk membenarkan mengapa Anda memilih tes nonparametrik untuk
pertanyaan penelitian atau hipotesis khusus Anda.
• Statistik nonparametrik tidak boleh digunakan pada kumpulan data yang besar. Tidak
benar. Prosedur matematika untuk statistik nonparametrik sama validnya untuk

kumpulan data besar seperti halnya untuk kumpulan data kecil, tetapi prosedur

tersebut lebih sering digunakan dengan kumpulan data kecil dan data dengan

distribusi non-normal.

• Tidak seperti tes nonparametrik, tes parametrik kuat.Sekali lagi,


tidak benar. Kekokohan menyiratkan bahwa pelanggaran asumsi
statistik tidak bermasalah. Faktanya, baik tes nonparametrik
maupun parametrik tidak kebal terhadap pelanggaran asumsi, oleh
karena itu penting untuk menguji asumsi sebelum menerima
temuan tes apa pun.

BEBERAPA KATA PERHATIAN

1. Anda tidak boleh mendapat kesan yang salah bahwa karena tersedia
teknik analitik nonparametrik, maka tidak masalah untuk melakukan
penelitian dengan sampel kecil. Kami mendorong Anda untuk
Pengantar Nonparametrik 21

melakukan analisis kekuatan apriori ketika merencanakan


studi, sehingga semua teknik statistik dapat tersedia
untuk menganalisis data, dan Anda akan dapat
mendeteksi ukuran efek kecil atau sedang. Ingat,
prosedur parametrik yang digunakan pada sampel besar
dengan data terdistribusi normal yang memenuhi semua
asumsi statistik lebih kuat daripada strategi
nonparametrik. Namun demikian, strategi nonparametrik
sangat penting jika data dari sampel besar Anda tidak
memenuhi asumsi uji parametrik, terutama asumsi
normalitas. Studi tentang perilaku manusia, misalnya,
sering kali menghasilkan data yang sangat miring atau
kurtosis (misalnya, variabel hasil Anda memiliki batas
deteksi yang jelas atau disensor, atau variabel Anda diberi
peringkat atau tingkat ordinal). Tambahan,

2. Dapat dengan mudah diinterpretasikanP-nilai salah, jadi penting untuk


membahas topik ini sedikit lebih luas di sini daripada mengintegrasikannya ke
dalam bab. Seperti yang didefinisikan,P-nilai adalah probabilitas mendapatkan
hasilsetidaknya sama ekstrimnyasebagai hasil yang Anda amati, dengan asumsi
bahwa hipotesis nol (hipotesis tidak ada pengaruh/tidak ada perbedaan) adalah
benar. Dengan kata lain,P-nilai mengevaluasi seberapa baik data sampel
mendukung gagasan bahwa hipotesis nol itu benar. Jadi, kecilP-nilai (biasanya
kurang dari 0,05) menunjukkan bahwa sampel memberikan bukti yang cukup
untuk menolak hipotesis nol untuk seluruh populasi. Misalnya, asumsikan
bahwa Anda melakukan intervensi yang menemukanP-nilai 0,03. Interpretasi
yang tepat adalah bahwajika Anda menganggap intervensi tidak berpengaruh,
Anda akan mendapatkan perbedaan yang diamati (atau lebih) dalam 3% kasus,
karena kesalahan pengambilan sampel acak.

Namun demikian, literatur mengandung banyak salah tafsir tentangP


-nilai. Diabukanprobabilitas membuat kesalahan dengan menolak hipotesis
nol yang benar — kesalahan Tipe I dalam bahasa statistik tradisional. Lebih-
lebih lagi,P-nilai tidak dapat menunjukkan kemungkinan bahwa hipotesis nol
benar atau salah. KecilP-nilai dapat menentukan bahwa data Anda tidak
mungkin jika, memang, nol benar, tetapi tidak dapat menunjukkan apakah
nol salah, atau jika nol benar tetapi sampel tidak biasa. Jadi, kamu
22 Analisis Data dengan Sampel Kecil dan Data Non-Normal

tidak bisamengatakanjika hipotesis nol ditolak, Anda memiliki kemungkinan 3% untuk


membuat kesalahan.
Asosiasi Statistik Amerika sampai pada enam pernyataan tentang P-nilai,
sebagai berikut:

1. TheP-nilai dapat menunjukkan seberapa tidak cocoknya data dengan model


statistik yang ditentukan.
2. TheP-nilai tidak mengukur probabilitas bahwa hipotesis yang
dipelajari itu benar, atau probabilitas bahwa data dihasilkan
secara kebetulan saja.
3. Kesimpulan ilmiah dan keputusan bisnis atau kebijakan tidak boleh
hanya didasarkan pada apakah aP-nilai melewati ambang tertentu.

4. Inferensi yang tepat membutuhkan pelaporan dan transparansi penuh.

5. AP-nilai, atau signifikansi statistik, tidak mengukur ukuran


efek atau pentingnya efek.
6. Dengan sendirinya, aP-nilai tidak memberikan ukuran bukti yang
baik mengenai model atau hipotesis. (Wasserman & Lazar, 2016)

Penting juga bahwa Anda memilih tingkat signifikansi (alfa) untuk ambang
Anda sebelum Anda memulai analisis Anda. Ilmuwan sosial biasanya memilih 0,05
sebagai ambang batas mereka, tetapi dalam analisis nonparametrik kadang-
kadang masuk akal untuk memilih 0,10 sebagai gantinya (M. Hollander,
komunikasi pribadi, 2003), meskipun kecenderungannya untuk memberikan
tingkat kesalahan Tipe I eksperimen yang meningkat. Informasi ini terintegrasi ke
dalam bab-bab buku ini.

KONVENSI YANG DIGUNAKAN DALAM BUKU INI

• Setiap bab dimulai dengan skenario penelitian, diikuti dengan


pertanyaan penelitian dan hipotesis untuk menggambarkan
setiap teknik nonparametrik.
• Tingkat pengukuran dijelaskan dalam istilah SPSS. Dengan demikian,
kategorismeliputi pengukuran nominal dan ordinal, yang termasuk
variabel dikotomis. Istilah lain yang digunakan untuk menggambarkan
variabel kategoris adalahdiskrit, yang mewakili data nominal, ordinal,
dan hitungan. Selain itu, dengan rekomendasi kami
Pengantar Nonparametrik 23

dan untuk digunakan dalam buku ini,kategorisjuga menyertakan variabel


opsi respons Likerttype dengan kurang dari 6 poin. Skalamencakup
variabel apa pun yang dapat diperlakukan sebagai kontinu. Variabel
kontinu adalah variabel yang dapat mengambil nilai apa pun dalam
rentang nilai tertentu yang terkait dengan apa yang diwakili oleh variabel
tersebut. Dalam buku ini, variabel skala mencakup beberapa item dalam
ukuran yang dijumlahkan untuk skor skala, interval dan tingkat rasio
pengukuran, dan item tunggal dengan skala opsi respons tipe Likert 6
poin atau lebih.
• Catatan ditempatkan secara strategis untuk kejelasan dan penjelasan
tambahan.
• Nama variabel dikapitalisasi (misalnya, Stress, Burnout).
• Opsi respons untuk item/pertanyaan dicetak miring (rendah
sedang Tinggi).
• Label SPSS (yaitu, kata atau frasa di jendela SPSS) dicetak tebal (Pilih Tes,
bidang). Ketika Anda melihat kata-kata tebal di SPSS, Anda dapat
mengklik kata-kata tersebut untuk mewujudkan sesuatu (misalnya, jika
Anda mengklikTampilan Variabel,Anda akan menemukan daftar
variabel).
• Nama jendela digarisbawahi (misalnya,Tes
Nonparametrik Satu Sampel ).
• “Select =>” menunjukkan bahwa Anda harus mengklik untuk
mengubah tampilan layar atau membuka/menutup jendela.
• “Klik” menunjukkan bahwa Anda memilih opsi di layar atau
menyorot item di layar.
• adalah ikon yang mewakili panah bergerak. Saat di SPSS, variabel yang
diklik dapat dipindahkan masuk dan keluar dari daftar variabel.
• Dalam SPSS, ikon untuk ukuran level nominal adalah
• Dalam SPSS, ikon untuk pengukuran level ordinal adalah
• Dalam SPSS, ikon untuk mengukur tingkat skala adalah

• Kami menggunakan bahasa dan simbol yang digunakan SPSS.

• Tanda tangan=tingkat signifikansi.

• Adj. Sig. = signifikansi yang disesuaikan.

• Sukses = istilah SPSS untuk membedakan nilai-nilai variabel dikotomis (misalnya,


jika Anda memiliki 1 dan 0 sebagai nilai variabel dikotomis, Anda harus
memilih salah satu dari mereka untuk mewakilikesuksesan).Catatan:Default
untuk SPSS adalah memilih nilai apa pun yang ditemuinya terlebih dahulu
sebagaikesuksesannilai. Jika kamu lari
24 Analisis Data dengan Sampel Kecil dan Data Non-Normal

tes tipe sukses pada variabel kategori dengan tiga nilai atau lebih, SPSS
akan memilih nilai pertama sebagaikesuksesandan sisanya sebagai
kegagalan. Ini menjadi lebih jelas saat Anda mengerjakan bab-bab yang
relevan.
• Kami melaporkan jumlah tempat desimal yang disertakan dalam
output SPSS (biasanya tiga), daripada nilai pembulatan.

LANGKAH PERTAMA

Jika Anda berencana untuk mengikuti langkah-langkah dalam bab ini untuk
menganalisis data Anda sendiri, Anda perlu memasukkan data Anda ke dalam SPSS.
Tata cara memasukkan data Anda ke dalam SPSS terdapat pada fitur bantuan SPSS (klik
tombolH opsi menu elp). Setelah data Anda berada di SPSS, langkah selanjutnya adalah
memverifikasi bahwa semua variabel Anda ditetapkan ke tingkat pengukuran yang
sesuai. Gambar 1.1 menampilkan tampilan data untuk contoh data yang digunakan
dalam Bab 2. Perhatikan bahwa setiap variabel diberi salah satu dari tiga tingkat nilai
pengukuran (misalnya, nominal, ordinal, atau skala).
Setelah data Anda berada di SPSS, Anda mengenali notasi SPSS, dan Anda
sudah familiar dengan istilah kunci, Anda siap untuk melanjutkan ke Bab 2.

Gambar 1.1.Tampilan data dalam SPSS.

SARAN UNTUK BACAAN LEBIH LANJUT

Manfred te Grotenhuis, Manfred, & Matthijssen, Anneke (2015).Dasar


Tutorial SPSS.Thousand Oaks, CA: Sage Publications.
Huff, D., & Geis, I. (1993).Bagaimana Berbohong dengan Statistik.NY: WW Norton
& Perusahaan.
Pengantar Nonparametrik 25

Pett, MA (2015).Statistik Nonparametrik untuk Perawatan Kesehatan


Penelitian: Statistik untuk Sampel Kecil dan Distribusi Tidak Biasa.
Thousand Oaks, Ca: Sage Publications.
Salkind, NJ (2015).Statistik Excel: Panduan Singkat.seribu pohon ek,
CA: Publikasi Sage.

Anda mungkin juga menyukai