Anda di halaman 1dari 10

Machine Translated by Google

Artikel

bmtest: Modul Jamovi untuk Uji Brunner–Munzel—


Alternatif Kuat untuk Uji Wilcoxon – Mann – Whitney
Julian D. Karch

Departemen Metodologi dan Statistika, Institut Psikologi, Universitas Leiden, PO Box 9555, 2300 RB
Leiden, Belanda; jdkarch@fsw.leidenuniv.nl

Abstrak: Dalam penelitian psikologi, perbandingan antara dua kelompok sering kali dilakukan untuk
menunjukkan bahwa satu kelompok menunjukkan nilai yang lebih tinggi. Meskipun uji-t variansi tak
setara Welch telah menjadi uji parametrik pilihan untuk tujuan ini, melampaui uji-t variansi setara
Student , uji Wilcoxon–Mann–Whitney tetap menjadi pendekatan nonparametrik yang dominan
meskipun memiliki keterbatasan serupa dengan uji-t Student . Secara khusus, uji Wilcoxon–Mann–
Whitney dikaitkan dengan asumsi yang kuat dan tidak realistis serta kurang kokoh jika asumsi tersebut
dilanggar. Uji Brunner – Munzel mengatasi keterbatasan ini, menampilkan asumsi yang lebih sedikit,
mirip dengan uji t Welch dalam domain parametrik, dan karenanya direkomendasikan untuk uji Wilcoxon – Mann
Namun, tes Brunner–Munzel saat ini tidak tersedia dalam perangkat lunak statistik yang mudah digunakan,
seperti SPSS, sehingga tidak dapat diakses oleh banyak peneliti. Dalam tulisan ini, saya memperkenalkan
modul bmtest untuk jamovi, perangkat lunak ramah pengguna yang tersedia secara gratis. Dengan membuat
tes Brunner–Munzel dapat diakses oleh banyak peneliti, modul bmtest berpotensi meningkatkan analisis
statistik nonparametrik dalam psikologi dan disiplin ilmu lainnya.

Kata Kunci: Uji Brunner–Munzel; jamovi; Tes Wilcoxon – Mann – Whitney; nonparametrik; kokoh

1. Perkenalan
Para peneliti di bidang psikologi dan bidang lain sering membandingkan dua kelompok independen.
Kutipan: Karch, JD bmtest: Modul
Biasanya, tujuannya adalah untuk menunjukkan bahwa kelompok tertentu cenderung menunjukkan
Jamovi untuk Brunner–Munzel
Tes—Alternatif yang Kuat untuk
nilai yang lebih besar, misalnya untuk memverifikasi bahwa metode terapi baru memberikan hasil
yang lebih baik. Sejalan dengan Ref. [1], saya menyebut tujuan ini sebagai “menetapkan arah”.
Uji Wilcoxon – Mann – Whitney.
Pendekatan standar untuk menetapkan arah antara dua kelompok adalah uji-t Student dan Welch ,
Jiwa 2023, 5, 386–395. https://
doi.org/10.3390/psych5020026 _
serta uji Wilcoxon–Mann–Whitney (atau dikenal sebagai uji Mann–Whitney U, Mann–Whitney–
Wilcoxon, atau Wilcoxon rank-sum) dan interval kepercayaan terkait mereka.
Editor Akademik: Alexander
Meskipun uji-t paling sering digunakan, uji nonparametrik sebaiknya lebih diutamakan
Robitzsch
daripada uji-t parametrik dalam beberapa situasi. Tes WMW hampir selalu direkomendasikan
Diterima: 31 Maret 2023 dan digunakan untuk membandingkan dua kelompok secara nonparametrik [2]. Keuntungan
Revisi: 24 April 2023 utama uji WMW dibandingkan uji t adalah tidak mengasumsikan data berdistribusi interval atau normal.
Diterima: 3 Mei 2023 Oleh karena itu, akan bermanfaat bila salah satu atau kedua asumsi ini tidak terpenuhi.
Diterbitkan: 10 Mei 2023 Sayangnya, tes Wilcoxon–Mann–Whitney sering disalahgunakan dalam psikologi.
Masalah utamanya adalah hipotesis nol dan hipotesis alternatif, serta asumsi-asumsi
yang terkait, sering kali disalahartikan. Tes WMW biasanya disajikan sebagai tes
kesetaraan median populasi [3] atau kesetaraan dua populasi di semua aspek, yang
Hak Cipta: © 2023 oleh penulis. disebut sebagai kesetaraan distribusi [4]. Jika dipasangkan dengan asumsi yang
Pemegang Lisensi MDPI, Basel, Swiss.
sesuai, maka hipotesis tersebut benar dalam artian uji WMW valid ( tingkat kesalahan
Artikel ini adalah artikel akses terbuka
Tipe I benar) dan konsisten (kekuatan mendekati 1 dengan bertambahnya ukuran sampel) [5].
didistribusikan berdasarkan syarat dan

ketentuan Creative Commons


Namun, asumsi yang terkait dengan hipotesis ini tidak realistis dalam psikologi, dan jika asumsi
tersebut tidak dipenuhi, uji WMW dapat meningkatkan tingkat kesalahan Tipe I dan daya hampir 0,
Lisensi Atribusi (CC BY) ( https://
creativecommons.org/licenses/by/
bahkan dalam sampel besar [2].
4.0/).

Jiwa 2023, 5, 386–395. https://doi.org/10.3390/psych5020026 https://www.mdpi.com/journal/psych


Machine Translated by Google

Psikologi 2023, 5 387

Perspektif yang paling umum pada tes WMW, di mana semua perspektif (yang benar)
lainnya merupakan kasus khusus dengan asumsi yang lebih ketat, adalah perspektif fungsional
Mann-Whitney [ 5]. Hipotesis nol adalah kesetaraan distribusi, dan hipotesis alternatifnya adalah
pengaruh relatif p tidak sama dengan 0,5. Alasan lain untuk mempertimbangkan p = 0,5 sebagai
hipotesis alternatif uji WMW adalah karena alasan komputasi: Uji WMW pada dasarnya
menggunakan estimasi sampel standar dari efek relatif p sebagai statistik pengujiannya (lihat Bagian 2).
Untuk menjelaskan efek relatif p, untuk sementara diasumsikan bahwa nilai terikat tidak pernah terjadi.
Kemudian, efek relatif p adalah probabilitas bahwa observasi acak dari kelompok pertama lebih
kecil dibandingkan observasi acak dari kelompok kedua. Jika p = 0,5, kemungkinan besar
observasi acak dari kelompok pertama lebih besar daripada observasi acak dari kelompok
kedua, demikian pula observasi acak dari kelompok pertama lebih kecil daripada observasi acak
dari kelompok kedua. Dalam hal ini, kedua kelompok tersebut disebut sebagai sebanding (secara
stokastik) [6]. p = 0,5 akibatnya diberi label tidak sebanding.
Bahkan di bawah perspektif fungsional Mann-Whitney, tes WMW dikaitkan dengan asumsi yang tidak
realistis. Sebagai Ref. [5] perhatikan, sulit membayangkan situasi di mana asumsi bahwa distribusinya sama
atau tidak sebanding (p = 0,5) dapat dibenarkan secara ilmiah. Perspektif tersebut muncul lebih sebagai
gambaran situasi di mana tes WMW benar. Modifikasi dari perspektif ini, agar lebih realistis, adalah dengan
mengganti hipotesis nol tentang distribusi yang setara dengan hipotesis nol kelompok-kelompok yang tidak
dapat dibandingkan: H0 : p = 0,5 [2,5], (Bab 8.8 dari Pustaka [7 ]). Sejalan dengan Ref. [6], saya menyebutnya
sebagai perspektif komparabilitas stokastik (dalam literatur statistik, masalah ini terkenal sebagai masalah
nonparametrik Behrens–Fisher).

Berbagai masalah dapat muncul ketika menggunakan tes WMW berdasarkan perspektif perbandingan
stokastik yang lebih realistis. Jika kelompok berbeda, misalnya karena varians yang tidak sama, dalam
keadaan umum, kesalahan standar yang salah digunakan. Hal ini, pada gilirannya, menyebabkan tingkat
kesalahan Tipe I yang meningkat, daya yang buruk, dan interval kepercayaan yang tidak memuaskan,
terutama ketika ukuran sampel berbeda [2], (Bab 8.8 dari Pustaka [7]). Dengan demikian, uji WMW dikaitkan
dengan kekurangan yang serupa dengan uji-t Student [8]. Memang benar, secara komputasi , ini pada
dasarnya adalah analog nonparametrik dari uji-t Student (lihat Bagian 2). Sama seperti uji-t Welch di bidang
parametrik, uji Brunner–Munzel (BM) mengatasi kekurangan ini [2,6,9]. Memang benar, uji BM pada dasarnya
adalah analog nonparametrik dari uji-t Welch (lihat Bagian 2). Akibatnya, sejalan dengan rekomendasi untuk
menggunakan uji-t Welch daripada uji-t Student secara default [8], uji Brunner–Munzel telah direkomendasikan
untuk digunakan secara default [2,9].

Namun, banyak peneliti mungkin tidak dapat menggunakan tes BM. Meskipun pengujian BM tersedia
dalam beberapa paket R, termasuk lawstat [10], brunnermunzel [11], npar-comp [12], dan makro SAS [6],
pengujian ini tidak tersedia dalam antarmuka pengguna grafis yang mudah digunakan ( Perangkat lunak
berbasis GUI, seperti SPSS. Dengan demikian, peneliti yang hanya mengandalkan perangkat lunak berbasis
GUI yang mudah digunakan tidak memiliki akses ke perangkat lunak tersebut.
Untuk mengatasi hal ini, saya memperkenalkan modul bmtest untuk jamovi [13]. Seperti jamovi, modul
bmtest tersedia secara gratis dan open source, membedakannya dari hampir semua program perangkat lunak
statistik ramah pengguna lainnya, termasuk SPSS, SAS, dan Stata, yang merupakan hak milik dan memerlukan
pembayaran. Sebagai produk sampingan, modul bmtest jamovi juga tersedia sebagai paket R bmtest.
Keuntungan uniknya dibandingkan paket R yang ada adalah ia menawarkan semua versi pengujian BM yang
umum digunakan.
Sisa dari makalah ini disusun sebagai berikut. Pertama, saya akan memberikan pengenalan singkat
tentang tes BM. Selanjutnya saya akan menawarkan tutorial langkah demi langkah tentang cara menggunakan
modul jamovi. Terakhir, saya akan memberikan gambaran singkat tentang paket R.

2. Tes Brunner–Munzel
Saya akan menjelaskan tes BM menggunakan contoh fiktif yang diperkenalkan dalam buku statistik
populer [14] untuk menjelaskan tes WMW. Contohnya adalah dua kelompok orang yang suka kelab malam:
satu kelompok diberi tablet ekstasi untuk diminum pada Sabtu malam, dan kelompok lainnya diberi minuman beralkohol.
Machine Translated by Google

Psikologi 2023, 5 388

Tingkat depresi diukur menggunakan Beck Depression Inventory pada hari setelahnya
(Minggu) dan pertengahan minggu (Rabu).

2.1. Efek Relatif


Saya akan mulai dengan menjelaskan efek relatif secara lebih rinci. Jika diterapkan pada contoh ini,
efek relatif p menunjukkan probabilitas bahwa seorang konsumen ekstasi yang dipilih secara acak akan
melaporkan perasaan depresi yang lebih ringan dibandingkan dengan seorang peminum alkohol yang
dipilih secara acak. Untuk mendefinisikan efek relatif secara formal, saya memperkenalkan variabel (acak)
X1 dan X2, yang masing-masing mewakili pengamatan acak dari kelompok pertama dan kedua. Tidak
termasuk ikatan, pengaruh relatif dihitung sebagai p = P(X1 < X2). Untuk memungkinkan terjadinya seri,
probabilitas seri diberikan dengan bobot yang sama untuk kedua kemungkinan (X1 lebih kecil, dan X2 lebih
kecil) dan dengan demikian
12 memiliki bobot pada efek relatif. Efek relatif yang dihasilkan memungkinkan
terjadinya ikatan diberikan oleh persamaan:

p = P(X1 < X2) + 1 P(X1 = X2). 2

Jika efek relatifnya p = 0,5, kelompok 1 dan 2 dianggap sebanding (secara stokastik), yang merupakan
hipotesis nol dari uji BM. Untuk pengujian dua sisi, hipotesis alternatifnya adalah HA : p = 0,5, yang menunjukkan
bahwa kelompok-kelompok tersebut tidak dapat dibandingkan. Untuk pengujian satu sisi, hipotesis alternatifnya
dapat berupa HA : p > 0,5 yang menunjukkan bahwa X1 cenderung mengambil nilai yang lebih kecil, atau HA :
p < 0,5 yang menunjukkan bahwa X1 cenderung mengambil nilai yang lebih besar.
Untuk mengilustrasikan lebih lanjut efek relatif, pertimbangkan dua variabel acak biner X1
dan X2 dengan nilai potensial 0 dan 1 dengan P(X1 = 0) = 0,7 dan P(X2 = 0) = 0,1. Dengan
demikian, X1 cenderung mengambil nilai yang lebih kecil. Hal ini tercermin dalam pengaruh
relatif sebagai berikut: jika X1 = 0, maka terdapat probabilitas 90% bahwa X2 lebih besar dan
probabilitas 10% bahwa X2 sama. Jadi, pengaruh relatif yang 1 2 diberikan X1 = 0 adalah (0,9 + ×

0,1) = 0,95. Demikian pula, jika X1 = 1, terdapat probabilitas 0% bahwa X2 lebih besar dan
probabilitas 90% bahwa X2 sama, sehingga pengaruh relatif yang 1 2 diberikan X1 = 1 adalah 0 +

× 0,9 = 0,45. Akibatnya, mengingat P(X1 = 0) = 0,7 dan P(X1 = 1) = 0,3, efek relatif (tanpa
syarat) adalah p = 0,7 × 0,95 + 0,3 × 0,45 = 0,8.

2.2. Statistik Uji

Statistik uji untuk uji BM didasarkan pada efek relatif sampel, yang merupakan penduga efek relatif yang tidak bias
dan konsisten (mendekati nilai sebenarnya dengan bertambahnya ukuran sampel) . Pertama, anggaplah observasi untuk
dua kelompok berukuran n1, n2 adalah X11, . . . , X1n1 , dan X21, . . . , X2n2 . Efek relatif sampel kemudian didefinisikan
sebagai berikut:

1 n1 n2
pˆ = ÿ
n1n2 i=1
ÿ S(X1i , X2j).
j=1

1
Di sini, S(x1, x2) = 1 jika x1 < x2, S(x1, x2)= 2 jika x1 = x2, dan sebaliknya S(x1, x2) = 0.
Oleh karena itu, efek relatif sampel mempertimbangkan semua kemungkinan pasangan observasi (X1i , X2j). Untuk pasangan
yang X1i lebih kecil dari X2j , satu ditambahkan ke hitungan. Untuk X1i sama dengan X2j ,
12 ditambahkan, jika tidak, tidak ada yang ditambahkan. Efek relatif sampel adalah hitungan dibagi jumlah
pasangan (n1n2). Efek relatif sampel pada dasarnya merangkum hasil kompetisi antara semua observasi dari
kedua kelompok [3]. Untuk setiap pertandingan yang dimenangkan grup, 1 diberikan kepadanya, dan untuk
1
seri, poin dimenangkan oleh grup kedua (X2). 2 . Efek relatif sampel adalah proporsinya

Menghitung efek relatif sampel dengan cara ini tidak efisien dan tidak diterapkan dalam program perangkat lunak,
karena semua pasangan n1n2 perlu dipertimbangkan. Sebaliknya, efek relatif dapat dihitung berdasarkan data peringkat,
yang juga menunjukkan bahwa tes BM didasarkan pada peringkat. Untuk mencapai hal ini, peringkat Rik observasi Xik di
antara sampel yang dikumpulkan X11, . . . , X1n1 , X21, . . . , X2n2 dihitung. Untuk nilai terikat, peringkat tengah ditetapkan,
yang mana
Machine Translated by Google

Psikologi 2023, 5 389

adalah rata-rata peringkat di antara nilai-nilai terikat. Misalkan menjadi peringkat rata-rata
Saya

pengamatan R¯ pada kelompok i. Kemudian, efek relatif sampel dapat dihitung sebagai berikut:

1 1
pˆ = N (R¯ 2 ÿ R¯ 1) + 2 ,

dimana N = n1 + n2.
Uji BM membakukan efek relatif sampel pˆ sehingga kira-kira memiliki distribusi normal
standar berdasarkan hipotesis nol p = 0,5; artinya, mendekati distribusi normal dengan
bertambahnya ukuran sampel. Tes WMW dapat didefinisikan secara setara.
Untuk mencapai hal ini, kedua pengujian mengurangi nilai yang diharapkan di bawah nol (0,5) dan
membaginya dengan perkiraan kesalahan standar yang dilambangkan dengan se. Hal ini mengarah pada
statistik uji setara berikut, yang diberi nama U dan W; seperti dalam kasus tes WMW, tes tersebut pada
dasarnya setara dengan U Mann – Whitney dan W Wilcoxon.

R¯ 2 ÿ
0,5 U R¯ pˆ ÿ
= atau setara W = se(pˆ) se(R¯
1
2 ÿ R¯ 1)

Perbedaan penting antara tes BM dan WMW terletak pada perkiraan kesalahan standar yang
digunakan. Estimasi yang digunakan oleh uji WMW hanya valid berdasarkan asumsi terbatas
model pergeseran lokasi [5,9], yang, misalnya, mengecualikan varians yang tidak sama antar
kelompok. Sebaliknya, kesalahan standar yang digunakan dalam pengujian BM adalah valid tanpa
asumsi yang membatasi ini. Memang benar, statistik pengujian uji BM mendekati standar
terdistribusi normal dan dengan demikian mengarah pada pengujian yang mendekati valid
berdasarkan asumsi yang sangat umum [6].
Rumus standard error dan statistik pengujian yang dihasilkan pada pengujian WMW dan BM
adalah sebagai berikut.

R 2 - R¯ 1 R 2 - R¯ 1
WMW = BM = . (1)
S2R (1/n1 + 1/n2) NS 2
1R 2 /n1 + S2R /n2

2 2
Di sini, SR adalah penduga varians gabungan dari data yang diperingkat, dan S berhubungan erat dengan a
akuR

penduga varians dari data yang diperingkat dalam kelompok i (lihat Pustaka [9] untuk rumusnya).
Persamaan (1) mengungkapkan bahwa tes WMW pada dasarnya adalah versi uji-t Student dan uji BM
berbasis peringkat , versi uji-t Welch berbasis peringkat (bandingkan Persamaan (1) dengan rumus uji-t
yang diberikan, misalnya pada Pustaka [9], Persamaan (2.2)). Hal ini memberikan wawasan lebih lanjut
mengapa pengujian BM memberikan hasil yang akurat dengan asumsi yang tidak terlalu ketat
dibandingkan pengujian WMW.
Akibatnya, statistik BM dapat diinterpretasikan secara setara dengan statistik t untuk uji-t Welch .
Nilai positif yang besar menunjukkan bahwa kelompok pertama cenderung mengambil nilai yang lebih
kecil, sedangkan nilai negatif yang besar menunjukkan bahwa kelompok pertama cenderung mengambil
nilai yang lebih besar. Dengan bertambahnya ukuran sampel, statistik BM mendekati standar terdistribusi
normal. Jadi, ketika pengujian dua sisi dengan tingkat signifikansi ÿ = 0,05 dan ukuran sampel yang
cukup besar untuk kedua kelompok, a |BM| > 1,96 menunjukkan hasil yang signifikan.

2.3. Dari Statistik Uji hingga Nilai-p


Ada beberapa pendekatan berbeda untuk mengubah statistik BM menjadi nilai p, sehingga
menghasilkan versi uji BM yang berbeda: seperti untuk uji t Welch , perkiraan normal tidak cukup
akurat dalam sampel yang lebih kecil. Untuk mengatasi hal ini, pendekatan yang lebih akurat
berdasarkan distribusi t telah diusulkan [15]. Pendekatan ini disebut pendekatan asimtotik dan
direkomendasikan daripada pendekatan normal. Pendekatan asimtotik telah terbukti memberikan
hasil yang memuaskan untuk ukuran sampel sekecil n1, n2 ÿ 10 [15].
Derajat kebebasan distribusi t diperkirakan berdasarkan data rangking yang mirip dengan metode
Welch. Untuk rumus tepatnya, lihat (Ref. [7] Bagian 7.8.6) dan untuk turunannya (Ref. [6] Bagian
3.5.2).
Machine Translated by Google

Psikologi 2023, 5 390

Pendekatan alternatif adalah metode pengujian permutasi [16]. Metode ini mengubah tugas menjadi
kelompok dan menyimpan statistik uji BMi yang dihasilkan untuk setiap permutasi i. Prosedur ini diulangi
untuk setiap kemungkinan permutasi untuk memperkirakan distribusi pengambilan sampel permutasi
berdasarkan hipotesis nol yang menyatakan tidak ada perbedaan antar kelompok. Nilai p diperoleh dengan
menghitung proporsi permutasi dimana statistik uji teramati BM tanpa permutasi lebih ekstrim dibandingkan
dengan statistik uji permutasi BMi .
Metode permutasi adalah pendekatan yang paling akurat dan menunjukkan kinerja yang wajar untuk ukuran
kelompok serendah n1, n2 = 7 [17]. Kerugian dari pendekatan permutasi adalah secara komputasi tidak
layak untuk ukuran sampel sedang karena jumlah kemungkinan permutasi bertambah dengan cepat seiring
dengan ukuran sampel [2].
Varian dari pendekatan permutasi yang mengatasi masalah komputasi adalah pengujian permutasi
acak. Daripada mempertimbangkan semua permutasi, hanya sebagian kecil permutasi acak yang
digunakan. Hal ini memungkinkan pengujian permutasi untuk semua ukuran sampel dengan mengorbankan
penurunan akurasi.
Meskipun jelas bahwa pendekatan permutasi penuh akan memberikan nilai p yang paling
akurat, bergantung pada keadaan, pendekatan permutasi asimtotik atau acak akan lebih akurat.
Namun, baru-baru ini, telah ditunjukkan bahwa pendekatan permutasi acak lebih kuat dalam hal
tingkat kesalahan dan kekuatan Tipe I dibandingkan dengan pendekatan asimtotik dalam banyak
situasi seperti yang biasa terjadi dalam psikologi [9].
Dengan demikian, ketiga pendekatan untuk memperoleh nilai p dapat diartikan sebagai trade-off yang
berbeda antara kompleksitas dan akurasi komputasi. Perbedaan antar pendekatan akan hilang seiring
bertambahnya ukuran sampel karena semuanya menyatu pada nilai yang benar.
Dalam praktiknya, saran saya adalah sebagai berikut. Karena kompleksitas komputasi dari
pendekatan permutasi penuh, pendekatan ini hanya dapat digunakan dalam sampel yang sangat
kecil. Saat ini, hal ini pada dasarnya terbatas pada kasus dimana n1, n2 keduanya tidak lebih besar dari 10 [2].
Dalam sampel sekecil itu, peningkatan akurasinya sangat berarti, dan karenanya harus digunakan.
Dalam semua kasus lainnya, pada prinsipnya, saya merekomendasikan pendekatan permutasi acak,
mengikuti hasil dan saran yang diberikan dalam Pustaka. [9] dengan 10.000 permutasi acak. Jika hal ini
juga memakan waktu terlalu lama, yang biasanya hanya berlaku untuk sampel berukuran cukup besar,
maka pendekatan asimtotik dapat digunakan, yang diharapkan cukup akurat dalam sampel berukuran
besar.

2.4. Interval Keyakinan


Ketiga versi tes BM (bahkan versi permutasi) dapat dibalik untuk membangun interval kepercayaan
untuk efek relatif p [18]. Prosedurnya sama untuk semua versi dan juga sama seperti yang digunakan untuk
pengujian lainnya, seperti uji-t. Sebagai contoh, interval kepercayaan 95% memuat semua nilai a yang
hipotesis nolnya bersesuaian H0 : p = a dengan statistik uji terkait pˆÿa
dan tingkat signifikansi ÿ = 0,05 tidak dapat
ditolak se(pˆ) . Pendekatan ini valid jika efek relatif sebenarnya p tidak mendekati 0 atau 1 dan ukuran
sampelnya cukup besar, yang seharusnya berlaku untuk sebagian besar aplikasi psikologi dengan
ukuran sampel sedang karena efek relatif 0 atau 1 menyiratkan bahwa semua observasi dalam satu
kelompok lebih kecil dari semua observasi kelompok lain, hal ini jarang terjadi dalam psikologi.
Jika kondisi ini tidak terpenuhi, Ref. [2] memberikan panduan tentang pendekatan alternatif yang masih
dapat memberikan interval kepercayaan yang valid, namun hanya diterapkan pada paket R lainnya, yang
paling menonjol adalah paket nparcomp [12].

3. Modul Jamovi bmtest 3.1.


Instalasi

Program jamovi dapat diunduh dari https://www.jamovi.org/download. html (diakses pada 15 Maret 2023) dan
tersedia untuk semua sistem operasi yang umum digunakan. Alternatifnya, jamovi juga dapat digunakan melalui jamovi
cloud. Namun, hal ini tidak disarankan, karena saat ini tidak memungkinkan untuk instalasi modul bmtest.

Instalasi bervariasi berdasarkan sistem operasi tetapi mudah; Oleh karena itu, hal ini tidak dijelaskan
secara rinci. Untuk tutorial ini, saya menggunakan versi 2.3.21 untuk Windows.
Machine Translated by Google

Psikologi 2023, 5 391

Langkah selanjutnya adalah menginstal modul bmtest. Secara umum, ada dua cara untuk
menginstal modul jamovi: menginstal dari toko jamovi atau menginstal secara manual dari file .jmo.
Pada saat penulisan, modul bmtest hanya dapat diinstal secara manual. File .jmo terbaru
dapat diperoleh dari https://github.com/karchjd/bmtest/releases/. Untuk tulisan ini, saya
menggunakan versi 0.1.0, yang merupakan versi terbaru pada saat penulisan. Perhatikan
bahwa file jmo yang sesuai untuk sistem operasi yang digunakan harus diunduh.
Modul dapat diinstal dengan mengklik “+ Modules”, “Jamovi Library”, “Sideload”, dan
kemudian panah yang menghadap ke atas (lihat Gambar 1). Ini akan membuka jendela
pengelola file di mana file .jmo yang diunduh harus dibuka, yang akan menginstal modul.
Jika Anda membaca ini nanti, versi terbaru modul bmtest juga akan tersedia di toko jamovi
dan dapat diinstal langsung dari toko.

Gambar 1. Memasang Modul bmtest.

3.2.
Penggunaan Langkah pertama adalah membuka dataset. Seperti disebutkan di bagian
sebelumnya, kumpulan data contoh narkoba fiktif berisi data dari dua kelompok clubbers: 30
orang diberi tablet ekstasi untuk diminum pada Sabtu malam, dan 30 orang mengonsumsi alkohol.
Tingkat depresi diukur menggunakan Beck Depression Inventory (BDI) pada hari setelahnya
(Minggu) dan pertengahan minggu (Rabu). Dataset obat dapat diunduh melalui link ini:
https://osf.io/download/nug79/ (diakses pada 15 Maret 2023). Langkah pertama adalah
membuka dataset. Karena proses ini mudah, maka tidak akan dijelaskan.
Untuk mengakses tes BM, klik menu “BM Test” dan pilih “Brunner-Munzel Test”.
Ini membuka menu tes BM (lihat Gambar 2). Langkah pertama adalah memilih “Variabel
Dependen ” dan “Variabel Pengelompokan”. Variabel “Sunday_BDI” dan “Wednesday_BDI”
berisi frekuensi perasaan depresi yang dilaporkan dan dengan demikian dipilih sebagai
variabel dependen. Perhatikan bahwa beberapa variabel terikat dapat ditentukan, dan uji BM
dilakukan untuk setiap variabel terikat secara terpisah. Variabel “Obat” adalah variabel
pengelompokan dan karenanya dipilih demikian. Pemilihan variabel dilakukan dengan cara
yang sama seperti di jamovi dan pada dasarnya sama seperti di SPSS.
Machine Translated by Google

Psikologi 2023, 5 392

Gambar 2. Menu Utama bmtest.

Setelah variabel terikat dan pengelompokan dipilih, hasilnya secara otomatis


dihitung dan ditampilkan. Secara default, hanya versi tes asimtotik yang tersedia
dihitung, karena ini adalah yang tercepat. Dua versi lainnya dapat diminta dengan mengaktifkan
kotak centang masing-masing di bagian menu “Versi Uji”. Untuk versi permutasi acak,
jumlah permutasi dapat dipilih dan, secara default, diatur ke
nilai yang direkomendasikan 10.000. Ada juga batas waktu yang dapat diubah, seperti halnya kumpulan data besar,
tes permutasi acak mungkin memakan waktu terlalu lama. Perhitungan akan dihentikan, dan tidak
hasilnya akan ditampilkan setelah batas waktu ini berlalu. Biasanya, dibutuhkan waktu lebih lama untuk itu
program berhenti dari batas waktu yang ditentukan karena kode R yang mendasarinya harus mencapai a
menyatakan di mana ia dapat mengganggu komputasi.
Versi permutasi lengkap hanya dihitung jika layak secara komputasi (saat ini ,
jika jumlah permutasi tidak melebihi 40.116.600, yang mana untuk kelompok yang setara
Machine Translated by Google

Psikologi 2023, 5 393

ukuran berjumlah n1, n2 ÿ 14). Jika tidak, masing-masing baris dalam tabel hasil dibiarkan kosong,
dan pesan kesalahan ditampilkan (lihat Gambar 3).

Tes Brunner-Munzel
Tes Brunner-Munzel

Keyakinan 95%.
Selang

Pÿ(Ecs < Alc) + ½Pÿ(Ecs =


Statistik df P Lebih rendah Atas
Alc)

Minggu_BDI Tanpa gejala -0,111 54.4 0,912 0,492 0,341 0,643

Acak
-0,111 0,904 0,492 0,337 0,643
Permutasi

Permutasi Penuh Tidak ada ÿ

Rabu_BDI Asimptotik -4.068 42,7 < 0,001 0,238 0,109 0,368

Acak
-4.068 < .001 0,238 0,111 0,370
Permutasi

Permutasi Penuh Tidak ada ÿ

Catatan. Hÿ Pÿ(Ecs < Alc) + ½Pÿ(Ecs = Alc) ÿ ½

ÿ Jumlah permutasi yang diperlukan terlalu besar untuk dapat dihitung secara layak. Gunakan salah satu dari dua opsi lainnya.

Gambar 3. Tabel Hasil.

Di bagian menu “Hipotesis”, pengguna dapat menentukan apakah satu sisi atau dua sisi
tes harus dilakukan. Hal ini hanya mempengaruhi nilai p yang diperoleh. Kepercayaan diri
interval yang dilaporkan selalu dua sisi. Hal ini harus dipertimbangkan secara krusial ketika
menafsirkan interval kepercayaan. Pilihan ini dibuat agar konsisten dengan sebagian besar tes BM
Paket R, yang juga selalu melaporkan interval kepercayaan dua sisi.
Bagian “Nilai yang Hilang” memungkinkan penentuan bagaimana nilai yang hilang harus ditangani.
Saat memilih “Kecualikan analisis kasus dengan analisis”, nilai yang hilang akan dikecualikan secara terpisah
untuk setiap variabel terikat. Jika tidak, setiap baris memiliki salah satu variabel yang terlibat
hilang (semua variabel terikat dan variabel pengelompokan) dihapus. saya merekomendasi
memilih “Kecualikan analisis kasus dengan analisis” sebagai opsi default, yang juga merupakan pilihan utama
setingan awal.
Mengaktifkan kotak centang untuk efek relatif dan interval kepercayaan akan menambahkan
sampel efek relatif pˆ, serta interval kepercayaan untuk efek relatif sebenarnya p terhadap
hasil. Tingkat kepercayaan yang diinginkan juga dapat ditentukan. Untuk versi permutasi penuh,
interval kepercayaan tidak ditampilkan karena saat ini tidak didukung.

3.3. Menafsirkan dan Melaporkan Hasil


Hasilnya ditampilkan dalam tabel dinamis di sebelah kanan menu, seperti defaultnya
di jamovi (lihat Gambar 3). Tabel ini diperbarui secara otomatis seiring perubahan pengaturan.
Dua kolom pertama yang tidak disebutkan namanya berisi informasi tentang variabel terikat dan
versi pengujian, dengan hasil untuk setiap kombinasi variabel terikat dan pengujian
versi ditampilkan dalam satu baris. Kolom “Statistik” berisi statistik uji BM dan is
jadi sama untuk semua versi pengujian. Kolom “df” berisi derajat kebebasan
versi asimtotik dan karenanya kosong untuk versi permutasi. Kolom “p”.
berisi nilai p. Kolom berikutnya berisi perkiraan efek relatif pˆ dan dengan demikian
sama untuk semua versi. Nama kolom memberi tahu pembaca kelompok mana yang diperlakukan
sebagai kelompok pertama (X1). Contohnya adalah kelompok Ekstasi. Interval kepercayaan
kolom berisi interval kepercayaan yang sesuai.
Hasilnya dapat diinterpretasikan dan dilaporkan sebagai berikut. Pertama, untuk sehari setelah substansi
konsumsi (Minggu_BDI), hipotesis nol perbandingan stokastik tidak mungkin ada
ditolak karena p-value lebih tinggi dari taraf signifikansi 5% dan tingkat kepercayaan 95%.
interval mengandung efek relatif p = 0,5. Mengingat hasil dari, dalam hal ini
kasus, direkomendasikan versi permutasi acak, ini dapat dilaporkan sebagai berikut: The
Machine Translated by Google

Psikologi 2023, 5 394

sehari setelah obat diminum, data tersebut sejalan dengan tingkat depresi pada pengguna ekstasi dan pengguna
alkohol yang sebanding, BM = ÿ0.11, p = 0.904. Membagi hubungan secara merata, kemungkinan bahwa
pengguna ekstasi secara acak memiliki tingkat depresi yang lebih rendah dibandingkan pengguna alkohol
secara acak adalah pˆ = 0.49, 95% CI [0.34, 0.64].
Hasil Rabu (Rabu_BDI) menunjukkan bahwa kelompok ekstasi cenderung memiliki nilai yang lebih tinggi;
Artinya, konsumen ekstasi cenderung merasa lebih tertekan dibandingkan peminum alkohol. Hal ini dapat
dilaporkan sebagai berikut: Pada hari Rabu, pengguna ekstasi cenderung merasa lebih tertekan dibandingkan
pengguna alkohol, BM = ÿ4.07, p < 0.001. Membagi hubungan secara merata, kemungkinan bahwa pengguna
ekstasi secara acak memiliki tingkat depresi yang lebih rendah dibandingkan pengguna alkohol secara acak
adalah pˆ = 0.24, 95% CI [0.11, 0.37].

4. Paket bmtest R
Pada saat penulisan, paket tersebut belum tersedia melalui CRAN. Kode berikut menginstal
paket:

jarak jauh::install_github("karchjd/bmtest")

Paket ini hanya berisi fungsi bmtest . Argumen fungsi tersebut sesuai dengan opsi pada
menu pengujian BM yang baru saja dibahas. Analisis yang dilakukan pada bagian sebelumnya
dapat dilakukan sebagai berikut:

perpustakaan(bmtest)
obat_data <- haven::read_sav("Obat.sav")
obat_data$Obat <- forcats::as_factor(drug_data$Obat) bmtest(data
= data_obat, vars = c("Minggu_BDI", "Rabu_BDI") ,
group = "Obat", asym = BENAR, randomPerm = BENAR, fullPerm = BENAR,
miss = "perAnalysis", relEff = BENAR, ci = BENAR, ciWidth = 95)

Ini mengembalikan tabel yang ditunjukkan pada Gambar 3 sebagai output. File bantuan (?bmtest)
memberikan panduan lebih rinci.

5. Catatan Penutup
Makalah ini menyajikan modul jamovi dan paket R bmtest, yang mengimplementasikan
semua versi pengujian Brunner–Munzel (BM). Tes BM mengatasi kelemahan tes Wilcoxon
– Mann – Whitney (WMW) dengan cara yang mirip dengan bagaimana uji-t Welch
meningkatkan uji-t Student . Paket bmtest jamovi membuat tes BM tersedia dalam
perangkat lunak statistik berbasis GUI yang mudah digunakan, sehingga membuatnya
dapat diakses oleh banyak peneliti.

Pendanaan: Penelitian ini tidak menerima pendanaan eksternal.

Pernyataan Ketersediaan Data: Data yang disajikan dalam penelitian ini tersedia secara terbuka di https://osf. io/nug79/.

Konflik Kepentingan: Penulis menyatakan tidak ada konflik kepentingan.

Referensi
1. Schlag, KH Siapa yang memberikan arahan terhadap pengujian statistik? Praktik terbaik memenuhi tes yang benar secara matematis. Elektron SSRN. J.2015 .
[Referensi Silang]

2. Karch, JD Psikolog harus menggunakan tes Brunner-Munzel daripada tes U Mann-Whitney sebagai prosedur nonparametrik default.
Adv. Metode Praktek. Psikologi. Sains. 2021, 4. [Referensi Silang]
3. Ilahi, GW; Norton, HJ; Baron, AE; Juarez-Colunga, E. Prosedur Wilcoxon-Mann-Whitney gagal sebagai ujian median.
Saya. Statistik. 2018, 72, 278–286. [Referensi Silang]
4. Howell, DC Metode Statistik untuk Psikologi; Pembelajaran Cengage: Boston, MA, AS, 2012. 5.
Fay, anggota parlemen; Proschan, MA Wilcoxon-Mann-Whitney atau uji-t? Tentang asumsi untuk uji hipotesis dan berbagai interpretasi aturan keputusan. Statistik. Bertahan.
2010, 4, 1–39. [Referensi Silang] [PubMed]
Machine Translated by Google

Psikologi 2023, 5 395

6. Brunner, E.; Mandi, AC; Konietschke, F. Prosedur Rank dan Pseudo-Rank untuk Observasi Independen dalam Desain Faktorial: Menggunakan R
dan SAS; Penerbitan Internasional Springer: Berlin/Heidelberg, Jerman, 2019. [CrossRef]
7. Wilcox, RR Statistik Modern untuk Ilmu Sosial dan Perilaku; CRC Press: Boca Raton, FL, AS, 2017. 8.
Delacre, M.; Lakens, D.; Leys, C. Mengapa psikolog secara default harus menggunakan uji-t Welch daripada uji-t Student. Int. Pdt. Soc.
Psikologi. 2017, 30, 92. [Referensi Silang]
9. Noguchi, K.; Konietschke, F.; Marmolejo-Ramos, F.; Pauly, M. Uji permutasi kuat dan kuat pada tingkat signifikansi 0,5% dan 5%. Berperilaku. Res. Metode 2021, 53,
2712–2724. [Referensi Silang] [PubMed]
10. Gastwirth, JL; Gel, YR; Hui, WLW; Lyubchich, V.; Miao, W.; Noguchi, K. Lawstat: Alat Biostatistik, Kebijakan Publik, dan Hukum.
2022. Tersedia online: https://CRAN.R-project.org/package=lawstat (diakses pada 15 Maret 2023)
11. Ara, T. Brunnermunzel: (Dipermutasi) Tes Brunner-Munzel. 2022. Tersedia online: https://CRAN.R-project.org/package=
brunermunzel (diakses pada 15 Maret 2023)
12. Konietschke, F.; Placzek, M.; Schaarschmidt, F.; Hothorn, LA nparcomp: Paket perangkat lunak R untuk kelipatan nonparametrik
perbandingan dan interval kepercayaan simultan. J.Stat. perangkat lunak. 2015, 64, 1–17. [Referensi Silang]
13. Proyek Jamovi. Jamovi [Perangkat Lunak Komputer]; Versi 2.3; 2022. Tersedia daring: https://www.jamovi.org (diakses pada 15
Maret 2023)
14. Field, A. Menemukan Statistik Menggunakan IBM SPSS Statistics, edisi ke-5; Sage: London, Inggris, 2017.
15. Brunner, E.; Munzel, U. Masalah Behrens-Fisher nonparametrik: Teori asimtotik dan perkiraan sampel kecil. Biom.
J.2000 , 42, 17–25. [Referensi Silang]
16. Uji Hipotesis Baik, P. Permutasi, Parametrik dan Bootstrap, edisi ke-3; Springer: New York, NY, AS, 2005.
17. Neubert, K.; Brunner, E. Tes permutasi yang dipelajari untuk masalah Behrens-Fisher non-parametrik. Hitung. Statistik. Data Anal.
2007, 51, 5192–5204. [Referensi Silang]
18. Pauly, M.; Asendorf, T.; Konietschke, F. Inferensi berbasis permutasi untuk AUC: Pendekatan terpadu untuk data berkelanjutan dan terputus-putus. Biom. J.2016 , 58,
1319–1337. [Referensi Silang]

Penafian/Catatan Penerbit: Pernyataan, opini, dan data yang terkandung dalam semua publikasi adalah sepenuhnya milik masing-masing penulis dan kontributor dan
bukan milik MDPI dan/atau editor. MDPI dan/atau editor melepaskan tanggung jawab atas kerugian apa pun pada orang atau properti akibat ide, metode, instruksi, atau
produk apa pun yang dirujuk dalam konten.

Anda mungkin juga menyukai