Anda di halaman 1dari 105

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | i

JURUS PRAKTIS STATISTIK DASAR


DAN PENGGUNAAN R COMMANDER

Taufan Bramantoro
Abdi Marang Gusti Alhaq
Nur Azmi Prasetyo

PENERBIT CV. PENA PERSADA

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | i


JURUS PRAKTIS STATISTIK DASAR
DAN PENGGUNAAN R COMMANDER

Penulis:
Taufan Bramantoro
Abdi Marang Gusti Alhaq
Nur Azmi Prasetyo

ISBN:

Editor:
Saiful Anwar, S.Pd., S.E., M.Pd

Desain Sampul:
Agung Riqzi Wahyudi

Tata Letak :
Aan Saeful Islam

Penerbit CV. Pena Persada


Redaksi :
Jl. Gerilya No. 292 Purwokerto Selatan, Kab. Banyumas
Jawa Tengah
Email : penerbit.penapersada@gmail.com
Website : penapersada.com
Phone : (0281) 7771388

Anggota IKAPI
All right reserved

Cetakan pertama : 2020

Hak cipta dilindungi oleh undang-undang.


Dilarang memperbanyak karya tulis ini dalam bentuk dan cara apapaun
tanpa ijin penerbit

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | ii


KATA PENGANTAR

Alhamdulillahirobbil'aalamin, tiada rahmat dan petunjuk


melainkan dari Allah Azza wa Jalla yang telah menganugerahi
nikmat tidak ternilai. Shalawat dan salam senantiasa tercurahkan
kepada Rasulullah shallallahu ‘alaihi wa sallam beserta keluarga, para
sahabat dan para pengikutnya.
Buku ini hadir dengan harapan besar untuk dapat menjadi
pengantar dasar seseorang yang ingin mengenal statistik dan
penggunaan software statistik yang open source. Bila kemudian
pembaca telah mampu memahami konsep statistik dasar, maka
penulis menyarankan untuk dapat melanjutkan pada fase
pembelajaran berikutnya melalui buku yang membahas statistik
lebih mendalam.
Kesempurnaan hanya milik Allah Azza wa Jalla, sehingga
penulis menyadari bahwa masih banyak kekurangan dalam
penulisan karya buku ini. Masukan dan diskusi membangun
menjadi suatu solusi untuk terus memacu penulis untuk
memberikan yang terbaik.
Terima kasih sedalam-dalamnya kami sampaikan dan
semoga secercah ilmu ini dapat menjadi manfaat bagi pembaca.

Penulis

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | iii


DAFTAR ISI

KATA PENGANTAR iii

DAFTAR ISI iv

MANAJEMEN DATA 1
1. Apa yang dimaksud dengan data? 2

2. Apa yang dimaksud dengan data primer dan data sekunder? 2

3. Apa yang dimaksud dengan data lisan dan data tertulis? 2


4. Apa yang dimaksud dengan data kualitatif dan data
kuantitatif? 3
5. Apa yang dimaksud dengan data nominal ?
Apa saja contoh data nominal? 3
6. Apa yang dimaksud dengan data ordinal?
Apa saja contoh data ordinal? 3
7. Apa yang dimaksud dengan data interval?
Apa saja contoh data interval? 4
8. Apa yang dimaksud dengan data rasio?
Apa saja contoh data rasio? 4
9. Apakah data yang telah didapatkan dari hasil proses
pengambilan data dapat langsung diproses
untuk uji statistik? 4

10. Apa yang dimaksud dengan manajemen data? 5

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | iv


11. Apa saja proses yang perlu diperhatikan terkait
dengan proses persiapan data? 5

12. Apa tujuan dari editing data? 5

13. Apa saja yang harus diperhatikan dalam proses editing? 5

14. Apa yang dimaksud dengan coding atau pengkodean? 7

15. Apa yang perlu diperhatikan terkait dengan proses coding? 8

16. Apa yang dimaksud dengan data entry? 8


17. Apa saja macam program komputer yang dapat digunakan
untuk melakukan data entry? 8
18.Apa yang harus diperhatikan
sebelum melakukan data entry? 9
19. Apa yang dimaksud dengan
pembersihan data (cleaning)? 10

20. Apa yang dimaksud dengan transformasi data? 10

21. Apa saja yang meliputi proses transformasi data? 10

ANALISIS DATA DESKRIPTIF 11


1. Setelah melalui proses persiapan data,
apa tahapan yang perlu dilakukan setelahnya? 12

2. Apa saja bentuk dari analisis deskriptif? 13

3. Apa yang dimaksud dengan frekuensi? 13

4. Apa yang dimaksud dengan nilai rata-rata? 13

5. Apa yang dimaksud dengan nilai standar deviasi? 13

6. Apa yang dimaksud dengan nilai median dan modus? 14

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | v


7. Pada analisis deskriptif juga didapatkan istilah tabulasi silang,
apa yang dimaksud dengan tabulasi silang? 15
8. Bagaimana langkah teknis memulai proses
tahapan awal pengolahan data? 15

ANALISIS DATA INFERENSIAL

(UJI STATISTIK) 19
1. Apa yang dimaksud dengan uji statistik
dan apa syarat dapat dilakukan uji statistik? 20
2. Apa hal yang perlu diperhatikan
ketika melakukan uji statistik? 20
3. Apa saja hal yang perlu diketahui saat memilih
jenis uji statistik yang akan digunakan? 21

4. Apa yang dimaksud dengan uji Chi square? 21


5. Apa syarat dan kondisi suatu data dapat
dilakukan uji Chi square? 22
6. Apa yang perlu dilakukan bila data
tidak memenuhi prasyarat uji Chi square? 23
7. Apa yang dimaksud dengan uji statistik
parametrik dan uji statistik non parametrik? 23
8. Apa yang perlu diperhatikan terlebih dahulu saat ingin
melakukan uji statistik parametrik? 24

9. Apa yang dimaksud dengan distribusi normal? 24

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | vi


10. Apa jenis data yang memerlukan uji distribusi normal
sebelum dilakukan uji statistik? 24
11. Mengapa jenis data interval dan rasio perlu dilakukan uji
distribusi normal terlebih dahulu? 25

12. Apa yang dimaksud dengan independent samples t-test? 25


13. Apa perbedaan independent samples t-test
dengan paired-samples t-test? 26
14. Apa syarat dan kondisi yang harus dipenuhi oleh suatu data
untuk pengujian independent samples t-test? 27
15. Apa syarat dan kondisi suatu data agar
paired-samples t-test dapat dilakukan? 28
16. Apa alternatif uji statistik independent t-test dan Paired t-test
pada kondisi data tidak terdistibusi normal? 28

17. Apa yang dimaksud dengan uji One-way Anova? 28


18. Apa perbedaan uji antara One-way Anova
dan independent samplet-test? 29
19. Apa syarat yang harus dipenuhi agar
uji One-way Anova dapat dilakukan? 29
20. Pada uji One-way Anova terdapat uji Post hoc,
apa makna dan kapan uji tersebut dilakukan? 29
21. Apa yang dilakukan ketika data yang akan diuji One-way
Anova ternyata tidak memenuhi syarat uji homogenitas? 30
22. Apa yang dimaksud dengan uji korelasi?
Ada berapa jenis uji korelasi? 31

23. Apa perbedaan uji korelasi dengan uji komparasi? 32


24. Apa yang dimaksud uji regresi?
Dan ada berapa jenis regresi? 32

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | vii


25. Apa perbedaan uji regresi dengan uji korelasi? 34

PENGGUNAAN R COMMANDER

35
1. Apa untungnya pakai R Commander? 35

2. Apa itu software R? 36

3. Apa untungnya pakai aplikasi R? 36

4. Apa bedanya R, R Studio dengan R Commander? 37

5. Instalasi R Commander 38

6. Persiapan Data 45

7. Analisis data deskriptif 52

8. Analisis inferensial 59

9. Visualisasi Praktis Menggunakan R Commander 88

DAFTAR PUSTAKA 94
PROFIL PENULIS 103

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | viii


MANAJEMEN DATA

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 1


1. Apa yang dimaksud dengan data?
Data menurut Kamus Besar Bahasa Indonesia di laman
kbbi.kemdikbud.go.id dijelaskan dalam 3 makna, yaitu:
a) Keterangan yang benar dan nyata
b) Keterangan atau bahan nyata yang dapat dijadikan
dasar kajian (analisis atau kesimpulan)
c) Informasi dalam bentuk yang dapat diproses oleh
komputer, seperti representasi digital dari teks, angka,
gambar grafis, atau suara
Terdapat beberapa klasifikasi makna dari data, diantaranya
adalah sebagai berikut:
Data primer dan data sekunder
Data lisan dan data tertulis
Data kualitatif dan data kuantitatif

2. Apa yang dimaksud dengan data primer dan data


sekunder?
Data primer adalah data yang didapatkan oleh peneliti secara
langsung dari objek yang diteliti. Sedangkan data sekunder
adalah data yang didapatkan peneliti secara tidak langsung
dari objek penelitian atau melalui sumber lain, secara lisan
ataupun tertulis. Contoh dari data sekunder dapat berupa
data dari laporan kinerja, data yang dipublikasikan oleh
lembaga survey, dan data sejenis lainnya.

3. Apa yang dimaksud dengan data lisan dan data tertulis?


Data lisan didapatkan langsung dari pemberi informasi,
sedangkan data tertulis didapatkan dari bahan tertulis.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 2


4. Apa yang dimaksud dengan data kualitatif dan data
kuantitatif?
Secara sederhana, data kualitatif dapat dijelaskan sebagai
data yang bentuk aslinya tidak berupa angka, sedangkan
data kuantitatif merupakan data yang berbentuk angka.
Data kualitatif terbagi menjadi data nominal dan data
ordinal. Sedangkan data kuantitatif terbagi menjadi data
interval dan data rasio.

5. Apa yang dimaksud dengan data nominal ? Apa saja


contoh data nominal?
Data nominal merupakan data kualitatif yang terbagi
menjadi beberapa kategori tanpa ada perbedaan tingkatan
ataupun hubungan antar kategori.
Contoh:
o Jenis kelamin terdiri dari dua kategori yaitu pria dan
wanita. Biasanya tiap kategori akan diberikan label atau
simbol, misalnya label angka 1 untuk pria dan label angka
2 untuk wanita.
o Jenis alat transportasi terdiri dari transportasi umum dan
transportasi pribadi.

6. Apa yang dimaksud dengan data ordinal? Apa saja contoh


data ordinal?
Data ordinal merupakan data kualitatif yang terbagi menjadi
beberapa kategori dan ada perbedaan tingkatan ataupun
hubungan antar kategori.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 3


Contoh: Tingkat pendidikan yang terdiri dari beberapa level
yaitu TK, SD, SMP, SMA, Sarjana. Contoh tingkat Pendidikan
tertinggi adalah “Perguruan tinggi” dan terendah adalah
“TK” (TK, SD, SMP, SMA, Perguruan tinggi).

7. Apa yang dimaksud dengan data interval?


Apa saja contoh data interval?
Data interval adalah data kuantitatif yang memiliki rentang
dari nilai paling kecil hingga paling besar dan tidak
mempunyai nilai nol yang mutlak.
Contoh: nilai ujian yang terdiri dari deretan angka 0 hingga
100.

8. Apa yang dimaksud dengan data rasio?


Apa saja contoh data rasio?
Data rasio merupakan data kuantitatif, memiliki nilai nol
yang mutlak dan tidak berentang.
Contoh: berat badan yang terdiri dari deretan angka dari nilai
1 hingga tak terhingga dan tentunya tidak ada berat badan
dengan nilai 0 kilogram.

9. Apakah data yang telah didapatkan dari hasil proses


pengambilan data dapat langsung diproses untuk uji
statistik?
Tidak, data yang telah terkumpul tersebut terlebih dahulu
perlu dilakukan proses persiapan data yang termasuk dalam
tahapan manajemen data.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 4


10. Apa yang dimaksud dengan manajemen data?
Manajemen data merupakan suatu proses yang dimulai dari
persiapan, kemudian berlanjut pada implementasi
pengolahan, dan evaluasi hasil pengolahan data.
Manajemen data merupakan suatu rangkaian kegiatan yang
sudah dimulai sejak data dikumpulkan di lapangan baik di
klinik maupun masyarakat.

11. Apa saja proses yang perlu diperhatikan terkait dengan


proses persiapan data?
Editing data, coding, data entry, cleaning, dan transformasi data

12. Apa tujuan dari editing data?


Kegiatan editing sangat perlu dilakukan untuk menjaga
kualitas data yang dimiliki. Tujuan utama dari dilakukannya
kegiatan editing ini adalah untuk meneliti dan memeriksa
kembali apakah pengisian pada instrumen pencatatan data
atau lembar pengumpul data (kuesioner, dan lain-lain) sudah
tercatat dengan baik.

13. Apa saja yang harus diperhatikan dalam proses editing?


Beberapa hal penting yang harus dijadikan perhatian dalam
proses editing adalah:
a. Antisipasi kesalahan pengisian/pengumpulan data.
Melakukan pemeriksaan data langsung ditempat
pengumpulan data untuk mengantisipasi terjadinya
kekeliruan atau kesalahan dalam pengumpulan data.
Langkah ini akan sangat efektif karena bila terdapat

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 5


kesalahan maka upaya pembetulan data, seperti
melaksanakan wawancara ulang atau pengukuran ulang
dapat dilakukan secepatnya;
b. Kelengkapan jawaban atau pencatatan data.
Langkah ini dilakukan untuk memastikan bahwa tidak
ada informasi yang missed saat proses pengumpulan data.
Setiap jawaban dari pertanyaan harus diteliti dan dicek
satu persatu untuk memastikan bahwa tidak ada
pertanyaan bersyarat yang tidak terisi. (Misalnya
pertanyaan "Pada umur berapa saudara pertama kali
merokok?") hanya ditanyakan pada responden yang
pernah merokok dalam masa hidupnya, bila jawaban
untuk pertanyaan tersebut kosong, perlu dipastikan
apakah memang karena responden tidak merokok,
ataukah responden memang lupa untuk menjawab.
c. Kejelasan tulisan.
Tulisan yang tertera pada lembar pengumpul data harus
dapat dibaca.
d. Konsistensi jawaban dan data.
Jawaban yang tertera harus logis dan konsisten. Contoh
dari jawaban yang tidak konsisten: Seorang ibu menjawab
pernah melahirkan hidup 7 orang anak, kemudian
jawaban ibu tersebut atas pertanyaan "Berapakah umur
ibu saat ini?" adalah 15 tahun.
e. Keseragaman satuan ukuran.
Jawaban yang tertulis dalam lembar pengumpul data
harus menggunakan satuan ukuran yang sama.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 6


14. Apa yang dimaksud dengan coding atau pengkodean?
Coding (pengkodean) adalah upaya pengelompokan atau
pengklasifikasian jawaban berdasarkan kriteria tertentu.
Pada proses pengelompokan ini secara umum dilakukan
dengan cara memberikan kode atau label tertentu pada
jawaban. Biasanya kode dapat berupa angka atau kata kunci
tertentu.
Sebagai contoh: data jenis kelamin yang terdiri dari Laki-laki
dan Perempuan. Terdapat 2 kemungkinan kondisi yang
didapatkan dalam proses pengumpulan data, yaitu sebagai
berikut:
o Kondisi 1: Bila dalam proses pengumpulan data, peneliti
memberikan pilihan pengisian kuesioner dalam pilihan
Laki-laki atau Perempuan. Maka proses coding dilakukan
dengan memberi kode angka sebagai representatif pilihan
Laki-laki (kode angka: 1) atau Perempuan (kode angka: 2).
o Kondisi 2: Bila dalam kuesioner tertera secara langsung
kode angka jenis kelamin, 1= Laki-laki dan 2 =
Perempuan, maka proses yang perlu dilakukan adalah
memberi label dari kode angka tersebut, sehingga
meminimalisir kekeliruan dalam pemaknaan kode angka
atau pemberian label yang terbalik.
Catatan:
Proses coding, khususnya pada data kuantitatif, dilakukan
sesuai dengan kebutuhan analisis data sesuai dengan tujuan
penelitian serta definisi operasional variabel penelitian.
Sebagai contoh untuk data berat badan, maka bila kebutuhan
peneliti akan menganalisis menggunakan data berat badan

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 7


dalam bentuk skala data rasio, data berat badan tersebut
tidak diperlukan untuk proses coding. Tetapi bila kebutuhan
peneliti akan menganalisis data berat badan yang terbagi 3
kategori, kurus-normal-obesitas, maka diperlukan proses
coding dari data berat badan.

15. Apa yang perlu diperhatikan terkait dengan proses coding?


Peneliti perlu untuk membuat catatan khusus atau disebut
juga sebagai code-book, yaitu suatu catatan yang berisi seluruh
daftar variabel yang diteliti beserta keterangan bentuk skala
data dari masing-masing variabel dan bila terdapat
kategorisasi kode, maka dituliskan label atau nama dari kode
tersebut.
Code-book tersebut akan sangat bermanfaat untuk menjadi
pedoman peneliti serta meminimalisir risiko kesalahan
dalam proses pemasukan data (data entry).

16. Apa yang dimaksud dengan data entry?


Data entry (pemasukan data) adalah proses yang dilakukan
untuk record (merekam) seluruh data kedalam suatu format
data yang sama. Proses ini secara umum bisa dilakukan
secara manual ataupun memanfaatkan penggunaan
komputer.

17. Apa saja macam program komputer yang dapat digunakan


untuk melakukan data entry?
Terdapat banyak program komputer yang bisa dipakai untuk
melakukan data entry misalnya word processor (Microsoft Word,

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 8


dll), spreadsheet (Microsoft Excel, dll), data base management
(Microsoft Access, dll), atau paket program statistik (R, SPSS,
SAS, STATA, dll).
Untuk program komputer yang bukan termasuk dalam
program statistik, maka akan diperlukan proses untuk
konversi atau memindahkan data pada program statistik
untuk proses analisis data lebih lanjut.

18. Apa yang harus diperhatikan sebelum melakukan data


entry?
Sebelum data dimasukkan terlebih dahulu harus ditentukan
struktur anatomi data yang akan digunakan untuk proses
input data. Struktur data secara umum terbentuk dari
pemberian nama kolom tabel data.
Sebagai contoh struktur data yang terdiri dari nomor urut
responden, jenis kelamin, usia, tinggi badan, dan berat badan.
Maka di dalam struktur data pada nama kolom tabel data
tertulis berurutan nomor (kolom 1), jenis kelamin (kolom 2),
usia (kolom 3), tinggi badan (kolom 4), berat badan (kolom 5).
Struktur data disesuaikan dengan kebutuhan analisis data
yang akan dilakukan.
Catatan:
Untuk penggunaan data komposit (penghitungan skor dari
beberapa pertanyaan yang terhimpun dalam 1 set
pertanyaan), maka sebaiknya proses input data dilakukan
dengan memasukkan tidak hanya nilai penghitungan
skornya, tetapi juga seluruh jawaban item pertanyaan.
Sebagai ilustrasi, bila peneliti mengukur tingkat pengetahuan

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 9


yang didapatkan dari penjumlahan skor jawaban dari 5
pertanyaan (pertanyaan pengetahuan 1 – 5), maka di dalam
struktur data dituliskan juga kolom input data untuk masing-
masing pertanyaan kemudian kolom data untuk nilai
penjumlahan skornya (bila Pengetahuan = P; maka terdapat
kolom data P1, P2, P3, P4, P5, dan skor pengetahuan).

19. Apa yang dimaksud dengan pembersihan data (cleaning)?


Pembersihan data adalah proses untuk mencermati dan
melakukan cek kebenaran data yang telah dimasukkan.
Proses ini wajib dilakukan sebelum dimulainya proses
analisis data. Karena data yang tidak bersih tentunya akan
sangat riskan untuk memberikan hasil analisis yang keliru.

20. Apa yang dimaksud dengan transformasi data?


Transformasi data adalah prosedur yang dilakukan untuk
tujuan meng-konversi data dengan mengikuti kaidah ilmiah
yang berlaku.

21. Apa saja yang meliputi proses transformasi data?


Proses transformasi bisa berupa upaya mengubah data
dengan cara melakukan pengelompokan ulang kategori
dalam variabel, pembuatan variabel baru dengan langkah
perhitungan matematik, pemilihan kasus operasi logika
konversi data, serta dapat pula dilakukan dengan
penggabungan dan pemisahan data.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 10


ANALISIS DATA DESKRIPTIF

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 11


1. Setelah melalui proses persiapan data, apa tahapan yang
perlu dilakukan setelahnya?
Memulai proses pengolahan data dengan melakukan analisis
data secara deskriptif terlebih dahulu.
Analisis data secara deskriptif terkadang disepelekan dan dianggap
tidak terlalu penting. Terdapat beberapa peneliti yang langsung
fokus pada proses uji statistik untuk membuktikan hipotesis
penelitian.
Hal tersebut tentunya kurang tepat, dikarenakan analisis deskriptif
merupakan pondasi penting untuk mencermati dan menganalisis
bagaimana gambaran pola serta distibusi data yang peneliti telah
dapatkan.
Mengetahui gambaran pola serta distribusi data akan
menjadi faktor penentu terhadap apa kondisi yang akan
diproses dalam uji statistik.
Sebagai contoh: bila dalam suatu penelitian terdapat tujuan
untuk membandingkan daya bunuh bakteri antara ekstrak
herbal A dengan obat B. Maka sebelum peneliti
membuktikan signifkansi perbedaan jumlah bakteri mati
antara kedua kelompok tersebut melalui uji statistik, peneliti
perlu untuk mendapatkan gambaran terlebih dahulu
mengenai bagaimana pola nilai rata-rata jumlah bakteri yang
mati pada masing-masing kelompok. Apakah kelompok A
lebih banyak bakteri yang mati, atau sebaliknya. Perbedaan
nilai yang terjadi tersebut kemudian menjadi landasan
informasi bagi peneliti untuk dibuktikan apakah jarak
perbedaan tersebut cukup kuat atau signifikan digeneralisasi
dalam populasi melalui uji statistik.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 12


2. Apa saja bentuk dari analisis deskriptif?
Terdapat beberapa bentuk luaran yang dapat dihasilkan dari
proses analisis data deskriptif. Diantaranya adalah frekuensi,
nilai rata-rata, standar deviasi, median, modus.

3. Apa yang dimaksud dengan frekuensi?


Frekuensi merupakan angka yang menunjukkan seberapa
sering munculnya suatu data kuantitatif maupun kualitatif.
Sebagai contoh: bila terdapat data jenis kelamin dari 5
responden sebagai berikut; L, P, P, L, L. Maka frekuensi
untuk data tersebut adalah L sejumlah 3 orang (60%) dan P
sejumlah 2 orang (40%).

4. Apa yang dimaksud dengan nilai rata-rata?


Nilai rata-rata merupakan hasil penjumlahan nilai data
dibagi banyaknya data.
Sebagai contoh: bila terdapat data berat badan dari 5
responden sebagai berikut; 70, 75, 80, 90, 75. Maka nilai rata-
rata data berat badan tersebut adalah 390/5 = 78 kg.

5. Apa yang dimaksud dengan nilai standar deviasi?


Nilai standar deviasi (SD) atau nilai simpangan baku
merupakan nilai yang memberikan gambaran tentang
kondisi sebaran sebuah data dalam suatu sampel. Dari nilai
SD tersebut akan dapat diketahui seberapa dekat nilai tiap
data individu dengan nilai rata-rata dari keseluruhan sampel.
Semakin luas variasi nilai dari data yang didapatkan saat
penelitian, maka akan semakin tinggi nilai standar deviasi.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 13


Pada suatu kelompok data, umumnya diharapkan memiliki
variasi data yang tidak terlalu luas dengan nilai standar
deviasi berada di bawah nilai rata-rata. Tetapi tentunya hal
tersebut dikembalikan pada karakter data yang diteliti serta
kebutuhan peneliti terkait dengan tujuan penelitian.
Sebagai contoh: pada beberapa publikasi artikel ilmiah
terdapat cara penulisan standar deviasi yang umumnya
dipasangkan dengan penulisan nilai rata-rata dengen
menggunakan simbol ±. Pada suatu penelitian didapatkan
hasil sebagai berikut; Nilai rata-rata kelompok A sebesar 2,35
± 0,5, dan nilai rata-rata kelompok B sebesar 5,15 ± 2,3. Maka
dapat dilihat bahwa sebaran data pada sampel terhadap nilai
rata-rata pada kelompok A lebih dekat dibandingkan dengan
kelompok B yang memiliki sebaran lebih luas.

6. Apa yang dimaksud dengan nilai median dan modus?


Median merupakan nilai dari data kuantitatif yang ketika
diurutkan dari data terkecil hingga terbesar dan atau dari
data terbesar hingga terkecil, nilai median merupakan nilai
yang berada di tengah data.
Sebagai contoh: bila terdapat data penelitian yang telah
diurutkan sebagai berikut; 2,4,6,6,11,12,12,19,21. Maka nilai
median dari data tersebut adalah 11.
Modus merupakan nilai yang paling banyak pada sebuah
data atau frekuensi yang paling sering muncul dari sebuah
deretan data kuantitatif.
contoh: bila terdapat data penelitian sebagai berikut; 2, 4, 6, 6,
6, 4, 12, 6, 11. Maka nilai modus dari data tersebut adalah 6.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 14


7. Pada analisis deskriptif juga didapatkan istilah tabulasi
silang, apa yang dimaksud dengan tabulasi silang?
Tabulasi silang atau disebut juga cross tab merupakan
penggabungan data dari 2 variabel dengan jenis skala data
kualitatif, yaitu nominal atau ordinal.
Tabulasi silang dilakukan untuk menganalisis potensi
hubungan dari dua variabel data kualitatif.
Sebagai contoh: bila peneliti ingin menganalisis apakah jenis
kelamin merupakan salah satu faktor risiko obesitas. Maka
terdapat 2 variabel data kualitatif, yaitu jenis kelamin yang
terdiri dari Laki-laki dan Perempuan, serta obesitas yang
terdiri dari normal dan obesitas. Informasi yang akan
didapatkan dari tabulasi silang terhadap kedua variabel
tersebut adalah dari sekian jumlah laki-laki yang menjadi
responden, berapa persentase mengalami obesitas, dan
berapa yang normal, serta pertanyaan yang sama juga pada
responden perempuan. Maka pada kesimpulan tabulasi
silang akan didapatkan informasi diantara laki-laki dan
perempuan, jenis kelamin apa yang memilki persentase lebih
tinggi mengalami obesitas. Bila dari seluruh responden Laki-
laki didapatkan 45% mengalami obesitas, dan dari seluruh
responden perempuan didapatkan 30% mengalami obesitas,
maka laki-laki lebih tinggi kecenderungan mengalami
obesitas dibandingkan dengan perempuan.

8. Bagaimana langkah teknis memulai proses tahapan awal


pengolahan data?
a) Setelah mendapat data dari hasil pengumpulan data

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 15


penelitian, maka peneliti perlu membuka dan membaca
kembali tujuan penelitian, yaitu tujuan umum dan tujuan
khusus.
b) Data kemudian dilakukan proses pengecekan apakah
seluruh data yang dibutuhkan untuk menjawab tujuan
penelitian telah didapatkan pada data tersebut.
Sebagai contoh: bila tujuan penelitian adalah menganalisis
hubungan antara usia dengan kepuasan pasien rawat
jalan. Maka dilakukan pengecekan apakah telah
didapatkan data usia serta jawaban responden pada item
pertanyaan kepuasan pasien.
c) Setelah linieritas data dengan tujuan penelitian telah
tervalidasi. Langkah berikutnya memetakan bentuk
format data yang dibutuhkan sesuai dengan definisi
operasional variabel yang telah ditentukan sebelumnya.
Informasi pada definisi operasional akan menjadi
pedoman untuk menentukan bentuk atau format data.
Sebagai contoh: pada tujuan penelitian untuk
menganalisis hubungan antara usia dengan kepuasan
pasien rawat jalan. Maka peneliti perlu membaca kembali
definisi operasional variabel usia dan kepuasan pasien.
Bila variabel usia dalam definisi operasional disebutkan
dalam angka tahun, dan pertanyaan usia di dalam
kuesioner juga ditanyakan dalam angka tahun, maka data
entry berbentuk angka seperti yang terjawab oleh
responden. Tetapi bila di dalam definisi operasional
terjelaskan usia dalam bentuk 2 kategori kelompok, yaitu
kelompok 31-45 tahun dan kelompok di atas 45 tahun,

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 16


maka diperlukan proses transformasi data dari bentuk
kuantitatif (usia dalam angka tahun) menjadi data
kualitatif (usia terbagi 2 kategori) pada kolom data di
samping data usia yang orisinal serta memberi kode
untuk masing-masing kategori (kode 1 = 31-45 tahun;
kode 2 = di atas 45 tahun).
d) Melakukan pengecekan dan pembersihan data yang
kemungkinan terjadi salah pengisian atau tidak terisi atau
tidak terjawab, melalui pembuatan tabel frekuensi untuk
setiap kolom data. Secara umum perlakuan terhadap data
yang salah adalah dilakukan cek ulang dan koreksi
terhadap proses data entry, sedangkan untuk data yang
tidak terisi, salah satu langkah dapat dilakukan proses
pembersihan data dengan menghapus data responden
yang bersangkutan. Secara penerapan, pertimbangan
keputusan terhadap data yang salah ataupun data yang
tidak terisi, dikembalikan pada pertimbangan peneliti
sesuai dengan kebutuhan dan tujuan penelitian.
Sebagai contoh: bila terdapat kolom data sebagai berikut;
usia, P1 (item pertanyaan kepuasan 1), P2 (item
pertanyaan kepuasan 2), P3 (item pertanyaan kepuasan 3),
skor kepuasan (total skor kepuasan). Maka setiap kolom
dilakukan analisis data frekuensi, dan bila terdapat
pengisian data yang salah ataupun tidak terisi, akan
terlihat dari hasil tabel frekuensi sebagai kode angka atau
huruf yang tidak semestinya ada atau juga terlihat sebagai
missing data.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 17


e) Langkah selanjutnya menentukan analisis deskriptif yang
dibutuhkan sesuai dengan bentuk format data yang telah
ditentukan sebelumnya. Diantaranya, pembuatan tabel
frekuensi untuk variabel dengan format data kualitatif
(nominal dan ordinal), dan pembuatan tabel nilai rata-rata
serta standar deviasi untuk variabel dengan format data
kuantitatif (interval dan rasio)
f) Bila diperlukan, maka dapat ditambahkan dengan
membuat tabulasi silang. Kebutuhan untuk membuat
tabulasi silang dipertimbangkan dari kebutuhan
informasi peneliti terhadap potensi keterkaitan antar
variabel.
Sebagai contoh: bila dalam data penelitian didapatkan
data jenis kelamin, tingkat pendidikan (kategori: rendah
dan tinggi), dan tingkat pengetahuan (kategori: rendah
dan tinggi). Maka peneliti dapat membuat tabulasi silang
antara jenis kelamin dengan tingkat pengetahuan, serta
tingkat pendidikan dengan tingkat pengetahuan.
Catatan:
Luaran atau output hasil analisis melalui software statistik
tidak ditampilkan secara langsung pada laporan penelitian
atau karya ilmiah, tetapi diperlukan untuk membuat tabel
baru dengan penyajian angka ataupun informasi yang
dibutuhkan secara jelas dan mudah dipahami. Tabel output
hasil analisis, dari software statistik, bila dibutuhkan, dapat
diletakkan sebagai lampiran pada laporan penelitian.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 18


ANALISIS DATA INFERENSIAL
(UJI STATISTIK)

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 19


1. Apa yang dimaksud dengan uji statistik dan apa syarat
dapat dilakukan uji statistik?
Analisis data penelitian menggunakan uji statistik adalah
saat peneliti melakukan pengamatan pada sampel
(bagian/subset dari populasi) atau saat syarat sampel seperti,
representatif (random) dan reliabel (sample size cukup)
terpenuhi.
Uji statistik juga digunakan saat hasil penelitian ditujukan
untuk generalisasi (mengambil kesimpulan untuk populasi).

2. Apa hal yang perlu diperhatikan ketika melakukan uji


statistik?
Uji statistik yang digunakan harus sesuai dengan tujuan dan
rancangan penelitian. Pemilihan uji statistik yang tidak sesuai
akan menimbulkan penafsiran yang salah.
Dari uji statistik yang dilakukan akan diperoleh dua
kemungkinan hasil uji, yaitu:
a) Hubungan antarvariabel atau perbedaan antarsampel
yang diteliti sangat bermakna (signifikan) pada taraf
signifikansi (level of significance) tertentu, misalnya satu
persen atau lima persen.
b) Hubungan antarvariabel atau perbedaan antarsampel
yang diteliti tidak bermakna.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 20


3. Apa saja hal yang perlu diketahui saat memilih jenis uji
statistik yang akan digunakan?
Beberapa hal yang dipakai sebagai dasar pemilihan uji
statistik adalah sebagai berikut:
a) Banyaknya variabel yang dianalisis.
b) Penentuan variabel yang termasuk variabel bebas dan
terikat beserta jumlah variabel pada variabel bebas dan
terikat.
c) Skala pengukuran/jenis skala data dari variabel-variabel
yang dianalisis.
d) Tujuan penelitian; sebagai contoh: perbandingan,
korelasi, pengaruh
Bila terdapat kelompok sampel, mengetahui sifat kelompok
sampel, yaitu sampel bebas (independent) ataukah
berpasangan (related); serta jumlah kelompok sampel (dua
kelompok ataukah lebih); atau jumlah pengamatan yang
berpasangan (dua pengamatan ataukah lebih).

4. Apa yang dimaksud dengan uji Chi square?


Uji Chi square merupakan salah satu jenis uji statistik yang
digunakan untuk menganalisis perbandingan antar variabel
data nominal.
Sebagai contoh: uji Chi Square dilakukan untuk mengetahui
perbandingan tingkat pengetahuan (kategori: buruk dan
baik) terkait tingkat pendidikan (kategori: rendah dan tinggi).

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 21


5. Apa syarat dan kondisi suatu data dapat dilakukan uji Chi
square?
Syarat dan kondisi suatu data dapat dilakukan uji Chi square
antara lain.
a) Jenis data yang digunakan adalah data nominal.
b) Pada tabulasi silang 2x2 (2 variabel nominal dengan
jumlah kategori masing-masing sejumlah 2 kategori),
terdapat persyaratan bahwa nilai frekuensi harapan
(expected count) pada tiap cell tidak ada yang kurang dari
5.
Sedangkan untuk tabulasi silang yang lebih dari 2x2, terdapat
persyaratan bahwa dari semua cell yang ada, jumlah cell
dengan nilai frekuensi harapan kurang dari 5. Sedangkan
untuk tabulasi silang yang lebih dari 2x2, terdapat
persyaratan expected count yang kurang dari 5 tidak boleh
lebih dari 20%.
Apa itu expected count? Simpelnya adalah batas bawah yang
harus dilampaui oleh suatu data agar hipotesis alternatif
diterima ketika melakukan uji chi-squared. Hipotesis
alternatif diterima = valid atau signifikan. Jika syarat expected
count tidak terpenuhi, maka hipotesis nol lah yang diterima
(tidak berhubungan/tidak signifikan secara statistik
Bagaimana memeroleh nilai expected count? Terdapat rumus baku:

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 22


Rumus di atas hanya berlaku untuk 1 sel. Sehingga perlu
dilakukan pengulangan ke 3 sel lainnya. Contoh pada sel b:
(b+a) x (b + d) / a+b+c+d dan seterusnya untuk sel c dan d.

6. Apa yang perlu dilakukan bila data tidak memenuhi


prasyarat uji Chi square?
Hal yang perlu dilakukan antara lain:
a) Melakukan pengecekan ulang untuk memastikan agar
tidak ada kesalahan atau kekeliruan dalam proses input
data;
b) Mempertimbangkan penentuan kategori dengan metode
berbeda. Terutama untuk tabulasi silang lebih dari 2x2,
maka dapat pula menyusun ulang kategori sehingga
menjadi 2x2 (jumlah pasangan tabel kolom yang terlalu
banyak, menyebabkan tingginya risiko tidak terpenuhi
syarat uji chi-square)
Apabila persyaratan untuk melakukan uji Chi Square tetap
tidak dapat terpenuhi setelah melakukan kedua hal diatas,
maka uji Fisher exact test dengan menggunakan tabulasi silang
2x2 dapat dipilih sebagai alternatif.

7. Apa yang dimaksud dengan uji statistik parametrik dan


uji statistik non parametrik?
Secara sederhana, uji statistik parametrik merupakan jenis uji
statistik pada memenuhi persyaratan memiliki distribusi

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 23


normal. Analisis statistik non parametrik merupakan jenis uji
statistik yang tidak membutuhkan persyaratan distribusi
normal. Uji statistik parametrik dapat dilakukan pada data
interval atau rasio yang memenuhi distribusi normal. Bila
data interval atau rasio tidak memiliki distribusi normal,
maka uji statistik yang dilakukan menggunakan uji non
parametrik. Sedangkan untuk uji statistik yang menganalisis
hubungan ataupun perbedaan yang melibatkan data nominal
atau ordinal, maka digunakan uji non parametrik.

8. Apa yang perlu diperhatikan terlebih dahulu saat ingin


melakukan uji statistik parametrik?
Memastikan bahwa data dari variabel yang ingin dianalisis
merupakan data kuantitatif (interval atau rasio). Kemudian
data tersebut memiliki distribusi normal.

9. Apa yang dimaksud dengan distribusi normal?


Distribusi normal merupakan suatu keadaan dimana
sekumpulan data kuantitatif tersebar merata dan membentuk
seperti kurva bell shaped. Persebaran data yang berada di
bawah nilai tengah atau nilai mean bersifat simetris. Pada
kondisi distribusi normal didapatkan nilai median, mean,
serta modus yang berhimpitan.

10. Apa jenis data yang memerlukan uji distribusi normal


sebelum dilakukan uji statistik?
Data yang memerlukan uji distribusi normal sebelum
dilakukan uji statistik adalah data interval dan rasio.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 24


11. Mengapa jenis data interval dan rasio perlu dilakukan uji
distribusi normal terlebih dahulu?
Uji distribusi normal (sering pula disebut dengan uji
normalitas) perlu dilakukan terhadap data tersebut untuk
mengetahui bagaimana pola distribusi nya, apakah data
tersebut diperoleh dari populasi yang berdistribusi nomal
atau tidak. Hasil pengujian ini selanjutnya akan menjadi
dasar untuk memutuskan jenis uji statistik mana yang paling
tepat untuk diterapkan. Bila dari hasil uji normalitas
diperoleh hasil bahwa data berdistribusi normal, maka uji
statistik parametrik dapat diterapkan untuk proses
selanjutnya. Namun sebaliknya, bila dari hasil pengujian ini
diketahui bahwa data yang dimiliki tidak berdistribusi
normal, maka uji statitik non parametrik akan lebih tepat
untuk diterapkan.

12. Apa yang dimaksud dengan independent samples t-test?


Independent samples t-test (uji t sampel bebas) adalah metode
pengujian yang dilakukan untuk membandingkan dua
kelompok sampel dengan tujuan untuk mengetahui apakah
terdapat perbedaan nilai mean antara dua kelompok sampel
tersebut. Jenis data yang dibandingkan berupa data interval
ataupun rasio. Yang dimaksudkan dua kelompok disini
adalah dua kelompok sampel yang berbeda.
Dua kelompok pada independent t-test adalah dua kelompok
sampel yang berbeda. Sebagai contoh saat peneliti ingin
membandingkan kadar gula darah antara laki-laki yang rajin
berolahraga dengan yang jarang berolahraga. Kata kunci

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 25


independent t-test ada di “dua kelompok yang berbeda”.
Karena jika kelompoknya sama hanya berbeda perlakuan,
maka uji yang dibutuhkan adalah Paired t-test. Lihat
selanjutnya.

13. Apa perbedaan independent samples t-test dengan paired-


samples t-test?
Walaupun secara umum independent samples t-test dan paired-
samples t-test (uji t sampel berpasangan) memiliki kesamaan,
yaitu sama-sama menguji perbedaan rata-rata (mean) dari
sampel yang diteliti, namun pada prinsipnya, terdapat
perbedaan pada kedua pengujian ini. Perbedaan tersebut
terletak pada anggota masing-masing kelompok yang
dilibatkan sebagai sampel. Jika pengujian bertujuan untuk
membandingkan dua kelompok yang memiliki anggota yang
berbeda satu sama lain, maka uji yang digunakan adalah
Independent samples t-test. Sebaliknya, jika pengujian yang
dilakukan untuk membandingkan dua kelompok yang
memiliki anggota yang sama, maka yang digunakan adalah
paired-samples t-test. Pada kedua pengujian ini, data yang
dibandingkan adalah data dengan skala interval ataupun
rasio.
Contoh:
a) Independent samples t-test (Uji t sampel bebas)
Sebagai contoh suatu penelitian yang mengukur
jumlah bakteri yang mati di media laboratorium setelah
pemberian obat herbal dibandingkan dengan obat
standar. Pada contoh tersebut akan didapatkan 2

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 26


kelompok data jumlah bakteri mati yang terbagi atas 2
kelompok yang berbeda, yaitu data jumlah bakteri mati
pada kelompok obat herbal, dan data jumlah bakteri mati
pada kelompok obat standar.
b) Paired samples t-test (Uji t sampel berpasangan)
Sebagai contoh suatu penelitian yang mengukur kadar
gula darah sebelum diberikan suatu terapi A kemudian
hasil pengukuran tersebut dibandingkan dengan kadar
gula darah setelah terapi yang sama. Pada contoh tersebut
akan didapatkan 2 kelompok data kadar gula darah yang
terbagi atas 2 kelompok dari sampel yang sama, yaitu data
kadar gula darah sebelum terapi dan kadar gula darah
setelah terapi.

14. Apa syarat dan kondisi yang harus dipenuhi oleh suatu
data untuk pengujian independent samples t-test?
Berikut adalah syarat dan kondisi yang harus dipenuhi oleh
data agar uji independent t-test dapat dilakukan, yaitu: jenis
data yang dibandingkan berupa data dengan skala interval
atau rasio, data yang dibandingkan diperoleh dari 2
kelompok yang tidak sama, dan data per kelompok memiliki
distribusi normal.
Jika syarat normalitas data tidak terpenuhi, maka sebagai
alternatif, uji yang dapat dilakukan adalah dengan
menggunakan uji statistik non parametrik.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 27


15. Apa syarat dan kondisi suatu data agar paired-samples t-
test dapat dilakukan?
Syarat dan kondisi suatu data yang harus dipenuhi agar
paired-samples t-test dapat dilakukan, yaitu 2 kelompok yang
dibandingkan berasal dari subjek yang sama, jenis data
berupa data dengan interval atau rasio, dan data dari kedua
kelompok yang akan dibandingkan memiliki distribusi
normal.
Uji normalitas dilakukan terlebih dahulu sebelum t-test.
Namun jika pada kenyataannya data yang diperoleh tidak
meiliki distribusi normal, sebagai alternatif dapat dilakukan
analisis statistik non parametrik.

16. Apa alternatif uji statistik independent t-test dan Paired t-


test pada kondisi data tidak terdistibusi normal?
Menggunakan uji statistik non parametrik Mann-whitney
sebagai alternatif independent t-test, dan uji statistik non
parametrik Wilcoxon sebagai alternatif Paired t-test.
Uji Mann-whitney dan Wilcoxon dilakukan pada uji yang
melibatkan data ordinal ataupun data interval dan rasio yang
tidak memenuhi distribusi normal.

17. Apa yang dimaksud dengan uji One-way Anova?


Uji One-way Anova merupakan uji statistik dengan metode
pengujian yang dilakukan untuk membandingkan 3 atau
lebih kelompok sampel dengan tujuan untuk mengetahui
apakah terdapat perbedaan nilai rerata (mean) antara 3 atau
lebih kelompok sampel tersebut. Uji ini merupakan salah satu

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 28


uji komparatif yang termasuk dalam analisis statistik
parametrik.

18. Apa perbedaan uji antara One-way Anova dan


independent samplet-test?
Perbedaan uji One-way Anova dan independent sample t-test
terdapat pada penggunaan jumlah rerata kelompok. Pada uji
One-way Anova, pengujian dilakukan untuk mengetahui
perbedaan nilai rerata pada 3 atau lebih kelompok sampel.
Sedangkan pada uji independent sample t-test, pengujian
dilakukan dengan tujuan untuk melihat perbedaan nilai
rerata yang terbatas hanya pada 2 kelompok sampel.

19. Apa syarat yang harus dipenuhi agar uji One-way Anova
dapat dilakukan?
Syarat yang harus dipenuhi sebelum uji One-way Anova dapat
dilakukan yaitu apabila data memenuhi 3 asumsi
diantaranya yaitu data berskala interval atau rasio, data
berdistribusi normal, dan terpenuhi homogenitas data yang
akan dibandingkan.

20. Pada uji One-way Anova terdapat uji Post hoc, apa makna
dan kapan uji tersebut dilakukan?
Uji Post hoc merupakan uji lanjutan pada uji one-way Anova.
Pengujian lanjutan ini dilakukan karena hasil dari uji one-way
Anova hanya memberikan indikasi tentang ada atau tidaknya
perbedaan rerata (mean) dari keseluruhan perbandingan nilai
rerata pada kelompok-kelompok sampel. Namun, hasil dari

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 29


one-way Anova belum dapat menunjukkan perbedaan antar
pasangan kelompok-kelompok yang berbeda.
Contoh: Kita ingin membandingkan A vs. B vs. C, hasil one-
way Anova p-value < 0.05. Hal tersebut berarti terdapat
perbedaan signifikan. Namun, kita belum mengetahui yang
mana yang berbeda signifikan. Oleh karena itu, uji Post hoc
perlu dilakukan. Hasil uji post-hoc nanti mampu
menyimpulkan A vs. B signifikan/tidak; A vs. C
signifikan/tidak; B vs. C signifikan/tidak.
Terdapat banyak variasi uji post hoc, diantaranya adalah LSD,
Tukey, Bonferroni. Uji Post hoc dilakukan bila didapatkan
hasil uji signifikan dari perbandingan uji one-way Anova
secara keseluruhan. Jika dari hasil one-way Anova ditemukan
bahwa nilai rata-rata antar kelompok sampel yang diuji tidak
berbeda bermakna/tidak signifikan, maka uji lanjutan atau
uji Post Hoc tidak diperlukan.

21. Apa yang dilakukan ketika data yang akan diuji One-way
Anova ternyata tidak memenuhi syarat uji homogenitas?
Salah satu asumsi yang harus dipenuhi dalam pengujian one-
way AnovaANOVA adalah homogenitas data. Jika asumsi ini
tidak dapat dipenuhi, maka langkah yang dapat ditempuh
adalah dengan melakukan transformasi data. Dapat juga
sebagai alternatif, uji Kruskal Wallis, salah satu pengujian
yang termasuk dalam analisis statistik non parametrik dapat
dijadikan pilihan.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 30


22. Apa yang dimaksud dengan uji korelasi? Ada berapa jenis
uji korelasi?
Uji korelasi adalah uji yang bertujuan mencari hubungan
antar dua variabel dan menganalisis bagaimana hubungan
antara dua variabel tersebut baik arah hubungan maupun
seberapa kuat hubungan antara 2 variabel tersebut.
Hubungan dua variabel tersebut dapat merupakan
hubungan sebab akibat atatupun hubungan yang terjadi
dikarenakan terdapat kejadian yang kebetulan terjadi
bersama dan memiliki pola di antara kedua variabel.
Dua variabel dapat dinyatakan memiliki korelasi bila
perubahan yang terjadi pada satu variabel diikuti dengan
pola tertentu oleh variabel yang lain. Bila pola tersebut
memiliki arah yang sama maka disebut korelasi positif atau
searah (contoh: semakin tinggi nilai variabel A juga diikuti
semakin tinggi nilai variabel B), sedangkan bila hubungan
antar kedua variabel memiliki arah yang berlawanan maka
disebut korelasi negatif atau berlawanan (contoh: semakin
tinggi nilai variabel A juga diikuti semakin rendah nilai
variabel B).
Uji korelasi terbagi menjadi 2 yaitu uji korelasi parametrik
dan non parametrik. Uji korelasi Pearson termasuk dalam uji
korelasi parametrik (kedua variabel berjenis interval atau
rasio serta memiliki distribusi normal), sedangkan uji
korelasi Spearman dan Kendall’s termasuk dalam uji korelasi
non parametrik (jenis data dapat berbentuk ordinal ataupun
interval dan rasio tetapi salah satu atau kedua variabel
memiliki distribusi tidak normal).

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 31


23. Apa perbedaan uji korelasi dengan uji komparasi?
Uji korelasi merupakan uji yang bertujuan untuk
mengidentifikasi hubungan yang memiliki pola tertentu
antar 2 variabel, sedangkan uji komparasi merupakan uji
yang bertujuan untuk membandingkan nilai antar 2 atau
lebih kelompok sampel.

24. Apa yang dimaksud uji regresi? Dan ada berapa jenis
regresi?
Regresi digunakan untuk menganalisis pengaruh variabel
bebas terhadap variabel terikat. Regresi juga dapat
digunakan untuk melakukan prediksi terhadap nilai variabel
terikat (Y) dengan menggunakan variabel bebas (X). Variabel
terikat dalam regresi linear berupa data interval atau rasio.
Sedangkan untuk variabel terikat dengan jenis data kualitatif,
menggunakan regresi logistik.
Berdasarkan jumlah variabel yang digunakan dalam
pengujian, terdapat dua pembagian regresi berdasarkan
jumlah variabel bebas, yaitu:
a) Regresi Sederhana yaitu uji regresi yang hanya memiliki
satu variabel bebas (X) terhadap satu variable terikat (Y);
b) Regresi Berganda yaitu uji regresi yang melibatkan dua
atau lebih variabel bebas (X1, X2, dan seterusnya)
terhadap satu variabel terikat (Y).
Disamping untuk mengukur besarnya pengaruh, uji regresi
linear juga bisa digunakan untuk mengidentifikasi
bagaimana hubungan linear antar variabel bebas (X) dan
variabel terikat (Y) apakah positif ataukah negatif. Hubungan

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 32


antara kedua variabel dianggap positif bila perubahan
kenaikan nilai pada variabel X diikuti pula oleh perubahan
kenaikan nilai pada variabel Y. Sedangkan hubungan antara
kedua variabel dikatakan negatif bila terjadi perubahan nilai
yang bertolak belakang, atau dengan kata lain bila perubahan
pada tiap kenaikan nilai pada variabel X, diikuti oleh
penurunan nilai pada variabel Y.
Selain dua fungsi yang sudah disebutkan di atas, uji regresi
linear juga bisa dipergunakan untuk memprediksi nilai dari
variabel terikat (Y) dengan berpatokan kepada kenaikan
ataupun penurunan nilai pada variabel bebas (X).
Pada proses uji Regresi akan didapatkan formula regresi.
Formula regresi merupakan suatu persamaan yang
menggambarkan suatu hubungan atau kondisi perubahan
rata-rata variabel terikat untuk setiap perubahan nilai pada
variabel bebas.
Contoh: formula akhir regresi biasanya disimbolkan dengan
Y = koefisien + aX1 + bX2 + cX2 + dst
Y adalah prediksi variabel terikat. Koefisien adalah koefisien
regresi. “a” Adalah koefisien X1 yang kita dapat dari hasil uji
statistik. X1 adalah nilai X1 dan seterusnya.
Contohnya kita ingin mengukur pengaruh konsumsi gula
merah dan jahe terhadap kadar gula darah. Variabel Y adalah
kadar gula darah dalam mg/dl, X1 adalah gula merah dalam
mg, X2 adalah jahe dalam mg. Singkat cerita setelah kita
lakukan uji statistik regresi, didapatkan nilai Y = 0.5 + 2.5 x1
+ (-0.7) x2. Bagaimana angka ini kita dapat akan di bahas di
bab selanjutnya.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 33


Formula di atas berarti setiap kenaikan 1miligram gula merah
akan menaikkan 2.5mg/dl gula darah. Lalu setiap 1miligram
jahe akan menurunkan 0.7 mg/dl gula darah. Catatan: ini
semua permisalah, bukan penelitian betulan. Jika pembaca
masih bingung, mari kita lihat sub-bab regresi di bab
Penggunaan R Commander

25. Apa perbedaan uji regresi dengan uji korelasi?


Uji regresi merupakan uji statistik yang melihat hubungan
antar variabel yang bersifat satu arah saja (hubungan sebab
akibat), sedangkan uji korelasi merupakan uji statistik yang
melihat hubungan antar variabel yang bersifat dua arah
(tidak selalu terjadi hubungan sebab akibat).
Jika kita aplikasikan ke dalam judul penelitian, uji regresi
menilai pengaruh langsung. Contoh: Pengaruh frekuensi
gosok gigi dan merk pasta gigi terhadap karies gigi.
Sedangkan korelasi menilai hubungan (arah dan
kekuatannya). Contoh: Hubungan frekuensi sikat gigi
dengan jumlah kunjungan ke dokter gigi.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 34


PENGGUNAAN R COMMANDER

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 35


1. Apa untungnya pakai R Commander?
“Aplikasi” seperti SPSS yang membuat olah data menjadi
tinggal klik. R commander atau Rcmdr merupakan fasilitas
package pada R yang dikembangkan oleh John Fox (Fox J. The
R Commander: A Basic-Statistics GUI for R. J Stat Softw
[Internet]. Aug 2005). Kehadiran Rcmdr membuat penggunaan
R menjadi lebih praktis dan efisien. Sebelum dapat
menggunakan Rcmdr, maka diperlukan proses instalasi
software R.

2. Apa itu software R?


R Analytics (atau bahasa pemrograman R) adalah perangkat
lunak sumber terbuka gratis (open-source) yang digunakan
untuk komputasi statistik. Bahasa ini dibangun khusus untuk,
dan digunakan secara luas oleh olah data statistik serta
penggalian data.
Program ini mampu mengolah data seperti di aplikasi SPSS,
AMOS, eViews, Lisrel, atau STATA. Di luar negeri, si R / R
Studio ini sudah sangat terkenal. Terbukti pemrograman R jadi
bahasa terpopuler secara internasional pada tahun 2017
(sumber: IEEE Spectrum rank languages)
Perlu diketahui bahwa IEEE adalah jurnal internasional
reputasi sangat tinggi. Jika akademisi mau kirim jurnal ke sana,
sulitnya minta ampun.

3. Apa untungnya pakai aplikasi R?


Efisien – penyimpanan data filenya kecil
Powerful – Serba bisa / Fitur lengkap

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 36


Valid – Banyak jurnal di luar negeri memakai R
Popular – Banyak tutorial: web atau pun video youtube
Cross platform – Linux, Mac, dan Windows, semua bisa
Nyaman di mata - UI bisa night mode (R Studio)
Punya forum tanya jawab R nasional (Indonesia)
Punya forum tanya jawab R Internasional (stackoverflow)
Reliabel – Sangat mudah direproduksi dengan pengiriman
script/syntax
Gratis – Open Source, tidak perlu bajak aplikasi olah data

4. Apa bedanya R, R Studio dengan R Commander?


R Studio adalah integrated development environment (IDE) dari R.
Sedangkan R Commander adalah salah satu package dari R.
Kalau kita simplifikasi atau terjemah bebasnya: Program R
adalah software gratis untuk olah data. Akan tetapi, R sendirian
masih cukup sulit digunakan. Oleh karena itu, dibutuhkan R-
Studio.
R-Studio adalah software gratis terintegrasi yang menyatukan
semua fasilitas untuk menjalankan bahasa R secara mudah dan
integrated. Bak mobil yang belum disusun (R), lalu
pengembang R Studio menyusun mobil tersebut menjadi R
Studio. R-Studio membuat kita hanya tinggal “menjalankan
mobil”, gas, rem, setir, semua siap pakai sudah tersusun.
Kemudahan ini semakin menjadi dengan datangnya R
Commander. R Commander adalah plugin (tambahan) gratis
yang memungkinkan otomatisasi bahasa R. Bak mobil yang
memiliki fitur menyetir otomatis. Hanya tinggal klik maka

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 37


bahasa R berjalan sendiri. Kita sebagai pengguna menerima
sudah jadi.
R commander atau Rcmdr merupakan fasilitas package pada R
yang dikembangkan oleh John Fox (Fox J. The R Commander: A
Basic-Statistics GUI for R. J Stat Softw [Internet]. Aug 2005).
Kehadiran Rcmdr membuat penggunaan R menjadi lebih
praktis dan efisien. Sebelum dapat menggunakan Rcmdr,
maka diperlukan proses instalasi software R.

5. Instalasi R Commander
Instalasi R diawali dengan mengunduh file instalasi melalui
website cran.r-project.org atau dapat dimulai dengan
melakukan pencarian kata kunci download R melalui situs
mesin pencari.

Pilih website yang tertuju dan kemudian klik Download


R.3.6.3for windows (atau R.4.0.0). Setelah download lanjutkan
untuk menginstall file R dan ikuti petunjuk prosedur install R
pada komputer.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 38


Setelah R berhasil terinstal, maka dilanjutkan untuk download
R studio. Tujuan dilakukan install R studio adalah untuk
mempermudah proses install package Rcmdr pada R. Untuk
download file install R studio melalui website rstudio.com atau
melakukan pencarian kata kunci download R studio melalui
situs mesin pencari.

Pilih website yang tertuju untuk mengunduh file installer R


studio. Kemudian lakukan double click pada file installer
Rstudio Desktop versi free.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 39


Mengikuti proses instalasi Rstudio Desktop hingga selesai.

Terdapat banyak pilihan untuk install Rstudio dan untuk


memilihnya harus disesuaikan dengan Windows pada
perangkat komputer kita. Untuk perangkat dengan kapasitas
32-bit, bisa klik older version of Rstudio. Setelah selesai
download maka install Rstudio sesuai dengan petunjuk pada
komputer.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 40


Ketika selesai proses install Rstudio, maka kemudian dapat
membuka Rstudio melalui start menu atau icon Rstudio.
Kemudian akan terlihat tampilan Rstudio. (berikut contoh
tampilan Rstudio yang telah digunakan).

Menuju pada window Rstudio yang berada di sisi kanan


bawah. Click pada menu packages dan dilanjutkan click pada
sub menu install.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 41


Pada menu install packages, berikutnya dapat diketikkan nama
packages “Rcmdr”. Centang pilihan install dependencies.
Kemudian dapat dilanjutkan klik install.

Proses instalasi Rcmdr akan berjalan dengan membutuhkan


waktu serta tergantung dengan akses internet. Proses instalasi
Rcmdr dapat dilihat pada window “console” pada Rstudio
(window kiri bawah). Bila proses instalasi telah selesai. Maka

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 42


dapat dilanjutkan dengan mengetik Rcmdr pada kolom search
di window package.

Klik pada pilihan Rcmdr

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 43


Bila instalasi Rcmdr telah selesai dan berhasil. Maka akan
terbuka window baru seperti tampilan berikut.

Bila tidak terlihat tampilan tersebut, maka akan terdapat saran


untuk menambah proses instalasi beberapa package terkait
Rcmdr. Proses tersebut dapat disetujui dan R akan menginstall
tambahan package tersebut. Seperti tampilan di bawah ini, jika
muncul klik ok untuk menyempurnakan proses install package
terkait Rcmdr. Bila terdapat informasi mengenai firewall di
komputer, maka dapat klik Allow access untuk memberi akses
bagi R menginstall package.
Bila telah selesai, maka dapat mencoba menjalankan Rcmdr
seperti langkah sebelumnya.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 44


Selamat mencoba instalasi R, Rstudio, dan R Commander.

6. Persiapan Data
Catatan: dalam praktik menggunakan R Commander ini,
terlihat beberapa warna berbeda pada border R Commander,
juga pada font-nya. Hal ini sebagai stimulus dan tambahan
wawasan kepada pembaca bahwa R dan R Commander dapat
disesuaikan tampilannya sesuai dengan selera pembaca.
Semoga hal ini dapat menambah semangat pembaca dalam
mempelajar R dan R Commander.
Untuk proses input data pada Rcmdr selain melalui edit dataset
secara langsung, dapat melalui proses import file dari data
excel.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 45


Langkah import file, dimulai dengan masuk pada menu Data,
kemudian memilih sub menu import data. Di dalamnya
terdapat beberapa format data awal yang dapat diproses untuk
di-import ke dalam Rcmdr. Pada contoh saat ini dilakukan
import data dari excel.

Memberi nama dataset dan centang pilihan baris pertama dari


kolom data excel akan menjadi nama variabel

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 46


Untuk melihat apakah proses import telah berhasil, maka dapat
klik pada menu view dataset, kemudian akan terlihat window
baru menunjukkan dataset dari hasil import data excel.

Pada data yang akan diolah lebih lanjut, bila terdapat data
kategori, maka diperlukan untuk melakukan konversi dari
data yang terbaca sebagai angka untuk diberi identitas kode
dan label pada angka tersebut. Sebagai contoh dari kode 1 dan
2, menjadi 1 untuk laki-laki dan 2 untuk perempuan.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 47


Memilih kolom atau nama variabel yang akan dikonversi, dan
menulis nama variabel baru sebagai hasil konversi.
Menuliskan label dari angka kode yang terdapat pada data
yang akan dikonversi.

Untuk melihat hasil konversi, maka dapat klik pada view


dataset, kemudian geser window dataset hingga di bagian
kolom paling akhir akan terlihat variabel baru yang
merupakan hasil konversi data.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 48


Pada proses yang lain, dapat pula dilakukan proses recode
atau melakukan kategorisasi dari data pada suatu variabel.

Memilih variabel yang akan di lakukan recode, kemudian


menuliskan nama variabel baru, serta menuliskan indikator
kategori pada window bagian bawah menu recode. Pada
contoh di bawah ini bermakna bahwa nilai terendah hingga 4,5
termasuk di kode 1, dan nilai 4,6 hingga tertinggi termasuk di
dalam kode 2.
Jangan lupa untuk menghilangkan centang pada pilihan make
(each) new variable a factor.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 49


Untuk melihat hasil re-code, maka dapat melalui view dataset.

Kemudian dilakukan proses konversi kembali untuk memberi


identitas kode dan label.

Menuliskan label dari angka kode yang terdapat pada data


yang akan dikonversi.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 50


Hasil proses re-code dan konversi tersebut dapat dilihat pada
view dataset.

Untuk proses menyimpan dataset, masuk ke dalam menu


Data, kemudian sub menu active dataset, dan memilih Save
active dataset.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 51


Untuk membuka kembali dataset yang telah disimpan, maka
masuk ke dalam menu Data, dan memilih Load data set.

Demikian untuk pengantar dasar data preparation


menggunakan Rcmdr.

7. Analisis data deskriptif


a) Frekuensi dan persentase
Untuk data kualitatif (nominal atau ordinal), penyajian
data secara deskriptif dapat dilakukan dengan tabel
frekuensi dan persentase.
Untuk menganalisis frekuensi pada data, masuk pada
menu Statistics, memilih sub menu Summaries dan
kemudian Frequency distributions.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 52


Memilih variabel data kualitatif yang akan dilakukan
analisis frekuensi.

Berikut hasil analisis frekuensi pada contoh data jenis


kelamin.

Catatan: Hasil analisis pada Rcmdr dapat dilihat pada


window Rstudio bagian kiri bawah (console).

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 53


Contoh penyajian tabel frekuensi.

b) Rerata (mean) dan Standar Deviasi


Untuk analisis nilai rata-rata atau mean, masuk ke
Statistics, kemudian Summaries dan Numerical
summaries. Kemudian memilih variabel kuantitatif
yang akan dianalisis nilai mean.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 54


Pada sub menu statistics di Numerical summaries, dapat
dipilih beberapa indikator analisis deskriptif yang ingin
ditampilkan. Pada contoh ini dipilih mean dan standar
deviasi.

Analisis data mean juga dapat terbagi berdasarkan


kelompok. Pada contoh di bawah ini, dibagi berdasarkan
jenis kelamin.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 55


Berikut hasil tampilan analisis mean dari data jumlah
karies yang terbagi berdasarkan jenis kelamin.

Contoh tabel rerata dan standar deviasi

c) Tabulasi Silang
Pada analisis deskriptif, khususnya pada data
kualitatif (nominal atau ordinal), dapat dilakukan
analisis tabulasi silang. Masuk ke menu Statistics,
kemudian sub menu Contingency tables, dan memilih
Two-way tables.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 56


Memilih dua variabel yang akan dipasangkan dalam
tabulasi silang. Umumnya dipilih faktor determinan atau
faktor risiko atau variabel bebas pada sisi baris, dan variabel
efek atau variabel terikat pada sisi kolom.

Pada sub menu Statistics di Two-way tables, dapat memilih


bentuk persentase pada tabulasi silang berupa Row
percentages.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 57


Berikut hasil analisis tabulasi silang.

Contoh penyajian tabulasi silang.

Demikian untuk pengantar dasar analisis data secara


deskriptif menggunakan R dengan Rcmdr package.
Selamat mencoba.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 58


8. Analisis inferensial
a) Chi-square (nominal vs nominal; nominal vs ordinal;
ordinal vs ordinal)
Masuk ke dalam menu Statistics dan memilih sub menu
Two-way table

Memilih 2 variabel yang akan dilakukan analisis, dimana


secara umum dapat dipilih variabel bebas atau faktor risiko
pada sisi baris (row) dan variabel terikat atau efek pada sisi
kolom (column).

Pada sub menu dapat dipilih terlebih dahulu sub menu


Statistics, dan memilih Row percentages serta centang
seluruh pilihan pada Hypothesis tests. Dilanjutkan dengan
klik OK.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 59


Hasil dari proses tersebut akan menghasilkan tampilan hasil
tabulasi silang antar variabel yang telah dipilih sebelumnya,
serta tampilan hasil uji chi square. Pada α = 0,05, maka nilai
p-value <0,05 menandakan terdapat perbedaan perbandingan
yang signifikan, dan bila nilai p-value ≥ 0,05 menandakan
terdapat perbedaan perbandingan yang tidak signifikan.

Alternatif dari uji chi quare adalah fisher’s exact test untuk
menganalisis data dalam tabulasi silang atau tabel
kontingensi, bila terdapat data dengan expected frequencies
kurang dari 5 (terdapat keterangan pada bagian bawah).
Pada α = 0,05, maka nilai p-value <0,05 menandakan terdapat

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 60


perbedaan perbandingan yang signifikan, dan bila nilai p-
value ≥ 0,05 menandakan terdapat perbedaan perbandingan
yang tidak signifikan.

b) Uji Normalitas
Uji normalitas dilakukan pada data interval atau rasio. Uji
tersebut digunakan untuk melihat distribusi data yang akan
dianalisis. Tujuan melihat distribusi tersebut untuk
menentukan penggunaan uji parametrik atau non-
parametrik pada analisis data interval atau rasio.
Uji normalitas dilakukan pada masing-masing kelompok
yang akan dibandingkan atau pada masing-masing variabel
yang akan dianalisis.
Masuk dalam menu Statistics dan pada sub menu Summaries
memilih Test of Normality. Kemudian memilih variabel yang
akan dilakukan uji normalitas. Bila uji normalitas dilakukan
terbagi dalam kelompok, maka dapat memilih Groups atau
pembagian kelompok.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 61


Pada Normality Test dapat memilih salah satu uji yang akan
digunakan, pada contoh ini dipilih uji normalitas Shapiro-
Wilk, kemudian dilanjutkan dengan klik OK.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 62


Hasil uji normalitas (test by groups) menghasilkan tampilan
variabel berdasarkan kelompok. Pada contoh di bawah ini
dilakukan uji normalitas data pada kelompok laki-laki dan
kelompok perempuan. Pada nilai = α 0,05, maka nilai p-value
<0,05 menandakan distribusi data yang tidak normal, dan
bila nilai p-value ≥ 0,05 menandakan distribusi data normal.

c) Uji homogenitas
Uji homogenitas digunakan untuk melihat homogenitas
varian dari data yang akan dianalisis. Uji ini secara umum
digunakan sebagai pertimbangan pada uji komparasi
independent t-test ataupun one-way Anova.
Masuk dalam menu Statistics pada sub menu Variance
kemudian pada contoh berikut memilih Levene’s test

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 63


Memilih faktor yaitu pembagian kelompok yang akan
dianalisis (Factors), serta memilih variabel yang berisi data
yang akan dianalisis (Response).

Hasil uji homogenitas, akan didapatkan nilai p-value. Nilai p-


value < 0,05 menunjukkan varian data yang akan dianalisis
tidak memenuhi homogenitas, dan jika nilai p-value ≥ 0,05
menunjukkan varian data yang akan dianalisis memenuhi
homogenitas. Bila pada uji independent t-test dan one-way
Anova, tidak terpenuhinya homogenitas varian menunjukkan
“not assuming equal variance”, dan terpenuhinya homogenitas
varian menunjukkan “assume equal variance”. Hal tersebut
akan dibutuhkan ketika memilih kondisi varian data pada
saat melakukan independent t-test dan one-way Anova.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 64


d) Uji Independent t-test (nominal (2 kelompok) vs
interval/rasio berdistribusi normal)
Masuk dalam menu Statistics pada sub menu Means memilih
Independent samples t-test

Pada sub menu Data memilih variabel data nominal yang


berisi kelompok yang akan dibandingkan (Groups) serta
memilih variabel data interval atau rasio yang berisi data
yang akan dianalisis (Response).

Sedangkan pada sub menu Options dapat memilih Alternative


Hypothesis dengan mencentang Two-sided, menulis confidence
level 0,95 dan centang yes pada assume equal variance (bila pada

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 65


hasil uji homogenitas varian didapatkan varian data
memenuhi homogenitas). Kemudian klik OK.

Hasil uji independent t-test menghasilkan tampilan hasil dari


perbandingan data berdasarkan kelompok yang telah dipilih
sebelumnya. Pada α = 0,05, maka jika nilai p-value < 0,05
menunjukkan terdapat perbedaan nilai yang signifikan, dan
jika nilai p-value ≥ 0,05 menunjukkan terdapat perbedaan nilai
yang tidak signifikan.

Contoh penyajian tabel hasil uji independent t-test

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 66


e) Uji Paired t-test (data interval/rasio sebelum vs data
interval/rasio sesudah, data berdistribusi normal)
Masuk dalam menu Statistics pada sub menu Means
kemudian memilih Paired t-test

Pada sub menu Data pilihlah kelompok data pertama (data


pre atau sebelum) dan kelompok data kedua (data post atau
sesudah) yang akan dianalisis.

Hasil uji Paired t-test menampilkan hasil dari perbandingan


data sebelum dengan sesudah yang telah dipilih sebelumnya.
Pada α = 0,05, maka jika nilai p-value < 0,05 menunjukkan
terdapat perbedaan nilai sebelum dan sesudah yang
signifikan, dan jika nilai p-value ≥ 0,05 menunjukkan terdapat
perbedaan nilai sebelum dan sesudah yang tidak signifikan.
Bila terlihat angka p-value seperti pada contoh berikut maka

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 67


hal tersebut bermakna 3,709 x 10-10 atau sangat jauh di bawah
0,05.

f) Uji one-way Anova (nominal (> 2 kelompok) vs interval/rasio


berdistribusi normal)
Masuk dalam menu Statistics pada sub menu Means
kemudian memilih One-way Anova

Memberi nama untuk model (dapat diketik secara langsung)


dan memilih variabel data nominal yang berisi kelompok
yang akan dibandingkan (Groups) serta memilih variabel data
interval atau rasio yang berisi data yang akan dianalisis
(Response). Kemudian dapat juga mencentang kedua pilihan
yang ada dibawahnya. Bila hasil uji one-way ANOVA
didapatkan perbedaan yang signifikan, maka pairwise
comparison of means digunakan untuk melihat uji
perbandingan antar kelompok secara sepasang. Sedangkan

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 68


Welch F-test digunakan bila hasil uji homogenitas data tidak
terpenuhi homogenitas varian data. Selanjutnya klik OK.

Hasil uji One-way ANOVA menghasilkan tampilan hasil dari


perbandingan data berdasarkan kelompok yang telah dipilih
sebelumnya. Pada α = 0,05, maka jika nilai p-value < 0,05
menunjukkan bahwa terdapat perbedaan nilai (minimal
sepasang kelompok perlakuan) yang signifikan, dan jika nilai
p-value ≥ 0,05 menunjukkan bahwa terdapat perbedaan nilai
antar kelompok yang tidak signifikan.

Pada hasil uji one-way ANOVA menunjukkan terdapat


perbedaan nilai yang signifikan, maka jika ingin melihat
pasangan kelompok perlakuan yang berbeda, maka analisis
dapat dilanjutkan dengan uji perbandingan antar kelompok.
Sebenarnya ada banyak macam untuk perbandingan
berganda tetapi di Rcmdr menggunakan Tukey, seperti
tampilan di bawah ini.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 69


Berikut hasil uji Welch F-test bila data tidak memenuhi
homogenitas varian data. Hasil p-value tersebut
menggantikan nilai p-value one-way Anova.

Contoh penyajian tabel uji one-way Anova

g) Uji korelasi
1) Uji korelasi Pearson (interval/rasio berdistribusi normal
vs interval/rasio berdistribusi normal)

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 70


2) Uji korelasi Spearman (ordinal atau interval/rasio
berdistribusi tidak normal vs ordinal atau interval/rasio
berdistribusi normal; ordinal atau interval/rasio
berdistribusi tidak normal vs ordinal atau interval/rasio
berdistribusi tidak normal)
Masuk dalam menu Statistics pada sub menu Summaries
kemudian memilih Correlation test.

Memilih 2 variabel yang akan dianalisis korelasi (sebelumnya


kedua variabel tersebut telah dilakukan uji normalitas
terlebih dahulu), bila kedua variabel berdistribusi normal
kemudian centang Pearson product-moment pada Type of
correlation dan centang two sided pada Alternative Hypothesis.
Selanjunya klik OK.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 71


Hasil uji korelasi menghasilkan tampilan korelasi 2 variabel
yang dianalisis. Pada α = 0,05, maka jika nilai p-value < 0,05
menunjukkan bahwa terdapat korelasi antara kedua variabel,
dan jika nilai p-value ≥ 0,05 menunjukkan bahwa tidak
terdapat korelasi antara kedua variabel. Bila didapatkan
korelasi dari kedua variabel, maka dapat dilanjutkan melihat
angka kekuatan hubungan korelasi pada bagian “estimates
cor”, semakin mendekati nilai 1 maka korelasi yang terbentuk
dinilai semakin kuat.

Pada uji korelasi dapat ditampilkan bentuk matriks, terutama


bila uji korelasi dilakukan pada beberapa variabel. Masuk
dalam menu Statistics pada sub menu Summaries kemudian
memilih Correlation matrix.

Memilih 2 variabel atau lebih, centang Pearson product-


moment pada Type of Correlations, centang complete observations
dan centang Pairwise p-values. Kemudian klik OK.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 72


Hasil uji korelasi dengan menggunakan correlation matrix
memperlihatkan hasil uji korelasi antar beberapa variabel,
dengan pengamatan korelasi secara sepasang antar dua
variabel. Sebagai contoh simulasi (tidak menggambarkan
kondisi sebenarnya), terlihat pada hasil uji korelasi di bawah
ini, pada uji korelasi antara variabel skor pengetahuan
dengan jumlah karies terdapat korelasi (p-value = 0,0394 atau
p-value < 0,05), sehingga kemudian dapat dilanjutkan melihat
nilai kekuatan korelasi yaitu sebesar 0,423.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 73


a) Uji regresi linear
Seperti yang sudah kita bahas di bab Analisis inferensial
subbab uji regresi, uji regresi adalah melihat pengaruh.
Kesempatan ini kita ingin melihat adakah pengaruh
pengetahuan tentang karies dan usia responden terhadap
jumlah karies. Kalau ada, seberapa besar pengaruhnya? Mari
kita kupas satu per satu:
Singkat cerita kita sudah selesai melakukan persiapan data
sekaligus input data ke R. Selanjutnya adalah membuka R
Commander dengan fungsi library (“Rcmdr”). Setelah
terbuka, masuk dalam menu Statistics pada sub menu Fit
models kemudian memilih Linier Model. Masuk dalam menu
Statistics pada sub menu Fit models kemudian memilih
Linier Model.

Memasukkan nama model dan membuat model formula


dengan cara klik 2 kali pada variabel yang akan dianalisis.
Pada gambar di bawah ini, terlihat kotak awal yang kecil
paling kiri diisi dengan pilihan variabel terikat (variabel Y),
sedangkan untuk kotak yang lebih panjang diisi dengan
variabel bebas (variabel X).

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 74


Setelah semua variabel ter-input di kolom R Commander
Linear Model, klik ok. Maka akan muncul di console R Studio
seperti berikut:

“Estimate” adalah koefisien: Estimate di-intercept adalah


koefisien regresi, estimate di skor_pengetahuan adalah
koefisien X1, estimate di usia adalah koefisien X2. Standard
error pun sama demikian. T value yang nantinya bermanfaat
untuk uji hipotesis juga sama. Sedangkan Pr (>|t|) adalah
probability atau yang kita kenal sebagai p-value atau Sig.
Jika nilai Pr(>|t|) atau p-value < 0,05 menunjukkan bahwa
terdapat pengaruh antara variabel bebas dengan terikat, dan

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 75


jika nilai p-value ≥ 0,05 menunjukkan bahwa tidak terdapat
pengaruh antara variabel bebas dengan terikat.
Pada contoh di atas, didapatkan bahwa hanya variabel
skor_pengetahuan (x1) yang memiliki pengaruh signifikan
terhadap jumlah karies (p-value = 0,0193 atau p-value < 0,05),
dengan nilai koefisien x1/estimates sebesar 1,056, serta nilai
adjusted R-squared sebesar 0,212.
Jika kita review kembali ke bab analisis inferensial subbab
regresi, kita dapatkan formula:
Y = koefisien + aX1 + bX2
Y (jumlah karies) = 1.056 (X1)
Koefisien regresi tidak ada karena p-value > 0.05 (tidak
signifikan), begitu pula pada koefisien X2. Pada formula di
atas dapat diambil kesimpulan bahwa setiap kenaikan 1 poin
skor_pengetahuan akan menambah jumlah karies sebesar
1.056. Tentunya hal ini tidak masuk akal secara keilmuan,
hanya permisalan atau contoh uji regresi saja. Ini hanya
simulasi tidak menggambarkan kondisi sebenarnya.
Bagaimana dengan uji asumsi? Kita mengetahui bahwa uji
asumsi wajib dikerjakan sebelum mengerjakan uji regresi.
Ternyata tidak demikian, kita pun mampu melakukan uji
asumsi setelah uji regresi dilakukan. Namun, jika terdapat
pelanggaran uji asumsi maka kita harus melakukan
transformasi data atau penanganan data lainnya seperti
pembuangan outlier. Lalu setelah itu melakukan uji regresi
lagi (mengulang setelah dilakukan perbaikan).

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 76


b) Uji Normalitas Residual
Setelah kita melakukan uji regresi, asumsi pertama yang
perlu kita cek adalah normalitas residual. Caranya adalah
sebagai berikut
Pertama, pastikan sudah terpilih model regresi yang
sudah kita kerjakan sebelumnya

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 77


Kotak merah atau normal Q-Q plot adalah uji normalitas
secara visualisasi. Dikatakan normal jika mengikuti garis
putus-putus. Selain cara ini, dapat kita lakukan dengan
cara numerik. Ketika tulisan ini dibuat belum ada fungsi
normalitas residual secara langsung di R Commander
sehingga kita perlu coding sedikit:

Hasil di atas menunjukkan bahwa residual regresi


berdistribusi normal. Tentunya hal ini sangat patut kita

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 78


syukuri karena berarti tidak perlu transformasi atau
penanganan data. Dikatakan normal jika p-value > 0.05.
c) Uji Multikolinieritas
Uji asumsi multikolinier kita saat ini akan menggunakan
Variance Inflation Factor (VIF). Dikatakan lulus uji asumsi
jika VIF <10

Hasil akan keluar di console R Studio:

VIF semua <10 sehingga uji multikoliner pun lulus


d) Uji Heteroskedastisitas
Asumsi selanjutnya di uji regresi adalah uji
heteroskedastisitas. Uji regresi dapat diterima hasilnya
jika semua asumsi terpenuhi, termasuk ini. Caranya
sebagai berikut:

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 79


Hasil akan keluar di console R Studio:

Sama seperti uji normalitas, dikatakan lulus jika p-value > 0.05. Pada
kesempatan kali ini sudah lulus karena p-value 0.48, sangat
menghemat waktu. Sekian tentang uji asumsi di uji regresi.
Ternyata semua uji asumsi terpenuhi, sehingga uji regresi kita di
awal tadi dapat digunakan.
Bagaimana jika ada uji asumsi yang tidak terpenuhi? Perlu
dilakukan penanganan data seperti pembuangan outlier atau

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 80


transformasi data. Transformasi data dapat mencakup logaritma,
square root, atau pun arcsin.
a) Uji regresi logistik
Masuk dalam menu Statistics pada sub menu Fit models
kemudian memilih Generalized Linier Model.

Memasukkan nama model dan membuat model formula klik 2


kali pada variabel yang akan dianalisis. Pada gambar di bawah
ini, terlihat kotak awal yang terpisah tersebut diisi dengan
pilihan variabel terikat, sedangkan untuk kotak yang lebih
panjang diisi dengan pilihan 1 atau lebih variabel bebas.
Memilih binomial pada Family dan pilih logit pada link
fuction. Selanjutnya klik OK.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 81


Hasil uji regresi logistik menunjukkan hasil uji berdasarkan
model formula yang dipilih sebelumnya. Pada α = 0,05, maka
jika nilai p-value < 0,05 menunjukkan bahwa terdapat pengaruh
antara variabel bebas dengan terikat, dan jika nilai p-value ≥
0,05 menunjukkan bahwa tidak terdapat pengaruh antara
variabel bebas dengan terikat. Pada contoh simulasi hasil di
bawah ini tidak didapatkan satupun variabel bebas yang
berpengaruh signifikan terhadap variabel terikat
(pengetahuan)

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 82


b) Uji Non parametrik
1) Uji two-samples Wilcoxon test (nominal (2 kelompok)
vs ordinal atau interval/rasio berdistribusi tidak
normal)
Masuk dalam menu Statistics pada sub menu
Nonparametric tests kemudian memilih Two-sample
Wilcoxon test.

Pada sub menu Data memilih variabel data nominal


yang berisi kelompok yang akan dibandingkan

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 83


(Groups) serta memilih variabel data ordinal atau
interval/rasio yang berisi data yang akan dianalisis
(Response).

Untuk sub menu options pilih Two-sided pada


Alternative Hyphotesis dan pilih Default pada Type of
Test.

Hasil uji menghasilkan tampilan hasil dari


perbandingan data berdasarkan kelompok yang telah
dipilih sebelumnya. Pada α = 0,05, maka jika nilai p-
value < 0,05 menunjukkan terdapat perbedaan nilai

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 84


yang signifikan, dan jika nilai p-value ≥ 0,05
menunjukkan terdapat perbedaan nilai yang tidak
signifikan.

2) Uji paired-samples Wilcoxon test(data ordinal atau


interval/rasio sebelum vs data ordinal atau
interval/rasio sesudah, data interval/rasio
berdistribusi tidak normal)
Masuk dalam menu Statistics pada sub menu
Nonparametric tests kemudian memilih Paired-
sample Wilcoxon test

Pada sub menu Data pilihlah kelompok data pertama


(data pre atau sebelum) dan kelompok data kedua
(data post atau sesudah) yang akan dianalisis.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 85


Hasil uji paired-samples Wilcoxon test menampilkan
hasil uji dari perbandingan data sebelum dengan
sesudah yang telah dipilih sebelumnya. Pada α = 0,05,
maka jika nilai p-value < 0,05 menunjukkan terdapat
perbedaan nilai sebelum dan sesudah yang signifikan,
dan jika nilai p-value ≥ 0,05 menunjukkan terdapat
perbedaan nilai sebelum dan sesudah yang tidak
signifikan.

3) Kruskall Wallis test (nominal (> 2 kelompok) vs


ordinal atau interval/rasio berdistribusi tidak normal)
Masuk dalam menu Statistics pada sub menu
Nonparametric tests kemudian memilih Kruskal-
Wallis test.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 86


Kemudian memilih variabel data nominal yang berisi
kelompok yang akan dibandingkan (Groups) serta
memilih variabel yang berisi data yang akan
dianalisis (Response).

Hasil uji Kruskal-Wallis menghasilkan tampilan hasil


dari perbandingan data berdasarkan kelompok yang
telah dipilih sebelumnya. Pada α = 0,05, maka jika
nilai p-value < 0,05 menunjukkan bahwa terdapat
perbedaan nilai antar kelompok secara umum yang
signifikan, dan jika nilai p-value ≥ 0,05 menunjukkan
bahwa terdapat perbedaan nilai antar kelompok yang
tidak signifikan.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 87


9. Visualisasi Praktis Menggunakan R Commander
Pada praktik visualisasi ini, digunakan data built-in (data yang
sudah ada di R) sehingga diharapkan lebih memudahkan
untuk praktik. Berikut adalah langkah-langkah pengambilan
data built-in :

Pilih menu Data in packages pada sub menu Data, lalu pilih
Read data set from an attached package.

Pada kolom Package pilih datasets, dan pada kolom Data set
cari data dengan nama iris kemudian klik OK. Demikian
adalah cara memilih data built-in pada R Commander,

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 88


pembaca bisa eksplorasi lebih lanjut mengenai data-data yang
sudah disediakan (built-in) di R.
Dari data Iris tersebut, dapat dilakukan berbagai macam
visualisasi, dalam buku ini dibahas visualisasi yang sering
dilakukan oleh peneliti dalam mencari insight tentang data
menggunakan grafik.
• Histogram
Pilih menu Graphs dan klik Histograms.

Kemudian pilih variabel dari data Iris yang ingin dibuat


histogram (dalam hal ini dipilih Sepal Length), lalu klik OK.

Kemudian hasil histogram dapat dilihat pada pop-up yang


muncul.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 89


• Boxplot
Pilih menu Graphs dan pilih Boxplot.

Kemudian pilih variabel yang ada dalam data Iris (dalam


hal ini dipilih Petal Width), lalu klik OK.

Hasil Boxplot muncul pada pop-up dan bisa digali insight-


nya.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 90


• Scatterplot
Pada menu Graphs pilih Scatterplot.

Lalu pilih variabel X dan variabel Y nya (dalam hal ini X =


Sepal Length dan Y = Sepal Width), kemudian klik OK.

Hasil Scatterplot sudah dapat dilihat di pop-up yang


muncul.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 91


• Pie Chart
Pada menu Graphs pilih Pie Chart.

Pada pilihan Variable, pilih variabel yang ingin dijadikan


Pie Chart (dalam data Iris terdapat Species Iris), lalu bisa
disesuaikan sendiri label dan judul yang diinginkan pada
Pie Chart dengan mengedit kolom sebelah kanan (dalam
hal ini, judul Pie Chart adalah Komposisi Iris). Lalu klik OK.

Hasil Pie Chart sudah dapat dinikmati pada pop-up yang


muncul.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 92


• Bar Graph
Pada menu Graphs, pilih Bar Graph.

Sesuaikan variabel yang ingin divisualisasikan sebgai Bar


Graph, lalu klik OK.

Hasil Bar Graph dapat dilihat pada pop-up yang muncul.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 93


DAFTAR PUSTAKA

Fox, J.2005. The R Commander: A Basic-Statistics Graphical User


Interface to R, Journal of Statistical Software, Vol 14, Issue 9.

Gehlbach, S.H. 2006. Interpreting the Medical Literature. 5th Ed. New
York: McGraw-Hill Book Co.

Hathway, R.S. 1995. Assumptions Underlying Quantitative and


Qualitative Research: Implication for Institutional Research.
Research in Higher Education 36(5): 535-562.

Hulley, S.B, Cummings, S.R., Browner, W.S., Grady, D., Hearst, N.,
and Newman, T.B., eds. 2006. Designing Clinical Research: An
Epidemiologic Approach. 3rd Ed. Baltimore: Lippincott Williams and
Willkins.

Kerlinger, F.N., and Lee, H.B. 1999. Foundation of Behavioral Research.


4th Ed. Wadsworth Publishing.

Pramana, S., Yordani, R., Kurniawan, R., dan Yuniarto, B. 2019.


Dasar-Dasar Statistika Dengan Software R Konsep dan Aplikasi Edisi
Ketiga. Bogor: Penerbit IN MEDIA.

Purnomo, Windhu, dan Taufan Bramantoro.2018. Pengantar


Metodologi Penelitian Bidang Kesehatan. Surabaya. Airlangga
University Press;

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 94


Profil Penulis

Dr. Taufan Bramantoro, drg., M.Kes, lahir di Surabaya 22 Juni 1984,


lulus dokter gigi dari FKG Universitas Airlangga sejak 2007. Pada
tahun 2010 lulus dari studi Magister Manajemen Pemasaran dan
Keuangan Pelayanan Kesehatan di FKM Universitas Airlangga.
Tahun 2015 lulus dari Pendidikan Doktoral Ilmu Kedokteran dan
Kesehatan di Fakultas Kedokteran Universitas Gadjah Mada.
Menjadi dosen di FKG Universitas Airlangga sejak 2008 dalam
bidang Ilmu Kesehatan Gigi Masyarakat dengan pendalaman pada
Manajemen Pelayanan Kesehatan, serta bidang Epidermologi,
Komunikasi, Metodologi Penelitian, Biostatistika, dan
Pemberdayaan.

dr. Abdi Marang Gusti Alhaq, dokter lulusan FK UGM di tahun


2018. Pengalaman menjadi asisten penelitian bagian radiologi FK
UGM. Memulai berbisnis dengan mengenalkan kekayaan
intelektual. Pendiri USH Indonesia sebuah solusi olah data dengan
aplikasi asli. Menerima permintaan dari dalam dan luar negeri.

Nur Azmi Prasetyo, lahir di Brebes 24 Juni 1998, Alumni Statistika


Undip, lulus sarjana Statistika dari Universitas Diponegoro pada
2020. Selama kuliah diperbantukan sebagai IT di Departemen
Statistika, juga sebagai asisten peneliti. Aktif mengikuti
pembelajaran Internasional tentang Data Science, juga aktif di
platform Masyarakat. . diskusi internasional yang membahas Data
Science.

Jurus Praktis Statistik Dasar dan Penggunaan R Commander | 95


Jurus Praktis Statistik Dasar dan Penggunaan R Commander | i

Anda mungkin juga menyukai