Anda di halaman 1dari 11

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/321899873

Dasar-dasar Statistika dengan Menggunakan Software R Edisi 2

Book · November 2017

CITATIONS READS

0 15,935

1 author:

Setia Pramana
Karolinska Institutet
103 PUBLICATIONS   399 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

mobile positioning data View project

Biclustering Method for Big Data and High Dimensional Data Analysis View project

All content following this page was uploaded by Setia Pramana on 17 February 2018.

The user has requested enhancement of the downloaded file.


DASAR-DASAR
STATISTIKA
Dengan Software R
Konsep dan Aplikasi
Edisi Kedua
IA iN MEDIA iN MEDIA

MEDIA iN MEDIA

EDIA iN MEDIA

Setia Pramana, Ph.D


Ricky Yordani, M.Stat
Robert Kurniawan, M.Si
Budi Yuniarto, M.Si

iN MEDIA

iN MEDIA

IN MEDIA

N MEDIA
N MEDIA IN MEDIA
IN M

IN
IN MEDIA
DASAR-DASAR STATISTIKA DENGAN SOFTWARE R
Konsep dan Aplikasi - Edisi Kedua

Setia Pramana, Ph.D


Ricky Yordani, M.Stat
Robert Kurniawan, M.Si
EDIA
Budi Yuniarto, M.Si


IN MEDIA
Hak Cipta ©2017 Setia Pramana, Ph.D, Ricky Yordani, M.Stat,
Robert Kurniawan, M.Si, Budi Yuniarto, M.Si
Diterbitkan oleh : Penerbit IN MEDIA
N MEDIA Telp/Faks.
Website
: (021) 82425377/(021) 82425377
: http//www.penerbitinmedia.co.id
IN MEDIA
IN MEDIA
E-mail : penerbitinmedia@gmail.com
Office : Vila Nusa Indah 3 Blok KD 4 No 1
Bojongkulur-Gunung Putri-Bogor IN MEDIA
IN MEDIA

Hak cipta dilindungi undang-undang. Dilarang memperbanyak sebagian atau seluruh


isi buku ini dalam bentuk apa pun, baik secara elektronik maupun mekanik, termasuk
memfotokopi, merekam, atau dengan menggunakan sistem penyimpanan lainnya, tanpa
izin tertulis dari Penerbit.

UNDANG-UNDANG NOMOR 19 TAHUN 2002 TENTANG HAK CIPTA


1. Barang siapa dengan sengaja dan tanpa hak mengumumkan atau memperbanyak
suatu ciptaan atau memberi izin untuk itu, dipidana dengan pidana penjara paling
lama 7 (tujuh) tahun dan/atau denda paling banyak Rp 5.000.000.000,00 (lima
miliar rupiah).
2. Barang siapa dengan sengaja menyiarkan, memamerkan, mengedarkan, atau menjual
kepada umum suatu ciptaan atau barang hasil pelanggaran Hak Cipta atau Hak
Terkait sebagaimana dimaksud pada ayat (1), dipidana dengan pidana penjara paling
lama 5 (lima) tahun dan/atau denda paling banyak Rp 500.000.000,00 (lima ratus juta
rupiah).


Cetakan: Pertama

Penerbit IN MEDIA
Amggota IKAPI No. 250/JBA/2014
1 jil.,17 × 24 cm, 292 hal.

ISBN :
Perpustakaan Nasional : Katalog dalam Terbitan (KDT)

1. Statisika 2. Dasar-dasar Statistika


Kata Pengantar

Alhamdulillah, segala puji bagi Allah SWT yang dengan rahmat dan ridho-Nya para
penulis mampu menyelesaikan buku edisi kedua ini. Buku edisi pertama telah banyak
digunakan baik oleh akademisi di berbagai perguruan tinggi, dan juga para praktisi dan
penggiat data di Indonesia.
Saat ini perkembangan statistika baik dalam hal teori, aplikasi serta software
berkembang sangat pesat sejalan cepatnya perkembangan teknologi informasi. Jumlah
data yang sangat besar yang besar (BigData), menjadikan tantangan bagi para statistisi
atau saat ini dikenal dengan ilmuwan data (data scientist) untuk mampu menyedikan
informasi, ringkasan, visualisasi serta prediksi secara cepat dan tepat. Software R yang
merupakan open source, mampu dengan mudah mengadopsi perkembangan terkini
(cutting edge techniques), menghasilkan visualisasi yang sangat menarik, serta dapat
embedded pada segala sistem menjadi pilihan utama dalam bidang analytics saat ini.
Perusahaan besar global seperti Google, Facebook, Twitter, Traveloka, dan BCA telah
menggunakan software R untuk keperluan Business Intelligent nya. Saat ini kemampuan
akan penggunaan software R menjadi sebuah keharusan bagi akademisi dan juga seorang
praktisi yang bergerak dalam bidang data analisis di berbagai sektor.
Buku ini memberikan dasar-dasar penggunaan software R dari mulai instalasi,
visualisasi hingga analisa data tingkat menengah. Pada bab pertama, dasar-dasar
penggunaan R, fungsi sederhana, tipe objek serta manajemen data dibahas dengan detil.
Bab ini menjadi krusial bagi pengguna R pemula untuk terbiasa dengan lingkungan kerja
(workspace) R.
iv   Dasar-Dasar Statistika dengan Software R—Konsep dan Aplikasi

Statistik deskriptif serta visualisasi data dibahas pada bab berikutnya yang
dilanjutkan dengan statistik inferensia, seperti t-test, analisis ragam, analisis regresi,
dan korelasi. Perbedaan buku edisi kedua ini adalah pembahasan visualisasi data dengan
menggunakan package ggplot2 dimana pengguna dapat memproduksi berbagai macam
grafik yang innovatif, unik dan menarik. Selain itu, pada edisi kedua ini pengantar regresi
logistik untuk respon variabel yang bersifat binary diberikan pada Bab 6.
Software R juga merupakan sebuah bahasa pemrograman sehingga dapat digunakan
untuk membangun sebuah aplikasi yang disesuaikan dengan kebutuhan pengguna. Bab
7 yang merupakan salah satu keunikan dari buku ini memberikan pengenalan dasar dari
pemrograman pada R hingga pembuatan fungsi sederhana. Sebagai tambahan pada edisi
kedua ini adalah pembahasan penggunaan package dplyr yang sangat berguna bagi R
developer yang akan menjalankan code nya di BigData framework seperti Spark.
Ketiga bab terakhir ditujukan bagi pengguna yang tidak ingin menggunakan
command line, dimana R menyediakan Graphical User Interface RCommander untuk analisa
data dengan R tanpa perlu mengingat perintah R. RCommander akan memberikan
kemudahan tidak hanya dalam bentuk click and drag, tapi juga memberitahukan perintah
pada command line dari setiap kegiatan yang dilakukan. Hal ini juga akan membantu
pengguna dalam memahami berbagai perintah (commands) pada R.
Penulis mengucapkan terima kasih kepada keluarga penulis yang mendukung serta
telah berkorban banyak karena waktu untuk keluarga digunakan untuk menyelesaikan
buku ini. Terima kasih kepada seluruh civitas akademika Sekolah Tinggi Ilmu Statistik
(STIS) yang telah memberikan dukungan penuh untuk terselesaikannya buku ini.
Penulis menyadari bahwa buku ini masih jauh dari sempurna dan tidak luput dari
kesalahan, maka saran, kritik serta tanggapan dari pembaca mengenai buku ini sangat
diharapkan untuk perbaikan buku ini di masa yang mendatang.

Jakarta, Oktober 2017

Penulis
Setia Pramana
Ricky Yordani
Robert Kurniawan
Budi Yuniarto
Daftar Isi

Kata Pengantar................................................................................................. iii


Daftar Isi............................................................................................................ v

Bab 1 Pengenalan RGUI dan RStudio......................................................... 1


A. Sejarah R..................................................................................... 1
B. Instalasi....................................................................................... 2
R Session............................................................................................ 2
C. R Graphical User Interface (GUI)................................................ 3
RStudio.............................................................................................. 4
Instalasi Package................................................................................. 6
Set Repository..................................................................................... 7
D. Dasar-Dasar Penggunaan R......................................................... 11
Menjalankan Fungsi di R..................................................................... 11
E. Bantuan serta Dokumentasi......................................................... 12
F. Fungsi-Fungsi Sederhana............................................................. 12
vi   Dasar-Dasar Statistika dengan Software R—Konsep dan Aplikasi

G. Operator Aritmatika dan Logika.................................................. 13


H. Tipe Objek................................................................................... 14
Vektor................................................................................................. 14
Operasi pada Vektor............................................................................. 15
Operasi Aritmatika pada vektor............................................................ 15
Subset dan Indeks Vektor...................................................................... 16
Faktor................................................................................................. 17
Matriks............................................................................................... 18
Operasi Matriks................................................................................... 19
Data Frame......................................................................................... 21
Binding............................................................................................... 22
List ................................................................................................... 23
I. Manajemen Data......................................................................... 24
Input Data.......................................................................................... 24
Membaca Data dalam File................................................................... 24
Import Data........................................................................................ 25
Import Data dari Software Statistik Lain.............................................. 26
Menyimpan Data ke dalam File........................................................... 27
J. Manajemen Objek....................................................................... 27
K. Missing Data............................................................................... 29

Bab 2 Statistik Deskriptif dan Visualisasi Data.......................................... 31


A. Statistik Deskriptif ....................................................................... 31
Ukuran Pemusatan.............................................................................. 31
Rata-rata (Mean)................................................................................. 32
Median............................................................................................... 32
Modus................................................................................................ 33
Fraktil................................................................................................. 33
Ukuran Penyebaran/Dispersi............................................................... 33
B. Visualisasi Data........................................................................... 43
Histogram........................................................................................... 46
Box and Whisker Plot.......................................................................... 47
Diagram Dahan Daun (Stem and Leaf Plot)......................................... 49
Diagram Batang (Barplot).................................................................... 50
Diagram Pie (Pie Chart)....................................................................... 55
Quantile-Quantile Plot (QQ Plot).......................................................... 55
Diagram Pencar (Scatter Plot).............................................................. 56
Diagram Garis (Line Chart)................................................................. 58
Berinteraksi dengan Diagram............................................................... 61
Menyimpan Diagram.......................................................................... 64
Daftar Isi vii  

C. Pengenalan ggplot2...................................................................... 65
Geometric Objects dan Aesthetics........................................................... 65
Aesthetic Mapping............................................................................... 65
Geometic Objects (geom)....................................................................... 66
Studi Kasus......................................................................................... 66
D. Distribusi Peluang........................................................................ 72
Distribusi Gaussian (Normal)............................................................... 74
Distribusi Student’s t............................................................................ 78
Distribusi Binomial............................................................................. 79
Distribusi Poisson................................................................................ 81

Bab 3 Statistik Inferensia dan Uji Hipotesis............................................... 85


A. Hipotesis Statistik........................................................................ 85
B. Analisis Inferensi......................................................................... 87
C. Uji Beda Rata-Rata Satu Sampel (One Sample T Test)..................... 88
D. Uji Beda Rata-Rata Dua Sampel (Two Sample T Test).................... 90
Uji Beda Rata-Rata Dua Sampel Independen
(Unpaired Two Sample t-test)........................................................ 90
Uji Beda Rata-Rata Dua Sampel Berpasangan
(Paired Two Sample t-test)............................................................ 98

Bab 4 Analisis Ragam (Anova)..................................................................... 109


A. Anova Satu Arah (One-Way Anova)............................................... 110
B. Uji Perbandingan Ganda (Multiple Comparison)............................. 115
C. Anova Dua Arah (Two-Way Anova)............................................... 124

Bab 5 Analisis Korelasi dan Regresi............................................................ 131


A. Korelasi....................................................................................... 132
B. Regresi Linear Sederhana (RLS)................................................... 134
Penetapan Persamaan Regresi Linier Sederhana.................................... 134
Pengertian Estimasi Parameter............................................................. 138
Sifat-Sifat Estimator............................................................................ 138
C. Analisis Residual......................................................................... 141
Pengecekan Asumsi (Analisis Residual) Menggunakan Plot.................... 142
Koefisien Determinasi.......................................................................... 142
Latihan............................................................................................... 143
D. Analisis Regresi Linear Berganda................................................. 145
Persamaan Regresi Linier Berganda...................................................... 146
Uji Koefisien Regresi Simultan............................................................. 148
Uji Koefisien Regresi Parsial................................................................. 149
viii   Dasar-Dasar Statistika dengan Software R—Konsep dan Aplikasi

E. Aplikasi dengan R....................................................................... 149


F. Uji Asumsi Regresi Linear Berganda............................................ 151
Asumsi 1............................................................................................. 151
Asumsi 2............................................................................................. 151
Asumsi 3............................................................................................. 152
Asumsi 4............................................................................................. 152
Metode Pemilihan Model Regresi Terbaik.............................................. 159

Bab 6 Regresi Logistik................................................................................. 167


A. Pengertian Regresi Logistik.......................................................... 167
B. Pengujian Signifikansi Parameter................................................. 168
Uji Chi-square..................................................................................... 168
Uji Kesesuaian Model (Goodness of Fit Test)......................................... 169
Uji Simultan (Likelihood Ratio Test).................................................... 170
Uji Parsial (Wald Test)......................................................................... 170
Rasio Kecenderungan (Odds Ratio)....................................................... 171
C. Terapannya di R.......................................................................... 172
Hosmer Lemeshow Test (Goodness of Fit Test)....................................... 175
Odds Ratio.......................................................................................... 175

Bab 7 Pengenalan Pemrograman dengan R.............................................. 177


A. If-Statement................................................................................. 177
Ifelse Statements.................................................................................. 178
Switch................................................................................................. 178
B. Loop........................................................................................... 179
For-loop............................................................................................... 179
While.................................................................................................. 182
Repeat................................................................................................. 183
C. Apply.......................................................................................... 183
tapply()............................................................................................... 184
lapply dan sapply................................................................................. 185
D. Membuat Fungsi dalam R............................................................ 186
Fungsi Menampilkan Deret Fibonacci................................................... 187
Fungsi Membuat Tabel Perkalian......................................................... 188
E. Bekerja dengan Tipe Data String.................................................. 190
F. Manipulasi Data dengan Package dplyr........................................ 191
Instalasi package dplyr......................................................................... 191
Beberapa Fungsi Penting dalam dplyr................................................... 192
Penggunaan Verbs dplyr....................................................................... 192
Select.................................................................................................. 193
Daftar Isi ix  

Filter................................................................................................... 195
Arrange............................................................................................... 198
Summarise.......................................................................................... 199
Mutate................................................................................................ 200
Group by............................................................................................. 200
Piping................................................................................................. 201
Join ................................................................................................... 202

Bab 8 Pengenalan R Commander............................................................... 205


A. Instalasi R Commander............................................................... 205
B. Input Data................................................................................... 208
C. Import Data................................................................................ 210
D. Load Data................................................................................... 211
E. Manipulasi Active Dataset.................................................................. 213
Data Extraction................................................................................... 213
Data Aggregation................................................................................. 214
Export Active Dataset to TXT, DAT and CSV....................................... 215
F. Manipulasi Variable dan Data...................................................... 215
Recode................................................................................................ 216
Compute New Variable........................................................................ 217
Bin Numeric Variable (Pengelompokkan).............................................. 218
Standardized Variables......................................................................... 219
G. Analisis Statistik dan Grafik......................................................... 219

Bab 9 Analisis Data dengan R Commander: Statistik Deskriptif.............. 221


A. Ringkasan Numerik (Numerical Summaries)................................... 221
B. Distribusi Frekuensi..................................................................... 226
C. Tabel Statistik.............................................................................. 227
D. Matriks Korelasi dan Uji Korelasi................................................ 228
E. Uji normalitas Shapiro-Wilk........................................................ 232

Bab 10 Analisis Data dengan R Commander: Statistik Inferensia.............. 235


A. Analisis Data Kategorik............................................................... 235
Uji Proporsi Sampel Tunggal................................................................ 235
B. Tabel Kontingensi Dua Arah........................................................ 239
Uji Proporsi Dua Sampel..................................................................... 240
Chi-square test..................................................................................... 243
C. Uji Hipotesis................................................................................ 247
Uji Rata-Rata Satu Sampel (One sample t test)...................................... 247
Uji Rata-Rata Dua Sampel (two samples t-test)..................................... 250
x   Dasar-Dasar Statistika dengan Software R—Konsep dan Aplikasi

D. Analysis of Variances (ANOVA).................................................. 258


One-way ANOVA................................................................................ 258
Two-way ANOVA............................................................................... 261
Uji Varians......................................................................................... 264
E. Analisis Regresi........................................................................... 265
F. Analisis Regresi Logistik.............................................................. 269

Daftar Pustaka.................................................................................................. 275


Biodata Penulis................................................................................................. 277
Indeks ............................................................................................................... 281

View publication stats

Anda mungkin juga menyukai