KomputasiStatistik1 R.compressed

KOMPUTASI STATISTIK
1. MANAJEMEN DATA
Manajemen data di R dapat dilakukan dengan fasilitas (1) R-GUI, yaitu R-
Commander yang dapat diakses dengan mengaktifkan library Rcmdr dan (2)
menuliskan perintah melalui comment line di R‐Console.
A
1.1 MANAJEMEN DATA DENGAN R-COMMANDER
R (PACKAGE:: RCMDR)
AY
Langkah awal untuk manajemen data dengan R‐Commander
R Commander adalah melakukan
install package Rcmdr,, yaitu klik pada menu Tools kemudian pilih Install Packages,
AB
pilih Install From: Repository (CRAN). Kemudian ketikkan Rcmdr pada kolom Packages
(separate multiple with space or comma).Install
comma). packages demikian, dilakukan saat
R
terkoneksi internet. Aktifkan package dengan menuliskan perintah
library(Rcmdr)pada R-Console
>library(Rcmdr)
Console.
Setelah Rcmdr aktif, akan ada jendela baru

SU
baru seperti yang ditunjukkan oleh Gambar 1.1.
A
IP
N
U
K A
TI
IS
AT
Gambar 1.1 Tampilan R‐Commander

ST
Setelah package Rcmdr aktif, manajemen data dapat dilakukan, diantaranya:

data entry, editing, importing & exporting data,
data dan transforming dataset
dataset.
A. Data Entry
Data entry atau pengisian data dengan R‐Commander
R Commander dilakukan melalui menu
Data, pilih New Data Set,, ketik nama data pada kolom enter name for data set pada
jendela New data set,, klik OK (Gambar 1.2). Misalkan nama data adalah
Page 1
Prodi Statistika UNIPA Surabaya
data_penjualan.Setelah
Setelah klik OK, maka akan muncul jendela pertanyaan: Data set data
already exists. Overwrite data set? Pilih Yes (Gambar 1.3).
A
AY
AB
R
Gambar 1.2 Jendela New Data Set
SU
A
IP
N
Gambar 1.3 Dialog Overwrite Data

U
Gambar 4., merupakan jendela data editor untuk membuat variabel‐‐variabel yang ada
dalam data. Ketikkan judul kolom variabel pada V1. Untuk menambah baris dan kolom
A
klik add row dan add column.

column. Misalkan data yang berisikan nama keterangan produk
K
dan jumlah barang dari tiap produk ditampilkan pada Gambar 1.4.
TI
IS
AT
ST
Gambar 1.4 Jendela Data Editor
Page 2
Pada jendela R Commander terlihat bahwa dataset yang aktif adalah
data_penjualan (Gambar 1.5). Untuk menampilkan data yang telah dibuat, ketikkan
data_penjualan pada kolom R Script kemudian klik submit (Gambar 1.5). Maka, table
data_penjualan akan tampil pada kolom console pada jendela R Studio (Gambar 1.6).
A
AY
AB
Gambar 1.5 Tampilan R Commander setelah Data Entry
R
SU
A
IP
N
U
Gambar 1.6 Tampilan R‐console dengan data_penjualan

A
Selain itu, data data_penjualan juga dapat dilihat dengan mengeklik menu View data
K
set pada jendela R Commander pada Gambar 1.5.

TI
B. Editing data
IS
Editing data dapat dilakukan melalui klik menu Edit data set di sebelah dataset
yang aktif pada jendela R Commander
Commander seperti yang terlihat pada Gambar 1.5. Setelah
AT
mengeklik edit data set maka jendela data editor (Gambar 1.4) akan muncul kembali
dan proses editing dapat dilakukan.
ST
C. Importing data
Importing data dilakukan apabila data yang akan diolah tersimpan dalam for
format
data dari program lain, seperti file teks (clipboard), mc. Excel, spss, minitab, dan lain
sebagainya. Contoh importing data pada modul ini yaitu importing data dari program
excel. Langkah‐langkah
langkah yang importing data excel juga dapat diterapkan pada for
format
data program lainnya.
Page 3
Untuk mengimpor data, pilih menu data kemudian pilih import data
data, dan klik
from Excel file pada R Commander (Gambar 1.7). Setelah itu, ketikkan nama/judul
dataset pada kolom Enter name of data set pada jendela Import Excel Data Set.
Centang kotak Variables name in first row of spreadsheet (judul/nama variabel ada
pada baris pertama pada dataset excel) dan Convert character data to factors
(Gambar 1.8).
A
AY
AB
R
SU
Gambar 1.7 Jendela R Commander untuk Importing Data
A
IP
N
U
A
Gambar 1.8 Jendela Import Excel Data Set

K
Setelah jendela import excel data set di‐OK,

di OK, maka lakukan pencarian dataset dan
TI
pilih dataset tersebut dari direktori tersimpan. Setelah file dataset dipilih akan muncul
jendela select one table,, pilih sheet yang memuat dengan dataset. Pada
Pada R Commander
IS
terlihat bahwa dataset yang aktif berbeda dengan dataset sebelumnya. Untuk melihat
AT
data set hasil importing excel klik View data setpada R Commander.
Pengolahan data dilakukan dengan memilih data dari data set yang akan
ST
dianalisis. Untuk memilih data dari kumpulan dataset yang telah dibuat dan aktif
dilakukan dengan cara: (1) pilih menu data pada R Commander, (2) pilih active data
set, dan (3) klik select active data set,
set kemudian (4) pilih data yang akan dianalisis.
D. Transformasi Data Set

Transformasi dataset atau pengaturan variabel pada dataset dapat dilakukan
dengan memilih menu manage variables in active data set pada R Commander.
Page 4
Terdapat beberapa pilihan yang ada dalam menu tersebut, diantaranya recode
variables dan compute new variable.
variable
Recode variables adalah pilihan untuk mengode ulang variabel pada dataset
aktif. Misalnya dataset aktif yang terpilih adalah dataset data_penjualan. Akan dilakukan
recode untuk variabel jumlah.
jumlah Recode dilakukan dengan mengode nil
nilai‐nilai yang ada
dalam variabel jumlah ke dalam variabel baru dengan nilai yang berbeda.
A
Gambar 1.9, merupakan jendela recode variables yang muncul setelah
AY
mengeklik recode variables pada menu manage variables in active data set
set. Pilih
variabel yang akan di‐recode
recode pada kolom Variables to recode (pick one or more)
more), beri
AB
nama/judul variabel baru hasil recode pada kolom New variable name or prefix for
multiple recodes(misalkan
(misalkan jumlah_recode), isi kolom enter recode directives
directives,
R
dengan formula sebagai berikut:
SU
0:10 = 1 nilai kurang dari 10 pada variabel jumlah bernilai 1 pada variabel jumlah
jumlah‐
_recode.
11:15 = 2 nilai antara 11 dan 15 pada variabel jumlah bernilai 2 pada variabel
A
jumlah_recode.
IP
16:25 = 3 nilai antara 16 sampai 25 pada variabel jumlah bernilai 3 p

pada variabel
N
jumlah_recode.
U
K A
TI
IS
AT
ST
Gambar 1.9 Jendela Recode Variables
Page 5
A
AY
Gambar 1.10 data_penjualan dengan Variabel Recode: jumlah_recode
Hasil recode variables menambah variabel pada data_penjualan yang ditampilkan pada
Gambar 1.10.
AB
Selanjutnya adalah pilihan compute new variable(CNV) pada menu manage
variables in active data set.
set. CNV merupakan pilihan untuk membuat variabel baru
R
yang dihasilkan oleh fungsi operasi dari variabel yang sudah ada.
SU
A
IP
N
U
K A
Gambar 1.11.Jendela
1.11. Compute New Variable
Misalkan akan dibuat variabel baru dari variabel jumlah pada dataset
TI
data_penjualan dengan nama proporsi. Langkah‐langkah

langkah yang harus dilakukan setelah
IS
mengeklik CNV adalah (1) pilih variabel yang akan digunakan sebagai fungsi untuk
AT
variabel baru (dalam modul ini adalah jumlah),

), (2) ketikkan nama variabel baru pada
kolom New variable name (misal: proporsi), (3)
3) Ketikkan fungsi operasi yang akan
ST
digunakan pada kolom Expression to compute (dalam modul ini adalah proporsi
dengan rumus: jumlah/sum(jumlah), sum merupakan fungsi penjumlahan seluruh nilai
dalam satu kolom, jumlah),
), dan (4) klik OK(Gambar
OK 1.11). Gambar 1.12, menampilkan
data_penjualan terbaru setelah mendapatkan tambahan variabel proporsi
proporsi.
Page 6
A
Gambar 1.12 data_penjualan dengan Tambahan Variabel Proporsi
AY
1.2 MANAJEMEN DATA DENGAN COMMENT LINE
Comment line atau pada software R disebut R Console merupakan kolom khusus
AB
pada jendela R untuk menuliskan perintah. Selain dilakukan di R Commander,
manajemen data juga dapat dilakukan di R Console. Pada R, data memiliki sifat data
R
(atribut), yaitu tipe data dan mode data. Tipe data berupa vector
vector, matriks, list,
logical,numeric, complex,, dan character.Perbedaan SU

dataframe, array, factor, function (built in command).
). Sedangkan mode data meliputi
.Perbedaan dari tiap mode data adalah sebagai
A
berikut.
IP
 Logical : Mode data yang dihasilkan dari perbandingan antar objek yang
menghas
menghasilkan nilai kebenaran TRUE atau FALSE
N
U
K A
TI
 Numeric : Nilai desimal maupun bilangan bulat (integer)

IS
AT
 Complex : Suatu bilangan dengan penambahan nilai imajiner i misal: 2 + 2i

ST
Page 7
 Character : Objek string yang diawali dan diakhiri dengan tanda petik (“___”).
Fungsi as.character()digunakan
as.character()digunakan untuk mengubah mode data yang
lain menjadi mode character.
A
AY
Penamaan suatu objek dalam R yang dituliskan dalam R Console, harus dimulai
dengan huruf (dapat berupa
erupa kombinasi huruf besar dan huruf kecil, angka, dan
AB
titik).Perlu diingat bahwa penaaman suatu objek sensitive terhadap huruf besar dan
huruf kecil (A berbeda dengan a).Assignment
a). dilakukan dengan menambahkan <
<‐ atau
R
tanda = setelah nama objek. Tanda pagar
pagar (#) merupakan sebuah perintah bahwa
SU
keterangan setelah tanda # bukan merupakan suatu assignment yang harus diproses.
Beberapa tipe data dalam R, akan dijelaskan sebagai berikut.
A. Data berupa Vektor atau Array Satu Dimensi

A
Vektor atau array satu dimensi merupakan himpunan yang terdiri dari beberapa
IP
mode data (numeric, logical,

logical character,, dsb).Vector merupakan suatu bentuk data
N
tunggal.Vektor hanya terdiri dari satu mode data meskipun tersusun dari beberapa
U
mode data.
Function yang digunakan untuk membentuk suatu vector adalah c()atau
A
seq().seq() merupakan suatu function untuk membuat suatu vector yang

K
memungkinkan adanya increment dari suatu deret bilangan.

TI
IS
AT
ST
Page 8
A
AY
B. Data berupa Matriks
Jika vector merupakan data array satu dimensi, maka matriks dapat dikatakan
AB
sebagai data array dua dimensi. Matriks tersusun dari baris dan kolom dan elemen
suatu matriks merupakan mode data yang sama. Function yang digunakan untuk
R
membentuk suatu matriks adalah matrix().. Formula itu membentuk suatu matriks
SU
berukuran 1x1 adalah matrix(data, nrow=1, ncol=1).
ncol=1) Pengisian matriks baris perbaris
dilakukan dengan menggunakan perintah optionalbyrow=T pada function matrix().
A
IP
N
U
K A
TI
IS
Function length() untuk

ntuk mengetahui jumlah
jumlah elemen matriks sementara dim()
AT
digunakan untuk mengetahui dimensi matriks. Untuk mengetahui tipe data matriks
menggunakan function class().
class() Sedangkan function mode() digunakan untuk
ST
mengetahui mode matriks.
Matriks merupakan sebuah data yang memiliki

memiliki beberapa operasi matematika,
seperti perkalian (tanda * digunakan untuk operasi perkalian tiap elemen matriks dan
Page 9
tanda %*% digunakan untuk perkalian matriks), invers (menggunakan function
solve()),
), dan transpose (menggunakan function t()) yang dijabarkan
n sebagai berikut.
A
AY
Selain itu, terdapat function yang dapat digunakan untuk
AB
menambahkan/menggabungkan baris matriks dan kolom matriks, yaitu dengan
menggunakan function rbind() dan cbind().
R
SU
A
IP
N
U
C. Data berupa Data Frame

A
Data frame merupakan bentuk data yang hampir sama dengan matriks, yaitu
K
terdiri dari baris dan kolom. Perbedaannya adalah mode data pada data frame dapat
TI
berbeda untuk setiap kolom, sedangkan matriks harus memiliki mode data yang sama
IS
disetiap elemen kolom.

Data frame dapat diartikan suatu tabel dimana setiap kolom merupakan suatu
AT
variabel yang barisnya merupakan nilai‐nilai

nilai nilai dari variabel tersebut. Function yang
digunakan untuk membuat tabel dengan data frame adalah data.frame()
data.frame(). Function
ST
names()digunakan untuk memberi atau mengubah kolom/variabel dari tabel data

frame.
Page 10
A
AY
Terdapat beberapa perintah untuk mengektrasi bagian‐bagian
bagian bagian tertentu dari
sebuah data frame yang telah dibentuk. Misalkan dari data frame data_penjualan,
AB
ekstraksi data dilakukan untuk mengambil
me merek Asus yang dibeli oleh Anto, maka
perintah yang digunakan adalah:
R
> data_penjualan[2,2] #kolom ke-2
ke dan baris ke-2
SU
A
IP
N
Sedangkan untuk mengekstrak variabel merek digunakan perintah sebagai berikut.

U
> data_penjualan$merek
A
“merek”]
> data_penjualan[“merek”] #dalam bentuk vector
D. Data berupa Data List

K
Data list merupakan suatu vector. Berbeda dengan vector yang telah dijelaskan
TI
sebelumnya, yaitu hanya terdiri dari satu mode data, data list merupakan suatu vector
IS
yang setiap elemennya dapat terdiri dari

dari beberapa mode data atau bahkan tipe data
AT
yang berbeda. Function yang digunakan untuk membuat data list adalah list(). Seperti
halnya matriks maupun data frame, ekstraksi sebagain data list dapat dilakukan.
ST
Page 11
A
AY
AB
Function str() digunakan untuk mengetahui mode atau jenis data yang ada pada setiap
elemen data list.
R
SU
A
IP
N
U
K A
TI
IS
1.2.1 Importing Data

AT
Setelah mengetahui tipe dan mode data, Importing data juga dapat dilakukan
melalui comment line di R Console. Perlu diketahui bahwa setiap format file mempunyai
ST
tipe file (extension)) yang berbeda.
Format ASCII dengan pemisah koma memiliki tipe file *.csv, tipe file dengan
pemisah tab adalah *.txt, dan *.dat untuk pemisah spasi.Excel memiliki tipe file *.xls,
SPSS memiliki tipe file *.sav, minitab memiliki tipe file *.mtw, sedangkan stata memiliki
tipe file *.dta.
A. Membaca File ASCII
Page 12
ASCII merupakan suatu standar internasional dalam kode huruf dan simbol
seperti Hex dan Unicode tetapi ASCII lebih bersifat universal, contohnya 124 adalah
untuk karakter "|". ASCII selalu digunakan oleh komputer dan alat komunikasi lain
untuk menunjukkan teks. Bilangan‐bilangan
Bilangan dalam file ASCII dipisahkan oleh spasi, tab,
tanda akhir baris atau tanda baris baru, serta pembatas yang lain (Suhartono,
Suhartono, 2008).
Terdapat beberapa cara yang dapat digunakan untuk meng‐import
import data dari file
A
ASCII ke dalam bentuk file R. Misalkan data tersimpan dalam format data *.txt yang
AY
tersimpan dalam notepad, yang berupa data sebagai berikut.
1 2 3 4 5 6 7 8 9 10
AB
11 12 13 14 15 16 17 18 19 20
Importing data
ta dengan bentuk data demikian dapat dilakukan dengan beberapa
R
cara, yaitu dengan menggunakan function scan(), read.table(), dan read.delim()
read.delim().
SU
A
IP
Function read.table() dan read.delim() juga dapat digunakan jika data berupa
N
tabel atau data frame. read.table() merupakan suatu function yang digunakan apabila
U
data tersimpan dalam tipe file *.txt dan pemisah kata berupa satu atau beberapa spasi,
tab, maupun enter. Jika data telah tersimpan di suatu direktori maka argumen dalam
A
function menggunakan direktori

ktori data tersimpan.
K
>data= read.table("d:\\- UNIPA\\MODUL R\\1. \3.

materi_konsep\\ AD-importing
TI
notepad.txt",header=TRUE)
IS
AT
Akan tetapi, apabila data belum tersimpan di suatu direktori manapun, langkah yang
ST
harus dilakukan adalah blok semua data yang ada di notepad kemudian copy data (Ctrl
+ C), kemudian ketikkan functionread.table(“clipboard”,
read.table(“clipboard”, header=TRUE) pada R
Console dan tekan enter.
Page 13
Function read.delim() digunakan hanya jika pemisah kata berupa tab. Function ini
dapat digunakan baik ketika data telah tersimpan maupun belum tersimpan. Langkah
yang harus dilakukan sama seperti pada function read.table().. Argumen headerpada
A
read.delim() tidak perlu dituliskan sebab default R telah menentukan bahwa baris
AY
pertama pada
ada tabel merupakan nama kolom/variabel.
AB
R
SU
B. Importing Data dari File Excel
Untuk mengimpordata dari file excel menggunakan comment line pada R
A
Console, tipe file harus diubah menjadi *.txt atau *.csv. Data dapat diimpor melalui
IP
function read.table() jika data disimpan dalam tipe file *.txt atau read.csv() jika tipe
file *.csv.
N
U
K A
TI
Apabila data belum tersimpan di direktori manapun, maka langkah

langkah‐langkah yang
IS
harus dilakukan untuk mengimpor data sama seperti mengimpor data di notepad.
AT
Langkah‐langkah yang harus dilakukan adalah blok semua data yang ada di worksheet
excel kemudian copy data (Ctrl + C), kemudian ketikkan
ST
functionread.table(“clipboard”,
read.table(“clipboard”, header=TRUE) atau read.delim(“clipboard) pada R
Console dan tekan enter.
Untuk menampilkan beberapa baris saja
saja dari suatu data maka gunakan perintah
data3[1:5,].. Sementara untuk menampilkan beberapa kolom menggunakan perintah
data3[,1:2].
Page 14
A
AY
AB
C. Importing Data dari Software Statistik
R
Sebelum melakukan importing data dari software statistic ke dalam R, paket ((package)
SU
foreign harus diinstall dan diaktifkan melalui library(foreign).. Setiap format file
software statistik memiliki function yang berbeda dengan software statistik lainnya.
1. Minitab : read.mtp untuk mengimpor file minitab *.mtw
A
2. SPSS : read.spss untuk mengimpor file SPSS *.sav
IP
3. SAS : read.ssd atau read.xport

N
4. S+ : read.S
U
5. Stata : read.dta
6. Sytat : read.sytat
K A
TI
IS
AT
ST
Berikut ini merupakan perbedaan beberapa function yang dapat digunakan

untuk mengimpor data dalam semua format data (kecuali software statistik):
Page 15
read.table() digunakan jika pemisah kata berupa satu atau beberapa spasi, tab, enter
atau lainnya (argumen sep).
sep). Jika data berupa numerik maka desimal (argumen dec)
disimbolkan dengan titik (.). Jika header tidak didefinisikan dalam function maka baris
pertama tidak dianggap sebagai nama kolom/variabel melainkan nilai tabel itu sendiri.
Sehingga jika menginginkan baris pertama sebagai nama kolom maka perlu
didefinisikan header=TRUE.
header=TRUE
A
read.csv() digunakan jika pemisah kata berupa koma (,), desimal
desimal disimbolkan dengan
AY
tanda titik (.) dan baris pertama pasti dianggap sebagai nama kolom tanpa perlu
mendefinisikan argumen header.
AB
Read.csv2() digunakan jika pemisah kata berupa titik koma (;), desimal disimbolkan
dengan tanda koma (,) dan baris pertama pasti dianggap sebagai nama kolom tanpa
R
perlu mendefinisikan argumen header.
SU
Read.delim() digunakan jika pemisah kata berupa titik tab, desimal disimbolkan
dengan tanda titik (.) dan baris pertama pasti dianggap sebagai nama kolom tanpa perlu
A
mendefinisikan
an argumen header.
IP
Read.delim2() digunakan jika pemisah kata berupa titik tab, desimal disimbolkan
N
dengan tanda koma (,) dan baris pertama pasti dianggap sebagai nama kolom tanpa
U
perlu mendefinisikan argumen header.

A
Selain impor dari format file seperti yang

yang telah dijelaskan, adapula package
K
RODBCmerupakan package yang harus di‐install dan diaktifkan terlebih dahulu jika
TI
ingin mengimpor file dari format database seperti Microsoft Access, termasuk format
database dalam excel. Formula yang digunakan untuk mengimpor
mengimpor format file database
IS
dari excel adalah sebagai berikut.

AT
>library(RODBC)
namafile.xls")
>data=odbcConnectExcel("namafile
ST
, "mysheet")
>dataku=sqlFetch(data,
>odbcClose(data)
Sedangkan untuk mengimpor file database dari access, formula yang digunakan adalah
sebagai berikut.
>library(RODBC)
namafile.xls")
>data=odbcConnectAccess("namafile
, "mysheet")
>dataku=sqlFetch(data,
>odbcClose(data)
Page 16
1.2.2 Exporting Data
Ekspor data dilakukan untuk menyimpan file data R ke format file lain. Ekspor data
membutuhkan package khusus yang perlu di‐install yaitu, xlsReadWrite
xlsReadWriteuntuk ekspor
data ke excel, untuk ekspor data ke Excel Spreadsheet dibutuhkan packagexlsx, dan
foreign untuk ekspor data ke software statistik lainnya (SPSS, Minitab, SAS, dsb).
>library(xlsReadWrite) #ekspor ke excel
>library(xlsx)
library(xlsx) #ekspor ke spreadsheet excel
A
>library(foreign) # ekspor ke software statistik
>write.xls(NamaDataDalamR,”c:/NamaData.xls”) # ekspor data dalam bentuk excel
AY
>write.table(NamaDataDalamR,”c:/NamaData.txt”,sep=” t”) # ekspor data dalam bentuk txt
>write.table(NamaDataDalamR,”c:/NamaData.txt”,sep=”\t”)
>write.foreign(NamaDataDalamR,”c:/NamaData.txt”
NamaDataDalamR,”c:/NamaData.txt” "c:/NamaData.sas",
.sas", package="SAS") #ekspor
data dalam SAS
AB
2. PENGUJIAN NORMALITAS DAN HOMOGENITAS DATA
2.1 Pengujian Normalitas Data
R
Pengujian normalitas data melalui software R dilakukan dengan menginstall dan
SU
mengaktifkan package nortest.Pengujian
nortest.Pengujian normalitas data dengan package tersebut
meliputi: (1) Uji Anderson‐Darling
Anderson dengan function ad.test(),, (2) Uji Shapiro
Shapiro‐Wilk
dengan function Shapiro.test(),
Shapiro.test() dan (3) Uji Kolmogorov‐Smirnov
rnov dengan function
A
lillie.test().. Hipotesis dalam pengujian normalitas adalah sebagai berikut.
IP
H0 : Data berdistribusi normal, X ~ N (  ,  2 )

N
H1 : Data tidak berdistribusi normal

U
Data yang akan digunakan sebagai contoh aplikasi pengujian normalit

normalitas data di
R adalah data iris pada variabel Sepal.Length. Misalkan data didefinisikan oleh variabel
A
SL. Untuk melakukan pengujian dengan R‐Commander

R Commander data dibentuk menjadi data
K
frame terlebih dahulu. Pengujian normalitas dengan ketiga pengujian tersebut juga
TI
dapat dilakukan melalui fasilitas R-Commander.

IS
>iris
> SL=iris$Sepal.Length
AT
> SL=data.frame(SL) #bentuk data sebagai data frame
Setelah data set diaktifkan, yaitu pilih data SL pada menu active data set, untuk
ST
menguji normalitas pilih menu statistics kemudian summaries

iesdan klik test of
normality(Gambar 2.1).
Page 17
A
Gambar 2.1 Menu Test of Normality pada R‐Commander
AY
Pada jendela Test of Normality (Gambar 2.2) diketahui bahwa terdapat
beberapa pilihan pengujian normalitas data, default menggunakan Uji Shapiro
Shapiro‐
AB
Wilk.Pada modul ini, data SL dengan R-Commander dilakukan dengan Uji Shapiro
Shapiro‐
Wilk.Hasil pengujian ditampilkan pada R‐Console
R Console pada Gambar 2.3.B
2.3.Berdasarkan hasil
R
pengujian Shapiro‐Wilk
Wilk yang disajikan pada Gambar 2.3, diketahui bahwa data SL tidak
berdistribusi normal karena P‐Value
P kurang dari 5%.
SU
A
IP
N
U
K A
TI
Gambar 2.2 Jendela Test of Normality

IS
AT
ST
Gambar 2.3 Output Test of Normality dengan Shapiro‐Wilk

Shapiro dengan R‐Commander
Uji normalitas data SL melalui comment line dilakukan dengan uji Kolmogorov
Kolmogorov‐
Smirnov. Pengujian normalitas dengan comment line tidak bisa dilakukan jika bentuk
data adalah data frame. Hasil uji Kolmogorov‐Smirnov
Kolmogorov Smirnov yang disajikan pada Gamba
Gambar 2.4
disimpulkan bahwa data tidak berdistribusi normal.
Page 18
Gambar 2.4 Output Uji Kolmogorov‐Smirnov
Kolmogorov dengan Comment Line
A
2.2 Pengujian Homogenitas Data
AY
Uji homogenitas data merupakan uji kesamaan varians. Dalam R, uji
homogenitas data dapat dilakukan melalui R-Commander dan R-Console
Console. Fasilitas uji
AB
homogenitas data yang disediakan oleh R adalah, uji F dua variansi, Uji Bartlett, dan Uji
Levene. Melalui R‐Commander,
Commander, pengujian homogenitas ada pada menu statistics,
R
variances,, dan pilih metode pengujian yang akan dilakukan (Gambar 2.5).
SU
A
IP
N
U
A
Gambar 2.5 Uji Homogenitas Data dalam R‐Commander

K
Data yang akan digunakan diambil dari data bawaan R, yaitu data sleep. Data
TI
sleep merupakan data yang menunjukkan pengaruh pemberian obat tidur terhadap
penambahan lama tidur. Terdapat
Ter tiga variabel, yaitu (1) extra menunjukkan
IS
bertambah atau berkurangnya lama tidur, (2) group menunjukkan jenis obat yang
AT
diberikan, dan (3) ID adalah identitas pasien.

Uji homogenitas data dilakukan untuk mengetahui homogenitas varians dari
ST
lama tidur yang dihasilkan oleh masing‐masing

masing masing jenis obat tidur. Untuk melakukan
pengujian melalui R-Commander
Commander data dibentuk menjadi sebuah data frame dengan
namasleepd.
>data(“sleep”) #memanggil data
>sleepd=data.frame(sleep)
Hipotesis yang digunakan adalah sebagai

seb berikut.
Page 19
H0 : Varians obat tidur jenis 1 sama dengan obat tidur jenis 2 (Varians homogen)
 12   22
H1 : Varians obat tidur jenis 1 tidak sama dengan obat tidur jenis 2 (Varians tidak
homogen)
 12   22
2.2.1 Uji F Dua Varians
A
Commander terbuka, pilih data sleepd
Setelah jendela R‐Commander sleepdsebagai active
AY
datasetdan pilih Two-Variances
Variances F-Test(TF)setelah
F setelah melakukan tahapan seperti
Gambar 2.5. Jendela dialog TF dengan menu Data dan Optionsakan
akan tampil seperti pada
AB
Gambar 2.6. Pilih variabel yang
y bertindak sebagai grup pada kolom Groups (pick one)
dan pilih variabel respon pada kolom Response Variable (pick one).. Sedangkan menu
R
options digunakan
akan untuk menentukan hipotesis alternatif (H1).
SU
A
IP
N
U
(a)
K A
TI
IS
AT
(b)
Gambar 2.6 Jendela Two Variances F‐Test
F (a) Data, (b) Options
ST
Pengujian dengan comment line dituliskan sebagai berikut.

>var.test(sleep$extra~sleep$group,alternative="two.sided",conf.level=0.95)
Terdapat argumen alternative pada function var.test(),, yang digunakan untuk

menentukan hipotesis alternatif. Untuk hipotesis dua arah gunakan argumen
two.sided, less untuk selisih < 0, dangreater
dan untuk selisih > 0.
Page 20
Kesimpulan yang dihasilkan dengan uji TF baik melalui R‐Commander
R Commander ataupun
comment line adalah varians antara obat tidur jenis 1 dan jenis 2 sama, atau varians
diantara keduanya homogen (Gambar 2.7).
A
AY
AB
R
2.2.2 Uji Bartlett
SU
Gambar 2.7 Output uji TF
A
Uji Bartlett dapat digunakan jika sampel yang akan diuji lebih dari dua. Sebagai
IP
contoh kasus dengan sampel lebih dari dua, data yang digunakan adalah data bawaan R,
N
yaitu InsectSprays.
U
Data tersebut menginformasikan tentang jumlah serangga yang digunakan

(count)) untuk setiap insektisida yang berbeda (spray).Ada
( ).Ada enam jenis inse
insektisida yang
A
digunakan.Pengujian homogenitas dilakukan untuk mengetahui kesamaan varians dari

K
jumlah serangga yang digunakan dari keenam jenis insektisida.

insektisida.Hipotesis yang
TI
digunakan sebagai berikut.

IS
H 0 :  12   22     62
AT
H 1 : minimal ada satu  i2   2j

ST
Gambar 2.8 Jendela Bartlett’s Test
Page 21
Pengujian homogenitas melalui R‐Commander
R Commander dilakukan dengan memilih
Bartlett’s test pada Gambar 2.5, kemudian menentukan variabel
variabel‐variabel yang
digunakan sebagai variabel faktor dan variabel respon (Gambar 2.8). Sebelumnya
definisikan data sebagai data frame
frame agar dapat diolah melalui R
R‐Commander.
Sedangkan pengujian melalui comment line,, dilakukan dengan perintah sebagai berikut.
>bartlett.test(InsectSprays$count,
bartlett.test(InsectSprays$count, InsectSprays$spray)
A
AY
AB
R
SU
A
Gambar 2.9 Output Bartlett’s Test
IP
Output yang diperoleh ditampilkan pada Gambar 2.9.Berdasarkan hasil

pengujian dengan Bartlett’s test diketahui bahwa varians dari keenam jenis insektisida
N
tidak homogen karena P‐Value

Value yang dihasilkan sangat kecil (kurang dari 5%).
U
2.2.3 Uji Levene

A
Sama halnya dengan uji Bartlett, uji Levene dapat digunakan untuk menguji
K
kesamaan varians dari beberapa sampel. Data yang digunakan sama seperti pada
TI
pengujian dengan Bartlett’s test, yaitu InsectSprays. Setelah melalui tahapan pada
IS
Gambar 2.5 akan muncul jendela seperti Gambar 2.10 yang digunakan untuk memilih
variabel sebagai faktor dan sebagai respon.
AT
ST
Gambar 2.10 Jendela Levene’s Test
Page 22
Untuk melakukan pengujian melalui comment line,function
function yang digunakan
adalah leveneTest(). Perintah yang dituliskan melalui R-Console
Consoleadalah sebagai
berikut.
>leveneTest(InsectSprays$count,
leveneTest(InsectSprays$count, InsectSprays$spray)
Output yang dihasilkan baik melalui R-Commander maupun comment line

ditampilkan pada Gambar 2.11.Berdasarkan informasi pada Gambar 2.11 diketahui
A
bahwa hasil pengujian dengan uji levene menyatakan bahwa vvarians keenam
AY
insektisida tidak homogen.
AB
R
SU
A
Gambar 2.11 Output Levene’s Test
IP
3. PENGUJIAN HIPOTESIS RATA-RATA SATU SAMPEL

N
Pengujian hipotesis rata‐rata

rata dilakukan dengan uji t. Misalkan pada data sleep
U
seperti yang telah digunakan pada subbab 2.2, diduga bahwa rata
rata‐rata lama tidur
A
pasien yang mengonsumsi obat tidur jenis apapun bertambah selama 2 jam. Uji rata
rata‐
K
rata satu sampel dengan uji t dilakukan untuk mengetahui kebenaran hipotesis
TI
tersebut.Hipotesis yang digunakan adalah sebagai berikut.

H0 :   2
IS
H1 :   2
AT
Uji rata‐rata
rata satu sampel dengan R‐Commander
R Commander dilakukan melalui menu
Statistics, pilih Means,, dan pilih Single sample t-test (Gambar 3.1). Kemudian akan
ST
muncul jendela seperti Gambar 3.2. Pada kolom Variable (pick one) pilih extra yang
akan diuji rata‐ratanya,
ratanya, inputkan nilai hipotesis rata‐rata,
rata rata, yaitu 2 pada kolom Null
hypothesis: mu=, dan
n pilih hipotesis alternative yang akan digunakan (pada modul ini
pilih Population mean !=mu0.
!=mu0
Uji rata‐rata
rata satu sampel dengan comment line, dilakukan
kukan dengan function
t.test().. Perintah yang dituliskan adalah sebagai berikut.
Page 23
>t.test(sleep$extra, alternative='two.sided', mu=2 conf.level=.95)
A
AY
Gambar 3.1 Uji Rata‐Rata dalam R‐Commander
AB
R
SU
A
IP
Gambar 3.2 Jendela Single‐Sample t‐Test

N
P‐Value yang dihasilkan dari uji t sebesar 0.3208 (lebih besar dari 5%). Oleh
U
karena itu dapat disimpulkan bahwa rata‐rata

rata lama tidur pasien yang mengonsumsi
obat tidur bertambah selama 2 jam adalah benar (Gambar 3.3).
K A
TI
IS
AT
ST
Gambar 3.3 Output Uji t‐ Rata‐rata Satu Sampel
Page 24
4. PENGUJIAN HIPOTESIS RATA-RATA SAMPEL INDEPENDEN DAN BERPASANGAN
4.1 Pengujian Hipotesis Rata-rata
Rata Sampel Independen
Pengujian hipotesis rata‐rata
rata rata sampel independen atau saling bebas adalah
pengujian untuk membandingkan
embandingkan nilai rata‐rata
rata rata dari dua kelompok tertentu (yang
dipilih secara acak) yang disebabkan oleh perlakuan berbeda yang diberikan di tiap
kelompok.
A
Berdasarkan data sleep,
sleep, terdapat dua kelompok pasien dimana setiap kelompok
AY
diberikan dua jenis obat tidur yang berbeda, obat jenis 1 dan obat jenis 2. Berdasarkan
pemberian kedua jenis obat tersebut, diduga bahwa penambahan lama tidur obat jenis
AB
1 lebih banyak daripada penambahan lama tidur obat jenis 2.Hipotesis yang diberikan
adalah sebagai berikut.
R
H 0 : 1   2
H 1 : 1   2
pengujian melalui R-Commander

SU
Uji independen dengan uji t digunakan untukmenguji hipotesis tersebut. Proses
Commander dilakukan setelah data terbentuk menjadi data frame
A
yang telah dibentuk pada subbab 2.2, yaitu sleepd.. Setelah dataset diaktifkan, pengujian
IP
independen sampel t‐test

test dapat dilakukan
dilakukan dengan memilih menu Independent
N
samples t-test seperti Gambar 3.1.

U
Gambar4.1 merupakan jendela Independent Samples t-test dengan menu data

dan options.Menu data digunakan untuk memilih variabel yang diuji.Pilih variabel
A
group data sleepd pada kolom Groups (pick one) dan pilih variabel extra sebagai
K
variabel respon. Sedangkan menu options digunakan untuk menentukan hipotesis

TI
alternative (pada modul ini pilih Difference > 0),

), selang kepercayaan, dan asumsi
IS
homogenitas varians. Pada subbab 2.2.1,

2.2.1, telah didapatkan kesimpulan bahwa varians
kedua jenis obat tidur sama. Oleh karena itu, pilih Yes pada kolom pertanyaan assume
AT
equal variances?.
ST
(a)
Page 25
A
(b)
Gambar 4.1Jendela Independent Samples t‐Test
AY
Uji rata‐rata
rata sampel independen melalui comment line menggunakan function
t.test(). Terdapat argumen logical,
logical yaitu var.equalsama dengan TRUE jika varians data
AB
diasumsikan sama, sedangkan FALSE jika varians data kedua kelompok tidak sama.
Perintah dalam comment line dituliskan sebagai berikut.
R
>t.test(sleep$extra~sleep$group,
sleep$extra~sleep$group, alternative='greater', conf.level=.95,
SU
var.equal=TRUE,data=sleep)
A
IP
N
U
K A
Gambar 4.2Output
4.2 Uji t‐ Rata‐rata Sampel Independen
TI
Berdasarkan output yang dihasilkan oleh uji t sampel independen, diperoleh

IS
kesimpulan bahwa H0 gagal ditolak, karena P‐Value

P Value bernilai besar (Gambar 4.2).
AT
Sehingga dapat diartikan bahwa penambahan lama tidur obat jenis 1 tidak lebih banyak
daripada penambahan lama tidur obat jenis 2.
ST
4.2 Pengujian Hipotesis Rata-Rata

Rata Sampel Berpasangan
Uji hipotesis sampel
pel berpasangan digunakan untuk membandingkan
membandingkan nilai rata
rata‐
rata dari indivual/objek yang sama, akan tetapi memiliki subjek yang berbeda. Subjek
berbeda terjadi atas perlakuan yang berbeda.Dengan
berbeda.Dengan kata lain, uji hipotesis sampel
berpasangan merupakan pengujian untuk menguji apakah terdapat perbedaan pada
Page 26
satu individu sebelum dan sesudah dilakukan suatu perlakuan.
perlakuan. Uji hipotesis rata
rata‐rata
sampel berpasangan menggunakan uji t.
Uji t untuk hipotesis rata‐rata
rata rata sampel berpasangan dengan R, dapat dilakukan
melalui R‐Commander
Commander dan comment line seperti uji hipotesis lainnya yang telah
dijelaskan. Akan tetapi, struktur data yang digunakan pada uji sampel berpasangan
berbeda dengan uji sampel independen.
A
Sebagai contoh kasus, data yang digunakan adalah data sleepdengan
AY
memisalkan data tersebut merupakan data kualitas sebuah obat tidur. Variabel extra
merupakan lama tidur pasien sebelum dan sesudah diberikan obat tidur.
tidur.Variabel
AB
Group merupakan
pakan informasi pemberian obat tidur, dimana nilai 1 menyatakan lama
tidur pasien sebelum diberikan obat tidur dan nilai 2 merupakan lama tidur pasien
R
setelah diberi obat tidur.Pabrik ingin mengetahui kualitas obat tidur terhadap
SU
penambahan lama tidur dari 10 pasien,, dengan dugaan pemberian obat tidur dapat
menambah lama tidur pasien.Hipotesis
pasien Hipotesis yang digunakan adalah sebagai berikut.
H 0 : 1( tanpa obat tidur )   2 ( dengan obat tidur )
A
H 1 : 1( tanpa obat tidur )   2( dengan obat tidur )
IP
Seperti yang telah disebutkan sebelumnya, struktur data untuk uji t sampel
N
berpasangan berbeda dengan uji

uji t sampel independen. Untuk itu diperlukan perubahan
U
struktur data dengan cara seperti yang ditampilkan pada Gambar 4.3. Struktur data
sleep yang baru dinamai dengan sleepB.
K A
TI
IS
AT
ST
Page 27
A
AY
AB
R
SU
A
IP
Gambar 4.3 Perubahan Struktur Data Sleep

N
Setelah mengaktifkan data set sleepB,, analisis dengan menggunakan R

R‐
U
Commander dilakukan dengan memilih Paired t-test seperti Gambar 3.1. dapat dilihat
A
pada jendela R-Commander

Commander,, adanya perubahan struktur data menyebabkan fasilitas
K
pengujian independent samples t‐test,

t one‐way ANOVA, dan multi‐way
way ANOVA menjadi
TI
non‐aktif.
IS
Pada jendela Paired t-Test(Gambar

t 4.4), pilih variabel tanpaObat sebagai
variabel pertama dan denganObat sebagai variabel kedua pada menu Data. Kemudian,
AT
pada menu Options,, pilih hipotesis alternatif Difference < 0,, sesuai dengan hipotesis
yang telah ditentukan sebelumnya.Setelah itu, tentukan selang kepercayaan yang
ST
diinginkan (pada modul ini 95%).
Page 28
(a)
A
AY
AB
R
SU
(b)
Gambar 4.4 Jendela Paired t‐Test
Selain menggunakan R‐Commander,

R Commander, uji t sampel berpasangan juga dapat
A
dilakukan melalui function t.test() yang dituliskan pada R‐Console.
Console. Argumen logical
IP
yang harus dituliskan pada formula t.test()adalah paired sama dengan TRUE untuk
N
menyatakan bahwa pengujian

an yang dilakukan adalah sampel berpasangan.
U
t.test(sleepB$tanpaObat,sleepB$denganObat, alternative='less',conf.level=.95, paired=TRUE)

>t.test(sleepB$tanpaObat,sleepB$denganObat,
Berdasarkan hasil analisis dengan menggunakan uji t sampel berpasangan,

A
diketahui bahwa P‐Value

Value yang dihasilkan kecil.Oleh
kecil.Oleh karena itu dapat disimpulkan
K
bahwa H0 ditolak.Artinya, terjadi penambahan lama tidur setelah pasien meminum obat
TI
tidur (Gambar 4.5).

IS
AT
ST
Gambar 4.5
4. Output Uji t‐ Rata‐rata Sampel Berpasangan
Page 29
5. ANALISIS REGRESI
Regresi linier adalah suatu metode analisis untuk mengetahui hubungan
fungsional antar variabel.Regresi linier dibedakan menjadi dua, yaitu regresi linier
sederhana dan regresi linier berganda.
5.1 REGRESI LINIER SEDERHANA
A
Regresi linier sederhana merupakan metode regresi yang hanya memiliki satu
AY
peubah bebas (variabel prediktor).Secara
prediktor). matematis, regresi linier sederhana dituliskan
sebagai berikut.
AB
Y   0  1 X  

Y   0  1 X
R
Dengan
Y

respon) SU
: Nilai pengamatan dari variabel tak bebas (variabel dependen/variabel
A
Y : Nilai ramalan/prediksi dari variabel tak bebas (variabel dependen/variabel
IP
respon)
X : Nilai pengamatan dari variabel bebas (variabel independen/variabel
N
prediktor)
U
0 : intersep atau konstanta

konstan
A
1 : slope atau koefisien kemiringan model regresi

K
 : error atau nilai kesalahan prediksi

TI
Paket (package)) untuk analisis regresi dengan bantuan software R biasanya telah ter
ter-
IS
install otomatis dalam software (package stats).

Contoh aplikasi analisis regresi dengan software R menggunakan data: waktu
AT
yang diperlukan untuk memroduksi suatu produk (run

( time/rt)
/rt) dan jumlah produk
ST
yang akan di produksi (run

run size/rs),
size ), data dipilih secara acak, dan didapatkan 20 jenis
produk (Sheather, ____).. Dalam modul ini akan diteliti apakah jumlah produk yang
diproduksi (disebut sebagai variabel prediktor X)) memengaruhi waktu produksi
(disebut sebagai variabel respon Y).
Langkah‐langkah, syntax,
syntax output, dan interpretasi output yang dilakukan untuk
analisis regresi dengan software R adalah sebagai berikut.
Page 30
1. Membuat data frame
Misalkan data frame yang dibuat diberi namaproduction
nama yang mempunyai dua
variabel: variabel Y,, yaitu run time (rt) dan variabel X adalah run size (rs). Perin
Perintah‐
perintah yang digunakan sebagai berikut.
>production<- data.frame(rt=c(195, 215, 243, 162, 185, 231, 234, 166, 253, 196, 220, 168,
207, 225, 169, 215, 147, 230, 208, 172), rs=c(175, 189, 344, 88, 114, 338, 271, 173, 284,
277, 337, 58, 146, 277, 123, 227,
22 63, 337, 146, 68))
A
> #untuk memanggil data, gunakan perintah “nama data frame”, yaitu production
>production
AY
AB
R
SU
A
IP
Gambar 5.1 Function dan Output Data Frame Production

N
Gambar 5.1 menampilkan data frame dari data production, yang meliputi data
U
run time (rt)) dan run size (rs) masing‐masing

masing masing sebanyak 20 observasi jenis produk.
A
2. Membuat scatter plot dan analisis korelasi untuk data production

K
Function yang digunakan untuk membuat scatter plot adalah plot. Tanda ~
TI
merupakan tanda yang digunakan untuk menjalankan

menjalankan proses regresi.Formula yang
digunakan adalah variabel respon ~ variabel predictor 1+variabel predictor
IS
2+…+variabel predictor p.
AT
>plot(rt ~ rs, data = production, xlab="run size", ylab="run time", main="productivity")

ST
Page 31
A
AY
Gambar 5.2 Scatterplot antara Run Size (X) dan Run Time (Y)
AB
> #xlab, ylab, dan main merupakan perintah untuk memberi judul
>cor.test(production$rt,production
production$rs)
R
SU
A
IP
Gambar 5.3 Function dan Output Matriks Korelasi antara X dan Y

Gambar 5.2 menampilkan scatterplot antara variabel X dan variabel Y dari 20
N
data observasi. Berdasarkan Gambar 5.3 diketahui nilai korelasi antara X dan Y sebesar
U
0.854, menunjukkan bahwa terdapat hubungan positif antara variabel X dan Y. p‐value
A
dari pengujian pearson correlation (1.615e‐06)

06) lebih kecil dari   5% sehingga
K
hubungan antara variabel X dan Y signifikan secara statistik.

TI
3. Membuat model regresi dari data production

IS
Function yang digunakan untuk membuat model regresi adalah lm. Misalkan
“reg” adalah nama untuk model regresi yang terbentuk.
AT
>reg<- lm(rt ~ rs, data=production)

> #gunakan perintah “reg” untuk memanggil output
>reg
ST
Gambar 5.4Formula
5.4 dan Output Model Regresi
Page 32
Berdasarkan Gambar 5.4
5 diketahui bahwa model regresi dari data production,
yaitu hubungan antara jumlah produk (X)
( dan lama produksi (Y)) adalah sebagai berikut.
Yˆ  149.747  0.259 X
Dari model regresi tersebut, diketahui bahwa terdapat hubungan positif antara variabel
X dan Y yang ditunjukkan oleh nilai slope positif sebesar 0.259.Nilai slope tersebut
diartikan sebagai rata‐rata
rata kenaikan waktu produksi (Y)
( ) sebesar 0.259 satuan waktu
A
akibat kenaikan per satuan jumlah produk (X).
(
AY
Function summary digunakanuntuk
digunakanu resi data production lebih
melihat hasil regresi
lengkap. Beberapa
eberapa informasi yang diberikanadalah nilai residual, koefisien regresi
AB
beserta nilai signifikansi (p‐value), nilai nilai untuk uji kebaikan model
value), dan nilai‐
>summary(reg)
R
SU
A
IP
N
U
Gambar 5.5
5Function dan Output Summary dari Model Regresi
egresi
A
Nilai minimum dan maksimum residual yang dihasilkan oleh model regresi
K
sebesar ‐28.597
28.597 dan 29.627. Berdasarkan hasil uji t pada Gambar 5.5
5.5, diketahui bahwa
TI
jumlah produk (X)) berpengaruh signifikan terhadap waktu produksi ((Y). Hal tersebut
IS
disebabkan p‐value
value dari uji t (sebesar 1.61e‐06)
1.61e lebih kecil dari   5% . Nilai Adjusted R
AT
squared menunjukkan bahwa variabel prediktor (X)

( ) mampu menjelaskan varians dari
variabel respon (Y)) sebesar 71.52%, persen sisanya dijelaskan
dijelaskan oleh variabel lain
ST
(Gambar 5.5).
Gambar 5.6
6 merupakan plot dengan garis regresi antara X dengan Y,
menunjukkan variasi observasi yang kecil dari garis regresi yang terbentuk.
Page 33
A
Gambar 5.6 Plot dengan Garis Regresi
AY
Gambar 5.6
6 dapat diperoleh dengan menggunakan formula‐formula
formula berikut.
AB
>plot(production$rs, production$rt, xlab="run size", ylab="run time", main="productivity")
>lines(production$rs, fitted(reg), col="red") #untuk membuat garis regresi antara variabel rs

itted values Y )
(X) dan nilai prediksi Y (fitted
R
4. Selang Kepercayaan (Confident
Confident Interval)
Interval 95%
SU
Function confint merupakan function untuk
ntuk menghitung taksiran interval dari
satu atau lebih parameter pada model yang diestimasi.
>confint(reg, level=0.95)
A
IP
N
Gambar 5.7 Formula dan Output Selang Kepercayaan (Confident Interval)) Parameter ̂ 0 dan ̂1
U
Gambar 5.7
7 menunjukkan nilai ̂ 0 (parameter
parameter taksiran intersep
intersep) terletak antara
A
132.251 dan 167.244 sementara nilai ̂1 (parameter taksiran X) terletak antara 0.181
K
dan 0.337.
TI
132.251  ˆ0  167.244

IS
0.181  ˆ  0.337
1
AT
Nilai selang kepercayaan yang tidak melewati nilai nol menyimpulkan bahwa jumlah
produk (rs) berpengaruh terhadap waktu produksi (rt).
(rt
ST
5. Menampilan Analysis of Variance (ANOVA)

anovamerupakan function yang digunakan untuk menampilkan hasil Analysis of
Variance (ANOVA) dari model regresi yang telah terbentuk. Tabel ANOVA menujukkan
kesesuaian model, yang diketahui dari signifikansi parameter
parameter terhadap variabel respon
yang dilakukan secara bersamaan dengan uji F.
>anova(reg)
Page 34
Gambar 5.8 Formula dan OutputANOVA
Gambar 5.8 menunjukkan bahwa model regresi linier sederhana yang telah
A
terbentuk telah mewakili data yang ada. Hal tersebut disebabkan oleh p
p‐value dari uji F
AY
(nilai statistik F sebesar 48.717) lebih kecil dari   5% , yaitu sebesar 1.615e
1.615e‐06.
6. Diagnostic Plot
AB
Diagnostic plot menampilkan 4 plot, yaitu (1) plot antara fitted values (nilai‐nilai
prediksi) dan residual, (2) plot antara kuantil‐kuantil
kuantil normal dari standardized residuals
R
(residual yang distandarisasi), (3) plot antara fitted values dan akar standardized
SU
residuals,, dan (4) plot antara laverage dan standardized residual. Formula
digunakan untuk membuat diagnostic plot adalah sebagai berikut.
Formula‐formula yang
A
>layout(matrix(c(1,2,3,4),2,2)) # untuk membuat 4 plot dalam 1 halaman
>plot(reg)
IP
N
U
K A
TI
Gambar 5.9 Diagnostic Plot

IS

9 diketahui bahwa tidak terjadi heteroskedastisitas
AT
karena plot antara fitted values dan standardized residual tidak membentuk pola
tertentu.
ST
7. Evaluasi Kesesuaian dan Asumsi Model Regresi

Evaluasi kesesuaian model dilakukan dengan pengecekan multikolinieritas.
Asumsi‐asumsi
asumsi yang harus terpenuhi dalam analisis regresi sebelum dilakukan
inferensia statistik adalah (1) varians residual homogen (homoscedasticity), (2)
autokorelasi, dan (3) residual berdistribusi normal.
Page 35
Function yang digunakan untuk
untuk pengecekan multikolinieritas adalah vif.
Sebelum menggunakan vif, library car harus ter‐install terlebih dahulu.
>library(car)
>vif(reg)
Gambar 5.10 Formula Pengujian Multikolinieritas
A
Pada Gambar 5.10
10 terlihat adanya error dalam komputasi perhitung
perhitungan nilai VIF,
AY
sebab multikolinieritas dapat terjadi pada model regresi yang memiliki minimal dua
variabel predictor X.
AB
Sementara itu, formula‐formula
formula formula yang digunakan untuk melakukan pengujian
asumsi‐asumsi
asumsi yang harus dipenuhi oleh model regresi sebagai berikut
berikut (perlu diingat
R
bahwa pengujian asumsi dilakukan terhadap residual dari model regresi).
SU
>residual= residuals(reg) #untuk memanggil residual yang dihasilkan oleh model regresi
>library(stats) #package untuk deteksi normalitas
>shapiro=shapiro.test(residual)
dual) #deteksi normalitas
>library(lmtest) #package untuk deteksi homoskedas dan autokorelasi
A
>homoskedas=bptest(reg) #deteksi homoskedas
>autokorr=dwtest(reg) #deteksi autokorelasi
IP
Berdasarkan uji shapiro‐wilk

shapiro yang tersaji pada Gambar 5.11
11 diketahui bahwa
residual telah berdistribusi normal karena p‐value
p value (sebesar 0.892) lebih besar dari
N
  5% (H0 : residual berdistribusi normsal, gagal ditolak).

U
K A
TI
IS
AT
ST
Gambar 5.11 Function dan OutputUji Asumsi Residual
Page 36
Uji homoskedastisitas dilakukan dengan uji Breusch‐Pagan
Pagan (uji BP).P
BP).P‐value yang
dihasilkan oleh uji BP (sebesar 0.750) lebih besar dari   5% sehingga asumsi
homoskedastisitas residual terpenuhi.
Uji durbin‐watson
watson merupakan uji untuk mendeteksi adanya autokorela
autokorelasi
residual.Gambar 11.menunjukkan bahwa tidak ada autokorelasi pada residual model
regresi karena p‐value
value (sebesar 0.967) lebih besar dari   5% (H0: tidak ada
A
autokorelasi residual, gagal ditolak). Berdasarkan pengujian asumsi‐asumsi
asumsi asumsi yang telah
AY
dilakukan, seluruh asumsi dalam model regresi telah terpenuhi, sehingga dapat
disimpulkan model regresi telah sesuai menggambarkan data dan inferensia statistik
AB
dapat dilakukan.
R
5.2 REGRESI LINIER BERGANDA
Perbedaan mendasar antara regresi linier sederhana dan regresi linier berganda
SU
terletak pada jumlah variabel prediktor.Regresi linier sederhana hanya mempunyai satu
variabel prediktor sementara regresi linier berganda mempunyai lebih dari satu
A
variabel prediktor.Semua pengujian yang dilakukan pada
pada regresi linier sederhana juga
IP
dilakukan pada regresi linier berganda.

N
Y   0  1 X 1     p X p  

U
Y   0  1 X 1     p X p
A
1. Memanggil Data yang akan Digunakan

K
Data yang akan digunakan sebagai contoh aplikasi model regresi berganda
TI
adalah data Menu Pricing (Sheather,

(Shea 2009),, yaitu harga menu (Price, Y) di salah satu
IS
restoran khas Itali di Manhattan, rating yang diberikan pelanggan untuk makanan
AT
(Food, x1 ), rating yang diberikan pelanggan untuk dekorasi (Decor, x 2 ), dan rating yang
diberikan pelanggan untuk pelayanan (Service, x3 ).

ST
Misalkan data tersimpan di direktori D: dalam folder – UNIPA dengan nama file
data nyc.csv. Untuk memanggil data yang tersimpan dalam format csv ke R, function yg
digunakan adalah read.csv.. Misalkan data yang akan dipanggil dinamai “data”.
>data=read.csv("D:\\- UNIPA
UNIPA\\MODUL Datasets
R\\regresi\\Datasets Simon J.
Sheather\\Data\\nyc.csv",header=TRUE)
nyc.csv",header=TRUE) #tanda ”\\”” digunakan untuk membuka folder yang
menyimpan data, header=TRUE
RUE merupakan perintah bahwa baris pertama dalam dataset csv
merupakan judul variabel
Page 37
>data[1:5,] #jika ingin menampilkan data yang telah di ekspor ke R hanya pada baris ke
ke-1
sampe ke-5
Karena dataset nyc.csv yang telah terekpor ke R dengan nama data, mempunyai
memiliki 7 kolom, tetapi tidak semua kolom akan digunakan dalam analisis regresi,
maka dibuat dataset baru yang hanya memuat variabel‐variabel
variabel variabel yang digunakan dalam
analisis, yaitu variabel dalam kolom ke‐3
ke sampai kolom ke‐6
6 (Gambar 5.12).
>dt=data[,3:6] #marupakan dataset baru (nama: dt) yang diambil dari dataset “data” pada kolom
A
ke-3 sampai ke-6
AY
AB
R
Gambar 5.12Function
5.12
SU
dan Dataset Menu Pricing
2. Membuat scatter plot dan Analisis Korelasi untuk Data dt (Menu Pricing)
A
Function yang digunakan untuk menampilkan scatterplot antara variabel Y danX
IP
seperti pada Gambar 5.13

13 adalah plot dengan formula sebagai berikut
berikut.
N
>plot(Price
plot(Price ~ Food+Decor+Service, data=dt)
U
K A
TI
IS
Gambar 5.13a Scatterplot antara Price Y dan Food x1

AT
ST
Gambar 5.13bScatterplot antara Price Y dan Decor x 2
Page 38
A
Gambar 5.13cScatterplot antara Price Y dan Service x3
AY
Gambar 5.14a
14a menunjukkan nilai korelasi antar variabel X dan Y cukup besar,
bernilai diatas 0.5.Nilai korelasi setiap variabel bernilai positif, sehingga dapat
AB
disimpulkan bahwa terjadi hubungan searah antar variabel. Misalkan jika rating
makanan (food) meningkat maka harga (price) akan meningkat.
meningkat. Informasi dari Gambar
R
14b, korelasi antar variabel signifikan secara statistik karena nilai p
p‐value yang
SU
dihasilkan disetiap variabel prediktor dan respon lebih kecil dari   5% (Tolak H0).
A
IP
Gambar 5.14aFunction
5.14a dan Output Korelasi
N
U
K A
TI
IS
AT
ST
Gambar 5.14b Function dan Outputp‐value

Output Uji Korelasi Pearson
Page 39
3. Membuat Model Regresi dari Data dt
Seperti pada regresi linier sederhana, membuat model regresi linier berganda
pada R ditunjukkan pada Gambar 15.Berdasarkan Gambar 5.15
15 dapat dituliskan model
regresi yang terbentuk sebagai berikut.

Y  24.641  1.556x1  1.847 x2  0.135x3
Model regresi yang dihasilkan menjelaskan bahwa setiap kenaikan 1 satuan
A
rating atas makanan disaat variabel lainnya
lainnya tetap maka akan menaikkan harga menu
AY
makanan sebesar $US 1.556. Jika rating atas dekorasi naik sebesar 1 satuan rating maka
harga makanan akan bertambah sebesar 1.847 ($US). Sedangkan jika rating pelayanan
AB
bertambah 1 satuan maka harga makanan akan bertambah
bertambah sebesar 0.135 ($US).
Pengujian inferensi yang pertama dilakukan adalah pengujian pengaruh variabel
R
predictor secara bersamaan terhadap respon dengan menggunakan uji F. Hipotesis awal
SU
(H0) dari pengujian ini adalah sebagai berikut.
H 0 : 1   2     p  0
H 0 :  food   decor   service  0
A
Jika H0 ditolak maka pengujian inferensi selanjutnya, yaitu uji individu parameter dapat
IP
dilakukan. Berdasarkan Gambar 5.15 diketahui bahwa H0 ditolak karena p

p‐value dari uji
N
F lebih kecil dari   5% . Oleh karena itu, uji individu parameter dapat dilakukan.
U
Uji individu parameter dilakukan dengan uji t. Berdasarkan uji t, diketahui

A
bahwa variabel x3 tidak berpengaruh signifikan terhadap Y sebab p‐value

value dari uji t lebih
K
besar dari   5% .Nilai adjusted R-Squared

R menunjukkan bahwa variabel prediktor ((X)
TI
mampu menjelaskan varians dari variabel respon (Y)

( ) sebesar 61%. Nilai residual yang
dihasilkan dari model regresi berkisar antara ‐14.8440
14.8440 dan 19.058 (Gambar 5.15).
IS
AT
ST
Page 40
A
AY
AB
R
Gambar 5.15 Function dan Output Regresi
SU
4. Selang Kepercayaan (Confident
Confident Interval)
Interval 95%
Gambar 5.16
16 menunjukkan selang kepercayaan untuk masing‐masing
masing masing parameter
taksiran dari variabel predictor yang dapat dituliskan sebagai berikut.
A

 34.027   0  15.254
IP

0.819  1  2.292

N
1.418   2  2.277

U
 0.646   3  0.916
K A
TI
Gambar 5.16Selang
5.16 Kepercayaan Parameter Taksiran Regresi
IS
Nilai selang kepercayaan pada parameter taksiran untuk variabel service x3 yang
AT
memuat nilai nol menunjukkan bahwa variabel x3 tidak berpengaruh terhadap variabel
Y.
ST
5. Menampilan Analysis
nalysis of Variance (ANOVA)
Analysis of Variancepada
pada regresi berganda dengan software R merupakan uji F
secara parsial (partial F-test
test).
). Berdasarkan Gambar 16., diketahui bahwa hasil uji F
secara parsial menyebutkan bahwa variabel x3 tidak berpengaruh karena hasil uji F
memiliki p‐value
value lebih besar dari   5% (gagal tolak H0).
Page 41
Gambar 5.17 TabelAnova
A
Pada software R, dapat diketahui pengaruh penambahan variabel prediktor baru
AY
terhadap model. Analisis dilakukan dengan bantuan model regresi lain yang memiliki
variabel predictor dengan model yang telah dibentuk (dalam modul ini adalah model
AB
reg1)) yang sama ditambahkan minimal satu variabel prediktor baru. Misalkan model
baru yang akan dibentuk dinamai
d model regresi reg2 dengan penambahan variabel
R
prediktor East yang ada pada dataset awal. ANOVA dengan R dilakukan dengan
SU
membandingkan model regresi reg1 dengan model reg2.Function
Function yang digunakan
sebagai berikut.
>anova(reg1,reg2)
A
IP
N
U
K A
TI
IS
Gambar 5.18
18 Langkah‐langkah ANOVA Regresi Berganda di R
AT

18 diketahui bahwa terdapat pengaruh yang signifikan yang
diberikan oleh variabel east terhadap harga menu ketika variabel prediktor x1 , x 2 , dan
ST
x3 telah diperhitungkan. Hal tersebut disebabkan oleh p‐value

p value dari uji F lebih kecil dari
  5% (Tolak H0).
Page 42
6. Diagnostic Plot, Evaluasi Kesesuaian dan Asumsi Model Regresi
19 diketahui bahwa tidak terjadi heteroskedastisitas
karena plot antara fitted values dan standardized residual tidak membentuk pola
tertentu.
A
AY
AB
R
Gambar 5.19Diagnostic Plot
Evaluasi kesesuaian dan asumsi model regresi ditampilkan pada Gambar
5.20.Berdasarkan Gambar 5.20
5. diketahui
SU
iketahui bahwa tidak terdapat multikolinieritas pada
model regresi karena nilai VIF yang dihasilkan kurang dari 10.
A
Berdasarkan informasi pada Gambar 5.20,, disimpulkan bahwa residual telah
IP
berdistribusi normal sebab p‐value

p bernilai 0.079 (lebih besar dari   5% ). Asumsi
N
homoskedastisitas residual juga terpenuhi karena p‐value

p value dari uji BP lebih besar dari
  5% . Akan tetapi, asumsi tidak ada autokorelasi terlanggar karena p
p‐value dari uji
U
Durbin‐Watson
Watson lebih kecil dari   5% (H0: tidak ada autokorelasi residual, ditolak).
K A
TI
IS
AT
ST
Gambar 5.20 Evaluasi Kesesuaian Model dan Deteksi Asumsi
Page 43
6. ARIMA
Salah satu model dalam pendekatan deret waktu atau timeseries adalah model
ARIMA. Model ARIMA terdiri dari 3 bentuk, yaitu AR, MA, dan ARMA.Secara umum,
model ARIMA dituliskan sebagai berikut (Cryer, 1986; Wei, 2006).
(1  1 B     p B p )(1  B ) d Z t   0  (1  1 B     q B q ) a t ,
erator mundur ( B k Z t  Z t  k ) . p dan q merupakan orde dari model

B merupakan operator
A
ARIMA dengan mengidentifikasi plot Autocorrelation Function (ACF) dan Partial
AY
Autocorrelation Function (PACF) pada data yang telah stasioner. Identifikasi plot ACF
dan PACF diringkas pada Tabel 6.1.
AB
Tabel 6.1 Identifikasi Model dengan Plot ACF dan PACF
Model ACF PACF
R
Plot turun cepat secara
Terputus setelah lag p
AR(p) exponensial/sinusoidal
SU
(cuts off di lag p)
(dies down)
Plot turun cepat secara
Terputus setelah lag q
MA(q) exponensial/sinusoidal
(cuts off di lag q)
(dies down)
A
Plot turun cepat secara Plot turun cepat secara
IP
ARMA(p,q) exponensial/sinusoidal exponensial/sinusoidal

(dies down) (dies down)
N
AR(p) atau Terputus setelah lag q Terputus setelah lag p

MA(q) (cuts off di lag q) (cuts off di lag p)
U
White Tidak ada yang keluar Tidak ada yang keluar

Noise batas/ tidak ada yang batas/ tidak ada yang
A
(Random) signifikan signifikan

K
Analisis timeseries dengan model ARIMA di R dilakukan hanya melalui perintah

TI
comment line.. Plot ACF dibuat dengan function ARMAacf(),, demikian pula untuk
membuat plot PACF function yang digunakan adalah ARMAacf() dengan menambahkan
IS
argumen pacf sama dengan TRUE.

AT
Gambar 6.1 merupakan perintah yang digunakan untuk membuat plot ACF dan
PACF teoritis
itis dengan model AR(1).
AR(
ST
Gambar 6.1 Scrip Plot ACF dan PACF
Page 44
Plot yang dihasilkan oleh model ARIMA(1,0,0) atau model AR(1) dengan nilai
koefisien parameter (phi)) sebesar 0.8 ditampilkan pada Gambar 6.2. Berdasarkan
Gambar 6.2 terlihat bahwa plot ACF model AR(1) membentuk pola dies down.
Sedangkan pola terputus setelah lag 1 pada plot ACF.
A
AY
AB
R
Gambar 6.3 merupakan scrip yang
SU
Gambar 6.3 Plot ACF dan PACF Model AR (1)
yang digunakan untuk membuat model MA(2) dan

A
model ARMA(1,1). Model MA(2) terbentuk dengan koefisien parameter 1  1.5 dan
IP
 2  0.7 . Sedangkan model ARMA(1,1) memiliki koefisien parameter AR   0.7 dan

N
MA   0.4 . Pola plot yang tergambar pada Gambar 6.3 sesuai dengan Tabel 6.1.
U
K A
TI
IS
(a)
AT
ST
(b)
Gambar 6.3 Script(a) Model MA(2) dan (b) Model ARMA(1,1)
Page 45
Selanjutnya, arima() merupakan function yang dapat digunakanuntuk
mengetahui nilai taksiran model ARIMA dari suatu data time series
series. Berdasarkan
informasi fasilitas help di R, diketahui formula arima() adalah sebagai berikut.
arima(x, order = c(0L, 0L, 0L),

seasonal = list(order
order = c(0L, 0L, 0L), period =NA),
=
xreg = NULL, include.mean = TRUE,
transform.pars = TRUE,
fixed = NULL, init = NULL,
A
method = c("CSS-ML",
ML", "ML", "CSS"), n.cond,
AY
SSinit = c("Gardner1980", "Rossignol2011"),
optim.method = "BFGS",
optim.control = list(), kappa = 1e6)
AB
atau secara singkat dapat dituliskan sebagai berikut.
arima(x, order = c(0L, 0L, 0L),
seasonal = list(order
order = c(0L, 0L, 0L), period =NA),
=
R
method = c("CSS-ML",
ML", "ML", "CSS"))
SU
dimanax merupakan sebuah data univariate time series, order adalah spesifikasi model
ARIMA (p,d,q), seasonal adalah spesifikasi pola musiman (seasonal)
( ) sekaligus periode
model, dan method adalah pilihan metode estimasi parameter yang dikehendaki
A
(maximum likelihood atauminimize
atau conditional sum-of-squares).
IP
Misalkan pada data yang disediakan oleh R, yaitu data time

time series presidents,
N
ingin diketahui apakah model ARIMA(1,0,0) dan ARIMA(3,0,0) cocok dengan data
U
tersebut. Untuk mengetahui nilai taksiran dari model ARIMA menggunakan function
arima() sedangkan untuk mengetahui kebaikan model menggunakan function tsdiag()
A
dengan statistik uji yang digunakan adalah statistik uji Ljung‐Box.

Ljung Box. Proses pengujian
K
ditampilkan pada Gambar 6.4.

TI
IS
AT
ST
Gambar 6.5 Scrip Pengujian Model ARIMA (1,0,0) dan ARIMA (3,0,0)
Gambar 6.6 merupakan output hasil tsdiag(fit1) untuk menguji residual model
telah memenuhi asumsi white
whit noise.. Berdasarkan Gambar 6.6 diketahui bahwa asumsi
white noise terlanggar karena terdapat lag yang keluar dari batas pada plot ACF
residual. Untuk mengetahui P‐Value
P statistik uji Ljung‐Box,function
on yang digunakan
Page 46
adalah Box.test(), formula yang dijalankan dengan comment line adalah sebagai
berikut.
>Box.test(resid(fit1), lag = 2, type = "Ljung-Box",
"Ljung fitdf = 1)
A
AY
AB
R
Gambar 6.6 PlotStandardized
Standardized Residual, SU
Residual ACF Residual, dan P‐value Statistik Uji Ljung
Ljung‐Box
A
Argumen dalam Box.test()meliputiBox.test(x,
Box.test() Box.test(x, lag, type, fitdf), diuraikan
IP
sebagai berikut.
‐ x : residual model atau data univariate time series
N
‐ lag : lag koefisien autokorelasi (lag > fitdf)

U
‐ type : metode pengujian yang digunakan, antara lain: Box-Pierce danLjung-Box

A
‐ fitdf : jumlah derajat bebas yang dikurangi jika x merupakan residual model
K
(fitdf=p+q)
TI
Berdasarkan output hasil pengujian white noise dengan Ljung

Ljung‐Box yang
ditampilkan pada Gambar 6.7, diketahui bahwa model fit1, yaitu model ARIMA
ARIMA(1,0,0)
IS
tidak memenuhi asumsi white noise. Hal tersebut dikarenakan P‐Value

P Value yang dihasilkan
AT
kurang dari 5%.

ST
Gambar 6.7Output Uji Ljung Box

Untuk mengetahui nilai prediksi dari masing‐masing
masing masing variabel data president,
function yang digunakan adalah predict(),, seperti yang ditampilkan pada Gambar 6.5.
Berdasarkan hasil
asil prediksi dengan menggunakan model fit2 atau ARI
ARIMA(3,0,0)
Page 47
diketahui pada tahun 1075, nilai Qtr1 sebesar 9.245 dan Qtr4 sebesar 14.482
14.482.Informasi
lengkap ditampilkan pada Gambar 6.8.
bar 6.8 Output Prediksi Model ARIMA(3,0,0)

Gambar
A
AY
DAFTAR PUSTAKA
Cryer, J.D. 1986.Time
Time Series Analysis.
Analysis Boston. PWS‐KENT
‐KENT Publishing Company.
AB
Draper, N.R. dan Smith, H. 1981.Applied
1981.Applied Regression Analysis.Second Edition
Edition. JohnWiley &
Sons, Inc.
R
Help R
SU
Sheater, Simon. J. 2009. A Modern Approach to Regression with R.
R. USA.Springer
USA.Springer.
Suhartono. 2008. Analisis Data Statistik dengan R.
R. Surabaya. Lab. Statistik Komputasi,
ITS.
A
Time Series Analysis Univariate and Multivariate Methods, Second
Wei, W.W.S. 2006.Time
IP
Edition.. New York. Pearson Education, Inc.

N
U
K A
TI
IS
AT
ST
Page 48

KomputasiStatistik1 R.compressed

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

KomputasiStatistik1 R.compressed

Diunggah oleh

Hak Cipta:

Format Tersedia

KOMPUTASI STATISTIK

Setelah Rcmdr aktif, akan ada jendela baru

Gambar 1.1 Tampilan R‐Commander

Setelah package Rcmdr aktif, manajemen data dapat dilakukan, diantaranya:

Gambar 1.3 Dialog Overwrite Data

klik add row dan add column.

Gambar 1.4 Jendela Data Editor

Gambar 1.6 Tampilan R‐console dengan data_penjualan

set pada jendela R Commander pada Gambar 1.5.

Gambar 1.8 Jendela Import Excel Data Set

Setelah jendela import excel data set di‐OK,

D. Transformasi Data Set

16:25 = 3 nilai antara 16 sampai 25 pada variabel jumlah bernilai 3 p

Gambar 1.9 Jendela Recode Variables

data_penjualan dengan nama proporsi. Langkah‐langkah

variabel baru (dalam modul ini adalah jumlah),

logical,numeric, complex,, dan character.Perbedaan SU

 Numeric : Nilai desimal maupun bilangan bulat (integer)

 Complex : Suatu bilangan dengan penambahan nilai imajiner i misal: 2 + 2i

A. Data berupa Vektor atau Array Satu Dimensi

mode data (numeric, logical,

seq().seq() merupakan suatu function untuk membuat suatu vector yang

memungkinkan adanya increment dari suatu deret bilangan.

Function length() untuk

mengetahui mode matriks.

Matriks merupakan sebuah data yang memiliki

C. Data berupa Data Frame

disetiap elemen kolom.

variabel yang barisnya merupakan nilai‐nilai

names()digunakan untuk memberi atau mengubah kolom/variabel dari tabel data

Sedangkan untuk mengekstrak variabel merek digunakan perintah sebagai berikut.

D. Data berupa Data List

yang setiap elemennya dapat terdiri dari

1.2.1 Importing Data

tipe file (extension)) yang berbeda.

A. Membaca File ASCII

function menggunakan direktori

>data= read.table("d:\\- UNIPA\\MODUL R\\1. \3.

Apabila data belum tersimpan di direktori manapun, maka langkah

3. SAS : read.ssd atau read.xport

Berikut ini merupakan perbedaan beberapa function yang dapat digunakan

perlu mendefinisikan argumen header.

Selain impor dari format file seperti yang

dari excel adalah sebagai berikut.

H0 : Data berdistribusi normal, X ~ N (  ,  2 )

H1 : Data tidak berdistribusi normal

Data yang akan digunakan sebagai contoh aplikasi pengujian normalit

SL. Untuk melakukan pengujian dengan R‐Commander

dapat dilakukan melalui fasilitas R-Commander.

> SL=data.frame(SL) #bentuk data sebagai data frame

menguji normalitas pilih menu statistics kemudian summaries

Gambar 2.2 Jendela Test of Normality

Gambar 2.3 Output Test of Normality dengan Shapiro‐Wilk

Gambar 2.5 Uji Homogenitas Data dalam R‐Commander

diberikan, dan (3) ID adalah identitas pasien.

lama tidur yang dihasilkan oleh masing‐masing

Hipotesis yang digunakan adalah sebagai

2.2.1 Uji F Dua Varians

Pengujian dengan comment line dituliskan sebagai berikut.

Terdapat argumen alternative pada function var.test(),, yang digunakan untuk

Data tersebut menginformasikan tentang jumlah serangga yang digunakan

digunakan.Pengujian homogenitas dilakukan untuk mengetahui kesamaan varians dari

jumlah serangga yang digunakan dari keenam jenis insektisida.