Anda di halaman 1dari 16

LAPORAN AKHIR PRAKTIKUM

Mata Pratikum : Statistika 2

Kelas : 2IA26

Pratikum ke :1

Tanggal Pratikum : 28 April 2017

Materi : R.Programming

NPM : 57415601

Nama : Reezky Illmawati

Ketua Asisten :

Paraf Asisten :

Nama Asisten :

Jumlah : 16 lembar

LABORATORIUM INFORMATIKA

UNIVERSITAS GUNADARMA

2016-2017

0
LOGIKA PEMROGRAMAN

R Programming

R adalah perangkat lunak statistik berbasiskan perintah (command driven), yang sepertinya dapat
memberi kesulitan bagi pengguna pemula untuk mengingat serangkaian perintah ataupun formula. Hal ini
sudah diantisipasi oleh perangkat lunak tersebut dengan menyediakan penggunaan Graphical User
Interface (GUI) yang memudahkan pengguna tanpa harus mengingat serangkaian perintahperintah.GUI
untuk R terbundel dalam paket yang bernama Rcmdr yang berisikan GUI untuk statistika dasar. Statistika
dasar meliputi diantaranya pemodelan uji hipotesis, distribusi (normal, F, binomial, t, Chi-square,
poisson), graph (histogram, scatterplot, boxplot, dan lain lain), statisik deskriptif. Namun sebagai open
source yang memiliki banyak kontributor, dalam pengembangannya juga mendukung untuk statistik
lanjut, seperti pemodelan linier dan generalized-linear.

R adalah suatu kesatuan software yang terintegrasi dengan beberapa fasilitas untuk manipulasi,
perhitungan dan penampilan grafik yang handal. R berbasis pada bahasa pemrograman S, yang
dikembangkan oleh AT&T Bell Laboratories (sekarang Lucent Technologies) pada akhir tahun ’70 an. R
merupakan versi gratis dari bahasa S dari software (berbayar) yang sejenis yakni S-LUS yang banyak
digunakan para peneliti dan akademisi dalam melakukan kegiatan ilmiahnya.
Pada awalnya, versi pertama R dibuat oleh Ross Ihaka and Robert Gentleman dari Universitas Auckland,
namun selanjutnya R dikembangkan oleh tim yang disebut tim inti.Tim inti (core team) terdiri dari ahli
statistik, ahli komputer & pemrograman,geografi, ekonomi dari institusi yang berbeda dari seluruh dunia
yang mencoba membangun sebuah sistem (software) yang handal namun dengan biaya yang sangat

1
murah. Sampai tulisan ini dibuat, R dapat secara cuma-cuma didownload dan digunakan dengan
berlisensi pada GNU General Public License.
Menurut kutipan dari penghargaan Association for Computing Machinery Software bagi John
Chamber 1998, menyatakan bahwa (bahasa pemrograman) S telah “merubah orang dalam memanipulasi,
visualisasi dan menganalisis data untuk selamanya”. R dibuat searah dengan ide yang ada pada bahasa
pemrograman S. Sampai tulisan ini dibuat versi R terbaru adalah R3.3.3 , dan banyak projek lainnya yang
berkaitan /berbasis /perluasan dari R, seperti geoR, Rattle, R Commander, SciViews R GUI, dan lain lain,
yang anda dapat lihat ataupun download (jika sudah di terbitkan) di situs resmi projek R.
Secara arsitektur menu, R terdiri dari menu utama seperti File, Edit, Data, Statistics, Graphs,
Models, Distributions, Tools, dan Help.

Instalasi & Menu dalam Rcmdr

Cara termudah melakukan instalasi R Commander pada sistem operasi Windows adalah jika anda
terkoneksi dengan Internet, yakni melalui Menu RGui Packages> Install package(s). R secara otomatis
akan meminta anda untuk memilih mirror tempat Rcmdr akan didownload dan diinstall.

Paket Rcmdr dan semua paket yang tidak terdapat (missing) yang sering terjadi jika instalasi
tidak terdapat koneksi internet, akan langsung di download dan diinstal secara otomatis. Sebagai contoh,
jika hendak menginstall paket graf 3D graphics, anda memerlukan koneksi Internet untuk mendapatkan
sumbernya (source). Pada Windows, Rcmdr hanya berfungsi pada SDI (Single-Document Rgui
Interface). Untuk mengaktifkan SDI, buatlah copy ikon R desktop (klik-kanan pada ikon, seret pada
lokasi yang berbeda di desktop, pilih Copy Here dari menu context). Kemudian klik-kanan pada ikon

2
yang baru dan pilih Properties. Tambahkan ---sdi (didahului oleh spasi) ke bagian/daerah Target pada
tabulasi Shortcut dalam kotak dialog Properties. Kemudian klik OK.
Menampilkan Menu Rcmdr

Pada RGui, pilih menu Packages>Load package … Kemudian pilih Rcmdr pada tabel Select one.

Dalam GUI Rcmdr, terdiri dari tiga sub window (layar) utama, yakni:

3
1. Script Window: Layar yang menampilkan perintah (command) R. Perintah dalam bagian ini
dapat di edit dan di eksekusi dan di eksekusi ulang (dengan menekan tobol submit)
2. Output Window: Layar yang menampilkan hasil perhitungan yang di eksekusi dari Script
Window
3. Warning Window: Layar yang menampilkan peringatan seperti pesan error, data missing, atau
adanya paket yang tidak diinstall.
Berikut adalah menu utama dan submenu dalam Rcmdr:
1. Menu File untuk loading dan menyimpan file script; untuk menyimpan output dan R workspace
(ruang kerja R); dan untuk keluar aplikasi Rcmdr dan atau keluar aplikasi Rcmdr sekaligus R.
2. Menu Edit (Cut, Copy, Paste, dll.) untuk penyuntingan (editing) konten dari script dan output
windows. Klik kanan pada script atau output window akan menampilkan menu edit “konteks”.
3. Submenu Data terdiri atas item untuk membaca dan memanipulasi data, seperti import data dari
file ber-ekstensi Text, SPSS, minitab atau STATA.
4. Submenu Statistics terdiri atas item-item berupa alat analisis statistika dasar.
5. Menu Graphs untuk membuat grafik statistic dasar, seperi histogram, scatterplot, Boxplot, Pie
chart, 3D dan lain lain.
6. Menu Models item dan submenu-nya digunakan untuk menghitung summary numeric, confidence
intervals, hypothesis tests, diagnostics, dan graphs untuk model statistic dan untuk menambahkan
kuantitas diagnostic.
7. Residuals.
8. Menu Distributions terdiri dari submenu distribusi probabilitas, quantiles, dan grafik distribusi
statistika standar, yaitu distribusi Normal, Chi-Square, t, F, binomial dan Poisson.
9. Menu Tools untuk loading paket R yang tidak berelasi dengan paket Rcmdr (misal, untuk
mengakses data yang tersimpan dalam paket lain), dan untuk men-setting beberapa option.
10. Menu Help yang berisikan informasi mengenai R dan R Commander termasuk manualnya. Setiap
kotak dialog (dialog box) mempunyai tombol Help button.

4
Mean,Median Modus pada R Programming

Pengisian data secara langsung via R dengan menggunakan R ‐commander dapat dilakukan
melalui menu Data, dan pilih New Dataset. maka akan terlihat jendela seperti berikut

Selanjutnya akan muncul kotak dialog Enter name for data set >>> Klik OK.

5
Pengisian nama variabel dilakukan dengan cara klik pada kolom paling atas dari data editor, klik
pada var1. Kemudian pada jendela Variable editor seperti yang terlihat pada Gambar dibawah isikan
responden sebagai variable name dan tipe data adalah character (karena yang akan diisikan pada kolom
ini adalah nama‐nama responden). Setelah semua data selesai diinputkan, maka akan diperoleh tampilan
Data Editor seperti gambar diatas.

6
Setelah dilakukan data entry, maka tutup jendela R Data Editor atau klik OK, untuk mengakhiri
proses data entry. Pada jendela R‐Commander Klik Statistics >>> Klik Summaries >>> Klik Active data
set.

7
Mean (Rata-Rata)

Rata-Rata merupakan deskripsi statistika yang menggambarkan tentang nilai rata-rata dari suatu
sample. Perhitungan rata secara matematis adalah sebagai berikut:

Dalam R terdapat fungsi untuk menghitung nilai rata-rata sampel. Fungsi yang digunakan adalah
mean(x) ataupun dengan menggunakan fungsi summary(x). Sebagai contoh, digunakan data dari dataset
yang sudah di input sebelumnya. Kemudian hitung nilai rata sampel, dengan Menuliskan Hasil tersebut di
atas adalah menunjukkan tentang data Dataset yang terdiri dari 11 data dengan nilai rerata 2.545. Selain
rerata ada pula nilai statistik lainnya, yaitu minimum, kuartil pertama, nilai tengah (median), kuartil ke
tiga dan maksimum. Nilai-nilai tersebut ditampilkan dengan menjalankan fungsi summary().

Median (Nilai Tengah)

Median=(n+1)/2 atau dalam R-programming dengan >Median(A)

Median adalah nilai tengah dari suatu data seperti halnya dengan mean, R juga menyediakan
fungsi untuk mencari nilai tengah (median) sampel dengan menuliskan fungsi median(). Sebagai contoh,
dapat digunakan data seperti pada mencari nilai rata sebelumnya. Nilai tengah (median) bedasarkan pada
data set yang dinput yaitu :3,00.

Nilai minimum dan maksimum

R menyediakan fasilitas untuk mencari nilai minimum dan maksimum suatu data, yaitu dengan
digunakan perintah min() dan max()

> min(x) # untuk nilai minimum, dan

> max(x) # untuk nilai maksimum

Modus

Modus adalah data yang paling sering muncul, atau data yang mempunyai frekuensi terbesar.

8
REGRESI

Regresi digunakan untuk menjelaskan atau memodelkan hubungan antara suatu variable tunggal
Y, disebut sebagai variable respon, output atau terikat, dan satu atau lebih variable predictor, input, bebas
atau penjelasan (explanatory), X1, …, Xp. Apabila p = 1 maka disebut regresi sederhana, sedangkan
apabila p > 1 maka disebut regresi berganda atau regresi multivariate. Jika terdapat lebih dari satu
variable terikat Y, maka disebut regresi mulrivariate berganda.

Analisis regressi merupakan metode analisis yang sering digunakan dan telah dipakai dalam
banyak bidang yang berbeda seperti ekonomi, bisnis, dan pendidikan. Namun analisis ini masih sering
digunakan secara keliru, dan pemakaiannya sering hanya melibatkan estimasi kwadrat terkecil (least-
squares estimation) dari koefisien regressinya, ditambah sekilas pandang tentang diagram pencar
residunya. Secara umum, analisis regressi harus mempertimbangkan dengan cermat beberapa hal seperti:
kesesuaian model yang digunakan, asumsi-asumsi model, dan masalah multikolinieritas serta
pendeteksian data pencilan. Membahas semua hal di atas dalam menyelesaikan suatu permasalahan
analisis regressi memerlukan perhitungan yang rumit, khususnya bila melibatkan beberapa variabel
dengan data observasi yang besar. Namun perhitungan ini bukanlah menjadi masalah yang besar jika
dikerjakan dengan alat komputer. Software R sebagai salah satu alat komputasi dapat digunakan untuk
analisis ini, oleh karenanya tulisan ini diberi judul Aplikasi Software R dalam Analisis Regressi.

Regresi linier diukur besarnya pengaruh variabel bebas terhadap variabel respons. Secara umum
langkah-langkah analisis regresi adalah sebagai berikut:

1. Menentukan variabel dependen dan variabel independen dalam model (dengan kata lain
menentukan dahulu variabel mana yang mempengaruhi variabel mana, hal ini dapat berdasarkan
teori-teori yang sudah ada).
2. Membangun model dan menyeleksi variabel independent yang signifikan dalam model.
3. Melakuan cek diagnostik atau uji asumsi model.
4. Melakukan transformasi terhadap variabel respons dan/atau variabel independen bila diperlukan.

Persamaan Regresi Linier dan Korelasi

Langkah pertama Load Package Rcmdr. Hal ini dilakukan karena paket yang digunakan dalam R
adalah R commander. Caranya klik Packages kemudian pilih Load package terus muncul tampilan dan
pilih Rcmdr.

9
Pada RGui, pilih menu Packages>Load package … Kemudian pilih Rcmdr pada tabel Select one.

10
Pengisian data secara langsung via R dengan menggunakan R ‐commander dapat dilakukan
melalui menu Data, dan pilih New Dataset. maka akan terlihat jendela seperti berikut

Selanjutnya akan muncul kotak dialog Enter name for data set >>> Klik OK.

11
Langkah selanjutnya Input data pada Data Editor untuk var1 diganti menjadi Diskon dan Var2
diganti menjadi Penjualan. Lalu input data tersebut sesuai dengan data yang kita miliki. Setelah
menginputkan data maka klik OK atua exit sebagai cara untuk mengakhiri data editor agar tersimpat
sebagai Dataset Active pada Rcmdr.

Untuk menampilkan persamaan dari Regresi Liner pada menu Rcmdr klik Statistics >>> Fit
models >>> Linear Regression. Menu Statistika menyediakan pilihan untuk menganalisis data baik untuk
statistika deskriptif maupun inferensial, termasuk uji nonparametrik. Bahkan untuk model linier telah
diakomodasi model linier terampat yang dapat menganalisis data yang tidak berdistribusi normal.

Maka akan menampilkan jendela Liniear Regression yang digunakan untuk memilih Response
variable dan Explanatory variable berdasarkan hasil pilihan dari user tersebut.Lalu klik Ok

12
Pada tab Output akan menampilkan persamaan dari Regresi Linear yang terdiri dari Formula =
Diskon – Penjualan. Residual (unstandardized residual) adalah selisih antara Diskon dan Penjualan.
Residual (standardized residual) adalah nilai residual yang telah terstandarisasi (nilai semakin mendekati
0 maka model regresi semakin baik dalam melakukan prediksi, sebaliknya semakin menjauhi 0 atau lebih
dari 1 atau -1 maka semakin tidak baik model regresi dalam melakukan prediksi). Dapat disimpulkan
bahwa nilai regresi pada data dibaah ini memiliki model regresi yang tidakbaik karena nilai residualnya
menjauhi 0.

Standard Error of the Estimate adalah suatu ukuran banyaknya kesalahan model regresi dalam
memprediksikan nilai Y. Dari hasil regresi di dapat nilai 9,0597 , 3,6301, 2,496, 0,130, hal ini berarti
tidak terdapat kesalahan dalam prediksi harga penjualan. Sebagai pedoman jika Standard error of the
estimate lebih dari standar deviasi t, maka model regresi semakin baik dalam memprediksi nilai t.
Adjusted R Square adalah nilai R Square yang telah disesuaikan, nilai ini selalu lebih kecil dari R Square
dan angka ini bisa memiliki harga negatif. Menurut Santoso (2001) bahwa untuk regresi dengan lebih dari

13
dua variabel bebas digunakan Adjusted R2 sebagai koefisien determinasi. Adjusted R Square. Suatu sifat
penting R2 adalah nilainya merupakan fungsi yang tidak pernah menurun dari banyaknya variabel bebas
yang ada dalam model. Oleh karenanya, untuk membandingkan dua R2 dari dua model, orang harus
memperhitungkan banyaknya variabel bebas yang ada dalam model. Ini dapat dilakukan dengan
menggunakan “adjusted R square”. Istilah penyesuaian berarti nilai R2 sudah disesuaikan dengan
banyaknya variabel (derajat bebas) dalam model. Memang, R2 yang disesuaikan ini juga akan meningkat
bersamaan meningkatnya jumlah variabel, tetapi peningkatannya relatif kecil.
Multiple R-squared suatu ukuran untuk mengukur tingkat (keeratan) hubungan linear antara
variabel terikat dengan seluruh variabel bebas secara bersama-sama. Pada kasus dua variabel (satu
variabel terikat dan satu variabel bebas), besaran r (biasa dituliskan dengan huruf kecil untuk dua
variabel) dapat bernilai positif maupun negatif (antara -1 – 1), tetapi untuk lebih dari dua variabel,
besaran R selalu bernilai positif (antara 0 – 1). Nilai R yang lebih besar (+ atau -) menunjukkan hubungan
yang lebih kuat. R Square (R2) sering disebut dengan koefisien determinasi, adalah mengukur kebaikan
suai (goodness of fit) dari persamaan regresi; yaitu memberikan proporsi atau persentase variasi total
dalam variabel terikat yang dijelaskan oleh variabel bebas. Nilai R 2 terletak antara 0 – 1, dan kecocokan
model dikatakan lebih baik kalau R 2 semakin mendekati 1. (uraian lebih lanjut mengenai R 2 lihat
pembahasan di bawah)

14
OUTPUT

15

Anda mungkin juga menyukai