Mengenal Programming R
Teknik tersebut misalnya analisis deret waktu, pemodelan linear dan non
linear, serta statistik klasik. Programming ini sendiri juga merupakan bahasa
fungsional yang mana inti dari bahasa satu memakai bentuk standar untuk notasi
aljabar dan memungkinkan untuk perhitungan numerik. Selain itu, ada fasilitas
untuk perhitungan memakai fungsi.
Sehingga untuk Anda yang merupakan seorang pemula dalam bidang data
ilmiah, maka bahasa pemrograman satu ini sangat direkomendasikan untuk Anda
pelajari. Untuk fungsi dari R antara lain ialah digunakan untuk riset akademis. Hal
ini dikarenakan software ini sangat pas digunakan untuk riset, baik secara
ekonomi, statistik, pemrograman komputer, dan bahkan komputasi numerik.
1. Software ini akan selalu dimulai pada prompt “<” pada console. Jika Anda
ingin mempelajari programming ini, maka Anda harus belajar mengenai
fitur-fitur yang ada pada software ini. Misalnya saja basic math yang
merupakan operasi dasar, seperti kurang, tambah, bagi, kali, mod, dan juga
sqrt.
2. Fitur lainnya yakni variables yang merupakan tempat menyimpan value.
3. Kemudian fitur tipe data yang digunakan seperti data karakter, numerik,
dates, dan juga logikal.
4. Programming ini juga punya fitur yang merupakan kumpulan elemen tipe
data sama yakni kerap disebut sebagai vektor. Anda juga bisa membuat
fungsi sendiri menggunakan R.
5. Programming ini juga punya data frame yang mirip dengan di Excel, yakni
ada nama kolom dan diikuti dengan isi pada bagian bawahnya. Fitur list
pada programming ini mirip dengan kontainer yang bisa diisi data
berbeda. Seperti yang Anda pelajari saat SMA, matrix ini juga berisi
dengan kolom dan juga baris. Matrix ini hampir mirip dengan data frame,
akan tetapi representasi dan juga rulesnya beda.
6. Fitur selanjutnya ada array yang memang jarang sekali dibahas oleh orang.
Apabila pada matrix menggunakan 2 dimensi, maka array ini
menggunakan 3 dimensi.
Salah satu kelebihan yang bisa Anda dapatkan ialah pengelolaan data dan
juga fasilitas penyimpanannya lebih efektif. Untuk ukuran file disimpan akan jauh
lebih kecil jika dibandingkan dengan software lainnya. Sehingga tidak memakan
banyak tempat penyimpanan.
Jika Anda menggunakan pemrograman yang satu ini, maka Anda bisa
mengembangkannya sesuai dengan keinginan Anda sendiri. Anda bisa
menyesuaikan dengan kebutuhan Anda sendiri. Jenis pemrograman ini juga
sifatnya terbuka dimana tiap orang bisa menambah fitur tambahan di dalam paket
yang dimasukkan pada software, sehingga bisa lebih memudahkan Anda dalam
mempelajarinya.
Hal penting lain yang wajib Anda ketahui mengenai programming satu ini
ialah sifatnya yang multiplatform. Artinya ialah programing ini bisa diintall
dengan menggunakan sistem operasi windows, LINUX, UNIX atau pun
Macintosh. Bukan hanya itu saja, bahasa pemrograman ini juga didukung dengan
menggunakan komunitas secara aktif melakukan interaksi antara satu dengan
lainnya menggunakan internet.
Tampilan awal R Studio akan terlihat seperti pada gambar berikut ini:
Salah satu kendala awal dalam beralih ke R yang sering jumpai adalah
bagaimana cara memasukkan data? IBM SPSS memiliki worksheet mirip Excel
dimana pengguna bisa mengisi nilai untuk setiap variabel. R tidak memiliki
kemampuan serupa! Walaupun ada beberapa package tambahan untuk membaca
data dari file Excel atau database, cara paling mudah untuk ‘mengisi’ data adalah
menggunakan file CSV. Hampir semua aplikasi modern sudah bisa men-export
data dalam bentuk CSV. Sebagai contoh, saya bisa men-export isi file Excel
menjadi file CSV dengan memilih CSV (Command delimited) di bagian Save as
type pada saat menyimpan file. Bila ingin menyimpan hasil query MySQL
Workbench menjadi file CSV, saya bisa men-klik tombol Export dan
memilih CSV di Save as type.
Setelah itu, saya bisa membaca file CSV dengan memberikan perintah
seperti berikut ini:
Selain itu, saya juga dapat melihat preview data dengan menggunakan
function head() atau tail() seperti:
> head(penjualan_produk1)
tanggal qty
1 2014-09-02 20
2 2014-09-03 30
3 2014-09-04 100
4 2014-09-05 10
5 2014-09-06 90
6 2014-09-08 40
Penjualan adalah sebuah variabel sama seperti variabel pada bahasa
pemograman lainnya. Function read.csv() akan menghasilkan nilai dalam tipe
data dataframe. Sebagai informasi, karena R adalah bahasa pemograman khusus
untuk pengolahan statistik, ia memiliki beberapa tipe data bawaan yang unik
seperti vector, matrix, dan dataframe.Sebuah dataframe mirip seperti matrix tetapi
masing-masing kolom boleh memiliki tipe data berbeda. Cara paling gampang
untuk memahami dataframe adalah dengan menganggapnya sebagai sebuah sheet
Excel dimana masing-masing kolom mewakili nilai sebuah variabel (pada
statistik) dalam bentuk vector.
Salah satu masalah yang sering timbul pada saat membaca data adalah
permasalahan yang berkaitan dengan tipe data. Seperti apa tipe data setiap kolom
di penjualan? Saya dapat melihatnya dengan memberikan perintah berikut ini:
tanggal qty
"factor" "integer"
factor adalah tipe data di R untuk nilai yang terdiri atas pilihan atau
kategori, seperti “iya” atau “tidak”. Pada data yang saya baca, nama konsumen
dan nama produk sudah tepat bila dianggap sebagai factor karena nama konsumen
atau nama produk adalah variabel kualitatif/kategorikal. Tapi hal yang sama tidak
berlaku pada kolom tanggal! Kolom tanggal bukan variabel kualitatif
melainkan continuous variable yang harus dibaca dalam bentuk Date. Oleh sebab
itu, saya perlu membaca file CSV dengan perintah seperti berikut ini:
+ colClasses=c('Date', 'integer')
+)
> sapply(penjualan_produk1,class)
tanggal qty
"Date" "integer"
+ colClasses=c('Date', 'integer')
+)
> head(penjualan_produk2)
tanggal qty
1 2014-09-02 80
2 2014-09-03 90
3 2014-09-04 90
4 2014-09-05 40
5 2014-09-06 30
6 2014-09-08 150
> head(p)
1 2014-09-02 20 80
2 2014-09-03 30 90
3 2014-09-04 100 90
4 2014-09-05 10 40
5 2014-09-06 90 30
6 2014-09-08 40 150
> head(p)
1 2014-09-02 20 80
2 2014-09-03 30 90
3 2014-09-04 100 90
4 2014-09-05 10 40
5 2014-09-06 90 30
6 2014-09-08 40 150
> head(p)
qty_produk1 qty_produk2
1 5 57.50000
2 10 52.66667
3 16 NaN
4 20 41.66667
5 23 NaN
6 25 20.00000
> summary(fit1)
Call:
Residuals:
Coefficients:
---
Signif. codes:
> require(ggplot2)
[1] -184.1778
[1] -0.1893496