Nah, sekarang bagaimana cara memulai menjalankan Rstudio? Untuk membuat script
editor baru di RStudio, Anda dapat klik menu File >> New File >> R Script. Cara yang kedua
adalah dengan toolbar New File. Anda dapat lihat pada Gambar 1.21. Anda juga dapat
menggunakan shortcut RStudio dengan menekan tombol Ctrl + Shift + N jika Anda
menggunakan OS Windows. Setelah berhasil menyiapkan file script editor baru yang masih
kosong Anda dapat menuliskan semua yang akan Anda lakukan dengan R. Mencoba “Hello
world!” di R? Di R Anda cukup menuliskan "Hello World!" di script editor,
kemudian Run atau tekan tombol Ctrl + Enter ketika cursor berada pada baris script tersebut
(Gambar 1.24). Tentu saja Anda juga dapat melakukannya seperti yang ada di Python dengan
fungsi print(). Selanjutnya untuk menyimpan script tersebut menjadi sebuah file, Anda dapat
lakukan dengan a) klik lambang simpan, b) pilih menu File >> Save atau Save As... atau c)
menggunakan shortcut dengan menekan tombol Ctrl + S. Kemudian tentukan lokasi folder
tempat menyimpan file script tersebut. Selanjutnya berikan nama file pada kotak File
name: seperti pada Gambar 1.26. Terakhir klik Save. Lalu memberi nama file, lalu selesai.
Saya rasa sangat mudah untuk menginstal kita hanya perlu memahaminya lalu
mengaplikasikannya, ini sangat mudah dibandingkan menjalankannya di Rstudio jadi yang
kita butuhkan adalah pemahaman tentang bagaimana cara download dan mengintsallnya dan
jika kita telah mengetahui dan memahaminya saya rasa itu sudah sangat luar biasa jadi hanya
teman-teman cukup memahami dan mengaplikasikannya.
TEORI : 3
Pada bahasan kali ini akan membahas hal-hal dasar tentang R yang harus diketahui
dan dikuasai. Selanjutnya apa itu dataframe? Nah Dataframe layaknya sebuah tabel di Ms
Excel, terdiri dari baris dan kolom dengan nama masing-masing kolom berbeda. Apa
bedanya dengan matriks? Matriks hanya bisa menyimpan tipe data yang sama, numeric
atau character seluruhnya. Ketika Anda ingin mengambil nilai dari objek tersebut maka
Anda hanya bisa memanggil dengan nama yang sama persis. Anda tidak bisa memanggil
objek tersebut dengan nama lain meskipun ketika Anda mengucapkan dengan suara
pengucapan yang sama. Anda tidak bisa memanggil objek a tersebut dengan A. Untuk
mengetahui struktur dari sebuah dataframe Anda dapat gunakan fungsi str() (str-ucture).
Dengan fungsi ini Anda dapat memperoleh informasi lebih lengkap dari sebuah dataframe
seperti banyaknya observation dan variable, nama-nama variable, tipe variable, dan
beberapa nilai baris pertama untuk masing-masing variable.
Nah, bagaimana jika data yang dibuat di excel kemudian ingin digunakan di program
R.. Untuk import data excel ke R Studio ini ada dua tipe file excel yang akan kita bahas. Tipe
CSV dan XLSX karena merupakan data yang paling umum digunakan di excel. Siapkan data
dengan nama datatinggi.csv dan isikan data seperti di atas. Bagaimana Cara Import Data
Excel Ke R Studio? Pertama-tama Siapkan data dengan nama datatinggi.csv dan isikan data
seperti di atas, Simpan data itu di direktori E:/ atau disesuaikan.Untuk mengimport data CSV
ke excel, buka program R Studio dan gunakan sintak berikut
1. # baris pertama merupakan bari variablenya, seperatornya berupa semikolom
2. # gunakan tanda / dan bukan tanda \ untuk menentukan direktori pada windows
3. Datatinggicsv -> read.table (‘e.:/datatinggi.csv’ , header=TRUE, sep=’.’)
4. Maka akan didapat tampilan data
Semua data ketika kita mengolah data di disimpan di dalam memory. Oleh karena
itu ketika kita menutup sesi R yang sedang berjalan, maka semua data atau objek yang ada
akan hilang. Namun kita bisa ekspor objek yang nantinya ingin kita gunakan kembali di
dalam sebuah file eksternal dengan format RDS. Untuk dapat menggunakan data yang ada
di dalam file RDS kita dapat gunakan fungsi readRDS() dari pakage {base}
atau read_rds() dari package {readr}.
Saya rasa sangat mudah untuk menginstal kita hanya perlu memahaminya lalu
mengaplikasikannya, ini sangat mudah dibandingkan menjalankannya di Rstudio jadi yang
kita butuhkan adalah pemahaman tentang bagaimana cara download dan mengintsallnya dan
jika kita telah mengetahui dan memahaminya saya rasa itu sudah sangat luar biasa jadi hanya
teman-teman cukup memahami dan mengaplikasikannya.
TEORI : 5
Structur Control
R menyediakan berbagai struktur kontrol standar untuk kebutuhan kami. Ekspresi
expr terdiri dari beberapa pernyataan yang bisa diapit dengan kurung kurawal {}. Lebih
efisien menggunakan fungsi bawaan di R daripada struktur kontrol, bila memungkinkan. Ini
memfasilitasi aliran eksekusi untuk dikontrol di dalam suatu fungsi.Struktur kontrol
menentukan aliran program. Keputusan kemudian dibuat setelah variabel dinilai. Ini
memungkinkan Anda untuk mengontrol aliran eksekusi skrip yang biasanya di dalam suatu
fungsi.
Yang umum termasuk: if, else, for, while, repeat, break, next, dan return. Saat dalam
situasi pengulangan bersarang, di mana ada pengulangan di dalam loop lain, pernyataan ini
keluar dari loop terdalam yang sedang dievaluasi. Sebuah ulangi loop digunakan untuk iterate
atas blok kode, beberapa nomor kali. Tugas ini dilakukan hanya jika kondisi ini dikembalikan
sebagai TRUE. R membuatnya lebih mudah: Anda dapat menghapus kata lalu dan
menentukan pilihan Anda dalam pernyataan if. Struktur kontrol ini di R , terbuat dari kotak
persegi panjang 'init' dan berlian. Itu dieksekusi beberapa kali yang diketahui. for adalah
blok yang berada di dalam kurung kurawal. Ini mirip dengan standar for loop , yang
membuatnya mudah untuk mengubah for loop menjadi foreach loop . Tidak seperti banyak
paket pemrograman paralel untuk R, foreach tidak memerlukan badan for untuk diubah
menjadi suatu fungsi. Kita bisa menyebutnya operator bersarang karena digunakan untuk
membuat loop foreach bersarang
Sering kali, kita akan memerlukan beberapa fungsi untuk melakukan pemrosesan dan
mengembalikan hasilnya. Ini dilakukan dengan pernyataan return() di R. Formatnya
adalah while(cond) expr , di mana cond adalah kondisi yang akan diuji dan expr adalah
ekspresi. R akan mengeluh tentang ekspresi yang hilang yang seharusnya memberikan True
atau False yang diperlukan dan pada kenyataannya, ia tidak tahu 'respons' sebelum
menggunakannya dalam loop. Kita juga dapat melakukan ini karena, jika kita menjawab
dengan benar pada percobaan pertama, loop tidak akan dieksekusi sama sekali. Saya rasa
sangat mudah untuk menginstal kita hanya perlu memahaminya lalu mengaplikasikannya, ini
sangat mudah dibandingkan menjalankannya di Rstudio jadi yang kita butuhkan adalah
pemahaman tentang bagaimana cara download dan mengintsallnya dan jika kita telah
mengetahui dan memahaminya saya rasa itu sudah sangat luar biasa jadi hanya teman-teman
cukup memahami dan mengaplikasikannya.
TEORI : 6
Sekarang kita akan membahas apa-apa saja fungsi yang ada diaplikasi Rstudio,
dengan fungsi rep() Anda dapat membuat sebuah vector dengan mengulang-ulang nilai yang
diinginkan sebanyak yang dibutuhkan Karena dibuat untuk memudahkan analisis data, R
mempunyai banyak fungsi yang tersedia untuk melakukan analisis statistik. Untuk
mendapatkan nilai rata-rata dari sebuah vector numeric Anda dapat langsung gunakan
fungsi mean(). Untuk mendapatkan milai minimum atau maksimum tersedia
fungsi min() dan max(). Fungsi sd() dapat digunakan untuk mendapatkan nilai standard
deviasi atau fungsi var() untuk mendapatkan nilai ragam (varians). Argumen byrow =
TRUE artinya matriks akan setiap elemen x diisikan ke m memenuhi baris terlebih dahulu.
Jika byrow = FALSE maka setiap elemen x diisikan ke m berdasarkan kolom terlebih dahulu.
Selanjutnya Factor merupakan bentuk lebih luas dari vector. Biasanya factor lebih
sering digunakan untuk menyimpan data nominal atau ordinal. Misalnya vector character
yang berisi "male" dan "female". Pada vector character, nilainya
adalah "male" dan "female" seperti terlihat apa adanya. Namun pada factor, tampilan dari isi
datanya mungkin "male" dan "female" tetapi isi dari factor adalah pengkodean numerik. Dan
juga Matriks adalah objek di R yang memiliki 2 dimensi, baris (row) dan kolom (column),
dan tipe nilainya sama. Jika ketika membuat sebuah matriks elemennya memiliki minimal
1 elemen bertipe character maka seluruh matriks tersebut akan bertipe character. Membuat
matriks di R menggunakan vector yang dikonversi dimensinya.
Jika fungsi atau data yang akan Anda gunakan berasal dari sebuah package, maka
Anda dapat gunakan fungsi library() atau require() untuk mengaktifkan package tersebut
pada session yang sedang Anda gunakan. Tentunya package tersebut harus sudah Anda
install sebelumnya.Baris di dataframe disebut observation dan kolom disebut variable.
Untuk membuat sebuah dataframe Anda dapat menggunakan fungsi data.frame(). Misalnya
Anda akan membuat sebuah dataframe bernama data1 yang berisi 5 observation dan 2
variable. Variable pertama bernama x1 berisi sebuah vector numeric dengan nilai {1, 3, 2,
6, 4} dan variable kedua bernama v2 berisi vector character dengan nilai {“a”, “A”, “c”,
“d”, “E”}. Anda dapat membuat vector x1 dan v1 terlebih dahulu menggunakan
fungsi c() (atau fungsi lain yang sesuai untuk membuat vector).
TEORI : 7
R mempunyai fungsi yang sederhana untuk membuat grafik. Pada ggplot, bar graph
dapat dibuat menggunakan layer geometry geom_bar() dan geom_col(). geom_bar()
membuat plot berdasarkan jumlah observasi tiap kategori, sedangkan geom_col() membuat
plot berdasarkan nilai pada data atau observasi. Untuk lebih memahaminya jika kita
memasukkan fungsi geom_bar() maka r untuk membuat plot pada data diatas maka output
grafik akan membuat grafik frekuensi untuk ketiga kelas seragam yaitu 1 karena jumlah
observasi pada data tersebut untuk kategori tersebut masing-masing satu. Jika
menggunakan geom_col() maka kita dapat menginput kategori beserta nilai observasinya.
Jika didata kita memiliki banyak observasi dan tiap observasi memiliki nilai
maka geom_col() akan memproses tinggi bar pada plot berdasarkan nilai rata-rata tiap
kategorinya.
Jika kita ingin menggunakan geom_bar() untuk membuat grafik seperti Gambar 2,
kita perlu menambahkan command stat_identity agar tinggi dari bar dapat menggunakan nilai
observasinya. Pie chart pada r hanya bias dibuat menggunakan pake plot bawaan r. Pada
artikel ini plot hanya dilakukan untuk melihat jumlah proporsi observasi pada
data ToothGrowth.
Salah satu kegunaan Histogram adalah diagram yang berkaitan dengan range atau
untuk melihat distribusi, penyebaran, varian suatu produk, proses atau layanan.dengan
menambahkan syntaq
Z = hist(Zat_padat)
Z$breaks
Z$counts
Z$density
Z$mids
Z$xname
Z$equidist
Dimana untuk membuat garis distribusinya maka kita gunakan fungsi dnorm dan rentang
nilai.
TEORI : 8
Pada text mining yang pertama harus dilakukan yaitu Siapkan terlebih dahulu R nya
serta install package yang diperlukan > install.packages("xml2"), > library(xml2),
>install.packages("rvest"), > library(rvest). kemudian kita ingin mengambil review dari Hotel
Royal Ambarrukmo yang ada di kota Yogyakarta, kita masukkan dalam R alamat website
tersebut, misal hasil pembacaan halaman website tersebut kita namakan “Ambarrukmo”
> ambarrukmo <- read_html> ambarrukmo. kemudian masukkan lagi ke R,
> review<-html_nodes(ambarrukmo,".common-text-ReadMore__content--2X4LR")
> reviewtext<-html_text(review)
> reviewtext
Kemudian, kita bersihkan sedikit, misal jika ada huruf “\n” dan lainnya yang tidak
diperlukan, dan kemudian kita simpan dalam cs bisa dilihat hasilnya tersimpan seperti berikut
(letak folder dipersilahkan anda buat sendiri)
Selanjutnya anda install beberapa package tambahan yang diperlukan untuk analisa
selanjutnya.
> library(tm)
> library(SnowballC)
> library(wordcloud)
> library(RColorBrewer)
> library(stringr)
jika anda belum menginstallnya maka gunakan perintah “install.packages(“nama_package”)”
Setelah instalasi selesai maka dapat kita teruskan dengan membaca kembali dokumen
yang ada dalam folder,
> dokumen<-readLines("C://untad/reviewtextbaru.csv")
> dokumen
nampak hasilnya,
daftar kata-kata diurutkan secara abjad atau lexical dan dianggap sebagai kolom, pada
perintah inspect hanya diperlihatkan 10 kata-kata pertama saja. Contoh pada dokumen ke-1
kata “ambarrukmo” muncul 2 kali, kata “best” tidak muncul, kata “dan” muncul 4 kali dan
seterusnya, Jika ingin diketahui lebih detil lagi dapat gunakan perintah berikut,
> str(dokumenDTM).
TEORI : 10
Regresi berganda adalah teknik statistik yang kuat, dan di sini Anda akan menemukan
mengapa dan bagaimana menggunakannya. Bagian dari kursus akan fokus pada aljabar
matriks karena sangat penting jika Anda ingin mulai memperkirakan koefisien regresi dalam
persamaan regresi. Bab terakhir akan memperkenalkan dummy coding sebagai teknik untuk
menangani variabel kategoris. Bab ini akan membantu mengembangkan pemahaman Anda
tentang kerangka dasar regresi berganda. Untuk tujuan ini, Anda akan menggunakan dataset
fs yang telah dimuat sebelumnya yang berisi upah tahunan profesor di universitas
tertentu. Dengan mengikuti latihan, Anda akan membiasakan diri dengan penerapan, dan
intuisi di balik, aspek terpenting dari regresi berganda dalam R.
Dalam video tersebut, Profesor Conway berbicara tentang koefisien R2 dari model
regresi. Koefisien ini sering digunakan dalam praktik untuk memilih model regresi terbaik
dalam kasus model yang bersaing. Koefisien R2 model regresi didefinisikan sebagai
persentase variasi variabel hasil yang dapat dijelaskan oleh variabel prediktor model. Secara
umum, R2 koefisien model meningkat ketika lebih banyak variabel prediktor ditambahkan ke
model. Lagi pula, menambahkan lebih banyak variabel prediktor ke model cenderung
meningkatkan kemungkinan menjelaskan lebih banyak variasi dalam variabel hasil.
TEORI : 11
Cara mudah untuk menghasilkan data numerik adalah dengan menarik angka acak
dari beberapa distribusi. Ini dapat dilakukan melalui fungsi untuk menghasilkan
penyimpangan acak. Fungsi-fungsi ini selalu dimulai dengan r(untuk "acak"). Distribusi dasar
yang paling sering saya gunakan untuk menghasilkan bilangan acak adalah distribusi normal
( rnorm()) dan seragam ( runif()). Kita akan melihatnya hari ini,
ditambah rpois()distribusi Poisson ( ) untuk menghasilkan jumlah diskrit.
rnorm(n = 5, mean = 0, sd = 1)
TEORI : 12
Metode yang kuat (atau "tahan") untuk pemodelan statistik telah tersedia di S sejak
awal tahun 1980-an; dan kemudian di R dalam statistik paket . Contohnya
adalah median() , mean(*, trim =. ) , mad() , IQR() , atau juga fivenum() , statistik di
belakang boxplot() dalam grafik paket ) atau lowess() (dan loess() ) untuk regresi
nonparametrik yang kuat, yang telah dilengkapi dengan runmed() pada tahun 2003. fungsi
penting lanjut Banyak yang telah dibuat tersedia di direkomendasikan (dan karenanya hadir
dalam semua versi R) paket MASSA (oleh Bill Venables dan Brian Ripley,
lihat yang buku modern Terapan Statistik dengan S ). Yang terpenting, mereka
menyediakan rlm() untuk regresi yang kuat dan cov.rob() untuk pencar dan kovarian
multivarian yang kuat.
Tampilan tugas ini adalah tentang paket add-on R yang menyediakan algoritma yang
lebih baru atau lebih cepat, lebih efisien dan terutama untuk (robustifikasi) model
baru.Silakan kirim saran untuk penambahan dan ekstensi ke pengelola tampilan tugas .
Sekelompok ilmuwan internasional yang bekerja di bidang statistik yang kuat telah
melakukan upaya (sejak Oktober 2005) untuk mengoordinasikan beberapa perkembangan
yang tersebar dan membuat yang penting tersedia melalui serangkaian paket R yang saling
melengkapi. Ini harus dibangun di atas paket dasar dengan "Essentials", yang
diciptakan robustbase dengan (berpotensi banyak) paket lain yang dibangun di atas dan
memperluas fungsionalitas penting ke model atau aplikasi tertentu. Lebih lanjut, ada paket
yang cukup komprehensif yang kuat , versi perpustakaan yang kuat dari S-PLUS, sebagai
paket R yang sekarang Berlisensi GP berkat Insightful dan Kjell Konis.