Anda di halaman 1dari 12

Nama: Wardatul Jannah (105361106019)

Kelas: Matematika 2019 C (4 C)


NIM : 105361106019
MATKUL : Pemrograman Komputer
TEORI : 1

Download and Install R and Rstudio


R adalah sebuah program komputasi statistika dan grafis (R Core Team 2020). Tentu
saja selain R masih banyak software lain yang juga sering digunakan untuk analisis data,
misalnya Python. R dibuat dengan tujuan awal untuk komputasi statistika dan grafis. Awalnya
digunakan oleh para ilmuwan dalam riset mereka dan para akademisi. R merupakan salah
satu software yang terkadang digunakan untuk membuat data excell secara otomatis. Rstudio
merupakan salah satu program integrated development environtment (IDE) untuk R yang
memudahkan pengguna untuk menulis dan mengeksekusi kode. Rstudio dipilih karena telah
memiliki banyak pengguna dan memiliki tampilan antarmuka yang cukup sederhana yang
sangat mudah dipahami bahkan untuk pemula yang baru saja belajar.
Nah, sekarang bagaimana cara menginstal R and Rstudio? Cukup mudah, pertama-
tama kita harus membuka halaman https://cran.r-project.org , lalu Pilih Download R for
Windows, terus klik Comprehensive R Archive Network (CRAN), Klik install R for the first
time, klik Download R Installer, Kemudian klik Download R x.x.x for Windows, Download
R untuk Windows, Simpan file installer tersebut dan tunggu hingga proses download selesai,
Setelah download selesai, jalankan file R x.x.x.exe tersebut, Anda hanya perlu klik Next dan
Finish. Selesai deh, mudah bukan? Selanjutnya, bagaimana menjalankan R? Nah, Setelah
selesai install, Anda bisa membuka R GUI Pada Windows 10, klik atau tekan tombol Start,
Cari folder R dan pilih R sesuai versi yang sudah terinstall, lalu klik menu untuk menjalankan
R. Anda sudah dapat menggunakan R melalui R GUI ini. Namun Anda juga dapat
menggunakan Integrated Development Environment (IDE) untuk lebih nyaman, mudah dan
efisien ketika bekerja dengan R. IDE untuk R yang saat ini sangat sering digunakan adalah
RStudio. Berikut ini adalah cara untuk install RStudio di PC Windows.
Saya rasa sangat mudah untuk menginstal kita hanya perlu memahaminya lalu
mengaplikasikannya, ini sangat mudah dibandingkan menjalankannya di Rstudio jadi yang
kita butuhkan adalah pemahaman tentang bagaimana cara download dan mengintsallnya dan
jika kita telah mengetahui dan memahaminya saya rasa itu sudah sangat luar biasa jadi hanya
teman-teman cukup memahami dan mengaplikasikannya.
TEORI : 2

Getting Started in Program R


Setelah download RStudio versi desktop sesuai dengan kebutuhan. Sangat disarankan untuk
menggunakan RStudio versi terbaru, termasuk juga dengan R. R dan RStudio adalah dua
program yang berbeda. Sebenarnya tidak harus install RStudio untuk dapat menggunakan
program R (melalui R GUI). Tapidiwajibkan untuk install R terlebih dahulu sebelum install
dan menggunakan RStudio karena RStudio membutuhkan program R yang sudah terinstall di
PC atau server. Hal yang sebaiknya menjadi kebiasaan Anda ketika menggunakan RStudio
adalah membuat sebuah Project untuk setiap pekerjaan yang berbeda. Jika pekerjaan Anda
tidak terdapat data yang confidential, Anda juga dapat menggunakan GitHub repository
sebagai backup atau berbagi yang Anda kerjakan. Anda dapat membuat sebuah project baru
di RStudio dengan cara:

Nah, sekarang bagaimana cara memulai menjalankan Rstudio? Untuk membuat script
editor baru di RStudio, Anda dapat klik menu File >> New File >> R Script. Cara yang kedua
adalah dengan toolbar New File. Anda dapat lihat pada Gambar 1.21. Anda juga dapat
menggunakan shortcut RStudio dengan menekan tombol Ctrl + Shift + N jika Anda
menggunakan OS Windows. Setelah berhasil menyiapkan file script editor baru yang masih
kosong Anda dapat menuliskan semua yang akan Anda lakukan dengan R. Mencoba “Hello
world!” di R? Di R Anda cukup menuliskan "Hello World!" di script editor,
kemudian Run atau tekan tombol Ctrl + Enter ketika cursor berada pada baris script tersebut
(Gambar 1.24). Tentu saja Anda juga dapat melakukannya seperti yang ada di Python dengan
fungsi print(). Selanjutnya untuk menyimpan script tersebut menjadi sebuah file, Anda dapat
lakukan dengan a) klik lambang simpan, b) pilih menu File >> Save atau Save As... atau c)
menggunakan shortcut dengan menekan tombol Ctrl + S. Kemudian tentukan lokasi folder
tempat menyimpan file script tersebut. Selanjutnya berikan nama file pada kotak File
name: seperti pada Gambar 1.26. Terakhir klik Save. Lalu memberi nama file, lalu selesai.

Saya rasa sangat mudah untuk menginstal kita hanya perlu memahaminya lalu
mengaplikasikannya, ini sangat mudah dibandingkan menjalankannya di Rstudio jadi yang
kita butuhkan adalah pemahaman tentang bagaimana cara download dan mengintsallnya dan
jika kita telah mengetahui dan memahaminya saya rasa itu sudah sangat luar biasa jadi hanya
teman-teman cukup memahami dan mengaplikasikannya.
TEORI : 3

Dealing with Dates, Strings, and Data Frames

Pada bahasan kali ini akan membahas hal-hal dasar tentang R yang harus diketahui
dan dikuasai. Selanjutnya apa itu dataframe? Nah Dataframe layaknya sebuah tabel di Ms
Excel, terdiri dari baris dan kolom dengan nama masing-masing kolom berbeda. Apa
bedanya dengan matriks? Matriks hanya bisa menyimpan tipe data yang sama, numeric
atau character seluruhnya. Ketika Anda ingin mengambil nilai dari objek tersebut maka
Anda hanya bisa memanggil dengan nama yang sama persis. Anda tidak bisa memanggil
objek tersebut dengan nama lain meskipun ketika Anda mengucapkan dengan suara
pengucapan yang sama. Anda tidak bisa memanggil objek a tersebut dengan A. Untuk
mengetahui struktur dari sebuah dataframe Anda dapat gunakan fungsi str() (str-ucture).
Dengan fungsi ini Anda dapat memperoleh informasi lebih lengkap dari sebuah dataframe
seperti banyaknya observation dan variable, nama-nama variable, tipe variable, dan
beberapa nilai baris pertama untuk masing-masing variable.

Untuk membuat sebuah dataframe Anda dapat menggunakan fungsi data.frame().


Misalnya Anda akan membuat sebuah dataframe bernama data1 yang berisi 5 observation
dan 2 variable. Variable pertama bernama x1 berisi sebuah vector numeric dengan nilai {1,
3, 2, 6, 4} dan variable kedua bernama v2 berisi vector character dengan nilai {“a,” “A,”
“c,” “d,” “E”}. Anda dapat membuat vector x1 dan v1 terlebih dahulu menggunakan
fungsi c() (atau fungsi lain yang sesuai untuk membuat vector).Perhatian! Ketika Anda
membuat sebuah dataframe yang berisi sebuah variable character pada R dengan versi
3.6.3 atau sebelumnya, maka secara otomatis variable dari vector character tersebut akan
diubah menjadi variable factor (2.6). Hal ini terjadi karena fungsi data.frame() mempunyai
sebuah argumen stringsAsFactors = TRUE. Pada R versi 4.0.0 atau lebih baru, variable
dari vector character akan tetap dijadikan sebuah variable character karena
argumen stringsAsFactors = FALSE.
Saya rasa sangat mudah untuk menginstal kita hanya perlu memahaminya lalu
mengaplikasikannya, ini sangat mudah dibandingkan menjalankannya di Rstudio jadi yang
kita butuhkan adalah pemahaman tentang bagaimana cara download dan mengintsallnya dan
jika kita telah mengetahui dan memahaminya saya rasa itu sudah sangat luar biasa jadi hanya
teman-teman cukup memahami dan mengaplikasikannya.
TEORI : 4
Input and Output on Rstudio
Input data merupakan tahapan penting dalam mengolah dan menganalisis data, begitu
juga dengan program R. Namun, data sederhana biasanya lebih umum dituliskan pada
program excel. Hal ini karena excel lebih familiar digunakan dan diinstal di banyak
komputer. Seperti pada tulisan pemrograman R sebelumnya, kita ketahui bahwa program
analisis data dan juga sekaligus sebuah bahasa pemrograman yang di sebut R ini selain open
source ternyata juga kompatibel dengan program – program statistik yang lain seperti SPSS,
Matlab, dan juga Excel. Oleh karena itu, kita bisa menggunakan data yang sudah dibuat di
program tadi untuk dibuka dan dianalisis di R.

Nah, bagaimana jika data yang dibuat di excel kemudian ingin digunakan di program
R.. Untuk import  data excel ke R Studio ini ada dua tipe file excel yang akan kita bahas. Tipe
CSV dan XLSX karena merupakan data yang paling umum digunakan di excel. Siapkan data
dengan nama datatinggi.csv dan isikan data seperti di atas. Bagaimana Cara Import Data
Excel Ke R Studio? Pertama-tama Siapkan data dengan nama datatinggi.csv dan isikan data
seperti di atas, Simpan data itu di direktori E:/ atau disesuaikan.Untuk mengimport data CSV
ke excel, buka program R Studio dan gunakan sintak berikut
1. # baris pertama merupakan bari variablenya, seperatornya berupa semikolom
2. # gunakan tanda / dan bukan tanda \ untuk menentukan direktori pada windows
3. Datatinggicsv -> read.table (‘e.:/datatinggi.csv’ , header=TRUE, sep=’.’)
4. Maka akan didapat tampilan data

Semua data ketika kita mengolah data di disimpan di dalam memory. Oleh karena
itu ketika kita menutup sesi R yang sedang berjalan, maka semua data atau objek yang ada
akan hilang. Namun kita bisa ekspor objek yang nantinya ingin kita gunakan kembali di
dalam sebuah file eksternal dengan format RDS. Untuk dapat menggunakan data yang ada
di dalam file RDS kita dapat gunakan fungsi readRDS() dari pakage {base}
atau read_rds() dari package {readr}.

Saya rasa sangat mudah untuk menginstal kita hanya perlu memahaminya lalu
mengaplikasikannya, ini sangat mudah dibandingkan menjalankannya di Rstudio jadi yang
kita butuhkan adalah pemahaman tentang bagaimana cara download dan mengintsallnya dan
jika kita telah mengetahui dan memahaminya saya rasa itu sudah sangat luar biasa jadi hanya
teman-teman cukup memahami dan mengaplikasikannya.
TEORI : 5
Structur Control
R menyediakan berbagai struktur kontrol standar untuk kebutuhan kami. Ekspresi
expr terdiri dari beberapa pernyataan yang bisa diapit dengan kurung kurawal {}. Lebih
efisien menggunakan fungsi bawaan di R daripada struktur kontrol, bila memungkinkan. Ini
memfasilitasi aliran eksekusi untuk dikontrol di dalam suatu fungsi.Struktur kontrol
menentukan aliran program. Keputusan kemudian dibuat setelah variabel dinilai. Ini
memungkinkan Anda untuk mengontrol aliran eksekusi skrip yang biasanya di dalam suatu
fungsi. 
Yang umum termasuk: if, else, for, while, repeat, break, next, dan return. Saat dalam
situasi pengulangan bersarang, di mana ada pengulangan di dalam loop lain, pernyataan ini
keluar dari loop terdalam yang sedang dievaluasi. Sebuah ulangi loop digunakan untuk iterate
atas blok kode, beberapa nomor kali. Tugas ini dilakukan hanya jika kondisi ini dikembalikan
sebagai TRUE. R membuatnya lebih mudah: Anda dapat menghapus kata lalu dan
menentukan pilihan Anda dalam pernyataan if. Struktur kontrol ini di R , terbuat dari kotak
persegi panjang 'init' dan berlian. Itu dieksekusi beberapa kali yang diketahui. for  adalah
blok yang berada di dalam kurung kurawal. Ini mirip dengan standar for loop , yang
membuatnya mudah untuk mengubah for loop menjadi foreach loop . Tidak seperti banyak
paket pemrograman paralel untuk R, foreach tidak memerlukan badan for untuk diubah
menjadi suatu fungsi. Kita bisa menyebutnya operator bersarang karena digunakan untuk
membuat loop foreach bersarang
Sering kali, kita akan memerlukan beberapa fungsi untuk melakukan pemrosesan dan
mengembalikan hasilnya. Ini dilakukan dengan pernyataan return()  di R. Formatnya
adalah while(cond) expr , di mana cond adalah kondisi yang akan diuji dan expr adalah
ekspresi. R akan mengeluh tentang ekspresi yang hilang yang seharusnya memberikan True
atau False yang diperlukan dan pada kenyataannya, ia tidak tahu 'respons' sebelum
menggunakannya dalam loop. Kita juga dapat melakukan ini karena, jika kita menjawab
dengan benar pada percobaan pertama, loop tidak akan dieksekusi sama sekali. Saya rasa
sangat mudah untuk menginstal kita hanya perlu memahaminya lalu mengaplikasikannya, ini
sangat mudah dibandingkan menjalankannya di Rstudio jadi yang kita butuhkan adalah
pemahaman tentang bagaimana cara download dan mengintsallnya dan jika kita telah
mengetahui dan memahaminya saya rasa itu sudah sangat luar biasa jadi hanya teman-teman
cukup memahami dan mengaplikasikannya.
TEORI : 6

FUNCTIONAL PROGRAMMING IN RSTUDIO

Sekarang kita akan membahas apa-apa saja fungsi yang ada diaplikasi Rstudio,
dengan fungsi rep() Anda dapat membuat sebuah vector dengan mengulang-ulang nilai yang
diinginkan sebanyak yang dibutuhkan Karena dibuat untuk memudahkan analisis data, R
mempunyai banyak fungsi yang tersedia untuk melakukan analisis statistik. Untuk
mendapatkan nilai rata-rata dari sebuah vector numeric Anda dapat langsung gunakan
fungsi mean(). Untuk mendapatkan milai minimum atau maksimum tersedia
fungsi min() dan max(). Fungsi sd() dapat digunakan untuk mendapatkan nilai standard
deviasi atau fungsi var() untuk mendapatkan nilai ragam (varians). Argumen byrow =
TRUE artinya matriks akan setiap elemen x diisikan ke m memenuhi baris terlebih dahulu.
Jika byrow = FALSE maka setiap elemen x diisikan ke m berdasarkan kolom terlebih dahulu.

Selanjutnya Factor merupakan bentuk lebih luas dari vector. Biasanya factor lebih
sering digunakan untuk menyimpan data nominal atau ordinal. Misalnya vector character
yang berisi "male" dan "female". Pada vector character, nilainya
adalah "male" dan "female" seperti terlihat apa adanya. Namun pada factor, tampilan dari isi
datanya mungkin "male" dan "female" tetapi isi dari factor adalah pengkodean numerik. Dan
juga Matriks adalah objek di R yang memiliki 2 dimensi, baris (row) dan kolom (column),
dan tipe nilainya sama. Jika ketika membuat sebuah matriks elemennya memiliki minimal
1 elemen bertipe character maka seluruh matriks tersebut akan bertipe character. Membuat
matriks di R menggunakan vector yang dikonversi dimensinya.

Jika fungsi atau data yang akan Anda gunakan berasal dari sebuah package, maka
Anda dapat gunakan fungsi library() atau require() untuk mengaktifkan package tersebut
pada session yang sedang Anda gunakan. Tentunya package tersebut harus sudah Anda
install sebelumnya.Baris di dataframe disebut observation dan kolom disebut variable.
Untuk membuat sebuah dataframe Anda dapat menggunakan fungsi data.frame(). Misalnya
Anda akan membuat sebuah dataframe bernama data1 yang berisi 5 observation dan 2
variable. Variable pertama bernama x1 berisi sebuah vector numeric dengan nilai {1, 3, 2,
6, 4} dan variable kedua bernama v2 berisi vector character dengan nilai {“a”, “A”, “c”,
“d”, “E”}. Anda dapat membuat vector x1 dan v1 terlebih dahulu menggunakan
fungsi c() (atau fungsi lain yang sesuai untuk membuat vector).
TEORI : 7

Creating Tables and Graphs in Rstudio

R mempunyai fungsi yang sederhana untuk membuat grafik. Pada ggplot, bar graph
dapat dibuat menggunakan layer geometry geom_bar() dan geom_col(). geom_bar()
membuat plot berdasarkan jumlah observasi tiap kategori, sedangkan geom_col() membuat
plot berdasarkan nilai pada data atau observasi. Untuk lebih memahaminya jika kita
memasukkan fungsi geom_bar() maka r untuk membuat plot pada data diatas maka output
grafik akan membuat grafik frekuensi untuk ketiga kelas seragam yaitu 1 karena jumlah
observasi pada data tersebut untuk kategori tersebut masing-masing satu. Jika
menggunakan geom_col() maka kita dapat menginput kategori beserta nilai observasinya.
Jika didata kita memiliki banyak observasi dan tiap observasi memiliki nilai
maka geom_col() akan memproses tinggi bar pada plot berdasarkan nilai rata-rata tiap
kategorinya.
Jika kita ingin menggunakan geom_bar() untuk membuat grafik seperti Gambar 2,
kita perlu menambahkan command stat_identity agar tinggi dari bar dapat menggunakan nilai
observasinya. Pie chart pada r hanya bias dibuat menggunakan pake plot bawaan r. Pada
artikel ini plot hanya dilakukan untuk melihat jumlah proporsi observasi pada
data ToothGrowth.

Salah satu kegunaan Histogram adalah diagram yang berkaitan dengan range atau
untuk melihat distribusi, penyebaran, varian suatu produk, proses atau layanan.dengan
menambahkan syntaq

Z = hist(Zat_padat)
Z$breaks 
Z$counts
Z$density
Z$mids
Z$xname
Z$equidist
Dimana untuk membuat garis distribusinya maka kita gunakan fungsi dnorm dan rentang
nilai.
TEORI : 8

DATA VISUALIZATION IN R STUDIO

Kali ini bagaimana cara memvisualisasikan data Anda menggunakan ggplot2. R


memiliki beberapa sistem untuk membuat grafik, tetapi ggplot2 adalah salah satu yang paling
elegan dan serbaguna. ggplot2 mengimplementasikan tata bahasa grafik , sistem yang
koheren untuk menggambarkan dan membangun grafik. Dengan ggplot2, Anda dapat
melakukan lebih cepat dengan mempelajari satu sistem dan menerapkannya di banyak
tempat. Satu baris kode itu memuat inti rapi; paket yang akan Anda gunakan di hampir setiap
analisis data. Ini juga memberi tahu Anda fungsi mana dari konflik rapi dengan fungsi di
basis R (atau dari paket lain yang mungkin telah Anda muat).
Jika Anda menjalankan kode ini dan mendapatkan pesan kesalahan "tidak ada paket
yang disebut 'tidyverse'", Anda harus menginstalnya terlebih dahulu, lalu
jalankan library()sekali lagi. Anda hanya perlu menginstal paket sekali, tetapi Anda perlu
memuatnya kembali setiap kali Anda memulai sesi baru. Jika kita perlu secara eksplisit
tentang dari mana suatu fungsi (atau kumpulan data) berasal, kita akan menggunakan
formulir khusus package::function(). Misalnya, ggplot2::ggplot()memberi tahu Anda secara
eksplisit bahwa kami menggunakan ggplot()fungsi dari paket ggplot2. Mari kita gunakan
grafik pertama untuk menjawab pertanyaan: Apakah mobil dengan mesin besar menggunakan
lebih banyak bahan bakar daripada mobil dengan mesin kecil? Anda mungkin sudah memiliki
jawaban, tetapi cobalah untuk membuat jawaban Anda tepat. Seperti apa hubungan antara
ukuran mesin dan efisiensi bahan bakar? Apakah itu positif? Negatif? Linier? Nonlinier?
Mari kita berhipotesis bahwa mobil-mobil itu adalah hibrida. Salah satu cara untuk
menguji hipotesis ini adalah dengan melihat classnilai untuk setiap
mobil. The classvariabel mpgmobil mengklasifikasikan dataset ke dalam kelompok-
kelompok seperti kompak, menengah, dan SUV. Jika titik-titik terluar adalah hibrida, mereka
harus diklasifikasikan sebagai mobil kompak atau, mungkin, mobil subkompak (perlu diingat
bahwa data ini dikumpulkan sebelum truk dan SUV hibrida menjadi populer). Anda dapat
menambahkan variabel ketiga, seperti class, ke sebar dua dimensi dengan memetakannya
ke estetika . Estetika adalah properti visual dari objek di plot Anda. Estetika mencakup hal-
hal seperti ukuran, bentuk, atau warna titik Anda. Anda dapat menampilkan titik (seperti di
bawah) dengan cara yang berbeda dengan mengubah nilai properti estetikanya. Karena kita
sudah menggunakan kata "nilai" untuk menggambarkan data, mari gunakan kata "tingkat"
untuk menggambarkan sifat estetika.
TEORI : 9

TEXT MINING IN R STUDIO

Pada text mining yang pertama harus dilakukan yaitu Siapkan terlebih dahulu R nya
serta install package yang diperlukan > install.packages("xml2"), > library(xml2),
>install.packages("rvest"), > library(rvest). kemudian kita ingin mengambil review dari Hotel
Royal Ambarrukmo yang ada di kota Yogyakarta, kita masukkan dalam R alamat website
tersebut, misal hasil pembacaan halaman website tersebut kita namakan “Ambarrukmo”
> ambarrukmo <- read_html> ambarrukmo. kemudian masukkan lagi ke R,
> review<-html_nodes(ambarrukmo,".common-text-ReadMore__content--2X4LR")
> reviewtext<-html_text(review)
> reviewtext
Kemudian, kita bersihkan sedikit, misal jika ada huruf “\n” dan lainnya yang tidak
diperlukan, dan kemudian kita simpan dalam cs bisa dilihat hasilnya tersimpan seperti berikut
(letak folder dipersilahkan anda buat sendiri)
Selanjutnya anda install beberapa package tambahan yang diperlukan untuk analisa
selanjutnya.
> library(tm)
> library(SnowballC)
> library(wordcloud)
> library(RColorBrewer)
> library(stringr)
jika anda belum menginstallnya maka gunakan perintah “install.packages(“nama_package”)”
Setelah instalasi selesai maka dapat kita teruskan dengan membaca kembali dokumen
yang ada dalam folder,
> dokumen<-readLines("C://untad/reviewtextbaru.csv")
> dokumen
nampak hasilnya,
daftar kata-kata diurutkan secara abjad atau lexical dan dianggap sebagai kolom, pada
perintah inspect hanya diperlihatkan 10 kata-kata pertama saja. Contoh pada dokumen ke-1
kata “ambarrukmo” muncul 2 kali, kata “best” tidak muncul, kata “dan” muncul 4 kali dan
seterusnya, Jika ingin diketahui lebih detil lagi dapat gunakan perintah berikut,
> str(dokumenDTM).
TEORI : 10

MULTIPLE REGRESSION IN RSTUDIO

Regresi berganda adalah teknik statistik yang kuat, dan di sini Anda akan menemukan
mengapa dan bagaimana menggunakannya. Bagian dari kursus akan fokus pada aljabar
matriks karena sangat penting jika Anda ingin mulai memperkirakan koefisien regresi dalam
persamaan regresi. Bab terakhir akan memperkenalkan dummy coding sebagai teknik untuk
menangani variabel kategoris. Bab ini akan membantu mengembangkan pemahaman Anda
tentang kerangka dasar regresi berganda. Untuk tujuan ini, Anda akan menggunakan dataset
fs yang telah dimuat sebelumnya yang berisi upah tahunan profesor di universitas
tertentu. Dengan mengikuti latihan, Anda akan membiasakan diri dengan penerapan, dan
intuisi di balik, aspek terpenting dari regresi berganda dalam R.

Seperti biasa, mulailah dengan menjelajahi data untuk memastikan Anda


mendapatkan tampilan global dari data yang sedang Anda kerjakan. Langkah pertama ini
sangat penting karena membantu Anda untuk benar-benar memahami berbagai hal. Dengan
demikian, Anda akan dapat melakukan latihan dengan lebih mudah. Gunakan konsol R untuk
melakukan tindakan ini. Sekarang Anda telah melihat secara singkat data dalam latihan
sebelumnya, langkah selanjutnya yang baik adalah mendapatkan pandangan tentang sifat
hubungan empiris antara variabel hasil (gaji tahunan profesor) dan dua variabel prediktor
spesifik (angka tahun sebagai anggota fakultas dan jumlah publikasi). Secara intuitif, orang
akan berharap bahwa seorang profesor dengan lebih banyak pengalaman kerja akan
menghasilkan lebih banyak. Selain itu, masuk akal juga jika seorang dosen dengan keahlian
yang lebih besar dalam hal jumlah publikasi akan memiliki gaji yang lebih tinggi juga. Mari
kita lihat apakah ini berlaku dalam praktik dengan mendapatkan konfirmasi visual melalui
beberapa plot pencar!

Dalam video tersebut, Profesor Conway berbicara tentang koefisien R2 dari model
regresi. Koefisien ini sering digunakan dalam praktik untuk memilih model regresi terbaik
dalam kasus model yang bersaing. Koefisien R2 model regresi didefinisikan sebagai
persentase variasi variabel hasil yang dapat dijelaskan oleh variabel prediktor model. Secara
umum, R2 koefisien model meningkat ketika lebih banyak variabel prediktor ditambahkan ke
model. Lagi pula, menambahkan lebih banyak variabel prediktor ke model cenderung
meningkatkan kemungkinan menjelaskan lebih banyak variasi dalam variabel hasil.
TEORI : 11

USING R FOR SIMULATION IN R STUDIO

Cara mudah untuk menghasilkan data numerik adalah dengan menarik angka acak
dari beberapa distribusi. Ini dapat dilakukan melalui fungsi untuk menghasilkan
penyimpangan acak. Fungsi-fungsi ini selalu dimulai dengan r(untuk "acak"). Distribusi dasar
yang paling sering saya gunakan untuk menghasilkan bilangan acak adalah distribusi normal
( rnorm()) dan seragam ( runif()). Kita akan melihatnya hari ini,
ditambah rpois()distribusi Poisson ( ) untuk menghasilkan jumlah diskrit.

Ada banyak distribusi lain yang tersedia sebagai bagian dari paket statistik (misalnya,


binomial, F, log normal, beta, eksponensial, Gamma) dan, seperti yang dapat Anda
bayangkan, lebih banyak lagi tersedia dalam paket tambahan. Baru-baru ini saya perlu
membuat data dari distribusi Tweedie untuk menguji alat pemodelan, yang dapat saya
lakukan melalui package tweedie . The r fungsi untuk distribusi yang dipilih semua pekerjaan
pada dasarnya dengan cara yang sama. Kami menentukan berapa banyak angka acak yang
ingin kami hasilkan dalam argumen pertama ( n) dan kemudian menentukan parameter untuk
distribusi yang ingin kami gambar. Ini lebih mudah dilihat dengan latihan, jadi mari kita
mulai.

Saya menggunakan rnorm()banyak, kadang-kadang dengan alasan yang baik dan


kadang-kadang ketika saya membutuhkan beberapa nomor dan saya benar-benar tidak terlalu
peduli tentang apa itu. Ada tiga argumen untuk rnorm(). Dari Usagebagian dokumentasi:
rnorm(n, mean = 0, sd = 1). The argumen adalah jumlah pengamatan kita ingin
menghasilkan. The meandan sdargumen menunjukkan apa nilai default parameter yang
(catatan bahwa sdadalah standar deviasi , bukan varians). Tidak semua rfungsi memiliki
default untuk argumen parameter seperti ini. Untuk mendapatkan 5 angka acak
dari distribusi (alias normal standar ) kita dapat menulis kode
seperti:nHaiRMSebuahaku(0,1)nHaiRMSebuahaku(0,1) rnorm(5). Berikut kode yang lebih
jelas untuk melakukan hal yang sama, di mana saya menulis argumen mean dan standar
deviasi secara eksplisit meskipun saya menggunakan nilai default. Hal ini tentu tidak perlu
untuk selalu berhati-hati ini, tapi saya tidak berpikir saya telah mengalami situasi yang buruk
untuk memiliki kode yang jelas.

rnorm(n = 5, mean = 0, sd = 1)
TEORI : 12

MODERN ROBUST STATISTICAL METHODS IN R STUDIO

Metode yang kuat (atau "tahan") untuk pemodelan statistik telah tersedia di S sejak
awal tahun 1980-an; dan kemudian di R dalam statistik paket . Contohnya
adalah median() , mean(*, trim =. ) , mad() , IQR() , atau juga fivenum() , statistik di
belakang boxplot() dalam grafik paket ) atau lowess() (dan loess() ) untuk regresi
nonparametrik yang kuat, yang telah dilengkapi dengan runmed() pada tahun 2003. fungsi
penting lanjut Banyak yang telah dibuat tersedia di direkomendasikan (dan karenanya hadir
dalam semua versi R) paket MASSA (oleh Bill Venables dan Brian Ripley,
lihat yang  buku modern Terapan Statistik dengan S ). Yang terpenting, mereka
menyediakan rlm() untuk regresi yang kuat dan cov.rob() untuk pencar dan kovarian
multivarian yang kuat.

Tampilan tugas ini adalah tentang paket add-on R yang menyediakan algoritma yang
lebih baru atau lebih cepat, lebih efisien dan terutama untuk (robustifikasi) model
baru.Silakan kirim saran untuk penambahan dan ekstensi ke pengelola tampilan tugas .
Sekelompok ilmuwan internasional yang bekerja di bidang statistik yang kuat telah
melakukan upaya (sejak Oktober 2005) untuk mengoordinasikan beberapa perkembangan
yang tersebar dan membuat yang penting tersedia melalui serangkaian paket R yang saling
melengkapi. Ini harus dibangun di atas paket dasar dengan "Essentials", yang
diciptakan robustbase dengan (berpotensi banyak) paket lain yang dibangun di atas dan
memperluas fungsionalitas penting ke model atau aplikasi tertentu. Lebih lanjut, ada paket
yang cukup komprehensif yang kuat , versi perpustakaan yang kuat dari S-PLUS, sebagai
paket R yang sekarang Berlisensi GP berkat Insightful dan Kjell Konis. 

Awalnya, ada banyak tumpang tindih antara 'robustbase' dan


'robust', robust bergantung pada robustbase dan rrcov , di mana 'robust' menyediakan
rutinitas yang nyaman bagi pengguna biasa sementara robustbase dan rrcov berisi
fungsionalitas yang mendasarinya, dan menyediakan berbagai pilihan untuk pemodelan yang
kuat kepada ahli statistik yang lebih maju. Kami menyusun paket secara kasar ke dalam topik
berikut, dan biasanya pertama-tama akan menyebutkan fungsionalitas dalam
paket robustbase , rrcov dan robust.

Anda mungkin juga menyukai