Anda di halaman 1dari 20

Pelatihan

ART300
Penggunaan R di Dunia Nyata

Data Analyst Artificial


Intelligence
Engineer
Data Scientist

Business Intelligence Data Science


Analyst Manager
Pengenalan R

Connection:
History:
Environment, Menghubungka
List baris koding
Environment:
History, nyang
Listdengan
pernah
variabel yang
Connection database
dijalankan
telah tersimpan
Script
Tempat menuliskan
koding.

File, Plots,
Packages, Help,
Viewer

Terminal:
Console dan Console: tempat
mengakses
Terminal melihat
sistem output
RStudio
Keuntungan Penggunaan R

01 OPEN SOURCE

Fleksibel, dapat bekerja di beragam tipe hardware/


02 software

03 Mendukung menggunakan extension

04 Dapat terhubung dengan bahasa pemrograman lain


Apa itu Package?
Package merupakan kumpulan fungsi-fungsi, kode dan data sampel yang
disimpan dalam direktori library() pada environment R. Pada awal penggunaan,
telah terpasang beberapa package dasar, dan kita dapat memasang package
lainnya sesuai dengan kebutuhan dalam penggunaan R.

pemasangan package pada R menggunakan install.packages(“x”)


pemanggilan package pada R menggunakan library()
Tipe-Tipe Data

Array/Matriks
SKALAR
Vektor

Numerik (double dan


integer), karakterlogikal List
Character
Data
Frame
Logical
Vektor, Matrix/Array
Vektor adalah array berdimensi satu dan setiap elemennya mempunyai tipe data
yang sama. Tipe datanya harus skalar. Beberapa cara membuat vektor. Dengan fungsi
combine c().

Matriks adalah array berdimensi dua. Dimensi pertama disebut baris dan dimensi
kedua disebut kolom. Setiap elemen matriks harus mempunyai tipe data yang sama dan
bertipe skalar.

Matriks dibuat dengan menggunakan fungsi matrix() yang mempunyai tiga argument
matrix(data, nrow, ncol, byrow = FALSE)

Lists adalah objek yang terdiri atas berbagai tipe elemen. List bisa terdiri dari
matriks atau data frame. Fungsi list adalah list().
Data Frame di R
Tipe data frame adalah deretan vektor yang panjangnya sama.
Perbedaannya dengan matriks adalah data frame membolehkan kolom yang
satu dengan yang lainnya mempunyai tipe data yang berbeda (namun tetap
bertipe skalar) .

Data frame dibuat dengan memasukkan beberapa vektor yang panjangnya sama
ke dalam fungsi data.frame().
Statistika Deskriptif
Ukuran Ukuran
Pemusatan Penyebaran

Mean Range

Modus Simpangan
Baku
Median
Visualisasi Data

Line chart
Pie Chart

Dot-line chart Histogram


BIG DATA
Data Age/Era Data:

Banyaknya data hingga


TerraByte/Petabyte,
tersebar di jaringan
komputer, internet,
tempat penyimpanan
data lainnya di berbagai
aspek kehidupan.
BIG DATA

Volume
Velocit
3V
y
Variety
Machine Learning
Tidak semua data pada database
akan digunakan, misalkan
Data Training

diambil secara
Big Data acak dan
ditransformasi

Tujuan: melihat trend dan mengatur


Data Test strategi
jadwalinvestasi
teller

Yang
Yangdibutuhkan:
dibutuhkan:data
datahistoris harga
kedatangan
saham dan
nasabah dan data
transaksinya
teller yang
bertugas
Machine Learning
Program yang dibuat agar dapat secara
otomatis belajar menemukan pola2 penting
serta keputusan yang tepat berdasarkan data.

01 Supervised Learning

02 Unsupervised Learning CLUSTERING

03 Semi-supervised Learning
Penerapan Machine Learning
CLUSTERING

K-Means Hierarchical
CLUSTERING

K-Means Hierarchical

Dapat digunakan untuk


dimensi-n variabel

Dapat terjebak dalam


Proses konvergen lebih cepat masalah Curse of
Dimentionality

Implementasi mudah
Pengambilan pengetahuan yang penting
dari data.

Data Aplikasi paling dasar dilakukan pada database,


data warehouse, data transaksi.
Mining
Data mining dapat dilakukan pada berbagai jenis data:
data streams, ordered/sequenced data, graph, spasial,
teks, multimedia data, dan WWW.
DATABASE
Database Management System (DBSM)
Perangkat lunak yang berisi kumpulan data yang saling
berhubungan/terkait, sehingga memudahkan dan
pemanipulasian data (penyisipan dan penghapusan data)

Software DBSM
Reference
https://www.geeksforgeeks.org/introduction-of-dbms-database-management-
system-set-1/

Anda mungkin juga menyukai