Anda di halaman 1dari 5

Ardiantiono

untuk Kelas Pengolahan Data Perikanan Menggunakan R, Medan 18 Juni 2020

BAB 2. MEMANGGIL DATASET DAN EKSPLORASI DATA


Untuk latihan kali ini kita akan menggunakan data dummy tangkapan tiga spesies
hiu: hiu sutera, hiu sirip hitam, dan hiu macan di perairan NTT dan Laut Jawa.

Mengimpor Data di R
Mari kita impor data tangkapan hiu ke R untuk dieksplorasi:
1. Buka kembali Project “LatihanR”, caranya bisa dengan mengklik langsung R
Project File di folder atau membuka RStudio kemudian klik Projects > Recent
Projects > LatihanR.

Jika kamu tidak bisa menemukannya di Recent Projects kamu bisa menuju
Project > Open Project ... dan cari file .rproj di folder.

2. Buka file Hiu.R. File ini akan berisikan perintah untuk eksplorasi data ke
depan.

3. Hapus objek yang ada terlebih dahulu. Ini penting dilakukan jika ada objek
dari hasil running R sebelumnya yang masih tersisa.

rm(list=ls()) #gunakan hati-hati


ls()

4. Tentukan direktori tempat kita menyimpan data terlebih dahulu

setwd("..., #lokasi folder data")


Isi... dengan lokasi folder dimana kamu menyimpan file hiu_dummy.

Jika kamu menggunakan Windows, kamu bisa meng-copy paste lokasi file
dari Windows Ekplorer (buka di Properties).

Tapi kamu perlu mengganti semua tanda “\” menjadi “/” atau “\\” atau R tidak
akan mengenali folder Anda dan memberikan error messages.
Ardiantiono
untuk Kelas Pengolahan Data Perikanan Menggunakan R, Medan 18 Juni 2020

5. Kita akan mengimpor data tangkapan hiu dengan menggunakan fungsi


read.csv().

R umumnya mengimpor data dalam format .csv (format di Excel) atau .txt
(Notepad). Untuk data .txt kamu bisa menggunakan fungsi read.table().

*Gunakan fungsi read.csv2() jika laptopmu menggunakan format “;” sebagai


pemisah dan “,” untuk tanda desimal.
hiu <- read.csv("hiu_dummy.csv”, stringsAsFactors =
TRUE, header = TRUE) #file memiliki nama kolom di baris
pertama
Opsi stringsAsFactors = TRUE bertujuan untuk merubah struktur objek
dari “character” atau teks menjadi “factor” atau kategori. Opsi header =
TRUE bertujuan untuk memberikan nama kepala kolom berdasarkan data kita.

(Opsional)
*Kita juga bisa memanggil data dengan menu Import Dataset yang lebih
praktis. Caranya klik opsi “Import Dataset” di jendela Workspace bagian
kanan atas .

Workspace

Pilih opsi “From Text (base)…” yang akan membaca data .csv atau .txt.
Perhatikan bahwa kita juga bisa mengimpor data Excel.
Ardiantiono
untuk Kelas Pengolahan Data Perikanan Menggunakan R, Medan 18 Juni 2020

Pilih file yang akan kita impor.

Cek apakah
sesuai

Akan muncul jendela di atas. Pilih “Heading > Yes” untuk menampilkan nama
kolom. Kemudian perhatikan apakah “Data Frame” yang ditampilkan di bawah
sudah sesuai. Jika iya, klik Import.

Perhatikan jika tampilan “Data Frame” tidak sesuai (contoh data tidak
terpisah menjadi beberapa kolom”, berarti format tampilan .csv dan decimal di
laptop kamu berbeda.

Ubah “Separator > Semicolon” dan “Decimal > Comma”. Umumnya ini akan
merapikan Data Frame.

Jika import telah dilakukan, nama datasetmu akan sama dengan nama file
yang diimpor. Untuk mengganti nama file, gunakan fungsi:
hiu <- hiu.dummy

6. Ketik fungsi head() untuk melihat enam baris pertama dari data yang telah
diimpor.

Gunakan fungsi ini juga untuk mengecek apakah data Anda sudah sesuai.
head(hiu)
Ardiantiono
untuk Kelas Pengolahan Data Perikanan Menggunakan R, Medan 18 Juni 2020

Eksplorasi awal data tangkapan hiu


7. Gunakan fungsi class(hiu) untuk melihat tipe data yang kamu punya.

8. Tampilkan nama kolom dengan menggunakan fungsi names(hiu)

9. Fungsi str() mendeskripsikan struktur dari objek data hiu ini, termasuk berapa
jumlah rekaman dan variabel (kolom) dan format apa kolom tersebut (faktor,
integer, numerik).
str(hiu)
Beberapa format data:
Character : teks (a,b,c,aaa,bcb)
Factor : teks dalam kategori (kakap, kerapu)
Integer : nilai hitung biasa bulat dan positif (1,30,100)
Numeric : nilai angka, decimal dan bisa minus (-1.7, 5.7, 6.5)

10. Perhatikan bahwa output dari str() diawali dengan tanda “$”.

Setiap kolom merupakan sebuah faktor, dan kamu dapat mengakses


informasi/melakukan kalkulasi dengan suatu kolom menggunakan simbol “$”.

Sebagai contoh kita ingin melihat spesies hiu yang tertangkap.

Perhatikan juga ketika kamu mengetik formula hiu$, RStudio akan


memberikan rekomendasi kolom untuk dipilih.
hiu$spesies1

11. Kamu juga bisa mengetahui jumlah kolom dan baris dari data ini.
dim(hiu) #jumlah baris dan kolom
ncol(hiu) #jumlah kolom
nrow(hiu) #jumlah baris
Ardiantiono
untuk Kelas Pengolahan Data Perikanan Menggunakan R, Medan 18 Juni 2020

12. Fungsi summary() memberikan informasi data dalam data.frame tangkapan


hiu.

Informasi yang diberikan mencangkup jumlah objek di beberapa kategori


pertama dari vektor, nilai maksimal dan minimum untuk data kontinu, dan
lainnya.

Ini akan membantu kamu untuk mengidentifikasi jika terdapat salah


pengetikan atau lainnya.
summary(hiu)
summary(hiu$CM) #melihat summary di kolom tertentu

13. Kamu juga bisa menggunakan fungsi levels() untuk menampilkan seluruh
kategori dari faktor dengan data kategorial (bukan kontinu/angka).

Ini terutama berguna ketika kamu ingin merapikan data yang salah ketik.
levels(hiu$bulan)
Tips: Jika kamu menemukan error ketika menjalankan perintah di R. Salah satu opsi
yang dapat dilakukan adalah meng-copy pesan error (yang berwarna merah)
tersebut ke google. Banyak sekali forum yang membahas mengenai R dan biasanya
(walau tidak selalu) kamu akan menemukan solusi di forum tersebut.

Anda mungkin juga menyukai