Anda di halaman 1dari 6

MODUL 3 PRAKTIKUM

PENGENALAN KOMPUTASI
DATA SUBSETTING

TIM MATERI PENGENALAN KOMPUTASI


STREAM DATA ANALYSIS
Contents
Pendahuluan ............................................................................................................................... 3
Beberapa Fungsi Tambahan ....................................................................................................... 3
View ....................................................................................................................................... 3
Clear Console ......................................................................................................................... 4
Fungsi Subset ............................................................................................................................. 4
Perintah Baris dan Kolom ...................................................................................................... 5
Perintah which........................................................................................................................ 5
Perintah subset ....................................................................................................................... 6
Pendahuluan

Pengelompokan data merupakan hal yang sangat berguna saat Anda bekerja dengan data yang
sangat besar. Seringkali saat bekerja dengan dataset yang sangat besar, Anda hanya ingin
menganalisa sebagian kecil dari data tersebut saja. Bagaimana cara mengekstraksi sebagian
kecil data tersebut dari sebuah dataset yang sangat besar? Bahasa R memiliki sebuah fungsi
bernama subset yang berfungsi untuk mengelompokan data yang besar tersebut menjadi
sekelompok data kecil. Fungsi ini dapat mempermudah Anda dalam melakukan analisa
terhadap data yang Anda inginkan saja.

Beberapa Fungsi Tambahan


Terdapat beberapa fungsi tambahan yang belum sempat dijelaskan pada modul 2 sebelumnya
yang dapat mempermudah Anda untuk melakukan pekerjaan Anda pada modul ini.

View
Pada modul 2 sebelumnya, kita telah mempelajari fungsi print untuk menampilkan data ke
layar hasil olahan rumus, pada modul ini kita akan mempelajari fungsi View. Fungsi View ini
jauh lebih mudah dilihat dan lebih interaktif daripada fungsi print. Jika fungsi digunakan:

Maka data akan muncul seperti berikut:


Terdapat fungsi sort yang berbentuk panah atas bawah ( ) di sebelah judul tiap kolom. Panah
tersebut dapat digunakan untuk mengurutkan data dari yang terkecil ataupun yang terbesar.
Secara default, tabel akan akan diurutkan berdasarkan urutan data yang sesuai dengan file
dataset.

Clear Console
Fungsi ini terdapat pada tab Console tempat hasil rumus Anda dikeluarkan. Fungsi ini
bertujuan untuk menghapus rumus-rumus yang telah dikerjakan sehingga daerah kerja Anda
lebih mudah dilihat. Shortcut dar fungsi ini adalah Ctrl+L.

Fungsi Subset
Terdapat beberapa cara untuk melakukan fungsi subset tersebut di R. Ketiga cara tersebut
adalah penggunaan perintah baris dan kolom, penggunaan perintah which, dan penggunaan
perintah subset. Ketiga cara ini dapat digunakan sesuai keinginan dan kecocokan terhadap data
yang diolah oleh pengguna.

Perintah Baris dan Kolom


Subset menggunakan perintah ini cocok digunakan jika Anda mengetahui target baris dan
kolom mana yang akan Anda analisis. Contoh dari penggunaan perintah ini adalah sebagai
berikut:

Berikut merupakan hasil dari rumus tersebut:

datapekerjaan: merupakan dataset yang digunakan.


[c(6:8),c(1,3)]: fungsi ini berarti data yang akan ditampilkan adalah data dari datapekerjaan
pada baris ke-6 sampai dengan baris ke-8 dan pada kolom ke-1 dan kolom ke-3. Fungsi ini
memiliki dua parameter, parameter pertama merupakan baris,, sementara parameter kedua
merupakan kolom.
[ ]: digunakan untuk men-subset sebuah objek data
c (combine): digunakan untuk mengombinasikan nilai menjadi sebuah list. Jika sebelum fungsi
c ditambahkan simbol strip (-) maka seluruh data akan ditampilkan kecuali data tersebut.
(:) berarti sampai dengan dan (,) sebagai separator atau pemisah.

Perintah which
Perintah which cocok digunakan jika dataset yang Anda gunakan sangat besar dan diketahui
nama dari tiap kolom dataset tersebut. Dengan fungsi ini, Anda tinggal menuliskan saja nama
kolom yang ingin Anda analisa. Fungsi ini dapat mencari syarat pencarian yang lebih spesifik.

Dari fungsi tersebut akan dihasilkan:


Fungsi di atas berarti akan dicari nama “Saskia” dari kolom Nama dan data yang akan
ditampilkan merupakan data “Saskia” yang terletak pada kolom Nama dan Pekerjaan.
which: mendefinisikan syarat-syarat subset.
$Nama: merupakan nama kolom yang akan dianalisa. Pada kasus ini, nama kolom tersebut
adalah kolom Nama.
== : digunakan untuk uji kesamaan. Digunakan untuk mencari apakah terdapat nilai tersebut
pada kolom yang sedang Anda cari. Dapat pula digunakan >, <, >=, atau <= untuk mengolah
nilai yang berupa angka.
names(datapekerjaan): menjelaskan nama kolom pada dataset datapekerjaan.
%in%: berarti ‘didefinisikan sebagai’
c(“Nama”, “Pekerjaan”): merupakan kolom yang datanya akan ditampilkan.

Perintah subset
Perintah ini merupakan versi lebih sederhana dari fungsi which. Pada fungsi subset, tidak
diperlukan lagi penggunaan kurung siku ([]) karena telah digantikan oleh fungsi subset
tersebut. Berikut merupakan contoh penggunaan subset.

Berikut adalah data yang dihasilkan dari fungsi tersebut:

Fungsi tersebut berarti akan dicari data dengan nilai kolom Usia kurang dari sama dengan 20
pada dataset datapekerjaan, dan akan ditampilkan data tersebut hanya dari kolom Nama dan
Usia saja.
Usia <= 20: merupakan kolom Usia yang akan dicari menggunakan parameter kurang dari
sama (<=) dengan 20. Parameter yang dicari dapat juga berupa huruf yang diapit tanda petik
(“”). Dapat ditambahkan beberapa parameter pencarian dengan menggunakan symbol dan (&).
select: menunjukkan kolom mana saja yang akan ditampilkan. Dalam kasus ini adalah kolom
Nama dan Usia.

Selamat belajar!

Anda mungkin juga menyukai