Modul 3 - Data Subsetting PDF
Modul 3 - Data Subsetting PDF
PENGENALAN KOMPUTASI
DATA SUBSETTING
Pengelompokan data merupakan hal yang sangat berguna saat Anda bekerja dengan data yang
sangat besar. Seringkali saat bekerja dengan dataset yang sangat besar, Anda hanya ingin
menganalisa sebagian kecil dari data tersebut saja. Bagaimana cara mengekstraksi sebagian
kecil data tersebut dari sebuah dataset yang sangat besar? Bahasa R memiliki sebuah fungsi
bernama subset yang berfungsi untuk mengelompokan data yang besar tersebut menjadi
sekelompok data kecil. Fungsi ini dapat mempermudah Anda dalam melakukan analisa
terhadap data yang Anda inginkan saja.
View
Pada modul 2 sebelumnya, kita telah mempelajari fungsi print untuk menampilkan data ke
layar hasil olahan rumus, pada modul ini kita akan mempelajari fungsi View. Fungsi View ini
jauh lebih mudah dilihat dan lebih interaktif daripada fungsi print. Jika fungsi digunakan:
Clear Console
Fungsi ini terdapat pada tab Console tempat hasil rumus Anda dikeluarkan. Fungsi ini
bertujuan untuk menghapus rumus-rumus yang telah dikerjakan sehingga daerah kerja Anda
lebih mudah dilihat. Shortcut dar fungsi ini adalah Ctrl+L.
Fungsi Subset
Terdapat beberapa cara untuk melakukan fungsi subset tersebut di R. Ketiga cara tersebut
adalah penggunaan perintah baris dan kolom, penggunaan perintah which, dan penggunaan
perintah subset. Ketiga cara ini dapat digunakan sesuai keinginan dan kecocokan terhadap data
yang diolah oleh pengguna.
Perintah which
Perintah which cocok digunakan jika dataset yang Anda gunakan sangat besar dan diketahui
nama dari tiap kolom dataset tersebut. Dengan fungsi ini, Anda tinggal menuliskan saja nama
kolom yang ingin Anda analisa. Fungsi ini dapat mencari syarat pencarian yang lebih spesifik.
Perintah subset
Perintah ini merupakan versi lebih sederhana dari fungsi which. Pada fungsi subset, tidak
diperlukan lagi penggunaan kurung siku ([]) karena telah digantikan oleh fungsi subset
tersebut. Berikut merupakan contoh penggunaan subset.
Fungsi tersebut berarti akan dicari data dengan nilai kolom Usia kurang dari sama dengan 20
pada dataset datapekerjaan, dan akan ditampilkan data tersebut hanya dari kolom Nama dan
Usia saja.
Usia <= 20: merupakan kolom Usia yang akan dicari menggunakan parameter kurang dari
sama (<=) dengan 20. Parameter yang dicari dapat juga berupa huruf yang diapit tanda petik
(“”). Dapat ditambahkan beberapa parameter pencarian dengan menggunakan symbol dan (&).
select: menunjukkan kolom mana saja yang akan ditampilkan. Dalam kasus ini adalah kolom
Nama dan Usia.
Selamat belajar!