Anda di halaman 1dari 22

Dataset untuk pembuatan

Publikasi dan Research


Dr. Elsye Maria Rosa, M.Kep
KEBIJAKAN KURIKULUM KAMPUS
MERDEKA
► OBE (OUTCOME BERBASIS EDUCATION)
► Mahasiswa wajib Publikasi 🡪 sebagai Outcome
► Meningkatkan kelulusan tepat waktu🡪Publikasi dilakukan dari awal perkuliahan
► Pra syarat ujian Tesis adalah memiliki Publikasi
► Publikasi dapat berupa data sekunder: dataset
► Publikasi dapat berupa: Penelitian review
► Meta Analisis
► Sistematic Review
► Scoping Review
► Literature review
TUJUAN MEMAHAMI DATASET

Mencari dataset Memperoleh


untuk ide penelitian, informasi variasi
publikasi data
Strategi OBE Mhs
Prodi MARS

Catatan:
Publikasi di journal Internasional/Sinta-2

Topik Tesis sesuai dengan Roadmap Dosen

Mahasiswa mengajukan topik tesis

Penentuan Pembimbing Tesis

DPA ikut berperan dalam Publikasi


Dataset for Project
Research
ELSYE MARIA ROSA
Basis Data Indonesia:
1. Dataset Indonesia [data.go.id]
2. Badan Pusat Statistik (BPS): (Hanya summary data).
3. UN unglobalpulse research Data on Indonesia
4. Global Open data Index Indonesia
5. World bank Data on Indonesia
6. OECD Data Indonesia
7. Data Wilayah Indonesia dari Kemendagri
8. Harga Pangan
9. Harga Komoditi
BADAN PUSAT STATISTIK
https://bps.go.id/
• DATA PRIVATE
Jenis Data • DATA PUBLIC

Sumber • BPS PUSAT


• BPS DAERAH
DATA BPS
NAVIGASI • NAVIGASI SEBELAH KIRI
• NAVIGASI PUBLIKASI
BPK • NAVIGASI APP
KAGGLE
https://www.kaggle.com/
RUMAH DATA SCIENTIST
SELURUH DUNIA
MEMUNGKINKAN MENCARI
DATASET PUBLIC
MENGIKUTI KOMPETISI
TENTANG ILMU DATA
UCI Machine Learning Repository
https://archive.ics.uci.edu/ml/index.php

Kumpulan database yang digunakan


oleh Komunitas

Machine learning untuk analisis


empiris algoritma pembalajaran mesin
Basis Data (Datasets) Umum:
1. Google Public Data Explorer atau
GCP Open Dataset
2. Dataset Search (google.com)
3. Microsoft Research Open Datasets
4. Kaggle Datasets
5. Mendeley dataset
6. Amazon Open Data
7. UC Irvine Machine Learning Reposito
ry
8. National Flight Data Center (NFDC)
9. FAA Data & Research
10. Flight Delay Information
11. FAA Aviation Safety Information Anal
ysis and Sharing (ASIAS)
12. Aircraft Situation Display to Industry
(ASDI)
13. NTSB Accident Database & Synopses
14. OpenFlights.org
CARA-1: Mendeley Data
► https://data.mendeley.com/r
esearch-data/?type=DATAS
ET&type=TABULAR_DA
TA&search=covid-19
► Contoh : Covid-19 in
hospital
Citasi dataset https://data.mendeley.com/
Analisis Big Data

► https://www.tableau.com/products/desktop
Dataset
Proses Utama pada Data Mining

Metode
Input (Algoritma Output
(Data) Data Mining) (Pola/Model)
Dataset
• Obyek (kasus,record,titik)
• Atribut (fitur,field,karakteristik,variabel)
Atribut, Class dan Tipe Data

• Atribut adalah faktor atau parameter yang


menyebabkan class/label/target terjadi
• Class adalah atribut yang akan dijadikan target,
sering juga disebut dengan label
• Tipe data untuk variabel pada statistik terbagi
menjadi empat: nominal, ordinal, interval, ratio
• Tapi secara praktis, tipe data untuk atribut pada
data mining hanya menggunakan dua:
1. Kategorikal (Nominal,Ordinal)
Kualitas Data
• Kesalahan Pengukuran
• Kesalahan Pengumpulan
1. Input (Dataset)

• Jenis dataset ada dua: Private dan Public


• Private Dataset: data set dapat diambil dari organisasi yang kita jadikan obyek
penelitian
– Bank, Rumah Sakit, Industri, Pabrik, Perusahaan Jasa, etc
• Public Dataset: data set dapat diambil dari repositori pubik yang disepakati
oleh para peneliti data mining
– UCI Repository (http://www.ics.uci.edu/~mlearn/MLRepository.html)
– ACM KDD Cup (http://www.sigkdd.org/kddcup/)
• Trend penelitian data mining saat ini adalah menguji metode yang
dikembangkan oleh peneliti dengan public dataset, sehingga penelitian
dapat bersifat: comparable, repeatable dan verifiable
Data Preprocessing
• Aggregation
• Sampling
• Dimensionality Reduction
• Feature subset selection
• Feature creation
• Discretization and Binarization
• Attribute Transformation
Thank You!
Publication and
research Strategy

Optimization

Research

Planning

Anda mungkin juga menyukai