Anda di halaman 1dari 7

Pengenalan Data - DWBI

Week Week 2

Kelompok KELOMPOK 10

1202204123 - Ario Kusuma Purboyo 1202204112 - Fikri Fathoni 1202204094 - Risma Intan
Anggota Wulandari 1202184131 - Yogi Sanjaya

Status Understood

Deskripsi Data (Risma Intan W)

📖 Kumpulan informasi yang diperoleh dari hasil pengamatan.

Data digunakan untuk mendukung  untuk setiap business intelligence, ilmu data, dan analisis bisnis. Tujuannya
untuk bisa dipaparkan dan direpresentasikan dengan baik. Data berisi tentang : pengetahuan,
insight/wawasan, dan informasi.
Ukuran data terbagi menjadi 3 yaitu

kecil atau bisa sangat besar.

Terstruktur atau tidak

Kelompok yang lebih kecil terus menerus atau bisa berupa kelompok besar

Data Knowledge
hasil dari rangkaian bagaimana kita memproses data mentah menjadi informasi dan akan terus berkembang
dari waktu ke waktu.

Data Representation
cara analisis data berupa bentuk visual seperti bagan, grafik, dan histogram, tujuannya untuk mempermudah
dalam memahami data yang disajikan.

Kesimpulan

📖 Gambaran data yang digunakan dalam suatu penelitian dan  mampu menampilkan data agar data
tersebut dapat dipaparkan secara baik dan diinterpretasikan secara mudah.

Data Taxonomy (Ario Kusuma)

📖 Data Taxonomi merupakan strukur hirarki yang membagi data menjadi beberapa kelas yang spesifik
berdasarkan karakteristik umumnya.

Pengenalan Data - DWBI 1


📖 Data Taxonomi berbeda dengan metadata, taxonomi mengorganisasikan konten dan aset dengan
menggunakan relasi hierarki

Data Level of Abstraction


Unstructured/semi structured Data

📖 Data yang tidak dapat diukur secara matematis

Textual

📖 Data yang berbentuk deskripsi

Multimedia

📖 Data yang berbentuk multimedia seperti gambar, audio, dan video

XML/JSON

📖 Data kodingan berbentuk script berupa .XML, .JSON, .html, .js

Structured Data

Pengenalan Data - DWBI 2


📖 Data yang dapat diukur secara matematis dan dapat diklasifikasikan sebagai kategorial dan
numerik

Categorical Data

📖 membagi dan mengelompokan data kedalam grup yang spesifik dengan menggunakan label
tertentu

Contoh

Jenis Kelamin

Level Pendidikan

Nominal Data

📖 Pengklasifikasian variable yang tidak memiliki nilai kuantitatif apapun

Contoh

Status Pernikahan (Single, Menikah, Cerai)

Ordinal Data

📖 Berisi kode yang dikaitkan kepada objek/event sebagai label yang menggambarkan urutan ranking
mereka

Contoh

High

Medium

Low

Numeric Data

📖 menggambarkan nilai numeruk untuk variabel yang spesifik

Contoh

Temperatur

Jumlah Penduduk

Umur

Jarak Tempuh

Interval Data

📖 variable yang bisa diukur menggunakan skala interval

Pengenalan Data - DWBI 3


Contoh

skala konversi Celcius

Ratio Data

📖 pengukuran variable yang biasa ditemukan pada sains fisika, dan engineering.

Contoh

Skala Kelvin

Massa

energi

Kesimpulan

📖 Data Taxonomy merupakan pengklasifikasian data secara hierarki berdasarkan jenis dan
karakteristiknya

Data Readiness (Yogi Sanjaya)

📖 Sebuah kesiapan dalam membuat sebuah data yang akan digunakan untuk semua yang
berkepentingan dan ada 10 karakteristik atau level sebuah data itu sendiri.

1. Data source reliability, Seberapa terpercaya nya sumber data

Suatu data dapat dikatakan reliabel jika selalu memberikan hasil yang sama jika diujikan pada kelompok yang
sama pada waktu atau kesempatan yang berbeda.

2. Data content accuracy, Seberapa akurat konten datanya


mengacu pada catatan bebas kesalahan yang dapat digunakan sebagai sumber informasi yang andal. Dalam
pengelolaan data, akurasi data adalah komponen/standar pertama dan penting dari kerangka kerja kualitas
data.

3. Data Accesibility, Seberapa aksesibel (mudah dijangkau) datanya


menghilangkan hambatan yang menghalangi untuk memanfaatkan data dalam database secara maksimal.
Solusi perangkat lunak atau perusahaan hebat yang mendukung akses data yang di tingkatkan dapat
memberdayakan siapa saja dalam peran atau industri apa pun untuk mengandalkan data mereka sebagai satu-
satunya sumber kebenaran.

4. Data security and data privacy, Seberapa aman datanya


mendefinisikan siapa / pihak mana yang sah untuk mengakses data tersebut. Artinya, Data Privacy berbicara
perihal hak dan kewajiban pemangku kepentingan dari data pribadi (data owner, data controller, data processor).
Sedangkan, Data Protection/security memiliki fokus pada mekanisme perlindungan terhadap data atau
melindungi data dari akses yang tidak sah, yang artinya Data security berbicara perihal cara kita melindungi
data pribadi.

5. Data Richness, Seberapa berguna datanya


mengacu pada kualitas data dan berapa banyak data yang diperlukan untuk menunjukkan gambaran yang
akurat.

Pengenalan Data - DWBI 4


6. Data Consistency, Seberapa konsisten datanya

berarti bahwa setiap pengguna melihat tampilan data yang konsisten, termasuk perubahan yang terlihat yang
dibuat oleh transaksi pengguna sendiri dan transaksi pengguna lain.

7. Data Currency/Data Timeliness

Seberapa benar datanya apabila terjadi perubahan waktu


8. Data Granularity, Seberapa detail datanya

Adalah ukuran tingkat detail dalam struktur data. Dalam data deret waktu, misalnya, perincian pengukuran
mungkin didasarkan pada interval tahun, bulan, minggu, hari, atau jam.

9. Data Validity, Seberapa valid datanya


adalah Pengabsahan data, penyahihan data, pengesahan data, atau pemvalidan data adalah proses
memastikan data telah melalui pembersihan data untuk memastikan data bersifat benar dan berguna.

10. Data Relevancy, Seberapa relevan datanya

berdasarkan subyek merujuk pada data yang disusun berdasarkan subyek terkait. Contoh, apabila dalam
perusahaan memerlukan data tentang penawaran kredit oleh berbagai bank, maka menampilkan data suku
bunga merupakan sebuah relevansi data berdasarkan subyek.

Data Preprocessing (Fikri Fathoni)

📖 Data pre procesing merupakan proses mengubah data mentah ke dalam bentuk data mudah
dipahami dan lebih mudah dianalisis oleh komputer dan machine learning.

Kenapa ada Data Preprocesing?


agar data yg akan dipakai lebih akurat dengan machine laearning dan agar kondisi data yang nantinya
dihasilkan dapat optimal dan dapat memberikan insight untuk kebutuhan bisnis.

Ada 4 tahapan dalam data pre-processing


1. data cleaning
membersihkan atau menyeleksi data yang akan di pakai. biasanya data yg di cleaning adalah data missing
value/yang hilang nilainya, menghilangkan noisy data (Menghilangkan data yang salah atau anomali) dan
menyelesaikan inkonsistensi data.

2. Data Integration
menggabungkan data dari berbagai sumber2 menjadi format yang sama.

Pada proses data integration ini perlu melakukan beberapa hal, yaitu:

Memastikan data memiliki format dan atribut yang sama.

Menghapus atribut yang tidak dibutuhkan dari semua sumber data.

Mendeteksi nilai data yang konflik.

3. data transformation
menjadikan data yg sudah digabung menjadi data yang terstuktur dan seragam agar menghasilkan dataset yg
sesuai proses mining.
langkah yang dilakukan pada tahapan data transformation:

Pengenalan Data - DWBI 5


• Agregation, yaitu langkah untuk menggabungkan semua data dalam format yang seragam.
• Normalization, yaitu langkah untuk mengubah data ke dalam skala yang teratur, sehingga dapat
membandingkannya dengan lebih akurat.
• Feature selection, yaitu langkah untuk menentukan variabel apa saja yang paling penting untuk analisis.
Variabel ini yang nantinya digunakan untuk melatih model machine learning atau kecerdasan buatan.
Discreditization yaitu langkah untuk mengumpulkan data ke dalam interval yang lebih kecil.

• Concept hierarchy generation, yaitu langkah untuk menambahkan hierarki baru di dalam dataset. Misalnya,
di dalam dataset berisi ayam dan bebek, maka kamu bisa menambahkan hierarki baru untuk
menggabungkan keduanya, yaitu unggas.

4. Data Reduction
merupakan tahapan pengurangan data, memiliki tujuan untuk mengurangi sampel data yang tidak perlu/relevan.
Saat melakukan data reduction, ada 3 teknik yang bisa diterapkan, diantaranya:

Attribute selection, yaitu dengan mengombinasikan tag atau feature, sehingga data bisa lebih


sederhana lagi. Misalnya, pada dataset ada tags laki-laki/perempuan dan professor. Kamu bisa
menggabungkan kedua tags tersebut menjadi profesor laki-laki/profesor perempuan.

Numerosity selection, yaitu merepresentasikan data sebagai model atau persamaan seperti model
regresi. Pemodelan ini akan menghemat beban penyimpanan data dan transmisi data.

Dimensionality reduction, yaitu teknik pengurangan jumlah fitur yang berulang pada dataset.

Gambar

Hasil Diskusi

Pengenalan Data - DWBI 6


Deskripsi Data

DESKRIPSI DATA - Google Docs

DESKRIPSI DATAhttps://docs.google.com/document/d/1qcSRhZLvD2vQr8Y3pm98bFXZrxc71e2Qi6X9G6eYaPE/edit?usp=drivesdk

Data Taxonomy

https://www.figma.com/file/mIiOEbQWmCmHNnGl9SJxRK/DWBI-Week-2?node-id=0%3A1

https://www.figma.com/file/mIiOEbQWmCmHNnGl9SJxRK/DWBI-Week-2?node-id=0%3A1

Data Readiness

https://www.stork.com/en/news-media/blog/data-relevance-crucial-in-asset-performance-
management#:~:text=What%20is%20data%20relevance%3F,the%20user's%20areas%20of%20interest.

http://becomingvisual.com/portfolio/datarichness/#

Data Preprocessing

4 Langkah Data Preprocessing Agar Data Lebih Mudah Dibaca (ekrut.com)

4 Langkah Data Preprocessing Agar Data Lebih Mudah Dibaca


Di era digital seperti saat ini, keberadaan data menjadi sesuatu yang sangat penting.
Dengan menggunakan big data, sebuah perusahaan akan terbantu untuk
menentukan rencana bisnis, mengembangkan arah bisnisnya, dan memahami lebih
https://www.ekrut.com/media/data-preprocessing

Pengenalan Data - DWBI 7

Anda mungkin juga menyukai