Week Week 2
Kelompok KELOMPOK 10
1202204123 - Ario Kusuma Purboyo 1202204112 - Fikri Fathoni 1202204094 - Risma Intan
Anggota Wulandari 1202184131 - Yogi Sanjaya
Status Understood
Data digunakan untuk mendukung untuk setiap business intelligence, ilmu data, dan analisis bisnis. Tujuannya
untuk bisa dipaparkan dan direpresentasikan dengan baik. Data berisi tentang : pengetahuan,
insight/wawasan, dan informasi.
Ukuran data terbagi menjadi 3 yaitu
Kelompok yang lebih kecil terus menerus atau bisa berupa kelompok besar
Data Knowledge
hasil dari rangkaian bagaimana kita memproses data mentah menjadi informasi dan akan terus berkembang
dari waktu ke waktu.
Data Representation
cara analisis data berupa bentuk visual seperti bagan, grafik, dan histogram, tujuannya untuk mempermudah
dalam memahami data yang disajikan.
Kesimpulan
📖 Gambaran data yang digunakan dalam suatu penelitian dan mampu menampilkan data agar data
tersebut dapat dipaparkan secara baik dan diinterpretasikan secara mudah.
📖 Data Taxonomi merupakan strukur hirarki yang membagi data menjadi beberapa kelas yang spesifik
berdasarkan karakteristik umumnya.
Textual
Multimedia
XML/JSON
Structured Data
Categorical Data
📖 membagi dan mengelompokan data kedalam grup yang spesifik dengan menggunakan label
tertentu
Contoh
Jenis Kelamin
Level Pendidikan
Nominal Data
Contoh
Ordinal Data
📖 Berisi kode yang dikaitkan kepada objek/event sebagai label yang menggambarkan urutan ranking
mereka
Contoh
High
Medium
Low
Numeric Data
Contoh
Temperatur
Jumlah Penduduk
Umur
Jarak Tempuh
Interval Data
Ratio Data
📖 pengukuran variable yang biasa ditemukan pada sains fisika, dan engineering.
Contoh
Skala Kelvin
Massa
energi
Kesimpulan
📖 Data Taxonomy merupakan pengklasifikasian data secara hierarki berdasarkan jenis dan
karakteristiknya
📖 Sebuah kesiapan dalam membuat sebuah data yang akan digunakan untuk semua yang
berkepentingan dan ada 10 karakteristik atau level sebuah data itu sendiri.
Suatu data dapat dikatakan reliabel jika selalu memberikan hasil yang sama jika diujikan pada kelompok yang
sama pada waktu atau kesempatan yang berbeda.
berarti bahwa setiap pengguna melihat tampilan data yang konsisten, termasuk perubahan yang terlihat yang
dibuat oleh transaksi pengguna sendiri dan transaksi pengguna lain.
Adalah ukuran tingkat detail dalam struktur data. Dalam data deret waktu, misalnya, perincian pengukuran
mungkin didasarkan pada interval tahun, bulan, minggu, hari, atau jam.
berdasarkan subyek merujuk pada data yang disusun berdasarkan subyek terkait. Contoh, apabila dalam
perusahaan memerlukan data tentang penawaran kredit oleh berbagai bank, maka menampilkan data suku
bunga merupakan sebuah relevansi data berdasarkan subyek.
📖 Data pre procesing merupakan proses mengubah data mentah ke dalam bentuk data mudah
dipahami dan lebih mudah dianalisis oleh komputer dan machine learning.
2. Data Integration
menggabungkan data dari berbagai sumber2 menjadi format yang sama.
Pada proses data integration ini perlu melakukan beberapa hal, yaitu:
3. data transformation
menjadikan data yg sudah digabung menjadi data yang terstuktur dan seragam agar menghasilkan dataset yg
sesuai proses mining.
langkah yang dilakukan pada tahapan data transformation:
• Concept hierarchy generation, yaitu langkah untuk menambahkan hierarki baru di dalam dataset. Misalnya,
di dalam dataset berisi ayam dan bebek, maka kamu bisa menambahkan hierarki baru untuk
menggabungkan keduanya, yaitu unggas.
4. Data Reduction
merupakan tahapan pengurangan data, memiliki tujuan untuk mengurangi sampel data yang tidak perlu/relevan.
Saat melakukan data reduction, ada 3 teknik yang bisa diterapkan, diantaranya:
Numerosity selection, yaitu merepresentasikan data sebagai model atau persamaan seperti model
regresi. Pemodelan ini akan menghemat beban penyimpanan data dan transmisi data.
Dimensionality reduction, yaitu teknik pengurangan jumlah fitur yang berulang pada dataset.
Gambar
Hasil Diskusi
DESKRIPSI DATAhttps://docs.google.com/document/d/1qcSRhZLvD2vQr8Y3pm98bFXZrxc71e2Qi6X9G6eYaPE/edit?usp=drivesdk
Data Taxonomy
https://www.figma.com/file/mIiOEbQWmCmHNnGl9SJxRK/DWBI-Week-2?node-id=0%3A1
https://www.figma.com/file/mIiOEbQWmCmHNnGl9SJxRK/DWBI-Week-2?node-id=0%3A1
Data Readiness
https://www.stork.com/en/news-media/blog/data-relevance-crucial-in-asset-performance-
management#:~:text=What%20is%20data%20relevance%3F,the%20user's%20areas%20of%20interest.
http://becomingvisual.com/portfolio/datarichness/#
Data Preprocessing