Anda di halaman 1dari 1

Data dibagi menjadi 3 :

* Big data Phenomena : Volume, Variety, & Velocity

* Types of Data :
- Record
- Graph & Record
- Ordered
- Spatial

* Source of Data : Download Public Dataset, API, Web Scrapping


--------------------------------------------
--------------------------------------------
Mencari Data Set +2000
Selasa Kosong diganti Sabtu 7 Pagi
Jumat Libur diganti hari Sabtu 8 Pagi (Kelas Gabungan)
Persiapan Hari Sabtu (Install Rapid Miner+DataSet+20000/Praktikum)
-------------------------------------------
-------------------------------------------
Proses ETL (Extract, Transform, Encoding)

*Extract : Teknik yang sesuai dengan setiap data source (tergantung format data)
>mengumpulkan, disaring, di olah kemudian di gabungkan kemudian di simpan kedalam
data warehouse & dilakukan untuk di analisa
*Transform : Kumpulan dari beberapa bagian data
> Cleaning untuk melakukan koreksi yang tujuan nya sama dengan format yang berbeda
(Eliminasi terhadap duplikat data, menghilangkan data yang tak dibutuhkan)
> Data Loading, dilakukan pengisian data kedalam data warehouse kemudian di
tampilkan kedalam sebuah aplikasi
*

Setelah dapatkan data excel lebih dari 2000


Tabel Fakta > Bilangan yang bisa dihitung atau di ukur dalam satuan angka
Tabel Dimensi > Berisi atribut

Tentukan Schema
- Star
- Snowflake : Dapat menormalisasi pada tabel dimensi untuk tidak terjadi redudansi
- Galaxy : ada hubungan dengan Tabel Fakta

Setelah ini lakukan Proses ETL


Extract sudah dilakukan disaat pengambilan data dalam form xls
Cleansing sifat nya Opsional

Anda mungkin juga menyukai