Anda di halaman 1dari 5

Nama : Muhammad Fikri Dzikrulloh

Kelas : SI – 21 – PB

Kelompok 3

MATERI 1

Introduction

Kumpulan metode yang penggunaannya bertujuan untuk menganalisis data dalam jumlah besar dan
mengekstraksi pengetahuan (pola tersembunyi) yang ada didalam data tersebut

Pedbedaan big data dan data biasa berasal dari source

Data Science

Past :

- Traditional data
- Big data
- Business Intellegence

FUTURE :

- Traditional hanya mengetahui scenario berdasarkan statistic

Data Scrience Process

- Setting Research Goal


Diutamakan karena untuk mendefinisilan apa yang sedang terjadi ,mencari kekurangan dan
penanggulangan untuk mendapatkan metode yang diininkan
Metode menjembatani antara source dan tujuan
- Retrieving Data
Mememukan dan mendapatkan akses le data yang diperlukan
- Data Preaparation
Memeriksa data, memperkaya data dengan data dari sumber data lain, dan mengubahnya
menjadi format yang sesuai pada model
Content best filtering (untuk mendapat rekomendasi dari user dan untuk menampilkan data
ke user)
Hybrid (adalah gabungan metode collaborative dan content best)
Kekurangannya komputasi yang lama 80% waktu abis pada tahap ini
Proses apa saja pada data wrangling :
data source,data exraction, data integration, wrangled data
Working data menyimpan hasil dari ekstraksi data,integrasi data auxiliary data
Quality menyimpan sumber data individual, hasil dari ekstraksi data dan komponen yang
relevan dengan integrasi seperti kecocokan atau pemetaan.
Feedback (menyimpan data dari pengguna
- Data Exploration
Visualization :
Dapat dilakukan dengan membuat chart untuk membantu membaca data(baik untuk data
numerik)
Line chart (untuk menunjukan tren dari waktu ke waktu)
Scatter Plot,bubble chart,line chart (untuk menunjukkan keterhubungan antar data)
Peta(fokus pada geografis)
- Data Modeling
- Presentasi
Menjabarkan hasil

MATERI 2

OUTLINE

Tipe Data :

1. Boolean
- Memiliki format true false (digunakan dala conditional
statement,perbandingan,membutuhkan representasi untuk kebenaran atau kesalahan
2. Complex Number
- Gabungan angka dan huruf atau bilangan imaginer
3. String Indexing
- Karakter awalnya nol
- Index berikutnya 1,2,3….
- Spasi dianggap character
4. String Slicing
- 5: akan memunculkan index ke 5 sampai terakhir
- :5 karakter di belakang akan di kurangi 1
5. String Concate
- Penggabungan string
6. List Comprehension
- List yang hanya memuat elemen dengan karakter unik atau tidak sama

Conditional Statement

1. If statement
- Apabila true akan dilanjutkan ke cond code
2. Else Statement
- Ketika suatu kondisi tak terpenuhi
- Melanjutkan ke else code
3. Elif Statement
- Menyimpan 2 kondisi
- Antara ke else dan elif

Looping

1. While Loop
2. For
- Menggunakan range

Object Oriented Programming

1. Class
- Bentuk umum yang belum dibagi
2. Objek
- Bentuk spesifik dari suatu class
3. Instance
- Membuat instance

MATERI 3

K – Means

K-means clustering termasuk dalam unsupervised machine learning untuk mempartisi kumpulan
data ke dalam “K” cluster. Algoritme K-means menentukan data point secara iteratif ke sebuah
klaster, dan kemudian menghitung ulang “pusat klaster” berdasarkan penentuan baru.

Unsupervised yang artinya tidak memiliki label dalam data, untuk menemukan pola dari suatu data
tanpa bantuan dari manusia itu sendiri berfokus pada clustering

Contoh k = 2 maka terbagi menjadi 2 cluster

Label kumpulan dari data yang memiliki karakteristik sama

Langkah Langkah k-means :

1. Pilih nilai ”K”, jumlah cluster/centroid, yang ingin kita buat.

2. Inisialisasi pusat cluster “K” secara acak.

3. Hitung jarak dari setiap data point ke pusat cluster terdekat.

4. Hitung ulang pusat klaster sebagai rata-rata titik data yang ditugaskan ke setiap klaster.

5. Ulangi langkah 3 dan 4 hingga penetapan cluster tidak lagi berubah

K - Nearest Neighbour

K merupakan jumlah tetangga terdekat dari data poin yang baru jenis algoritma supervised learning
,Untuk mengetahui flow

K-NN Steps

1. Pengumpulan Data
2. Pilih Nilai K
3. Tentukan Metrik Jarak
4. Hitung Jarak
5. Pilih k tetangga terdekat
6. Tentukan kelas mayoritas
7. Tetapkan kelas
Source code latihan

Anda mungkin juga menyukai