Kelas : SI – 21 – PB
Kelompok 3
MATERI 1
Introduction
Kumpulan metode yang penggunaannya bertujuan untuk menganalisis data dalam jumlah besar dan
mengekstraksi pengetahuan (pola tersembunyi) yang ada didalam data tersebut
Data Science
Past :
- Traditional data
- Big data
- Business Intellegence
FUTURE :
MATERI 2
OUTLINE
Tipe Data :
1. Boolean
- Memiliki format true false (digunakan dala conditional
statement,perbandingan,membutuhkan representasi untuk kebenaran atau kesalahan
2. Complex Number
- Gabungan angka dan huruf atau bilangan imaginer
3. String Indexing
- Karakter awalnya nol
- Index berikutnya 1,2,3….
- Spasi dianggap character
4. String Slicing
- 5: akan memunculkan index ke 5 sampai terakhir
- :5 karakter di belakang akan di kurangi 1
5. String Concate
- Penggabungan string
6. List Comprehension
- List yang hanya memuat elemen dengan karakter unik atau tidak sama
Conditional Statement
1. If statement
- Apabila true akan dilanjutkan ke cond code
2. Else Statement
- Ketika suatu kondisi tak terpenuhi
- Melanjutkan ke else code
3. Elif Statement
- Menyimpan 2 kondisi
- Antara ke else dan elif
Looping
1. While Loop
2. For
- Menggunakan range
1. Class
- Bentuk umum yang belum dibagi
2. Objek
- Bentuk spesifik dari suatu class
3. Instance
- Membuat instance
MATERI 3
K – Means
K-means clustering termasuk dalam unsupervised machine learning untuk mempartisi kumpulan
data ke dalam “K” cluster. Algoritme K-means menentukan data point secara iteratif ke sebuah
klaster, dan kemudian menghitung ulang “pusat klaster” berdasarkan penentuan baru.
Unsupervised yang artinya tidak memiliki label dalam data, untuk menemukan pola dari suatu data
tanpa bantuan dari manusia itu sendiri berfokus pada clustering
4. Hitung ulang pusat klaster sebagai rata-rata titik data yang ditugaskan ke setiap klaster.
K - Nearest Neighbour
K merupakan jumlah tetangga terdekat dari data poin yang baru jenis algoritma supervised learning
,Untuk mengetahui flow
K-NN Steps
1. Pengumpulan Data
2. Pilih Nilai K
3. Tentukan Metrik Jarak
4. Hitung Jarak
5. Pilih k tetangga terdekat
6. Tentukan kelas mayoritas
7. Tetapkan kelas
Source code latihan