Selamat datang di Scribd!

Lewati carousel

Syifa Fauziah - UAS DSA 113

Diunggah oleh

SomeBell. in

0% menganggap dokumen ini bermanfaat (0 suara)

22 tayangan4 halaman

Hak Cipta

Format Tersedia

DOCX, PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Hak Cipta:

Format Tersedia

Unduh sebagai DOCX, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

22 tayangan4 halaman

Syifa Fauziah - UAS DSA 113

Diunggah oleh

SomeBell. in

Hak Cipta:

Format Tersedia

Unduh sebagai DOCX, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 4

Cari di dalam dokumen

UAS DATA SAINS DAN ANALISIS

Nama : Syifa Fauziah

NIM : 1512618053

1. Sebuah datasets rumah terdiri atas beberapa features, seperti luas tanah, luas rumah, jumlah
kamar, dan harga. Jika data tersebut akan dikelompokkan berdasarkan harganya (mahal
atau murah), namun informasi mengenai harga belum ada, maka teknik pengelompokkan
data yang tepat adalah menggunakan klasifikasi atau clustering? Jelaskan alasannya!

Jawab : Teknik pengelompokkan data untuk datasets di atas menggunakan clustering.

Karena clustering merupakan unsupervised learning. Informasi mengenai harga belum
ada. Dapat dikatakan bahwa dataset diatas belum ada panduannya. Dengan menggunakan
clustering lah data bisa digunakan tanpa dipandu sebelumya. Ketika output nya keluar,
sudah diberi harga.

2. Perhatikan grafik berikut ini:

Grafik di atas adalah hasil visualisasi dari dataset iris yang ada pada sklearn. Feature
yang digunakan adalah sepal length. Buat program singkat untuk plotting grafik tersebut
dengan tambahan title-nya adalah: ‘Data Iris’, label untuk sumbu y adalah ‘sepal
length’.
Jawab :
import matplotlib

import matplotlib.pyplot as plt

import pandas as pd

import numpy as np

-----------------------------------

df=pd.read_csv('D:/iris.csv')

-----------------------------------

fig, ax = plt.subplots()
_=ax.plot(np.sort(df['sepal_length']),
marker='o', markersize='1', linestyle='')
_=ax.set_title('Data Iris')
_=ax.set_ylabel('sepal length')

3. Pada sklearn.datasets, selain iris terdapat datasets dengan nama breast_cancer. a. Ada
berapa features pada datasets breast_cancer tersebut?
a. Tuliskan perintahnya untuk menampilkan features tersebut!
Jawab : breast_cancer.feature_names
b. Cluster-kan data tersebut dengan Kmeans dengan jumlah cluster=2, kemudian
gambarkan grafik scatter-nya!
Jawab :
import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer
from sklearn.cluster import KMeans

#siapkan datasets
breast_cancer = load_breast_cancer()
X = breast_cancer.data

#siapkan metode
model = KMeans(n_clusters=2)

#train model
model.fit(X)

#gunakan model
pred = model.predict(X)

-----------------------------------
_ = plt.scatter(X_red[:,0], X_red[:,1], cmap='RdYlBu')

c. Reduksi jumlah features pada breast_cancer datasets tersebut menggunakan PCA

menjadi 5 (lima), kemudian cluster-kan dengan Kmeans dengan jumlah cluster=2,
dan gambarkan grafik scatter-nya!
Jawab :
import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer
from sklearn.cluster import KMeans
from sklearn.decomposition import PCA

breast_cancer = load_breast_cancer()
X = breast_cancer.data

model = PCA(n_components=5)

model.fit(X)

X_red = model.transform(X)

model = KMeans(n_clusters=2)

model.fit(X)

pred = model.predict(X)

-----------------------------------
_ = plt.scatter(X_red[:,0], X_red[:,1], cmap='RdYlBu')

d. Reduksi jumlah features pada breast_cancer datasets tersebut menggunakan PCA

menjadi 3 (tiga), kemudian cluster-kan dengan Kmeans dengan jumlah cluster=2, dan
gambarkan grafik scatter-nya!
Jawab :
import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer
from sklearn.cluster import KMeans
from sklearn.decomposition import PCA

breast_cancer = load_breast_cancer()
X = breast_cancer.data

model = PCA(n_components=3)

model.fit(X)

X_red = model.transform(X)
model = KMeans(n_clusters=2)

model.fit(X)

pred = model.predict(X)

-----------------------------------
_ = plt.scatter(X_red[:,0], X_red[:,1], cmap='RdYlBu')

e. Apakah hasil grafik pada b, c, dan d memiliki cluster yang sama atau berbeda?
Jawab : Hasil grafik sama

Anda mungkin juga menyukai

Machine Learning
Dari Everand
Machine Learning
Ibnu Daqiqil Id
Penilaian: 2.5 dari 5 bintang
2.5/5 (7)
Tentang Assesment Rekayasa Perangkat Lunak
Dokumen6 halaman
Tentang Assesment Rekayasa Perangkat Lunak
ferryawan.a
Belum ada peringkat
Algorithma K Means
Dokumen10 halaman
Algorithma K Means
yunbetrysiagian
Belum ada peringkat
SVM Deskripsi Fix
Dokumen6 halaman
SVM Deskripsi Fix
zulfahmi syahputra
Belum ada peringkat
Laporan Clustering 42520011
Dokumen8 halaman
Laporan Clustering 42520011
sasa123
Belum ada peringkat
Source Code
Dokumen6 halaman
Source Code
Noer Ramadhan
Belum ada peringkat
Spesifikasi Tugas Besar - AI
Dokumen4 halaman
Spesifikasi Tugas Besar - AI
Taufik Agung Santoso
Belum ada peringkat
I Made Gde Putra Dipanala - Tugas Clustering Python
Dokumen7 halaman
I Made Gde Putra Dipanala - Tugas Clustering Python
Hanita Pradnya
Belum ada peringkat
Laporan Summary Modul 5
Dokumen17 halaman
Laporan Summary Modul 5
DIMAS RIZAL SURYA SETIAWAN
Belum ada peringkat
AD Modul 9. Visualisasi DGN Seaborn Lanjutan
Dokumen17 halaman
AD Modul 9. Visualisasi DGN Seaborn Lanjutan
Farras yoga
Belum ada peringkat
Assalamualaikum Temen
Dokumen2 halaman
Assalamualaikum Temen
Dana Harliansyah
Belum ada peringkat
Laporan Neural Network
Dokumen6 halaman
Laporan Neural Network
Muhammad Dzikrullah S
Belum ada peringkat
Scaling A Dataset To Improve Model Accuracy Id - Unlocked
Dokumen13 halaman
Scaling A Dataset To Improve Model Accuracy Id - Unlocked
khodimul istiqlal
Belum ada peringkat
Scaling A Dataset To Improve Model Accuracy Id
Dokumen13 halaman
Scaling A Dataset To Improve Model Accuracy Id
khodimul istiqlal
Belum ada peringkat
(K-Means) Kelompok 2
Dokumen15 halaman
(K-Means) Kelompok 2
shopiarisqi
Belum ada peringkat
Modul 9
Dokumen7 halaman
Modul 9
Victor Imannuel Kartika
Belum ada peringkat
AD Modul 9. Visualisasi DGN Seaborn Lanjutan
Dokumen17 halaman
AD Modul 9. Visualisasi DGN Seaborn Lanjutan
Andika Nugraha
Belum ada peringkat
Tugas Besar Pembelajaran Mesin 1 - Clustering
Dokumen12 halaman
Tugas Besar Pembelajaran Mesin 1 - Clustering
Kaenova Mahendra Auditama
100% (1)
Jaringan Syaraf Tiruan Untuk Prediksi Menggunakan
Dokumen12 halaman
Jaringan Syaraf Tiruan Untuk Prediksi Menggunakan
mohammad riyan fikri
Belum ada peringkat
Modul 4
Dokumen7 halaman
Modul 4
dnevo5758
Belum ada peringkat
Jobsheet 8-KNN
Dokumen14 halaman
Jobsheet 8-KNN
Dwi Suci
Belum ada peringkat
Hello World ML
Dokumen5 halaman
Hello World ML
abdulambia25
Belum ada peringkat
Lapres 8.2 Progkom
Dokumen12 halaman
Lapres 8.2 Progkom
Indah Nur Laila
100% (1)
HawiNatalino K-Meansalgorith
Dokumen8 halaman
HawiNatalino K-Meansalgorith
HawiNatalino
Belum ada peringkat
Laporan Project Augmented CNN Dan Project Prediction
Dokumen10 halaman
Laporan Project Augmented CNN Dan Project Prediction
fga.dts5
Belum ada peringkat
M. Fikri Zulhimmah S - 28323001 M2
Dokumen5 halaman
M. Fikri Zulhimmah S - 28323001 M2
frizulh
Belum ada peringkat
Tantangan Milestone Pada Kumpulan Data Sepeda Bekas
Dokumen11 halaman
Tantangan Milestone Pada Kumpulan Data Sepeda Bekas
ScribdTranslations
Belum ada peringkat
Materi PKB
Dokumen17 halaman
Materi PKB
Stefanus Dapa Loka
Belum ada peringkat
Tugas Deep Learning P-13 Leni e 201810225080
Dokumen7 halaman
Tugas Deep Learning P-13 Leni e 201810225080
Lenny Aprilia
Belum ada peringkat
New Text Document
Dokumen4 halaman
New Text Document
Bakti Qilan
Belum ada peringkat
K Means Clustering
Dokumen12 halaman
K Means Clustering
JOKO ELIYANTO
Belum ada peringkat
Statistika - Ipynb - Colaboratory
Dokumen5 halaman
Statistika - Ipynb - Colaboratory
Agnesa Hanravia
Belum ada peringkat
Makalah Welta Liani (21100109) Machine Learning
Dokumen8 halaman
Makalah Welta Liani (21100109) Machine Learning
Welta Liani
Belum ada peringkat
K-Means Clustering (Case 2 Cluster)
Dokumen6 halaman
K-Means Clustering (Case 2 Cluster)
Jans Hendry
Belum ada peringkat
MODUL
Dokumen19 halaman
MODUL
Rasyid Rasyid
Belum ada peringkat
TUGAS STATISTIKA Ditambah Bisa Didiskusikan
Dokumen14 halaman
TUGAS STATISTIKA Ditambah Bisa Didiskusikan
Asri Dwita
Belum ada peringkat
Materi Multi Layer Perceptron
Dokumen15 halaman
Materi Multi Layer Perceptron
Keroppie Pethag Xielan
Belum ada peringkat
K-Means Clustering To Design Radial Basis Function Neural Network (RBFNN) Classifiers
Dokumen9 halaman
K-Means Clustering To Design Radial Basis Function Neural Network (RBFNN) Classifiers
HAYQAL HAZMI QASTARI
Belum ada peringkat
Lintang Puspita - Responsi Komstat B
Dokumen9 halaman
Lintang Puspita - Responsi Komstat B
lintang
Belum ada peringkat
Di Python
Dokumen3 halaman
Di Python
muhammad ikhwanul afif
Belum ada peringkat
Big Data Small Report Visualisasi & Clustering Data
Dokumen6 halaman
Big Data Small Report Visualisasi & Clustering Data
nuky pujiani
Belum ada peringkat
Laporan 8 16211223086
Dokumen29 halaman
Laporan 8 16211223086
rifqy nurkholiq
Belum ada peringkat
Tugas ANN
Dokumen10 halaman
Tugas ANN
chintya ang98
Belum ada peringkat
Rizky Amelia - Uts Regresi
Dokumen4 halaman
Rizky Amelia - Uts Regresi
Omi Luthfia Rahman
Belum ada peringkat
1 PB
Dokumen6 halaman
1 PB
septianfirman firman
Belum ada peringkat
Hasil Praktikum Teknik Sampling Dan Survey-4
Dokumen23 halaman
Hasil Praktikum Teknik Sampling Dan Survey-4
Sitti Nur Age
Belum ada peringkat
Modul 3 - SSD - Regresi Logistik
Dokumen23 halaman
Modul 3 - SSD - Regresi Logistik
01NATASYA EGA LINA MARBUN
Belum ada peringkat
Task10 - Bagus Arimanu - Ipynb - Colaboratory
Dokumen6 halaman
Task10 - Bagus Arimanu - Ipynb - Colaboratory
bagus arimanu
Belum ada peringkat
Anur Basit Qolbi 20210120135 AI
Dokumen4 halaman
Anur Basit Qolbi 20210120135 AI
Anur Basit
Belum ada peringkat
Sagita Amaria Christie
Dokumen5 halaman
Sagita Amaria Christie
Yulianti Repati
Belum ada peringkat
1 - Muhammad Rayhan Aulia Akbar - Ap7
Dokumen10 halaman
1 - Muhammad Rayhan Aulia Akbar - Ap7
Pasta Senpai
Belum ada peringkat
09 Array3dimensi Modul Prak Algo I Versi 4
Dokumen11 halaman
09 Array3dimensi Modul Prak Algo I Versi 4
abezita
Belum ada peringkat
Modul 11. Klasifikasi Dengan Fuzzy
Dokumen9 halaman
Modul 11. Klasifikasi Dengan Fuzzy
Hadziq Mufid Mahmud IV
Belum ada peringkat
Masalah Pelabelan
Dokumen6 halaman
Masalah Pelabelan
bindakunn12
Belum ada peringkat
Muhammad Hamaas Taqiyuddin Al Mustadjabi - 185150200111071 - Bab10
Dokumen5 halaman
Muhammad Hamaas Taqiyuddin Al Mustadjabi - 185150200111071 - Bab10
Alfen Hasiholan
Belum ada peringkat
Pert5 Overview Clustering
Dokumen30 halaman
Pert5 Overview Clustering
Nisa Alya
Belum ada peringkat
Darren Mazinzan - 10120285 - 4KA13 - M6
Dokumen11 halaman
Darren Mazinzan - 10120285 - 4KA13 - M6
mazinzan rusmanto
Belum ada peringkat
Laporan Praktikum Bahasa R (Probstat)
Dokumen12 halaman
Laporan Praktikum Bahasa R (Probstat)
Muhammad Avlach
Belum ada peringkat
Bab 6
Dokumen4 halaman
Bab 6
Hani Amany Elisadi
Belum ada peringkat
Muhammad Alfin Nuron - 20210120029
Dokumen3 halaman
Muhammad Alfin Nuron - 20210120029
Msholeh ID
Belum ada peringkat