Anda di halaman 1dari 4

TUGAS EKSPLORASI SCIKIT LEARN PADA JUPYTER NOTEBOOK

INTELIGENSI BUATAN T.A. 2019/2020

Jupyter Notebook (http://jupyter.org/) memudahkan kita untuk membuat dan men-share


dokumen yang merupakan gabungan dari live code, equation, visualisasi dan catatan. Jupyter
dapat digunakan untuk visualisasi, pembersihan dan data transformasi, statistical model dan
machine learning. Scikit-learn merupakan library machine learning pada bahasa python.

1. Lakukan eksplorasi scikit learn pada Jupiter Netbook dan bacalah dokumentasinya :
https://jupyter-notebook.readthedocs.io/en/stable/notebook.html
http://scikit-learn.org/stable/documentation.html

2. Proses Instalasi
a. Instalasi di windows
- Cara paling mudah adalah menggunakan Anaconca yang dapat diunduh pada
laman https://www.anaconda.com/download/#download. Setelah proses instalasi
selesai dilakukan, maka carilah “Anaconda Prompt” selanjutnya ketikkan
command line:
jupyter notebook
- Jupyter akan otomatis muncul di browser
- Untuk instalasi berbagai library yang diperlukan, buka Anaconda Prompt kembali
dari awal, dan gunakan command line berikut:
conda install pandas
conda install scikit-learn
b. Instalasi di Linux
- Untuk melakukan instlasi anaconda pada sistem operasi linux dapat melalui
terminal dan menggunakan command line:
pip3 install jupyter
- Sedangkan untuk menjalankannya bisa menggunakan command line:
jupyter notebook
- Untuk instalasi package library yang dibutuhkan bisa menggunakan fasilitas
pip3, dengan menggunakan command line:
pip3 install pandas
pip3 install scikit-learn

3. Tulislah script dalam bahasa python pada satu notebook untuk melakukan task berikut ini:
a. Lakukan pembelajaran untuk Metode Naïve Bayes, serta analisis dan jelaskan luaran
yang dihasilkan pada setiap blok kode program.
from sklearn import datasets
from sklearn.model_selection import train_test_split
Blok 1
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import confusion_matrix
wine = datasets.load_wine()
Blok 2 print ("Features: ", wine.feature_names)
print ("Labels: ", wine.target_names)
print ("Ukuran Data\n",wine.data.shape,"\n")
Blok 3 print ("Dataset X\n",wine.data[0:5],"\n")
print ("Data Label\n",wine.target,"\n")
X_train, X_test, y_train, y_test = train_test_split(wine.d
ata, wine.target, test_size=0.3,random_state=109)
gnb = GaussianNB()
gnb.fit(X_train, y_train)
Blok 4 y_pred = gnb.predict(X_test)
print ("Confusion Matrix:\n", confusion_matrix(y_test, y_p
red), "\n")
print ("Classification Measure\n", classification_report(y
_test, y_pred))

b. Lakukan pembelajaran untuk Metode Neural Network, serta analisis dan jelaskan
luaran yang dihasilkan pada setiap blok kode program.
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
Blok 1
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import confusion_matrix, classificati
on_report
cancer = load_breast_cancer()
print ("Description Data\n",cancer.keys())
Blok 2
X = cancer['data']
Y = cancer['target']
print ("Ukuran Data\n",cancer['data'].shape,"\n")
Blok 3 print ("Dataset X\n",X[0:5],"\n")
print ("Data Label\n",Y,"\n")
X_train, X_test, y_train, y_test = train_test_split(X, Y)
scaler = StandardScaler()
scaler.fit(X_train)
Blok 4 X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)
print("Hasil Preprocessing X-Train\n",X_train,"\n")
print("Hasil Preprocessing X-Test\n",X_test)
model = MLPClassifier(hidden_layer_sizes=(30,30,30))
Blok 5 model.fit(X_train,y_train)
y_pred = model.predict(X_test)
print("Confusion Matriks:\n",confusion_matrix(y_test, y_pr
ed),"\n")
print("Prediction Measure:\n",classification_report(y_test
, y_pred))

c. Lakukan pembelajaran untuk Metode K-Means, serta analisis dan jelaskan luaran
yang dihasilkan pada setiap blok kode program.
import numpy as np
import pandas as pd
Blok 1 from matplotlib import pyplot as plt
from sklearn.datasets.samples_generator import make_blobs
from sklearn.cluster import KMeans
X, Y = make_blobs(n_samples=300, centers=4,
Blok 2 cluster_std=0.6, center_box=(0, 10))
print ("Ploting Data :\n",plt.scatter(X[:,0], X[:,1]))
wcss = []
for i in range(1, 11):
kmeans = KMeans(n_clusters=i, init='k-
means++', max_iter=300, n_init=10, random_state=0)
kmeans.fit(X)
wcss.append(kmeans.inertia_)
Blok 3
print ("Hasil Pencarian Nilai K Terbaik :\n")
plt.plot(range(1, 11), wcss)
plt.title('Elbow Method')
plt.xlabel('Number of clusters')
plt.ylabel('WCSS')
plt.show()
kmeans = KMeans(n_clusters=4, init='k-means++',
max_iter=300, n_init=10, random_state=0)
pred_y = kmeans.fit_predict(X)
Blok 4 plt.scatter(X[:,0], X[:,1])
plt.scatter(kmeans.cluster_centers_[:, 0],
kmeans.cluster_centers_[:, 1], s=150, c='red')
plt.show()

4. Tugas dikerjakan berkelompok, dan 1 kelompok terdiri atas 2 mahasiswa.

5. Tugas dikumpulkan berupa hasil download notebook dalam dua format yaitu file .ipynb
dan pdf. Hanya salah satu anggota kelompok saja yang melakukan upload file tugas pada
google classroom pada Course Inteligensi Buatan. Penamaan file yang dikumpulkan:
Tubes_[NIM1_NIM2].zip (misal: Tubes_13515001_13515002.zip yang berisi file dengan
ekstensi .ipynb dan .pdf.
6. Pengumpulan yang terlambat tidak diperbolehkan, batas akhir adalah hari Rabu, 25
Desember 2019 pukul 23.55 WIB (waktu sistem).

Anda mungkin juga menyukai