Anda di halaman 1dari 3

Nama : Rafi Pramasukma E.

NRP : 10311710000024
Mata Kuliah : Intellegent Manufacturing
Dosen Pengampu : Fauzi Imaduddin Adhim
Topik Bahasan Tugas : Penjelasan Pemrograman Phyton

Penjelasan Pemrograman phyton Persiapan Data

# Mengimpor library yang diperlukan


import numpy as np
// Sebagai library phyton digunakan untuk proses aritmatika, jika ingin memanggil fungsi numpy
maka pada saat penulisan program cukup menuliskan dengan np
import pandas as pd
//Sebagai library phyton yang digunakan untuk mengimpor dataset, dan memanage dataset, jika
ingin memanggil fungsi pandas pada program cukup menuliskan dengan pd

# Import data ke python


dataset = pd.read_csv('Data.csv')
//Pada program line ini digunakan untuk memanggil data excel dengan nama Data.csv, penamaan
dataset sebagai penamaan bebas tapi di program ini menggunakan nama dataset
X = dataset.iloc[:, :-1].values
//Pada program ini menjelaskan bahwa “:” merupakan index untuk menampilkan semua baris
sedangkan “:-1” merupakan index untuk menampilkan kolom 0 sampai kolom terakhir
NOTE : Jika index pada kolom berisi “:-2” maka yang akan ditampilkan adalah kolom 0 sampai
kolom terakhir sebelumnya (-2 artinya 1 index sebelum index terakhir)
y = dataset.iloc[:, 3].values
//Pada program ini menjelaskan bahwa “:” merupakan index untuk menampilkan semua baris
sedangkan “3” merupakan index untuk menampilkan irisan kolom ke 3

# Memproses data yang hilang (missing)


from sklearn.impute import SimpleImputer
//Untuk memanggil library scikit-learn dan menggunakan sublibrary impute dan
menggunakan class SimpleImputer
imputer = SimpleImputer(missing_values= np.nan, strategy = 'mean')
//Pada program ini digunakan untuk menentukan parameter yang tepat, pada program ini diberi
parameter missing_value dikarenakan parameter missing_values diisi dengan np.nan karena
dataset yang kosong merupakan nan dlam format numpy, untuk mean (rata rata) digunakan untuk
fungsi mencari rata2 sedangkan imputer sebagai penamaannya saja bias dirubah dengan nama
apa saja tergantung programmer
imputer = imputer.fit(X[:, 1:3])
//Pada program ini digunakan untuk mempersiapkan pengisian baris yang hilang pada pemilihan
fit pada program digunakan semisal kita ingin mengisi bagian Usia dan gaji saja maka
penulisannya kolom X index 1 dan 2
X[:, 1:3] = imputer.transform(X[:, 1:3])
//Pada program ini sebagai implementasi dari program sebelumnya dimana line sebelum program
ini sebagai fungsi mempersiapkan pengisian baris yang hilang

# Encoding data kategori dan variabel independen


from sklearn.preprocessing import LabelEncoder, OneHotEncoder
//Pada program ini digunakan untuk menerjemahkan dikarena machine learning merupakan
hitung hitungan secara matematis dikarenakan tidak mungkin pada data kategori diproses dengan
cara matematis juga

from sklearn.compose import ColumnTransformer


//Pada program ini digunakan untuk mengimpor class ColumnTransformer dari sub
library sklearn.compose dimana columnTransformer digunakan ketika memanggil library
OneHotEncoder
labelencoder_X = LabelEncoder() # Bisa dihilangkan, baca pembahasan di bawahnya
// Pada program ini sama dengan program sebelumnya dimana machine learning hanya bisa
secara matematis sedangkan data proses tidak mungkin secara matematis
X[:, 0] = labelencoder_X.fit_transform(X[:, 0]) # Bisa dihilangkan, baca pembahasan di
bawahnya
//Program ini merupakan implementasi dari LabelEncoder dengan metode fit_transform, pada
fungsi fit digunakan untuk proses perhitungan sedangkan fungsi transform merupakan proses
pengisiannya sedangkan fit_transform merupakan gabungan dari proses perhitungan dan proses
pengisian
transformer = ColumnTransformer(
[('Negara', OneHotEncoder(), [0])],
remainder='passthrough')
//Pada program ini digunakan untuk perintah untuk mendefinisikan objek dengan nama
transformer pada pemilihan nama transformer tergantung programmer yang membuat, pada
fungsi program “[('Negara', OneHotEncoder(), [0])],” parameter ‘Negara’ digunakan untuk
membuat dummy variable dimana dummy variable ini digunakan ketika banyak negara pada
kolom setelah itu pada header semisal negara prancis,jerman, amerika setelah itu pada hasilnya
baris pertama merupakan negara perancis maka hasil akan 0 0 1, pada nilai 0 inilai negara
tersebut tidak sesuai dengan header jika nilai 1 maka header dengan kolom negara adalah benar
adanya. Sedangkan parameter “OneHotEncoder()” sebagai pengaplikasian pada kolom negara
tersebut. Pada parameter ketiga adalah urutan kolomnya. Karena kolom yang kita inginkan
adalah kolom ‘Negara’, maka kita pilih kolom ke nol (0). Setelah itu diikuti dengan parameter
remainder:’passthrough’. Artinya kita biarkan kolom-kolom yang lain seperti itu apa adanya.

X = np.array(transformer.fit_transform(X), dtype=np.float)
//Pada program ini digunakan untuk mengaplikasikan objek transformer yang didefinisikan untuk
merubah kolom ke nol (kolom ‘negara’) menjadi dummy variabel untuk variabel X. Perintahnya
adalah dimulai dengan np.array, karena hasil dari ColumnTransformer mengharuskan objeknya
berbentuk array. dtype=np.float (data tipe yang diinginkan untuk setiap kolomnya adalah
numpy, dan ditambahkan Koma jika nilai berupa decimal dikarenakan fungsi berjenis float

# Encoding the Dependent Variable


labelencoder_y = LabelEncoder()
y = labelencoder_y.fit_transform(y)
//Pada kedua program diatas merupakan program yang digunakan untuk proses encoding untuk
variabel dependen ‘Beli’. Karena hanya memiliki dua kategori yaitu Yes (1) dan No (0), maka
tidak memerlukan OneHotEncoder. Dikarenakan untuk memproses Yes(1) saja.
Penjelasan Pemrograman Phyton Training dan test set

# Membagi menjadi training set dan test set


from sklearn.model_selection import train_test_split
//Program ini sebagai library pada program training dan test set digunakan untuk proses import
train_test_split. Library train_test_split ini adalah sublibrary dari modul model_selection
di library sklearn dimana
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)
//Pada program ini X_test sebagai data X yang ingin kita tes, y_train adalah variabel dependen
yang dilatih, dan y_test merupakan variabel dependen yang diuji. Pada perintah train_test_split
diisi dengan parameter arrays X,y yang menunjukkan arrays yang dipakai adalah X sebagai
variabel independen dan y sebagai variabel dependen. Parameter selanjutnya adalah test_size
sebesar 20%. Biasanya sebagai rule of thumb (aturan umum) proporsi test set sebesar 20%
dan train set 80%. Parameter lainnya adalah random_state yang merupakan random number
generator (RNG)

Penjelasan Pemrograman Phyton Feature scaling

# Feature Scaling
from sklearn.preprocessing import StandardScaler
//Pada program ini sebagai library pada program feature scalling
sc_X = StandardScaler()
//Pada program ini adalah mendefinisikan sc_X (dibaca scale of X) sebagai variabel proses dari
StandarScaler nantinya. Kita ingin menormalisasi variabel X (independen).
X_train = sc_X.fit_transform(X_train)
//Pada program ini digunakan untuk mengonversi X_train menjadi X_train yang sudah
di rescale, dimana fungsi “fit” adalah sebagai menghitung nilai rataan dan standar deviasi pada
saat melakukan proses scalling, sedangkan “transform” menggunakan hasil perhitungan rataan
dan standar deviasi sebelumnya (dari ‘fit’) untuk diterapkan ke datanya (mengurangkan semua
data dengan nilai rataan, kemudian dibagi dengan standar deviasi), “fit_transform” melakukan
keduanya sekaligus.
X_test = sc_X.transform(X_test)
//Program ini digunakan untuk proses konversi untuk X_test.dimana sc_X sudah di fit-kan
terhadap X_train dikarenakan sudah melalui proses fit terhadap X_train

Anda mungkin juga menyukai