Anda di halaman 1dari 11

Data Science

UTS FORECASTING

Disusun Oleh :
Bagas tri panji susilo (2211010036)

Kelas: 2TI-P4

INSTITUT INFORMATIKA DAN BISNIS DARMAJAYA


2023 Chapter 1: mengimpor data coffe dan memuat dataset
-langkah 1 buka:(https://colab.research.google.com/) lalu sign-in
mengunakan akun google anda.
-Langkah 2
Jika sudah sign-in klik files lalu upload data kalian yang berformat
csv
Contoh:

-Langkah 3
Klik + code lalu Ketik: [import numpy as np import
pandas as pd import os for dirname, _, filenames
in os.walk('/kaggle/input'): for filename in
filenames: print(os.path.join(dirname, filename))
chapter 2:import libraries

-langkah ketik [import matplotlib.pyplot as plt


%matplotlib inline import
seaborn as sns] chapter 2:
data processing
-Langkah 1 membaca file dengan mengetikan code
[df=pd.read_csv(r"coffee.csv"]
-Langkah 2 ketik menampilkan kepala di data kita [df.head()] lalu
akan muncul seperti ini

-Langkah 3 memunculkan isnull pada data ketik [df.isnull().sum()]


akan muncul seperti ini:

-Langkah 4 memdiscribe data mengetik [df.describe] akan muncul


seperti ini:
-Langkah 5 mengecek type data kita ketik [type(df["Date"].iloc[0])]
Hasil:str
-Langkah 6 drop columns dengan memasukan code
[df=df.drop(["Currency"],axis=1)]
-langkah 7 memnunculkan lagi kepala yang sudah di ubah
ketik[df.head()] hasilnya:

Chapter 3: perform EDA


-Langkah 1 memunculkan boxplot data dengan memasukan
code[sns.boxplot(data=df))] akan muncul seperti ini:

-Langkah 2 menampilkan volume value data kita dengan


memasukan code [df["Volume"].value_counts()akan
muncul seperti ini:
-Langkah 3 memunculkan pairplot data dengan memasukan kode
[sns.pairplot(data=df)]] hasil:

-langkah 4 menampilkan corelasi diantara colum ketik [


plt.figure(figsize=(20,10))
sns.heatmap(df.corr(),annot=True,cmap='viridis')]
hasilnya: <ipython-input-14-9b0a1826d709>:3:
FutureWarning: The default value of numeric_only in
DataFrame.corr is deprecated. In a future version, it will
default to False. Select only valid columns or specify the
value of numeric_only to silence this warning.

sns.heatmap(df.corr(),annot=True,cmap='viridis')
<Axes: >

-Langkah 5 menampilkan figure data dengan memasukan code


[plt.figure(figsize = (10, 10))
plt.title('high VS low')
plt.scatter(df['High'],
df['Low'])] lalu akan muncul
seperti ini:

Chapter 4: performing machine learning


-Langkah 1 import masukan code [from sklearn import
linear_model]
-Langkah 2 linear masukan code
[slr=linear_model.LinearRegression()]
-langkah 3 columns ketik [df.columns] hasilnya:

-Langkah 4 open and close ketik [X=df[['Open', 'High',


'Low','Volume']]
y=df['Close']
-Langkah 5 Pisahkan data menjadi kereta dan uji masukan code
[from sklearn.model_selection import train_test_split]
-Langkah 6 train memasukan code [X_train, X_test, y_train, y_test
= train_test_split(X, y, test_size=0.30, random_state=101)]
-langkah 7 LSR split ketik [slr.fit(X_train,y_train)] hasil
:LinearRegression()
-langkah 8 prediksi ketik [predictions=slr.predict(X_test)]
-langkah 9 accuracy ketik [accuracy=slr.score(X_test,y_test)]
-langkah 10 print accuracy ketik [print(accuracy) #0.99% accuracy]
hasil : 0.9994763229642112
-langkah 11 Plot prediksi vs y_test ketik [plt.figure(figsize=(10,10))
plt.scatter(predictions,y_test)] hasilnya :
<matplotlib.collections.PathCollection at 0x7954e6b47dd0>
Chapter 5: finding errors
-Langkah 1 import ketik [from sklearn.metrics import
mean_absolute_error]
-langkah 2 absolute error ketik
[mean_absolute_error(y_test,predictions)] hasilnya :
0.7992722349766604
-Langkah 3 mean score error ketik [from sklearn.metrics
import mean_squared_error mean_squared_error(y_test,
predictions)] hasilnya :
1.358385249174444
-langkah 4 score ketik [from sklearn.metrics import r2_score
r2_score(y_test, predictions)] hasilnya : 0.9994763229642112

Anda mungkin juga menyukai