Pertemuan 1
Pertemuan 1
01
TOOLS FOR DATA SCIENCE
Modul ke:
Introduction
Fakultas
FAK ILMU KOMPTER PUJI RAHAYU
Program Studi
TEKNIK
INFORMATIKA
● High Level Programming Language, Python memiliki syntax yang simpel dan gampang
diinterpretasikan sehingga mudah dipelajari oleh orang-orang yang tidak punya background
engineering sekalipun.
● Python merupakan bahasa pemrograman serbaguna yang dapat digunakan untuk berbagai tujuan,
seperti membuat software, web development, automasi, dan data science.
● Digunakan oleh perusahaan-perusahaan besar seperti Google, Amazon, Facebook, Uber, etc
Why Python for Data
● Science?
Open Source, artinya setiap orang dapat menggunakan & develop bahasa pemrograman python,
sehingga banyak package-package atau tools yang sangat berguna untuk Data Science.
● Tools-tools matematika & statistika yang lengkap disediakan oleh library-library python, juga
package-package machine learning.
● Python memiliki beberapa package untuk data visualization yang sangat solid, seperti matplotlib,
seaborn, ggplot, dan plotly.
Data Science
Flowchart
Understanding Data Data Exploratory
Problem Collection Cleaning Data Analysis
Model Building
Deployment Interpretation
Evaluation Model
Pada python, kita menggunakan package pandas untuk pengolahan data, seperti data collection, dan data cleaning.
Kemudian menggunakan library plotly untuk EDA dan interpretasi model. Library sklearn digunakan untuk hal-hal yang
berhubungan dengan machine learning, seperti membuat model, evaluasi model, dan data preparation. Kita menggunakan
numpy sebagai tools yang digunakan setiap ada perhitungan yang berhubungan dengan array dan matriks, dan sebagai
support untuk package lainnya.
Google Colab
Google Colab
1. Pergi ke situs
https://colab.research.google.com
2. Pilih “New Notebook”
3. Kita siap untuk membuat kode baru.
Block Cell untuk Google Colab, berbeda dengan python
biasa, Google Colab memiliki struktur kode yang dapat di
run blok-per blok nya
ctrl +enter
Daftar Pustaka
<
← MENU AKHIRI