Anda di halaman 1dari 38

Course: Introduction to Data Analytics for Business

Meeting 19
Part I - Module, Package, Library
Pendidikan

Sarjana Komunikasi Hubungan


Masyarakat, Universitas Paramadina
Magister Manajemen Marketing,
Universitas Negeri Jakarta

Pengalaman Kerja

Advertising and Promotion, Trax FM


Semarang
Account Executive, Goers
Nama Expert
Sales Executive, Moka POS
Account Manager, Ruangguru
Materi Pembelajaran

Dalam materi ini kita akan belajar mengenai:

a. Overview
b. How to interact with Package
c. Exploring package: NumPy
Overview
Menurut kalian, apa itu

Module, Package, Library?


Overview

Modules Concept
• Di materi sebelumnya, kita telah belajar tentang function dan bagaimana cara membuat function.
• Setiap code yang sudah kita tulis dan eksekusi akan hilang ketika kita menutup IDE kita. Lalu bagaimana jika kita
ingin menggunakannya lagi, misal di file notebook yang berbeda? Apakah kita perlu menuliskan codenya kembali dan
run file tersebut? Hal ini tent akan membuat code kita tidak rapi dan reusable.
• Maka, kita perlu menyimpan di sebuah file sehingga code yang sudah kita buat dapat reusable, sharable, dan
persistent.
• Selain functions, modules juga dapat menyimpan variables, names, data objects, class, dll tersimpan dalam bentuk file
dengan ekstensi .py.
Overview

Modules Concept - Create your own module


• Untuk memudahkan pemahaman kita tentang cara kerja modules, kita akan mencoba untuk membuat 1 function dan
kita simpan dalam bentuk yang paling sederhana yaitu function akar (square root).
• Di pelajaran Matematika dasar, kita tahu bahwa:

• Kita transform rumus di atas menjadi sebuah function yaitu:


Overview

Modules Concept - Create your own module


• Untuk menggunakan module kita perlu mendownload dengan file extension .py bukan .ipynb.
• Satukan file tersebut dalam directory yang sama dengan notebook yang akan digunakan.
• Lalu buka notebook baru, dan hubungkan dengan drive kita dengan cara mounting google drive
Overview

Modules Concept - Create your own module


• Buka notebook yang baru saja dibuat
• Untuk copy file yang ada di drive dan dapat dibaca oleh Google Colab kita masukkan keyword !cp (copy file) di code
cell sebelum lokasi file (path file)
• Sorot sqroot.py, kemudian klik kanan dan copy path lalu run cell code tsb.

• Karena ada space di penamaan folder, Google Colab tidak dapat mendeteksi lokasi module, sehingga kita perlu
menambahkan modifikasi pada copy file syntax dengan memberikan ‘\’ pada space dan /content di akhir syntax
Overview

Modules Concept - Test module


• Step berikutnya yaitu bagaimana cara memasukkan module yang sudah kita copy?
• Kita membutuhkan import keyword, diikuti dengan nama module
• Final step, yaitu dengan melakukan testing apakah module dapat bekerja dengan baik.

Buat variabel
yang berisikan
list

Nama module nama


module.nama
function

Output
Overview

Built-in modules
• Kita juga dapat menggunakan modules yang termasuk di dalam instalasi atau bawaan dari Python.
• Namun, bagaimana kita dapat mengetahui apa saja module yang sudah tersedia (termasuk module yang sudah kita
buat)?
• Gunakan built-in function help() dan ketikkan di code cell Google Colab kalian.

Contoh

that is our created module!


Overview

Package Concept
• Di dalam pembuatan aplikasi sekecil apapun atau pada saat Contoh
kita melakukan projek data analitik, kita pasti akan bekerja
dengan banyak beberapa module yang berbeda namun
saling berkaitan. Sehingga code tersebut perlu kita atur.
• Package adalah tempat dimana kita dapat mengelompokkan
dan mengatur module-module, atau Package dapat
dikatakan sebagai sebuah direktori dari kumpulan modules.
• Ektensi dari package adalah __init.__.py
• Kumpulan dari classes, functions, variables dan runnable
code di dalam package disebut sebagai attributes.
Overview

Package Concept
• Package my_new_model terdiri dari beberapa module.
• Dengan menggunakan import statement dan menggunakan
notasi titik, maka kita dapat mengakses dan mengimpor
module tertentu dari package.

• Misalkan untuk mengimpor module dataset kita dapat


menggunakan syntax sbb:

import my_new_model.training.dataset

atau

from my_new_model.training import dataset


Overview

Package Concept
• Bagaimana jika hanya ingin mengakses sebuah function dari
sebuah package?
• Contoh di dalam modul dataset, tersimpan function
load_dataset()

• Maka, dapat diakses dengan menggunakan syntax berikut:

import my_new_model.training.dataset.load_dataset()

atau

from my_new_model.training.dataset import load_dataset()


Overview

Built-in Python packages


• Kita dapat menggunakan ‘pip freeze’ untuk mendapatkan daftar packages yang sudah terinstall dan informasi dari
versi masing-masing.
Overview

Library
• Library adalah sebuah istilah umum yang mengacu pada kumpulan code yang dapat digunakan kembali, dimana
kumpulan itu berupa modules dan packages yang saling terkait.
• Seringnya, istilah library di literatur ataupun artikel digunakan secara bergantian dengan ‘Package’, karena package
juga berisikan module dan package lain (sub-package).
• Namun sering diasumsikan bahwa package merupakan kumpulan module, dan library merupakan kumpulan dari
package.
• Python memiliki komunitas yang besar, sehingga terkadang setelah developer membuat library untuk dibagikan ke
komunitas, dan pengembang lain dapat membuat serangkaian function yang dapat diambil dari library tersebut.
• Contoh:

NumPy = core library in Python Pandas = open-source library bulit on top of numpy
How to interact with package
Interacting with Package

importing packages
• Untuk melakukan import package, ada dua cara yang bisa digunakan berdasarkan kebutuhan.

import

• digunakan jika ingin mengimpor seluruh package/modul, dan umum digunakan karena mempersingkat waktu dan butuh
satu baris code.
• boros di memory resource.

from.. import..

• digunakan untuk mengimpor package attribute spesifik.


• menghemat resources namun lebih komplek
Interacting with Package

Installing packages by using pip

• Pip (built-in package) digunakan untuk menginstall library/packages dengan mudah melalui
command-prompt/terminal/di code cell dan koneksi internet.

• Sebelum menginstal, pastikan perangkat anda terhubung dengan internet. Lalu kalian dapat menggnakan baik
command prompt (cmd) windows atau terminal pada windows/mac, atau di code cell dengan menggunakan !pip
install <package name>.
C:\Python34\Scripts\pip.exe install requests !pip install requests black
Interacting with Package

Import what you need

• Saat sudah mulai berkerja dengan data, umumnya kita akan menulis code cell paling awal adalah untuk menulis
package apa saja yang diimpor, set warning, atau menggunakan magic line command (%).

• Contoh:

Image: Data Preparation & Exploration (Kaggle/Bert Carreemans, 2018)

Image: Time series basics: Exploring Traditional TS (Kaggle/Jagangupta, 2018)


Exploring Package: NumPy
Exploring Package: NumPy

NumPy

• Kepanjangan dari Numerical Python, dibaca /ˈnʌmpaɪ/ (NUM-py) atau /ˈnʌmpi/ (NUM-pee) yang dibangun di tahun
2005 oleh Travis Oliphant dengan menyempurnakan dari pendahulunya Numeric yang dibuat oleh Jim Hugunin.

• Adalah Package fundamental untuk kebutuhan scientific computing di Python yang bekerja dengan arrays untuk
mathematical functions

• Menyediakan multidimensional array object yang dapat digunakan untuk berbagai math operations
• Digunakan untuk performing basic operations seperti sorting, indexing, dan array manipulation
• Memiliki processing speed yang cepat di antara library-library Python lainnya
• NumPy juga merupakan sebuah framework dari Library yang umum digunakan di data analytic atau data science
seperti SciPy, Scikit-Learn, Pandas, dll.

• Fungsi utama dari package ini adalah ndarray atau n-dimensional array dan data structure.
• NumPy juga digunakan libraries yang high-end seperti TensorFlow untuk Tensor manipulasi.
Exploring Package: NumPy

NumPy

• Dasar dari NumPy arrays

Attributes di arrays • Menentukan ukuran, bentuk, memory consumption dan tipe data array

Indexing • Mendapatkan dan mengatur nilai secara individu di elemen array

Slicing • Mendapatkan dan mengatur dari array yang lebih besar menjadi bagian
sub-array ukuran kecil

Reshaping • Merubah bentuk array

Concatenation dan Splitting • Menggabungkan beberapa array menjadi 1, dan memisahkan 1 array menjadi
beberapa bagian
Sekarang kita coba explore apa saja function di dalam

NumPy
Slide ini adalah akhir dari presentasi.

TERIMA KASIH
Course: Introduction to Data Analytics for Business

Meeting 19
Part II - Module, Package, Library
Pendidikan

Sarjana Komunikasi Hubungan


Masyarakat, Universitas Paramadina
Magister Manajemen Marketing,
Universitas Negeri Jakarta

Pengalaman Kerja

Advertising and Promotion, Trax FM


Semarang
Account Executive, Goers
Nama Expert
Sales Executive, Moka POS
Account Manager, Ruangguru
Materi Pembelajaran

Dalam materi kedua ini kita akan belajar mengenai:

a. Exploring Package: Pandas


b. Exploring Package: Matplotlib dan Seaborn
Exploring Package: Pandas
Exploring Package: Pandas

Pandas

• Pandas adalah package yang sangat populer di bidang Data Analysis dan Data Science
• Menyedakan DataFrame, yaitu multimensi arrays dengan label baris dan kolom dengan tipe yang heterogen dan
missing data dimana package ini dibangun atas NumPy.

• Pandas memberikan kenyamanan di data operations kepada para user yang biasa menggunakan framework
database dan program spreadsheet serta dapat menghubungkan ke sumber data seperti Excel, CSV, atau SQL
database.

• Pandas memiliki 2 struktur yaitu:


Series • Terdiri dari 1 dimensi

DataFrame • Terdiri dari 2 dimensi


Exploring Package: Pandas

Pandas

• Dimensi series • Dimensi DataFrame


Qty Qty Kota Sales (dlm Region
ribu)
0 10
0 10 Malang 1000 1
1 21
1 21 Denpasar 2500 2
2 22
2 22 Bontang 1900 4
3 1 3 1 Semarang 2300 3
4 43 4 43 Surabaya 500 1
5 13 5 13 Tangerang 900 5
6 9 6 9 Tangerang 450 5
7 20 7 20 Jakarta Selatan 700 5
Sekarang kita coba explore apa saja function di dalam

Pandas
Exploring Package: Matplotlib and Seaborn
Exploring Package: Matplotlib and Seaborn

Matplotlib dan Seaborn

• Visualisasi adalah salah satu teknik di data analitik yang sangat berguna dalam menampilkan data.
• Salah satunya adalah package Matplotlib dan Seaborn yang fleksibel karena kita dapat membuat beberapa tipe
visualisasi berdasarkan kebutuhan, seperti Histogram, Bar chart, Pie chart, Scatterplot, dll.

• Seaborn muncul setelah Matplotlib dengan mengusung library bawaan Matplotlib untuk menampilkan visualisasi lebih
indah dan estetik.
Sekarang kita coba explore apa saja function di dalam

Matplotlib dan Seaborn


Recap

Apakah perbedaan dari Modules, Package, dan Library?

Apa manfaat dari penggunaan package Pandas?


References

Mueller, J. P. (2018). Beginning Programming with Python For Dummies (For Dummies (Computer/Tech)) (2nd ed.)
[E-book]. For Dummies.

Park, A. (2021). Data Science for Beginners: 4 books in 1 — Master the Basics of Python Programming and Learn The Art
of Data Science with Real-World Applications to Artificial Intelligence and Machine Learning [E-book]. Independently
published.

Rajagopalan, G. (2020). A Python Data Analyst’s Toolkit: Learn Python and Python-based Libraries with Applications in
Data Analysis and Statistics (1st ed.) [E-book]. Apress.

Sheppard, Kevin (2019) Introduction to Python for Econometrics, Statistics, and Data Analysis. University of Oxford.
Retrieved from https://www.kevinsheppard.com/files/teaching/python/notes/python_introduction_2019.pdf

VanderPlas, J. (2016). Python Data Science Handbook: Essential Tools for Working with Data (1st ed.) [E-book]. O’Reilly
Media.

Image credits to:


“image: Freepik.com”. All of images has been designed using resources from Freepik.com
Slide ini adalah akhir dari presentasi.

TERIMA KASIH

Anda mungkin juga menyukai