Anda di halaman 1dari 9

DATA SCIENCE DALAM PYHTON

MAKALAH
Disusun untuk memenuhi salah satu tugas Pengantar Teknologi Informasi dan Pemrograman

Dosen Pengajar:
Deni Sukendar, S.Si., MT.

Penyusun:

Wildan Aridansyah S. (23410019)


Dinda Rizka Amalia (23410004)
Nasywa Adellia Putri (23410017)
Angela Puella Bria (23410023)
Elviani (23410022)

PROGRAM STUDI TEKNIK TEKSTIL


POLITEKNIK STTT BANDUNG
2023
KATA PENGANTAR

Segala puji bagi Allah SWT. karena atas berkat dan rahmatnya kami dapat menyelesaikan
makalah Data science dalam pyhton ini tepat waktu.Tak lupa kami ucapkan pada Bapak Deni
Sukendar., S.Si.,M.T. selaku dosen Pengantar Teknologi Informasi dan Pemrograman, yang
sudah membantu kami dalam pembuatan makalah ini. Kami ucapkan banyak terima kasih juga
kepada pihak-pihak yang turut membantu dalam pembuatan makalah kami ini.
Makalah dengan judul “Data Science dalam python” ini disusun untuk memenuhi tugas mata
kuliah Pengantar Teknologi Informasi dan Pemrograman. Melalui tugas yang diberikan ini, kami
mendapatkan banyak pengetahuan baru mengenai Data Science dalam python.
Kami menyadari susunan dari makalah ini belum sempurna. Akan tetapi, kami harap makalah ini
dapat bermanfaat bagi khalayak banyak.

Bandung, Desember 2023

Penulis

i
DAFTAR ISI

KATA PENGANTAR.....................................................................................................................i
BAB I...............................................................................................................................................1
PENDAHULUAN..........................................................................................................................1
A. Latar Belakang........................................................................................................................1
B. Rumusan Masalah..................................................................................................................1
C. Tujuan........................................................................................................................................1
BAB II.............................................................................................................................................2
PEMBAHASAN.............................................................................................................................2
2.1 Pengertian Data science.........................................................................................................2
2.2 Kegunaan Data Science dalam Python...............................................................................2
2.3 Alasan Data Science menggunakan python.......................................................................3
2.4 Elemem-Elemen Utama dalam Python..............................................................................3
BAB III...........................................................................................................................................5
KESIMPULAN.............................................................................................................................5
DAFTAR PUSTAKA...................................................................................................................6

ii
BAB I

PENDAHULUAN

A. Latar Belakang
Bahasa pemrograman atau bahasa komputer adalah perintah yang dibuat manusia
untuk membuat komputer menjadi memiliki fungsi tertentu. Bahasa pemrograman adalah
suatu susunan aturan penulisan (sintaks) yang membentuk kode-kode yang kemudian
akan diterjemahkan oleh program kompiler menjadi bahasa rakitan (assembly) dan terus
diolah hingga dimengerti oleh mesin. Komputer hanya mengerti bahasa mesin.
Bahasa pemrograman penting dikuasai di era sekarang oleh para pengembang
teknologi. Seiring berkembangnya teknologi, kini semakin banyak bahasa pemrograman
yang bisa digunakan. Bahkan penggunaan bahasa pemrograman pun semakin mudah.
Bahasa pemrograman terbagi menjadi tiga jenis, yakni bahasa mesin (machine language),
bahasa tingkat rendah/rakitan (low-level/assembly language), dan bahasa tinggi (high
level language).
Data science merupakan bidang ilmu yang bertugas untuk mengelola data.
Orang yang melakukan pengelolaan data disebut data scientist. Seorang
data scientist bertanggung jawab untuk mengumpulkan dan menganalisis kumpulan
data hingga mendapatkan pandangan atau insight untuk menentukan pengambilan
keputusan pada suatu perusahaan.
Python merupakan salah satu bahasa pemrograman yang paling populer di
dunia. Python menjadi semakin populer seiring dengan meningkatnya kepopuleran
data science. Sebab, bahasa pemrograman yang satu ini merupakan bahasa
pemrograman yang paling umum digunakan dalam data science.
Berdasarkan ciri khasnya, Python adalah bahasa pemrograman yang
terinterpretasi, object oriented, dan high level. Konsep Python sebenarnya sama
dengan bahasa pemrograman lainnya seperti C++, Java, R, dan lain sebagainya.
Python diciptakan oleh Guido van Rossum pada tahun 1990.Python diusung
sebagai bahasa pemrograman yang betsifat open source. Sejak saat itulah Python
dalam data science menjadi bahasa pemrograman paling penting di dunia karena
komunitasnya yang cukup besar.

B. Rumusan Masalah
 Apa itu Data Science?
 Kegunaan Data Science?
 Elemen-elemen Data Science dalam python
C. Tujuan
 Mengetahui bagaimana cara menggunakan Data Science dalam Python

1
BAB II

PEMBAHASAN

2.1 Pengertian Data science


Data science adalah bidang interdisipliner yang menggunakan metode ilmiah, proses
bisnis, dan sistem komputasi untuk mengekstrak pengetahuan dan wawasan dari berbagai jenis
data. Tujuan utama dari data science adalah untuk membuat keputusan yang lebih baik dan
memahami fenomena dunia nyata melalui analisis data yang komprehensif. Python, sebagai
bahasa pemrograman yang populer, sering digunakan dalam praktik data science karena memiliki
berbagai pustaka dan alat yang kuat.

2.2 Kegunaan Data Science dalam Python


1) Pengumpulan dan pembersihan data, Seorang data scientist bisa menggunakan hampir
semua jenis data yang tersedia dalam berbagai format seperti CSV (Comma-separated
value), TSV (Tab-separated value), maupun Jason. Python juga bisa digunakan untuk
impor table langsung dari SQL ke website code scrapping.
2) Eksplorasi Data, Setelah memiliki data bersih, seorang data scientist harus menemukan
pertanyaan bisnis untuk dijawab yang kemudian dikonversikan pada pertanyaan data
science. Untuk melakukan proses ini, seorang data scientist membutuhkan Python untuk
mengidentifikasi properti mereka dan memisahkan data berdasarkan tipenya seperti
numerik, ordinal, nominal, atau kategori untuk menyiapkan treatment yang dibutuhkan.
3) Visualisasi dan Interpretasi Data, Python memiliki banyak paket visualisasi data.
Matplotlib menjadi library yang paling sering digunakan oleh data scientist untuk meng-
generate grafik dasar dan diagram. Untuk membuat visualisasi data yang estetik, data
scientist dapat menggunakan library Python lainnya yakni, Plotly.
Data Modelling, Sekarang kita sudah masuk di fase yang sangat krusial dalam proses
kerja data science. Dalam tahap ini, seorang data scientist harus berjuang untuk
memperkecil dimensionality dari dataset.
Dalam proses ini, data scientist dapat menggunakan Python yang memiliki banyak library
canggih yang dapat membantu proses machine learning untuk melaksanakan perintah
yang terkait dengan data modelling.

2
4) Deploying, Proses deployment merupakan proses mengubah model pada bahasa yang
bermakna dan dapat dipahami oleh sistem maupun end user. Salah satu framework yang
paling sering digunakan dalam proses ini adalah Flask.

2.3 Alasan Data Science menggunakan python


Python merupakan bahasa pemrograman yang paling banyak populer digunakan belakangan
ini seiring meningkatnya popularitas data science.Ada beberapa alasan kenapa Python begitu
populer.
1. Python memiliki syntax yang mudah diingat dan mudah dimengerti.
2. Python bisa digunakan untuk berbagai hal, baik itu pengolahan data maupun pembuatan
website baru.
3. Python bersifat open-source, alias dibuka gratis untuk publik. Ini juga artinya ada
banyak sekali fitur dan kode buatan kreator yang semakin memperluas kapabilitas
Python.

2.4 Elemem-Elemen Utama dalam Python


1. Pengumpulan Data (Data Collection)
Sumber data: Pengumpulan data melibatkan mengumpulkan informasi dari berbagai
sumber, seperti basis data, file teks, web scraping, sensor IoT, dan API (Antarmuka
Pemrograman Aplikasi).
Pandas: Pustaka pandas menyediakan struktur data yang kuat (DataFrame) untuk
menyimpan dan mengelola data tabular.

2. Pembersihan Data (Data Cleaning)


Identifikasi dan Penanganan Missing Values: Pembersihan data melibatkan identifikasi
dan penanganan nilai-nilai yang hilang atau tidak valid.
Pustaka Pandas: Pandas digunakan untuk membersihkan dan memanipulasi data,
termasuk menghapus nilai-nilai yang hilang atau outlier.

3. Eksplorasi Data (Exploratory Data Analysis - EDA)


Visualisasi Data: Penggunaan grafik dan plot untuk memahami distribusi data, korelasi
antar variabel, dan pola-pola lainnya.
Matplotlib dan Seaborn: Pustaka Matplotlib dan Seaborn digunakan untuk membuat
visualisasi data.

3
4. Pemodelan Statistik dan Machine Learning
Analisis Statistik: Menggunakan metode statistik untuk mengekstrak wawasan dari data.
Machine Learning: Membangun dan melatih model machine learning untuk membuat
prediksi atau klasifikasi. Pustaka scikit-learn sangat populer untuk ini.

5. Evaluasi Model dan Penyempurnaan (Model Evaluation and Refinement)


Evaluasi Model: Mengukur kinerja model menggunakan metrik yang sesuai.
Penyempurnaan Model: Melakukan penyetelan dan peningkatan model untuk
meningkatkan performa.

6. Komunikasi dan Visualisasi Hasil


Komunikasi: Menyajikan temuan dan hasil secara jelas kepada pemangku kepentingan.
Dashboard dan Laporan: Membuat dashboard atau laporan visual untuk komunikasi
hasil analisis.

7. Penggunaan Python dalam Data Science


 Pandas, NumPy: Untuk manipulasi dan analisis data.
 Matplotlib, Seaborn: Untuk visualisasi data.
 Scikit-learn: Untuk pemodelan machine learning.
 Jupyter Notebooks: Untuk membuat dan berbagi dokumentasi interaktif.

Data science dalam Python melibatkan penerapan langkah-langkah ini secara berurutan
untuk menyelidiki, memahami, dan mengekstrak nilai dari data. Kombinasi antara
keahlian domain, matematika/statistik, dan pemrograman Python memungkinkan praktisi
data science untuk mengatasi tantangan analisis data yang kompleks.

4
BAB III

KESIMPULAN

Data science dalam Python adalah disiplin interdisipliner yang menggunakan


bahasa pemrograman Python dan pustaka-pustaka seperti Pandas, NumPy, Matplotlib,
Seaborn, dan Scikit-learn. Prosesnya melibatkan pengumpulan, pembersihan, dan
eksplorasi data, serta pembuatan dan evaluasi model machine learning. Penting untuk
memiliki keterampilan analisis, pemrograman, dan komunikasi hasil. Python, dengan
ekosistemnya yang kuat, menjadi pilihan utama untuk praktisi data science dalam
mengolah dan menganalisis data, serta membuat prediksi berdasarkan pola yang
ditemukan dalam dataset.

5
DAFTAR PUSTAKA

https://www.hacktiv8.com/intro-to-python-for-data-science. Diakses Desember 2023


https://danacita.co.id/blog/mengenal-apa-itu-python-dalam-data-science/#:~:text=Data
%20science%20merupakan%20bidang%20ilmu,pengelolaan%20data.%20disebut%20data
%20scientist. Diakses Desember 2023.

Anda mungkin juga menyukai