Anda di halaman 1dari 7

BAB I

PENDAHULUAN

1.1 Dasar Teori


Dalam perkembangan saat ini terdapat banyak data yang bisa diperoleh
dengan mudah dan cepat. Data-data tersebut dikumpulkan untuk digunakan
dalam pengambilan kesimpulan dari data tersebut. Pengolahan data menjadi
hal yang cukup penting saat ini, adanya kemudahan memperoleh data tersebut
membuat pengolahan data yang ada menjadi mudah dan cepat pula.
sekumpulan data yang didapat bisa diolah sehingga memunculkan kesimpulan
dari data.
1.2 Rumusan Masalah
1.2.1 Bagaimana mengolah suatu data yang ada menggunakan python?
BAB II
PEMBAHASAN

1. Melakukan import libraries.

Import sys berfungsi mengakses pengaturan interpreter pada saat runtime


dan berinteraksi dengan environment sistem operasi.
Import scipy berfungsi mengitungi operasi aljabar dan matriks.
Import numpy berfungsi untuk operasi vektor dan matriks.
Import matplotlib berfungsi meampilkan data dengan bentuk grafik
berwarna.
Import sklearnberfungsi memberikan sejumlah fitur untuk keperluan
data science seperti Algoritma Naive Bayes, Algoritma Clustering, dll.
Import pandas berfungsi membaca file dari berbagai format seperti .txt,
.csv, .tsv, dan lainnya.

2. Memasukkan url data dan membuat tabel sesuai dengan atribut dataset.

url berfungsi mengimport link dataset dari sebuah halaman web agar
terdefinisikan oleh python. Sedangkan names berfungsi untuk membuat
tabeli dengan atribut sesuai dataset.

Fungsi print(dataset.shape) berfungsi membaca dataset yang diimport


kemudian mendefinisikan jumlah data dan jumlah atributnya, dalam
dataset yang dipilih akan muncul (165, 5).
3. Menampilkan dataset yang telah di import

Print(dataset.head(20)) berfungsi menampilkan 20 data pertama dari


dataset.

4. Mendeskripsikan dataset yang telah di import

Print(dataset.describe()) berfungsi untuk mendeskripsikan setiap


atribut di dalam dataset.
5. Menampilkan grafik dari dataset yang telah di import

Fungsi matplotlib berfungsi untuk menampilkan dataset yang di import


ke dalam bentuk grafik.
6. Menampilkan grafik histogram

Fungsi matplotlib berfungsi untuk menampilkan dataset yang di import


juga ke dalam bentuk grafik histogram.
7. Menampilkan grafik scatter matrix

Dengan mengimport scatter_matrix, maka grafik akan terbentuk sesuai


dengan dataset yang telah dibca oleh fungsi pandas dan telah diimport
BAB III
PENUTUP

3.1 Kesimpulan
Python sering digunakan dalam untuk keperluan data science dalam
Machine Learning seperti Algoritma Naive Bayes, dll Python dapat
dig8nakan untuk menghitung operasi matematis. Selain serta menampilkan
grafik sesuai dengan dataset yang di definisikan. Python sering digunakan
dalam untuk keperluan data science dalam Machine Learning seperti
Algoritma Naive Bayes, Algoritma Clustering, Algoritma Decision Tree dan
lainnya.

Anda mungkin juga menyukai