Anda di halaman 1dari 8

PRAKTIKUM I

Visualisasi Data dan Deskripsi Statistik Dasar Data menggunakan Jupyter


Notebook

Disusun Oleh :
Nama : Isabella Siagian
NIM: 12S15011

Sistem Informasi IT Del 2015


Sitoluama, Laguboti 2018

1 |DAMI
I. Tujuan
1. Mahasiswa mampu melakukan analisis data dengan memanfaatkan visualisasi
data dan deskripsi statistic dasar data
2. Mahasiswa mampu menyelesaikan tugas praktikum dengan memanfaatkan
dataset dan mengerjakan sesuai instruksi dari praktikum.

II. Analisis Dataset


Dataset yang digunakan pada tugas ini adalah processed-data-putus-sekolah-sd
2008-2011.csv
a. Tipe dataset : Record data yaitu Data Matrix
b. Data Objects: Perebaran data jumlah anak SD yang putus sekolah di Indonesia
pada tahun 2008-2011 yang tersebar pada setiap provinsi.
c. Attribute and type attributes:
Attribute Type Attribute
kode_provinsi Nominal
nama_provinsi Nominal
Tahun Numerik : interval-scaled
jumlah_putus_sekolah Numerik : Ratio Scaled

d. Hasil pengukuran dan analisi central tendency :


1. Mean
Dari dataset yang diolah, didapatkan nilai mean, yaitu 11899.2727.
Analisis: Dari hasil pengukuran mean, maka dapat disimpulkan bahwa
sebanyak 11899.2727 anak SD yang tersebar di Indonesia mengalami putus
sekolah.

2. Median
Dari dataset yang diolah didapatkan nilai median, yaitu 7845.5.
Analisis: Berdasarkan hasil pengukuran secara Median, dapat disimpulkan
bahwa jumlah anak sekolah SD yang putus sekolah berada memiliki nilai

2 |DAMI
tengah Antara dua nilai rata-rata yaitu sekitar 7846 jiwa yang tersebar pada
Indonesia.

3. Mode
Dari dataset yang diolah didapatkan nilai mode, yaitu 3210.
Analisis: Dari hasil pengukuran Mode, dapat disimpulkan bahwa jumlah anak
SD yang mengalami putus sekolah yang paling banyak dimiliki/muncul pada
beberapa provinsi di Indonesia periode 2008-2011 sebanyak 3210 anak.

e. Hasil pengukuran data dan analisis data distribution:


1. Variance
Hasil dari pengukuran: 146448077.68077
Analsis: berdasarkan pengukuran menggunakan variance dapat disimpulkan
bahwa adanya perbedaan persebaran data dengan menggunakan data spesifik.
Artinya jumlah anak SD yang putus sekolah tersebar di Indonesia sudah berada
pada beberapa provinsi pada tahun 2008 -2011.
2. Standard Deviation
Hasil pengukuran: 12101.57335
Analisi: berdasarkan hasil pengukuran Standard Deviation, dapat disimpulkan
bahwa persebaran jumlah anak SD yang putus sekolah mendekati rata-rata
jumlah anak SD yang putus sekolah diseluruh Indonesia.

f. Hasil pengukuran dispersion of data dan analisis terhadap data


Pengukuran dispersion of data menggunakan teknik Boxplot dan hasilnya:

3 |DAMI
Analisis:
Berdasarkan Boxplot diatas dapat disimpulkan bahwa persebaran jumlah anak SD
yang putus sekolah diseluruh Indonesia pada tahun 2008-2011 berkisaran pada
rentang lebih besar dari 0 dan lebih kecil dari 3000. Yang ditandai pada wishker
min dan max pada boxplot.
g. Hasil data visualization: Geometric Projection dengan teknik Scatter Plot dan
analisis terhadap data. Hasilnya:

Analisis: berdasarkan visualisasi scatter plot diatas dapat disimpulkan


bahwasannya pada dasarnya persebaran jumlah anak SD yang putus sekolah
diseluruh Indonesia berada pada rentang lebih besar dari 0 hingga 2000 jiwa pada
tahun 2008 sampai 2011.

4 |DAMI
III. Penjelasan Kode Program
a. Mean
Code:

Line 1: didefinisikan fungsi mean dengan parameter data.


Line 2: diberikan formula total data berdasarkan attribute jumlah_putus_sekolah yang
dibagi dengan banyaknya data.
Line 3: Variabel mean diprint.

b. Median
Code:

Line 1: didefinisikan fungsi median dengan parameter data..


Line 3: menghitung jumlah data
Line 4: mengurutkan data
Line 5: mendapatkan nilai tengah
Line 7-9: mengurutkan nilai tengah jika jumlah data (n) habis dibagi 2 memiliki sisa 1

5 |DAMI
Line 10-14: mengurutkan nilai tengah jika jumlah data (n) habis dibagi 2 tanpa adanya sisa
bagi
Line 16: menampilkan nilai median berdasarkan parameter data.

c. Mode
Code:

Line 1: didefinisikan fungsi modus dengan parameter data.


Line 3: mengihitung jumlah data anak sekolah yang putus sekolah
Line 4: menampilkan jumlah data yang terbanyak (max) dari hasil jumlah data yang
dilakukan pada line 3
Line 5-6: melakukan perulangan untuk menghitung jumlah data yang terbesar
Line 7: menampilkan nilai dari nilai modus berdasarkan parameter data

d. Variance
Code:

Line 1: didefinisikan fungsi rata-rata dengan parameter x


Line 2: didefiniskan sebuah parameter x_bar untuk menampung rata-rata data
Line 3: mengembalikan nilai rata-rata dari data

6 |DAMI
Line 5: didefinisikan fungsi variance dengan parameter data
Line 6: didefinisikan parameter n untuk menampung jumlah data
Line 7: didefinisikan parameter deviations untuk menampung rata-rata data
Line 8: mengembalikan rata-rata berdasarkan parameter deviations yang telah didefiniskan
dibagi dengan jumlah data dikurang 1
Line 9: menampilkan nilai variance berdasarkan parameter data dengan spesifik attribute
tertentu yang akan dikalkulasikan.

e. Standard Deviation
Code:

Line 1: didefinisikan fungsi standar deviasi dengan parameter x


Line 2: mengembalikan nilai akar dari totl variance yang telah didefinisikan
sebelumnya.
Line 3: menampilkan nilai standart deviasi berdasarkan data dengan attribute yang akan
dikalkulasi.

f. Dispersion of data : Boxplot


Code:

7 |DAMI
Line 1: memberikan judul boxplot “Basic Plot” pada Boxplot
Line2: menentukan sumber data dengan spesifikasi attribute yang akan dikalkulasikan
Line 3-5: memberikan title dan label pada sumbu x dan y
Line 6: menampilkan bloxplot berdasarkan data yang dijadikan sebagai sumber data
kalkulasi.

g. Data Visualization:
Code:

Code:
Line 1-2: mendefinisikan sebuah parameter penampung data yang akan diolah dalam hal
ini data yang dipakai adalah tabel yang telah ditampung dalam sebuah parameter “data”
dengan attribute tertentu (jumlah_putus_sekolah dan tahun).
Line 3: label pada hasil visualisasi data
Line 5: memanggil library plt dengan spesifikasi teknik scatter dengan attribute yang akan
diolah (Tahun dan Total), sesuai dengan parameter penampung pada line 1 dan 2.
Line 8-12: melakukan perulangan untuk menghitung jumlah data yang akan
direpresentasikan dalam scatter.
Line 14-16: mendefinisikan title dan masing-masing label x dan y.
Line 17: memanggil library plt dan menampilkan hasil dari representasi dari attribute yang
telah dikalkulasikan.

8 |DAMI