Anda di halaman 1dari 6

LAPORAN PROYEK 3

KU1072 PENGENALAN TEKNOLOGI INFORMASI IB


SEMESTER I 2018-2019

ANALISIS DESKRIPTIF DATA

Kelompok 3

Karina Dara 169 18 039


Dzaky 169 18 083
Fahmi Muzaki 169 18 159
Raihan Lutfianto 169 18 231
Steven Fabian 169 18 235
November 2018

PROGRAM TAHAP PERSIAPAN BERSAMA


FAKULTAS TEKNIK MESIN DAN DIRGANTARA
INSTITUT TEKNOLOGI BANDUNG
2018
I. Tujuan Proyek
1. Mahasiswa mampu mengenali persoalan komputasi dalam persoalan yang diberikan, menggunakan
dekomposisi dan abstraksi dalam pemecahan persoalan, serta menghasilkan artifak komputasi yang
relevan
2. Mahasiswa mampu berkolaborasi dalam kelompok pemecahan persoalan komputasi.
3. Mahasiswa mampu berkomunikasi dengan berbagai pihak dalam rangka mengekspresikan dan bertukar
ide mengenai pemecahan persoalan komputasi.

II. Teori Dasar


Statistik Deskriptif (Statistic Descriptive) adalah cabang ilmu statistika yang mempelajari tentang
cara pengumpulan dan penyederhanaan data-data yang diperoleh kemudian menyajikan data-data tersebut
menjadi informasi yang bermanfaat dan lebih menarik serta mudah dimengerti. Analisis Deskriptif adalah
analisis yang dilakukan untuk menilai karakteristik dari sebuah data. Informasi yang diperoleh dari
Analisis Statistik Deskriptif antara lain adalah Pemusatan data (Mean, Median, Modus), Penyebaran data
(Standar Deviasi, Varian, Range) dan kecenderungan sekelompok data.
Ada 2 (dua) cara yang dapat dilakukan dalam mempergunakan Microsoft Excel untuk menghitung
semua jenis Statistik Deskriptif yaitu dengan memakai Fungsi dalam Microsoft Excel seperti
(AVERAGE, MEDIAN, COUNT, MIN, MAX, STDEV.S) ataupun menggunakan Data Analysis yang
lebih mudah dan praktis.
Dikatakan lebih mudah dan praktis karena metode “Data Analysis” ini dapat melakukan
perhitungan secara lengkap dengan beberapa langkah saja. Tetapi untuk dapat menggunakan metode
“Data Analysis” dalam Microsoft Excel, kita perlu melakukan instalasi Add-ins Analysis Toolpak ke
dalam Microsoft Excel. Add-Ins Analysis Toolpak merupakan Add-Ins gratis dan memang sudah tersedia
didalam Microsoft Excel 2007 itu sendiri.

III. Pembahasan
III.1 Deskripsi Data
Data yang digunakan pada proyek ini adalah data mengenai hasil ekspor mineral dari Indonesia yang
diperoleh dari data.go.id dengan format .csv. Data set berdimensi 5 kolom dan 440+1 baris dan ukuran
filenya 21,4 KB. Selengkapnya mengenai data set ini adalah sebagai berikut.
Penjelasan mengenai Variabel pada Dataset ini:
o nama_perusahaan: Nama Perusahaan
o komoditas: Komoditas
o satuan: Satuan berkenaan dengan komoditas tersebut
o tahun: Tahun
o nilai: Nilai Ekspor
Informasi tambahan:
 Field: Nilai
 Level Penyajian: Perusahaan
 Tahun: 2000-2010
 Cakupan: Nasional

Untuk mengubah dataset menjadi bentuk tabel, semua data diblock terlebih dahulu lalu klik insert
table, setelah itu klik filter untuk memisahkan kelompok datanya. Dimensi dari dataset tersebut dapat
diketahui dengan melihat berapa kolom dan baris yang terisi, untuk memudahkan, bisa klik Ctrl+A agar
semua data terblock dan dapat diketahui baris akhirnya berapa.

III.2 Sampel Data

1
Kelompok Sampel 1: Jumlah Nilai Tiap Komoditas terhadap Tahun

Sampel ini menunjukkan jumlah nilai tiap komoditas per tahunnya.


Untuk mendapatkan sampel ini, dataset diblock terlebih dahulu lalu pilih menu
Insert setelah itu klik Pivot Table. Pilih fields pada pivot table seperti pada
gambar, yaitu Column (Series) diisi dengan komoditas, Row (Categories) diisi
dengan tahun, dan Values diisi dengan nilai. Untuk menampilkan grafik, klik
Pivot Table yang telah dibuat, lalu ke menu insert dan pilih Insert Chart. Hasilnya
akan didapat jumlah nilai ekspor tiap tahunnya.

Kelompok Sampel 2: Jumlah Komoditas tiap Perusahaan

Sampel ini menunjukkan jumlah komoditas tiap perusahaan. Untuk mendapatkan sampel ini,
dataset diblock terlebih dahulu lalu pilih menu Insert setelah itu klik Pivot Table. Pilih fields pada pivot
table seperti pada gambar, yaitu Column (Series) diisi dengan nama perusahaan dan Values diisi dengan
komoditas. Untuk menampilkan grafik, klik Pivot Table yang telah dibuat, lalu ke menu insert dan pilih
Insert Chart. Hasilnya akan didapat jumlah komoditas tiap perusahaan.

2
Kelompok Sampel 3: Jumlah Nilai tiap Komoditas

Sampel ini menunjukkan jumlah nilai tiap komoditas. Untuk


mendapatkan sampel ini, dataset diblock terlebih dahulu lalu pilih menu Insert
setelah itu klik Pivot Table. Pilih fields pada pivot table seperti pada gambar,
yaitu Rows diisi dengan komoditas dan Values diisi dengan nilai. Untuk
menampilkan grafik, klik Pivot Table yang telah dibuat, lalu ke menu insert
dan pilih Insert Chart. Hasilnya akan didapat jumlah nilai ekspor tiap
perusahaan.

III.3 Makna dan Karakteristik Atribut


Penjelasan mengenai Variabel pada Dataset ini:
o nama_perusahaan: Nama Perusahaan merupakan atribut nominal karena nilainya berupa simbol-
simbol atau nama-nama benda. Dan nilainya tidak memiliki urutan yang memiliki arti. Pada nominal
attribute, operasi matematika pada nilai-nilainya tidak berarti. Sehingga, tidak masuk akal untuk
mencari nilai mean (rata-rata) nya atau nilai median (tengah) nya, kecuali untuk mode (nilai yang
paling sering muncul) nya.
o komoditas: Komoditas merupakan atribut nominal karena nilainya berupa simbol-simbol atau nama-
nama benda.
o satuan: Satuan berkenaan dengan komoditas tersebut merupakan atribut nominal karena nilainya
berupa simbol-simbol atau nama-nama benda.
o tahun: Tahun merupakan atribut ordinal karena berupa nilai-nilai yang kemungkinan memiliki
urutan yang mempunyai arti atau tingkatan (ranking), akan tetapi jarak antara nilai-nilainya tidak
diketahui.
o nilai: Nilai Ekspor merupakan atribut numerik karena berupa atribut kuantitatif, yaitu dapat dihitung
banyaknya dan dapat diwakilkan dalam bilangan integer atau real. Numeric attribute dapat berupa
skala interval(interval-scaled) atau skala-rasio(ration-scaled), kedua-duanya memiliki nilai mean,
median, dan mode. Untuk numeric attribute interval-scaled tidak memiliki true zero-point(nilai nol
yang sebenarnya), sedangkan yang ratio-scaled memiliki true zero-point.

3
III.4 Statistik Atribut
1) Rata-rata, Ekstermum, dan Standar Deviasi

Rata-rata, Ekstermum, dan Standar Deviasi dari


data yang digunakan dapat dicari dengan menggunakan
fitur Data Analysis lalu pilih Descriptive Statistics.
Pada Input Range, masukkan kolom atau baris
yang ingin diolah datanya. Kemudian di Output Options,
pilih di mana informasi statistika deskriptif akan
ditampilkan. Centang bagian Summary Statistics supaya
semua informasi muncul, dan juga atur Confidence Level
for Mean di 99%. Setelah itu, klik OK.
Setelah itu, akan muncul hasil pengolahan data
deskriptif statistik yang berguna untuk mengetahui
pemusatan data, penyebaran data, juga kecenderungan
sekelompok data.

Mean (rata-rata) menunjukkan nilai rata-rata dari sebuah kelompok data. Nilai yang digunakan pada
proyek ini adalah nilai ekspor mineral dari Indonesia. Mean didapatkan dari jumlah semua anggota kelompok
data dibagi dengan jumlah anggota.
Ekstermum atau nilai maksimum dan minimum menunjukkan sampel dari data yang bernilai paling
besar juga bernilai paling kecil. Minimum adalah nilai paling rendah atau paling kecil diantara semua anggota
dalam sebuah kelompok data. Sedangkan Maksimum adalah nilai paling tinggi atau besar diantara semua
anggota dalam sebuah kelompok data. Dapat dilihat bahwa nilai ekspor minimumnya sebesar 4 dan
maksimumnya sebesar 6907459.
Standar Deviasi menunjukkan seberapa besar simpangan baku dari dataset. Pada dataset nilai ekspor
mineral dari Indonesia ini diperoleh simpangan bakunya sebesar 1075602,532.

2) Percentile

Rank and percentile adalah analisis yang membagi


data ke dalam 100 kelompok data. Untuk menampilkan data
ini, masuk ke Data Analysis dan pilih Rank and Percentile.
Masukkan data yang ingin dicari persentilnya. Lalu klik OK.
Dari dataset yang digunakan, diperoleh rank and
percentile dari nilai ekspor mineral dari Indonesia.

4
III.5 Korelasi dan Visualisasi
Pada dataset ini, yang akan dicari korelasinya dalah kelompok data tahun dengan nilai. Korelasinya
dicari dnegan menggunakan rumus =CORREL(array1,array2) dan diperoleh hasil sebesar -0,050123778.
Korelasi Negatif (-1), berdasarkan interpretasi yang sama dengan korelasi positif (+1) nilai yang diperoleh
menujukkan bahwa hubungan korelasinya sangat lemah. Lalu untuk menampilkan grafiknya, pilih kolom
yang berisi tahun dan nilai, lalu ke menu Insert dan pilih Insert Scatter pada bagian Chart.

III.6 Data Kotor


Pada dataset tersebut terdapat beberapa data kosong di kolom nilai. Jumlahnya ada 206 data kosong
sedangkan data yang terisi ada 234. Data kosong dapat dicek dengan menggunakan Filter, lalu kilk panah
di kolom nilai dan pilih blank. Salin data yang kosong agar bisa ditentukan jumlahnya. Persen dari data
yang kosong sebesar 46.81% dari keseluruhan. Persennya ini didapat dengan cara menghitung data
kosong/data total x 100 %.
Alasan kami memilih untuk membiarkan adanya data kosong tersebut adalah karena dataset tersebut
merupakan dokumen dari Kementerian ESDM, kami memposisikan diri sebagai analis yang menerima
data apa adanya. Jika dataset tersebut dirubah, sama saja dengan memanipulasi data nilai ekspor pada
tahun yang bersangkutan dan menunjukkan informasi yang salah pada publik.