Anda di halaman 1dari 9

TUGAS BESAR

STATISTIKA

Makalah
Diajukan untuk memenuhi tugas pada mata kuliah Statistika

Disusun oleh :
Dio Aditya Putra Wardhono (1301194290)
Yusril Ramadhan (1301194075)
Rafly Ahmad Yanuar (1301194119)
Fahrul Raykhan Ridho (1301194399)

PROGRAM STUDI S1 INFORMATIKA


FAKULTAS INFORMATIKA
UNIVERSITAS TELKOM
BANDUNG
2020
BAB 1 PENDAHULUAN
1.1 Latar Belakang

Seiring dengan berkembangnya zaman big data merupakan suatu yang menjadi trend
dalam dunia informasi. Bisa dibilang big data merupakan kumpulan data yang sangat
besar yang di dalamnya mencakup berbagai jenis data. Big Data menjadi kata yang
popular seiring dengan bagaimana dapat menyimpan data dalam jumlah yang besar,
melakukan proses serta analisa. Sesuatu yang tidak dapat dihindari bagaimana impact dari
big data ini dalam kehidupan sehari-hari. Big Data telah memberikan kesempatan atau
peluang bisnis bagi banyak perusahaan. Hampir semua industri telah memanfaatkan atau
baru melakukan identifikasi tentang pentingnya big data dalam menumbuhkan bisnisnya
atau tetap dapat bersaing bahkan menjadi keunggulan dalam berkompetisi.
Dari sekian banyak manfaat dan peluang, big data dapat meninggalkan beberapa
tantangan diantaranya adalah tantangan teknologi yang dapat menghandle big data ini,
tantangan skill atau keahlian orang yang akan mengolah data sehingga data yang tersedia
dapat menjadi informasi, insight yang bermanfaat.terdapat berbagai cara merubah big
data ini menjadi sebuah informasi yang bermanfaat diantaranya dengan cara eksplorasi
data statistika ,deskripsi data statistika dan analisis data statistika

1.2 Rumusan Masalah


Berdasarkan latar belakang yang dikemukakan di atas maka rumusan permasalahan pada Tugas
Akhir ini adalah:
● Eksplorasi data apa saja yang dapat digunakan pada data suatu bank
● Deskripsi data apa saja yang dapat digunakan pada data suatu bank
● pengolahan dan analisis data ​apa saja yang dapat digunakan pada data suatu bank

1.3 Batasan Masalah


Berdasarkan rumusan masalah yang telah dikemukakan,Adapun Batasan makalah
sebagai berikut:
● Eksplorasi data pada data suatu bank
● Deskripsi data pada data suatu bank
● pengolahan dan analisis data ​pada data suatu bank

1.4 Tujuan
Berdasarkan rumusan masalah yang telah dikemukakan, maka tujuan pada Tugas Akhir ini adalah
sebagai berikut:
● Mengetahui jenis jenis eksplorasi data yang dapat digunakan pada data suatu bank
● Mengetahui jenis jenis Deskripsi data yang dapat digunakan pada data suatu bank
● Mengetahui jenis jenis ​pengolahan dan analisis data​ yang dapat digunakan pada data suatu
bank
BAB 2 PEMBAHASAN

2.1 Alat dan Bahan


Alat yang digunakan untuk penelitian kali ini adalah program r dan juga
google colab sedangkan bahan yang dibutuhkan adalah data bank

2.2 Hasil Penelitian

2.2.1 Scatterplot
Diagram Scatter atau diagram pencar atau juga disebut diagram sebar adalah gambaran
yang menunjukkan kemungkinan hubungan (korelasi) antara pasangan dua macam
variabel (data 2-D) dan menunjukkan keeratan hubungan antara dua variabel tersebut
yang sering diwujudkan sebagai koefisien korelasi. Pada data Bankchurners kami
mengambil data Total Trans Count dan Total Trans Amount untuk dicari kemungkinan
korelasinya.dengan hasil sebagai berikut dengan data yang menyebar.​Hubungan ada
kecendrungan korelasi positif apabila x naik dan y naik tapi mungkin ada faktor lain yang
mempengaruhi faktor lain yang berpengaruh.
2.2.2​Histogram

Pada bidang statistik, histogram adalah tampilan grafis dari tabulasi frekuensi
yang digambarkan dengan grafis batangan sebagai manifestasi data binning. Tiap
tampilan batang menunjukkan proporsi frekuensi pada masing-masing deret kategori
yang berdampingan dengan interval yang tidak tumpang tindih.
Menurut hasil ​dari percobaan kami bentuk histogram maka kita dapat melihat
bahwa Total_Trans_Ct memiliki titik tengah antara 60 - 80, kemudian kita dapat
melihat dengan lebih jelas bahwa Total_Trans_Ct memiliki kemiringan cenderung
positif dikarenakan ujung dari kemiringan menjulur ke arah positif (ekor kurva
sebelah kanan lebih panjang) dan ​kita dapat lihat dari bentuk histogram maka ​kita
dapat melihat bahwa Total_Trans_Amt memiliki titik tengah antara 4000 - 5000,
kemudian kita dapat melihat dengan lebih jelas bahwa Total_Trans_Amt memiliki
kemiringan cenderung positif dikarenakan ujung dari kemiringan menjulur ke arah
positif (ekor kurva sebelah kanan lebih panjang). Keruncingan dari Total_Trans_Amt
terlihat jelas relatif runcing dan penyebaran data dari histogram Total_Trans_Amt
sangat menyebar.
2.2.3 Boxplot
Boxplot adalah salah satu cara dalam statistik deskriptif untuk
menggambarkan secara grafik dari data numeris melalui lima ukuran
Dari hasil pengamatan kita, kita dapat melihat dari boxplot diatas 
terdapat 2 pencilan dari variabel Total_Trans_Ct dan kita lihat dari data 
boxplot terdapat banyak pencilan dari variabel Total_Trans_Amt.
2.2.4 ​ Korelasi
Korelasi​​Total_Trans_Ct, Total_Trans_Amt

Hasil pengamatan kami untuk nilai​ korelasi untuk atribut ​ ​Total_Trans_Ct,


Total_Trans_Amt​ ini bernilai ​0.807192034651435​, ​Kita ketahui dari hasil
korelasi antara variabel Total_Trans_Ct dan Total_Trans_Amt adalah memiiki
nilai korelasi yang positif kuat.
2.2.5 Diagram lingkaran

Hasil pengamatan kami untuk​ diagram lingkaran(chart) menggunakan atribut Card


category adalah sebagai berikut dimana ​dari data chart diatas dimana distribusi berdasarkan
kategori kartu dominan oleh kartu tipe biru dibandingkan tipe lainnya yaitu 93,2% dan yang
terkecil adalah kartu warna merah yaitu 0,2%.
2.2.6 Line Plot
Line/Linear plot merupakan representasi fungsi berupa garis lurus yang
menghubungkan antar posisi koordinat data. Menurut dari pengamatan kelompok kami ​dari
line plot mengenai pertumbuhan dari Total_Trans_Ct, dapat diketahui bahwa banyak data
yang bernilai antara 50 - 100 sedangkan data yang bernilai diatas 100 relatif sedikit dibanding
nilai lainnya.

Kemudian dari line plot mengenai pertumbuhan dari Total_Trans_Amt, dapat diketahui
bahwa banyak data yang bernilai antara 0 - 5000 sedangkan data yang bernilai diatas 5000
atau 10000 relatif sedikit dibanding nilai lainnya.
2.2.7 Variansi

v​arian dan standar deviasi (simpangan baku) adalah ukuran-ukuran keragaman


(variasi) data statistik yang paling sering digunakan.
Menurut dari hasil pengamatan kelompok kami mengenai variansi dari attribut
Total_Trans_Ct yaitu v​arians adalah ukuran seberapa jauh sebuah kumpulan data tersebar. Di
dalam Total_Trans_Ct kita mempunyai varians 550.961563494206, maka data ini
mempunyai varians yang tinggi yang menunjukkan data sangat tersebar di sekitar nilai rerata.
Kemudian menurut dari hasil pengamatan kelompok kami mengenai variansi dari attribut
Total_Trans_Ct yaitu​ ​di dalam Total_Trans_Amt kita mempunyai varians
11540487.1653733, maka data ini mempunyai varians yang tinggi yang menunjukkan data
sangat tersebar di sekitar nilai rerata​. 
 
3. Link Google Colab

https://colab.research.google.com/drive/1bROXkHWd6xteL79wNfPF7HxZMSU1Cg
Uz?usp=sharing

Anda mungkin juga menyukai