T3 - Irvan Eksa Mahendra - 20210801371
T3 - Irvan Eksa Mahendra - 20210801371
1. Sebutkan 6 tipe Data Atribut dan berikan 1 contoh! (Petunjuk: Sub Chapter 2.1)
- Nominal Attribute
- Binary Attribute
- Ordinal Attribute
- Numeric Attribute (Interval-Scaled dan Ratio-Scaled),
- Discrete versus Continuous Attributes
Contoh:
Data numerik adalah data di mana ia direpresentasikan dalam sebuah angka.
Karakteristik dari angka adalah ia merepresentasikan sifat kuantitatif dari data itu
sendiri. Maksud dari kuantitatif adalah jumlah, kadar, kapasitas yang bisa diukur
dengan jelas. Misalnya air dalam gelas bisa kita ukur volumenya. Berat beras dalam
karung beras bisa kita ukur beratnya, dan seterusnya.
2. Beri contoh (gambar) Data Set berupa Social network dan jelaskan bagaimana cara
membacanya! (Petunjuk: Slide 2 dan chapter 13)
Time Series adalah serial dari kumpulan data yang teratur oleh urutan waktu.
Salah satu teknik yang paling penting untuk mendeskripsikan dan mendapatkan pola
data Time Series adalah untuk men-decompose data. Teknik ini akan membagi Time
Series data menjadi 4 bagian yaitu:
a) Base atau Level. Nilai dari data jika serial data tersebut merupakan garis lurus.
b) Trend. Kemiringan meningkat atau menurun yang terlihat di Time Series. Di
dalam Trend juga terdapat komponen Cyclic yang berbeda dari Trend tetapi
sering digabungkan menjadi satu dengan Trend.
c) Seasonality. Pola unik yang terlihat di suatu interval waktu karena faktor
musiman. Hal ini bisa karena suatu bulan di setiap tahunnya, suatu hari di
setiap bulannya, atau bahkan suatu jam di dalam satu hari.
d) Residual atau Noise atau Error. Variasi dari data yang tidak dapat dijelaskan.
4. Jelaskan Teknik-Teknik yang dapat dilakukan untuk melakukan eksplorasi data secara
statistik (min 4)! (Petunjuk: Slide 2 dan subchapter 2.2)
- Boxplot merupakan ringkasan distribusi sampel yang disajikan secara grafis
yang bisa menggambarkan bentuk distribusi data (skewness), ukuran tendensi
sentral dan ukuran penyebaran (keragaman) data pengamatan.
- Histogram adalah tampilan grafis dari tabulasi frekuensi yang digambarkan
dengan grafis batangan sebagai manifestasi data binning. Tiap tampilan batang
menunjukkan proporsi frekuensi pada masing-masing deret kategori yang
berdampingan dengan interval yang tidak tumpang tindih.
- Quantile-quantile (q-q) plot merupakan sebuah plot probabilitas yang berguna
untuk mengecek secara visual apakah ditribusi sampel atau data mengikuti
Distribusi tertentu dalam kasus pada artikel ini dicek apakah Distribusi data
mengikuti Distribusi normal.
- Scatter plot adalah sebuah grafik yang biasa digunakan untuk melihat suatu
pola hubungan antara 2 variabel. Untuk bisa menggunakan scatter plot, skala
data yang digunakan haruslah skala interval dan rasio.
- Manhattan Distance
Manhattan distance adalah metode perhitungan jarak pada ruang jarak dengan
menerapkan konsep selisih mutlak (Buaton, Sundari, & Maulita, 2016).
Berikut adalah persamaan manhattan distance:
(𝑥, 𝑦) = ∑|𝑥𝑖−𝑦𝑖 | 𝑛 𝑖=1
Keterangan :
d(x,y) = Jarak
x = koordinat lokasi 1
y = koordinat lokasi 2
- Supremum Distance
Penyelesaian: