Anda di halaman 1dari 4

Rifai 20210801403

Agus Kharir Andriana 20180801295


Irvan Eksa Mahendra 20210801371

Quiz Pertemuan 2 – Data Mining

1. Sebutkan 6 tipe Data Atribut dan berikan 1 contoh! (Petunjuk: Sub Chapter 2.1)
- Nominal Attribute
- Binary Attribute
- Ordinal Attribute
- Numeric Attribute (Interval-Scaled dan Ratio-Scaled),
- Discrete versus Continuous Attributes
Contoh:
Data numerik adalah data di mana ia direpresentasikan dalam sebuah angka.
Karakteristik dari angka adalah ia merepresentasikan sifat kuantitatif dari data itu
sendiri. Maksud dari kuantitatif adalah jumlah, kadar, kapasitas yang bisa diukur
dengan jelas. Misalnya air dalam gelas bisa kita ukur volumenya. Berat beras dalam
karung beras bisa kita ukur beratnya, dan seterusnya.

2. Beri contoh (gambar) Data Set berupa Social network dan jelaskan bagaimana cara
membacanya! (Petunjuk: Slide 2 dan chapter 13)

Contoh (gambar) Data Set Social Network


Pada social network, individu atau orang digambarkan sebagai nodes atau titik,
sedangkan relasi yang terjadi antar individu disebut dengan edges atau links. Pada
dasarnya sebuah jaringan sosial adalah sebuah peta yang terdiri atas banyak orang
dimana di dalamnya terdapat relasi antar individunya. Berikut adalah contoh
pemetaan graf dari sebuah jaringan sosial.
Ada 2 macam cara untuk merepresentasikan informasi yang ada, yaitu dengan
menggunakan graf dan matriks. Dari sekian banyak jenis graf yang ada, network
analysis menggunakan suatu jenis graf yang berisi nodes atau titik untuk
merepresentasikan aktor dan edges atau garis untuk merepresentasikan hubungan
atau relasi, yang disebut “ socio-grams”.
3. Beri contoh (gambar) Data Set berupa Time-Series Data dan jelaskan bagaimana cara
membacanya! (Petunjuk: Slide 2 dan chapter 13)
Contoh (gambar) Data Set Time-Series

Time Series adalah serial dari kumpulan data yang teratur oleh urutan waktu.
Salah satu teknik yang paling penting untuk mendeskripsikan dan mendapatkan pola
data Time Series adalah untuk men-decompose data. Teknik ini akan membagi Time
Series data menjadi 4 bagian yaitu:
a) Base atau Level. Nilai dari data jika serial data tersebut merupakan garis lurus.
b)  Trend. Kemiringan meningkat atau menurun yang terlihat di Time Series. Di
dalam Trend juga terdapat komponen Cyclic yang berbeda dari Trend tetapi
sering digabungkan menjadi satu dengan Trend.
c) Seasonality. Pola unik yang terlihat di suatu interval waktu karena faktor
musiman. Hal ini bisa karena suatu bulan di setiap tahunnya, suatu hari di
setiap bulannya, atau bahkan suatu jam di dalam satu hari.
d) Residual atau Noise atau Error. Variasi dari data yang tidak dapat dijelaskan.

4. Jelaskan Teknik-Teknik yang dapat dilakukan untuk melakukan eksplorasi data secara
statistik (min 4)! (Petunjuk: Slide 2 dan subchapter 2.2)
- Boxplot merupakan ringkasan distribusi sampel yang disajikan secara grafis
yang bisa menggambarkan bentuk distribusi data (skewness), ukuran tendensi
sentral dan ukuran penyebaran (keragaman) data pengamatan.
- Histogram adalah tampilan grafis dari tabulasi frekuensi yang digambarkan
dengan grafis batangan sebagai manifestasi data binning. Tiap tampilan batang
menunjukkan proporsi frekuensi pada masing-masing deret kategori yang
berdampingan dengan interval yang tidak tumpang tindih.
- Quantile-quantile (q-q) plot merupakan sebuah plot probabilitas yang berguna
untuk mengecek secara visual apakah ditribusi sampel atau data mengikuti
Distribusi tertentu dalam kasus pada artikel ini dicek apakah Distribusi data
mengikuti Distribusi normal.
- Scatter plot adalah sebuah grafik yang biasa digunakan untuk melihat suatu
pola hubungan antara 2 variabel. Untuk bisa menggunakan scatter plot, skala
data yang digunakan haruslah skala interval dan rasio.

5. Bagaimana similaritas/disimilaritas data dapat diukur dengan Minkowski Distance,


berikan 1 contoh perhitungan untuk tiap metode (Euclidian, Manhattan, dan
Supremum)? (Petunjuk: Slide 2 dan subchapter 2.4.4)
- Euclidean Distance
Euclidean distance adalah perhitungan untuk mengukur jarak dua titik dalam
euclidean space yang mempelajari hubungan antara sudut dan jarak (Derisma,
Firdaus, & Yusya, 2016).
Dalam matematika euclidean distance digunakan untuk mengukur dua titik
dalam satu dimensi yang memberikan hasil seperti perhitungan Pythagoras
(Mustofa & Suasana, 2018).
𝑑 = √(𝑥1 − 𝑥2) 2 + (𝑦1 −𝑦2) 2 (1)
Keterangan : d = Jarak
𝑥1 = Koordinat latitude 1
𝑥2 = Koordinat latitude 2
𝑦1 = Koordinat Longitude 1
𝑦2 = Koordinat Longitude 2

- Manhattan Distance
Manhattan distance adalah metode perhitungan jarak pada ruang jarak dengan
menerapkan konsep selisih mutlak (Buaton, Sundari, & Maulita, 2016).
Berikut adalah persamaan manhattan distance:
(𝑥, 𝑦) = ∑|𝑥𝑖−𝑦𝑖 | 𝑛 𝑖=1
Keterangan :
d(x,y) = Jarak
x = koordinat lokasi 1
y = koordinat lokasi 2

- Supremum Distance
Penyelesaian:

Anda mungkin juga menyukai