Anda di halaman 1dari 12

Nama : Nur Varidah

NIM :1913020025

Kelas : A

1. Buatlah ringkasan dari materi indeks similaritas jarak dan clustering berdasarkan pemahaman
anda masing-masing!
Jawab :

Indeks similaritas merupakan indeks yang menunjukkan tingkat kesamaan struktur suatu
komunitas satu dengan yang lainnya (Brower et al., 1997).

Analisis cluster didefinisikan sebagai cara untuk membuat kelompok objek, atau cluster,
sedemikian rupa sehingga objek dalam satu cluster sangat mirip dan objek dalam cluster yang
berbeda cukup berbeda. Pengelompokan data (atau hanya pengelompokan), juga disebut analisis
klaster, analisis segmentasi, analisis taksonomi, atau klasifikasi tak terawasi, adalah metode
untuk membuat kelompok objek, atau klaster, sedemikian rupa sehingga objek dalam satu klaster
sangat mirip dan objek di cluster yang berbeda sangat berbeda.

2. Buatlah analisis clustering dari data berikut beserta penjelasannya!


Tabel kualitas air selama penelitian (Fisika) di bulan April
SATUAN
ST- ST- ST- ST- ST- ST- ST- ST- ST- ST-
PARAMETER SATUAN 01 02 03 04 05 06 07 08 09 10
112, 113,
Kecerahan cm 100 155 122 155 5 130 145 5 129 153
Suhu ֯°C
֯ 31,8 31,3 31,6 32 31,3 31,5 30,6 30,8 30,9 31,8
Kekeruhan NTU 3,4 1,36 4,04 43,6 12,3 5,35 3,59 3,3 3,52 2,41
TTS mg/L 33 25 82 112 88 79 63 46 49 46

Clustering dalam bentuk dendrogram aka ditampilkan (menggunakan indeks similaritas


euclidean)
Similaritas

2 3 4 5
322,163 394,211 239,099
2 0 8 1 4
322,163 82,1043 127,524
3 8 0 6 4
394,211 82,1043 180,741
4 1 6 0 5
239,099 127,524 180,741
5 4 4 5 0

3. Tentukan indeks similaritas dari data berikut dengan menggunakan indeks similaritas
bray-curtis!
Tabel jenis ikan yang di peroleh dari stasiun penelitian sungai Alas
No ordo famili spesies stasiun
1 2 3 4
Cypriniforme 1. Mystacoleucus
1 1. Cyprinidae + + - -
s marginatus
2. Cichlidae 2. Tor tambroides + + + +
3. Oreochromis
2 Perciformes 3. Channidae - - + +
mossambicus
4. Claridae 4. Ophiocephalus striatus + - + +
5.
3 Siluriformes 5. Clarias batrachus + + + -
Loricariidae
6. Bagridae 6. Lyposarcus pardalis + + + -
7. Mystus nemurus + - + -
Jumlah 6 4 6 3

2 3 4 5 6 7 8 9
24,4399 51,7108 56,3741 2335,48 70,8813 469,667 804,499
2 0 26 66 34 63 07 33 57
24,4399 75,1916 79,6651 2314,44 94,2405 449,984 781,293
3 26 0 46 43 75 84 62 79
51,7108 75,1916 4,98979 2376,49 19,2602 518,657 850,081
4 66 46 0 96 88 96 04 62
56,3741 79,6651 4,98979 2379,41 14,7954 523,312 853,715
5 34 43 96 0 1 62 28 6
6 2335,48 2314,44 2376,49 2379,41 0 2391,77 2037,45 1771,27
63 75 88 1 83 03 5
70,8813 94,2405 19,2602 14,7954 2391,77 537,427 866,488
7 07 84 96 62 83 0 61 62
469,667 449,984 518,657 523,312 2037,45 537,427 605,192
8 33 62 04 28 03 61 0 96
804,499 781,293 850,081 853,715 1771,27 866,488 605,192
9 57 79 62 6 5 62 96 0

4. Buatlah analisis clustering dari data berikut beserta penjalasannya!


Tabel Data Parameter fisika dan Kimia di Waduk Cengklik, Boyolali
No Parameter Stasiun 1 Stasiun 2 Stasiun 3 Stasiun 4 Stasiun 5 Stasiun 6
1 Suhu (°C) 25 32 30,7 28,3 29,3 28,7
2 kerjernihan (cm) 33 43 34 37 41,5 42
3 pH 7,93 7,97 8,49 8,12 7,45 8,03
4 DO (ppm) 6,53 5,13 5,65 5,87 6,33 7,33
5 Nitrat (NO3) 978,41 440,67 190,92 521,75 1941,88 700,54
(ppm)
6 Phospat (ppm) 0,07 0,27 0,11 0,07 0,1 0,23
7 Kalsium (ppm) 236,9 156,63 297,01 260,02 168,78 155,52
8 Magnesium (ppm) 143,91 523,33 106,31 157,96 444,33 472,43
2 3 4 5 6 7 8 9
2 0 24,4399 51,7108 56,3741 2335,48 70,8813 469,667 804,499
26 66 34 63 07 33 57
3 24,4399 0 75,1916 79,6651 2314,44 94,2405 449,984 781,293
26 46 43 75 84 62 79
4 51,7108 75,1916 0 4,98979 2376,49 19,2602 518,657 850,081
66 46 96 88 96 04 62
5 56,3741 79,6651 4,98979 0 2379,41 14,7954 523,312 853,715
34 43 96 1 62 28 6
6 2335,48 2314,44 2376,49 2379,41 0 2391,77 2037,45 1771,27
63 75 88 1 83 03 5
7 70,8813 94,2405 19,2602 14,7954 2391,77 0 537,427 866,488
07 84 96 62 83 61 62
8 469,667 449,984 518,657 523,312 2037,45 537,427 0 605,192
33 62 04 28 03 61 96
9 804,499 781,293 850,081 853,715 1771,27 866,488 605,192 0
57 79 62 6 5 62 96

5.Jelaskan pemahaman anda tentang syarat suatu clustering harus mampu untuk menangani noise
pada data!

Jawab :
Metoda Binning:

– Pertama urutkan data dan partisi kedalam (kedalaman

yang sama) bin-bin

– Kemudian noisy data itu bisa dihaluskan dengan rata-

rata bin, median bin, atau batas bin.

• Clustering

– Medeteksi dan membuang outliers

• Inspeksi kombinasi komputer dan manusia

– Mendeteksi nilai-nilai yang mencurigakan dan

memeriksa dengan manusia(misal, berurusan dengan

outlier yang mungkin)

• Regresi

– Menghaluskan dengan memasukkan data kedalam

fungsi regresi
Partisi lebar yang sama (jarak::

– Membagi range kedalam N interval dengan

ukuran yang sama: grid seragam

– Jika A dan B masing-masing adalah nilai

terendah dan tertinggi dari atribut, lebar

interval akan menjadi : W = (B –A:/N.

– Kebanyakan langsung, tetapi outlier

mendominasi presentasi

– Data Outlier dan menyimpang tidak ditangani

dengan baik.

Partisi kedalaman sama (frekuensi::

– Membagi range kedalam N interval, masing-masing

memuat jumlah sampel yang hampir sama


– Penskalaan data yang baik

– Penanganan atribut yang bersifat kategori bisa

rumit.

6. Jelaskan pemahaman anda tentang syarat suatu clustering harus mampu untuk mengelompokan
data dimensi tinggi

Jawab :

Fitur seleksi(i.e., atribute subset selection::

– Memilih sekumpulan ftur minimum sedemikian hingga

distribusi peluang dari kelas berbeda bila nilai-nilai

ftur tersebut diberikan adalah sedekat mungkin dengan

distribusi asli bila nilai-nilai diberikan pada seluruh

ftur

– Mengurangi jumlah pola dalam pola, lebih mudah

dipahami
• Metoda heuristik(due to exponential # of choices::

– Seleksi step-wise forward

– Eliminasi step-wise backward

– Kombinasi seleksi forward dan eliminasi backward

– Induksi pohon keputusan

Anda mungkin juga menyukai