Anda di halaman 1dari 23

LAPORAN PRAKTIKUM

PERTEMUAN IV
ANALISIS DATA EKSPLORATIF

Oleh

Nama : Okta Saputra

NPM : F1F019023

Dosen Pengampu : Dyah Setyo Rini, S.Si., M.Sc.

Asisten Praktikum : 1. Diyah Astuti (F1F018008)

2. Dyah Yunita Hartanti (F1F018012)

3. Ahmad Rakha Hidayat (F1F018013)

4. Alin Febianti Fikri (F1F018019)

LABORATORIUM MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BENGKULU
2022
KATA PENGANTAR

Puji dan syukur penulis panjatkan ke hadirat Allah SWT atas segala rahmat

dan karunia-Nya yang telah diberikan sehingga penyusun bisa menyelesaikan

laporan praktikum Analisis Data Eksploratif ini dengan baik dan lancar. Penulis

juga ingin mengucapkan terima kasih kepada dosen dan asisten praktikum dalam

penulisan laporan ini.

Pada kesempatan ini Penulis juga mengucapkan terima kasih kepada yang

terhormat:

1. Dyah Setyo Rini, S.Si., M.Sc. selaku Dosen Pengampu

2. Diyah Astuti selaku Asisten Praktikum

3. Dyah Yunita Hartanti selaku Asisten Praktikum

4. Ahmad Rakha Hidayat selaku Asisten Praktikum

5. Alin Febianti Fikri selaku Asisten Praktikum

6. Terakhir, pada keluarga dan teman-teman yang senantiasa memberikan

dukungan kepada penulis.

Penulis menyadari bahwa penulisan laporan ini masih banyak kekurangan,

baik dari segi susunan kata, kalimat maupun tatanan bahasa. Oleh karena itu,

penulis mengharapkan kritik dan saran dari semua pihak untuk laporan ini. Akhir

kata penulis berharap agar laporan ini memberikan banyak manfaat dan

pembelajaran untuk pembaca.

Bengkulu, 10 Nopember 2022

Penulis

ii
DAFTAR ISI

HALAMAN JUDUL...............................................................................................i
KATA PENGANTAR...........................................................................................ii
DAFTAR ISI.........................................................................................................iii
DAFTAR GAMBAR.............................................................................................iv
BAB I PENDAHULUAN.......................................................................................1
1.1 Latar Belakang...........................................................................................1
1.2 Rumusan Masalah.....................................................................................2
1.3 Tujuan Penelitian.......................................................................................2
1.4 Batasan Masalah........................................................................................3
1.5 Manfaat Penelitian.....................................................................................3
1.6 Sistematika Penulisan................................................................................3
BAB II TINJAUAN PUSTAKA...........................................................................5
2.1 Analisis Gerombol......................................................................................5
2.2 Metode Hirarki...........................................................................................6
2.3 Metode Non-Hirarki..................................................................................7
BAB III METODE PENELITIAN.......................................................................9
3.1 Jenis dan Sumber Data..............................................................................9
3.2 Variabel Penelitian.....................................................................................9
3.3 Analisis Data...............................................................................................9
3.4 Diagram Alur...........................................................................................11
BAB IV HASIL DAN PEMBAHASAN.............................................................12
4.1 Metode Hirarki........................................................................................12
4.2 Metode Non-Hirarki...............................................................................12
4.3 Analisis Gerombol Pada Data................................................................13
BAB V KESIMPULAN DAN SARAN...............................................................14
5.1 Kesimpulan...............................................................................................14
5.2 Saran.........................................................................................................15
DAFTAR PUSTAKA...........................................................................................16
LAMPIRAN

iii
DAFTAR GAMBAR

Gambar 1. Diagram alur analisis gerombol...........................................................11

iv
DAFTAR TABEL

Tabel 1. Metode hirarki aglomeratif........................................................................9

v
BAB I

PENDAHULUAN

1.1 Latar Belakang

R merupakan salah satu bahasa dalam pemograman statistika. R termasuk

kelompok software yang open source yang tidak memerlukan lisensi atau dengan

kata lain gratis (freeware). Paket R memiliki fasilitas yang sangat banyak untuk

analisis data statistik. Mulai dari metode yang klasik sampai dengan yang modern.

Salah satu kelebihan yang dimiliki R yaitu, efektif dalam pengelolaan data dan

fasilitas penyimpanan dan ukuran file yang disimpan jauh lebih kecil dibanding

software lainnya.

Masalah penggerombolan seringkali ditemui di kehidupan sehari-hari, baik

itu terkait dengan bidang sosial, bidang kesehatan, bidang marketing maupun

bidang akademik. Mendeskripsikan dan memaparkan keunikan proses atau hasil

pengelompokan merupakan hal yang menarik dan dapat memberikan ide-ide

tertentu. Misalnya saja dalam membuat segmentasi pemasaran, dengan analisis

gerombol dapat dikelompokkan pelanggan atau pembeli berdasarkan manfaat atau

keuntungan yang diperoleh dari pembelian barang. Hasil dari penggerombolan ini

selanjutnya dapat digunakan dalam pengambilan keputusan untuk strategi

pemasaran selanjutnya. Namun jika pengelompokan ini tidak sesuai atau tidak

representatif dengan apa yang diharapkan, apalagi menyangkut pengambilan

keputusan yang cukup penting akibatnya akan cukup fatal, oleh karena itu perlu

dilakukan review pada proses penggerombolan.

Penggerombolan adalah proses mengelompokkan objek ke dalam kelompok-

kelompok yang memiliki kemiripan. Saat ini metode penggerombolan yang

1
digunakan secara luas adalah metode penggerombolan berhirarki dan tak

berhirarki. Kedua metode ini digunakan untuk data yang berskala interval, rasio

atau ordinal. Sedangkan metode k-rataan (k-means) mensyaratkan peubah dasar

penggerombolannya berskala interval. Permasalahan utama dalam menerapkan

analisis gerombol adalah jika peubah dasar penggerombolan bersifat kategorik

maupun campuran kategorik dan numerik, contohnya segmentasi desa pada survei

potensi desa, segmentasi pelanggan pada riset-riset pemasaran, dan lain-lain.

Permasalahan kedua, pada analisis gerombol berhirarki dan k-rataan penentuan

banyaknya gerombol ditentukan oleh peneliti serta tidak ada uji statistik untuk

mengetahui banyaknya gerombol yang pantas (fit) dengan data yang dianalisis,

sehingga hasil penggerombolan tergantung dari pengetahuan, pengalaman serta

subjektifitas peneliti.

1.2 Rumusan Masalah

Bedasarkan latar belakang diatas, rumusan masalah yang dapat disimpulkan

adalah sebagai berikut:

1. Bagaimana cara melakukan analisis gerombol (cluster) ?

2. Bagaimana cara menginterpretasikan hasil analisis gerombol (cluster) ?

1.3 Tujuan Penelitian

Berdasarkan rumusan masalah di atas, tujuan dari praktikum ini adalah

sebagai berikut:

1. Mahasiswa dapat melakukan analisis gerombol (cluster).

2. Mahasiswa dapat menginterpretasikan hasil analisis gerombol (cluster).

2
1.4 Batasan Masalah

Penelitian ini dilakukan untuk membuat analisis gerombol, sehingga peneliti

menetapakan beberapa batasan masalah pada penelitian ini yaitu lakukanlah

analisis gerombol untuk mengelompokkan atau membedakan karakteristik

mahasiswa praktikan ADE tahun 2022. Komponen data yang dibutuhkan adalah

berat badan, tinggi badan,dan ukuran sepatu.

a. Gunakan metode hirarki cluster (salah satu saja) kemudia interpretasikan

hasil!

b. Gunakan metode K-Means cluster kemudian interpretasikan hasil!

1.5 Manfaat Penelitian

Penelitian yang dilakukan bertujuan untuk mendapatkan kebermanfaatan.

Penelitian ini diharapkan dapat menjadi tuntunan dan ilmu pengetahuan baru bagi

praktisi maupun akademisi antara lain sebagai berikut :

1. Bagi peneliti Penelitian ini diharapkan dapat memajukan referensi ilmu

pengetahuan untuk peneliti lain khususnya berkaitan dengan analisis

gerombol.

2. Bagi mahasiswa Penelitian ini dapat menambah referensi mengenai analisis

gerombol.

3. Bagi masyarakat Penelitian ini dapat menjadi sumber atau bahan referensi

untuk analisis gerombol.

1.6 Sistematika Penulisan

Untuk mempermudah dalam memahami penelitian ini akan dikemukakan

lima bab dan setiap bab terdiri dari beberapa subbab. Adapun isi dari bab tersebut

adalah sebagai berikut :

3
BAB I PENDAHULUAN

Bab ini merupakan bab yang memuat latar belakang penelitian,

tujuan dan manfaat dari penelitian, batasan masalah penelitian dan

sistematika penulisan.

BAB II TINJAUAN PUSTAKA

Bab ini merupakan bab yang memuat pengertian dan teori yang

diperlukan untuk rancangan penelitian pada bab-bab berikutnya.

BAB III METODE PENELITIAN

Bab ini merupakan bab yang memuat uraian mengenai jenis

penelitian, variabel penelitian, informasi mengenai sumber data,

dan analisis data.

BAB IV HASIL DAN PEMBAHASAN

Bab ini merupakan bab yang memuat hasil analisis dan

pembahasan dari hasil yang telah diperoleh dan interpretasi.

BAB V KESIMPULAN DAN SARAN

Bab ini merupakan bab yang memuat rangkuman dari hasil secara

keseluruhan dan saran yang diberikan oleh penulis terhadap hasil

maupun analisis yang telah dilakukan.

DAFTAR PUSTAKA

4
BAB II

TINJAUAN PUSTAKA

2.1 Analisis Gerombol

Analisis gerombol (cluster) merupakan teknik peubah ganda (multivariate)

yang tujuan utamanya untuk mengelompokkan objek-objek berdasarkan

kemiripan karakteristik yang dimilikinya. Karakteristik objek dalam suatu

gerombol memiliki kemiripan yang tinggi, sedangkan karakteristik antar objek

pada suatu gerombol dengan objek pada gerombol lainnya memiliki tingkat

kemiripan yang rendah. Asumsi yang harus dipenuhi, yaitu sampel yang diambil

harus benar-benar bisa mewakili populasi, sebaiknya tidak ada multikolinieritas

yaitu korelasi antar obyek, bila ada maka besar multikolinieritas tidaklah tinggi

yaitu kurang dari 0.5 (Agwil, 2022)

Ukuran ketakmiripkan anatara dua objek a dan b dinotasikan d (a ,b) :

a. d ( a ,b)≥ 0

b. d ( a , a ) =0

c. d ( a , b ) =d (b , a)

d. d ( a ,b) meningkat seiring semakin tidak mirip kedua objek a dan b .

e. d ( a , b ) ≤ d ( a ,b )+ d (b , c)

Asumsi: semua pengukuran bersifat numerik.

Manfaat penggerombolan antara lain adalah untuk eksplorasi data, reduksi

data, dan pelapisan data. Dengan eksplorasi data dapat diperoleh informasi yang

ada dalam himpunan data, dengan reduksi data dimungkinkan mengambil suatu

ringkasan gerombol yang dapat mewakili seluruh anggota tersebut.

5
Penggerombolan dapat digunakan sebagai pelapisan data dalam penarikan

contoh atau penggolongan tipe objek. Dalam penggerombolan objek, untuk

menggabungkan dua atau lebih objek menjadi suatu gerombol, biasanya

digunakan suatu ukuran kemiripan atau ketidakmiripan. Semakin mirip dua objek

semakin tinggi peluang untuk dikelompokkan dalam suatu gerombol. Sebaliknya

semakin tidak mirip semakin rendah pula peluang untuk dikelompokkan dalam

satu gerombol (Lathifaturrahmah, 2014).

2.2 Metode Hirarki

Ada dua cara mendapatkan gerombolan dengan menggunakan metode

gerombolan hirarki yaitu dengan cara penggabungan (agglomerative) dan

pemisahan gerombol (divisive). Metode hirarki dengan cara penggabungan

didapat dengan menggabungkan pengamatan atau gerombol secara bertahap,

sehingga pada akhirnya didapat hanya satu gerombol gerombol saja. Sebaliknya,

cara pemisahan pada metode hirarki dimulai dengan membentuk satu gerombol

besar beranggotakan seluruh pengamatan. Gerombol besar tersebut kemudian

dipisah menjadi gerombol yang lebih kecil, sampai satu gerombol hanya

beranggotakan satu pengamatan saja. Metode Aglomeratif terdiri dari:

Tabel 1. Metode hirarki aglomeratif


Single Linkage Minuman dari semua jarak antara
objek pada gerombol satu dengan
gerombol lain.
Complete Linkage Maksimum dari semua jarak antara
objek pada gerombol satu dengan
gerombol lain
Average Linkage Rata-rata dari semua jarak antara
objek pada gerombol satu dengan
gerombol lain

6
Centroid Jarak antar centroid

2.3 Metode Non-Hirarki

Pada metode ini terlebih dahulu harus ditentukan jumlah cluster yang

diinginkan dan centroid tiap cluster. Kemudian dihitung jarak untuk setiap objek

ke centroid, lalu masukkan objek ke dalam cluster yang memiliki jarak terdekat

dengan centroid cluster yang berpadanan. Hitung kembali tiap centroid yang

terbentuk, ulangi step sampai tidak terdapat objek yang berpindah antar cluster.

Metode ini biasanya dinamakan dengan k-mean (Agwil, 2019).

Metode penggerombolan yang dilakukan dengan dua tahapan diantaranya

adalah (Sumertajaya, 2007):

1. Analisis gerombol Hibrid (Hybrid Clustering)

Metode Hibrid merupakan penggabungan dari metode gerombol berhirarki

dengan tak berhirarki. Tahap pertama yaitu menggerombolkan objek-objek ke

dalam k gerombol menggunakan metode K-means. Kedua, menggerombolkan

gerombol yang diperoleh pada tahapan pertama dengan menggunakan metode

pautan tunggal (single-linkage) sebagai ukuran jarak antar gerombol, dan jarak

Euclidean sebagai ukuran jarak antar objeknya. Metode ini dapat digunakan pada

data dengan jumlah amatan yang besar dan jumlah gerombol yang diinginkan

tidak diketahui. Pada metode ini, peubah yang digunakan bertipe numerik.

2. BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies)

BIRCH merupakan salah satu penerapan dari metode gerombol berhirarki

untuk peubah yang berskala pengukuran interval dan rasio. Teknik yang

dilakukan pada tahap awal sama dengan yang dilakukan metode Two Step Cluster

pada tahap pertama, yaitu pembentukkan CF Tree. Tahapan selanjutnya adalah

7
pengambilan contoh secara acak dari data tersebut. Jarak antar gerombol yang

dapat digunakan pada metode ini adalah jarak Euclidean dan jarak Manhattan.

3. Analisis gerombol dua langkah (Two Step Cluster Analysis)

Metode ini dapat mengatasi masalah skala pengukuran yang tidak sama,

dalam hal ini bertipe kontinu dan kategorik, serta memiliki jumlah objek amatan

relatif besar. Metode ini masih memiliki kelemahan yaitu sensitif terhadap data

yang berupa urutan atau tingkatan, sehingga masih tidak mampu dalam

menangani data ordinal. Apabila terdapat peubah yang bertipe ordinal, maka

sebelum dianalisis peubah tersebut harus ditransformasi terlebih dahulu. Jarak

antara dua gerombol didefinisikan sebagai jarak antar pusat dari masing-masing

gerombol tersebut. Pusat dari suatu gerombol adalah vektor dari rataan masing-

masing peubahnya. Jarak yang digunakan dalam metode Two Step Cluster adalah

jarak Log-Likelihood dan jarak Euclidean.

8
BAB III

METODE PENELITIAN

3.1 Jenis dan Sumber Data

Dalam penelitian ini peneliti menggunakan data primer yang mana data

diperoleh langsung dari lapangan yang bersumber dari dengan kuesioner yang di

isi oleh praktikan Analisis Data Eksploratif (ADE) tahun 2022.

3.2 Variabel Penelitian

Dalam penelitian kali ini peneliti menggunakan data primer yang bersumber

dari kuesioner praktikan ADE tahun 2022. Data ini memiliki 2 variabel

character yaitu variabel nama dan NPM serta 3 variabel numerik yaitu Berat

Badan, Tinggi Badan, dan Ukuran Sepatu.

3.3 Analisis Data

Dalam penelitian kali ini peneliti melakukan analisis gerombol. Berikut

merupakan algoritma dari analisis gerombol:

a. Algoritma Metode Hirarki

1. Tentukan data yang akan di uji.

2. Hitunglah korelasi antar objek.

3. Hitunglah jarak antar objek.

4. Lakukan peng-clusteran dengan metode pemusatan atau pemisahan.

5. Buatlah interpretasi dari hasil.

b. Algoritma Metode Non-Hirarki

1. Tentukan data yang akan di uji.

2. Tentukan jumlah cluster.

3. Hitunglah korelasi antar objek.

9
4. Hitunglah jarak antar objek.

5. Lakukan peng-clusteran.

6. Buatlah interpretasi dari hasil.

10
3.4 Diagram Alur
Mulai

Tentukan data yang


akan di uji

Non- Tentukan metode hirarki atau non-hirarki


yang akan digunakan?

Hirarki
Tentukan
Hitung korelasi antar objek
jumlah cluster

Hitung jarak antar objek

Lakukan peng-clusteran

Buatlah interpretasi

Selesai

Gambar 1.

11
BAB IV

HASIL DAN PEMBAHASAN

4.1 Metode Hirarki

Ada dua cara mendapatkan gerombolan dengan menggunakan metode

gerombolan hirarki yaitu dengan cara penggabungan (aglomerative) dan

pemisahan gerombol (devisive). Metode hirarki dengan cara penggabungan

didapat dengan menggabungkan pengamatan atau gerombol secara bertahap,

sehingga pada akhirnya didapat hanya satu gerombol gerombol saja. Sebaliknya,

cara pemisahan pada metode hirarki dimulai dengan membentuk satu gerombol

besar beranggotakan seluruh pengamatan. Gerombol besar tersebut kemudian

dipisah menjadi gerombol yang lebih kecil, sampai satu gerombol hanya

beranggotakan satu pengamatan saja. Batasan masalah pada teladan bagian (a)

peneliti menggunakan metode hirarki yaitu single linkage dan untuk hasil dari

perhitungan korelasi antar objek, jarak antar objek dan pembentukan cluster

peneliti tampilkan pada bagian lampiran.

4.2 Metode Non-Hirarki

Pada metode ini peneliti menerapkan pada batasan masalah teladan bagian (b)

yang mana terlebih dahulu harus ditentukan jumlah cluster yang diinginkan dan

centroid tiap cluster dimana peneliti menggunakan sebanyak 3 cluster. Kemudian

dihitung jarak untuk setiap objek ke centroid, lalu masukkan objek ke dalam

cluster yang memiliki jarak terdekat dengan centroid cluster yang berpadanan.

Hitung kembali tiap centroid yang terbentuk, ulangi step sampai tidak terdapat

objek yang berpindah antar cluster. Metode ini biasanya dinamakan dengan k-

mean

12
4.3 Analisis Gerombol Pada Data

Pada batasan masalah penelitit melakukakan analisis gerombol dengan

menggunakan metode hirarki dan metode non-hirarki (k-means) dimana data yang

digunakan yaitu data berat badan, tinggi badan, dan ukuran sepatu dari mahasiswa

statistika UNIB yang mengikuti kelas analisis dasar eksploratif tahun 2022. Hasil

metode hirarki dapat dilihat dari hasil dendogram seperti pada lampiran, diketahui

bahwa terdapat 3 klaster dimana klaster 1 terdapat 21 mahasiswa, pada klaster 2

hanya terdapat 1 mahasiswa, dan pada klaster 3 terdapat 5 mahasiswa. Untuk

metode non hirarki peneliti menetapakn 3 klaster yaitu klaster 1 warna merah

dengan anggota 6 orang, klaster 2 warna hijau ada 15 orang, dan klaster 3 warna

biru ada 6 orang.

13
BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Penggerombolan adalah proses mengelompokkan objek ke dalam kelompok-

kelompok yang memiliki kemiripan. Saat ini metode penggerombolan yang

digunakan secara luas adalah metode penggerombolan berhirarki dan tak

berhirarki. Kedua metode ini digunakan untuk data yang berskala interval, rasio

atau ordinal. Sedangkan metode k-rataan (k-means) mensyaratkan peubah dasar

penggerombolannya berskala interval.

Tahap interpretasi meliputi pengujian tiap cluster untuk menamai dan

menandai dengan suatu label yang secara akurat dapat menjelaskan kealamian

cluster. Proses ini dimulai dengan suatu ukuran yang sering digunakan yaitu

centroid cluster. Membuat profil dan interpretasi cluster tidak hanya untuk

memoeroleh suatu gambaran saja melainkan pertama, menyediakan suatu rata-rata

untuk menilai korespondensi pada cluster yang terbentuk, kedua, profil cluster

memberikan arahan bagi penilainan terhadap signifikansi praktis.

Pada batasan masalah penelitit melakukakan analisis gerombol dengan

menggunakan metode hirarki dan metode non-hirarki (k-means) dimana data yang

digunakan yaitu data berat badan, tinggi badan, dan ukuran sepatu dari mahasiswa

statistika UNIB yang mengikuti kelas analisis dasar eksploratif tahun 2022. Hasil

metode hirarki dapat dilihat dari hasil dendogram seperti pada lampiran, diketahui

bahwa terdapat 3 klaster dimana klaster 1 terdapat 21 mahasiswa, pada klaster 2

hanya terdapat 1 mahasiswa, dan pada klaster 3 terdapat 5 mahasiswa. Untuk

metode non hirarki peneliti menetapakn 3 klaster yaitu klaster 1 warna merah

14
dengan anggota 6 orang, klaster 2 warna hijau ada 15 orang, dan klaster 3 warna

biru ada 6 orang.

5.2 Saran

Bagi semua praktikan diharapkan untuk lebih aktif saat praktikum

berlangsung, agar bukan hanya asisten dosen saja yang aktif tapi praktikan

diharapkan lebih aktif bertanya maupun menjawab pertanyaan yang diajukan dan

berani bertanya bila ada yang kurang dimengerti.

15
DAFTAR PUSTAKA

Agwil, W. 2022. Modul Praktikum Analisis Data Eksploratif. Bengkulu: Lab.


FMIPA UNIB.
Lathifaturrahmah. 2014. Perbandingan Hasil Penggerombolan K-Means, Fuzzy
K-Means, dan Two Step Clustering. Diakses pada 09 Nopember 2022 .
https://media. neliti.com/media/publications/120953-ID-perbandingan-hasil-
penggerombolan-k-mean.pdf
Sumertajaya, I Made dan Erfiani. 2007. Analisis Gerombol Menggunakan Metode
Two Step Cluster. Diakses pada 09 Nopember 2022 https://journal.ipb.
ac.id/index.php/statistika/article/view/5513/ 9551

16
LAMPIRAN

Lampiran 1. Tabel metode hirarki aglomeratif


Single Linkage Minuman dari semua jarak antara
objek pada gerombol satu dengan
gerombol lain.
Complete Linkage Maksimum dari semua jarak antara
objek pada gerombol satu dengan
gerombol lain
Average Linkage Rata-rata dari semua jarak antara
objek pada gerombol satu dengan
gerombol lain
Centroid Jarak antar centroid

Lampiran 2. Sintaks utama teladan

Lampiran 3. Hasil perhitungan korelasi dan jarak antar objek teladan (a)
Lampiran 4. Plot klaster dendogram metode hirarki

Lampiran 4. Pengelompokan anggota metode hirarki

Lampiran 5. Hasil pengklasteran metode non-hirarki

Lampiran 6. Plot klaster metode non-hirarki

Anda mungkin juga menyukai