ID Analisis Cluster Terhadap Tingkat Pencem PDF
ID Analisis Cluster Terhadap Tingkat Pencem PDF
Intisari: Analisis cluster merupakan suatu tehnik yang dipergunakan untuk mengklasikasikan objek ke dalam kelom-
pok yang relatif homogen. Analisis cluster terbagi atas dua metode, hirarki dan non-hirarki. Penelitian ini dibahas
pengelompokkan 10 jenis industri yang ada di sumatera selatan berdasarkan jenis polutan yang dihasilkan dan menge-
tahui ciri-ciri dari setiap kelompok industri. Berdasarkan hasil analisis cluster metode hirarki, ada 3 kelompok industri
(cluster). Cluster pertama yaitu industri industri karet, industri sawit, industri pengalengan ikan, industri listrik, indus-
tri pertambangan, dan industri semen. Cluster kedua terdiri dari industri migas, industri minyak goreng, dan industri
makanan. Cluster ketiga yaitu industri pupuk. Pada metode non-hirarki, cluster pertama yaitu industri yang memi-
liki rata-rata polutan yang lebih besar dari pada cluster kedua, dapat digolongkan menjadi kelompok industri dengan
tingkat pencemaran tinggi. Anggotanya adalah industri migas, industri minyak goreng, industri makanan, dan industri
pupuk. Cluster kedua yaitu industri yang memiliki rata-rata polutan yang lebih kecil dari pada cluster pertama, dapat
digolongkan menjadi kelompok industri dengan tingkat pencemaran rendah. Anggotanya adalah industri karet, industri
sawit, industri pengalengan ikan, industri listrik, industri pertambangan, dan industri semen.
Kata kunci: analisis kluster, pencemaran, industri
Abstract: Cluster analysis is a technique used to classify objects into relatively homogeneous groups. Cluster analysis
is divided into two methods, hierarchical and non-hierarchical. This research covered 10 types of industrial clustering in
the southern Sumatran based on the type of pollutants generated and knowing the characteristics of each industry group.
Based on the results of hierarchical cluster analysis method, there are three industry groups (clusters). The rst cluster
of industrial rubber industry, oil industry, sh canning industry, power industry, mining industry and cement industry.
The second cluster consists of oil and gas industry, oil industry, and food industries. The third cluster is the fertilizer
industry. In non-hierarchical method, the rst clusters of industrial pollutants have on average larger than in the two
clusters, can be classied into groups of industries with high pollution levels. The members are oil and gas industry,
oil industry, food industry, and fertilizer industries. The second cluster of industrial pollutants have on average smaller
than the rst cluster, can be classied into groups of industries with low pollution levels. Its members are the rubber
industry, oil industry, sh canning industry, power industry, mining industry and cement industry
Keywords: cluster analysis, pollution, industry
Juli 2011
akan dilakukan. Analisis multivariat merupakan salah Analisis cluster termasuk dalam analisis statistik
satu metode statistika yang cocok untuk meringkas multivariat metode interdependen, dan oleh karena itu
data dengan peubah banyak. Salah satu analisis mul- tujuan analisis cluster tidak untuk menghubungkan
tivariat yang dapat digunakan untuk memahami dan ataupun membedakan dengan sampel/variabel lain.
mempermudah interpretasi data adalah analisis clus- Analisis cluster berguna untuk meringkas data de-
ter
[1] . ngan jalan mengelompokkan objek-objek berdasarkan
Analisis cluster bertujuan untuk mengelompokkan kesamaan karakteristik tertentu diantara objek-objek
objek-objek berdasarkan karakteristik diantara objek- yang akan diteliti. Analisis cluster terbagi atas 2 me-
objek itu, sehinggga dapat diketahui ciri khas dari tiap tode, yaitu:
kelompok. Banyak objek yang dapat dikelompokkan
dengan analisis cluster, diantaranya adalah produk 1. Metode hirarki
(barang dan jasa), benda, manusia (responden kon- 2. Metode non-hirarki
sumen) [2] .
Pada metode hirarki ini dimulai dengan mengelom-
2 TINJAUAN PUSTAKA pokkan dua atau lebih objek yang mempunyai ke-
samaaan yang paling dekat. Kemudian proses diterus-
2.1 Analisis Multivariat kan ke objek lain yang mempunyai kedekatan kedua.
Demikian seterusnya sampai cluster akan membentuk
Analisis multivariat merupakan analisis yang meneliti
semacam \pohon" hierarki (tingkatan) yang jelas an-
masalah yang bersifat multidimensional dan menggu-
tar objek dari yang paling mirip sampai yang paling
nakan tiga atau lebih variabel. Analisis multivariat
tidak mirip. Deondogram biasanya digunakan untuk
dibagi menjadi dua kategori utama, yakni:
membantu memperjelas proses hierarki tersebut.
1. Dependence Method. Pada metode non-hirarki, digunakan jarak Euclid-
Analisis ketergantungan digunakan apabila tu- ian, untuk menetapkan nilai kedekatan antara ob-
juan dari analisis adalah menjelaskan atau mem- jek. Bakal cluster pertama adalah observasi pertama
prediksi variabel terikat berdasarkan dua atau dalam set data. Bakal kedua adalah observasi lengkap
lebih variabel bebas. Metode ini terdiri atas em- berikutnya yang dipisahkan dari bakal pertama oleh
pat jenis yaitu: jarak minimum khusus.
Analisis cluster adalah suatu alat untuk menge-
Analisis Regresi Berganda lompokkan sejumlah n objek berdasarkan p variabel
(Multiple Regression Analysis ) yang secara relatif mempunyai kesamaan karakteris-
Analisis Diskriminan Berganda tik diantara objek-objek tersebut, sehingga keragaman
(Multiple Discriminant Analysis ) dalam suatu kelompok tersebut lebih kecil dibanding-
Analisis Multivariat Varians kan dengan keragaman antar kelompok. Objeknya da-
(Multivariate analysis of Variance ) pat berupa barang, jasa, hewan, manusia (responden,
konsumen, atau yang lain). Objek tersebut akan dikla-
Analisis Korelasi Kanonikal sikasikan dalam satu atau lebih cluster (kelompok)
(Canonical Correlations Analysis ) sehingga objek-objek yang berada dalam satu cluster
2. Metode Saling Ketergantungan (Interdependence akan mempunyai kemiripan atau kesamaan karakter.
Method ) Jika terdapat n objek dan p variabel, maka observasi
Metode yang digunakan untuk menjelaskan se- xij dengan i = 1; 2; : : : ; n dan j = 1; 2; : : : ; p dan dapat
perangkat variabel atau pengelompokan berda- digambarkan sebagai berikut:
sarkan variabel-variabel tertentu. Metode ini di Adapun ciri-ciri cluster (gerombol) adalah:
kelompokkan menjadi tiga yaitu; 1. Homogenitas (kesamaan) yang tinggi antar ang-
Analisis Faktor (Factor Analysis ) gota dalam satu cluster
Analisis Cluster (Cluster Analysis ) 2. Heterogenitas (perbedaan) yang tinggi antar clus-
Skala Multidimensional (Multidimensional ter yang satu dengan cluster yang lain
Scalling )
2.3 Tujuan Analisis Cluster
2.2 Analisis Cluster
Setelah mengelompokkan n buah objek pengamatan
Analisis cluster adalah analisis untuk mengelompok- kedalam m kelompok berdasarkan p variabel dapat
kan elemen yang mirip sebagai objek penelitian untuk diketahui bahwa tujuan utama dari penggerombolan
menjadi kelompok (cluster ) yang berbeda dan mutu- objek adalah untuk memperoleh kelompok objek yang
ally exclusive
[2] . memiliki nilai relatif sama. Sehingga nantinya dalam
14303-12
Sitepu dkk./Analisis Cluster terhadap. . . Jurnal Penelitian Sains 14 3(A) 14303
Xx
perhitungan jarak kuadrat sebagai berikut: untuk cluster yang baru terbentuk.
Mengulangi langkah 2 sampai tidak ada
dih = ( ij xij )2 lagi pemindahan objek antar cluster.
di mana: dih = jarak kuadrat Euclidian antar ob- 3. Setelah cluster terbentuk, yaitu dengan kedua
jek ke-i dengan objek ke-h p = jumlah variabel metode yang disebutkan, langkah selanjutnya
cluster xij = nilai dari objek ke-i pada variabel adalah melakukan interpretasi terhadap cluster
ke-j xhj = nilai dari objek ke-h pada variabel ke-j yang terbentuk.
14303-13
Sitepu dkk./Analisis Cluster terhadap. . . Jurnal Penelitian Sains 14 3(A) 14303
3. Menerapkan analisis cluster pada data penelitian 1. Bandingkan jarak Euclidian yang ada pada ta-
yaitu dengan: ble Proximity matriks, dimana menentukan jarak
yang terdekat antara dua objek dari sekian ba-
Membentuk matriks ketidakmiripan antar nyak kombinasi jarak dari kesepuluh objek yang
objek dengan menggunakan jarak Euclidian. ada.
Membuat cluster dengan dua metode, yaitu 2. Kemudian dilakukan perbaikan matriks jarak
metode hirarki dan non-hirarki.
menggunakan metode pautan tunggal dengan
a Metode hirarki dengan menggunakan me- persamaan: hfBr ; Bs g = min fd(xi ; xh ); xi ang-
tode pautan tunggal atau single linkage. gota Br ; xh anggotaBs g, sehingga diperoleh table
Menentukan jarak ketakmiripan antara se- matriks jarak yang baru.
buah objek dalam gerombol yang satu de-
ngan sebuah objek dalam gerombol yang 3. Kembali menentukan jarak terdekat antara dua
lain. Adapun ukuran ketidakmiripan objek pada tabel matriks jarak yang baru dan
yang digunakan adalah hfBr ; Bs g = min mengulangi langkah 2, sampai tersisa satu gerom-
fd(xi ; xh ); xi anggota Br ; xh anggota Bs g bol
b Metode non hirarki dengan menggunakan Pada awal proses ada sepuluh gerombol. Tahap per-
metode k-means. tama yang dilakukan adalah menentukan jarak yang
14303-14
Sitepu dkk./Analisis Cluster terhadap. . . Jurnal Penelitian Sains 14 3(A) 14303
Tabel 2: Tabel Beban Pencemaran Udara Pada Sektor Industri di Sumatera Selatan
No Jenis Industri NO2 SO2 CO TSP NH3
1 Karet 630.545 1140.640 8620.366 948.708 2.102
2 Sawit 696.770 1841.352 1177.563 610.747 129.210
3 Pengalengan ikan 398.580 360.824 4380.000 206.999 0.876
4 Migas 1003.108 1672.109 16175.603 824.930 0.00
5 Listrik 370.110 405.150 5689.620 428.714 0.00
6 Minyak goreng 974.200 1641.624 17041.529 530.944 1.972
7 Makanan 956.855 1511.012 16950.600 1123.470 2.278
8 Pupuk 1097.453 2157.413 22250.400 1071.790 1.752
9 Pertambangan 605.841 449.563 4174.140 476.325 0.262
10 Semen 777.45 1727.910 9592.200 1151.414 0.00
terdekat antara dua objek dari sekian banyak kombi- 407,120 sehingga kedua industri tersebut menjadi satu
nasi jarak dari kesepuluh objek yang ada. Jarak an- kelompok. Sekarang tersisa sembilan gerombol.
tara industri pengalengan ikan dengan industri tam- Kemudian dilakukan perbaikan matriks jarak meng-
bang merupakan jarak yang terdekat yaitu sebesar gunakan metode pautan tunggal dengan persamaan:
sehingga terjadi perubahan jarak yang melibatkan hf(3; 9); (8)g = min fd(3; 8); d(9; 8)g
gerombol baru (gerombol yang anggotanya industri = min 17:994; 866; 18:173; 172
pengalengan ikan dan tambang) sehingga diperoleh:
= 17:994; 866
hf(3; 9); (1)g = min fd(3; 1); d(9; 1)g
= min 4:830; 954; 4:524; 409 hf(3; 9); (10)g = min fd(3; 10); d(9; 10)g
= 4:524; 409 = min 5:483; 741; 5:610; 235
= 5:483; 741
hf(3; 9); (2)g = min fd(3; 2); d(9; 2)g
= min 3:565; 945; 3:310; 516
= 3:310; 516 Kemudian lakukan lagi penentuan jarak terdekat
pada objek berdasarkan tabel matriks jarak yang baru.
hf(3; 9); (4)g = min fd(3; 4); d(9; 4)g
= min 11:899; 706; 12:075; 143 4.3 Proses Penggerombolan secara
= 11:899; 706 non-hirarki
hf(3; 9); (5)g = min fd(3; 5); d(9; 5)g 1. Tahap pertama, menentukan besarnya k.
= min 1:329; 3; 1:535; 086 2. Tahap kedua, menghitung jarak setiap objek de-
= 1:329; 300 ngan tiap centroid (rata-rata) dengan rumus jarak
kuadrat seperti ya disebutkan diatas, lalu diban-
hf(3; 9); (6)g = min fd(3; 6); d(9; 6)g dingkan untuk mengetahui kelompok objek.
= min 12:743; 275; 12:927; 853 3. Tahap ketiga, menghitung kembali centroid yang
= 12:743; 275 baru yang merupakan rataan kelima variabel dari
tiap cluster.
hf(3; 9); (7)g = min fd(3; 7); d(9; 7)g 4. Tahap keempat, mengulangi tahap kedua dan
= min 12:668; 643; 12:841; 597 ketiga. Jika tidak ada lagi perubahan hasil peng-
= 12:668; 643 cluster-an, maka proses terhenti
14303-15
Sitepu dkk./Analisis Cluster terhadap. . . Jurnal Penelitian Sains 14 3(A) 14303
Dari kesepuluh jenis Industri kita bandingkan cen- Tabel 5: Tabel Jarak Setiap Objek dari Sentroid Kedua
troid yang terbesar dan terkecilnya. Adapun centroid
terbesar (c1 ) adalah rata-rata polutan pada indus- Industri c2
tri pupuk dengan nilai c1 = (1.097,453; 2.157,413; Karet 56,02 106
22.250,400; 1.071,790; 1,752) dan centroid terkecil Sawit 0
(c2 ) adalah nilai rata-rata polutan pada industri sawit Pengalengan ikan 15,8 106
dengan nilai c2 = (696,770; 1.841,352; 1.177,563; Migas 225,13106
610,747; 129,210).
Listrik 22,6 106
Lalu penghitungan jarak setiap objek dari centroid
(pusat cluster) pertama dengan menggunakan kuadrat Minyak goreng 251,8 106
jarak Euclidian. Gunakan rumus jarak kuadrat, se- Makanan 249,24106
hingga diperoleh Tabel jarak setiap objek dari sentroid Pupuk 444,54106
Pertama dan kedua sebagai berikut: Pertambangan 10,96 106
Semen 71,13 106
Tabel 4: Jarak Setiap Objek dari Sentroid Pertama
Industri c1 H0 : Variabel i bukan pembeda dalam peng-
Karet 181,04106 cluster -an
14303-16
Sitepu dkk./Analisis Cluster terhadap. . . Jurnal Penelitian Sains 14 3(A) 14303
Tabel 6: Tabel Jarak Setiap Objek (Industri) ke Pusat 1. cluster pencemar tinggi: kelima polutannya
Cluster memiliki rerata lebih besar dari cluster ke-
dua. Anggotanya adalah industri migas,
Industri c1 c2 minyak goreng,makanan, dan pupuk.
Karet 181,04106 56,02 106
2. cluster pencemar rendah: kelima polutan-
Sawit 444,55106 0
nya memiliki rerata lebih kecil dari cluster
Pengalengan ikan 323,79106 15,8 106 pertama. Anggotanya adalah industri karet,
Migas 37,44 106 225,13106 sawit, pengalengan ikan, listrik, pertamba-
Listrik 278,27106 22,6 106 ngan, dan semen
Minyak goreng 27,70 106 251,8 106
Makanan 28,53 106 249,24106 5.2 Saran
Pupuk 0 444,54106 Berdasarkan dari kesimpulan yang telah dikemukakan,
Pertambangan 329,91106 10,96 106 maka peneliti mencoba untuk memberikan saran-saran
Semen 160,52106 71,13 106 sebagai berikut:
1. Untuk meningkatkan pengaruh polutan terhadap
5 KESIMPULAN DAN SARAN
pencemaran udara pada sektor industri, maka
harus diarahkan lagi ke polutan yang memberikan
5.1 Kesimpulan pengaruh besar ke sektor industri itu.
Dari hasil analisis dan pembahasan dapat diambil 2. Untuk peneliti selanjutnya, agar menambah vari-
keputusan sebagai berikut: abel lain yang mempengaruhi tingkat pencemaran
udara pada sektor industri di Sumatera Selatan.
1. Hasil analisis cluster dari 10 jenis industri berda- 3. Peranan industri dapat ditingkatkan untuk relo-
sarkan jenis polutan TSP, CO, NH3 , NO2 , dan kasi industri pencemar udara ke kawasan atau
SO2 , zona industri.
a. Untuk metode hirarki dapat dikelompokkan
menjadi tiga kelompok, yaitu cluster (kelom- DAFTAR PUSTAKA
pok industri) pencemar rendah, cluster pen- [1] Tim Penelitian dan Pengembangan Wahana Komputer,
cemar sedang, dan cluster pencemar tinggi 2005, Pengembangan Analisis Multivariat dengan SPSS
12, Edisi Pertama, Salemba Infotek, Jakarta, Hal.120
b. Untuk metode non hirarki dapat dikelom- [2] Supranto, J., 2000, Teknik Sampling untuk Survei dan
pokkan menjadi dua kelompok, yaitu clus- Eksperimen, Edisi Baru, PT. Rineka Cipta, Jakarta
ter (kelompok industri) pencemar tinggi dan [3] , 2010, Analisis Peubah Ganda,
cluster (kelompok industri) pencemar ren- http://www.adia08.les. wordpress.coin/2008/06/analisis
dah. peubah ganda.pdf, Diakses pada 20 February 2010
[4] , 2010, Pencemaran Udara,
2. Ciri dari setiap kelompok yang terbentuk yaitu; http://www.sabah.org.my/bm/kenali sabah/as
pencemaran udara.asp, Diakses pada 20 February 2010
[5] Kristanto, P., 2004, Ekologi Industri, Andi Oset,
a. Untuk metode hirarki: Yogyakarta
[6] Perkins, H.C., 1980, Air Pollution, Mcgraw-Hill Higher
1. cluster pencemar rendah: memiliki rerata
nilai variabel (polutan) yang paling kecil Education, New York
dan anggotanya adalah industri karet, sawit,
pengalengan ikan, listrik, pertambangan,
dan semen.
2. cluster pencemar sedang: memiliki rerata ni-
lai variabel (polutan) yang lebih besar dari
cluster pertama, namun lebih kecil dari clus-
ter ketiga. Anggotanya adalah industri mi-
gas, minyak goreng, dan makanan.
3. cluster pencemar tinggi: memiliki rerata ni-
lai variabel terbesar dan anggotanya adalah
industri pupuk
b. Untuk metode non hirarki:
14303-17