Anda di halaman 1dari 10

Penuntun Praktikum

ANALISIS DATA CURAH HUJAN MENGGUNAKAN


ANALISIS KOMPONEN UTAMA DAN ANALISIS GEROMBOL1
Muhamad Askari dan Rizaldi Boer

Pendahuluan
Analisis komponen utama merupakan salah satu teknik
statistika yang digunakan untuk mengidentifikasi peubah baru
yang mendasari data peubah ganda, mengurangi banyaknya
dimensi himpunan peubah yang biasanya terdiri atas peubah
yang banyak dan saling berkorelasi menjadi peubah-peubah baru
yang

tidak

mungkin

berkorelasi
keragaman

dengan

mempertahankan

dalam

himpunan

sebanyak

data

tersebut

(menghilangkan masalah multikoliniaritas), dan menghilangkan


peubah-peubah asal yang memberikan sumbangan informasi
yang relatif kecil.

Peubah baru tersebut merupakan kombinasi

linear peubah asal, tidak berkorelasi, mempunyai ragam berurut


dari yang terbesar ke terkecil dan jumlah kuadrat koefisien dalam
kombinasi linear tersebut bernilai satu.
Analisis komponen utama tidak akan memberikan hasil
yang diinginkan apabila tidak ada korelasi antar peubah asal.
Dengan demikian analisis ini tidak selalu bermanfaat untuk
mengurangi banyaknya peubah asal menjadi beberapa peubah
baru yang dapat menjelaskan dengan baik keragaman data asal.
Analisis gerombol umumnya dilakukan setelah analisis
komponen

utama.

mengelompokkan

Analisis

objek-objek

ini

menjadi

digunakan
beberapa

untuk

gerombol

berdasarkan pengukuran peubah-peubah yang diamati, sehingga


diperoleh
1

kemiripan

Bahan Praktikum
Agroklimatologi

objek

dalam

gerombol

Metode Klimatologi pada Program


31 Agustus 2 November 2000.

yang

sama

Pencangkokan

dibandingkan antar objek pada gerombol yang lain.


mendasar

dalam

analisis

ini

adalah

Masalah

menentukan

ukuran

kedekatan yang digunakan dan cara penggerombolannya.


Terdapat

beberapa

cara/teknik

yang

dilakukan

untuk

melakukan penggerombolan, diantaranya teknik hierarki, fuzzy


dan

diskriminan.

Teknik

hierarki

disajikan

dalam

bentuk

dendrogram sehingga penggerombolan akan lebih mudah dan


informatif.

Adapun

berdasarkan

jarak

ukuran

kedekatan

Eucledian,

dapat

Manhattan,

dihitung

Pearson

dan

sebagainya. Selanjutnya dalam analisis ini akan menggunakan


jarak Eucledian.
Persamaan jarak Eucledian dari dua pengamatan x i dan yi
yang berdimensi p adalah sebagai berikut:
d ij

x
p

k 1

ik

x jk

dimana dij adalah jarak antara objek ke-i dan ke-j, x ik adalah
besaran nilai sifat ke-k dari objek atau komponen utama ke-i, x jk
adalah besaran nilai sifat ke-k dari objek atau komponen utama
ke-j, dan p adalah banyaknya sifat yang diamati. Semakin besar
jarak Eucledian maka semakin besar pula perbedaan antara
objek-objek tersebut.
Ada

beberapa

menghitung

nilai

algoritma

jarak

yang

berdasarkan

bisa

dipilih

persamaan

untuk

Eucledian

tersebut, diantaranya algoritma furthest neighbour, nearest


neighbour, dan centroid.

Perbedaan mendasar dari ketiga

algoritma tersebut adalah jauh dekatnya jarak antara suatu objek


dengan dua objek lain yang telah lebih dulu bergabung.
Penentuan

dua

objek

yang

lebih

dulu

bergabung

didasarkan pada matrik jarak antar objek, dengan jarak paling


kecil.
dengan

Selanjutnya dihitung pula jarak setiap objek lainnya


matrik

yang

telah

bergabung

tersebut

dengan

menggunakan salah satu dari tiga algoritma di atas.

Sampai

akhirnya

semua

objek

bergabung

membentuk

sebuah

dendogram. Selanjutnya dilakukan penentuan jumlah gerombol


yang optimal dengan cara memplotkan banyaknya gerombol
yang disarankan dendogram versus tingkat penggerombolan,
yaitu pada tingkat jarak dimana beberapa gerombol tersebut
bergabung.

Jumlah kelompok yang optimal dipilih pada saat

kurva hubungan mulai mendatar.


Salah satu penggunaan analisis komponen utama dan
analisis

gerombol

dalam

penanganan

data

iklim

adalah

pengelompokkan stasiun-stasiun hujan yang mewakili luasan


tertentu ke dalam kelompok areal yang mempunyai kesamaan
sifat.

Misalnya

pembagian wilayah hujan di Jawa

Barat

berdasarkan keserupaan curah hujan bulanan (Boer et al., 1996).


Tujuan
1. Peserta praktikum dapat memanfaatkan program aplikasi
statistika MINITAB terutama untuk analisis komponen utama
dan analisis gerombol.
2. Peserta praktikum dapat memahami salah satu aplikasi kedua
analisis tersebut dalam analisis data iklim yaitu pemecahan
masalah multikolinearitas dan pengelompokkan stasiun hujan.
3. Secara manual dapat menggambarkan wilayah-wilayah yang
mempunyai karakteristik curah hujan yang sama (berdasarkan
hasil pengelompokkan menggunakan analisis gerombol).
Alat dan Bahan
1. Seperangkat komputer dengan program aplikasi statistika
MINITAB.
2. Peta pulau Sulawesi menurut satuan kabupaten
3. Data rata-rata curah hujan wilayah menurut satuan kabupaten
di Pulau Sulawesi. Dalam praktikum ini akan dianalisis data
curah hujan sebanyak 31 kabupaten.

Gambar 1. Peta pulau Sulawesi menurut satuan


kabupaten

Isi dengan hujan Sulawesi per kabupaten

(Lihat File Hujan Sulawesi per Kabupaten)

Cara Kerja
Ada beberapa langkah yang harus dilakukan:
1. Data disusun berdasarkan kode kabupaten dan data hujan,
dimana pada kolom C1 ditempatkan kode kabupaten dan
kolom C2 C13 ditempatkan data hujan menurut bulan
kejadian, berurut mulai Januari sampai dengan Desember.
Data tersimpan dalam direktori Metklim dengan nama PCICluster.mtw
2. Lakukan analisis komponen utama dengan perintah sebagai
berikut:
MTB>pca C2-C13;
SUBC>cova;
SUBC>score c15-c26.

Selanjutnya

pada

menu

session

akan

ditampilkan

12

komponen utama (KU) dengan sumbangan keragamannya


masing-masing (ditunjukkan oleh proportion dalam eigen
analysis of the covarian matrix).

Berikut ini hasil tampilan

pada menu session:


Principal Component Analysis
EigenanalysisoftheCovarianceMatrix
Eigenvalue4365618035556129281513788
Proportion0.5920.2440.0750.0400.0210.011
Cumulative0.5920.8360.9110.9510.9720.982
Eigenvalue4973072531198942
Proportion0.0070.0040.0030.0020.0010.001
Cumulative0.9890.9930.9970.9980.9991.000
VariablePC1PC2PC3PC4PC5PC6
Jan0.6130.0180.1690.4230.0900.348
Peb0.3800.1450.1100.0240.1500.151
Mar0.2890.2610.0150.2230.4680.229
Apr0.0160.5120.1390.4460.2820.142
Mei0.1600.5730.3090.0990.5020.312
Jun0.2210.4060.2830.3780.0710.184
Jul0.1890.2360.0200.5210.1870.253
Agst0.1150.1420.2610.1950.1910.082
Sep0.0980.0880.4450.2750.2980.290
Okt0.0200.1100.5010.1120.3370.293
Nop0.1630.1930.4880.0930.3480.194
Des0.4860.1490.0890.1130.1430.612
VariablePC7PC8PC9PC10PC11PC12
Jan0.0540.1730.3940.1190.2770.092
Peb0.0870.4790.4950.2600.4760.025
Mar0.3210.5970.1480.0640.1870.079

Apr0.0810.4310.3140.3270.1210.083
Mei0.1230.2430.1220.0270.3180.030
Jun0.1740.1060.4180.1240.5370.062
Jul0.5250.0100.1780.2090.3390.267
Agst0.0070.0000.3940.6690.0550.460
Sep0.6080.1310.1340.2060.2090.215
Okt0.3630.0520.2830.3120.1480.437
Nop0.0610.0570.0310.3820.1880.584
Des0.2330.3230.0490.1200.1960.335

3. Selanjutnya, pilihlah KU yang dapat menerangkan keragaman


data 80% (ditunjukkan oleh cumulative dalam eigen
analysis of the covarian matrix).

Berdasarkan hasil tampilan

di atas terlihat bahwa KU 1 dan KU 2 memberikan sumbangan


informasi 80%.
4. Setelah diperoleh hasil komponen utama yang menerangkan
keragaman

data

data

80%

tersebut

maka

langkah

selanjutnya adalah melakukan analisis gerombol terhadap KU


1 dan KU 2 dengan perintah sebagai berikut:
MTB>cluo C15 C16;
SUBC>centroid;
SUBC>dendogram;
SUBC>ydist.

Hasil tampilan perintah di atas adalah sebagai berikut:


Hierarchical Cluster Analysis of Observations
EuclideanDistance,CentroidLinkage
AmalgamationSteps
StepNumberofSimilarityDistanceClustersNewNumberofObs
clusterslevelleveljoinedclusterinnewcluster
13099.216.6921712
22999.167.0882530252
32896.5329.43752052
42796.5029.6672231222
52695.7536.0121519152
62595.9134.63751554
72495.6037.2961022103
82395.9634.2571029104
92295.1541.11912813
102194.7644.41351855
112094.5646.10422622
121994.2948.41681182
131894.1949.2701317132
141793.5654.5552527253
151693.8252.4051025107
161592.3864.60922123
171492.1466.570110110
181389.8785.87692392

191288.6696.06115115
201189.1392.07212118
211086.00118.59292493
22983.86136.7643934
23880.65163.96214119
24777.80188.14713123
25676.18201.81318125
26576.98195.03016126

Distance
423.37

282.25

141.12

0.00
12 13 17 16 14 6 8 11 3 9 23 24 4 2 26 21 5 20 15 19 18 1 7 28 10 22 31 29 25 30 27

Observations
27472.23235.344114127
28371.67240.088116128
29270.56249.4751213123
30150.04423.370112131
FinalPartition
Numberofclusters:1
NumberofWithinclusterAveragedistanceMaximumdistance
observationssumofsquaresfromcentroidfromcentroid
Cluster1311850742.134208.022548.472

Selanjutnya

akan

ditampilkan

pula

sebuah

dendogram

dimana sumbu y menyatakan level jarak dan sumbu x


menyatakan objek-objek yang bergabung pada tingkat jarak
tersebut (observasi).

Sebagai catatan, perintah di atas

menggunakan algoritma centroid.


5. Langkah selanjutnya lihatlah amalgamation steps yang ada
pada menu session di atas.

Dendogram yang ditampilkan

pada tahap No. 4 di atas merupakan ringkasan dari kolom

distance level (pada sumbu y) dengan Clusters joined, New


cluster, Number of Obs. in New cluster (pada sumbu x).
6. Untuk memilih jumlah gerombol yang optimal maka plotkan
level distance sebagai sumbu y dan Number of clusters
sebagai sumbu x.
7.

Setelah ditemukan jumlah kelompok yang optimal,


misalnya jumlah kelompok yang optimal adalah 15 pada
tingkat jarak 64.609, maka lihat kembali dendogram yang
terbentuk untuk menentukan kabupaten-kabupaten mana
saja

yang

bergabung

berdasarkan

15

kelompok

penggerombolan tersebut.
Catatan: sebagai latihan ambil lima kelompok wilayah
hujan,

kemudian

tentukan

masing-masing

stasiun

anggotanya.
8. Delineasikan ke dalam peta (buat plot isohyet) berdasarkan
hasil analisis tahap 7 di atas.

Akhirnya akan diperoleh

pengelompokkan pulau Sulawesi berdasarkan kesamaan sifat


curah hujan wilayahnya.
9. Sebagai latihan selanjutnya, tahap analisis mulai No. 1
sampai No. 8 dapat diulang kembali dengan mengganti
linkage methods centroid menggunakan linkage methods
Ward dan McQuitty.

DAFTAR PUSTAKA
Boer, R., I. Las, R. Hidayati dan B. Budianto. 1996. Analisis deret
hari kering untuk perencanaan penanaman padi sawah
tadah hujan di Jawa Barat. Laporan Penelitian. LP IPB
Balitbang Pertanian.

Anda mungkin juga menyukai