Anda di halaman 1dari 4

Nama : Wulan Handareni Asisten Praktikum :

NRP : G24130020 1. Ayularas Purnamasari S (G24120031)


Hari, Tanggal : Rabu, 30 September 2015 2. Yahdi Isna M (G24130079)
Praktikum ke-4

PENDUGAAN DATA HILANG


Tujuan
Tujuan praktikum kali ini adalah mengisi data hilang menggunakan beberapa metode
sederhana. Selanjutnya membandingkan nilai missing data dari metode Rata-rata
Sederhana, Kuadran Empat dan regresi linear.
Metodologi
Alat dan Bahan yang digunakan pada pratikum metode klimatologi adalah
laptop/komputer, software Ms Excel, alat tulis, data yang akan diduga dan aplikasi
minitab.
Praktikum meteode klimatologi dilaksanakan pada hari hari Rabu, 30 September
2015 bertempat di laboratorium komputer Departemen Geofisika dan Meteorologi IPB.
Langkah Kerja

Uji Kendal : MEtode rata-rata


Menghitung Rb, Rc, sederhana :
Mengitung Tb, Tc, Td
Rd dengan menghitung rata-rata
menggunakan rumus
membandingkan data data satdiun
atas dan bawahnya. pembanding

apabila hasilnya
Metode rata-rata
Uji ketepatan metode kurang dari 10 %,
berbobot : menghitung
dengan menggunakan maka hasil rata-rata
rata-rata data tiap
rumus. dapat digunakan untuk
stasiun
mengisi data hilang

Uji ketepatan metode


hitung nilai Pa tahun
dengan rumus, apabila Metode kuadran
yang memiliki data
hasilnya > 10% empat : hitung
hilang menggunakan
metode ini dapat menggunakan rumus
rumus
digunakan

Analisa regresi Menghitung nilai Pa


berganda tahun yang memiliki
Salin persamaan ke
menggunakan minitab, data hilang
excel
copy seluruh data menggunakan
masukkan ke minitab persamaan

Gambar 1 Diagram alir beberapa metode pendugaan data hilang


Pembahasan
Data yang hilang dapat diduga dengan beberapa metode pendugaan data hilang.
Digunakan data curah hujan tahun 1988 hingga 2002 dari empat stasiun yang jaraknya
berdekatan. Beberapa data pada stasiun A hilang, sehingga dilakukan pendugaan
menggunakan tiga stasiun lainnya. Metode pertama adalah Uji Kendall. Koefisien
korelasi Kendall adalah ukuran korelasi yang menuntut kedua variabel diukur sekurang-
kurangnya dalam skala ordinal sehingga obyek-obyek yang dipelajari dapat
diperingkatkan dalam dua jangkauan berurut (Pradeka et al. 2003). Koefisien korelasi
rank kendall pertama sekali dikemukakan oleh Maurice G. kendall pada tahun 1938.
Koefisien korelasi rank kendall dinotasikan dengan τ. Koefisien korelasi rank Kendall
digunakan untuk mencari hubungan dan menguji hipotesis antara dua variabel atau lebih,
bila datanya berbentuk ordinal atau ranking.
Nilai korelasi yang dihasilkan berkisar diantara -1 sampai dengan +1. Angka
pada nilai korelasi menunjukkan keeratan hubungan antara dua variabel yang diuji. Jika
angka korelasi makin mendekati 1, maka korelasi dua variabel akan makin kuat,
sedangkan jika angka korelasi makin mendekati 0 maka korelasi dua variable makin
lemah. Sedangkan tanda negatif dan positif pada nilai korelasi menyatakan sifat
hubungan. Jika nilai korelasi bertanda negatif, berarti hubungan diantara kedua tabel
bersifat searah. Sedangkan jika nilai korelasi bertanda positif, berarti hubungan diantara
kedua tabel bersifat berlawanan arah.
Korelasi kendall merupakan salah satu metode pengukuran koefisien korelasi
nonparametrik. Metode statistika nonparametrik sering disebut metode bebas sebaran
(distribution free) karena model uji statistiknya tidak menetapkan syarat-syarat tertentu
tentang bentuk-bentuk distribusi parameter populasinya. Uji satistik nonparametrik hanya
menetapkan asumsi/persyaratan bahwa observasi-observasinya harus independen dan
bahwa variabel yang diteliti pada dasarnya harus memiliki kontinyuitias. Banyak diantara
uji-uji statistik nonparametrik kadangkala disebut sebagai uji ranking, Karena teknik-
teknik nonparametrik ini dapat digunakan untuk skor yang bukan skor eksak dalam
pengertian keangkaan, melainkan berupa skor yang semata-mata berupa jenjang-jenjang
(ranks).
Tabel 1 Pendugaan data hilang menggunakan korelasi kendall
Tb 0,866666667
Tc 0,885714286
Td 0,904761905
Terdapat empat data yang hilang pada stasiun A, yaitu pada tahun 1991, 1995,
1999, serta 2000. Uji kendal hanya menduga data hilang pada tahun 1991, 1995 dan
1999, karena pada tahun 2000 tidak ada pembanding data lagi dibawahnya. Dapat
diketahui dari tabel 1, hasil pendugaan data hilang pada tiap stasiun bernilai diatas 0,8
atau hampir mendekati angka 1. Nilai pendugaan tertinggi adalah Td (pada stasiun D)
yaitu sebesar 0,904761905. Hal ini menunjukkan bahwa pendugaan terbaik yang dapat
digunakan untuk mengisi data hilang adalah menggunakan data pada stasiun D.
Selain metode Kendall ada tiga metode lainnya yang dapat digunakan untuk
menduga data hilang yaitu metode Rata-rata Sederhana, metode Kuadran Empat, dan
Analisis Regresi Berganda. Metode Rata-rata Sederhana adalah metode yang paling
mudah.
Metode ini menggunakan nilai rata rata secara sederhana dengan menentukan harga rata-
rata per unit berdasarkan frekuensi. Metode Rata-rata Sederhana bisa digunakan apabila
data yang tersedia tidak mengandung unsur musiman dan tren. Data tersebut harus
stasioner. Semakin banyak data yang digunakan, maka semakin stabil rata-rata yang
dihasilkan (Makridasi 1991). Sebelum menggunakan metode ini, terlebih dahulu dihitung
rata-rata curah hujan tahunan ditiap stasiun. Kemudian dengan menggunakan persamaan
diperoleh nilai sebesar 3,031096. Hasil tersebut kurang dari 10%, sehingga metode Rata-
rata Sederhana dapat digunakan. Apabila hasil perhitungan menggunakan persamaan
lebih dari 10% berarti metode Rata-rata Sederhana tidak dapat digunakan. Nilai rataan
stasiun B,C,D untuk mengisi data yang hilang pada tahun 1991 dan 1995 berturut-turut
sebesar 109 dan 172,3333333. Sedangkan untuk tahun 1999 dan 2000 berturut-turut
sebesar 138 dan 199,3333333.
Metode Kuadran Empat digunakan untuk menduga data hilang dengan
menghitung persamaan. Dari hasil perhitungan, nilai pendugaan data hilang pada tahun
1991 dan 1995 berturut-turut adalah 94,47997759 dan 135,4941846, sedangkan tahun
1999 dan 2000 berturut-turut adalah 152,0152211 dan 201,3599561.
Analisis regresi linier berganda adalah hubungan secara linear antara dua atau
lebih variabel independen (X1, X2,….Xn) dengan variabel dependen (Y). Analisis ini
untuk mengetahui arah hubungan antara variabel independen dengan variabel dependen
apakah masing-masing variabel independen berhubungan positif atau negatif dan untuk
memprediksi nilai dari variabel dependen apabila nilai variabel independen mengalami
kenaikan atau penurunan. Data yang digunakan biasanya berskala interval atau rasio.
Sehingga apabila ingin dikaji hubungan atau pengaruh dua atau lebih variabel bebas
terhadap variabel tidak bebas, maka model regresi yang digunakan adalah model regresi
linier berganda (multiple linear regression model) (Kutner et al. 2004). Dari hasil
persamaan yang diperoleh minitab, pendugaan data hilang pada tahun 1991 dan 1995
berturut-turut adalah sebesar 134,47 dan 187,77, sedangkan pada tahun 1999 dan 2000
adalah sebesar 149,836 dan 185,184.

Tabel 2 Perbandingan pendugaan data hilang menggunakan metode Rata-rata Sederhana,


Kuadran Empat serta Analisis Regresi Berganda
Metode Rata-rata Metode Kuadran Analisis Regresi
Tahun Data asli
Sederhana Empat Berganda
Pa1991 109 94,47997759 134,47 126
Pa1995 172,3333333 135,4941846 187,77 78
Pa1999 138 152,0152211 149,836 275
Pa2000 199,3333333 201,3599561 185,184 211

Pendugaan data hilang yang dihasilkan oleh ketiga metode berbeda-beda karena
cara perhitungan maupun persamaan yang digunakan berbeda-beda. Metode yang
memiliki hasil pendugaan paling mendekati data asli adalah metode Kuadran Empat.
Metode tersebut memperhitungkan pengaruh dari masing-masing stasiun pembanding,
oleh karena itu metode ini dapat menghasilkan pendugaan yang lebih akurat.
Metode terakhir yang digunakan untuk pendugaan data hilang adalah metode
Rata-rata Berbobot. Rata-rata Berbobot digunakan untuk menghitung skor atau data yang
memiliki bobot atau nilai. Metode ini dapat digunakan apabila hasil uji rata-rata data
ditiap stasiun lebih dari 10%. Jika hasil uji rataan kurang dari 10%, metode Rata-rata
Berbobot tidak dapat digunakan. Hal ini berkebalikan dengan metode Rata-rata
Sederhana.
Tabel 3 Pendugaan data hilang metode Rata-rata Berbobot
Tahun Data hasil dugaan
Pa1988 48,45417001
Pa1990 167,3670914
Pa1995 218,6862709
Pa1999 260,5477648
Hasil pendugaan data hilang menggunakan metode Rata-rata Berbobot pada
tahun 1988 dan 1990 berturut-turut sebesar 48,45417001 dan 167,3670914, sedangkan
pada tahun 1995 dan 1999 berturut-turut sebesar 218,6862709 dan 260,5477648. Hasil
pendugaan Rata-rata Berbobot tidak dibandingkan dengan metode yang lainnya karena
tahun data hilang yang digunakan berbeda. Pada metode Rata-rata Berbobot, data hilang
yang diduga adalah data tahun 1988, 1990, 1995, dan 1999. Sedangkan pada metode
Rata-rata Sederhana, Kuadran Empat serta Analisis Regresi Berganda, data hilang yang
diduga adalah data tahun 1991, 1995, 1999, dan 2000.

Kesimpulan
Beberapa metode yang dapat digunakan untuk menduga data hilang adalah
metode Kendall, Rata-rata Sederhana, Rata-rata Berbobot, Kuadran Empat, serta Analisis
Regresi Berganda. Dari perbandingan tiga metode (tabel 2), hasil pendugaan yang
mendekati data asli adalah metode Kuadran Empat.

Daftar Pustaka
Pradeka R, Setiawan A, dan Linawati L. 2003. Uji Koefisien Korelasi Spearman dan
Kendall Menggunakan Metode Bootstrap. Prosiding dalam Studi Kasus: Beberapa
Kurs Mata Uang Asing Terhadap Rupiah. Fakultas Sains dan Matematika
Universitas Kristen Satya Wacana.
Makridasi. 1991. Metode dan aplikasi Peramalan. Bandung(ID) : Erlangga.
Kutner MH, Nachtsheim CJ, dan Neter J. 2004. Applied Linear Regression Models. 4th
ed. New York (US): McGraw-Hill Companies, Inc.

Anda mungkin juga menyukai