Anda di halaman 1dari 54

KNOWLEDGE SHARING

STATISTIK DAN PENGENALAN APLIKASI SIMPLE-E


UNTUK DEMAND FORCAST

RUDIANA NURHADIAN / 8506683-Z


M A H A S I S WA M AG I S T E R I T B 2 0 1 2

SEKOLAH TEKNIK ELEKTRO DAN INFORMATIKA


INSTITUT TEKNOLOGI BANDUNG
2013
MENGENAL STATISTIK
UNTUK
KEBUTUHAN
DEMAND FORECAST
STATISTIK dan STATISTIKA

STATISTIK :
Kumpulan fakta, umumnya berbentuk angka
yang disusun dalam tabel dan atau diagram yang
menggambarkan suatu persoalan.

STATISTIKA :
Pengetahuan yang berhubungan dengan cara-
cara pengumpulan fakta, pengolahan serta
penganalisaannya, penarikan kesimpulan serta
pembuatan keputusan yang cukup beralasan
berdasarkan fakta dan analisa yang dilakukan
APLIKASI ILMU STATISTIK
dibagi dalam 2 bagian
STATISTIK DESKRIPTIF:
Menjelaskan berbagai karakteristik data, seperti
rata-rata, variasi data terhadap rata-ratanya,
median, modus, dsb.

STATISTIKA INDUKTIF (INFERENSI):


Membuat suatu perkiraan besaran populasi yang
berasal dari kumpulan data sampel, uji hipotesis,
peramalan (forecasting), dsb
DATA STATISTIK
dibagi dalam 2 bagian

1. DATA KUANTITATIF:
Data yang berbentuk bilangan, harganya
berubah ubah atau bersifat variabel.

Data Kuantitatif dibagi menjadi 2 :


Skala Nomial (jenis kelamin, warna rambut, dll)
Skala Ordinal (level :tinggi, rendah, dll)
DATA STATISTIK
dibagi dalam 2 bagian

2. DATA KUALITATIF :
Data yang berupa kategori atau atribut.
Contoh : laki-laki, perempuan, bagus, rusak,
dll.

Data kualitatif dibagi menjadi 2 :


Skala Interval : tidak mempunyai nilai nol
absolut (suhu udara panas antara 37-39o C)
Skala Rasio (data yang bersifat angka)
POPULASI dan SAMPEL

POPULASI :
Sekumpulan data yang menggambarkan
fenomena secara menyeluruh. Contoh : semua
pegawai PT PLN (Persero)

SAMPEL :
Sekumpulan data yang diambil secara acak dari
populasi. Contoh : pegawai laki-laki di PT PLN
(Persero).
MENGUKUR RATA-RATA &
STANDAR DEVIASI

RATA-RATA :
Rata-rata x = (∑xi)/n

STANDAR DEVIASI (S) :


s sampel = (∑(xi-rata2 x))/n -1

S populasi = (∑(xi-rata2 x))/n


Normal Distribution X

 Normal distribution is a model for a continuous


random variable whose value depends on a number
of factors.
 Mean value Xi/n=
 Sample Variance Xi )2/(n-1)=




      
PROBABILITAS

 Standard Distribution Normal





      
MENGUKUR RATA-RATA & STANDAR
DEVIASI


RATA-RATA :
x
x  i

n
STANDAR DEVIASI :

 x 
2
x
s sampel  i

n 1

 x  x 
2

s populasi  i

n
ANALISIS REGRESI & KORELASI

o Analisis Regresi & Korelasi : analisis hubungan


fungsional antara satu atau lebih variabel yang
dinyatakan dalam formula matematis.
o Formula matematis yang dimaksud yaitu mencari nilai
variabel tergantung (dependent) dari nilai variabel bebas
(independent) yang diketahui.
o Tujuan dilakukannya Analisis Regresi biasanya adalah
untuk forecasting
Regresi dibagi menjadi 2 yaitu :
 Linier
 Non Linier
Mengapa Mempelajari Analisis Runtun Waktu

• Karena dengan mengamati data runtut waktu akan terlihat empat


komponen yang mempengaruhi suatupoladata
masalaludansekarang, yang cenderung berulang dimasa
mendatang
• Empat komponen yang ditemukan dalam analisis runtut
waktuadalah:

1. Trend, yaitu komponen jangka panjang yang mendasar


pertumbuhan(atau penurunan) suatu data runtut waktu.
2. Siklikal(cyclical), yaitu suatu pola fluktuasi atau siklus dari data
runtut waktu akibat perubahan kondisi ekonomi.
3. Musiman(seasonal), yaitu fluktuasi musiman yang sering
dijumpai pada data kuartalan, bulanan atau mingguan.
4. Tak beraturan(irregular), yaitu pola acak yang disebabkan oleh
peristiwa yang tidak dapat diprediksi atau tidak beraturan,
seperti perang, pemogokan, pemilu, atau longsor maupun
bencana alam lainnya Waktu?
REGRESI LINIER
Regresi LINIER dibagi menjadi 2 yaitu :
 Sederhana : Y = a + bX
 Multipel : Y = a + bX1 + cX2 + dX3 + …

Y :Actual data
c

b Regression equation
a Y = a + bX +c

X
0
Model matematika yang menyatakan hubungan antara variabel tidak
bebas (response variable) dengan variabel bebas (predictor)
REGRESI NON LINIER

Regresi Non Linier yaitu :


 Quadratic : Yt=b0+b1t+b2t2
 Compound : Yt=b0b1t
 Growth : Yt=eb0+b1t
 Exponential : Yt=b0eb1t
 Logaritmic : Yt=b0+b1ln(t)
REGRESI NON LINIER

Trend Eksponensial
Trend Logistik

a>0, b>1

Y = abX

a<0, b<1

a>0, b<1
a<0, b>1
KORELASI

 Menyatakan hubungan / asosiasi antara dua atau


lebih variabel
 Bila dua variabel tidak berhubungan ; korelasinya
0, bila kuat korelasinya 1.
 Koefisien korelasi dinotasikan dengan R2.
 Rumus : JKR
R 2

JKT
  yi  y 
2
ˆ

 y  y
2
i

0  R2  1
MEMBENTUK REGRESI LINIER

1. Metode tangan bebas :

y = a + bx
MEMBENTUK REGRESI LINIER
2. Metode Kuadrat Terkecil :
Y
y = a + bx
Y’
Y
a  y  bx
Y’

 y  x 
Y’ Y
yx 
i i
n
i i

b
 xi 
2

 xi  n
2
PENGENALAN
DEMAND FORECAST
Apa Itu Forecast ?

“Apa saja bisa di forecast, tetapi tidak semua 
bisa di prediksi”

•Prediksi berarti sudah menyangkut hukum / 
fenomena alam, sedangkan 
•Forecast lebih bersifat probabilitas
•Forecast adalah pernyataan tentang masa depan
KLASIFIKASI METODE PERAMALAN
Ilustrasi Model Matematis

Forecasting Method

Objective Subjective (judgmental)


Forecasting Methods Forecasting Methods

Time Series Methods Causal Methods


Yt= f (Yt-1, Yt-2, … , Yt-k) Yt= f (X1t, X2t, … , Xkt)

Examples : Examples :
sales(t) = f( sales(t-1), sales(t-2), …) sales(t) = f ( price(t), advert(t), ……..)

Combination of Time Series – Causal Method


Examples :
sales(t) = f (sales(t-1), advert(t), advert(t-1), …)
REGRESI
Model 1 : dua variabel
SUMMARY OUTPUT

Regression Statistics
Multiple R 0,992469648
R Square 0,984996003
Adjusted R Square 0,977494005
Standard Error 0,043723168
Observations 7

ANOVA
df SS MS F Significance F
Regression 2 0,502008105 0,251 131,298 0,00022512
Residual 4 0,007646862 0,0019
Total 6 0,509654967

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Durbin-Watson
Intercept -2100376304 3,598219321 -5,8373 0,00429 -30,99404216 -11,01348393 2,656508469
X Variable 1 0,954909101 0,218507229 4,3701 0,01197 0,348234518 1,561583685
X Variable 2 2,444634562 0,188815958 12,947 0,00021 1,92096333 2,968872791
REGRESI
Model 2 : tiga variabel
SUMMARY OUTPUT

Regression Statistics
Multiple R 0,99760490
R Square 0,99521554
Adjusted R Square 0,98803884
Standard Error 0,02667809
Observations 6

ANOVA
df SS MS F Significance F
Regression 3 0,29608967 0,0987 138,673 0,007166105
Residual 2 0,001423441 0,00071
Total 5 0,297513111

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Durbin-Watson
Intercept -2,52900493 7,090905676 -0,3567 0,75546 -33,03873083 27,980721 2,114590767
X Variable 1 0,15891128 0,324887762 0,48913 0,67313 -1,238968908 1,55679147
X Variable 2 0,18877955 0,778093437 0,24262 0,83091 -3,15908836 3,53664773
X Variable 3 0,86352862 0,292600946 2,95122 0,09819 -0,395432521 2,12248975
FORECAST MODEL
LANGKAH PEMBENTUKAN MODEL
Contoh (1)

Descriptive Statistics

Mean Std. Deviation N


T_GWH 66132,82 34650.38611 22
T_PLG 2,4E+07 10071179,97 22
DAYA_MVA 33404,21 15299.40440 22
INFLASI 11.5095 15.07899 22
GDP 1315536 1366378,069 22
PENDUDUK 199189,0 18024.81452 22
Contoh (2)

Correlations

T_GWH T_PLG DAYA_MVA INFLASI GDP PENDUDUK


Pearson Correlation T_GWH 1.000 .989 .998 .038 .932 .996
T_PLG .989 1.000 .995 .101 .873 .993
DAYA_MVA .998 .995 1.000 .060 .914 .998
INFLASI .038 .101 .060 1.000 -.017 .050
GDP .932 .873 .914 -.017 1.000 .904
PENDUDUK .996 .993 .998 .050 .904 1.000
Sig. (1-tailed) T_GWH . .000 .000 .433 .000 .000
T_PLG .000 . .000 .327 .000 .000
DAYA_MVA .000 .000 . .396 .000 .000
INFLASI .433 .327 .396 . .471 .413
GDP .000 .000 .000 .471 . .000
PENDUDUK .000 .000 .000 .413 .000 .
N T_GWH 22 22 22 22 22 22
T_PLG 22 22 22 22 22 22
DAYA_MVA 22 22 22 22 22 22
INFLASI 22 22 22 22 22 22
GDP 22 22 22 22 22 22
PENDUDUK 22 22 22 22 22 22
Contoh (3)

Model Summary

Change Statistics
AdjustedStd. Error o
R Square
Mode R R Square R Squarehe Estimate ChangeF Change df1 df2 g. F Chang
1 1.000a .999 .999 64.74851 .999713.873 5 16 .000
a.Predictors: (Constant), PENDUDUK, INFLASI, GDP, T_PLG, DAYA_MVA
Contoh (4)

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 2,52E+10 5 5038385636 3713.873 .000a
Residual 21706226 16 1356639.102
Total 2,52E+10 21
a. Predictors: (Constant), PENDUDUK, INFLASI, GDP, T_PLG, DAYA_MVA
b. Dependent Variable: T_GWH
Contoh (5)

a
Coefficients

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant)-63719,3 3691.287 -1.891 .077
T_PLG 474E-04 .001 .159 1.086 .294 .989 .262 .008 .003 399.285
DAYA_MVA 1.144 .465 .505 2.459 .026 .998 .524 .018 .001 783.950
INFLASI -34.099 19.805 -.015 -1.722 .104 .038 -.395 -.013 .724 1.380
GDP 977E-03 .001 .157 4.451 .000 .932 .744 .033 .043 23.072
PENDUDU .371 .212 .193 1.754 .099 .996 .402 .013 .004 225.030
a.Dependent Variable: T_GWH
Contoh (6)

Descriptive Statistics

Mean Std. Deviation N


T_GWH 66132,82 34650.38611 22
GDP 1315536 1366378,069 22
DAYA_MVA 33404,21 15299.40440 22
Contoh (7)

Correlations

T_GWH GDP DAYA_MVA


Pearson Correlation T_GWH 1.000 .932 .998
GDP .932 1.000 .914
DAYA_MVA .998 .914 1.000
Sig. (1-tailed) T_GWH . .000 .000
GDP .000 . .000
DAYA_MVA .000 .000 .
N T_GWH 22 22 22
GDP 22 22 22
DAYA_MVA 22 22 22
Contoh (8)

Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .999a .999 .999 1294.15084 .999 7517.738 2 19 .000
a. Predictors: (Constant), DAYA_MVA, GDP

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 2,52E+10 2 1,259E+10 7517.738 .000a
Residual 31821702 19 1674826.406
Total 2,52E+10 21
a. Predictors: (Constant), DAYA_MVA, GDP
b. Dependent Variable: T_GWH
Contoh (9)

MODEL: MOD_1.
_
Dependent variable.. GDP Method.. LINEAR
Listwise Deletion of Missing Data
Multiple R ,89962
R Square ,80931
Adjusted R Square ,79978
Standard Error 611399,09775
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 1 31730592439142 31730592439142
Residuals 20 7476177134539 373808856726,9
F = 84,88454 Signif F = ,0000

-------------------- Variables in the Equation --------------------


Variable B SE B Beta T Sig T
Time 189297,469170 20546,15266 ,899619 9,213 ,0000
(Constant) -861384,636364 269851,6392 -3,192 ,0046
_
Contoh (10)

Dependent variable.. GDP Method.. COMPOUND


Listwise Deletion of Missing Data
Multiple R ,99829
R Square ,99658
Adjusted R Square ,99641
Standard Error ,06910
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 1 27,805344 27,805344
Residuals 20 ,095509 ,004775
F = 5822,54584 Signif F = ,0000

-------------------- Variables in the Equation --------------------


Variable B SE B Beta T Sig T
Time 1,193873 ,002772 2,713629 430,612 ,0000
(Constant) 97066,041752 2960,569537 32,786 ,0000
_
ASUMSI YANG HARUS DIPENUHI DALAM
PEMBENTUKAN MODEL

1. Data Y (dependent variable) minimal berskala


nominal
Daya X (independent variable) minimal berskala
nominal), jika data X berskala nominal/ordinal
harus menggunakan bantuan dummy variable.
2. Data Y dan X berdistribusi Normal
3. Homoscedasticity . Varians dari variabel Y dapat
dikatakan sama pada beberapa variabel X sama
4. Tidak terdapat multikolinieritas antar
independent variable.
KRITERIA MODEL FIT

1. Koefisien penaksir, sudah melewati pengujian


heterosdastisitas sehingga dapat dikatakan layak
menjadi kofisien penaksir
2. Antar variabel independen tidak terdapat korelasi
sehingga model yang diperoleh merupakan
model yang efisien, melalui uji Multikolinieritas.
3. Standard Deviasi kecil antara data realisasi
dengan hasil taksiran
PENGUJIAN HIPOTESIS
Hipotesis : Perumusan/dugaan sementara mengenai suatu hal.
1. Hipotesis Uji Koefisien Determinasi/Koefisien Korelasi:
Ho : R2= 0 (Independent variable tidak berpengaruh thd dependent variable)
Hi : R2 ≠ 0 (Independent variable berpengaruh thd dependent variable)
Statistik uji
R2 / k
Fhitung = (1-R2)/ (n-k-1)
R2 = koefisien determinasi
k = jumlah independent variable
n = jumlah sample
F = uji hipotesis
Kriteria Pengujian
F hitung > F tabel, Ho ditolak
F hitung ≤ F tabel, Ho diterima
PENGUJIAN HIPOTESIS
Selain menggunakan statistik uji F, untuk menguji koefisien
korelasi dapat juga digunakan statistik Durbin Watson dan lebih
sesitif terhadap sifat korelasi.

Statistik Uji Durbin Watson

 e  e  i 1
2

R 2
 i

 e 
2
i

Kriteria Pengujian :
• Jika du <  d maka Ho diterima
• Jika d < dl maka Ho ditolak, terjadi korelasi positif
• Jika d > (4‐dl) maka Ho ditolak, terjadi korelasi negatif
• Du < d < dl atau (4‐du) < d < (4‐dl) maka tidak dapat disimpulkan
Nilai du dan dl didapat dari tabel titik kritis Durbin Watson
PENGUJIAN HIPOTESIS
2. Hipotesis Uji Koefisien Regresi:
Ho : βi = 0 (Koefisien regresi tidak signifikan)
Hi : βi ≠ 0 (Koefisien regresi Signifikan)

Statistik uji
bi - βi
t= sbi
selain statistik Uji t, menguji koefisien regresi dapat juga
menggunakan Uji F
Kriteria Pengujian
t n-2,α/2 ≤ t hitung ≤ t n-2, 1-α/2 daerah penerimaan Ho
PENGUJIAN MULTIKOLINIERITAS

2. Uji Multikolinieritas dapat diuji dengan menghitung


VIF (Variance Inflaction Factor). Jika VIF < 10 maka
terdapat korelasi antar variabel independent.
2
VIF = 1/(1-R )

Catatan : Berdasarkan hasil pengujian terhadap koefisien


regresi, koefisien yang tidak significant ternyata
memiliki korelasi yang kuat terhadap variabel yang
koefisiennya significant dg demikian uji autokorelasi
tidak perlu dilanjutkan.
PENGENALAN
APLIKASI SIMPLE-E
UNTUK
DEMAND FORECAST
Simple-E (Simple Econometric Simulation System, for Excel) :

− Tools berbasis ilmu statistik


− Berbentuk modul yang disisipkan kedalam excel
− Untuk membuat forecast
− Menggunakan metode regresi
− Disediakan beberapa pilihan model regresi
− Indikator statistik langsung ditampilkan
− Grafik mudah dibuat
− Mudah dalam analisa
− Dapat dipertanggung jawabkan secara ilmu statistik
− Digunakan di DJLPE untuk RUKN dan perusahaan besar
listrik di Jepang
Pengetahuan dasar yang diperlukan untuk
bisa memahami Simple-e
ILMU STATISTIK :
− Regresi (linier, non linier)
− Distribusi (sebaran) data
− Uji statistik (R, DW, t-value)
1. Data input:
- kWh jual tahun2 yl
- Jml pelanggan
- Daya tersambung
- PDRB
- Jml penduduk

2. Model input:
Pilihan rjenis regresi
(linier atau non liner)

3. Proyeksi PDRB,
penduduk, dafter
tunggu
Start

Theory of
the model
TAHAPAN Repair, arrange
Prepare the available
data for use

PEMILIHAN
the data
Regression
Analysis
METODE
REGRESI UNTUK
No
Checking reliability of model formula

DEMAND Yes
Confirm the
FORECAST structure of model

Forecasting
(Interpolation)

No
Checking reliability of model

Setting Yes
Exogenous
Variable Forecasting
(Extrapolation test)
Simple Regression Analysis (Exercise)

Let’s analyze relationship between GDP and


Final consumption of Electricity using same
approach.

Linear Approximation
Logarithmic Approximation
Power Approximation
Exponential Approximation

(Data Source: IEA Energy Balances of Non-


OECD Countries 2008 Edition
Worldbank:http://ddp-
ext.worldbank.org/ext/DDPQQ/member.do?meth
od=getMembers&userid=1&queryId=135)
Simple Regression Analysis (Exercise Result)
BERBAGAI MACAM UJI STATISTIK YANG TERSEDIA DI SIMPLE-E
(Fitness of Equation by Regression Analysis)

1) R :R-Square, 0  Explained variance / Total variance  1,


(The larger the better)
2) AR :Adjusted R-Square, AR  1, (The larger the better)
3) SD :SD = (e2 /(n-k))1/2 ,
e = Residual, n = Sample size,
k = No. of independent variables
4) DW :Durbin Watson Statistics, 1 < DW < 3
DW = 2 : No serial correlation
DW  0 : Positive correlation
DW  4 : Negative correlation
5) Dh :Durbin h Statistics with lag,  Dh   2
6) t-value t2 : Significant
2t1 : Admissible to use
t1 : Insignificant
PENYIAPAN DATA (1)
DATA PENGUSAHAAN WIL/DIS

1. Penjualan 1993-2009 per kelompok tarif :


 kWh jual,
 MVA tersambung,
 Jumlah pelanggan
2. Beban puncak (MW) periode 1993-2009
3. Susut jaringan (%) periode 1993-2009
4. Jumlah penduduk 2010-2025 per Provinsi
PENYIAPAN DATA (2)
DATA PENGUSAHAAN WIL/DIS

PDRB 1993-2008 per lapangan usaha, disusun per


kelompok tarif pelanggan PLN :
a. PDRB Sektor Rumah tangga : Total tanpa minyak &
gas
b. PDRB Sektor Komersial :
 Konstruksi
 Perdagangan, Hotel & Restoran
 Pengangkutan dan Komunikasi
 Keuangan, Real estate & Jasa Perusahaan
c. PDRB sektor Publik :
 Jasa
d. PDRB sektor Industri
 Pertambangan dan penggalan
 Industri pengolahan
 Listrik, gas dan air
SIMULASI
Demand Forecast Per Provinsi

 Perhitungan demand forecast untuk tahun 2010-


2020 sudah menggunakan Aplikasi Simple-e
 Demand dihitung per kelompok pelanggan sesuai
tarif (R, B, P, I).
 Perhitungan beban puncak, energi produksi, beban
puncak dan produksi per-sistem, beban puncak GI
menggunakan metode seperti dalam DKL.
TERIMA KASIH

Anda mungkin juga menyukai