62 Modul Uts d4-St
62 Modul Uts d4-St
Hubungan Fungsional bersifat pasti sehingga Hubungan statistic tidak bersifat pasti sehingga
dapat dinyatakan dalam bentuk fungsi titik-titik hasil observasi tidak tepat jatuh pada
matematis. Maka, fungsi f(x) akan memetakan garis kurva hubungan antarvariabel. Dengan
nilai X tertentu ke tepat satu nilai Y secara pasti. demikian, suatu nilai X tertentu (fixed) akan
Hubungan matematis : 𝑌 = 𝑓(𝑥) terdapat banyak kemungkinan nilai Y (stochastic).
Nilai Y ini terdistribusi mengikuti distribusi
peluang tertentu.
Hubungan statistik : 𝑌 = 𝑓(𝑥) + 𝜀
7
B. Korelasi dan Regresi
Korelasi Regresi
• Mempelajari keeratan hubungan antara dua • Mempelajari bentuk hubungan antara kedua
variabel yang dinyatakan dalam besarnya variabel yang dinyatakan melalui suatu
angka, sedangkan tandanya menentukan persamaan.
arah hubungan. • Mengukur seberapa besar suatu variabel
• Nilainya −1 ≤ 𝜌 ≤ 1 memengaruhi variabel lainnya sehingga
• Correlation doesn’t imply causation. dapat digunakan untuk membuat peramalan.
(Korelasi tidak menyatakan sebab akibat) • Hubungan bisa saja berupa sebab akibat.
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 untuk 𝑖 ∈ 1,2, … , 𝑛
Dengan :
𝑌𝑖 merupakan nilai dari variabel dependen untuk observasi ke-i
𝛽0 dan 𝛽1 merupakan parameter model
𝜀𝑖 merupakan komponen error
𝑋𝑖 merupakan nilai variabel bebas X pada observasi ke-i
n merupakan banyaknya data observasi (sampel)
8
B. Asumsi Regresi Linear Sederhana
1. 𝐸(𝜀𝑖 ) = 0 yakni rata-rata seluruh error bernilai nol untuk setiap nilai X yang terobservasi.
Maka, sifat regresi unbiased didapatkan 𝐸(𝑌𝑖 ) = 𝛽0 + 𝛽1 𝑋𝑖 . Sifat ini diilustrasikan pada
gambar dengan setiap garis melewati rata-rata distribusi normal.
2
2. 𝑉𝑎𝑟(𝜀𝑖 ) = 𝜎 2 atau 𝐸 [(𝜀 − 𝐸(𝜀)) ] = 𝐸[𝜀 2 ] = 𝜎 2 (homoscedastic).
Maka, pendugaan interval prediksi regresi dapat lebih akurat. Jika asumsi ini tidak terpenuhi,
penaksir regresi linear masih tetap unbias dan konsisten, tetapi tidak lagi efisien karena
variansnya berbeda-beda.
3. 𝜀𝑖 ∼𝑖𝑖𝑑 𝑁(0, 𝜎 2 ) error merupakan random variabel yang berdistribusi normal dengan rata-
rata nol dan varians 𝜎 2 . Sifat ini tergambarkan dengan distribusi normal yang identik pada
gambar di atas.
4. 𝐶𝑜𝑟(𝜀𝑖 , 𝜀𝑗 ) = 0 untuk 𝑖 ≠ 𝑗
sehingga 𝐶𝑜𝑣(𝜀𝑖 , 𝜀𝑗 ) = 𝐸(𝜀𝑖 𝜀𝑗 ) − 𝐸(𝜀𝑖 )𝐸(𝜀𝑗 ) = 𝐸(𝜀𝑖 𝜀𝑗 ) = 0 untuk 𝑖 ≠ 𝑗 (nonautocorrelation).
Maka, nilai variabel respons 𝑌𝑖 juga tidak saling berkorelasi dengan 𝑌𝑗 .
C. Pendugaan/Estimasi Parameter
Estimasi parameter pada regresi linear sederhana dapat dilakukan menggunakan dua cara, yakni
least square method dan maximum likelihood method.
9
Untuk meminimalkan fungsi di atas, lakukan turunan parsial terhadap 𝛽0 dan 𝛽1 sehingga
didapatkan penduganya, yakni 𝑏0 dan 𝑏1 :
Intercept Slope
𝑛 𝑛
𝜕𝑄(𝛽0 , 𝛽1 ) 𝜕𝑄(𝛽0 , 𝛽1 )
= 2 ∑(𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 )(−1) = 2 ∑(𝑌𝑖 − 𝛽0
𝜕𝛽0 𝜕𝛽1
𝑖=1 𝑖=1
𝑏0 = 𝑌̅ − 𝑏1 𝑋̅ − 𝛽1 𝑋𝑖 ) (−𝑋𝑖 )
𝑛∑𝑋𝑖 𝑌𝑖 − ∑𝑋𝑖∑𝑌𝑖
𝑏1 =
𝑛 ∑ 𝑋𝑖2 − (∑𝑋𝑖 )2
10
6. Garis regresi selalu melewati titik (𝑋̅, 𝑌̅).
Dalam proses inferensia, terdapat dua proses yang dapat dilakukan, yakni estimasi interval dan
pengujian hipotesis. Estimasi interval biasanya dilakukan terhadap nilai rata-rata dari Y atau
observasi baru dari Y. Sementara itu, pengujian hipotesis biasanya dilakukan pada parameter regresi.
A. Inferensia 𝜷𝟏
• Hipotesis
Sebenarnya, hipotesis yang dapat dibuat tergantung pada penentuan nilai parameter yang akan
diuji. Dengan kata lain, secara general hipotesisnya adalah 𝛽1 = 𝛽10 . Akan tetapi, nilai parameter
yang sering diuji adalah apakah 𝛽1 = 0, yakni kasus saat 𝛽10 = 0.
11
∑𝑛 ̅
𝑖=1(𝑋𝑖 −𝑋)(𝑌𝑖 −𝑌)
̅ 𝑀𝑆𝐸
𝑏1 = ∑𝑛 (𝑋 ̅ ) 2 𝑠(𝑏1 ) = √∑𝑛 ̅ 2
𝑖=1 𝑖 −𝑋 𝑖=1(𝑋𝑖 −𝑋)
dengan :
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌𝑖 )
𝑀𝑆𝐸 = 𝑛−2
pembagi bernilai n-2 karena terdapat dua parameter yang diestimasi dalam
kasus RLS.
• Statistik Uji
𝑏1
𝑡ℎ𝑖𝑡 =
𝑠(𝑏1 )
• Daerah Penolakan 𝑯𝟎
• Kesimpulan
Jika 𝐻0 ditolak, kesimpulan yang didapatkan adalah terdapat pengaruh perubahan yang
signifikan dari variabel X terhadap variabel Y.
• Interval Kepercayaan
𝑃 [𝑏1 − 𝑡(1−𝛼,𝑛−2) 𝑠(𝑏1 ) ≤ 𝛽1 ≤ 𝑏1 + 𝑡(1−𝛼,𝑛−2) 𝑠(𝑏1 )] = 1 − 𝛼
2 2
B. Inferensia 𝜷𝟎
Inferensia untuk parameter 𝛽0 jarang dilakukan karena dalam analisis regresi tujuan yang
umumnya ingin dicapai adalah menentukan apakah variabel bebas yang digunakan berpengaruh
secara signifikan terhadap peningkatan dari variabel terikatnya. Akan tetapi, inferensia terhadap
parameter 𝛽0 sebenarnya dapat dilakukan saat cakupan model memuat 𝑋 = 0.
• Hipotesis
• Dua arah Satu arah kanan Satu arah kiri
𝐻0 ∶ 𝛽0 = 0 𝐻0 ∶ 𝛽0 ≤ 0 𝐻0 ∶ 𝛽0 ≥ 0
𝐻1 ∶ 𝛽0 ≠ 0 𝐻1 ∶ 𝛽0 > 0 𝐻1 ∶ 𝛽0 < 0
Inferensia parameter 𝛽0 dilakukan dengan menggunakan estimator 𝑏0 . Estimasi titik dan
standar error 𝑏0 diberikan sebagai berikut :
1 𝑋̅ 2
𝑏0 = 𝑌̅ − 𝑏1 𝑋̅ 𝑠(𝑏0 ) = √𝑀𝑆𝐸 [𝑛 + ∑𝑛 ̅ 2
]
𝑖=1 𝑖 −𝑋)
(𝑋
dengan :
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌𝑖 )
𝑀𝑆𝐸 = 𝑛−2
pembagi bernilai n-2 karena terdapat dua parameter yang diestimasi dalam
kasus RLS.
• Statistik Uji
𝑏0
𝑡ℎ𝑖𝑡 =
𝑠(𝑏0 )
12
• Daerah Penolakan 𝑯𝟎
Dua arah Satu arah kanan Satu arah kiri
|𝑡ℎ𝑖𝑡 | > 𝑡(1−𝛼,𝑛−2) 𝑡ℎ𝑖𝑡 > 𝑡(1−𝛼,𝑛−2) 𝑡ℎ𝑖𝑡 < −𝑡(1−𝛼,𝑛−2)
2
Dengan :
𝑡(1−𝛼,𝑛−2) : Menyatakan titik kritis distribusi t dengan derajat bebas n-2 yang luasan kiri sebesar
2
𝛼
1−2.
• Kesimpulan
Jika 𝐻0 ditolak, kesimpulan yang didapatkan adalah terdapat perbedaan nilai yang signifikan
dari nol untuk Y saat 𝑋 = 0.
• Interval Kepercayaan
𝑃 [𝑏0 − 𝑡(1−𝛼,𝑛−2) 𝑠(𝑏0 ) ≤ 𝛽0 ≤ 𝑏0 + 𝑡(1−𝛼,𝑛−2) 𝑠(𝑏0 )] = 1 − 𝛼
2 2
• Hipotesis
𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
Dasar : Partisi dari Sum of Squares Total (SST) dan derajat bebas.
𝑌𝑖 − 𝑌̅ = (𝑌𝑖 − 𝑌̂𝑖 ) + (𝑌
̂𝑖 − 𝑌̅)
𝑛 𝑛 𝑛
̂𝑖 )2 + ∑(𝑌
∑(𝑌𝑖 − 𝑌̅)2 = ∑(𝑌𝑖 − 𝑌 ̂𝑖 − 𝑌̅)2
𝑖=1 𝑖=1 𝑖=1
Dengan :
𝑆𝑆𝑇 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2
̂𝑖 )2
𝑆𝑆𝐸 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌
𝑆𝑆𝑅 = ∑𝑛𝑖=1(𝑌̂𝑖 − 𝑌̅)2
Dengan kata lain, 𝑆𝑆𝑇 = 𝑆𝑆𝐸 + 𝑆𝑆𝑅.
• Tabel Anova
Sumber Derajat Bebas Jumlah Kuadrat Rata-rata Jumlah Stat Uji (F)
Kuadrat
Regresi 1 SSR 𝑆𝑆𝑅 𝑀𝑆𝑅
𝑀𝑆𝑅 = 𝐹ℎ𝑖𝑡 =
1 𝑀𝑆𝐸
Error n-2 SSE 𝑆𝑆𝐸
𝑀𝑆𝐸 =
𝑛−2
Total n-1 SST
13
• Keputusan
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡 > 𝐹(1−𝛼;1,𝑛−2) .
𝐹(1−𝛼;1,𝑛−2) adalah titik kritis distribusi F dengan derajat bebas pembilang bernilai 1 dan derajat
bebas penyebut bernilai n-2 yang memiliki luasan kiri sebesar 1 − 𝛼.
Dengan demikian, dapat dibentuk interval kepercayaan (1 − 𝛼)100% untuk 𝐸(𝑌ℎ ) adalah :
̂
𝑃 [𝑌 ̂ ̂ ̂
ℎ − 𝑡(1−𝛼,𝑛−2) 𝑠(𝑌ℎ ) ≤ 𝐸(𝑌ℎ ) ≤ 𝑌ℎ + 𝑡(1−𝛼,𝑛−2) 𝑠(𝑌ℎ )] = 1 − 𝛼
2 2
14
Dengan standar error :
1 (𝑋ℎ.𝑛𝑒𝑤 − 𝑋̅)2
𝑠(𝑌̂
ℎ.𝑛𝑒𝑤 ) = √𝑀𝑆𝐸 (1 + + )
𝑛 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌𝑖 )
𝑀𝑆𝐸 = pembagi bernilai n-2 karena terdapat dua parameter yang diestimasi dalam
𝑛−2
kasus RLS.
Dengan demikian, dapat dibentuk interval kepercayaan (1 − 𝛼)100% untuk 𝐸(𝑌ℎ ) adalah :
𝑃 [𝑌̂ ̂ ̂ ̂
ℎ.𝑛𝑒𝑤 − 𝑡(1−𝛼 ,𝑛−2) 𝑠(𝑌ℎ.𝑛𝑒𝑤 ) ≤ 𝑌ℎ.𝑛𝑒𝑤 ≤ 𝑌ℎ.𝑛𝑒𝑤 + 𝑡(1−𝛼,𝑛−2) 𝑠(𝑌ℎ.𝑛𝑒𝑤 )] = 1 − 𝛼
2 2
A. Syarat
Terdapat amatan berulang pada satu atau lebih nilai 𝑋.
B. Langkah Pengujian
• Hipotesis
𝐻0 : Model linear cocok untuk menjelaskan hubungan antara X danY
(𝐸(𝑌𝑖 ) = 𝛽0 + 𝛽1 𝑋𝑖 )
𝐻1 : Model linear tidak cocok untuk menjelaskan hubungan antara X danY
(𝐸(𝑌𝑖 ) ≠ 𝛽0 + 𝛽1 𝑋𝑖 )
• Perhitungan Anova
𝑆𝑆𝑇 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2
2
𝑆𝑆𝐸 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌
̂𝑖 )
2
𝑆𝑆𝑅 = ∑𝑛𝑖=1(𝑌
̂𝑖 − 𝑌̅)
Dan
𝑆𝑆𝑇 = 𝑆𝑆𝐸 + 𝑆𝑆𝑅
Selanjutnya
𝑆𝑆𝐸 = 𝑆𝑆𝑝𝑒 + 𝑆𝑆𝑙𝑜𝑓
Dengan
𝑘 𝑛𝑘
2
𝑆𝑆𝑝𝑒 = ∑ ∑(𝑌𝑖𝑗 − 𝑌̅𝑖 . )
𝑖=1 𝑗=1
𝑆𝑆𝑙𝑜𝑓 = 𝑆𝑆𝐸 − 𝑆𝑆𝑝𝑒
𝑛𝑖 =banyaknya amatan pada 𝑥𝑖 yang berulang
k =banyaknya 𝑥𝑖 yang mengandung pengulangan
15
Error n-2 SSE 𝑆𝑆𝐸 𝐹
𝑀𝑆𝐸 = 𝑛−2 ℎ𝑖𝑡.𝑙𝑜𝑓=
𝑀𝑆𝑙𝑜𝑓
• Lack of Fit • k-2 • 𝑆𝑆𝑙𝑜𝑓 𝑆𝑆𝑙𝑜𝑓
𝑀𝑆𝑝𝑒
• 𝑀𝑆𝑙𝑜𝑓 =
• Pure error • n-k • 𝑆𝑆𝑝𝑒 𝑘−2
𝑆𝑆𝑝𝑒
• 𝑀𝑆𝑝𝑒 = 𝑛−𝑘
Total n-1 SST
• Daerah Penolakan
Tolak 𝐻0 jika didapatkan 𝐹ℎ𝑖𝑡.𝑙𝑜𝑓 > 𝐹(1−𝛼;𝑘−2,𝑛−𝑘). Jika didapatkan tolak 𝐻0 , model regresi lain
perlu digunakan. Jika didapatkan gagal tolak 𝐻0 , model linear sudah cocok untuk menjelaskan
hubungan antara X dan Y.
A. Pemeriksaan Residual
Pemeriksaan residual bermanfaat untuk memeriksa adanya penyimpangan pada model regresi
linear sederhana dengan beberapa asumsi yang telah disebutkan. Beberapa penyimpangan pada
model regresi yang dapat terjadi di antaranya :
o Fungsi regresi tidak linear
o Suku error tidak memiliki varian konstan
o Suku error tidak saling bebas
o Outlier yang mengganggu model regresi
o Error yang tidak menyebar normal
• Normalitas
Normalitas dapat ditunjukkan dengan plot antara residual yang diurutkan 𝑒(𝑖) dengan nilai
harapannya 𝐸(𝑒(𝑖) ) (Normal Probability Plot). Asumsi kenormalan terpenuhi jika pencaran
titik-titiknya membentuk atau mendekati suatu garis linear.
• Homoskedastisitas
16
Homoskedastisitas dapat ditunjukkan dengan plot antara nilai-nilai residual 𝑒𝑖 dengan nilai 𝑋𝑖
̂𝑖 (plot yang untuk mengecek linearitas). Asumsi ini terpenuhi jika titik-titik pada plot
atau 𝑌
menunjukkan pola yang acak.
• Autokorelasi
Autokorelasi dapat terjadi terutama jika data yang digunakan untuk analisis regresi merupakan
data time series. Pemeriksaan autokorelasi dapat dilakukan dengan membuat plot antara 𝑒𝑡
(residual pada waktu ke t) dengan waktu (t).
17
B. Estimasi Parameter Koefisien Regresi Linear Berganda
Salah satu metode yang dapat digunakan untuk mengestimasi parameter koefisien regresi linear
berganda adalah Ordinary Least Square (OLS). Caranya sama seperti pada kasus regresi linear
sederhana, yakni meminimalkan kuadrat residual.
𝑛 𝑛
2
𝑄= ∑ 𝜀𝑖2 = ∑[𝑌𝑖 − (𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + ⋯ + 𝛽𝑝−1 𝑋𝑖.𝑘 )]
𝑖=1 𝑖=1
Lakukan diferensial secara parsial fungsi Q terhadap masing-masing 𝛽0 , 𝛽1 , … , 𝛽𝑘 sama dengan
nol sehingga didapatkan persamaan normal untuk mencari 𝑏1 , 𝑏2 , … , 𝑏𝑘 dalam bentuk matriks
sebagai berikut :
𝒃 = (𝑿𝑇 𝑿)−𝟏 𝑿𝑇 𝒀
𝑛 𝑛 𝑛 −1 𝑛
C. Pengujian Hipotesis
• Uji Simultan
Pengujian simultan dilakukan untuk menguji secara simultan apakah terdapat variabel bebas
yang berpengaruh dalam regresi linear beganda. Pengujian ini dilakukan menggunakan
pendekatan ANOVA.
Hipotesis :
𝐻0 : 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑝−1 = 0
(Tidak terdapat satupun variabel bebas yang menjelaskan hubungan dengan variabel terikat)
𝐻1 : 𝛽𝑖 ≠ 0 ; 𝑖 ∈ {1,2, … , 𝑘}
(Terdapat minimal satu variabel bebas yang menjelaskan hubungan dengan variabel terikat)
Perhitungan ANOVA :
𝟏 1
SST = 𝐘 𝐓 𝒀 − 𝒏 𝒀𝑻 𝑱𝒀 = ∑ 𝑌 2 − 𝑛 (∑ 𝑌)2 = 𝑆𝑆𝑅 + 𝑆𝑆𝐸
𝟏 1
SSR = 𝛃𝐓 𝑿𝑻 𝒀 − 𝒏 𝒀𝑻 𝑱𝒀 =𝛃𝐓 𝑿𝑻 𝒀 − 𝑛 (∑ 𝑌)2
SSE = 𝐘 𝐓 𝒀 − 𝜷𝑻 𝑿𝑻 𝒀 = ∑ 𝑌 2 − 𝜷𝑻 𝑿𝑻 𝒀
Dengan :
1 1 … 1
1 1 … 1
𝐽=[ ]
⋮ ⋮ ⋱ ⋮
1 1 1 1 𝑛𝑥𝑛
18
Tabel ANOVA :
Sumber
SS Df MS 𝐹ℎ𝑖𝑡𝑢𝑛𝑔
Keragaman
𝑆𝑆𝑅
Regresi 𝑆𝑆𝑅 𝑘 𝑀𝑆𝑅 =
𝑘 𝑀𝑆𝑅
𝑆𝑆𝐸 𝑀𝑆𝐸
Error 𝑆𝑆𝐸 𝑛−𝑘−1 𝑀𝑆𝐸 =
𝑛−𝑘−1
Total 𝑆𝑆𝑇 𝑛−1
Daerah Penolakan 𝐻0 :
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹(1−𝛼;𝑘,𝑛−𝑘−1)
Jika tolak 𝐻0 , dapat dikatakan bahwa minimal ada satu variabel bebas yang signifikan/ model
dapat menjelaskan hubungan antar variabel.
• Uji Parsial
Uji ini digunakan untuk menguji apakah variabel bebas tertentu signifikan di dalam model
(apakah signifikan mempengaruhi variabel tak bebas).
Hipotesis:
𝐻0 : 𝛽𝑗 = 0
(variabel bebas ke-j tidak signifikan mempengaruhi variabel tak bebas)
𝐻1 : 𝛽𝑗 ≠ 0
(variabel bebas ke-j signifikan mempengaruhi variabel tak bebas)
Statistik uji:
𝑏𝑗
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
𝑠(𝑏𝑗 )
𝑠 2 (𝑏0 ) 𝑠 2 (𝑏0 , 𝑏1 ) 𝑠 2 (𝑏0 , 𝑏11 )
−𝟏 𝑆𝑆𝐸
𝑠 2 (𝑏) = 𝑀𝑆𝐸(𝐗 𝐓 𝑿) = [ 𝑠 2 (𝑏1 , 𝑏0 ) 𝑠 2 (𝑏1 ) 𝑠 2 (𝑏1 , 𝑏11 )] ; 𝑀𝑆𝐸 = 𝑛−𝑝
𝑠 2 (𝑏11 , 𝑏0 ) 𝑠 2 (𝑏11 , 𝑏1 ) 𝑠 2 (𝑏11 )
Daerah Penolakan 𝐻0 :
Tolak 𝐻0 jika |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | > |𝑡(1−𝛼;𝑛−2) |
2
Jika tolak 𝐻0 , dapat dikatakan bahwa variabel bebas ke-j signifikan mempengaruhi variabel tak
bebas (Y).
2. Normalitas
Plot antara residual yang diurutkan ei dengan nilai harapannya 𝐸(𝑒𝑖 ) memiliki pencaran titik
yang membentuk suatu garis linier, maka asumsi kenormalan terpenuhi.
19
3. Homoskedastisitas
Jika plot antara ei dengan Xi menunjukan pola acak, atau plot antara ei dengan Yi menunjukan
pola acak, maka asumsi kesamaan varians (homoskedastisitas) terpenuhi.
4. Independensi/Autokorelasi
Sering terjadi terutama pada data time series dan dapat menimbulkan masalah serius pada nilai
penduga dari varians sample (MSE).
5. Multikollinieritas
Merupakan korelasi antar variabel bebas pada model regresi berganda. Diindikasikan dengan
nilai VIF (Variance Inflaction Factor). Jika nilai VIF besar dari 10 meningindikasikan adanya
multikolinieritas. Untuk melakukan analisis regresi linier berganda, antar variabel independen
tidak boleh memiliki ketergantungan.
a. Menentukan 𝑆𝑆𝐸(𝑋1 )
𝑆𝑆𝐸(𝑋1 ) adalah jumlah kuadrat error (residual) pada model regresi yang hanya melibatkan
𝑋1 sebagai variabel bebasnya, sedangkan 𝑆𝑆𝐸(𝑋1 , 𝑋2 ) adalah jumlah kuadrat error (residual)
yang didapat pada model regresi berganda yang terdapat 𝑋1 dan 𝑋2 sebagai variabel
bebasnya.
𝑌̂𝑖 = 𝑏0 + 𝑏1 𝑋𝑖
2
𝑆𝑆𝐸(𝑋𝑖 ) = ∑(𝑌𝑖 − 𝑌̂𝑖 ) = ∑ 𝑌 2 − 𝑏0 ∑ 𝑌 − 𝑏1 ∑ 𝑋𝑌
20
b. Menentukan 𝑆𝑆𝑅(𝑋𝑖 |𝑋𝑗 )
Contoh: 𝑆𝑆𝑅(𝑋1 |𝑋2 ) = 𝑆𝑆𝑅(𝑋1 , 𝑋2 ) − 𝑆𝑆𝑅(𝑋2 ) = 𝑆𝑆𝐸(𝑋2 ) − 𝑆𝑆𝐸(𝑋1 , 𝑋2 )
2
c. Menentukan 𝑅𝑦(𝑥 𝑖 |𝑥𝑗 )
d. Kesimpulan
2
Misal: 𝑅𝑌(𝑋1 |𝑋2 )
= 0,86
Keragaman nilai variabel Y yang dapat dijelaskan oleh variabel 𝑋1 tetapi tidak dapat
dijelaskan oleh 𝑋2 sebesar 86%.
A. Definisi
Regresi linear sederhana dan regresi linear berganda yang telah dibahas sebelumnya selalu
menggunakan variabel kuantitatif sebagai variabel bebasnya. Regresi dengan variabel dummy
atau regresi kualitatif pada dasarnya adalah meng”kuantitatifkan” data kualitatif dengan cara
menjadikannya kode 0 dan 1. Bila suatu variabel bebas memiliki k kategori, variabel indikator
yang dibuat sebanyak (k-1) variabel indikator yang masing-masing bernilai 0 atau 1. Dummy
yang bernilai 0 disebut dengan kategorik pembanding atau dasar atau reference.
Contoh 2 :
Regresi dengan variabel bebas kuantitatif dan kualitatif
Y = Gaji pegawai
𝑋1 =Pengalaman Kerja (tahun)
𝑋2 =Skor ujian
𝑋3 =Jenis kelamin (0=perempuan dan 1=laki-laki)
21
Model :
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + 𝛽3 𝐷𝑖3 + 𝜀𝑖
Dengan demikian,
• Perkiraan rata-rata gaji pegawai dengan pengalaman kerja 0 tahun, skor ujian 0, dan
berjenis kelamin perempuan adalah sebesar 𝛽0 .
• Jika pengalaman kerja naik sebesar 1, perkiraan rata-rata gaji pegawai akan naik sebesar 𝛽1
dengan skor ujian dan jenis kelamin yang sama.
• Jika skor ujian naik sebesar 1 satuan, perkiraan rata-rata gaji pegawai akan naik sebesar 𝛽2
dengan pengalaman kerja dan jenis kelamin yang sama.
• Jika pegawai berjenis kelamin laki-laki, perkiraan rata-rata gaji pegawai akan naik sebesar
𝛽3 dengan pengalaman kerja dan skor ujian yang sama.
Contoh 3 :
Regresi dengan variabel bebas kuantitatif dan kualitatif (lebih dari dua kategori)
Y = Gaji pegawai
𝑋1 =Pengalaman Kerja (tahun)
𝑋2 = Skor ujian
𝑋3 = Jenis Kelamin (0=perempuan dan 1=laki-laki)
𝑋4 = Tingkat Pendidikan (SMA, sarjana, dan pascasarjana)
Dalam kasus ini, variabel bebas 𝑋4 memiliki 3 kategori sehingga akan dibuat 2 indikator yang
masing-masing bernilai 0 atau 1. Indikator yang dimaksud 𝑋4.𝑠𝑎𝑟𝑗𝑎𝑛𝑎 dan 𝑋4.𝑝𝑎𝑠𝑐𝑎𝑠𝑎𝑟𝑗𝑎𝑛𝑎 . Jika
kedua indikator ini bernilai 0, berarti secara otomatis pegawai tersebut memiliki tingkat
Pendidikan SMA.
Model :
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + 𝛽3 𝐷𝑖3 + 𝛽4.𝑠𝑎𝑟𝑗𝑎𝑛𝑎 𝐷4.𝑠𝑎𝑟𝑗𝑎𝑛𝑎 + 𝛽4.𝑝𝑎𝑠𝑐𝑎𝑠𝑎𝑟𝑗𝑎𝑛𝑎 𝐷4.𝑝𝑎𝑠𝑐𝑎𝑠𝑎𝑟𝑗𝑎𝑛𝑎 + 𝜀𝑖
22
POLITEKNIK STATISTIKA STIS
JAKARTA
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2017/2018
MATA KULIAH : ANALISIS REGRESI
TINGKAT : II
DOSEN : TIM DOSEN
HARI/TANGGAL : RABU/25 APRIL 2018
WAKTU : 2 JAM
SIFAT UJIAN : TUTUP BUKU – BOLEH MENGGUNAKAN KALKULATOR
Berdoalan Sebelum Bekerja
1. (NILAI 30)
Indeks Pembangunan Manusia (IPM) menjelaskan bagaimana penduduk dapat mengakses hasil
pembangunan dalam memperoleh pendapatan, kesehatan, pendidikan dan sebagainya. Salah satu
variabel yang diduga memengaruhi nilai IPM suatu kabupaten adalah persentase pengeluaran
pemerintah daerah untuk pendidikan. Berikut data di setiap kabupaten di Provinsi Papua Barat tahun
2016 (data hipotetik).
Kabupaten IPM Presentase Pengeluaran
untuk pendidikan
Fakfak 66 8,2
Kaimana 62 7,8
Teluk Wondana 57 6,6
Teluk Bintuni 62 7,6
Manokwari 70 7,8
Sorong Selatan 59 7,0
Sorong 62 7,6
Raja Ampat 62 7,5
Tambrauw 50 4,7
Maybrat 56 6,3
Manokwari Selatan 57 6,3
Pegunungan Arfak 54 4,9
a. Bangun model regresi untuk menjelaskan pengaruh persentase pengeluaran pemerintah daerah
untuk pendidikan terhadap IPM di Provinsi Papua Barat tahun 2016. Interpretasikan nilai
koefisien regresi.
b. Apakah persentase pengeluaran pemerintah daerah untuk pendidikan signifikan memengaruhi
nilai IPM? Gunakan tingkat signifikansi 5%.
c. Buatlah prediksi interval 95% untuk IPM Kota Sorong yang memiliki persentase pengeluaran
untuk pendidikan 10,9%.
2. (NILAI 35)
Provinsi A ingin mengetahui model hubungan antara Tingkat Persentase Angkatan Kerja (TPAK)
terhadap performa perekonomian daerahnya yang dilihat dari aspek nilai total output (PDRB). Provinsi
A meliputi 15 kabupaten, di mana berdasarkan nilai TPAKnya kelima belas kabupaten/kota tersebut
terbagi menjadi 5 level. Model awal yang mereka lakukan adalah pemodelan linier sederhana. Namun
diperoleh informasi tambahan bahwa antara TPAK dengan PDRB tidak sesederhana itu, bisa saja
didapatkan efek hubungan yang tidak linier antara TPAK dengan nilai PDRB. Kemudian dilakukan
23
pemodelan kuadratik berdasarkan informasi tersebut. Anda sebagai seorang statistisi diminta
pendapatnya untuk menanggapi hasil dari dua pemodelan berikut ini. Gunakan tingkat signifikansi 5%.
Jika diperlukan.
Komponen yang diketahui Model Linier Sederhana Model Kuadratik
Jumlah Kuadrat Simpangan 0,2027 1,477
rata-rata PDRB terhadap
nilai estimasinya (fitted
value)
Jumlah kuadrat simpangan 0,58 -
nilai PDRB terhadap nilai
rata-rata pada setiap level
TPAK
Estimasi Varians Error 151 0.06
Konstanta 2,306 (𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 4,917) 7.96 (𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 6,323)
Efek Linier 0,007 (𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 1,151) -0,154 (𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = −4,399)
Efek Kuadratik - 0,001 (𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 4,618)
a. Sebaiknya model apa yang paling tepat untuk menjelaskan hubungan antara TPAK dan PDRB di
Provinsi A? Jelaskan alasannya secara sistematik dan statistik!
b. Tuliskan persamaan yang paling baik menunjukkan hubungan antara TPAK dengan PDRB.
Interpretasikan persamaannya!
c. Berapa nilai Koefisien determinasi model yang anda pilih dan jelaskan maknanya!
3. (NILAI 35). Seorang mahasiswa STIS ingin melakukan penelitian apakah nilai Analisis Regresi
seorang mahasiswa dipengaruhi oleh nilai Metode Statistika II (X1), lama belajar kelompok selama
seminggu (X2 dalam jam) dan lama belajar secara mandiri selama seminggu (X3 dalam jam). Berikut
ditampilkan output pengolahan dari 15 orang mahasiswa.
ANOVA
Model Sum of Square df Mean Square
1 Regression … … …
𝑋1 … …
𝑋2 , 𝑋3 |𝑋1 … …
Residual 0,830 … …
Total … …
Coefficient
Model Unstandardized Standardized 𝑏𝑖
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
Coefficient Coefficient 𝑠(𝑏𝑖 )
B Std.error Beta
1 Constant 0,232 0,552
𝑋1 0,213 0,064 0,245 …
𝑋2 0,101 0,040 0,344 …
𝑋3 0,152 0,042 0,383 …
Dependent variable: Y
Diketahui:
𝑆𝑆𝑅(𝑋1 ) = 13,630
24
𝑆𝑆𝐸(𝑋1 ) = 10,103
𝑆𝑆𝐸(𝑋2 ) = 3,015
𝑆𝑆𝐸(𝑋3 ) = 2,447
𝑆𝑆𝐸(𝑋1 , 𝑋2 ) = 1,795
𝑆𝑆𝐸(𝑋1 , 𝑋3 ) = 1,315
𝑆𝑆𝐸(𝑋2 , 𝑋3 ) = 1,678
a. Lengkapilah tabel ANOVA dan Coefficients tersebut!
b. Buatlah persamaan regresinya serta interpretasikan nilai koefisien regresinya!
c. Berapa persen keragaman nilai analisis regresi yang dapat dijelaskan oleh Metode Statistika II,
lama belajar kelompok dan lama belajar mandiri? Jelaskan!
d. Apakah ketiga variable tersebut memengaruhi nilai analisis regresi? Jelaskan!
e. Hitunglah Koefisien determinasi parsial dan koefisien korelasi parsial untuk setiap variable
bebas, jika 2 variabel bebas yang lain sudah ada di dalam model! Interpretasikan hasilnya!
25
PEMBAHASAN UTS GENAP 2017/2018
ANALISIS REGRESI
1.
∑ 𝑌 = 717
∑ 𝑋 = 82,3
∑ 𝑋 2 = 578,73
∑ 𝑋𝑌 = 4978,9
∑ 𝑌 2 = 43163
IPM sebagai variable dependen
𝑠𝑥𝑦 𝑛 ∑ 𝑋𝑌−∑ 𝑋 ∑ 𝑌 737,7
a. 𝑏1 = = 2 = = 4,3022
𝑠𝑥2 𝑛 ∑ 𝑋 −(∑ 𝑋)2 171,47
Interpretasi : Untuk setiap penambahan 1 persen pengeluaran pemerintah untuk pendidikan
akan meningkatkan Indeks Pembangunan Manusia (IPM) sebesar 4,3022 di Provinsi Papua.
b.
➢ 𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠
𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
➢ Taraf Uji 𝛼 = 5%
➢ Statistik Uji
2
𝑆𝑆𝐸 ∑(𝑌𝑖 − 𝑌̂𝑖 ) ∑ 𝑌𝑖2 − 𝑏0 ∑ 𝑌𝑖 − 𝑏1 ∑ 𝑋𝑖 𝑌𝑖
𝑀𝑆𝐸 = = = = 5,7828
𝑛−2 𝑛−2 𝑛−2
𝑀𝑆𝐸
𝑠 2 (𝑏1 ) = = 0,4047
∑(𝑋𝑖 − 𝑋̅)2
𝑠(𝑏1 ) = √𝑠 2 (𝑏1 ) = √0,4047 = 0,6362
𝑏1 4,3022
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = = = 6,7628
𝑠(𝑏1 ) 0,6362
➢ Keputusan
Karena 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 > 𝑡𝛼 atau 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 < −𝑡𝛼 maka tolak 𝐻0
➢ Kesimpulan
Dengan tingkat kepercayaan 95% persentase pengeluaran pemerintah untuk pendidikan
berpengaruh signifikan terhadap indeks pembangunan manusia (IPM).
26
c.
2 2
1 (𝑋ℎ − 𝑋̂) 𝑛(𝑋ℎ − 𝑋̂)
𝑠 2 (𝑌ℎ 𝑛𝑒𝑤) = 𝑀𝑆𝐸(1 + + =
𝑛 ∑(𝑋 − 𝑋̂)2 𝑛 ∑ 𝑋 2 − (∑ 𝑋)2
𝑖
1 12(10,9 − 6,8583)2
= 5,7828 (1 + + ) = 12,8755
12 171,47
𝑠(𝑌ℎ 𝑛𝑒𝑤) = √12,8755 = 3,5882
𝑌̂ℎ = 30,2240 + 4,3022 × 10,9 = 77,1179
𝑃 [𝑌ℎ − 𝑡(1−𝛼;𝑛−2) 𝑠(𝑌̂ℎ 𝑛𝑒𝑤) ≤ 𝑌ℎ 𝑛𝑒𝑤 ≤ 𝑡(1−𝛼;𝑛−2) 𝑠(𝑌̂ℎ 𝑛𝑒𝑤) + 𝑌ℎ ] = 1 − 𝛼
2 2
𝑃[77,1179 − 2,2281 × 3,5882 ≤ 𝑌ℎ 𝑛𝑒𝑤 ≤ 77,1179 + 2,2281 × 3,5882] = 95%
𝑃[69,123 ≤ 𝑌ℎ 𝑛𝑒𝑤 ≤ 85,1128] = 95%
2.
a. Uji t
➢ Model Linier
𝐻0 : 𝛽0 = 0
𝐻1 : 𝛽0 ≠ 0
𝐻0: 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
Taraf Uji 𝛼 = 5%
Statistik Uji
𝑏𝑖
𝑡=
𝑠(𝑏𝑖 )
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 4,917 (𝑏0 )
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 1,151 (𝑏1 )
𝑡0,975;13 = 2,160
Keputusan
Untuk 𝛽0 tolak 𝐻0 karena 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 ≥ 𝑡𝑡𝑎𝑏𝑒𝑙
Untuk 𝛽1 gagal tolak 𝐻0 karena 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 < 𝑡𝑡𝑎𝑏𝑒𝑙
Kesimpulan
Dengan signifikansi 5% dapat dinyatakan bahwa variabel 𝑥 tidak berpengaruh secara
signifikan terhadap variabel 𝑦.
➢ Model Kuadratik
𝐻0 : 𝛽0 = 0
𝐻1 : 𝛽0 ≠ 0
𝐻0: 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
27
𝐻0: 𝛽11 = 0
𝐻1 : 𝛽11 ≠ 0
Taraf uji 𝛼 = 5%
Statistik Uji
𝑏𝑖
𝑡=
𝑠(𝑏𝑖 )
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 6,323 (𝑏0 )
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = −4,399 (𝑏1 )
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 4,618 (𝑏11 )
𝑡0,975;11 = 2,201
Keputusan
Untuk 𝛽0 , 𝛽1 , 𝛽11 tolak 𝐻0 karena 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 ≥ 𝑡𝑡𝑎𝑏𝑒𝑙 𝑎𝑡𝑎𝑢 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 ≤ −𝑡𝑡𝑎𝑏𝑒𝑙
Kesimpulan
Dengan taraf uji 0,05, efek linier dan efek kuadratik pada variabel 𝑥 di dalam model
berpengaruh secara signifikan terhadap variabel 𝑦.
Dari hasil tersebut, sudah cukup untuk mengatakan bahwa model kuadratik lebih cocok
digunakan karena semua koefisien regresinya signifikan. Dapat juga dilakukan uji ketepatan
model atau uji F dengan ANOVA.
Linier Kuadratik
𝑛=15 𝑐=5 𝑛=15
𝑆𝑆𝑅=0,2027 𝑆𝑆𝑅=1,477
𝑆𝑆𝑃𝐸=0,58 𝑀𝑆𝐸=0,06
Estimasi Varians Error = MSE = 151* 𝑆𝑆𝐸=𝑀𝑆𝐸×𝑑𝑓=0,06×12=0,72
𝑆𝑆𝑇=𝑆𝑆𝑅+𝑆𝑆𝐸=1,477+0,72=2,197
* Setelah dikonfirmasi dengan Pak Agung Priyo Utomo, nilai MSE = 151 tidak masuk akal,
karena nilai SSE dan SSR akan sangat berbeda jauh yang juga mengakibatkan nilai F-test yang
sangat besar. Sehingga menurut beliau angka tersebut adalah kesalahan soal.
𝑆𝑆𝑅 1,477
c. 𝑅 2 = 𝑆𝑆𝑇 = 2,197 = 0,67288 = 67,3%
Interpretasi : Dengan menggunakan model kuadratik, keragaman nilai PDRB yang dapat
dijelaskan oleh TPAK sebesar 67,3% dan sisanya dipengaruhi variabel lain yang tidak termasuk
ke dalam model.
3.
a. Melengkapi tabel
𝑆𝑆𝑅(𝑋2 , 𝑋3 |𝑋1 ) = 𝑆𝑆𝐸(𝑋1 ) − 𝑆𝑆𝐸(𝑋1 , 𝑋2 , 𝑋3 ) = 10,103 − 0,830 = 9,273
28
𝑆𝑆𝑅(𝑋1 , 𝑋2 , 𝑋3 ) = 𝑆𝑆𝑅(𝑋1 ) + 𝑆𝑆𝑅(𝑋2 , 𝑋3 |𝑋1 ) = 13,630 + 9,273 = 22,903
𝑆𝑆𝑇 = 𝑆𝑆𝑅 + 𝑆𝑆𝐸 = 22,903 + 0,830 = 23,733
ANOVA
Model Sum of Square df Mean Square
1 Regression 22,903 3 7,635
𝑋1 13,630 1
𝑋2 , 𝑋3 |𝑋1 9,273 2
Residual 0,830 11 0,0754
Total 23,733 14
Coefficient
Model Unstandardized Standardized 𝑏𝑖
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
Coefficient Coefficient 𝑠(𝑏𝑖 )
B Std.error Beta
1 Constant 0,232 0,552
𝑋1 0,213 0,064 0,245 3,34
𝑋2 0,101 0,040 0,344 2,525
𝑋3 0,152 0,042 0,383 3,619
• Nilai (rata-rata) mata kuliah analisis regresi mahasiswa STIS akan naik sebesar 0,152 jika
lama belajar mandiri ditambah satu jam per minggu, ketika variabel nilai metode statistika II
dan lama belajar kelompok selama seminggu dianggap konstan.
2 𝑆𝑆𝐸(𝑛−1) 0,830(15−1)
c. 𝑅(𝑋1 ,𝑋2 ,𝑋3 ,)(𝑎𝑑𝑗)
= 1 − 𝑆𝑆𝑇(𝑛−𝑝) = 1 − 23,733(15−4) = 0,9554 = 95,54%
Interpretasi:
Keragaman nilai mata kuliah analisis regresi mahasiswa STIS dapat dijelaskan secara bersama-
sama oleh variabel nilai metode statistika II, jam belajar kelompok (per minggu), dan jam belajar
mandiri (per minggu) sebesar 95,54% dan 4,46% sisanya dipengaruhi variabel lain yang tidak
termasuk di dalam model.
29
d. Uji parsial masing-masing parameter
➢ Hipotesis
o 𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
o 𝐻0 : 𝛽2 = 0
𝐻1 : 𝛽2 ≠ 0
o 𝐻0 : 𝛽3 = 0
𝐻1 : 𝛽3 ≠ 0
➢ Taraf Uji
𝛼 = 5%
➢ Statistik Uji
𝑏𝑖
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
𝑠(𝑏𝑖 )
∗
𝑡1 = 3,34
𝑡2∗ = 2,525
𝑡3∗ = 3,619
𝑡0,975;11 = 2,201
➢ Keputusan
Tolak 𝐻0 pada masing-masing parameter karena 𝑡𝑖∗ ≥ 𝑡0,975;11
➢ Kesimpulan
Dengan taraf uji 0,05, variabel nilai metode statistika II, lama jam belajar kelompok, lama jam
belajar mandiri berpengaruh secara signifikan terhadap nilai analisis regresi.
30
POLITEKNIK STATISTIKA STIS JAKARTA
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2018/2019
MATA KULIAH : ANALISIS REGRESI
TINGKAT : II
DOSEN : TIM DOSEN
HARI/TANGGAL : RABU/11 MARET 2019
WAKTU : 2 JAM
SIFAT UJIAN : TUTUP BUKU – BOLEH MENGGUNAKAN KALKULATOR
Berdoalah Sebelum Bekerja
1. (NILAI 35)
Diduga ada hubungan antara banyaknya lagu yang ada dalam folder musik laptop seseorang
dengan sudah berapa lama orang tersebut memiliki laptop tersebut. Datanya ditampilkan pada
tabel berikut dengan X = lamanya waktu memiliki laptop (dalam minggu) dan 𝑦 = banyaknya
lagu dalam folder musik laptop.
X 23 2 28 5 32 23 4 26 1 13 5
y 49 8 58 12 73 45 6 48 4 27 14
2. (NILAI 35).
Diketahui bahwa gaji seseorang data scientist (dalam juta rupiah) dipengaruhi oleh pengalaman
kerja (X1) (dalam tahun), skor kemampuan bidang statistika (X2), dan skor kemampuan bidang
komputasi (X3). Berikut adalah beberapa ringkasan hasil pengolahan berdasarkan data yang ada.
ANOVA
Model Sum of Square df Mean Square
1 Regression … … …
𝑋1 … … …
𝑋2 |𝑋1 … … …
𝑋3 |𝑋1 , 𝑋2 … … …
Residual … … …
Total … …
31
Coefficient
Model Unstandardized Standardized
Coefficient Coefficient
B Beta
1 Constant 3,631
𝑋1 0,490 0,559
𝑋2 0,355 0,358
𝑋3 0,090 0,088
𝑆𝑆𝐸(𝑋1 ) = 99,256
𝑆𝑆𝑅(𝑋1 |𝑋2 ) = 111,242
𝑆𝑆𝐸(𝑋1 , 𝑋3 ) = 84,913
𝑆𝑆𝐸(𝑋2 ) = 166,214
𝑆𝑆𝐸(𝑋2 , 𝑋3 ) = 107,490
𝑆𝑆𝑅(𝑋3 ) = 2573,168
𝑆𝑆𝑅(𝑋3 , 𝑋2 ) = 2658,5
𝑛 = 15
2
𝑟𝑦2.13 = 0,368165
3. (NILAI 30)
Berikut ini adalah data ekologi tentang area sebaran kerang (m2) dan jumlah spesies (SPECIES).
NO 1 2 3 4 5 6 7 8 9 10
AREA (m2) 5 5 5 9 14 18 17 18 31 40
SPECIES 3 7 6 8 10 9 10 11 16 9
NO 11 12 13 14 15 16 17 18 19 20
AREA (m2) 44 45 50 45 55 75 71 91 137 203
SPECIES 13 14 12 14 20 22 15 20 15 24
Misalkan peneliti ingin menyusun model regresi antara variabel SPECIES (𝑦) dan AREA (X)
menggunakan model 𝑦𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝛽11 𝑋𝑖2 + 𝜀𝑖
32
Diketahui:
𝑆𝑆𝑇 = 583,8
𝑆𝑆𝑅(𝑋) = 354,0438
𝑆𝑆𝑅(𝑋, 𝑋 2 ) = 417,0525
33
PEMBAHASAN UTS GENAP 2018/2019
ANALISIS REGRESI
1.
∑ 𝑋 = 162
∑ 𝑌 = 344
∑ 𝑋 2 = 3782
∑ 𝑋𝑌 = 7895
∑ 𝑌 2 = 16608
Banyaknya lagu dalam folder music sebagai Variabel dependen
̂𝑖 = 1,4336 + 2,0261𝑋𝑖
𝑌
c. Dari persamaan regresi, dapat kita buat nilai estimasi sebagai berikut
𝑋 23 2 28 5 32 23 4 26 1 13 5
𝑦 49 8 58 12 73 45 6 48 4 27 14
𝑦̂ 48,03 5,49 58,16 11,56 66,27 48,03 9,54 54,11 3,46 27,77 11,56
(𝑦 − 𝑦̂)2 0,933 6,321 0,027 0,19 45,309 9,205 12,517 37,359 0,292 0,597 5,934
➢ 𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠
𝐻0 : 𝐸(𝑌) = 𝛽0 + 𝛽1 𝑋𝑖
𝐻1 : 𝐸(𝑌) ≠ 𝛽0 + 𝛽1 𝑋𝑖
➢ Taraf Uji 𝛼 = 5%
➢ CR: 𝐹 ∗ > 𝐹0,05;7;2 𝑎𝑡𝑎𝑢 𝐹 ∗ > 118,685
34
➢ Statistik Uji
𝑆𝑆𝑃𝐸 = ∑(𝑦 − 𝑦̂)2 = 118,685
𝑆𝑆𝑃𝐸 118,685
𝑀𝑆𝑃𝐸 = = = 59,342
11 − 9 2
𝑆𝑆𝐿𝐹 = 𝑆𝑆𝐸 − 𝑆𝑆𝑃𝐸 = 118,782 − 118,685 = 0,097
𝑆𝑆𝐿𝐹 0,097
𝑀𝑆𝐿𝐹 = = = 0,014
9−2 7
𝑀𝑆𝐿𝐹 0,014
𝐹∗ = = = 0,0002
𝑀𝑆𝑃𝐸 59,342
➢ Keputusan
Karena 𝐹 ∗ < 𝐹0,05;2;17 maka gagal tolak 𝐻0
➢ Kesimpulan
Dengan tingkat signifikansi 5%, terdapat cukup bukti untuk menyatakan bahwa terdapat
hubungan linier antara banyaknya lagu yang ada dalam folder musik laptop dengan lamanya
waktu memiliki laptop.
d. Koefisien Determinasi
2
(∑ 𝑌)2 3442
𝑆𝑆𝑇 = ∑ 𝑌 − = 16608 − = 5850,1818
𝑛 11
𝑆𝑆𝐸 118,7821
𝑅2 = 1 − =1− = 0,9797 = 97,97%
𝑆𝑆𝑇 5850,1818
Jadi, model linier sudah cocok untuk menjelaskan hubungan antara banyaknya lagu yang ada
dalam folder musik laptop dengan sudah berapa lama laptop itu dimiliki karena model mampu
menjelaskan keragaman banyak lagu dalam folder musik sebesar 97,97%.
2.
a. Berdasarkan tabel “coefficients”, dapat kita susun persamaan regresi sebagai berikut.
𝑌̂𝑖 = 3,631 + 0,49𝑋𝑖 + 0,355𝑋2 + 0,09𝑋3
Interpretasi:
➢ Rata-rata gaji seorang data scientist dengan mengabaikan pengalaman kerja, skor
kemampuan bidang statistik, dan skor kemampuan bidang komputasi adalah
Rp3.631.000,00.
➢ Rata-rata gaji seorang data scientist akan naik sebesar Rp490.000,00 jika lama pengalaman
kerja lebih lama 1 tahun dengan mengabaikan skor kemampuan bidang statistik dan skor
kemampuan bidang komputasi.
➢ Rata-rata gaji seorang data scientist akan naik sebesar Rp355.000,00 jika skor kemampuan
bidang statistiknya lebih tinggi 1 poin dengan mengabaikan lama pengalaman kerja dan skor
kemampuan bidang komputasi
➢ Rata-rata gaji seorang data scientist akan naik sebesar Rp90.000,00 jika skor kemampuan
bidang komputasinya lebih tinggi 1 poin dengan mengabaikan lama pengalaman kerja dan
skor kemampuan statistik
35
2
𝑆𝑆𝑅(𝑋2 |𝑋1 , 𝑋3 ) = 𝑟𝑦2,13 × 𝑆𝑆𝐸(𝑋1 , 𝑋3 ) = 0,368165 × 84,913 = 31,262
ANOVA
Model Sum of Square df Mean Square
1 Regression 2712,349 3 904,116
𝑋1 2666,735 1 2666,735
𝑋2 |𝑋1 44,293 1 44,293
𝑋3 |𝑋1 , 𝑋2 1,321 1 1,321
Residual 53,651 11 4,877
Total 2766 14
c. Hipotesis
𝐻0 : 𝛽1 = 𝛽2 = 𝛽2
𝐻1 : 𝑀𝑖𝑛𝑖𝑚𝑎𝑙 𝑎𝑑𝑎 𝑠𝑎𝑡𝑢 𝛽𝑖 ≠ 0; 𝑖 = 1,2,3
Taraf Uji 5%
Statistik Uji
𝑀𝑆𝑅 904,116
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = = = 185,3836
𝑀𝑆𝐸 4,877
𝐹𝛼;𝑝−1;𝑛−𝑝 = 𝐹0,05;2;12 = 3,587
Keputusan
Karena 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 maka tolak 𝐻0
Kesimpulan
Dengan demikian, kesimpulannya adalah dengan tingkat signifikansi 5%, terdapat cukup bukti
untuk menunjukkan bahwa terdapat hubungan regresi antara variabel dependen dan variabel
independen.
d.
➢ Hipotesis
𝐻0 : 𝛽3 = 0
𝐻1 : 𝛽3 ≠ 0
Taraf Uji 𝛼 = 5%
36
Statistik Uji
𝑆𝑆𝑅(𝑋3 )
𝑀𝑆𝑅 1 2573,168
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = = = = 173,476
𝑀𝑆𝐸 𝑆𝑆𝐸(𝑋3 ) 14,833
13
Keputusan
Karena 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 maka tolak 𝐻0
Kesimpulan
Dengan demikian, kesimpulannya adalah dengan tingkat signifikansi 5%, terdapat cukup
bukti untuk menunjukkan bahwa 𝛽3 ≠ 0.
2
𝑆𝑆𝑅(𝑋3 |𝑋1 , 𝑋2 ) 1,321
𝑟𝑦3,12 = = = 0,0240
𝑆𝑆𝐸(𝑋1 , 𝑋2 ) 54,972
Interpretasi:
➢ Keragaman gaji seseorang data scientist yang dapat dijelaskan oleh pengalaman kerja tetapi
tidak dapat dijelaskan oleh skor kemampuan bidang statistika dan skor kemampuan bidang
komputasi sebesar 50,09%.
➢ Keragaman gaji seseorang data scientist yang dapat dijelaskan oleh skor kemampuan bidang
statistika tetapi tidak dapat dijelaskan oleh pengalaman kerja dan skor kemampuan bidang
komputasi sebesar 36,82%.
➢ Keragaman gaji seseorang data scientist yang dapat dijelaskan oleh skor kemampuan bidang
komputasi tetapi tidak dapat dijelaskan oleh pengalaman kerja dan skor kemampuan bidang
statistika sebesar 2,40%.
➢ Hubungan antara gaji seseorang data scientist dan pengalaman kerja kuat (0,71) dan
berbanding lurus.
➢ Hubungan antara gaji seseorang data scientist dan skor kemampuan bidang statistika cukup
kuat (0,61) dan berbanding lurus.
➢ Hubungan antara gaji seseorang data scientist dan skor kemampuan bidang komputasi lemah
(0,15) dan berbanding lurus.
37
3. Kita ubah nilai 𝑋𝑖 menjadi 𝑥𝑖 dimana 𝑥𝑖 = 𝑋𝑖 − 𝑋̅ = 𝑋𝑖 − 48,9 dan diperoleh tabel baru sebagai
berikut:
𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖
-43,9 3 -3,9 14
-43,9 7 1,1 12
-43.9 6 -3,9 14
-39,9 8 6,1 20
-34,9 10 26,1 22
-30,9 9 22,2 14
-31,9 10 42,1 20
-30,9 11 88,1 15
-17,9 16 154,1 24
-8,9 9
-4,9 13
∑𝑦
𝑆𝑆𝐸 528,636
𝑀𝑆𝐸 = = = 31,096
𝑛−3 17
38
a. Uji Simultan
Dari persamaan regresi 𝑌̂𝑖 = 14,218 + 0,136𝑥𝑖 − 0,001𝑥𝑖2 kita dapatkan nilai dugaan dan kuadrat
residual sebagai berikut.
➢ Hipotesis
𝐻0 : 𝐸(𝑌) = 𝛽0 + 𝛽1 𝑋𝑖 + 𝛽11 𝑋𝑖2
𝐻1 : 𝐸(𝑌) ≠ 𝛽0 + 𝛽1 𝑋𝑖 + 𝛽11 𝑋𝑖2
➢ 𝐶𝑅: 𝐹 ∗ ≥ 𝐹0,05;4;13 𝑎𝑡𝑎𝑢 𝐹 ∗ ≥ 3,179
➢ Statistik Uji
𝑆𝑆𝑃𝐸 = ∑(𝑦𝑖 − 𝑦̂𝑖 )2 = 287,697
𝑆𝑆𝑃𝐸 287,697
𝑀𝑆𝑃𝐸 = = = 71,924
20 − 16 4
𝑆𝑆𝐿𝐹 = 𝑆𝑆𝐸 − 𝑆𝑆𝑃𝐸 = 528,636 − 287,697 = 240,939
𝑆𝑆𝐿𝐹 240,939
𝑀𝑆𝐿𝐹 = = = 18,534
16 − 3 13
𝑀𝑆𝐿𝐹 18,534
𝐹∗ = = = 0,258
𝑀𝑆𝑃𝐸 71,924
➢ Keputusan
Karena 𝐹 ∗ < 𝐹0,05;4;13 maka gagal tolak 𝐻0
39
➢ Kesimpulan
Dengan tingkat signifikansi 5%, terdapat cukup bukti untuk menyatakan bahwa terdapat
hubungan regresi antara area sebaran kerang dan jumlah spesies.
b. Uji 𝛽11
➢ Hipotesis
𝐻0 : 𝛽11 = 0 (𝑡𝑖𝑑𝑎𝑘 𝑡𝑒𝑟𝑑𝑎𝑝𝑎𝑡 𝑒𝑓𝑒𝑘 𝑘𝑢𝑎𝑑𝑟𝑎𝑡𝑖𝑘)
𝐻1 : 𝛽11 ≠ 0 (𝑡𝑒𝑟𝑑𝑎𝑝𝑎𝑡 𝑒𝑓𝑒𝑘 𝑘𝑢𝑎𝑑𝑟𝑎𝑡𝑖𝑘)
➢ 𝐶𝑅: |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | ≥ 𝑡0,025;20−3 𝑎𝑡𝑎𝑢 |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | ≥ 2,110
➢ Statistik Uji
𝑏11 0,001
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = =− = −2,506
𝑠(𝑏11 ) 0,000399
➢ Keputusan
Karena |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | ≥ 2,110 maka Tolak 𝐻0
➢ Kesimpulan
Dengan tingkat signifikansi 5%, sudah cukup bukti untuk menyatakan bahwa terdapat efek
kuadratik dari hubungan antara area sebaran kerang dan jumlah spesies. Oleh karena itu,
sesuai memasukkan suku kuadratik ke dalam model
c. Koefisien Determinasi
2
𝑆𝑆𝑅(𝑋, 𝑋 2 ) 417,0525
𝑅 = = = 0,7144 = 71,44%
𝑆𝑆𝑇 583,8
Jadi, kontribusi suku kuadratik di dalam model sebesar 71,44%
40
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2019/2020
MATA KULIAH : ANALISIS REGRESI
TINGKAT : II(DUA)/D4 STATISTIKA
DOSEN : TIM
HARI/TANGGAL : SELASA/25 FEBRUARI 2020
WAKTU : 2 JAM
SIFAT UJIAN : TUTUP BUKU & RUMUS
BOLEH MENGGUNAKAN KALKULATOR
1. (NILAI 30). Data berikut memuat skor yang menunjukkan tingkat stress dan nilai ujian dari 9
mahasiwa. Semakin tinggi skor tingkat stres menunjukkan bahwa mahasiswa tersebut semakin
stres.
Tingkat Stres 23 14 14 0 17 20 20 15 21
Nilai Ujian 43 59 48 77 50 52 46 51 51
2. (NILAI). Suatu penelitian telah dilakukan untuk mengetahui hubungan antara tes kemampuan
bahasa (X) dan nilai karya ilmiah (Y) dari 10 siswa kelas I SMA. Diduga bahwa model regresi
polinomial kuadratik cocok digunakan.
Diketahui
0,1813176 −0,006212 −0,002259
(𝐗 ′ 𝐗)−𝟏 = [−0,006212 0,0032523 0,0001725 ]
−0,002259 0,0001725 0,0000627
3. (NILAI 35). Diduga tiga buah variabel prediktor, yaitu X1 = PDRB Perkapita (juta rupiah), X2 =
upah minimum kabupaten/kota (ribuan rupiah), dan X3 = rata-rata lama sekolah (tahun)
berpengaruh terhadap persentase penduduk miskin (Y). Dari hasil pengolahan SPSS diperoleh
output sebagai berikut:
41
𝐀𝐍𝐎𝐕𝐀𝐚
Model Sum of Squares Df Mean Square F Sig.
Regression 4519,897 1 4519,897 21,537 , 000𝑏
1 Residual 3567,787 17 209,870
Total 8087,684 18
a. Dependent Variable: Y
b. Predictors: (Constant), X2
𝐀𝐍𝐎𝐕𝐀𝐚
Model Sum of Squares Df Mean Square F Sig.
Regression 3879,550 2 1939,775 7,375 , 005𝑏
1 Residual 4208,134 16 263,008
Total 8087,684 18
a. Dependent Variable: Y
b. Predictors: (Constant), X1,X3
𝐂𝐨𝐞𝐟𝐟𝐢𝐜𝐢𝐞𝐧𝐭𝐬 𝐚
Unstandarized Coefficients Standardized Coefficients
Model
B Std. Error Beta
(Constant) 87,188 21,552
X1 -,564 ,428 -,297
1
X2 -,513 ,224 -,567
X3 -,072 ,455 -,030
𝐀𝐍𝐎𝐕𝐀𝐚
Model Sum of Squares Df Mean Square
Regression … … …
X1,X3 … … …
1 X2|X1,X3 … … …
Residual 3121,006 … …
Total … …
42
PEMBAHASAN UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK
2019/2020
Estimasi 𝛽1 :
𝑛 ∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖
𝛽̂1 = 2 2
𝑛 ∑ 𝑋𝑖 −(∑ 𝑋𝑖 )
9(7133)−(144)(477)
= 9(2676)−20.736
−4491
= 3348
= −1,3414
Estimasi 𝛽0 :
𝛽̂0 = 𝑌̅ − 𝛽1 𝑋̅
= 53 − (−1,3414)(16)
= 76,4624
Diperoleh persamaan regresi linear sederhana: 𝑌̂ = 76,4624 − 1,3414 𝑋𝑖
Interpretasi :
Koefisien variabel 𝑋𝑖 bertanda negatif. Artinya, setiap kenaikan tingkat stress mahasiswa sebesar 1
satuan, nilai ujian mahasiswa akan turun sebesar 1,3414 poin.
43
Bentuk confidence interval: 𝛽̂0 ± 𝑡(1−𝛼;𝑛−2) . 𝑠(𝛽̂0 )
2
𝛽̂0 = 76,4624
1 16
𝑠(𝛽̂0 ) = √(19,2346). (9 + 372) = 3,9210
Confidence Interval:
𝛽̂0 ± 𝑡(1−𝛼;𝑛−2) . 𝑠(𝛽̂0 )
2
76,4624 ± 2,3646 (3,9210)
65,19 < 𝛽̂0 < 83,73
Interpretasi:
Dengan tingkat kepercayaan 95%, kita memercayai bahwa nilai 𝛽̂0 yang sebenarnya berada pada
interval 65,19 sampai 83,73.
Inferensia 𝛽1 :
Hipotesis:
𝐻0 ∶ 𝛽1 = 0
𝐻1 ∶ 𝛽1 ≠ 0
Taraf signifikansi: 𝛼 = 5%
𝑏
Statistik uji: 𝑡𝑜𝑏𝑠 = 𝑠(𝑏1 )
1
𝑏1 = −1,3414
𝑀𝑆𝐸 19,2346
𝑠(𝑏1 ) = √∑(𝑋 −𝑋̅)2 = √ 372
= 0,2274
𝑖
1,3414
𝑡𝑜𝑏𝑠 = − 0,2274 = −5,8989
Wilayah kritis:
Tolak H0 jika |𝑡𝑜𝑏𝑠 | > |𝑡(1−𝛼;𝑛−2) | = |𝑡(0,975;7) | = 2,3646
2
Keputusan: Tolak H0
Kesimpulan:
Dengan taraf signifikansi 5%, data menunjukkan cukup bukti bahwa 𝛽1 signifikan terhadap model
(𝛽1 ≠ 0). Artinya, terdapat pengaruh yang signifikan dari variabel tingkat stres terhadap nilai ujian
mahasiswa.
44
Confidence Interval 𝛽1 :
𝛽̂1 ± 𝑡(1−𝛼;𝑛−2) . 𝑠(𝛽̂1 )
2
−1,3414 ± 2,3646 (0,2274)
−1,88 < 𝛽1 < −0,80
Interpretasi:
Dengan tingkat kepercayaan 95%, kita memercayai bahwa nilai 𝛽1 yang sebenarnya berada pada
interval -1,88 sampai -0,88. Artinya, setiap peningkatan tingkat stress sebesar 1 unit akan
menurunkan nilai ujian mahasiswa antara 0,80 sampai 1,88.
𝑗
𝑋1 = 0 𝑋2 = 14 𝑋3 = 15 𝑋4 = 17 𝑋5 = 20 𝑋6 = 21 𝑋7 = 23
𝑖=1 77 48 51 50 46 51 43
𝑖=2 52
𝑌̅𝑗 77 53,5 51 50 49 51 43
𝑆𝑆𝑃𝐸 = ∑ ∑(𝑦𝑖𝑢 − 𝑦̅𝑖. )2 = (77 − 77)2 + (48 − 53,5)2 + ⋯ + (43 − 43)2 = 78,5
𝑆𝑆𝐿𝑂𝐹 = 𝑆𝑆𝐸 − 𝑆𝑆𝑃𝐸 = 134,6403 − 78,5 = 56,1403
ANOVA tabel:
Statistik uji:
𝑀𝑆𝐿𝑂𝐹
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑀𝑆𝑃𝐸
= 0,2861
45
Daerah kritis:
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹(1−𝛼;5;2) = 19,2964
Keputusan:
Gagal tolak H0
Kesimpulan:
Dengan tingkat signifikansi 5%, data belum menunjukkan cukup bukti bahwa tingkat stress
mahasiswa tidak berpengaruh signifikan terhadap nilai ujian mahasiswa. Artinya, model linier sudah
cocok untuk menjelaskan hubungan antara tingkat stress mahasiswa dengan nilai ujian mahasiswa.
2. Diketahui
0,1813176 −0,006212 −0,002259
(𝐗 ′ −𝟏
𝐗) = [−0,006212 0,0032523 0,0001725 ]
−0,002259 0,0001725 0,0000627
∑ 𝑌𝑖 = 458 ∑ 𝑌𝑖2 = 21604 ∑ 𝑋𝑖 𝑌𝑖 = 304
∑ 𝑋𝑖2 𝑌𝑖 = 17252 2
∑ 𝑋𝑖 = 360 ∑ 𝑋𝑖4 = 31620
46
Interpretasi:
Kontribusi variabel nilai tes kemampuan bahasa dalam menjelaskan keragaman nilai karya ilmiah
kelas I SMA adalah sebesar 63,77 persen. Artinya, 36,23 persen keragaman nilai karya ilmiah kelas
I SMA dijelaskan oleh faktor lain yang tidak tercakup dalam model.
𝑆𝑆𝐸 227,391
2 𝑛−𝑝 10−3
𝑅𝑎𝑑𝑗 =1− 𝑆𝑆𝑇 =1− 627,6 = 0,5342
𝑛−1 10−1
Interpretasi:
Kontribusi variabel nilai tes kemampuan bahasa dalam menjelaskan keragaman nilai karya ilmiah
kelas I SMA yang sudah ditimbang derajat bebasnya adalah sebesar 53,42 persen. Artinya, 46,58
persen keragaman nilai karya ilmiah kelas I SMA dijelaskan oleh faktor lain yang tidak tercakup
2
dalam model. 𝑅𝑎𝑑𝑗 biasa digunakan dalam regresi linier berganda. Sebasb ketika suatu model
memiliki variabel independen yang banyak, 𝑅 2 akan cenderung meningkat yang dapat
2
menimbulkan bias. Sehingga, 𝑅𝑎𝑑𝑗 digunakan dalam model.
c. Uji F simultan
• Hipotesis:
𝐻0 : 𝛽1 = 𝛽11 = 0
𝐻1 : 𝑚𝑖𝑛𝑖𝑚𝑎𝑙 𝑎𝑑𝑎 𝑠𝑎𝑡𝑢 𝛽𝑖 ≠ 0 ; 𝑖 = 1,11
• Taraf signifikansi:
𝛼 = 0,05
• Tabel ANOVA:
Sumber
SS Df MS 𝐹ℎ𝑖𝑡𝑢𝑛𝑔
Keragaman
Regresi 400,2090 2 200,1045
6,1600
Error 227,3910 7 21,4844
Total 627,6 9
• Statistik uji:
𝑀𝑆𝑅
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑀𝑆𝐸 = 6,1600
• Daerah kritis:
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹(1−𝛼;𝑘,𝑛−𝑘−1) = 𝐹(.95;2;7) = 4,7374
• Keputusan:
Tolak 𝐻0
• Kesimpulan:
Dengan tingkat signifikansi 5%, data menunjukkan cukup bukti bahwa paling tidak terdapat
satu 𝛽𝑖 yang signifikan terhadap variabel dependen.
47
d. Uji t parsial (efek kuadratik)
• Hipotesis:
𝐻0 : 𝛽11 = 0
𝐻1 : 𝛽11 ≠ 0
• Taraf signifikansi:
𝛼 = 0,05
• Statistik uji:
𝑏
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑠(𝑏11 )
11
𝑏11 = 0,0995
Matriks varians-covarians
−𝟏
𝜎 2 (𝑏) = 𝜎 2 (𝑿𝑻 𝑿)
Unbiased estimator untuk 𝜎 2 adalah 𝑠 2 , yaitu adalah 𝑀𝑆𝐸
0,1813176 −0,006212 −0,002259
2 (𝑏) 𝐓 −𝟏
𝑠 = 𝑀𝑆𝐸(𝐗 𝑿) = 𝟑𝟐, 𝟒𝟖𝟒𝟒 [−0,006212 0,0032523 0,0001725 ]
−0,002259 0,0001725 0,0000627
5,8900 −0,2018 −0,0734
= [−0,2018 0,1056 0,0056 ]
−0,0734 0,0056 0,0020
• Daerah kritis:
Tolak 𝐻0 jika |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | > |𝑡(1−𝛼;𝑛−𝑘−1) | = 𝑡(.975;10−3) = 2,3646
2
• Keputusan:
Gagal tolak 𝐻0
• Kesimpulan:
Dengan tingkat signifikansi 5%, data belum menunjukkan cukup bukti bahwa suku kuadratik
memiliki pengaruh signifikan terhadap model. Artinya, suku kuadratik dapat dihilangkan dari
model sehingga dapat dibentuk model baru hanya dengan suku efek linier. Namun, bisa juga
suku kuadratik tetap dipertahankan dalam model tetapi tidak diinterpretasikan besar
pengaruhnya pada variabel dependen karena tidak signifikan.
a) Model regresi: Y = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝜀
Persamaan regresi: 𝑌̂ = 87,188 − 0,564𝑋1 − 0,513𝑋2 − 0,072𝑋3
48
Interpretasi:
• Persentase penduduk miskin adalah sebesar 87,188 persen ketika tidak ada pengaruh dari
variabel PDRB perkapita (X1=0), variabel upah minimumkabupaten/kota (X2 = 0), dan
variabel rata-rata lama sekolah (X3 = 0).
• Jika PDRB Perkapita (X1) mengalami kenaikan sebesar satu satuan, akan membuat
persentase penduduk miskin menurun sebesar 0,564 persen dengan asumsi bahwa variabel
upah minimum kabupaten/kota (X2) dan variabel rata-rata lama sekolah (X3) dianggap
konstan (X2, X3 = 0).
• Jika upah minimum kabupaten/kota (X1) mengalami kenaikan sebesar satu satuan, akan
membuat persentase penduduk miskin menurun sebesar 0,513 persen dengan asumsi bahwa
variabel PDRB Perkapita (X1) dan variabel rata-rata lama sekolah (X3) dianggap konstan (X1,
X3 = 0).
• Jika rata-rata lama sekolah (X3) mengalami kenaikan sebesar satu satuan, akan membuat
persentase penduduk miskin menurun sebesar 0,072 persen dengan asumsi bahwa variabel
PDRB Perkapita (X1) dan variabel upah minimum kabupaten/kota (X2) dianggap konstan
(X1, X2 = 0).
• Taraf signifikansi
𝛼 = 5%
• Statistik uji
𝑀𝑆𝑅 1655,559
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = = = 7,9569
𝑀𝑆𝐸 208,0671
• Daerah kritis:
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹(1−𝛼;𝑘,𝑛−𝑘−1) = 𝐹(.95;3,15) = 3,2874
49
• Keputusan:
Tolak H0
• Kesimpulan:
Dengan taraf signifikansi 5%, data menunjukkan cukup bukti bahwa paling tidak terdapat
satu variabel prediktor yang signifikan terhadap variabel respon.
# Uji T parsial
• Hipotesis
• 𝐻0 : 𝛽𝑗 = 0
(variabel bebas ke-j tidak signifikan mempengaruhi variabel tak bebas)
𝐻1 : 𝛽𝑗 ≠ 0
(variabel bebas ke-j signifikan mempengaruhi variabel tak bebas)
• Taraf signifikansi
𝛼 = 5%
• Statistik uji
𝑏
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑠(𝑏𝑗
𝑗)
• Daerah kritis
Tolak 𝐻0 jika |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | > 𝑡(1−𝛼;𝑛−𝑘−1) = 𝑡(0,975;15) = 2,13145
2
• Keputusan
Prediktor 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | Keputusan
X1 -1,3178 1,3178 Gagal tolak H0
X2 -2,2902 2,2902 Tolak H0
X3 -0,1582 0,1582 Gagal tolak H0
• Kesimpulan:
• X1
Dengan taraf signifikansi 5%, dengan data yang ada belum cukup bukti bahwa variabel
prediktor X1 signifikan terhadap variabel respon Y. Artinya, belum cukup bukti untuk
menyatakan bahwa PDRB Perkapita signifikan terhadap persentase penduduk miskin.
• X2
Dengan taraf signifikansi 5%, dengan data yang ada cukup bukti bahwa variabel
prediktor X2 signifikan terhadap variabel respon Y. Artinya, cukup bukti untuk
menyatakan bahwa upah minimum kabupaten/kota signifikan terhadap persentase
penduduk miskin.
50
• X3
Dengan taraf signifikansi 5%, dengan data yang ada belum cukup bukti bahwa variabel
prediktor X3 signifikan terhadap variabel respon Y. Artinya, belum cukup bukti untuk
menyatakan bahwa rata-rata lama sekolah signifikan terhadap persentase penduduk
miskin.
2
d) Mencari 𝑎𝑑𝑗𝑢𝑠𝑡𝑒𝑑 𝑅 2 , 𝑟𝑌2.13 , 𝑟𝑌2,13
• 𝑎𝑑𝑗𝑢𝑠𝑡𝑒𝑑 𝑅 2
𝑆𝑆𝐸 208,0671
2
𝑅𝑎𝑑𝑗 =1− 𝑛 − 𝑘 − 1 =1− 15 = 0,5369
𝑆𝑆𝑇 8087,684
𝑛−1 18
Interpretasi:
Kontribusi variabel PDRB Perkapita, variabel upah minimum kabupaten/kota, dan variabel
rata-rata lama sekolah dalam menjelaskan keragaman persentase penduduk miskin yang
sudah ditimbang derajat bebasnya adalah sebesar 53,69 persen. Artinya, 46,31 persen
keragaman persentase penduduk miskin dijelaskan oleh faktor lain yang tidak tercakup
dalam model.
• 2
𝑟𝑌2.13
2 𝑆𝑆𝐸(𝑋1,𝑋3)−𝑆𝑆𝐸(𝑋1,𝑋2,𝑋3) 4208,134−3121,006
𝑟𝑌2.13 = 𝑆𝑆𝐸(𝑋1,𝑋3)
= 4208,134
= 0,25834
Interpretasi:
Keragaman persentase penduduk miskin dapat dijelaskan oleh variabel upah minimum
kabupaten/kota tetapi tidak dapat dijelaskan oleh variabel PDRB Perkapita dan variabel rata-
rata lamanya sekolah adalah sebesar 25,834 persen.
• 𝑟𝑌2,13
2
𝑟𝑌2,13 = −√𝑟𝑌2,13 = −0,50827
Interpretasi:
Hubungan antara persentase penduduk miskin dengan upah minimum kabupaten/kota
sedang (0,50827) dan berbanding terbalik. Artinya, kenaikan upah minimum
kabupaten/kota menyebabkan penurunan persentase penduduk miskin dan sebaliknya
apabila PDRB Perkapita dan rata-rata lama sekolah tetap.
51
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2020/2021
MATA KULIAH : ANALISIS REGRESI
TINGKAT : II (DUA)/D-IV STATISTIKA/KS
DOSEN : TIM
HARI/TANGGAL : JUM’AT/26 MARET 2021
WAKTU : 2 JAM
SIFAT UJIAN : BOLEH MEMBUKA BUKU/REFERENSI
Apakah model regresi linier sederhana cocok untuk menganalisis data di atas? Gunakan tingkat
signifikasi 5%.
2. (NILAI 30). Sebuah penelitian dilakukan untuk mengetahui hubungan antara panjang ikan (Y) (dalam
mm) dengan umur ikan (X) (dalam tahun). Bentuk hubungan antara kedua variabel tersebut diduga
berbentuk polinomial kuadratik dengan model regresi:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝛽11 𝑋𝑖2 + 𝜀𝑖
Dari sampel sebanyak 25 ekor ikan, diperoleh hasil pengolahan sebagai berikut:
Model Sum of Squares df Mean Square
Regression ... ... ...
𝑋 ... ... ...
2 ... ... ...
𝑋 |𝑋
Error 2.181,227 ... ...
Total ... ...
Diketahui:
𝑆𝑆𝐸(𝑋) = 2.816,977 𝑆𝑆𝐸(𝑋2) = 4.176,277 𝑆𝑆𝑅(𝑋2) = 10.991,723
Pertanyaan:
a. Lengkapilah tabel ANOVA di atas!
52
b. Ujilah apakah suku linier dan suku kuadratik secara bersama-sama berpengaruh terhadap
variabel tak bebas? (Gunakan alpha 5%).
2
c. Hitunglah 𝑟𝑌𝑋 2 |𝑋 dan jelaskan maknanya.
3. (NILAI 50). Sebuah penelitian menunjukkan tinggi badan seseorang dipengaruhi oleh panjang badan
saat lahir dan tinggi badan orang tua. Data berikut menyajikan tinggi badan 20 orang remaja laki-laki
umur 18 tahun beserta data panjang badannya saat lahir dan tinggi badan ibu dan ayahnya saat
berumur 18 tahun. Semua data dalam satuan cm.
53
PEMBAHASAN UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK
2020/2021
Y 4,6 11 12,1 10,9 15,3 16,1 14,9 15,6 17,9 18,3 18,6 17,8 19,2 19,6 18,9 20,0
• Lack of Fit
𝒙 10 20 30 40
𝒚̅𝒊 11,65 15,475 18,15 19,425
𝒏𝒌 4 4 4 4
𝒏𝒆 3 3 3 3 ∑𝑛𝑒 =12
2
∑(𝒚𝒊𝒖 − 𝒚̅𝒊 )𝟐 2,09 0,7675 0,41 0,6875 ∑∑(𝑦𝑖𝑢 − 𝑦̅)
𝑖
= 3,955
• Pengujian
𝐻0 : Model RLS cocok untuk menjelaskan hubungan X dan Y (𝐸(𝑦𝑖 ) = 𝛽0 + 𝛽1 𝑋𝑖 )
𝐻1 : Model RLS tidak cocok untuk menjelaskan hubungan X dan Y (𝐸(𝑦𝑖 ) ≠ 𝛽0 + 𝛽1 𝑋𝑖 )
𝛼: 5%
➢ Statistik Uji
ANOVA Lack of Fit
Source df SS MS
Regression 1 135,2 135,2
Residual 14 10,47 0,747
Lack of Fit 2 6,515 3,2575
Pure Error 12 3,955 0,3295
Total 15 145,67
𝑀𝑆𝐿𝐹 3,2575
𝐹∗ = = = 9,8861
𝑀𝑆𝑃𝐸 0,3295
𝐹(1−𝛼; 2, 12) = 3,8852
Akan tolak 𝐻0 jika 𝐹 ∗ > 𝐹𝑡𝑎𝑏𝑒𝑙
Keputusan :
Tolak 𝐻0 karena 𝐹 ∗ > 𝐹𝑡𝑎𝑏𝑒𝑙
Kesimpulan :
Dengan taraf uji 5% dan sampel uji yang tersedia, terdapat cukup bukti bahwa model RLS yang
diajukan tidak tepat/ tidak cocok untuk menjelaskan hubungan antara 𝑋 dan 𝑌.
54
2. Model : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝛽11 𝑋𝑖2 + 𝜀𝑖
Diketahui:
𝑆𝑆𝐸(𝑋1 𝑋 2 ) = 2181,227 𝑆𝑆𝑅(𝑋 2 ) = 10991,723
𝑆𝑆𝐸(𝑋) = 2816,977 𝑛 = 25
𝑆𝑆𝐸(𝑋 2 ) = 4176,277
b) Uji Simultan
𝐻0 : 𝛽1 = 𝛽11 = 0
(X maupun 𝑋 2 tidak berpengaruh signifikan terhadap Y)
𝐻1 : 𝛽1 ≠ 0 𝑎𝑡𝑎𝑢 𝛽11 ≠ 0 𝑎𝑡𝑎𝑢 𝛽1 , 𝛽11 ≠ 0
(Setidaknya ada salah satu 𝛽𝑖 ≠ 0 atau signifikan berpengaruh terhadap Y)
𝛼: 5%
Statistik Uji :
Dengan menggunakan tabel ANOVA pada poin A
𝑀𝑆𝑅 6493,3865
𝐹∗ = = = 65,4927
𝑀𝑆𝐸 99,1466
Tolak 𝐻0 saat
𝐹 ∗ > 𝐹(1−𝛼;2,22) → 𝐹 ∗ > 3, 4435
Keputusan :
Tolak 𝐻0 karena 𝐹 ∗ > 𝐹𝑡𝑎𝑏𝑒𝑙
Kesimpulan :
Dengan taraf uji 5%, dapat dibuktikan bahwa terdapat setidaknya salah satu dari 𝛽1 dan 𝛽11 yang
tidak bernilai 0. Dengan kata lain, dapat dikatakan bahwa suku linear atau suku kuadratik akan
secara Bersama-sama memengaruhi nilai dari variabel tak bebas (𝑋, 𝑋 2 berpengaruh pada 𝑌).
55
c) Koefisien Determinasi Parsial
Dengan hasil pada ANOVA poin A
2 𝑆𝑆𝑅(𝑋 2 |𝑋) 635,75
𝑟𝑌𝑋 2 |𝑋 = = = 0,05147
𝑆𝑆𝑅(𝑋) 12351,023
Angka tersebut bermakna bahwa keragaman nilai Y di sekitar rataannya yang dapat dijelaskan
oleh suku 𝑋 2 , tetapi tidak dapat dijelaskan oleh suku linear (𝑋) adalah sebesar 0,05147 bagian
atau 5,147%.
b. Uji parsial
𝐻0 : 𝛽1 = 0 (tidak signifikan memengaruhi)
𝐻1 : 𝛽1 ≠ 0 (signifikan memengaruhi)
56
𝛼: 5%
Statistik Uji :
𝛽𝑖
𝑡∗ = 𝑠 2 (𝑏) = 𝑀𝑆𝐸(𝑋 𝑇 𝑋)−1
𝑠(𝑏𝑖 )
𝟏𝟏𝟖𝟗, 𝟎𝟐 −6,4629 −2,871 −2,304
−6,462 𝟎, 𝟏𝟗𝟔𝟗 −0,028 0,0073
[ ]
−2,871 −0,028 𝟎, 𝟎𝟐𝟔𝟎 0,0043
−2,304 0,0073 0,00043 𝟎, 𝟎𝟏𝟎𝟕𝟖
𝑠 2 (𝑏1 ) = 0,1969 2 (𝑏 )
𝑠 2 = 0,0260 𝑠 3 (𝑏3 ) = 0,01078
𝑠(𝑏1 ) = 0,4437 𝑠(𝑏2 ) = 0,16148 𝑠(𝑏3 ) = 0,1038
𝑡 ∗ = 2,4024 𝑡 ∗ = 4,951 𝑡 ∗ = 10,878
Taraf uji tolak 𝐻0 saat :
|𝑡 ∗ | > 𝑡(1−𝛼;𝑛−4)
2
|𝑡 ∗ | > 2,4728
Keputusan :
𝑏1 gagal tolak 𝐻0
𝑏2 tolak 𝐻0
𝑏3 tolak 𝐻0
Kesimpulan :
Dengan taraf uji 5% dan dari sampel yang tersedia, dapat dibuktikan bahwa 𝑏2 dan 𝑏3
bernilai ≠ 0 atau 𝑋2 dan 𝑋3 signifikan memengaruhi, tetapi tidak dapat dibuktikan bahwa
𝛽1 ≠ 0 atau 𝑋1 tidak signifikan memengaruhi.
c. Perkiraan Interval
Untuk 𝑋1 = 50, 𝑋2 = 152, 𝑋3 = 182 amatan baru, adalah 𝑌̂ = 174, 999
CI : 𝑦̂
ℎ.𝑛𝑒𝑤 ± 𝑡(1−𝛼) 𝑠(𝑦ℎ.𝑛𝑒𝑤 )
2
𝑠 2 (𝑦ℎ.𝑛𝑒𝑤 ) = 𝑀𝑆𝐸 + 𝑠 2 (𝑦ℎ )
= 𝑀𝑆𝐸 + 𝑋ℎ′ 𝑠 2 (𝑏)𝑋ℎ
1
50
𝑋ℎ = [ ] 𝑋ℎ′ = [1 50 152 182]
152
182
𝑠 2 (𝑦ℎ ) = 3,71244
𝑠 2 (𝑦ℎ.𝑛𝑒𝑤 ) = 5,7524 + 3,7124 = 9,4648
𝑠(𝑦ℎ.𝑛𝑒𝑤 ) = 3,076
𝑡(1−𝛼;𝑛−4) = 2,4728 𝑀𝑎𝑟𝑔𝑖𝑛𝑂𝑓𝐸𝑟𝑟𝑜𝑟 = 7,6075
2
CI :
𝑃(174,999 − 7,6075 < 𝑌𝑖 < 174,999 + 7,6075) = 95%
𝑃(167,3915 < 𝑌𝑖 < 182,60) = 95%
Dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa tinggi anak dengan panjang lahir
50cm, tinggi ibu 152cm, tinggi ayah 182cm adalah antara 167,39 sampai 182,60cm.
2 𝑆𝑆𝐸 𝑛−1
d. 𝑅𝑎𝑑𝑗 = 1 − 𝑆𝑆𝑇 (𝑛−𝑘−1) = 0,884
Besar keragaman tinggi badan yang dapat dijelaskan oleh model adalah sebesar 88,4%, sedangkan
sisanya dijelaskan faktor lain yang tidak dimasukkan dalam model.
57
2 𝑆𝑆𝐸(𝑋1,𝑋2,𝑋3)
e. 𝑟𝑦𝑥 2 𝑥3 |𝑥1
=1− 𝑆𝑆𝐸(𝑋1 )
Didapatkan dari tabel ANOVA regresi bahwa
𝑆𝑆𝐸(𝑋1 , 𝑋2 , 𝑋3 ) = 92, 03981
𝑆𝑆𝐸(𝑋1 ) = 898, 3056
2 92,03981
𝑟𝑦𝑥 𝑥 |𝑥 = 1 − = 1 − 0,10245 = 0,8975
2 3 1 898,3056
Besar keragaman tinggi badan seseorang yang dapat dijelaskan oleh faktor tinggi badan ibu dan
ayahnya, tetapi tidak dapat dijelaskan oleh variabel panjang lahirnya adalah sebesar 89,75%.
58
PENGENALAN BASIS DATA
A. DEFINISI
▪ Basis Data atau Database adalah kumpulan dari data yang berhubungan.
▪ Database Management System (DBMS) adalah sebuah software yang mengatur dan
mengontrol akses ke database.
▪ Aplikasi Basis Data adalah program yang berinteraksi dengan basis data pada titik tertentu
dalam proses mengeksekusi.
Contoh:
o Membeli barang di supermarket
‣ Scan barcode → cari nama barang, harga, jumlah stok → Tampilkan di layar
o Saat kuliah
‣ Scan sidik jari → program aplikasi → Database siswa (Nama dan NIM)
▪ Sistem Basis Data atau Database System adalah kumpulan dari program aplikasi yang
berinteraksi dengan database.
D. DATABASE APPROACH
▪ Keterbatasan pada file based system menyebabkan:
o Setiap program aplikasi memelihara datanya sendiri sehingga kurangnya control dalam
pengelolaan data yang terpisah
o Data yang sama dikelola oleh aplikasi yang berbeda sehingga menyebabkan borosnya
waktu, biaya, dan space untuk mengentri data yang sama di tempat yang berbeda.
▪ Sehingga menghasilkan Database dan Database Management System (DBMS)
60
E. DATABASE
▪ Kumpulan data dan deskripsi dari data yang berhubungan secara logika yang dirancang dan
dibagikan untuk memenuhi kebutuhan organisasi akan informasi
▪ Data-data yang berhubungan meliputi entitas, atribut, dan hubungan dari informasi sebuah
organisasi.
o Entitas : Sebuah objek berbeda (orang, tempat, benda, konsep, atau kegiatan) dalam
organisasi yang direpresentasikan di database.
o Atribut: Sebuah property yang mendeskripsikan beberapa aspek dari objek yang
ingin kita simpan, seperti NIM, kode dosen, nama, kode matkul, dan jumlah SKS
o Relationship: Hubungan antara entitas, misal dosen mengajar mata kuliah.
G. FUNGSI DBMS
▪ Data Definition Language (DDL)
o Untuk menspesifikasikan tipe data, struktur dan Batasan data lainnya.
▪ Data Manipulation Language (DML)
o General enquiry facility (Bahasa query) dari data
▪ Mengontrol akses ke database
o A security system
o An integrity system
o A concurrency control system
o A recovery control system
o A user-accessible catalog
H. VIEW
▪ Memungkinkan setiap pengguna untuk bisa melihat tampilan database-nya sendiri.
▪ Pada dasarnya, View merupakan bagian dari database
▪ Keuntungan
o Mengurangi kompleksitas dan mengatur tingkat keamanan
o Mengatur mekanisme untuk mengubah tampilan database
o Tingkat keamanan yang lebih baik
61
o Menyajikan struktur database yang tidak bisa diubah, bahkan jika database pokok
berubah
▪ Hardware
o Berkisar antara PC sampai jaringan computer
o Arsitektur client-server (backend & frontend)
▪ Software
o DBMS, operating system(OS), network software (jika dibutuhkan), dan juga program
aplikasi (seperti Java, Visual Basic, SQL)
▪ Data
o Data operasional yang digunakan oleh organisasi dan deskripsi pada data yang disebut
skema.
▪ Prosedur
o Instruksi dan aturan yang seharusnya digunakan untuk mendesain dan menggunakan
database dan DBMS
▪ Orang (Pengguna)
62
K. KEUNTUNGAN DBMS
▪ Mengontrol kelebihan data
▪ Konsistensi data
▪ Informasi yang lebih banyak dengan jumlah data yang sama
▪ Mengembangkan integritas data
▪ Peningkatan keamanan
▪ Pelaksanaan standar
▪ Meningkatkan aksesibilitas data dan responsive
▪ Meningkatkan produktivitas
▪ Meningkatkan maintenance melalui data independen
▪ Meningkatkan jasa backup dan recovery
L. KEKURANGAN DBMS
▪ Kompleksitas
▪ Ukuran yang besar
▪ Biaya mahal
o Biaya tambahan hardware
o Biaya pengubahan
▪ Performa
o DBMS dikembangkan untuk aplikasi umum dibandingkan untuk file-based system
▪ Dampak kegagalan lebih tinggi
RELATIONAL MODEL
A. TERMINOLOGI
▪ Relation → tabel dengan kolom dan baris
▪ Atribut → nama kolom pada relation (tabel)
o Informasi atau karakteristik tentang objek
▪ Domain → kumpulan nilai-nilai yang diijinkan pada satu atau lebih atribut
o Setiap atribut di relation didefinisikan oleh domain
o Mungkin berbeda untuk setiap atribut, atau dua atau lebih atribut mungkin didefinisikan
di domain yang sama
o Contoh : Nilai mata kuliah (bisa sama dan bisa berbeda), NIM, Nama
▪ Tuple → baris pada relation (tabel)
o Intension adalah struktur pada relation dengan domain dan batasan-batasan pada nilai
yang mungkin (biasanya tetap)
▪ Degree → jumlah atribut pada relation (tabel)
o Unary relation : sebuah relation dengan 1 atribut
o Binary relation : sebuah relation dengan 2 atribut
o Ternary relation : sebuah relation dengan 3 atribut
o N-ary relation : sebuah relation dengan lebih dari 3 atribut
▪ Cardinality → Jumlah tuple pada relation (tabel)
o Cardinality pada tabel adalah property dari tuple pada relation
▪ Relational Database adalah kumpulan relation yang dinormalisasi dengan nama relation
yang berbeda
o Terdiri atas relation yang terstruktur dengan tepat → dinormalisasi
63
B. CONTOH RELATION
▪ Relation pada Branch dan Staff
C. TERMINOLOGI ALTERNATIF
Formal Terms Alternative 1 Alternative 2
Relation Tabel File
Tuple Baris Record
Attribute Kolom Field
D. PROPERTIES OF RELATIONS
▪ Nama relation (tabel) berbeda dari relation yang lain pada skema relation
▪ Setiap cell pada relation terdiri dari satu nilai
▪ Setiap atribut punya nama yang berbeda
▪ Nilai sebuah atribut berasal dari domain yang sama
▪ Setiap tuple berbeda; tidak ada duplicate tuple
▪ Order pada atribut tidak penting
▪ Order pada tuple tidak penting secara teori
E. RELATIONAL KEYS
▪ Tidak ada duplicate tuple pada relation (tabel) → mengidentifikasi satu atau lebih atribut
(disebut relational keys) yang mengidentifikasi secara unik setiap tuple pada relation
▪ Super key : Sebuah atribut atau kumpulan atribut (composite key) yang mengidentifikasi
secara unik sebuah tuple pada relation
▪ Candidate key
o Superkey(K) dimana tidak ada bagian dari superkey dengan relation
o Di setiap tuple pada relation, nilai K secara unik mengidentifikasi tuple (uniqueness)
64
o Tidak ada bagian dari K yang mempunyai keunikan property (irreducibility)
o Contoh Candidate key
o Branch→ branchNo, postcode
▪ Primary Key : Candidate key yang dipilih untuk mengidentifikasi tuple secara unik pada
relation
▪ Alternate Key : Candidate key yang tidak dipilih untuk menjadi primary key
▪ Foreign Key: Atribut, atau sekumpulan atribut pada satu relation yang cocok dengan
candidate key pada beberapa (kemungkinan sama) relation
G. INTEGRITY CONSTRAINT
▪ Sebuah data mempunyai dua bagian
o Bagian manipulasi, mendefinisikan tipe operasi yang diijinkan pada data
o Sekumpulan batasan integritas, yang menjamin bahwa data tersebut akurat
▪ Contoh
o Domain constraint → setiap atribut mempunyai sebuah domain yang terkait
o Integritas entitas
‣ Pada relation dasar, tidak ada primary key pada atribut bisa saja null
‣ Koresponden pada relation dasar untuk entitas dalam skema konseptual
o Integritas referensi
‣ Jika foreign key ada dalam relation, nilai foreign key lainnya harus sama dengan
nilai candidate key pada beberapa tuple di relation pokok atau foreign key harus
sepenuhnya null
o Keserberagaman
o Batasan umum
‣ Aturan tambahan yang dispesifikasikan oleh pengguna atau administrator
database yang mendefinisikan atau membatasi pada beberapa aspek perusahaan
‣ Contoh : mengatur batas pada kerja staff di cabang
▪ Null
o Merepresentasikan nilai pada sebuah atribut yang pada saat itu tidak diketahui atau
tak dapat diterapkan di tuple (baris) → merepresentasikan absennya sebuah nilai
o Terkait dengan tidak komplitnya data
o Tidak sama dengan 0 atau spasi, yang mana termasuk nilai
65
H. VIEW
▪ Tampilan dinamis dari satu atau lebih operasi relasional pada relation (tabel) dasar untuk
menghasilkan relation lain
▪ Relation berubah secara dinamis turun dari satu atau lebih relation dasar
▪ Sebuah tabel tak nyata yang tidak dibutuhkan benar-benar ada di database namun dihasilkan
berdasarkan permintaan, pada saat ada permintaan konten pada view didefinisikan sebagai
sebuah query pada satu atau lebih relation dasar
▪ Beberapa operasi pada view secara otomatis diubah menjadi operasi pada relation dari yang
diturunkan
▪ Views selalu dinamis
▪ Saat pengguna membuat perubahan ijin pada view, perubahan ini dibuat berdasarkan
relation pokok
I. TUJUAN VIEW
▪ Menyajikan mekanisme keamanan yang powerful dan fleksibel dengan menyembunyikan
bagian database pada pengguna tertentu
▪ Mengijinkan pengguna untuk mengakses data dengan cara yang disesuaikan, sehingga data
yang sama dapat dilihat oleh pengguna yang berbeda dengan cara yang berbeda, pada waktu
yang bersamaan.
▪ Dapat menyederhanakan operasi kompleks pada relation dasar
▪ Menyajikan struktur database yang tidak bisa diubah walaupun jika database pokok
berubah.
J. UPDATING VIEW
▪ Ada batasan pada pengubahan tipe yang bisa dilakukan melalui view
▪ Kondisi dimana kebanyakan sistem menentukan apakah mengijinkan update melalui view
o Update diijinkan melalui view didefinisikan menggunakan query sederhana melibatkan
satu relation dasar dan terdiri atas primary key atau candidate key di relation dasar
o Update tidak diijinkan melalui view yang melibatkan beberapa relation dasar
o Update tidak diijinkan melalui view melibatkan pengelompokan operasi
o Kelas pada view sudah didefinisikan bahwa secara teori tidak dapat diupdate, secara
teori dapat diupdate, dan sebagian bisa diupdate
66
ENTITY RELATIONALSHIP MODELING
A. KONSEP
▪ Entity Type Vs. Occurrence
o Entity Type → Kelompok objek dengan properties yang sama berada dalam organisasi
yang mempunyai eksistensi independen
o Entity occurrence → Objek yang teridentifikasi secara unik pada sebuah tipe entitas
▪ Relationship Type Vs. Occurence
o Relationship Type (Tipe Hubungan)
Himpunan relai (bisa lebih dari satu) antara dua atau lebih jenis entitas
o Relationship Occurrence (Terjadinya hubungan)
Hubungan antara dua atau lebih jenis entitas yang ditunjukkan oleh objek dari masing-
masing entitas.
o Jaringan semantic mempunyai tipe hubungan
o Degree of a Relationship
Jumlah entitas yang berpartisipasi dalam hubungan
o Degree of Relationship
‣ Binary = 2
‣ Ternary = 3
‣ Quarternary =4
o Hubungan Ternary
‣ Hubungan direpresentasikan menggunakan belah ketupat
‣ Nama hubungan terdapat di dalam belah ketupat
‣ Arah hubungan dihilangkan
‣ Contoh :
o Hubungan Quarternary
o Hubungan Rekursif/Unary
Tipe hubungan dimana tipe entitas sama berpartisipasi lebih dari sekali dengan peran
yang berbeda
o Hubungan diberikan nama peran untuk mengindikasi tujuan untuk setiap tipe entitas
berpartisipasi dalam sebuah hubungan
67
▪ Atribut
o Atribut → properti dari sebuah entitas atau tipe hubungan
o Domain Atribut
Kumpulan nilai yang diperbolehkan untuk satu atau lebih atribut
o Atribut simple/atomic
‣ Atribut yang terdiri satu komponen dengan eksistensi independen
‣ Contoh:posisi dan gaji pada entitas staff
o Atribut Komposit
Atribut yang terdiri dari beberapa komponen, dimana setiap komponen memiliki
eksistensi independen
Contoh: atribut alamat pada entitas Branch bisa dibagi menjadi jalan, kota dan pos kode
o Atribut bernilai tunggal
‣ Atribut yang memiliki nilai tunggal untuk setiap kejadian pada tipe entitas
‣ Contoh: setiap kejadian pada entitas Branch mempunyai satu nilai untuk setiap
atribut nomor cabang (branchNo)
o Atribut bernilai banyak
‣ Atribut yang memiliki nilai banyak untuk setiap kejadian pada sebuah tipe entitas
‣ Contoh: untuk setiap kejadian pada tipe entitas Branch bisa mempunyai nilai
banyak pada atribut telNo
o Atribut turunan
‣ Atribut yang merepresentasikan nilai yang diturunkan dari nilai pada atribut yang
berhubungan, atau sekumpulan atribut, yang tidak dibutuhkan di tipe entitas yang
sama
B. KEY
▪ Candidate Key
o Sekumpulan atribut yang teridentifikasi secara unik untuk setiap kejadian pada sebuah
tipe entitas
o Primary Key
‣ Candidate Key yang dipilih untuk mengidentifikasi secara unik setiap kejadian pada
sebuah tipe entitas
‣ Pilihan berdasarkan pertimbangan panjang atribut, jumlah minimal dari atribut
yang dibutuhkan dan certainty of uniqueness
o Composite Key
‣ Sebuah Candidate Key yang terdiri dari dua atau lebih atribut
D. TIPE ENTITAS
▪ Tipe Entitas Strong
68
o Tipe entitas yang eksistensinya tidak tergantung dengan tipe entitas lain
o Setiap entitas yang terjadi teridentifikasi secara unik menggunakan atribut Primary Key
pada tipe entitas tersebut
o Terkadang disebut sebagai induk, pemilik atau entitas dominan
▪ Tipe Entitas Weak
o Tipe entitas yang eksistensinya tergantung dengan tipe entitas lain
o Tidak mengidentifikasi terjadinya entitas hanya menggunakan atribut ini
o Terkadang disebut anak, dependent atau entitas subordinate
E. BATASAN STRUKTURAL
▪ Batasan tipe utama pada hubungan disebut multiplicity
▪ Multiplicity- jumlah (atau range) dari kemungkinan kejadian pada sebuah tipe entitas yang
mungkin berhubungan dengan sebuah kejadian pada asosiasi tipe entitas melalui hubungan
tertentu
▪ Merepresentasikan aturan(disebut aturan bisnis) established oleh pengguna atau
perusahaan
▪ Tingkat hubungan paling umum adalah biner
▪ Hubungan biner pada umumnya diartikan sebagai berikut:
o Satu ke satu (1:1)
o Satu ke banyak (1:*)
o Banyak ke banyak (*:*)
▪ Multiplicity dari hubungan Staf Manages Branch (1:1)
69
▪ Multiplicity untuk hubungan kompleks
o Jumlah (atau range) kemungkinan terjadinya sebuah tipe entitas pada hubungan n-ary
ketika nilai lain (n-1) are fixed
▪ Batasan Struktural
o Multiplicity dibuat dalam dua tipe batasan pada hubungan : cardinality dan participation
o Cardinality
‣ Jumlah maksimum kemunculan dalam suatu hubungan relasi
o Participation
‣ Menentukan apakah semua atau hanya beberapa entitas yang berpartisipasi dalam
hubungan
70
o Restruktur ER Model untuk menghapus fan trap
o Jaringan semantic
▪ Chasm Trap
o Ketika sebuah model suggest eksistensi sebuah hubungan antara tipe entitas, tetapi
tidak ada jalur yang menghubungkannya
o Jaringan Semantic
71
RELASI UNTUK DATA LOGIS
C. SPECIALIZATION/GENERALIZATION
▪ Specialization
o Proses memaksimalkan perbedaan antara anggota entitas dengan mengidentifikasi
karakteristik yang berbeda diantara mereka
o Top-down approach: mengidentifikasi perbedaan (atribut dan atau hubungan) antara
anggota pada entitas Staff
▪ Generalization
o Proses meminimumkan perbedaan antara anggota dengan mengidentifikasi
karakteristik umum mereka
o Botom-up approach: Menemukan atribut umum pada semua staff (Manager,
SalesPersonnel dan Secretary)
D. BATASAN DI SPECIALIZATION/GENERALIZATION
▪ 2 batasan yang mungkin digunakan pada Spesialisasi/generalisasi
o Batasan partisipan
72
‣ Menentukan apakah setiap anggota pada superclass harus berpartisipasi sebagai
anggota pada subclass
‣ Bisa perintah ataupun opsional
• Perintah: setiap anggota staff harus mempunyai kontrak
• Opsional: setiap anggota staff tidak membutuhkan tambahan peran kerja
o Batasan disjoint
‣ Mendeskripsikan hubungan antara anggota subclass dan mengindikasi apakah
anggota superclass bisa menjadi anggota pada sebuah atau lebih subclass
‣ Hanya digunakan ketika superclass mempunyai lebih dari satu subclass
‣ Bisa disjoint (OR) ataupun nondisjoint (AND)
▪ Terdapat empat kategori batasan pada spesialisasi dan generalisasi
o Perintah dan disjoint
o Opsional dan disjoint
o Perintah dan nondisjoint
o Opsional dan nondisjoint
E. AGGREGATION
▪ Representasi hubungan ‘Mempunyai sebuah’ atau ‘bagian dari’ antara tipe entitas, dimana
salahsatunya merepresentasikan semua dan lainnya merepresentasikan bagian
▪ Agregasi tidak bisa mengubah makna dari hubungan semua dan bagian
F. KOMPOSISI
▪ Bentuk spesifik dari aggregation yang merepresentasikan sebuah hubungan antar entitas
▪ Komposisi harus mengatur pembuatan dan penghancuran pada bagiannya
▪ Artinya, sebuah objek boleh menjadi bagian dari satu komposit pada satu waktu (dimana
aggregation diijinkan)
NORMALISASI
A. PENGENALAN
▪ Normalisasi adalah sebuah teknik untuk mendekomposisi suatu tabel menjadi beberapa
tabel agar tidak terjadi anomali pada waktu melakukan manipulasi
▪ Tujuan Normalisasi
o Menghilangkan data yang tidak perlu, yaitu data yang berulang (redundancy data)
o Mencegah terjadinya anomaly data
o Mengurangi kompleksitas
73
▪ Contoh Data Redundancy
‣ Masalah berhubungan dengan data redundancy diilustrasikan dengan membandingkan
tabel Staff dan Branch dengan tabel StaffBranch
‣ Tabel StaffBranch mempunyai redundant data; detail dari cabang diulangi untuk
setiap anggota staff yang bekerja di cabang tersebut
‣ Sebaliknya, informasi cabang ditampilkan hanya sekali untuk setiap cabang pada
tabel Branch dan hanya nomor cabang (BranchNo) yang diulangi di tabel Staff,
untuk merepresentasi dimana setiap anggota bekerja
▪ Update Anomali
‣ Tabel yang memiliki informasi berlebihan berpotensi terkena update anomaly
‣ Contoh update Anomali
‣ Insertion
• Untuk memasukan staff baru di cabang B007, kita juga harus memasukan detail
data pada cabang
• Untuk memasukan cabang baru yang tidak punya anggota menggunakan null
‣ Deletion
• Jika SA9 dihapus, B007 juga dihapus dari database
‣ Modification
• Untuk memperbarui alamat B003, kita harus memperbarui kolom semua staff
yang bekerja disana
C. KETERGANTUNGAN FUNGSIONAL
▪ Konsep penting yang berhubungan dengan normalisasi
▪ Ketergantungan fungsional mendeskripsikan hubungan antara atribut
▪ Contoh
o Jika A dan B adalah atribut dari tabel R
o B bergantung fungsional kepada A (dinotasikan dengan A→B)
74
o Jika setiap nilai di A di R berhubungan dengan satu nilai B di R
▪ Karakteristik Ketergantungan Fungsional
o Property dari meaning atau semantic atribut di tabel
o Representasi diagram
o Determinant dari ketergantungan fungsional referensi dari atribut atau grup berada di
sebelah kiri panah
▪ Contoh Ketergantungan Fungsional
o Contoh
Nim →nama [yes] (NIM Spesifik untuk sebuah nama) Alamat → kodepos [yes]
Nama→ Nim [no] (Nama tidak spesifik untuk sebuah NIM, misal “putra” bisa saja ada
beberapa NIM yang keluar)
Kodepos → alamat [no]
▪ Karakteristik dari Ketergantungan fungsional
o Determinan seharusnya mempunyai jumlah atribut yang minimal yang dibutuhkan
untuk menjaga ketergantungan fungsional dengan atribut yang di arah kanan panah
o Persyaratan ini disebut full functional dependency
o Full functional dependency mengindikasikan bahwa
‣ Jika A dan B adalah atribut dari tabelB secara penuh fungsional tergantung pada A,
jika B secara fungsional bergantung pada A
‣ Tetapi tidak pada subset A
o A bergantung fungsional A →B secara full functional dependency jika menghapus atribut
dari hasil A jika ketergantungan tidak ada
o A bergantung fungsional A→B secara parsial jika terdapat
o beberapa atribut yang bisa dihapus dari A dan tidak bergantung
o Contoh
‣ Tabel staff mempunyai staffNo, sName →branchNo
75
‣ Determinant mempunyai jumlah minimal atribut yang dibutuhkan untuk menjaga
ketergantungan dengan atribut di sebelah kanan
▪ Mengidentifikasi Functional Dependencies
o Mengidentifikasi semua functional dependencies antara sekumpulan atribut cukup
mudah
‣ Jika makna dari setiap atribut dan hubungan antara atribut mudah dimengerti
o Informasi ini seharusnya disediakan oleh enterprise dalam bentuk diskusi dengan
pengguna dan atau dokumentasi seperti persyaratan spesifikasi pengguna
o Tetapi, jika pengguna tidak bisa berkonsultasi dan atau dokumen tidak komplit
kemudan tergantung pada aplikasi database itu mungkin dibutuhkan untuk database
designer untuk menggunakan pengalaman mereka untuk menyediakan informasi yang
hilang
76
E. KETERGANTUNGAN FUNGSIONAL DAN PRIMARY KEY
▪ Mengidentifikasi Primary Key untuk Tabel menggunak Functional Dependencies
o Tujuan utama mengidentifikasi sekumpulan functional dependencies untuk sebuah
tabel adalah untuk menspesifikasikan sekumpulan batasan integritas yang harus
ditahan pada tabel
o Sebuah batasan integritas yang penting untuk dipertimbangkan pertama adalah
mengidentifikasi Candidate Key, dimana salah satunya dipilih untuk menjadi Primary
Key tabel
o Tabel StaffBranch mempunyai 5 functional dependencies
‣ staffNo →sName,position,salary,branchNo,bAddress
‣ branchNo→bAddress
‣ bAddress→branchNo
‣ branchNo,position → salary
‣ bAddress,position → salary
o Determinannya adalah staffNo, branchNo, bAddress, (branchNo,position) dan
(bAddress, position)
o Untuk mengidentifikasi semua Candidate Key, identifikasi atribut(atau sekumpulan
atribut) yang secara unik mengidentifikasi setiap kolam di tabel
o Semua atribut yang tidak menjadi bagian Candidate Key seharusnya menjadi functional
dependent kepada Key
o Satu Candidate Key dan kemudian menjadi Primary Key untuk tabel StaffBranch adalah
staffNo, semua atribut lainnya pada tabel menjadi functional dependent terhadap
staffNo
‣ staffNo →sName,position,salary,branchNo,bAddress
o Contoh
‣ Tabel sampel mempunyai 4 functional dependencies
• A→C
• C→A
• B→D
• A,B → E
‣ Determinant pada tabel Sampel adalah A,B,C dan (A,B). Tetapi salah satu
determinan yang secara fungsional menentukan semua bagian atribut adalah (A,B)
‣ (A,B) teridentifikasi menjadi Primary Key untuk tabel ini
F. PROSES NORMALISASI
▪ Teknik formal untuk menganalisis tabel berdasarkan Primary Keynya (atau Candidate key)
dan functional dependencies antara atribut dari tabel
▪ Sering dieksekusi sebagai rangkaian langkah
▪ Setiap langkah berkoresponden ke sebuah bentuk normal, yang disebut properties
▪ Saat normalisasi berjalan, tabel menjadi :
o Dengan progress lebih ketat (kuat) dalam format dan
o Mengurangi vulnerable untuk update anomaly
▪ Unnormalized Form (UNF)
o Table yang memiliki satu atau lebih kelompok yang berulang
o Untuk membuat sebuah tabel unnormalized, ubah data dari sumber informasi menjadi
format tabel dengan kolom dan baris
77
▪ UNF ke 1NF
o Nominasi sebuah atribut atau sekelompok atribut untuk beraksi sebagai kunci pada
tabel unnormalized
o Mengidentifikasi kelompok yang berulang di tabel unnormalized yang mengulangi
untuk atribut kunci
o Menghapus kelompok yang berulang dengan memasukan data yang sesuai di kolom
yang kosong
o Atau menghapus kelompok yang berulang dengan menempatkan data berulang
bersama dengan salinan atribut key nya di tabel yang berbeda
▪ First Normal Form (1NF)
o Sebuah tabel yang berpotong setiap baris dan kolom terdiri satu dan hanya satu nilai
▪ Permasalahan di 1NF
o Termasuk data redundancy yang signifikan
o Subjek untuk upadate anomaly
o Sehingga, muncul 2NF
▪ Second Normal Form (2NF)
o Berdasarkan pada konsep full functional dependency
o Full functional dependency mengindikasikan jika
‣ Atribut A dan B pada sebuah tabel
‣ B semuanya bergantung pada A jika B adalah fungsional bergantung pada A tetapi
tidak pada subset A
o Sebuah tabel di 1NF dan setiap atribut non-primary-key adalah semuanya functionally
dependent pada Primary Key
‣ Sehingga 2NF digunakan pada tabel dengan composite Key
‣ Sehingga, sebuah tabel dengan atribut primary key tunggal secara otomatis berada
2NF
▪ 1NF ke 2NF
o Identifikasi Primary Key pada tabel 1NF
o Identifikasi functional dependencies pada tabel
o Jika partial dependencies ada pada Primary Key, hapus mereka dengan menempatkan
mereka pada tabel baru beserta salinan determinant mereka
▪ Permasalahan pada 2NF
o Masih terdapat kemungkinan dari update anomaly
▪ Third Normal Form (3NF)
o Sebuah tabel yang berada di 1NF dan 2NF dan dimana tidak terdapat atribut non-
primary-key adalah transitively dependent pada Primary key
▪ 2NF ke 3 NF
o Identifikasi Primary Key pada tabel 2NF
o Identifikasi functional dependencies pada tabel
o Jika transitive dependencies ada pada primary key, hapus mereka dengan menempatkan
mereka pada tabel baru dengan salinan determinant mereka
o Definisi Umum 2NF ke 3NF2NF : Sebuah tabel pada 1NF dan setiap atribut non-primary-
key adalah secara penuh functionally dependent pada candidate key
o 3NF : Sebuah tabel pada 1NF dan 2NF dan tidak ada atribut non- primary-key yang
transitively dependent pada setiap candidate key
78
G. ALAT DEKOMPOSISI
▪ Dua peralatan penting pada dekomposisi
o Lossless-join property yang memudahkan kita untuk menemukan satu instansi pada
tabel asli dari instansi koresponden di tabel yang lebih kecil
o Dependency preservation property
‣ Memudahkan kita untuk memaksa batasan pada tabel asli dengan memaksa
beberapa batasan di setiap tabel yang lebih kecil
‣ Jika sebuah dekomposisi bukan dependency-preserving, kemudian, dependency
tersebut kehilangan dekomposisi
A. OBJECTIVES OF SQL
▪ SQL adalah transform-oriented language, bahasa yang didesain untuk menggunakan relation
untuk mengubah input menjadi output yang dibutuhkan
▪ Mempunyai 2 komponen utama
o DDL untuk mendefinisikan struktur database
o DML untuk membetulkan dan mengupdate data
▪ Tujuan SQL
o Membuat basis data dan struktur relasi
o Melakukan input, perubahan, dan penghapusan data dari suatu relasi
o Melakukan pencarian sederhana maupun kompleks
▪ Terdiri dari bahasa Inggris standar
o CREATE TABLE …;
o INSERT INTO … VALUES(…);
o SELECT … FROM … WHERE …;
▪ Bisa digunakan oleh semua pengguna
▪ Sebuah standar ISO saat ini sudah ada untuk SQL, membuat keduanya formal dan bahasa
standar secara de facto untuk relational database
C. LITERAL
▪ Literal adalah pernyataan yang sering digunakan di SQL
▪ Semua literal non numerik harus menggunakan kutipan ( Contoh: ‘London’)
▪ Semua literal numeric tidak menggunakan kutipan (Contoh :650.00)
79
D. SELECT STATEMENT
SELECT[DISTINCT|ALL]
{*| [columnExpression[AS newName]] [ , …]}
FROM TableName [alias] [ , …]
[WHERE condition]
[GROUP BY columList] [HAVING condition] [ORDER BY columnList]
▪ Penjelasan:
o FROM : menjelaskan tabel yang akan digunakan WHERE : menjelaskan kondisi
o GROUP BY : membentuk kelompok baris dengan nilai kolom yang sama HAVING :
menyaring subjek kelompok ke beberapa kondisi
o SELECT : menjelaskan kolom mana yang akan ditampilkan dalam output ORDER BY :
menjelaskan perintah output
‣ Urutan pada klausa tidak bisa diubah
‣ Hanya SELECT dan FROM yang merupakan perintah yang harus ada
E. CONTOH
▪ Semua Kolom dan Semua baris
SELECT staffNo, fName, lName, position, sex, DOB, salary, branchNo
( bisa diganti dengan * sehingga menjadi SELECT *)
FROM Staff;
▪ Menghitung Fields
Menampilkan daftar gaji bulanan staff dan
hanya menampilkan
staffNo, fName, lName dan salary.
SELECT staffNo, fName,lName,
salary/12
FROM Staff
80
▪ Untuk mengubah nama kolom pada salary
SELECT staffNo, fName,lName,
salary/12 AS monthlySalary
FROM Staff
▪ Mengatur Anggota
o Daftar manager dan supervisor
SELECT staffNo, fName, lName, position
FROM Staff
WHERE position IN
(‘Manager’, ‘Supervisor’);
81
▪ Mencocokan Pola pada Pencarian
o Menemukan semua pemiliki yang memiliki kata ‘Glasgow’ pada kolom
alamatnya
SELECT ownerNo,fName,lName,address,telNo
FROM PrivateOwner
WHERE address LIKE ‘%Glasgow%’;
▪ Menggunakan Having
Untuk setiap cabang dengan member lebih dari 1 orang, temukan jumlah staff di setiap
cabang dan jumlahkan gajinya
SELECT branchNo, COUNT(staffNo) AS myCount, SUM(salary)
82
AS mySum
FROM Staff
GROUP BY branchNo HAVING
COUNT(staffNo) > 1
ORDER BY branchNo;
▪ Contoh ALL
Mencari staff yang gajinya lebih tinggi daripada gaji semua staff yang bekerja di cabang B003
SELECT staffNo,fName,lName, position, salary FROM Staff
WHERE salary>ALL (SELECT salary FROM Staff
WHERE branchNo=’B003’);
83
SELECT
c.clientNo,c.fName,c.lName,v.propertyNo,v.comment FROM Client c,
Viewing v
WHERE c.clientNo=v.clientNo;
Penjelasan
Hanya baris dari kedua tabel yang mempunyai nilai yang identik/sama pada kolom
clientNo(c.clientNo=v.clientNo) yang masuk dalam output
▪ SQL menyediakan cara alternative untuk menspesifikasikan join
o FROM Client c JOIN Viewing v ON c.clientNo=v.clientNo
o FROM Client JOIN Viewing USING clientNo
o FROM Client NATURAL JOIN Viewing
▪ Contoh mengurutkan Join:
Untuk setiap cabang, tampilkan daftar nomor dan nama staff yang mengatur property dan
property yang dia atur
SELECT s.branchNo, s.staffNo, s.fName, s.lName, propertyNo FROM
Staff s, PropertyForRent p
WHERE s.staffNo=p.staffNo
ORDER BY s.branchNo,s.staffNo,propertyNo;
C. COMPUTING A JOIN
▪ Prosedur untuk menghitung hasil dari sebuah join:
o Buat produk Cartesian dari nama tabel pada klausa FROM
84
o Jika terdapat klausa WHERE, gunakan kondisi pencarian pada setiap baris tabel produk,
sebagai penahan baris yang memuaskan kondisi pencarian
o Untuk setiap baris tersisa, tentukan nilai untuk setiap item di daftar SELECT untuk
menghasil sebuah baris dalam tabel hasil
o Jika DISTINCT sudah dispesifikasikan, hapus baris duplikasi dari hasil tabel
o Jika ada klausa ORDER BY, urutkan hasil tabel sesuai kebutuhan
▪ SQL menyediakan format khusus SELECT untuk produk Cartesian SELECT [DISTINCT|ALL]
{*|columnList}
FROM Table1 CROSSJOIN Table2
▪ Inner Joins
o Jika satu tabel dari tabel join tidak sama, baris dihilangkan dari tabel hasil
o Operasi inner join menahan baris yang tidak sesuai dengan kondisi join
o Perhatikan tabel dibawah ini
Penjelasan:
o Tabel hasil mempunyai dua baris dimana memiliki kota yang sama
o Tidak ada baris untuk kota Bristol dan Aberdeen
o Untuk memasukkan baris yang tidak sama kedalam tabel, gunakan Outer Join
▪ Contoh Left Outer Join
Daftar cabang dan property yang sama juga dengan cabang yang tidak sama
SELECT b.*, p.*
FROM Branch1 b LEFT JOIN PropertyForRent1 p On
b.bCity=p.pCity;
Penjelasan:
o Termasuk baris pertama pada tabel pertama (kiri) yang tidak sama dengan baris tabel
kedua (kanan)
o Kolom dari tabel kedua tidak diisi atau kosong
▪ Contoh Right Outer Join
Daftar cabang dan property yang sama juga dengan cabang yang tidak sama
SELECT b.*, p.*
FROM Branch1 b RIGHT JOIN PropertyForRent1 p ON
85
b.bCity=p.pCity;
Penjelasan
Right Outer Join termasuk baris kedua (kanan) tabel yang tidak sama dengan baris dari tabel
pertama (kiri) Tabel pertama tidak diisi atau kosong
▪ Contoh Full Outer Join
Daftar cabang dan property yang sama juga dengan cabang yang tidak sama
SELECT b.*,p.*
FROM Branch1 b LEFT JOIN PropertyForRent1 p ON
b.bCIty=p.pCity UNION
SELECT b.*,p.*
FROM Branch1 b RIGHT JOIN PropertyForRent1 p ON
b.bCIty=p.pCity;
Penjelasan
o Termasuk baris yang tidak sama di kedua tabel
o Kolom yang tidak sama tidak diisi atau kosong
Penjelasan
o Kondisi pencarian s.branchNo=b.branchNo dibutuhkan untuk mempertimbangkan
record cabang yang benar untuk setiap anggota staff
o Jika dihilangkan, akan menampilkan semua daftar staff karena subquerinya adalah
86
SELECT * FROM Branch WHERE city=’London’
▪ Akan selalu bernilai benar dan queri akan menjadi
SELECT staffNo,fName,lName, position
FROM Staff WHERE true;
▪ Bisa juga queri ini ditulis menggunakan struktur Join
SELECT staffNo,fName,lName,position
FROM Staff s, Branch b
WHERE s.branchNo=b.branchNo AND city=’London’;
87
(SELECT city FROM PropertyForRent);
▪ Penggunaan EXCEPT
Daftar nama kota dimana terdapat kantor cabang tetapi tidak ada property
(SELECT city FROM Branch) EXCEPT
(SELECT city FROM PropertyFromRent);
Atau
(SELECT * FROM Branch) EXCEPT CORRESPONDING BY city
(SELECT* FROM PropertyForRent);
▪ INSERT
Memasukkan data baru pada relation Contoh
INSERT INTO Staff
VALUES (‘SG16’ , ‘Alan’, ‘Brown’, ‘Assisstant’,
‘M’, ‘1957-05-25’, 8300, ‘B003’);
▪ UPDATE
Memperbarui data yang telah ada. Contoh :
UPDATE Staff
SET salary=salary*1.03;
DELETE
▪ Menghapus data yang sudah ada di tabel Contoh
DELETE FROM Viewing WHERE propertyNo= ‘PG14’;
DEFINISI DATA
88
▪ Angka Numerik Perkiraan
89
o Keputusan diambil ketika mencoba mengupdate/ menghapus nilai CK di tabel induk
dengan mencocokan baris pada anak yang bergantung pada aksi referensial
dispesifikasikan menggunakan sub klausa ON UPDATE dan ON DELETE
o Saat pengguna mencoba untuk menghapus baris dari tabel induk, dan terdapat satu atau
lebih baris yang sama dengan tabel anak, SQL memberikan empat pilhan tergantung aksi
yang diambil
CASCADE, SET NULL, SET DEFAULT,NO ACTION
▪ Batasan Umum
Pembaruan pada tabel dibatasi oleh aturan umum yang direpresentasikan oleh UPDATE, bisa
menggunakan CHECK/UNIQUE di CREATE dan ALTER TABLE
o Sama dengan klausa CHECK, juga mempunyai: CREATE ASSERTION
Assertion Name CHECK (searchCondition)
o Berbeda dengan CHECK/UNIQUE, ASSERTION bisa digunakan pada lebih dari satu tabel
CREATE ASSERTION
StaffNotHandlingTooMuch CHECK(NOT EXISTS(SELECT staffNo
FROM PropertyForRent GROUP BY StaffNo HAVING COUNT (*)>100))
▪ Klausa CHECK, yang memungkinkan batasan untuk ditentukan pada kolom atau seluruh
tabel. Format klausa CHECK adalah
CHECK(searchCondition)
Sex CHAR NOT NULL CHECK(sex IN (‘M’, ‘F’))
▪ Domain dapat ditentukan lebih eksplisit dengan menggunakan pernyataan CREATE DOMAIN
CREATE DOMAIN DomainName[AS]data Type [DEFAULT
defaultOption]
[CHECK (searchCondition)]
CREATE DOMAIN sexType AS CHAR DEFAULT ‘M’
CHECK (VALUE (‘M’ , ‘F’));
sex SEXType NOT NULL
CREATE DOMAIN BranchNumber AS CHAR (4)
CHECK (VALUE IN (SELECT branchNo FROM
Branch));
D. SQL DDL
▪ SQL DDL mengijinkan objek database seperti skema, domain, tabel , view dan index bisa
dibuat dan dihapus
▪ Pernyataan utama SQL DDL adalah
CREATE SCHEMA DROP SCHEMA
CREATE/ALTER DOMAIN DROP DOMAIN
CREATE/ALTER TABLE DROP TABLE
CREATE VIEW DROP VIEW
▪ Banyak DBMS juga menyediakan (tidak standar)
CREATE INDEX DROP INDEX
▪ Relation(tabel) dan objek database lainnya ada di envinroment
▪ Setiap envinroment terdiri atas satu atau lebih catalog, dan setiap catalog terdiri atas
sekumpulan skema
▪ Skema adalah nama kumpulan objek database yang berhubungan
▪ Objek di skema bisa tabel, views, domain, assertion, collation, translations, dan sekumpulan
karakter. Semuanya mempunyai pemilik sama
90
E. CREATE TABLE
▪ Membuat tabel dengan satu atau lebih kolom dispesifikasikan di dataType
▪ Dengan NOT NULL, sistem menolak semua percobaan untuk memasukkan null di kolom
▪ Bisa menspesifikasikan nilai DEFAULT untuk kolom
▪ PRIMARY KEY seharusnya selalu dispesifikasikan sebagai NOT NULL
▪ Klausa FOREIGN KEY menspesifikasikan FOREIGN KEY dengan referential action
▪ Contoh :
F. ALTER TABLE
▪ Menambahkan kolom baru pada tabel
▪ Menghapus kolom pada tabel
▪ Menambahkan batasan tabel
▪ Menghapus batasan tabel
▪ Mengatur default pada kolom
▪ Menghapus default pada kolom
▪ Format dasar dari pernyataannya adalah :
Keterangan :
o DROP COLUMN mempunyai opsi kualifikasi dimana menspesifikasikan apakah aksi
DROP adalah cascade atau tidak
‣ RESTRICT : operasi akan ditolak jika kolom yang direferensikan oleh objek database
lain. Merupakan setting default
‣ CASCADE : operasi akan diproses dan secara otomatis menghapus kolom dari
setuap objek database yang direferensikan.
91
G. DROP TABLE
▪ DROP TABLE TableName[RESTRICT|CASCADE]
Contoh : DROP TABLE PropertyForRent
▪ Menghapus nama tabel dan semua baris di dalamnya
o Gunakan DELETE FROM PropertyForRent untuk menghapus baris saja
▪ Dengan RESTRICT, jika terdapat objek yang eksistensinya tergantung pada eksistensi pada
tabel ini, SQL tidak mengijinkan permintaan
▪ Dengan CASCADE, SQL menghapus semua objek dependen
92
UJIAN TENGAH SEMESTER TAHUN AKADEMIK 2017/2018
Mata Kuliah : Basis Data
Tingkat : II (Dua)
Pengajar : Tim Dosen
Hari, Tanggal : Senin, 23 April 2018
Waktu Ujian : 120 menit
Sistem Ujian : Tutup Buku
Jawablah seluruh pertanyaan berikut ini dengan lengkap, baik dan benar.
1. Dilan adalah seorang ketua club motor yang memiliki cabang organisasi di seluruh pulau Jawa. Setiap
cabang organisasi dipimpin oleh seorang ketua cabang. Dan untuk menjaga ketertiban, setiap
anggota club memiliki satu pengawas yang disebut sebagai sesepuh. Setiap anggota harus
mendaftarkan sepeda motor yang dimilikinya untuk keperluan organisasi. Organisasi yang dipimpin
Dilan memiliki hubungan yang baik dengan pihak kepolisian, dimana setiap cabang memiliki
pembina yang berasal dari pihak kepolisian. Jika Anda diminta bantuan oleh Dilan untuk merancang
basis data untuk klub motornya, maka identifikasilah entitas apa saja yang ada dalam basis data yang
dibuat dan buatlah Entity Relationship Diagram (ERD) dari entitas tersebut!
Order
idOrder tanggalOrder nomorOrder idPelanggan
1 7/14/2012 12:00:00 542378 3
2 7/15/2012 10:00:00 542379 1
3 7/16/2012 09:00:00 542380 1
4 7/17/2012 11:00:00 542381 2
5 7/18/2012 14:00:00 542382 4
93
Order Item
idOrderItem idOrder idProduk kuantitas
1 1 11 20
2 1 12 40
3 1 13 10
4 2 11 10
5 2 14 15
6 3 14 20
7 3 15 20
8 3 16 20
9 4 12 25
10 4 16 10
11 4 17 10
12 5 13 20
13 5 14 25
14 5 17 25
Produk
idProduk namaProduk idSupplier hargaPerUnit kemasan
11 Vegetable Oils 1 18.000 10 boxes x 20 bags
12 Olive Oils 1 19.000 24-12 oz bottles
13 Aniseed Syrup 1 10.000 12-550 ml bottles
14 Chef Anton’s Cajun Seasoning 2 22.000 48-6 oz jars
Grandma’s Boysenberry
15 3 25.000 12-8 oz jars
Spread
16 Chef Anton’s Gumbo Mix 2 21.350 36 boxes
17 Uncle Bob’s Dried Pears 3 30.000 12-1 lb pkgs
Supplier
idSupplier namaPerusahaan namaKontak kota negara telepon fax
1 Ceria Liquids Sahid Jakarta Indonesia 021- 021-
8403241 8403241
2 New Cajun Bryan New USA - -
Delights Orleans
3 Grandma Melly Melbourne Australia - -
Homestead
Dari basis data tersebut, tuliskan SQL DDL dan DML untuk pertanyaan berikut, dan khusus untuk DML
tuliskan outputnya:
a) Buatlah tabel Pelanggan
b) Update kota menjadi California untuk supplier yang berasal dari USA
c) Tampilkan semua produk yang harganya antara 10.000 dan 20.000
94
d) Tampilkan produk-produk yang kemasannya dalam bottles dan pelanggan yang membeli produk
tersebut
e) Jika pelanggan Andi Maulana melakukan order yang baru dengan rincian:
- Order pada tanggal 7/19/2012 10:00:00 dengan nomor Order 542383
- Membeli produk Vegetable Oils dengan kuantitas sebanyak 15 unit dan Produk Olive Oils
dengan kuantitas sebanyak 10 unit
Menurut Anda, tabel-tabel mana yang perlu di-insert? Tuliskan DML untuk melakukan insert
tersebut?
3. Perhatikan tabel 1 yang terdapat pada lampiran soal. Dari tabel tersebut:
a) Buat tabel bentuk 1NF
b) Berikan 3 contoh masalah update anomalies yang muncul akibat redudansi data yang sudah ada
pada tabel tersebut
c) Identifikasi functional dependencies yang ada (termasuk tentukan candidate key, full functional
dependencies, partial dependency, dan transitive dependency jika ada)
d) Buat tabel bentuk 2NF
e) Buat tabel bentuk 3NF
95
PEMBAHASAN BASIS DATA
KETUA
idKetua
Nama
Alamat
noHp
1..1
Memiliki
1..1
CABANG KEPOLISIAN
noCabang noIdentitas
Alamat Dibina 1..1 Nama
Kota 1..* Alamat
noHp
1..1
Memiliki
1..*
PENGAWAS ANGGOTA
idPengawas 1..1 Mengawasi idAnggota
Nama Nama
Alamat 1..* Alamat
noHp noHp
2.
a)
Buatlah tabel Pelanggan
CREATE TABLE Pelanggan (
IdPelanggan VARCHAR(5) PRIMARY KEY,
namaDepan VARCHAR(15) NOT NULL,
namaBelakang VARCHAR(15),
kota VARCHAR(10) NOT NULL,
Negara VARCHAR(10) NOT NULL,
Telepon VARCHAR(25));
UPDATE Supplier
SET kota=’California’
WHERE Negara=’USA’
96
OUTPUT :
Supplier
idSupplier namaPerusahaan namaKontak kota negara telepon fax
1 Ceria Liquids Sahid Jakarta Indonesia 021- 021-
8403241 8403241
2 New Cajun Bryan California USA - -
Delights
3 Grandma Melly Melbourne Australia - -
Homestead
d) Tampilkan produk-produk yang kemasannya dalam bottles dan pelanggan yang membeli produk
tersebut
SELECT p.idProduk, p.namaProduk, p.kemasan, l.idPelanggan, l.namaDepan, l.namaBelakang
FROM Produk p, OrderItem o, Order r, Pelanggan l
WHERE p.idProduk=o.idProduk AND o.idOrder=r.idOrder AND
r.idPelanggan=l.idPelanggan AND p.kemasan LIKE ‘%bottles%’;
e)
Jika pelanggan Andi Maulana melakukan order yang baru dengan rincian :
- Order pada tanggal 7/19/2012 10:00:00 dengan nomor Order 542383
- Membeli produk Vegetable Oils dengan kuantitas sebanyak 15 unit dan produk Olive Oils dengan
kuantitas sebanyak 10 unit
Menurut Anda, tabel-tabel mana yang perlu di-insert? Tuliskan DML untuk melakukan insert
tersebut?
97
Tabel yang perlu di-insert adalah tabel Order dan OrderItem
Berikut kalimat
Kami kurang
pernyataan tidak Jawaban Ya
M1 Q1 J1 A1 sependapat dengan
setuju yang santun Tunggal
gagasan saudara
adalah
Berikut kalimat
kami akan
pernyataan tidak Jawaban Tidak
M1 Q1 J1 A2 mempertimbangkan
setuju yang santun Tunggal
gagasan saudara
adalah
Berikut kalimat
pendapat anda
pernyataan tidak Jawaban Tidak
M1 Q1 J1 A3 perlu ditinjau
setuju yang santun Tunggal
kembali
adalah
berikut hal-hal yang
tidak perlu tanggapan yang
diperhatikan dalam Jawaban dikemukakan harus Tidak
M1 Q1 J2 A4
mengemukakan ganda berhubungan atau
pendapat atau sesuai dengan topik
tanggapan
berikut hal-hal yang
tidak perlu tanggapan
M1 Q1 diperhatikan dalam J2 Jawaban A5 dikemukakan dalam Tidak
mengemukakan ganda uraian yang lebar
pendapat atau
tanggapan
98
berikut hal-hal yang
tidak perlu menggunakan kata
M1 Q1 diperhatikan dalam J2 Jawaban A6 yang tepat dan Ya
mengemukakan ganda bersahaja
pendapat atau
tanggapan
My
M2 Q1 English…really…since J1 Jawaban A1 had/improve Tidak
I moved to Australia Tunggal
My
M2 Q1 English…really…since J1 Jawaban A2 has/improved Ya
I moved to Australia Tunggal
My
M2 Q1 English…really…since J1 Jawaban A3 is/Improving Tidak
I moved to Australia Tunggal
FD1 Kode materi, Kode Jenis Pertanyaan, Kode Jawaban → Jawaban ( primary key )
FD2 kode materi, kode jenis pertanyaan, kode jawabn, jawaban benar → Jawaban (partial dependency)
FD3 Kode Jenis Pertanyaan → Jenis Pertanyaan (Transitive dependency)
1NF ke 2NF
Materi bahasan
Kode Materi Materi Kode Pokok Bahasan Pokok Bahasan
Materi Pertanyaan
Kode Kode Jenis Pertanyaan
Materi Pertanyaan
Berikut kalimat pernyataan tidak setuju yang santunadalah
M1 J1
99
Tabel 2
Kode Kode Jenis Jenis Kode Kode Jawaban
Jawaban Benar
Materi Pertanyaan Pertanyaan Pertanyaan Jawaban
Kami kurang
Jawaban Ya
M1 J1 Q1 A1 sependapat dengan
Tunggal
gagasan saudara
kami akan
Jawaban Tidak
M1 J1 Q1 A2 mempertimbangkan
Tunggal
gagasan saudara
pendapat anda
Jawaban Tidak
M1 J1 Q1 A3 perlu ditinjau
Tunggal
kembali
tanggapan yang
Jawaban dikemukakan harus Tidak
M1 J2 Q1 A4
ganda berhubungan atau
sesuai dengan topik
tanggapan
Jawaban dikemukakan dalam
M1 J2 Q1 A5 Tidak
ganda uraian yang lebar
menggunakan kata
Jawaban Ya
M1 J2 Q1 A6 yang tepat dan
ganda
bersahaja
Jawaban Tidak
M2 J1 Q1 A1 had/improve
Tunggal
Jawaban Ya
M2 J1 Q1 A2 has/improved
Tunggal
Jawaban Tidak
M2 J1 Q1 A3 is/Improving
Tunggal
2NF ke 3NF
Materi Bahasan
Kode Materi Materi Kode Pokok Bahasan Pokok Bahasan
Materi Pertanyaan
Kode Kode Jenis Pertanyaan
Materi Pertanyaan
Berikut kalimat pernyataan tidak setuju yang santunadalah
M1 J1
100
Jenis Pertanyaan
Kode Jenis Pertanyaan Jenis Pertanyaan
J1 Jawaban Tunggal
J2 Jawaban Ganda
Tabel 3
Kode Kode Jenis Kode Kode Jawaban
Jawaban Benar
Materi Pertanyaan Pertanyaan Jawaban
Kami kurang
M1 J1 Q1 A1 sependapat dengan Ya
gagasan saudara
kami akan
M1 J1 Q1 A2 mempertimbangkan Tidak
gagasan saudara
pendapat anda
M1 J1 Q1 A3 perlu ditinjau Tidak
kembali
tanggapan yang
dikemukakan harus Tidak
M1 J2 Q1 A4
berhubungan atau
sesuai dengan topik
tanggapan
dikemukakan dalam
M1 J2 Q1 A5 Tidak
uraian yang lebar
menggunakan kata
M1 J2 Q1 A6 yang tepat dan Ya
bersahaja
M2 J1 Q1 A1 had/improve Tidak
M2 J1 Q1 A2 has/improved Ya
M2 J1 Q1 A3 is/Improving Tidak
101
UJIAN TENGAH SEMESTER TAHUN AKADEMIK 2018/2019
Mata Kuliah : Basis Data
Tingkat : II (Dua)
Pengajar : Tim Dosen
Hari, Tanggal : Selasa, 19 Maret 2019
Waktu Ujian : 120 menit
Sistem Ujian : Tutup Buku
PILIHAN GANDA
Nomor 1-20, bobot masing-masing soal 2 poin
1. Properti dari sebuah entitas atau relasi dalam basis data disebut....
a. Atribut
b. Asosiasi
c. Komponen
d. Baris
2. Berikut adalah ciri dari penerapan aplikasi dengan pendekatan File-Based Systems, kecuali ....
a. Setiap program yang berjalan memproses datanya sendiri
b. Memungkinkan data yang sama dikelola oleh aplikasi yang berbeda
c. Data disimpan secara terpisah dan independen terhadap aplikasi
d. Aplikasi yang dibangunan bertujuan untuk memproses fungsi kueri yang spesifik
3. Sekumpulan program aplikasi yang berjalan dan melakukan interasi dengan basis data disebut....
a. Database
b. Database Management System (DBMS)
c. Database Application
d. Database Systems
4. Pada Lingkungan DBMS, terdapat satu komponen yang menjembatani antara mesin dengan manusia
adalah....
a. Software
b. Procedures
c. Data
d. Application
6. Yang dimaksud dengan entity constraint dalam relational database adalah ....
a. Setiap tuple harus tidak duplikat
b. Setiap kolom dalam suatu relasi tidak boleh sama
c. Atribut primary key harus memiliki nilai
102
d. Aturan-aturan tambahan yang didefinisikan karena kebutuhan bisnis proses
7. Tabel dinamis yang dihasilkan berdasarkan operasi dari satu atau beberapa table dalam database
dan tidak perlu ada di dalam database disebut....
a. Entitas
b. Views
c. Relations
d. SQL
10. Suatu himpunan dari nilai yang memungkinkan dari satu atau beberapa atribut disebut...
a. Intension
b. Degree
c. Values
d. Domain
103
MH34 BRP 20/05/03 Ford Ka C100 Smith, J 02 Kelvinbridge
MD5 10PQ 20/05/03 Nissan Sunny C295 Pen, T 02 Kelvinbridge
12. Pernyataan berikut yang tidak benar terkait dengan normalisasi data adalah…
a. Dilakukan dengan teknik bottom-up
b. Dapat menghemat ruang penyimpanan
c. Menghilangkan adanya anomali pada basis data
d. Proses query menjadi lebih mudah
13. Berikut merupakan entitas yang memiliki hubungan bersifat one-to-one adalah…
a. Negara – Ibukota
b. Departemen – Pegawai
c. Pelanggan – Transaksi
d. Produk – Pemasok
15. Batasan yang mengatur tentang nilai suatu kolom berdasarkan kolom lain adalah…
a. Referential integrity
b. Entity integrity
c. Domain constraint
d. Required data
16. Jika kita ingin mengimplementasikan suatu kolom yang bertipe karakter dengan data kosong, maka
kita menggunakan nilai…
a. “ ”
b. “NULL”
c. ‘NULL’
d. NULL
17. kita ingin menyimpan data waktu kedatangan tamu di suatu hari, maka kita menggunakan tipe data…
a. DATE
b. DATETIME
c. TIME
d. DATE and TIME
104
18. Yang merupakan bukan kelemahan view adalah…
a. Perubahan di tabel dasar tidak langsung terlihat di view
b. Performa dari view bisa kurang bagus
c. Memungkinkan perubahan tampilan dari database
d. Kompleksitas query tidak dapat dikontrol
19. Perintah untuk menghapus semua data yang ada di tabel transaksi adalah…
a. Delete from transaksi;
b. Delete * from transaksi;
c. Drop table transaksi;
d. Drop table * transaksi;
20. Salah satu tugas Database Designers pada tahap desain basis data secara konseptual adalah....
a. Mengidentifikasi karakteristik data yang digunakan dalam proses bisnis organisasi (jawaban)
b. Mengatur sumber daya data yang digunakan dalam proses bisnis
c. Mengimplementasikan basis data dalam sebuah DBMS
d. Membuat aplikasi/program yang digunakan untuk mengakses basis data
SOAL ESAI
Soal nomor 21-23, bobot soal 10 poin
21. Sebutkan dan jelaskan limitasi/kelemahan aplikasi yang menggunakan pendekatan File- based
dalam mengelola data dan bagaimana kelemahan tersebut dapat dihindari dengan pendekatan
database!
22. Sebutkan tujuan dari pembuatan views!
23. Buatlah definisi tabel yang dapat digunakan untuk menyimpan data berikut.
Perkuliahan Hari Senin, 14 Januari 2019, Sesi 2
Kehadiran Dosen
Jam Masuk : 10:15:37
Jam Pulang : 12:42:39
Kehadiran Mahasiswa
105
24. Sebuah toko akan membuat basis data berdasarkan sumber data dari kumpulan order form yang ada
di toko tersebut. Anda diminta untuk membuat basis data berdasarkan form tersebut dengan
mengikuti kaidah normalisasi (UNF, 1NF, 2 NF dan 3NF).
Order Form
Date :
Order No : 1801 03/14/2019
Costumer No : 9876
Costumer Name : John Doe
CostumerAddress : Jalan Sigma No.19
City-Country : Jakarta, Indonesia
Pelanggan
idPelanggan namaDepan namaBelakang kota negara telepon
1 Maria Anders Berlin Germany 030-0074321
2 Ana Trujillo Mexico Mexico (5) 555-4729
3 Antonio Moreno London UK (171) 555-7788
4 Thomas Hardy Glasgow UK (171) 555-2340
5 Andi Maulana Depok Indonesia +628568431209
Order
idOrder tanggalOrder nomorOrder idPelanggan
1 1/2/2019 12:00:00 542378 3
2 1/15/2019 10:00:00 542379 1
3 1/16/2019 09:00:00 542380 1
4 2/17/2019 11:00:00 542381 2
5 2/18/2019 14:00:00 542382 4
Order Item
idOrderItem idOrder idProduk Kuantitas
1 1 11 20
2 1 12 40
3 1 13 10
4 2 11 10
5 2 14 15
6 3 14 20
7 3 15 20
106
8 3 16 20
9 4 12 25
10 4 16 10
11 4 17 10
12 5 13 20
13 5 14 25
14 5 17 25
Produk
idProduk namaProduk idSupplier hargaPerUnit
11 VegetableOils 1 18.000
12 OliveOils 1 19.000
13 AniseedSyrup 1 10.000
14 ChefAnton’sCajunSeasoning 2 22.000
15 Grandma’sBoysenberrySpread 3 25.000
16 ChefAnton’sGumboMix 2 21.350
17 UncleBob’sDriedPears 3 30.000
Supplier
idSupplier namaPerusahaan namaKontak Kota negara telepon fax
1 Ceria Liquids Sahid Jakarta Indonesia 021- 021-
8403241 8403241
2 New Cajun Bryan New USA - -
Delights Orleans
3 Grandma Melly Melbourne Australia - -
Homestead
107
PEMBAHASAN UTS GASAL 2018/2019
BASIS DATA
PILIHAN GANDA
1 A 6 C 11 B 16 D
2 B 7 B 12 A 17 C
3 C 8 A 13 D 18 C
4 A 9 B 14 D 19 A
5 D 10 D 15 A 20 C
ESAI
21. Keterbatasan pada File Based System :
▪ Pemisahan dan isolasi data
▪ Jika data dibatasi pada sejumlah file terpisah, maka akan lebih sukar untuk mendapatkan data
yang seharusnya tersedia.
▪ Duplikasi data
▪ Duplikasi akan menyebabkan pemborosan, Pemborosan waktu dan biaya untuk mencari data
karena harus dilakukan lebih dari sekali. Duplikasi juga dapat mendorong kearah hilangnya
integritas data; dengan kata lain tidak ada konsistensi data.
▪ Ketergantungan Program-Data
▪ Format file yang tidak sesuai
▪ Fixed Query pada program aplikasi
Hal tersebut dapat dihindari dengan pendekatan database Fasilitas pendekatan ini:
▪ Membagikan kumpulan data yang berhubungan yang di rancang untuk memenuhi kebutuhan
informasi dari suatu organisasi
▪ System Catalog(MetaData) untuk memberikan deskripsi data yang memungkinkan program data
independence
▪ Data secara logically terkait yang terdiri dari entitas, atribut, dan hubungan informasi organisasi
▪ Data Definition Language(DDL), permits untuk spesifikasi tipe data, struktur, dan
batasan(constraints)
▪ Data Manipulation Language(DML) untuk fasilitas general query (query language) dari data
▪ Menyediakan Akses Kontrol ke DataBase, seperti :
o Security System
o Integrity System
o Concurrency Control System
o Recovery Control
o User-Accessible Catalog
Keuntungan :
o Mengontrol duplikasi data
o Konsistensi data
o Penggunaan data secara bersama-sama
o data yang sama memiliki informasi yang banyak
o Pengembangan data yang sudah terintegritas
108
o Pengembangan keamanan data
o Standard yang lebih jelas
o Ekonomis
o Konflik kebutuhan dapat di seimbangkan
o Kemampuan akses dan respon yang lebih cepat
o Meningkatkan produktifitas
o Mempermudah maintenances
o Meningkatkan concurrency
o Meningkatkan kemampuan backup
23. Perkuliahan
Field Type Data Field Size
Hari VARCHAR 10
Tanggal DATE
Jam TIME
Sesi CHAR 1
Kehadiran Dosen
Field Type Data Field Size Keterangan
kodeKD VARCHAR 5 Primary Key
idDosen VARCHAR 5 Foreign Key
NamaDosen VARCHAR 30 NOT NULL
JamMasuk TIME 30 NOT NULL
JamPulang TIME 15 NOT NULL
StatusPerkuliahan VARCHAR NOT NULL
KetAbsensi VARCHAR NOT NULL
PokokBahasan VARCHAR NOT NULL
UraianMateri VARCHAR NOT NULL
Komentar VARCHAR
Kehadiran Mahasiswa
Field Type Data Field Size Ket
KodeKM VARCHAR 5 Primary Key
MhsHadir Integer NOT NULL
MhsSakit Integer NOT NULL
109
MhsIjin Integer NOT NULL
MhsTidakIjin Integer NOT NULL
24. 1NF
Cust fName lName Address City Country Order Date Product Product Price Qty
No No No
9876 John Doe Jl.Sigma JKT IDN 1801 03/1 A123 Pensil Rp1500 200
No.19 4/19
9876 John Doe Jl.Sigma JKT IDN 1801 03/1 B234 Penghapus Rp1000 100
No.19 4/19
9876 John Doe Jl.Sigma JKT IDN 1801 03/1 C345 BukuTulis Rp2000 300
No.19 4/19
2NF
Cust
fName lName Address City Country orderNo Date ProductNo Qty
No
Jl.Sigma
9876 John Doe JKT IDN 1801 03/14/19 A123 200
No.19
Jl.Sigma
9876 John Doe JKT IDN 1801 03/14/19 B234 100
No.19
Jl.Sigma
9876 John Doe No.19 JKT IDN 1801 03/14/19 C345 300
3NF
Costumer
CustNo fName lName Address City Country
9876 John Doe Jl.Sigma No19 JKT IDN
Order
OrderNo Date CustNo
1801 03/14/19 9876
Product
ProductNo Product Price
A123 Pensil Rp1.500
B234 Penghapus Rp1.000
C345 BukuTulis Rp2.000
110
Order Item
IdOrderItem OrderNo ProductNo Qty
1 1801 A123 200
2 1801 B234 100
3 1801 C345 300
25.
a. SELECT p.namaProduk, s.namaPerusahaan, o.Kuantitas, p.hargaPerUnit*o.kuantitas AS
totalharga
FROM Produk p, Supplier s, OrderItem o, Order c
WHERE p.idProduk=o.idProduk AND p.idSupplier=s.idSupplier AND o.idOrder=c.idOrder AND
c.idPelanggan='3';
b. UPDATE Supplier
SET telepon='1-504-930783' , fax='1-504-930784'
WHERE idSupplier='2';
111
UJIAN TENGAH SEMESTER GASAL TAHUN AKADEMIK 2019/2020
Mata Kuliah : Basis Data
Tingkat : II (dua)
Dosen : Tim Dosen Prodi D4 Statistika
Hari/Tanggal : Selasa / 27 Oktober 2020
Waktu : 120 menit
Sistem Ujian : Tutup buku dan hanya boleh memakai kalkulator
PILIHAN GANDA
Nomer 1-20, bobot masing-masing soal 2 poin
1. Di antara atribut berikut ini, atribut yang paling tepat digunakan sebagai primary key adalah…
a. Nama Lengkap
b. Tanggal lahir
c. Email
d. Alamat
2. Sebuah tabel disebut memenuhi bentuk 1st NF jika tabel tersebut tidak terdapat…
a. Determinan
b. Repeating grups
c. Nilai null pada primary key
d. Functional dependencies
3. Banyaknya atribut dari sebuah entitas atau relasi dalam basis data disebut…
a. Atribut
b. Degree
c. Tuple
d. Record
4. Berikut yang tidak termasuk komponen dari lingkungan Database Management System adalah…
a. Softwere
b. Hardwere
c. Relation
d. Peoplz
5. Sebuah program aplikasi yang berjalan dan berintegrasi dengan basis data pada suatu titik saat
dijalankan disebut…
a. Database
b. Database Management System (DBMS)
c. Database Application
d. Database Systems
6. Membuat sebuah program aplikasi yang mengakses database (untuk mengambil, menambah,
memperbaharui, tau menghapus data) merupakan peran dari…
a. Application Programmers
b. Database Administrator
c. Aplication Designers
112
d. Database Designer
8. Manakah dari pernyataan dibawah ini yang menjelaskan tentang primary key dengan tepat?
a. Primary key adalah field pertama dalam suatu record database
b. Primary key adalah data utama yang harus ada pada DBMS
c. Primary key adalah field yang menggunakan tipe data otomatis
d. Primary key digunakan untuk menentukan suatu nilai unik untuk mengidentifikasi record
Berdasarkan data di atas, jika terdapat sebuah hubungan antar atribut {A,B} - > {C} maka hubungan
antar atribut tersebut bersifat:
a. Full function dependency
b. Partial dependency
c. Transitive dependency
d. Tidak ada dependency
11. Bagaimana cara menambahkkan kolom Alamat dan TTL pada tabel PEGAWAI.?
a. ALTER TABLE PEGAWAI
ADD Alamat VARCHAR 100,
TTL Date;
b. ALTER TABLE PEGAWAI
ADD (Alamat VARCHAR 100),
(TTL Date);
c. ALTER TABLE PEGAWAI
113
ADD (Alamat VARCHAR 100,
TTL Date);
d. ALTER TABLE PEGAWAI
ADD (Alamat (VARCHAR 100),
TTL (Date);
12. Sintak mana yang tepat untuk meng-insert dua baris dibawah ini ke tabel PEGAWAI!
NoPeg NamaPeg Pekerjaan TanggalKontrak
13. Berikut adalah Aggregate function yang didukung oleh SQL, kecuali :
a. SUM b. VARIANCE c. COUNT d. MAX
15. Yang boleh muncul di select tanpa diikuti clausa group by kecuali :
a. Nama kolom saja
b. Fungsi agregat saja
c. Nama kolom dan fungsi agregat
d. Nama kolom dan konstanta
114
17. Berikut ini yang merupakan entitas yang bersifat konseptual adalah…
c. Produk b. Penjualan c. Pegawai d. Penyedia
19. Untuk mengubah record menjadi bernilai pada kolom section ID menjadi NULL.
a. Drop sectionID from Section
b. Delete SectionID from Section
c. Update Section SET sectionID =NULL
d. Update Section SET sectionID IS NULL
Smith 17 1 CS
Brown 8 2 CS
17 112 B
8 85 A
CS3380 CS3320
115
SOAL ESAI
21. Perhatikan tabel kunjungan pasien di bawah ini
No TglKunjungan NoPas UmurPas AlmtPas NoKlinik JenisKlinik Diagnosa
22. Berdasarkan tabel pada soal nomer 20, buat perintah SQL untuk mengubah course name yang di ajar
King pada section 85 menjadi “Discrete Mathematic”. (10 poin)
23. Sebutkan dan jelaskan kelebihan da kelemahan dari peenggunaan Database Management System! (10
poin)
24. Diberikan dua tabel sebagai berikut :
Nama Tabel: Location
116
BR Brazil 2
CA Canada 2
CH Switzerland 1
CN China 3
DE Germany 1
DK Denmark 1
EG Egypt 4
FR France 1
HK HongKong 3
IL Israel 4
IN India 3
IT Italy 1
JP Japan 3
KW Kuwait 4
MX Mexico 2
NG Nigeria 4
NL Netherlands 1
SG Singapore 3
UK United Kingd 1
US United State 2
ZM Zambia 4
ZW Zimbabwe 4
117
PEMBAHASAN SOAL UTS GENAP 2019/2020 BASDAT
PILIHAN GANDA
1. Tidak ada yang tepat
2. B
3. B
4. C
5. C
6. A
7. D
8. D
9. A
10. D
11. A
12. C
13. B
14. A
15. D
16. D
17. B
18. A
19. B
20. D
ESSAY
21.
a. Tabel kunjungan pasien
No TglKunjungan NoPas UmurPas AlamatPas NoKlinik JenisKlinik Diagnosa
Function Dependency
No → TglKunjungan, NoPas, NoKlinik, Diagnosa NoPas à UmurPas, AlamatPas
Noklinik → Jenisklinik
No, NoPas → Noklinik, Diagnosa
118
b. 1NF
No TglKunjungan NoPas UmurPas AlmtPas NoKlinik JenisKlinik Diagnosa
2NF
NoKlinik JenisKlinik
K1 Umum
K2 THT
K2 THT
K3 Obgyn
3NF
Pasien
NoPas UmurPas AlmtPas Diagnosa
P1 35 Jatinegara Radang
telimga
P2 17 Tebet Sinusitis
P3 27 Cawang Periksa
Kehamilan
Poliklinik
NoKlinik JenisKlinik
K1 Umum
K2 THT
K2 THT
K3 Obgyn
119
Kunjungan
No TglKunjungan NoKlinik
J001 2/1/2020 K1
J001 2/1/2020 K2
J002 10/1/2020 K2
J003 13/1/2020 K3
Diagnosa
IdDiagnosa Diagnosa
1 Gejala Flu
1 Radang telimga
2 Sinusitis
3 Periksa
Kehamilan
Rekam Medis
No TglKunjungan NoPas UmurPas AlmtPas NoKlinik JenisKlinik Diagnosa
120
▪ Peningkatan keamanan
▪ Pelaksanaan standar
▪ Meningkatkan aksesibilitas data dan responsive
▪ Meningkatkan produktivitas
▪ Meningkatkan maintenance melalui data independen
▪ Meningkatkan jasa backup dan recovery
Kekurangan DBMS :
▪ Kompleks
▪ Ukuran yang besar
▪ Biaya mahal (Biaya tambahan hardware dan biaya pengubahan)
▪ Performa (DBMS dikembangkan untuk aplikasi umum dibandingkan untuk filebased system)
▪ Dampak kegagalan lebih tinggi
24.
a) SELECT
c.country_id AS country_id, c.country_name AS country_name,
c.region_id AS region_id, COUNT(o.country_id) AS number_of_locations
FROM
Countries c
LEFT JOIN location o on c.country_id = o.country_id GROUP BY
c.country_id
b) SELECT
STATE_PROVINCE, COUNTRY_ID
FROM locations
WHERE state_province IS NULL;
121
UJIAN TENGAH SEMESTER GASAL TAHUN AKADEMIK 2020/2021
Mata Kuliah : Basis Data
Tingkat : II (dua)
Dosen : Tim Dosen Prodi D4 Statistika
Hari/Tanggal : Selasa / 23 Maret 2021
Waktu : 60 menit
Sistem Ujian : Tutup buku
1. Tuliskan perintah SQL untuk mendapatkan hasil daftar unit kerja serta jumlah karyawan pada tiap
unit kerja
3. Jika satu entity occurrence sebuah entity dapat direlasikan dengan banyak entity occurrence pada
entity lain, dan juga sebaliknya, maka relationship-nya adalah…
a. Many-to-many
b. One-to-many
122
c. One-to-one
d. Many-to-one
4. 4.
a. Seorang pasien dapat menjadwalkan minimal 1 appointment dan maksimal banyak appointment
b. Multiplicity pada relationship “Mempunyai” 0..1 terdiri dari cardinality adalah 0 dan participation
adalah 1
c. Participation constraint pada relationship antara Patient dan Appointment merupakan
mandatory participation
d. Ada pasien yang tidak memiliki medical history
6. Pada Integrity Constraint, apabila kita menghapus suatu data di tabel induk yang menjadi referensi
pada tabel anaknya, kemudian data pada tabel anak tersebut juga ikut terhapus, Integrity constraint
yang seperti ini disebut....
a. SET DEFAULT
b. CASCADE
c. SET NULL
d. NO ACTION
7. Bahasa SQL yang digunakan untuk mengambil dan mengupdate data disebut … dan perintah yang
termasuk adalah ...
a. Data Modification Language, CREATE, UPDATE, INSERT
b. Data Manipulation Language, SELECT, INSERT, DELETE
c. Data Modification Language, SELECT, INSERT, DELETE
d. Data Manipulation Language, UPDATE, INSERT, DROP
8. Diketahui suatu tabel: Perintah SQL untuk menampilkan informasi lengkap semua mahasiswa yang
berasal dari Jabar dan Jatim adalah...
123
a. SELECT * FROM Mahasiswa WHERE asal_daerah='Jabar', asal_daerah='Jatim';
b. SELECT * FROM Mahasiswa WHERE asal_daerah='Jabar' OR asal_daerah='Jatim';
c. SELECT * FROM Mahasiswa WHERE asal_daerah='Jabar' AND asal_daerah='Jatim';
d. SELECT * FROM Mahasiswa WHERE asal_daerah='Jabar' JOIN asal_daerah='Jatim';
9. Hasil query dari SELECT alamatKota FROM penduduk WHERE alamatKota LIKE ‘%ng’ adalah ..
a. Padangsidempuan, Padangsiantar
b. Bengkalis, Bengkulu
c. Tangerang, Bandung
d. Ngawi, Nganjuk
10. Misal P, Q, R dan S adalah atribut-atribut pada suatu tabel. Berdasarkan data yang ada pada gambar,
manakah yang disebut sebagai transitive dependency....
11.
12. Jika Database Administrator ingin mengubah sebuah atribut biasa menjadi atribut yang menjadi
FOREIGN KEY pada relasi pinjam maka syntax yang benar adalah…
a. ALTER TABLE pinjam ADD FOREIGN KEY REFERENCES anggota(noAnggota) ON
DELETE CASCADE;
b. ALTER TABLE pinjam ADD FOREIGN KEY (noAnggota) REFERENCES
anggota(noAnggota);
c. MODIFY TABLE pinjam ADD FOREIGN KEY REFERENCES anggota(noAnggota) ON
DELETE CASCADE;
124
d. ALTER TABLE pinjam ADD FOREIGN KEY (noAnggota) REFERENCES anggota ON
DELETE CASCADE;
13. Relasi (tabel) yang memenuhi bentuk normal yang pertama (1NF) adalah relasi yang TIDAK
terdapat unsur....
a. Partial Dependency
b. Functional Dependency
c. Determinan
d. Kelompok yang berulang
14. Operator yang digunakan dalam SQL untuk membandingkan nilai NULL adalah…
a. HAVING
b. IS
c. IN
d. = (EQUAL)
16. Saat mengisi biodata, mahasiswa boleh tidak mengisi data tentang berat badan, maka isian ini akan
disimpan ke dalam basis data dalam bentuk...
a. NULL
b. 0
c. spasi
d. "NULL"
17. Apa yang terjadi jika sintaks ini dieksekusi? DROP TABLE Ujian;
a. Tabel Ujian akan dimasukkan ke dalam kotak sampah
b. Tabel Ujian dan datanya akan dihapus
c. Data tabel Ujian akan dihapus, namun tabel Ujian masih tetap ada
d. Tabel Ujian akan dihapus, namun datanya masih tetap ada
18. Manakah dari hal-hal berikut ini yang tidak bisa diubah atau diperbarui dengan perintah UPDATE
a. Mengubah nilai semua baris pada suatu kolom
b. Mengubah baris NULL dengan suatu nilai
c. Mengubah nilai beberapa kolom
d. Mengubah tipe data suatu kolom
19. Pada perancangan basis data, bentuk normal yang ke berapa yang menjadi pertimbangan suatu
rancangan basis data dikatakan cukup...
a. 4NF
b. 3NF
c. 2NF
d. 5NF
125
20. Berikut adalah kelemahan dari sistem berbasis file, KECUALI:
a. berpeluang kehilangan integritas data antar program aplikasi
b. item data yang sama bisa mempunyai tipe data yang berbeda di antara program aplikasi
c. pengelolaan data independen antar program aplikasi
d. item data yang sama bisa mempunyai nilai data yang berbeda di antara program aplikasi
21. Diketahui suatu entity X dengan sampel data seperti pada tabel bawah ini. x1, x2, dan x3 merupakan
entity occurrence dari entity type X. Apakah jenis atribut dari Atribut2 dan Atribut3?
22. Diketahui sebuah tabel Film dengan atribut judulFilm dan durasi. Apa yang akan ditampilkan dari
pernyataan SQL di bawah ini?
23. Tuliskan perintah SQL untuk mendapatkan hasil daftar karyawan yang bekerja di unit Marketing:
a. SELECT id, nama, umur FROM DaftarUnit u, DaftarKaryawan k WHERE u.kode_unit = k.kode_unit
AND u.kode_unit = 'C01'
b. SELECT u.id, k.nama, k.umur FROM DaftarUnit u, DaftarKaryawan k WHERE u.kode_unit =
k.kode_unit AND u.kode_unit = 'C01'
c. SELECT id, nama, umur FROM DaftarUnit u, DaftarKaryawan k WHERE u.kode_unit = k.kode_unit
126
d. SELECT u.kode_unit, nama_unit, COUNT(*) FROM DaftarUnit u, DaftarKaryawan k WHERE
u.kode_unit = k.kode_unit GROUP BY u.kode_unit
24. Penulisan relation instance yang benar dari Tabel Pinjam sebagai berikut, kecuali...
25. Sebuah ER Diagram yang memuat entitas-entitas, relationship antar entitas tersebut, atribut-atribut
dalam setiap entitas, serta primary dan foreign key-nya adalah perancangan database pada tingkat
a. Schema
b. Logical
c. Physical
d. Conceptual
26. Dalam ER model dan relational model, manakah pernyataan berikut yang tidak benar?
a. Dalam satu baris data pada tabel relasional, satu atribut dapat memiliki lebih dari satu nilai
b. Dalam satu baris data pada tabel relasional, satu atribut dapat memiliki satu nilai atau nilai NULL
c. Sebuah atribut dari sebuah entity dapet merupakan gabungan (composite) beberapa atribut lain
d. Sebuah entity dapat memiliki lebih dari satu atribut
28. Pada saat melakukan query, apabila kita tidak melakukan pengurutan dengan klausa ORDER BY,
maka data akan ditampilkan secara...
a. diurutkan secara Ascending
b. sesuai urutan perintah query sebelumnya
c. Acak
d. diurutkan secara descending
127
29. Diketahui ERD sebagai berikut. Jika seorang pelanggan dapat mendaftar untuk langganan majalah
setiap tahunnya, Apakah peran atribut pelangganNo dan majalahNo pada entity Subscription?
30. Perintah SQL “ALTER TABLE” digunakan untuk tujuan dibawah ini kecuali..
a. Menghapus sebuah record dalam sebuah tabel
b. Menambah sebuah kolom dalam sebuah tabel
c. Menambah batasan dalam sebuah tabel
d. Menghapus sebuah kolom dalam sebuah tabel
31. Bahasa SQL yang digunakan untuk mendefinisikan struktur database disebut ... dan perintah yang
termasuk adalah ...,
a. Data Driven Language, CREATE, ALTER, DROP
b. Data Definition Language, CREATE, ALTER, DELETE
c. Data Manipulation Language, SELECT, INSERT, UPDATE
d. Data Definition Language, CREATE, DROP, ALTER
32. Diketahui pernyataan untuk membuat sebuah tabel database sebagai berikut. Manakah pernyataan
berikut yang benar?
a. Jika dilakukan update data pada tabelB, maka baris data pada tabelA yang bersesuaian juga akan
ikut berubah
b. Jika dilakukan penghapusan data pada tabelA, maka baris data pada tabelB yang bersesuaian
akan tetap atau tidak berubah
c. Jika dilakukan penghapusan data pada tabelA, maka baris data pada tabelB yang bersesuaian juga
akan ikut terhapus
d. Jika dilakukan update data pada tabelA, maka baris data pada tabelB yang bersesuaian juga akan
ikut berubah
128
33. Manakah urutan yang benar dari sebuah pernyataan SQL?
a. SELECT, GROUP BY, WHERE, ORDER BY, HAVING
b. SELECT, WHERE, GROUP BY, HAVING, ORDER BY
c. SELECT, HAVING, WHERE, GROUP BY, ORDER BY
d. SELECT, WHERE, HAVING, ORDER BY, GROUP BY
35. Perintah pada command line psql yang digunakan untuk melihat daftar tabel, pindah database, dan
melihat daftar database secara berturut-turut adalah..
a. \c, \dt namadatabase, \l
b. \dt, \c, \l namadatabase
c. \dt, \l, c namadatabase
d. \dt, \c namadatabase, \l
36. Perintah SQL yang digunakan untuk menghitung jumlah penduduk dari tabel penduduk menurut
kabupaten/kota adalah
a. SELECT idPenduduk, SUM (idPenduduk) FROM penduduk GROUP BY kabkota;
b. SELECT kabkot FROM Penduduk GROUP BY idPenduduk;
c. SELECT idPenduduk, COUNT (kabkot) FROM penduduk GROUP BY kabkot;
d. SELECT kabkot, COUNT (idPenduduk) FROM penduduk GROUP BY kabkota;
37. Tentukan atribut yang dapat menjadi candidate key dari tabel penduduk berikut serta berapa degree
dan kardinalitasnya secara berurutan..
a. tglLahir, 8, dan 5
b. NIK, 5, dan 8
c. noHP, 5, dan 8
d. NIK, 8, dan 5
38. Dari gambar berikut, atribut minimal yang dapat digunakan sebagai primary key adalah....
129
a. B
b. A
c. A,B
d. A, C
39. Suatu tabel memiliki atribut A1, A2, A3, A4, A5 diketahui memiliki functional dependencies A1 ->
A2, A3, A4, A5 dan A4 -> A5. Tabel ini dalam bentuk normal ke....
a. 1NF
b. 2NF
c. 4NF
d. 3NF
40. Perintah SQL Create View untuk melihat detil dokter yang berada pada RS cabang kota Semarang
adalah..
a. CREATE VIEW doktersemarang AS SELECT * FROM cabang where kotaRS
=’Semarang’;
b. CREATE VIEW doktersemarang AS SELECT * FROM dokter where kotaRS
=’Semarang’;
c. CREATE VIEW doktersemarang BY SELECT * FROM dokter where kotaRS
=’Semarang’;
d. CREATE VIEW AS doktersemarang SELECT * FROM dokter where kotaRS
=’Semarang’;
41. Pernyataan berikut yang TIDAK BENAR terkait dengan normalisasi data adalah
a. Dapat menghemat ruang penyimpan
b. Dilakukan dengan teknik bottom-up
c. Menghilangkan adanya anomali pada basis data
d. Proses query menjadi lebih mudah
42. Sebuah perusahaan mempunyai beberapa lokasi parkir yang dapat digunakan oleh pegawai-
pegawainya yang mempunyai mobil. Setiap lokasi parkir dibagi menjadi beberapa zona parkir
didalamnya. Setiap pegawai hanya dapat menggunakan satu zona untuk memarkir mobilnya. Semua
proses di atas akan dicatat dalam sebuah database.Multiplicity pada ERD di bawah ini yang paling
tepat untuk kebutuhan perusahaan di atas adalah
43. Dari gambar berikut, manakah yang menunjukkan full functional dependency
130
a. B -> C, A
b. B, C -> A
c. A, C -> B
d. A, B -> C dan B -> A
44. Manakah pernyataan SQL yang tepat untuk mengambil daftar mahasiswa dengan alamat KTP di
Tangerang dan Bogor tetapi domisilinya di Jakarta?
a. SELECT nama, ktp, domisili FROM mahasiswa WHERE ktp = ‘Tangerang’ OR
ktp = ‘Bogor’ OR domisili = ‘Jakarta’;
b. SELECT nama, ktp, domisili FROM mahasiswa WHERE ktp = ‘Tangerang’ AND
ktp = ‘Bogor’ AND domisili = ‘Jakarta’;
c. SELECT nama, ktp, domisili FROM mahasiswa WHERE ktp = ‘Tangerang’ AND
ktp = ‘Bogor’ OR domisili = ‘Jakarta’;
d. SELECT nama, ktp, domisili FROM mahasiswa WHERE ktp = ‘Tangerang’ OR
ktp = ‘Bogor’ AND domisili = ‘Jakarta’;
45. Jika diketahui relational database schema adalah sebagai berikut. Manakah SQL yang paling tepat
untuk mengubah data pegawai dimana semua pegawai di department Finance (deptName =
‘Finance’) dipindahkan ke department HRD?
46. Manakah pernyataan yang tidak benar tentang entity ERD di bawah ini?
a. Objek-objek yang memiliki atribut-atribut yang sama dikelompokan sebagai entity type
b. Strong dan weak entity type mempunyai primary keys untuk mengidentifikasi entity occurrence
secara unik
c. Strong entity type keberadaannya independent
d. Setiap weak entity harus direlasikan dengan entity lain
131
47.
48. Jika terdapat foreign key dalam sebuah relasi maka nilai foreign key harus cocok dengan nilai
candidate key dari beberapa tuple pada relasi asalnya disebut..
a. Referential Integrity
b. User Defined Integrity
c. Entity Integrity
d. Domain Integrity
132
HALO SEMUA! UNTUK PEMBAHASAN UTS BASIS DATA 2020/2021 BELUM BISA KAMI
TAMPILKAN KARENA BEBERAPA ALASAN. UNTUK BEBERAPA MATKUL YANG
TERCANTUMKAN PEMBAHASANNYA, DISARANKAN UNTUK TIDAK DIJADIKAN PATOKAN
KARENA PEMBAHASAN INI BELUM DIVALIDASI OLEH DOSEN YANG MENGAJAR. MESKIPUN
DEMIKIAN, SEMOGA SUDAH BISA MEMBANTU TEMAN-TEMAN BELAJAR, YA. SUKSES
SEMUANYA, SEMANGAT
133
PENDUGA RASIO (RATIO ESTIMATOR)
A. DEFINISI
Penduga Rasio (𝑅𝑎𝑡𝑖𝑜 𝐸𝑠𝑡𝑖𝑚𝑎𝑡𝑜𝑟) adalah suatu metode estimasi yang memanfaatkan
perbandingan/rasio antara variabel yang diteliti (𝑦) dengan variabel bantu/pendukung (𝑥)
dimana jumlah populasi (𝑋) harus diketahui untuk meningkatkan efisiensi pendugaan parameter
populasi.
135
2. Jika jumlah sampel (𝑛) besar, limiting distribution dari ratio estimate akan mengikuti
distribusi normal.
3. Jika jumlah sampel (𝑛) moderate, ratio estimate mempunyai kecenderungan mengikuti
positive skewness distribution.
4. Dalam penghitungan bias, terdapat rumus untuk berbagai ukuran sampel, tetapi perkiraan
varians hanya berlaku untuk jumlah sampel berukuran besar
5. Sebagai aturan praktis, Cochran menyatakan bahwa pendekatan large sample untuk
penghitungan varians dapat digunakan jika:
a. Ukuran sampel lebih dari 30
b. Koefisien variasi (CV) dari variabel 𝑥 dan variabel 𝑦, keduanya kurang dari 10%
E. ESTIMATOR
Jika penarikan sampel dilakukan secara simple random sampling, dan nilai karakteristik 𝑦 dan 𝑥
tersedia untuk setiap unit dalam sampel dengan nilai populasi 𝑋 diketahui, maka:
𝑦̅
Estimator rasio : 𝑅̂ = 𝑥̅
Estimator rata-rata : 𝑦̅𝑅 = 𝑅̂ 𝑋̅
Estimator total : 𝑌̂𝑅 = 𝑅̂ 𝑋
G. ESTIMASI VARIANS
Varians rata-rata :
𝑛
1−𝑓 2
𝑣(𝑦̅𝑅 ) = ∑(𝑦𝑖 − 𝑅̂ 𝑥𝑖 )
𝑛(𝑛 − 1)
𝑖=1
Rumus di atas dapat dijabarkan menjadi :
𝑛 𝑛 𝑛
1−𝑓
𝑣(𝑦̅𝑅 ) = [∑ 𝑦𝑖2 − 2𝑅̂ ∑ 𝑦𝑖 𝑥𝑖 + 𝑅̂ 2 ∑ 𝑥𝑖2 ]
𝑛(𝑛 − 1)
𝑖=1 𝑖=1 𝑖=1
136
1−𝑓 2
𝑣(𝑦̅𝑅 ) = (𝑠𝑦 − 2𝑅̂ 𝑠𝑦𝑥 + 𝑅̂ 2 𝑠𝑥2 )
𝑛
Keterangan :
1
𝑠𝑦𝑥 = ∑𝑛 (𝑦 − 𝑦̅)(𝑥𝑖 − 𝑥̅ ) → sample covariance
𝑛−1 𝑖=1 𝑖
Diketahui :
∑𝑁
𝑖 (𝑦𝑖 − 𝑦
̅)(𝑥𝑖 − 𝑥̅ ) 𝑠𝑦𝑥
𝜌= =
(𝑛 − 1)𝑠𝑦 𝑠𝑥 𝑠𝑦 𝑠𝑥
Maka :
1−𝑓 2
𝑣(𝑦̅𝑅 ) = (𝑠𝑦 − 2𝑅̂ 𝜌𝑠𝑥 𝑠𝑦 + 𝑅̂ 2 𝑠𝑥2 )
𝑛
Varians rasio :
𝑣(𝑦̅𝑅 )
𝑣(𝑅̂ ) =
𝑋̅ 2
1−𝑓 2
𝑣(𝑅̂ ) = (𝑠 − 2𝑅̂ 𝑠𝑦𝑥 + 𝑅̂ 2 𝑠𝑥2 )
𝑛𝑋̅ 2 𝑦
Varians total :
𝑣(𝑌̂𝑅 ) = 𝑁 2 𝑣(𝑦̅𝑅 )
𝑁 2 (1 − 𝑓) 2
𝑣(𝑌̂𝑅 ) = (𝑠𝑦 − 2𝑅̂𝑠𝑦𝑥 + 𝑅̂ 2 𝑠𝑥2 )
𝑛
H. SELANG KEPERCAYAAN
Untuk ukuran sampel 𝑛 besar, dugaan bagi rata-rata atau total dapat diasumsikan memiliki
sebaran normal. Dengan demikian selang kepercayaan untuk penduga-penduga tersebut adalah
sebagai berikut:
Selang kepercayaan (1 − 𝛼)% bagi rasio 𝑅 adalah :
𝑃{𝑅̂ − 𝑍𝛼⁄2 𝑆𝑒(𝑅̂ ) ≤ 𝑅 ≤ 𝑅̂ + 𝑍𝛼⁄2 𝑆𝑒(𝑅̂ )} = 1 − 𝛼
Selang kepercayaan (1 − 𝛼)% bagi rata-rata 𝑌̅̂ adalah : 𝑅
𝑃 {𝑌̅̂𝑅 − 𝑍𝛼⁄2 𝑆𝑒(𝑌̅̂𝑅 ) ≤ 𝑌̅𝑅 ≤ 𝑌̅̂𝑅 + 𝑍𝛼⁄2 𝑆𝑒(𝑌̅̂𝑅 )} = 1 − 𝛼
Selang kepercayaan (1 − 𝛼)% bagi total ratio 𝑌̂𝑅 adalah :
𝑃{𝑌̂𝑅 − 𝑍𝛼⁄2 𝑆𝑒(𝑌̂𝑅 ) ≤ 𝑌𝑅 ≤ 𝑌̂𝑅 + 𝑍𝛼⁄2 𝑆𝑒(𝑌̂𝑅 )} = 1 − 𝛼
137
𝑠𝑦2 − 2𝑅̂ 𝜌𝑠𝑦 𝑠𝑥 + 𝑅̂ 2 𝑠𝑥2
<1
𝑠𝑦2
𝑠𝑦2 − 2𝑅̂ 𝜌𝑠𝑦 𝑠𝑥 + 𝑅̂ 2 𝑠𝑥2 < 𝑠𝑦2
−2𝑅̂𝜌𝑠𝑦 𝑠𝑥 + 𝑅̂ 2 𝑠𝑥2 < 0
138
𝐿
𝑁ℎ 2 (1 − 𝑓ℎ ) 2 2 2
𝑣(𝑌̂𝑅𝑠 ) = ∑ (𝑠𝑦ℎ − 2𝑅̂ℎ 𝜌ℎ 𝑠𝑦ℎ 𝑠𝑥ℎ + 𝑅̂ℎ 𝑠𝑥ℎ )
𝑛ℎ
ℎ=1
Formula di atas akan valid jika jumlah sampel di setiap strata cukup besar sehingga penduga 𝑌̂𝑅𝑠
adalah bias (tapi bias dapat diabaikan) dan approksimasi rumus varians bisa diterapkan untuk
masing-masing strata. Di samping itu, jika jumlah sampel tiap strata kecil dan jumlah strata besar,
biasnya akan besar (tidak dapat diabaikan).
Estimasi total :
𝐿
𝑌̂𝑠𝑡
𝑌̂𝑠𝑡 = ∑ 𝑁ℎ 𝑦̅ℎ −→ 𝑦̅𝑠𝑡 =
𝑁
ℎ=1
𝐿
𝑋̂𝑠𝑡
𝑌̂𝑠𝑡 = ∑ 𝑁ℎ 𝑥̅ℎ −→ 𝑥̅𝑠𝑡 =
𝑁
ℎ=1
𝑌̂𝑠𝑡 𝑦̅𝑠𝑡
𝑌̂𝑅𝑐 = 𝑅̂𝑐 𝑋 = ∙𝑋 = .𝑋
𝑋̂𝑠𝑡 𝑥̅𝑠𝑡
𝐿
𝑁ℎ 2 (1 − 𝑓ℎ ) 2 2 2
𝑣(𝑌̂𝑅𝑐 ) = ∑ (𝑠𝑦ℎ − 2𝑅̂𝑐 𝜌ℎ 𝑠𝑦ℎ 𝑠𝑥ℎ + 𝑅̂𝑐 𝑠𝑥ℎ )
𝑛ℎ
ℎ=1
Estimator 𝑌̂𝑅𝑐 tidak memerlukan informasi mengenai 𝑋ℎ , hanya membutuhkan informasi 𝑋. Bias
dari combined ratio estimator pada umumnya lebih kecil daripada separate ratio estimator. Jika
jumlah sampel di setiap strata kecil, combined estimator lebih direkomendasikan untuk
digunakan.
139
M. KESIMPULAN
• Jika sampel setiap strata kecil, gunakan combined ratio estimator, kecuali ada perbedaan
yang besar antara rasio tiap strata.
• Jika ukuran sampel setiap strata besar, lebih baik gunakan separate ratio estimator,
kecuali sulit melakukan penghitungannya. Jika ini terjadi, pastikan keuntungannya
sebelum menggunakan.
• Jika 𝑋ℎ diketahui independen dari strata ke strata, gunakan separate ratio estimator.
Ketika 𝑋ℎ = 𝑁ℎ , estimator menjadi sama dengan estimator strata dan tidak masalah
dengan bias dari estimasinya.
• Jika sampling unitnya adalah elementary units dan denominator dari rasio adalah jumlah
dari elementary units dalam sampel, kedua estimatornya adalah unbiased.
• Dalam kasus ini, estimator yang dipilih harus mempertimbangkan varians dan
keuntungan yang diperoleh.
A. DEFINISI
Penduga Beda dan Penduga Regresi adalah suatu metode estimasi dengan mengambil manfaat
hubungan yang kuat antara variabel pendukung 𝑥𝑖 dengan variabel yang diteliti 𝑦𝑖 (Jumlah
populasi 𝑋 dari 𝑥𝑖 harus diketahui) dimana hubungannya mendekati linier namun garisnya tidak
melalui titik origin. Seperti halnya ratio estimator, linear regression estimator menggunakan
auxiliary information untuk meningkatkan presisi.
B. GENERALIZED ESTIMATOR
𝑦̅𝐺 = 𝑦̅ + 𝑐(𝑋̅ − 𝑥̅ )
Dengan c merupakan sesuatu yang belum ditetapkan (konstan atau variabel)
Keterangan :
1. Jika 𝑐 = 0 maka 𝑦̅𝐺 = 𝑦̅ → (rata-rata sederhana)
2. Jika 𝑐 = 𝑘 (𝑘 adalah konstanta, tidak tergantung pada sampel), maka 𝑦̅𝐷 = 𝑦̅ + 𝑘(𝑋̅ − 𝑥̅ ) →
(difference estimator/penduga beda)
3. Jika 𝑐 = 𝛽 (𝛽 adalah konstanta, koefisien regresi populasi), maka 𝑦̅𝑙𝑟 = 𝑦̅ + 𝛽(𝑋̅ − 𝑥̅ ) →
(regression estimator/penduga regresi)
4. Jika 𝑐 = 𝑏 (𝑏 adalah random variable, estimator untuk 𝛽), maka 𝑦̅𝑙𝑟 = 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅ ) →
(regression estimator/penduga regresi)
𝑦̅
5. Jika 𝑐 = 𝑟 (𝑟 = ⁄𝑥̅ ), maka 𝑦̅𝐺 = 𝑦̅ + 𝑟(𝑋̅ − 𝑥̅ ) = 𝑟𝑋̅ → (ratio estimator/penduga rasio)
Estimasi varians sampling untuk 𝑦̅𝑐 :
𝑣(𝑦̅𝑐 ) = 𝑣(𝑦̅) − 2𝑐 𝑐𝑜𝑣(𝑦̅, 𝑥̅ ) + 𝑐 2 𝑣(𝑥̅ )
Jika penarikan sampel secara SRS WOR
1−𝑓 2
𝑣(𝑦̅) = 𝑠
𝑛 𝑦
140
1−𝑓 2
𝑣(𝑥̅ ) = 𝑠
𝑛 𝑥
1−𝑓
𝑐𝑜𝑣(𝑦̅, 𝑥̅ ) = 𝑠
𝑛 𝑦𝑥
Jika penarikan sampel secara PPS
𝑛
1 𝑦𝑖 2
𝑣(𝑦̅) = 2 ∑ ( − 𝑁𝑦̅)
𝑁 𝑛(𝑛 − 1) 𝑝𝑖
𝑖=1
𝑛
1 𝑥𝑖 2
𝑣(𝑥̅ ) = ∑ ( − 𝑁𝑥̅ )
𝑁 2 𝑛(𝑛 − 1) 𝑝𝑖
𝑖=1
𝑛
1 𝑦𝑖 𝑥𝑖
𝑐𝑜𝑣(𝑦̅, 𝑥̅ ) = ∑( − 𝑁𝑦̅) ( − 𝑁𝑥̅ )
𝑁 2 𝑛(𝑛 − 1) 𝑝𝑖 𝑝𝑖
𝑖=1
C. DIFFERENCE ESTIMATOR
Misalkan 𝑦 dan 𝑥 merupakan karakteristik yang berkorelasi.
Dari satu gugus sampel yang berukuran 𝑛 dan ditarik secara simple random sampling, maka akan
diperoleh unbiased estimator 𝑦̅ dan 𝑥̅ untuk 𝑌̅ dan 𝑋̅.
Difference estimator didefinisikan sebagai
𝑦̅𝐷 = 𝑦̅ + 𝑘(𝑋̅ − 𝑥̅ )
𝑘 adalah konstanta yang telah ditentukan dan diketahui.
Variance bagi 𝑦̅𝐷 adalah
𝑉(𝑦̅𝐷 ) = 𝑉(𝑦̅) − 2𝑘 𝑐𝑜𝑣(𝑥̅ , 𝑦̅) + 𝑘 2 𝑉(𝑥̅ )
Dalam SRS WOR, varians sampling penduga beda adalah
𝑉(𝑥̅ ) 𝑐𝑜𝑣(𝑦̅, 𝑥̅ )
𝑉(𝑦̅𝐷 ) = 𝑉(𝑦̅) + 𝑘 2 𝑉(𝑥̅ ) − 2𝑘 𝑐𝑜𝑣(𝑦̅, 𝑥̅ ) = 𝑉(𝑦̅) (1 + 𝑘 2 − 2𝑘 )
𝑉(𝑦̅) 𝑉(𝑦̅)
𝑆𝑥 𝑆𝑦
= 𝑉(𝑦̅) (1 + 𝛼 2 − 2𝑘𝜌 ) = 𝑉(𝑦̅)(1 + 𝛼 2 − 2𝛼𝜌)
𝑆𝑦 2
Dimana 𝜌 adalah koefisien korelasi antara 𝑥 dan 𝑦 dan 𝛼 = 𝑘 𝑆𝑥 ⁄𝑆𝑦
Corollary :
𝑌
Untuk kasus 𝑐 = 𝑅 = ( ), varians dari penduga beda dengan penduga rasio aproksimasi order
𝑋
pertama akan tepat sama.
Penduga beda 𝑦̅𝐷 akan lebih tepat dari penduga mean per unit 𝑦̅ jika 𝑐 < 2𝜌 𝑆𝑦 ⁄𝑆𝑥
Bila 𝜌 = 𝛼 ⁄2, maka 𝑉(𝑦̅𝐷 ) = 𝑉(𝑦̅)
Dalam SRS WOR, penduga tak bias dari 𝑉(𝑦̅𝐷 ):
(1 − 𝑓) 2
𝑣(𝑦̅𝐷 ) = (𝑠𝑦 + 𝑘 2 𝑠𝑥2 − 2𝑘𝑠𝑦𝑥 )
𝑛
𝑠𝑦
Difference estimator akan lebih baik (precise) dibandingkan penduga SRS, bila 𝑘 < 2𝜌
𝑠𝑥
141
Penduga Regresi (Regression Estimator)
Dari rumus difference estimator 𝑦̅𝐷 = 𝑦̅ + 𝑘(𝑋̅ − 𝑥̅ ), nilai 𝑘 yang meminimumkan varians bisa
diperoleh dengan mendiferensiasikan 𝑉(𝑦̅𝐷 ) terhadap 𝑘 dan menyamakannya dengan nol
sehingga diperoleh :
𝐶𝑜𝑣(𝑥̅ , 𝑦̅)
𝑘=𝛽=
𝑉(𝑥̅ )
Jelaslah, bahwa 𝑘 = 𝛽 adalah koefisien regresi linier sederhana 𝑌 dalam 𝑋, dengan demikian
estimator dengan nilai optimum dari 𝑘 = 𝛽 adalah
𝑦̅𝑙𝑟 = 𝑦̅ + 𝛽(𝑋̅ − 𝑥̅ )
𝑦̅𝑙𝑟 ∶ 𝑙𝑖𝑛𝑒𝑎𝑟 𝑟𝑒𝑔𝑟𝑒𝑠𝑠𝑖𝑜𝑛 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑜𝑟 untuk penduga rata-rata
Pada umumnya koefisien regresi 𝛽 tidak diketahui sehingga harus diestimasi dari sampel.
Misalkan 𝑦𝑖 dan 𝑥𝑖 (𝑖 = 1,2,3, … , 𝑛) diperoleh dari setiap unit sampel yang ditarik secara SRS, nilai
𝛽 diestimasi dengan metode kuadrat terkecil (Least Square Method), yaitu
𝑠𝑦𝑥 ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝑏= 2 =
𝑠𝑥 ∑(𝑥𝑖 − 𝑥̅ )2
1−𝑓 2
𝑣(𝑦̅) = 𝑠
𝑛 𝑦
1−𝑓 2
𝑣(𝑥̅ ) = 𝑠
𝑛 𝑥
(1 − 𝑓)
𝑐𝑜𝑣(𝑥̅ , 𝑦̅) = 𝑠𝑦𝑥
𝑛
𝑠𝑦𝑥
𝑏= 2
𝑠𝑥
𝑆𝑦𝑥 = 𝜌𝑠𝑦 𝑠𝑥
1−𝑓 2 2
𝑣(𝑦̅𝑙𝑟 ) = (𝑠𝑦 − 2𝑏𝜌𝑠𝑦 𝑠𝑥 + 𝑏 𝑠2𝑥 )
𝑛
Dengan substitusi formula di atas pada rumus 𝑣(𝑦̅𝑙𝑟 ) diperoleh bentuk lain dari rumus unbiased
sampling variance yang lebih sederhana yaitu :
1−𝑓 2
𝑣(𝑦̅𝑙𝑟 ) = 𝑠 (1 − 𝜌2 )
𝑛 𝑦
Beberapa hal yang bisa disimpulkan dari rumus varians tersebut :
• Bila regresi linier, dan 𝑏 adalah Least Square Estimate bagi 𝛽, maka 𝑦̅𝑙𝑟 presisinya lebih
tinggi daripada 𝑦̅𝐷 .
• Bila regresi 𝑦 dalam 𝑥 linier sempurna sehingga |𝜌| ≈ 1 , maka 𝑣(𝑦̅𝑙𝑟 ) ≈ 0.
• Bila 𝑦 dan 𝑥 tak berkorelasi 𝜌 = 0 , maka 𝑦̅𝑙𝑟 = 𝑦̅ (penduga regresi sama dengan penduga
SRS).
142
Estimasi total dengan menggunakan penduga regresi dirumuskan:
𝑌̂𝑙𝑟 = 𝑁𝑦̅𝑙𝑟 = 𝑁[𝑦̅ + 𝑏(𝑋̅ − 𝑥̅ )] = 𝑌̂ + 𝑏(𝑋 − 𝑋̂)
Sampling varians untuk estimasi total :
(1 − 𝑓) 2
𝑣(𝑌̂𝑙𝑟 ) = 𝑁 2 𝑣(𝑦̅𝑙𝑟 ) = 𝑁 2 𝑠𝑦 (1 − 𝜌2 )
𝑛
Nilai (1 − 𝜌2 ) akan selalu lebih kecil atau sama dengan 1, sehingga penduga SRS akan sama efisien
dengan penduga regresi hanya jika 𝜌 = 0.
Perbandingan Penduga Regresi dengan Penduga Ratio
Secara umum, regression estimator akan lebih efisien dari pada ratio estimator.
Regression estimator akan mempunyai efisiensi yang sama dengan ratio estimator hanya jika 𝑏 =
𝐶
𝑅̂ atau 𝜌 = 𝐶𝑥
𝑦
Catatan :
Penduga regresi tidak selalu merupakan sebuah pilihan yang tepat meskipun memberikan
varians yang sama dengan atau kurang dari varians yang lain (varians rasio). Yang perlu
diperhatikan adalah :
1. Jika informasi sebelumnya pada sebuah nilai yang tepat dari (𝛽 = 𝑐) tersedia, dengan
penghitungan sederhana hasil yang bagus dapat diperoleh dengan nilai 𝑐 seperti itu dengan
penduga beda.
2. Jika 𝜌 ≅ 𝜎𝑥 ⁄𝜎𝑦 , penduga beda dengan 𝑐 = 1 akan memberikan hasil ketepatan yang sama
seperti penduga regresi.
3. Jika 𝜌 ≅ 𝐶𝑥 ⁄𝐶𝑦 , penduga rasio akan memberikan hasil ketepatan yang sama seperti penduga
regresi.
143
4. Jika 𝜌 berbeda dari 𝜎𝑥 ⁄𝜎𝑦 , penduga regresi seharusnya lebih disukai. Dalam situasi ini,
penduga beda dengan 𝑐 = 1 akan memberikan hasil yang tepat.
5. Jika 𝜌 berbeda dari 𝐶𝑥 ⁄𝐶𝑦 , penduga rasio seharusnya lebih disukai. Dalam situasi ini, varians
penduga rasio akan lebih besar dari pada penduga regresi.
6. Jika penghitungan penduga regresi adalah berat, membutuhkan waktu dan mahal,
penggunaannya disarankan hanya jika keuntungan dari penghitungan seperti ini adalah jauh
lebih signifikan dari pada biaya tambahan.
𝑦̅𝑙𝑟𝑠 = ∑ 𝑊ℎ 𝑦̅𝑙𝑟ℎ
ℎ=1
𝐿 𝐿 𝐿
𝑁ℎ 1 1 𝑌̂𝑙𝑟𝑠
𝑦̅𝑙𝑟𝑠 =∑ 𝑦̅𝑙𝑟ℎ = [∑ 𝑌̂ℎ + 𝑏ℎ (𝑋ℎ − 𝑋̂ℎ )] = ∑ 𝑌̂𝑙𝑟ℎ =
𝑁 𝑁 𝑁 𝑁
ℎ=1 ℎ=1 ℎ=1
Varians :
𝐿 𝐿
2 𝑊ℎ 2 (1 − 𝑓ℎ ) 2
𝑣(𝑦̅𝑙𝑟𝑠 ) = ∑ 𝑊ℎ 𝑣(𝑦̅𝑙𝑟ℎ ) = ∑ (𝑠𝑦ℎ − 2𝑏ℎ 𝑠𝑦𝑥ℎ + 𝑏ℎ2 𝑠𝑥ℎ
2
)
𝑛ℎ
ℎ=1 ℎ=1
𝐿 2
𝑊ℎ (1 − 𝑓ℎ ) 2
=∑ 𝑠𝑦ℎ (1 − 𝜌ℎ 2 )
𝑛ℎ
ℎ=1
Estimasi total karakteristik populasi dirumuskan :
𝐿
144
Varians :
𝐿 𝐿 𝐿
𝑁ℎ 2 (1 − 𝑓ℎ ) 2
𝑣(𝑌̂𝑙𝑟𝑠 ) = 𝑁 2 𝑣(𝑦̅𝑙𝑟𝑠 ) = ∑ 𝑣(𝑌̂𝑙𝑟𝑠 ) = ∑ 𝑁ℎ 2 𝑣(𝑦̅𝑙𝑟ℎ ) = ∑ (𝑠𝑦ℎ − 2𝑏ℎ 𝑠𝑦𝑥ℎ + 𝑏ℎ2 𝑠𝑥ℎ
2
)
𝑛ℎ
ℎ=1 ℎ=1 ℎ=1
𝐿 2
𝑁ℎ (1 − 𝑓ℎ ) 2
= ∑ 𝑠𝑦ℎ (1 − 𝜌ℎ 2 )
𝑛ℎ
ℎ=1
𝑦̅𝑠𝑡 = ∑ 𝑊ℎ 𝑦̅ℎ
ℎ=1
𝐿
𝑥̅𝑠𝑡 = ∑ 𝑊ℎ 𝑥̅ℎ
ℎ=1
Sampling variance dan sampling covariance :
𝐿
(1 − 𝑓ℎ ) 2
𝑣(𝑦̅𝑠𝑡 ) = ∑ 𝑊ℎ 2 𝑠𝑦ℎ
𝑛ℎ
ℎ=1
𝐿
(1 − 𝑓ℎ ) 2
𝑣(𝑥̅𝑠𝑡 ) = ∑ 𝑊ℎ 2 𝑠𝑥ℎ
𝑛ℎ
ℎ=1
𝐿
(1 − 𝑓ℎ )
𝑐𝑜𝑣(𝑦̅𝑠𝑡 , 𝑥̅𝑠𝑡 ) = ∑ 𝑊ℎ 2 𝑠𝑦𝑥ℎ
𝑛ℎ
ℎ=1
Estimasi Combined Regression Coefficient :
𝑐𝑜𝑣(𝑦̅𝑠𝑡 , 𝑥̅𝑠𝑡 )
𝑏𝑐 =
𝑣(𝑥̅𝑠𝑡 )
Catatan :
• Tidak ada aturan yang pasti apakah separate atau combined yang lebih baik (lebih
akurat) untuk digunakan pada kondisi tertentu.
• Konsekuensi dari separate regression estimator adalah biasnya akan besar jika jumlah
sampel dalam tiap strata kecil.
145
• Konsekuensi dari combined regression estimator adalah variansnya akan besar jika
koefisien regresi populasi tiap strata (𝛽ℎ ) berbeda antar strata.
• Jika garis regresi adalah linear dan 𝛽ℎ diperkirakan sama untuk semua strata, combined
regression estimator lebih direkomendasikan.
• Jika garis regresi adalah linear (sehingga nilai bias diperkirakan kecil) dan 𝛽ℎ berbeda
antar strata, separate regression estimator lebih baik untuk digunakan.
• Jika garis regresi cenderung curvilinear (agak melengkung) lebih baik menggunakan
combined regression estimator, kecuali jika jumlah sampel di setiap strata besar.
Product Estimator
CONTOH SOAL
1. Manajer suatu perusahaan tertarik memperkirakan total penjualan dalam ribuan untuk 300
cabangnya. Dari catatan tahun lalu, total penjualan dalam ribuan untuk semua 300 cabang
adalah 21300. Pemeriksaan catatan tahun ini diperoleh dengan cermat untuk SRS dari 15
cabang dengan hasil sebagai berikut:
Jawaban:
a. Ratio estimator
𝑁 = 300 𝑋 = 21300 (𝑑𝑎𝑙𝑎𝑚 𝑟𝑖𝑏𝑢𝑎𝑛) 𝑛 = 15
𝑥̅ = 61,7333 𝑦̅ = 78,3333
146
𝑠𝑥 2 = 4302,4952 𝑠𝑦 2 = 9983,8095
𝑠𝑥 = 65,5934 𝑠𝑦 = 99,9190
𝑋̅ = 71
𝜌 = 0,9069
𝑦̅ 78,3333
𝑅̂ = = = 1,2689
𝑥̅ 61,7333
Estimasi rata-rata :
𝑦̅𝑅 = 𝑅̂ × 𝑋̅ = 1,2689 × 71 = 90,0918
(1 − 𝑓)
𝑣(𝑦̅𝑅 ) = (𝑠𝑦 2 − 2𝑅̂ 𝜌𝑠𝑥 𝑠𝑦 + 𝑅̂ 2 𝑠𝑥 2 )
𝑛
(300 − 15)
= (9983,8095 − 2(1,2689)(0,9069)(65,5934)(99,9190)
300 × 15
+ (1,2689)2 (4302,4952)) = 115,6812
𝑠𝑒(𝑦̅𝑅 ) = √𝑣(𝑦̅𝑅 ) = √115,6812 = 10,7555
𝐿𝐶𝐿 = 𝑦̅𝑅 − 1,96(𝑠𝑒(𝑦̅𝑅 )) = 90,0918 − 1,96(10,7555) = 69,0110
𝑈𝐶𝐿 = 𝑦̅𝑅 + 1,96(𝑠𝑒(𝑦̅𝑅 )) = 90,0918 + 1,96(10,7555) = 111,1726
𝑠𝑒(𝑦̅𝑅 ) 10,7555
𝑟𝑠𝑒(𝑦̅𝑅 ) = × 100% = × 100% = 11,94%
𝑦̅𝑅 90,0918
Estimasi rata-rata penjualan dalam ribuan untuk 300 cabang adalah sebesar 90,0918 dengan
standar error sebesar 10,7555. Estimasi rata-rata penjualan dalam ribuan untuk 300 cabang
berkisar antara 69,0110 sampai 111,1726 dengan relative standar error sebesar 11,94%.
Estimasi total :
𝑌̂𝑅 = 𝑁𝑦̅𝑅 = 300 × 90,0918 = 27027,5378
𝑣(𝑌̂𝑅 ) = 𝑁 2 𝑣(𝑦̅𝑅 ) = 3002 × 115,6812 = 10411312,02
Estimasi total penjualan dalam ribuan untuk 300 cabang adalah sebesar 27027,5378 dengan
standar error sebesar 3226,6565. Estimasi total penjualan dalam ribuan untuk 300 cabang
berkisar antara 20703,2911 sampai 33351,7845 dengan relative standar error sebesar
11,94%.
b. Regression estimator
𝑁 = 300 𝑋 = 21300 (𝑑𝑎𝑙𝑎𝑚 𝑟𝑖𝑏𝑢𝑎𝑛) 𝑛 = 15
𝑥̅ = 61,7333 𝑦̅ = 78,3333
𝑠𝑥 2 = 4302,4952 𝑠𝑦 2 = 9983,8095
𝑠𝑥 = 65,5934 𝑠𝑦 = 99,9190
𝑋̅ = 71
147
𝜌 = 0,9069
𝑏 = 1,3815
Estimasi rata-rata :
𝑦̅𝐿𝑅 = 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅ ) = 78,3333 + 1,3815(71 − 61,7333) = 91,1355
(1 − 𝑓)
𝑣(𝑦̅𝐿𝑅 ) = (𝑠𝑦 2 − 2𝑏𝜌𝑠𝑥 𝑠𝑦 + 𝑏 2 𝑠𝑥 2 )
𝑛
(300 − 15)
= (9983,8095 − 2(1,3815)(0,9069)(65,5934)(99,9190)
300 × 15
+ (1,3815)2 (4302,4952)) = 112,2245
𝑠𝑒(𝑦̅𝐿𝑅 ) = √𝑣(𝑦̅𝐿𝑅 ) = √112,2245 = 10,5936
𝐿𝐶𝐿 = 𝑦̅𝐿𝑅 − 1,96(𝑠𝑒(𝑦̅𝐿𝑅 )) = 91,1355 − 1,96(10,5936) = 70,3720
𝑈𝐶𝐿 = 𝑦̅𝐿𝑅 + 1,96(𝑠𝑒(𝑦̅𝐿𝑅 )) = 91,1355 + 1,96(10,5936) = 111,899
𝑠𝑒(𝑦̅𝐿𝑅 ) 10,5936
𝑟𝑠𝑒(𝑦̅𝐿𝑅 ) = × 100% = × 100% = 11,62%
𝑦̅𝐿𝑅 91,1355
Estimasi rata-rata penjualan dalam ribuan untuk 300 cabang adalah sebesar 91,1355 dengan
standar error sebesar 10,5936. Estimasi rata-rata penjualan dalam ribuan untuk 300 cabang
berkisar antara 70,3720 sampai 111,899 dengan relative standar error sebesar 11,62%.
Estimasi total :
𝑌̂𝐿𝑅 = 𝑁𝑦̅𝐿𝑅 = 300 × 91,1355 = 27340,6518
𝑣(𝑌̂𝐿𝑅 ) = 𝑁 2 𝑣(𝑦̅𝐿𝑅 ) = 3002 × 112,2245 = 10100204,36
Estimasi total penjualan dalam ribuan untuk 300 cabang adalah sebesar 27340,6518 dengan
standar error sebesar 3178,0819. Estimasi total penjualan dalam ribuan untuk 300 cabang
berkisar antara 21111,6114 sampai 33569,6923 dengan relative standar error sebesar
11,62%.
2. Data berikut dikumpulkan dalam sebuah pilot survei untuk memperkirakan perluasan dari
penanaman dan produksi buah segar di 3 wilayah di suatu daerah:
148
8,66; 6,61; 7,35; 9,87; 6,42; 565,1; 436,2; 490,6; 648,1;
B 1.196 9.115 8
8,60; 9,70; 6,75 450,5; 560,7; 635,5; 446,0
11,60; 15,29; 17,94; 14,29; 810,4; 927; 1374; 995,8;
C 1.020 15.270 11 18,00; 13,20; 11,50; 14,70; 1499; 750; 861,3; 847;
12,01; 17,96; 23,15 879,7; 1420,5; 2115
Metode yang digunakan adalah Separate Rasio Estimator karena nilai auxiliary variable dan
variabel yang diteliti melewati titik origin (jika x=0 maka y=0) dimana ketika luas lahan bernilai
nol maka jumlah pohon juga bernilai nol dan karena nilai 𝑅̂ setiap strata cukup berbeda maka
digunakan separate ratio estimator.
Strata 𝑁ℎ 𝑋ℎ 𝑛ℎ 𝑥ℎ𝑖 𝑦ℎ𝑖 𝑥̅ℎ 𝑦̅ℎ 𝑠𝑥ℎ 2 𝑠𝑦ℎ 2
4,63 290,6
2,9 179,5
1,45 92,3
A 985 3253 6 3,48 219,15 1,7326 6545,795
3,38 212,4
5,17 318,7
3,35 221,4
8,66 565,1
6,61 436,2
7,35 490,6
9,87 648,1
B 1196 9115 8 7,995 529,0875 1,9422 7281,8212
6,42 450,5
8,6 560,7
9,7 635,5
6,75 446
11,6 810,4
15,29 927
17,94 1374
C 1020 15270 11 14,29 995,8 15,4218 1134,52 12,75 177078,93
18 1499
13,2 750
11,5 861,3
149
14,7 847
12,01 879,7
17,96 1420,5
23,15 2115
Estimasi total jumlah pohon di 3 wilayah tersebut adalah sebesar 1931410,503 pohon dengan
standard error sebesar 58369,5313 pohon. Estimasi total jumlah pohon di 3 wilayah tersebut
berkisar antara 1817006,221 pohon sampai 2045814,784 pohon dengan relative standard error
sebesar 3,02%.
𝑌̂𝑅𝑆 1931410,503
𝑦̅𝑅𝑆 = = = 603,3772
𝑁 3201
𝑣(𝑌̂𝑅𝑆 ) 3407002180
𝑣(𝑦̅𝑅𝑆 ) = = = 332,5072
𝑁2 32012
𝑠𝑒(𝑦̅𝑅𝑆 ) = √𝑣(𝑦̅𝑅𝑆 ) = √332,5072 = 18,2348
Estimasi rata-rata jumlah pohon di 3 wilayah tersebut adalah sebesar 603,3772 pohon dengan
standard error sebesar 18,2348 pohon. Estimasi rata-rata jumlah pohon di 3 wilayah tersebut
150
berkisar antara 567,6371 pohon sampai 639,1174 pohon dengan relative standard error sebesar
3,02%.
A. DEFINISI
Two Stage Sampling adalah suatu metode penarikan contoh dimana pengambilan pertama adalah
memilih contoh dari unit-unit utama (primary sampling units/psu) dan kemudian pada
pengambilan kedua adalah memilih sejumlah elemen-elemen dari unit-unit utama yang terpilih
(secondary sampling units/ssu).
E. TWO STAGE SAMPLING WITH EQUAL FIRST STAGE UNITS: SRS WOR - SRS WOR
Notasi:
𝑦𝑖𝑗 = nilai ssu ke − j pada psu ke − i
𝑚
𝑦𝑖𝑗
𝑦̅𝑖. = ∑ = rata − rata elemen per ssu pada psu ke − i
𝑚
𝑗
𝑦𝑖𝑗 = nilai ssu ke − j pada psu ke − i
𝑛
𝑦̅𝑖.
𝑦̅ = ∑ = rata − rata keseluruhan elemen
𝑛
𝑖
Estimasi Total
Jika n-psu dan m-ssu dipilih secara SRS WOR, maka penduga totalnya adalah:
151
𝑛 𝑚
𝑁𝑀
𝑌̂ = ∑ ∑ 𝑦𝑖𝑗
𝑛𝑚
𝑖=1 𝑗=1
𝑌̂ = 𝑁𝑀𝑦̅
Estimasi Rata-Rata
𝑛 𝑚
𝑌̂ 1
𝑦̅ = = ∑ ∑ 𝑦𝑖𝑗
𝑁𝑀 𝑛𝑚
𝑖=1 𝑗=1
𝑆𝑒(𝑌̂) = √𝑉(𝑌̂)
𝑆𝑒(𝑌̂)
𝑅𝑠𝑒(𝑌̂) = 𝑥 100%
𝑌̂
F. TWO STAGE SAMPLING WITH UNEQUAL FIRST STAGE UNITS: SRS WOR - PPS WR
Jika sebuah sampel dari n psu dipilih secara PPS WR, kemudian dari psu terpilih diambil Kembali
sebanyak 𝑚𝑖 ssu dengan metode SRS WOR, maka:
𝑛
1 𝑀𝑖 𝑦̅𝑖.
𝑌̂ = ∑
𝑛 𝑝𝑖
𝑖=1
152
Dimana:
𝑚𝑖
𝑦𝑖𝑗
𝑦̅𝑖. = ∑
𝑚𝑖
𝑗=1
𝑁
∑ 𝑝𝑖 = 1
𝑖=1
𝐶 ′ = 𝐶0 + 𝑛𝐶1 + 𝑛𝑚𝐶2
Dalam praktek, umumnya 𝐶1 lebih besar dari 𝐶2 , sehingga peningkatan n akan meningkatkan
biaya lebih dari pada peningkatan m.
𝐴2 𝐶1
𝑚𝑜𝑝𝑡𝑖𝑚𝑢𝑚 = √
𝐴1 𝐶2
153
POLITEKNIK STATISTIKA STIS JAKARTA
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2017/2018
Mata Kuliah : Metode Penarikan Contoh II
Tingkat : 2 (Dua)
==================================================
PETUNJUK:
1. Jawablah
a. Jelaskan alasan penggunaan metode penduga rasio, regresi dan beda!
b. Jelaskan persamaan dan perbedaan metode penduga rasio, regresi dan beda, lengkapi jawaban
anda dengan contoh penerapannya!
c. Pada kondisi bagaimana penduga regresi mempunyai efisiensi yang sama dengan penduga SRS
dan penduga rasio?, buktikan masing-masing melalui rumus!
2. Sebuah survei untuk mengestimasi produksi susu sapi perah dilakukan di suatu daerah dengan
memilih 20 desa dari 1200 desa secara acak tanpa pengembalian. Hasil produksi susu sapi perah
berdasarkan hasil survei dan hasil sensus di periode sebelumnya dari tiap desa terpilih sebagai
berikut :
Produksi Susu Liter Produksi Susu Liter
Nomor Nomor
Data Data Data Data
Desa Desa
Sensus Survei Sensus Survei
(1) (2) (3) (1) (2) (3)
1 3115 3270 11 10225 10550
2 3450 3480 12 5345 2960
3 2670 2650 13 3530 3535
4 1465 1575 14 8975 9450
5 345 390 15 7030 5615
6 4210 3200 16 590 575
7 2375 3460 17 1650 1875
8 1855 1460 18 1090 1875
9 805 1050 19 1090 1060
10 1490 2775 20 1020 1260
154
Bandingkan efisiensi antara metode penduga rasio dengan metode penduga regresi! Beri
kesimpulan! (Jika diketahui dari hasil sensus di periode sebelumnya produksi susu dari semua desa
sebanyak 3,3 juta liter)
4. Suatu penelitian dilakukan untuk mengetahui total produksi sepatu per hari dari Perusahaan Sepatu
merk “DRA”. Perusahaan ini diketahui membawahi sebanyak 60 anak perusahaan yang tersebar di
beberapa tempat. Setiap anak perusahaan tersebut dikelompokkan menjadi 2 strata, dimana strata
pertama adalah anak perusahaan yang memiliki jumlah mesin kurang dari 10 dan strata kedua
adalah anak perusahaan yang memiliki jumlah mesin 10 atau lebih. Pada strata pertama, ada
sebanyak 24 anak perusahaan dengan total mesin yang dimiliki ada sebanyak 192 buah mesin dari
sebanyak 624 buah mesin. Kemudian diambil sampel sebanyak 3 anak perusahaan dimasing-masing
strata dengan cara SRS WOR dan data yang diperoleh adalah sebagai berikut :
Jumlah
Mesin di
Strata setiap anak Produksi Sepatu (dalam ratusan pasang)
perusahaan
sampel
6 2 5 3 5 8 1
I 7 5 1 3 7 8 6 5
8 7 5 9 3 6 3 11 4
10 12 16 13 18 15 9 19 11 12 15
II 11 10 20 12 14 13 16 10 11 17 19 23
12 15 18 19 15 21 17 14 10 19 11 13 20
Berdasarkan data tersebut di atas, perkirakan total produksi sepatu per hari dari Perusahaan Sepatu
merk “DRA” dalam sebuah selang kepercayaan 95% beserta Rse-nya! Kemudian interpretasikan
hasil yang diperoleh.
155
PEMBAHASAN SOAL UTS GENAP TAHUN 2017/2018
METODE PENARIKAN CONTOH II
1. Jawaban
a. Ratio estimator, difference estimator dan regression estimator adalah suatu metode estimasi
dengan mengambil manfaat hubungan yang kuat antara variabel pendukung, 𝑥𝑖 dengan variabel
yang diteliti, 𝑦𝑖 . Syarat menggunakan ketiga estimator tersebut adalah adalah jumlah populasi 𝑋
dari 𝑥𝑖 harus diketahui.
Contoh penerapan:
➢ Penduga Rasio
𝑥 = 0 dan 𝑦 = 0
misal: 𝑥 = luas lahan pertanian
𝑦 = produksi padi
Jika 𝑥 = 0 (lahan pertanian tidak ada), otomatis 𝑦 = 0 (jika tidak ada lahan pertanian mana
mungkin ada padi).
➢ Penduga Regresi
𝑥 = 0 dan 𝑦 ≠ 0
misal: 𝑥 = jumlah pupuk yang digunakan
𝑦 = produksi padi
Jika 𝑥 = 0 (petani menanam tidak memakai pupuk), nilai 𝑦 ≠ 0 (produksi padi akan tetap
ada).
156
➢ Penduga Beda
Sama seperti penduga regresi, tetapi nilai 𝑐 atau 𝑘 (gradien) diketahui dari survei sebelumnya
ataupun survei pendahuluan. Penduga beda digunakan untuk melihat perbedaan nilai suatu
karakteristik yang sama dari repeated survey.
c. Penduga regresi mempunyai efisiensi yang sama dengan penduga SRS hanya jika variabel 𝑥 dan
𝑦 tidak berkorelasi (𝜌 = 0)
Bukti:
1−f 2
𝑣(𝑦̅𝐿𝑅 ) n 𝑠𝑦 (1 − 𝜌2 )
= = 1 − 𝜌2
𝑣(𝑦̅𝑆𝑅𝑆 ) 1−f 2
n 𝑠𝑦
2
Nilai 1 − 𝜌 akan selalu lebih kecil atau sama dengan 1, sehingga penduga SRS akan sama efisien
dengan penduga regresi hanya jika 𝜌 = 0.
2. Diketahui:
Populasi 𝑁 = 1200
Sampel 𝑛 = 20
Dimana,
𝑋~ Jumlah produksi sapi perah hasil sensus di periode sebelumnya (dalam liter)
𝑌~ Jumlah produksi sapi perah hasil survei (dalam liter)
𝑁
𝑋 = ∑ 𝑥𝑖 = 3300000
𝑖=1
Sehingga diperoleh:
𝑋
𝑋̅ = = 2750
𝑁
∑𝑛𝑖=1 𝑥𝑖 62325
𝑥̅ = = = 3116,25
𝑛 20
∑𝑛𝑖=1 𝑦𝑖 62065
𝑦̅ = = = 3103,25
𝑛 20
𝑛
2
(𝑥𝑖 − 𝑥̅ )2
𝑠𝑥 = ∑ = 7815407,566
𝑛−1
𝑖=1
𝑛
(𝑦𝑖 − 𝑦̅)2
𝑠𝑦2 = ∑ = 7182408,618
𝑛−1
𝑖=1
𝑠𝑥𝑦
𝜌̂ = = 0,95576
𝑠𝑥 𝑠𝑦
157
𝑠𝑒(𝑌̂𝑅 ) = √𝑣(𝑌̂𝑅 ) = 217941,6012
Interpretasi:
Dengan menggunakan metode ratio estimator, perkiraan jumlah produksi susu sapi perah adalah
sebesar 3286233,454 liter dengan standard error (penyimpangan terhadap total sebenarnya)
sebesar 217941,6012 liter.
Efisiensi
𝑣(𝑦̅𝐿𝑅 ) 43993741950
𝑅𝐸 = = = 0,9262124801
𝑣(𝑦̅𝑅 ) 47498541530
Interpretasi:
Karena 𝑅𝐸 < 1, maka 𝑣(𝑦̅𝐿𝑅 ) < 𝑣(𝑦̅𝑅 ) sehingga penduga regresi lebih efisien daripada penduga
rasio.
Karena 𝑣(𝑦̅𝐿𝑅 ) < 𝑣(𝑦̅𝑅 ), sehingga dalam perkiraan jumlah produksi susu sapi perah, penduga
regresi lebih presisi/akurat dibandingkan penduga rasio.
3. “Stratified PPS Cluster Sampling” Provinsi Kepulauan Riau Estimasi Jumlah Penduduk
a. Pengambilan sampel secara klaster (sekumpulan elemen-elemen yang tidak saling tumpang
tindih) dengan memerhatikan size cluster saat memilih klaster, dan sebelumnya klaster telah
dikelompokkan menjadi strata-strata tertentu.
Strata : Jumlah penduduk berdasarkan sensus terdekat
Klaster : Kabupaten atau Kota
Size : Jumlah penduduk berdasarkan sensus terdekat
158
c. Rumus estimasi
Untuk tiap-tiap strata:
➢ Rata-rata strata
∑𝑛𝑖=1
ℎ
z̅ℎ 𝑖
z̅ℎ =
𝑛ℎ
𝑀ℎ 𝑖 𝑦̅ℎ 𝑖
z̅ℎ 𝑖 =
𝑀0ℎ 𝑝ℎ 𝑖
➢ Total per strata
Ẑℎ = 𝑁ℎ 𝑀0ℎ z̅ℎ
➢ Rata-rata keseluruhan
Ẑ
z̅𝑛 =
𝑁𝑀0
➢ Total keseluruhan
𝐿
Ẑ = ∑ Ẑℎ
ℎ=1
Untuk tiap-tiap strata, jika PPS WOR dengan size banyaknya elemen
❖ Varians rata-rata strata
𝑁
1 2
𝑣(z̅ℎ ) = ∑(𝑦̅ℎ 𝑖 − 𝑦̅ℎ )
𝑛ℎ (𝑛ℎ − 1)
𝑖=1
❖ Varians total strata
𝑣(Ẑℎ ) = 𝑁ℎ2 𝑀02ℎ 𝑣(z̅ℎ )
𝑣(Ẑ) = ∑ 𝑣(Ẑℎ )
ℎ=1
4. Stratified Unequal Cluster Sampling
𝑁 = 60 𝑀0 = 624 buah mesin
𝑁1 = 24 𝑛1 = 3 𝑀01 = 192
𝑁2 = 36 𝑛2 = 3 𝑀0 2 = 432
Karena 𝑀0 diketahui maka menggunakan 3 cara:
Didapatkan nilai-nilai statistik sebagai berikut:
𝑀𝑖 624
̅ = ∑𝑁
𝑀 𝑖=1 = = 10,4 ̅1 = 192 = 8
𝑀 ̅2 = 432 = 12
𝑀
𝑁 60 24 36
159
2
𝑀𝑖 𝑦̅𝑖
∑𝑛𝑖=1 ( ̅ − 𝑦̅ℎ )
𝑣(𝑦̅1∗ ) = (1 − f) 𝑀
𝑛(𝑛 − 1)
24 2 35 2 48 2
3 (10,2−3,4294871795) +(10,2−3,4294871795) +(10,2−3,4294871795)
= (1 − 24
) 3(3−1)
2
𝑀𝑖 𝑦̅𝑖
∑𝑛𝑖=1 ( ̅ − 𝑦̅ℎ )
𝑣(𝑦̅2∗ ) = (1 − f) 𝑀
𝑛(𝑛 − 1)
140 2 165 2 192 2
3 (10,2−15,929487179) +(10,2−15,929487179) +(10,2−15,929487179)
= (1 − 36
) 3(3−1)
33 4,857602701 + 0,06100080444 + 8,375480445
= ×
36 6
33 13,29408395
= ×
36 6
𝑣(𝑦̅2∗ ) = 2,031040604
= 658,4615385 + 6881,538461
𝑌̂𝑠𝑡 = 7540
160
Confidence Interval:
𝑠𝑒(𝑌̂𝑠𝑡 ) 627,7180574
𝑅𝑆𝐸 = × 100% = × 100% = 8,325%
𝑌̂𝑠𝑡 7540
Interpretasi :
Perkiraan total produksi sepatu per hari dari Perusahaan Sepatu merk “DRA” sekitar 7540 (dalam
ratusan pasang) dengan penyimpangan terhadap total sebenarnya sekitar 627,7180574. Dengan
selang kepercayaan 95%, perkiraan total produksi sepatu per hari antara 6310 sampai 8770 (dalam
ratusan pasang) dengan tingkat ketelitian yang kita duga sebesar 91,675% ( 100% − 𝑅𝑆𝐸).
161
POLITEKNIK STATISTIKA STIS JAKARTA
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2018/2019
==================================================
==================================================
∑𝑛
𝑖=1 𝑥𝑖 ∑𝑛
𝑖=1 𝑦𝑖
1. Jika 𝑥̅ = 𝑛
dan 𝑦̅ =
yang diperoleh dari 𝑛 elemen sampel yang dipilih secara SRS (dari 𝑁
𝑛
elemen populasi), sehingga masing-masing merupakan unbiased estimator dari parameter 𝑋̅ =
∑𝑁
𝑖=1 𝑥𝑖 ∑𝑁
𝑖=1 𝑦𝑖 𝑦̅
𝑁
dan 𝑌̅ = 𝑁
. Maka rasio sampel 𝑅̂ = 𝑥̅ merupakan unbiased estimator bagi parameternya
𝑌̅
𝑅 = 𝑋̅.
a. Tuliskan formula bias dari penduga rasio tersebut
𝑦̅
b. Buktikan dengan angka fiktif, bahwa 𝑅̂ = merupakan penduga yang bias.
𝑥̅
2. Seorang peneliti industri kecil melakukan penelitian terhadap usaha masyarakat yang memproduksi
sepatu di suatu wilayah. Untuk mendukung penelitiannya, diambil sampel di wilayah tersebut
sebanyak 10 rumah tangga secara acak sederhana tanpa pengembalian (SRS-WOR). Diketahui di
wilayah tersebut ada sebanyak 100 rumah tangga yang mengusahakan industri sepatu dengan mesin
yang dimilikinya yang seluruhnya berjumlah 450 mesin. Dari hasil wawancara terhadap 10 rumah
tangga usaha sepatu yang terpilih sampel, diperoleh informasi sebagai berikut:
Berdasarkan informasi diatas, perkirakan statistik rata-rata produksi sepatu per-industri rumah
tangga, standar error, dan relative standar error (rse)-nya dengan:
162
3. Cluster sampling adalah salah satu teknik sampling berpeluang dimana setiap unit samplingnya
memiliki peluang yang sama untuk dipilih sebagai sampel (equal probability sampling). Dalam
kegiatan survei skala besar, cluster sampling ini paling sering digunakan. Berdasarkan hal tersebut:
a. Jelaskan pengertian cluster sampling berikut kelemahan dan kelebihannya!
b. Jika seseorang ingin meneliti tentang produktifitas petani tanaman padi di sebuah Kabupaten di
propinsi Maluku Utara menggunakan metode “Stratified Cluster Systematic Sampling” dengan
clusternya adalah semua desa/kelurahan yang ada di kabupaten tersebut, Jelaskan arti dari
metode sampling tersebut, sertai jawaban anda dengan menyebutkan Populasi, Populasi Target,
Kerangka Sampel, Unit Sampling, Unit Analisis dan Nilai Karakteristik yang diestimasi dari
penelitian tersebut!
4. Diketahui suatu akademi memiliki 24 kelas yang masing-masing kelas terdiri dari 8 mahasiswa.
Untuk memperkirakan jumlah buku statistik yang dimiliki oleh mahasiswa, dilakukan pengambilan
sampel secara SRS WOR sebanyak 4 kelas, kemudian dilakukan wawancara terhadap semua
mahasiswa yang berada pada kelas terpilih. Data yang diperoleh:
No urut sampel Mahasiswa
kelas 1 2 3 4 5 6 7 8
1 3 1 6 8 2 2 4 2
2 7 2 4 4 9 8 7 4
3 6 1 2 9 2 6 4 5
4 8 4 8 1 4 3 8 8
Perkirakan total buku statistik yang dimiliki mahasiswa di akademi tersebut beserta standard error
dan rse-nya!
5. PPS sampling dapat diterapkan dalam sampling Cluster. Salah satu syarat digunakannya PPS adalah
adanya korelasi positif antara size yang digunakan dalam PPS dengan variable yang akan diteliti
dalam survei. Terkait size, maka jawablah pertanyaan di bawah ini:
a. Jelaskan, kenapa size dengan nilai korelasi yang tidak terlalu kuat akan menyebabkan estimasi
akan cenderung bias?
b. Terdapat hubungan antara nilai Efisiensi cluster PPS terhadap SRS dengan cluster size (𝑀𝑖).
Jelaskan bentuk hubungan tersebut?
163
PEMBAHASAN SOAL UTS GENAP TAHUN 2018/2019
METODE PENARIKAN CONTOH II
Lalu, kita akan ambil satu sampel, sehingga all posible sample-nya adalah sebagai berikut
X Y X Y X Y
1 1 2 3 3 5
3 5
𝑅̂1 = 1 𝑅̂2 = 𝑅̂1 =
2 3
3 5
∑ 𝑅̂𝑖 1 + 2 + 3 25
𝐸(𝑅̂ ) = = =
𝑛 3 18
25 3
𝐸(𝑅̂ ) = ≠
18 2
𝑦̅
Jadi, terbukti bahwa 𝑅̂ = 𝑥̅ merupakan penduga bias dari 𝑅 karena 𝐸(𝑅̂ ) ≠ 𝑅.
2. Diketahui:
Populasi 𝑁 = 100
Sampel 𝑛 = 10
Dimana,
𝑋~ Jumlah mesin untuk industri rumah tangga
𝑌~ Hasil produksi sepatu (dalam satuan pasang)
𝑋 = ∑ 𝑥𝑖 = 450
𝑖=1
164
Sehingga diperoleh:
𝑋 450
𝑋̅ = = = 4,5
𝑁 100
𝑛
∑𝑖=1 𝑥𝑖 60
𝑥̅ = = =6
𝑛 10
𝑛
∑𝑖=1 𝑦𝑖 500
𝑦̅ = = = 50
𝑛 10
𝑛
(𝑥𝑖 − 𝑥̅ )2
𝑠𝑥2 = ∑ = 4,6667
𝑛−1
𝑖=1
𝑛
(𝑦𝑖 − 𝑦̅)2
𝑠𝑦2 =∑ = 94
𝑛−1
𝑖=1
𝑠𝑥𝑦 20,3333
𝜌̂ = = = 0,9708
𝑠𝑥 𝑠𝑦 2,1602 × 9,6954
a. Penduga Rasio
𝑦̅ 50
𝑅̂ = = = 8,3333
𝑥̅ 6
𝑦̅𝑅 = 𝑅̂ 𝑋̅ = 8,3333 × 4,5 = 37,5
1−f
𝑣(𝑦̅𝑅 ) = × [𝑠𝑦2 + 𝑅̂ 2 𝑠𝑥2 − 2𝜌̂𝑅̂𝑠𝑥 𝑠𝑦 ] = 7,1267
n
𝑠𝑒(𝑦̅𝑅 )
𝑟𝑠𝑒(𝑦̅𝑅 ) = × 100% = 7,1189%
𝑦̅𝑅
Interpretasi:
Dengan menggunakan metode ratio estimator, perkiraan rata-rata produksi sepatu per industri
rumah tangga adalah sebesar 37,5 pasang sepatu dengan standard error (penyimpangan
terhadap total sebenarnya) sebesar 2,6696 pasang dan relative standar error sebesar 7,1189%
b. Penduga Regresi
𝑠𝑥𝑦 20,3333
𝑏= = = 4,3571
𝑠𝑥2 4,6667
𝑦̅𝐿𝑅 = 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅ ) = 50 + 4,3571(4,5 − 6) = 43,4643
1−f
𝑣(𝑦̅𝐿𝑅 ) = × [𝑠𝑦2 + 𝑏 2 𝑠𝑥2 − 2𝜌̂𝑏𝑠𝑥 𝑠𝑦 ] = 0,4864
n
𝑠𝑒(𝑦̅𝐿𝑅 ) = √𝑣(𝑦̅𝐿𝑅 ) = 0,6974
𝑠𝑒(𝑦̅𝐿𝑅 )
𝑟𝑠𝑒(𝑦̅𝐿𝑅 ) = × 100% = 1,6046%
𝑦̅𝐿𝑅
Interpretasi:
Dengan menggunakan metode regression estimator, perkiraan rata-rata produksi sepatu per
industri rumah tangga adalah sebesar 43,4643 pasang sepatu dengan standard error
165
(penyimpangan terhadap total sebenarnya) sebesar 0,6974 pasang dan relative standar error
sebesar 1,6046%.
3. Cluster Sampling
a. Cluster Sampling adalah suatu metode penarikan sampel di mana unit penarikan sampel (unit
sampling)-nya adalah merupakan kumpulan elemen-elemen yang tidak saling tumpang tindih.
Cluster Sampling dilakukan ketika daftar kerangka contoh yang memuat seluruh unit-unit
analisis dalam populasi tidak tersedia secara lengkap dan mutakhir, dan biaya untuk membuat
daftar kerangka contoh sangat mahal, serta biaya transportasi antar unit-unit contoh sangat
mahal dan tidak sebanding dengan biaya untuk penelitian per unit contoh. Cluster Sampling
memiliki beberapa kelebihan dan kelemahan sebagai berikut.
Kelebihan Kelemahan
• Pengumpulan data untuk elemen yang
berdekatan mudah, cepat, dan secara
operasional lebih baik/nyaman
Standard error yang dihasilkan sering
lebih tinggi dibandingkan dengan
• Biaya kecil dibanding SRS pada
metode sampling lain, karena listing
penghematan waktu perjalanan,
unit dalam klaster yang sama sering
identifikasi, kontak, dll
homogen
• Dapat dilakukan ketika kerangka
sampling dari elemen tidak tersedia
dengan mudah
b. Stratified Cluster Systematic Sampling adalah metode pengambilan sampel secara sistematik di
dalam klaster, dan sebelumnya klaster telah dikelompokkan menjadi strata-strata tertentu.
Populasi : Seluruh petani padi di sebuah kabupaten di Provinsi Maluku Utara
Populasi Target : Seluruh petani padi di sebuah kabupaten di Provinsi Maluku Utara
Kerangka Sampel : Data petani padi di setiap desa/kelurahan di kabupaten tersebut
Unit Sampling : Petani padi di setiap desa/kelurahan di kabupaten tersebut
Unit Analisis : Petani terpilih di desa/kelurahan terpilih
Nilai Karakteristik : Produktivitas petani padi
4. Diketahui:
𝑁 = 24 𝑛 = 4 𝑀 = 8
𝑀
𝑦1𝑗 3 + 1 + 6 + 8 + 2 + 2 + 4 + 2 28
𝑦̅1. = ∑ = = = 3,5
𝑀 8 8
𝑗=1
𝑀
𝑦2𝑗 7 + 2 + 4 + 4 + 9 + 8 + 7 + 4 45
𝑦̅2. = ∑ = = = 5,625
𝑀 8 8
𝑗=1
𝑀
𝑦3𝑗 6 + 1 + 2 + 9 + 2 + 6 + 4 + 5 35
𝑦̅3. = ∑ = = = 4,375
𝑀 8 8
𝑗=1
𝑀
𝑦4𝑗 8 + 4 + 8 + 1 + 4 + 3 + 8 + 8 44
𝑦̅4. = ∑ = = = 5,5
𝑀 8 8
𝑗=1
166
𝑛
𝑦̅𝑖. 3,5 + 5,625 + 4,375 + 5,5 19
𝑦̅𝑛 = ∑ = = = 4,75
𝑛 4 4
𝑖=1
𝑦̅ = 𝑀𝑦̅𝑛 = 8 × 4,75 = 38
𝑛
(𝑦𝑖. − 𝑦̅)2 (28 − 38)2 + (45 − 38)2 + (35 − 38)2 + (44 − 38)2
𝑠𝑏2 =∑ = = 64,6667
𝑛−1 3
𝑖=1
b. Untuk menghitung nilai efisiensi cluster PPS terhadap SRS, digunakan rumus sebagai berikut.
𝜎2
𝑅𝐸 = 𝑀̅ 𝑏
𝜎2
Kita lihat bahwa untuk menghitung nilai efisiensi cluster PPS terhadap SRS, dibutuhkan
komponen 𝑀 ̅ = 1 ∑𝑀𝑖 , sehingga rumus 𝑅𝐸 tersebut dapat juga ditulis sebagai berikut.
̅ dimana 𝑀
𝑁
𝑁
𝜎𝑏2 1 𝜎𝑏2
̅
𝑅𝐸 = 𝑀 = ∑ 𝑀𝑖 2
𝜎2 𝑁 𝜎
𝑖=1
Dapat kita lihat bahwa nilai efisiensi cluster PPS terhadap SRS memiliki hubungan dengan cluster
size (𝑀𝑖 ) dan hubungannya berbanding lurus.
167
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2019/2020
MATA KULIAH : Metode Penarikan Contoh II
TINGKAT : II (Dua) Prodi D4 Statistika
DOSEN : Tim Dosen
HARI/TANGGAL : Kamis/5 Maret 2020
WAKTU : 120 menit
SIFAT UJIAN : Tutup buku namun boleh buka rumus
1. Dalam mengestimasi hasil dari kegiatan survei sering kali digunakan variabel pembantu
(auxilliary variable), yaitu variabel yang memiliki hubungan (correlation) yang kuat dengan
variabel yang diteliti, sebagai metode untuk memperkecil nilai varians sehingga dapat
meningkatkan presisi estimator-nya. Beberapa metode yang menggunakan variabel pembantu
tersebut adalah penduga rasio, regresi dan beda. Berdasarkan hal tersebut :
a. Jelaskan alasan penggunaan metode penduga rasio, regresi dan beda!
b. Jelaskan persamaan dan perbedaan metode penduga rasio, regresi dan beda, lengkapi
jawaban anda dengan contoh penerapannya!
c. Pada kondisi bagaimana penduga regresi mempunyai efisiensi yang sama dengan penduga
SRS dan penduga rasio? Buktikan masing-masing melalui rumus!
2. Penduduk yang padat, selalu memberikan berbagai dampak positif dan negatifnya. Salah satunya
peningkatan kejadian kecelakaan lantas. Jakarta yang terkenal dengan penduduknya yang padat
memang memiliki catatan kejadian kecelakaan lantas yang tinggi. pengendara yang terburu-buru,
melawan arus, sambil menelpon/chating, dan lain-lain diberitakan menjadi penyebab kecelakaan
lantas. Berbagai upaya sebenarnya sudah dilakukan oleh pemerintahan melalui kepolisian
setempat untuk mengurangi kejadian kecelakaan tersebut, akan tetapi catatan kecelakaan tetap
tinggi, bahkan mengalami peningkatan. Informasi mengenai kejadian kecelakaan lantas sangat
diperlukan bagi kepolisian setempat untuk merencanakan berbagai upaya pencegahannya
sekaligus evaluasi upaya pencegahan yang sudah dilakukan. Sebuah penelitian yang dilakukan di
11 kecamatan dari 44 kecamatan di Jakarta dilakukan secara acak tanpa pengembalian untuk
memperkirakan kejadian kecelakaan lantas di Jakarta berdasarkan jumlah total kepemilikan
kendaraan bermotor dan data yang diperoleh seperti terlihat pada Tabel 1.
Tabel 1. Jumlah Kejadian Kecelakaan per bulan berdasarkan Kecamatan dan Jenis Kendaraan
Tahun X
Jumlah kendaraan yang dimiliki penduduk Jumlah kejadian
Kecamatan (ribu unit) kecelakaan per
Motor Mobil bulan
1 271.5 69.3 9
2 420.3 56.1 12
3 272.4 69.3 8
4 331.4 89.1 10
5 445.5 81.2 10
6 232.7 119.8 13
7 368.1 62.4 9
168
8 397.2 99 10
9 324.1 106.1 11
10 294.5 87.3 9
11 290 78.9 9
Berdasarkan hal tersebut bila anda diminta membantu mengestimasi kejadian kecelakaan lantas,
maka jawablah beberapa hal berikut :
a. Diantara metode estimasi rasio dan regresi, mana yang akan kalian sarankan untuk
digunakan dalam estimasi yang dimaksud?
b. Berdasarkan jawaban poin a, berapa estimasi rata-rata kejadian kecelakaan lantas per bulan
di tiap kecamatan di Jakarta? Berapa pula relative standar error-nya? Beri interpretasi!
Diketahui jumlah kepemilikan mobil di Jakarta pada Tahun X adalah sebesar 3,5 juta unit dan
motor sebesar 9,6 juta unit.
3. Dalam penarikan sampel dari populasi yang heterogen, seringkali digunakan teknik
pengelompokan dengan tujuan memperoleh hasil pendugaan yang lebih efisien baik dari sisi
biaya (cost) maupun dari tingkat keragamannya. Beberapa teknik pengelompokan yang bisa
digunakan diantaranya metode stratifikasi, metode klaster maupun gabungan antara keduanya.
a. Jelaskan perbedaan metode stratified random sampling dan metode cluster sampling.
b. Jelaskan keuntungan dan kerugian menggunakan metode cluster sampling dibandingkan
simple random sampling, serta jelaskan bagaimana mengukur perbandingan antara cluster
sampling dan simple random sampling!
c. Berikan contoh penggunaan metode stratified random sampling, metode cluster sampling
dan metode gabungan keduanya (stratified cluster sampling)!
4. Suatu penelitian dilakukan untuk mengetahui omzet penjualan barongko per bulan dari suatu
UMKM dengan merk “HAYATI”. Usaha ini diketahui memiliki 60 lokasi penjualan yang terbesar
di beberapa tempat, dan setiap lokasi memiliki outlet yang dapat memudahkan penjualan.
Kemudian lokasi tersebut dikelompokkan menjadi 2 strata berdasarkan standar kelas outlet,
dimana strata pertama adalah outlet beromzet besar dan strata kedua adalah outlet beromzet
kecil. Pada strata pertama ada sebanyak 36 lokasi dengan total 432 outlet dari sebanyak 624
outlet yang ada. Kemudian diambil sampel sebanyak 3 lokasi di masing-masing strata dengan SRS
WOR dan data yang diperoleh adalah sebagai berikut :
Tabel 2. Jumlah barongko Terjual berdasarkan Lokasi dan Outlet Tahun X
Jumlah
Lokasi outlet di Jumlah barongko terjual (ratusan bungkus)
setiap lokasi
12 15 18 19 15 21 17 14 10 19 11 13 20
Outlet
dengan 10 12 16 13 18 15 9 19 11 12 15
omzet besar 11 10 20 12 14 13 16 10 11 17 19 23
Outlet 7 5 1 3 7 8 6 5
dengan 8 7 5 9 3 6 3 11 4
omzet kecil 6 2 5 3 5 8 1
169
Berdasarkan data penjualan tersebut, bila diketahui harga per bungkus barongko adalah
Rp3.000,- perkirakan omzet dari penjualan barongko tersebut dalam sebuah confident interval
95 persen beserta relative standard error-nya!
170
PEMBAHASAN SOAL UTS GENAP TAHUN 2019/2020
METODE PENARIKAN CONTOH II
1.
a. Jelaskan alasan penggunaan metode penduga rasio, regresi dan beda!
Alasan penggunaan metode penduga rasio, regresi dan beda adalah untuk mengestimasi
suatu variabel terhadap variabel lainnya dan untuk meningkatkan presisi dari estimasi rata-
rata dan estimasi total.
Rastio estimator adalah suatu metode estimasi yang membandingkan antara variabel yang
diteliti (𝑦) dengan variabel bantu/pendukung (𝑥) untuk meningkatkan efisiensi pendukung
𝑦̅
parameter populasi (𝑅̂ = 𝑟 = ), dan garisnya melalui titik origin (𝑥 = 0 𝑑𝑎𝑛 𝑦 = 0).
𝑥̅
Difference estimator digunakan jika nilai c atau k diketahui. Regression estimator digunakan
jika 𝑥 = 0 namun 𝑦 ≠ 0, kedua metode ini adalah metode estimasi dengan mengambil
manfaat hubungan yang kuat antara 𝑥 dengan variabel 𝑦. Syaratnya adalah jumlah populasi
𝑋 dari 𝑥𝑖 harus diketahui. Hubungan antara 𝑥 dan 𝑦 mendekati linier namun garisnya tidak
melalui titik origin.
b. Jelaskan persamaan dan perbedaan metode penduga rasio, regresi dan beda, lengkapi
jawaban anda dengan contoh penerapannya!
Persamaan dan perbedaan
Metode Penduga Perbedaan Persamaan
Rasio Garisnya melalui titik origin (0,0) Suatu metode estimasi
Garis liniernya tidak melalui titik dengan mengambil
Regresi
origin manfaat hubungan yang
kuat antar variabel
pendukung 𝑥𝑖 , dengan
Nilai c atau k diketahui dan garis variabel yang diteliti 𝑦𝑖 .
Beda Syaratnya adalah jumlah
liniernya tidak melalui titik origin.
populasi 𝑋 dari 𝑥𝑖 harus
diketahui.
Contoh penerapan :
Penduga Rasio
𝑥 = 0 𝑑𝑎𝑛 𝑦 = 0
Misal : 𝑥 = 𝑙𝑢𝑎𝑠 𝑙𝑎ℎ𝑎𝑛 𝑝𝑒𝑟𝑡𝑎𝑛𝑖𝑎𝑛
𝑦 = 𝑝𝑟𝑜𝑑𝑢𝑘𝑠𝑖 𝑝𝑎𝑑𝑖
Jika 𝑥 = 0 (lahan pertanian tidak ada), maka 𝑦 = 0 (jika tidak ada lahan pertanian maka tidak
memproduksi padi)
Penduga Regresi
𝑥 = 0 𝑑𝑎𝑛 𝑦 ≠ 0
Misal : 𝑥 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑝𝑢𝑝𝑢𝑘 𝑦𝑎𝑛𝑔 𝑑𝑖𝑔𝑢𝑛𝑎𝑘𝑎𝑛
𝑦 = 𝑝𝑟𝑜𝑑𝑢𝑘𝑠𝑖 𝑝𝑎𝑑𝑖
Jika 𝑥 = 0 (petani menanam tidak memakai pupuk), nilai 𝑦 ≠ 0 (produksi padi akan tetap
ada)
171
Penduga Beda
Nilai 𝑘 sudah diketahui dari survei sebelumnya. Penduga beda digunakan untuk melihat
perbedaan nilai suatu karakteristik yang sama dari repeated survey.
c. Pada kondisi bagaimana penduga regresi mempunyai efisiensi yang sama dengan penduga
SRS dan penduga rasio? Buktikan masing-masing melalui rumus!
Regression estimator akan mempunyai efisiensi yang sama dengan penduga SRS hanya jika
variabel 𝑥 dan 𝑦 tidak berkorelasi (𝜌 = 0)
Bukti :
1−𝑓 2
𝑣(𝑦̅𝑙𝑟 ) 𝑠𝑦 (1 − 𝜌2 )
= 𝑛 = (1 − 𝜌2 )
𝑣(𝑦̅) 1−𝑓 2
𝑛 𝑠𝑦
Nilai (1 − 𝜌2 ) akan selalu lebih kecil atau sama dengan 1, sehingga penduga SRS akan sama
efisien dengan penduga regresi hanya jika 𝜌 = 0.
Regression estimator akan mempunyai efisiensi yang sama dengan ratio estimator hanya jika
𝐶𝑥
𝑏 = 𝑅̂ atau 𝜌 =
𝐶𝑦
Bukti :
1−𝑓 2 1−𝑓 2
𝑣(𝑦̅𝑙𝑟 ) 𝑛 𝑠𝑦 (1 − 𝜌2 ) 𝑛 𝑠𝑦 (1 − 𝜌2 ) (1 − 𝜌2 )
= = =
𝑣(𝑦̅𝑟 ) 1 − 𝑓 2 − 2𝜌𝑅̂ 𝑠 𝑠 + 𝑅̂ 2 𝑠 2 1−𝑓 2 𝑦̅ 𝑠𝑥 𝑦̅ 2 𝑠𝑥 2 𝐶𝑥 𝐶𝑥 2
(𝑠 ) 𝑠 (1 − 2𝜌 + ( ) ( ) ) (1 − 2𝜌 + ( )
𝐶𝑦 )
𝑛 𝑦 𝑦 𝑥 𝑥 𝑦
𝑛 𝑥̅ 𝑠𝑦 𝑥̅ 𝑠𝑦 𝐶𝑦
(1 − 𝜌2 ) (1 − 𝜌2 )
= =
𝐶 𝐶 2 𝐶 𝐶 2
(1 − 2𝜌 𝐶𝑥 + (𝐶𝑥 ) + 𝜌2 − 𝜌2 ) (𝜌2 − 2𝜌 𝐶𝑥 + (𝐶𝑥 ) + 1 − 𝜌2 )
𝑦 𝑦 𝑦 𝑦
(1 − 𝜌 2)
=
2
𝐶
((𝐶𝑥 − 𝜌) + (1 − 𝜌2 ))
𝑦
Persamaan di atas selalu bernilai kurang dari atau sama dengan 1 sehingga secara umum
regresi lebih efisien dari pada ratio estimator.
Regresi akan sama efisien dengan ratio jika :
𝑣(𝑦̅𝑙𝑟 ) (1 − 𝜌2 )
= =1
𝑣(𝑦̅𝑟 ) 𝐶 2
((𝐶𝑥 − 𝜌) + (1 − 𝜌2 ))
𝑦
2
𝐶𝑥
(1 − 𝜌2 ) = ( − 𝜌) + (1 − 𝜌2 )
𝐶𝑦
2
𝐶𝑥 𝐶𝑥 𝐶𝑥
( − 𝜌) = 0 ↔ −𝜌=0↔𝜌=
𝐶𝑦 𝐶𝑦 𝐶𝑦
172
2.
a. Diantara metode estimasi rasio dan regresi, mana yang akan kalian sarankan untuk
digunakan dalam estimasi yang dimaksud?
Metode estimasi yang disarankan untuk digunakan adalah metode estimasi rasio karena
garisnya melalui titik origin (0,0) dimana jika penduduk tidak memiliki kendaraan
(𝑥 = 0 ) maka tidak ada kejadian kecelakaan (𝑦 = 0).
b. Berdasarkan jawaban poin a, berapa estimasi rata-rata kejadian kecelakaan lantas per bulan
di tiap kecamatan di Jakarta? Berapa pula relative standar error-nya? Beri interpretasi!
Jumlah kepemilikan mobil : 𝑋1 = 9,6 𝑗𝑢𝑡𝑎 = 9.600 (𝑟𝑖𝑏𝑢 𝑢𝑛𝑖𝑡)
Jumlah kepemilikan motor : 𝑋2 = 3,5 𝑗𝑢𝑡𝑎 = 3.500 (𝑟𝑖𝑏𝑢 𝑢𝑛𝑖𝑡)
Jumlah kepemilikan kendaraan (mobil dan motor) :
𝑋 = 𝑋1 + 𝑋2 = 13.100 (𝑟𝑖𝑏𝑢 𝑢𝑛𝑖𝑡)
𝑁 = 44
𝑛 = 11
Kecamatan 1 2 3 4 5 6 7 8 9 10 11
Jumlah
kendaraan (𝑥) 340,8 476,4 341,7 420,5 526,7 352,5 430,5 496,2 430,2 381,8 368,9
(ribu unit)
Jumlah
9 12 8 10 10 13 9 10 11 9 9
Kecelakaan (𝑦)
173
1−𝑓 2 (𝑁 − 𝑛) 2
𝑣(𝑦̅𝑅 ) = (𝑠𝑦 − 2𝑅̂ 𝜌𝑠𝑥 𝑠𝑦 + 𝑅̂ 2 𝑠𝑥2 ) = (𝑠𝑦 − 2𝑅̂ 𝜌𝑠𝑥 𝑠𝑦 + 𝑅̂ 2 𝑠𝑥2 )
𝑛 𝑁𝑛
(44 − 11)
= (2,2 − 2(0,0241)(0,2465)(64,3070)(1,4832)
44 × 11
+ (0,0241)2 (4135,3929)) = 0,2364
𝑠𝑒(𝑦̅𝑅 ) = √𝑣(𝑦̅𝑅 ) = √0,2364 = 0,4862
𝐿𝐶𝐿 = 𝑦̅𝑅 − 1,96 × 𝑠𝑒(𝑦̅𝑅 ) = 7,1723 − 1,96 × 0,4862 = 6,2193
𝑈𝐶𝐿 = 𝑦̅𝑅 + 1,96 × 𝑠𝑒(𝑦̅𝑅 ) = 7,1723 + 1,96 × 0,4862 = 8,1252
√𝑣 (𝑦̅𝑅 ) 0,4862
𝑟𝑠𝑒(𝑦̅𝑅 ) = × 100% = × 100% = 6,78%
𝑦̅𝑅 7,1723
Estimasi rata-rata jumlah kejadian kecelakaan per bulan di setiap kecamatan di Jakarta
adalah sebesar 7,1723 kecelakaan dengan standard error atau penyimpangan sebesar
0,4862. Estimasi rata-rata jumlah kejadian kecelakaan per bulan di setiap kecamatan di
Jakarta berkisar antara 6,2193 sampai 8,1252 kecelakaan dengan relative standard error
sebesar 6,78%.
174
POLITEKNIK STATISTIKA STIS JAKARTA
UJIAN TENGAH SEMESTER GANJIL TAHUN AKADEMIK 2020/2021
========================================================
========================================================
2. Pemerintah suatu daerah bermaksud untuk mempelajari produksi susu sapi perah yang
menjadi salah satu produksi pertanian andalan di daerah tersebut. 15 desa sampel acak
yang menjadi pusat pengembangan sapi perah dipilih dari total 115 desa, kemudian dicatat
jumlah sapi tiap desa tersebut beserta hasil pendataan di tahun sebelumnya.
175
6 1127 1140 14 1115 1118
7 1163 1153 15 1112 1122
8 1153 1146
Diketahui jumlah populasi sapi di tahun sebelumnya sebesar 140968 ekor. Berdasarkan
informasi tersebut, jawab dan jelaskan beberapa hal berikut
a. Perkirakan rata-rata jumlah sapi tiap desa serta total sapi saat ini beserta
standard errornya, dengan menggunakan metode estimasi rasio. Interpretasikan!
b. Bandingkan efisiensi jawaban pada pertanyaan (a) dengan metode estimasi regresi
dan random sampling! Apa yang bisa kamu sarankan dari hasil tersebut. Jelaskan!
3. Klaster sampling adalah suatu metode pengambilan sampel dimana masing-masing unit
sampelnya merupakan kumpulan dari eleman yang tidak tumpang tindih yang disebut
sebagai klaster. Berkaitan dengan ini:
a. Jelaskan alasan perlunya penerapan dari klaster sampling, lengkapi jawaban anda
dengan keuntungan dan kelemahannya.!
∑𝑁 𝑀 ̅ 2
𝑖=1 ∑𝑗=1(𝑦𝑖𝑗 −𝑌)
b. Jika 𝑆 2 = 𝑁𝑀−1
𝑀(𝑁−1)𝑆𝑏2 +𝑁(𝑀−1)𝑆𝑤 2
Buktikan bahwa 𝑆 2 =
𝑁𝑀−1
Jumlah rumah
Jumla Jumlah rumah tangga yang
Jumla h BS tangga di memiliki unit
strata Pendapatan rumah tangga per bulan (juta rupiah)
h BS Samp masing-masing usaha online di
el BS terpilih masing-masing
BS terpilih
120 6 0,5 1,2 3,1 0,8 4,2 2,5
Desa 64 3 105 8 1,3 0,6 1,8 3,4 3,8 2,3 4,4 1,7
115 4 3,6 4,1 0,9 2,6
176
180 12 1,1 2,9 3,6 5,2 8,4 4,2 1,9 2,4 3,7 4,6 4,9 6,5
Kota 46 2
210 16 1,3 1,9 2,6 7,4 4,4 5,8 6,3 6,6 5,4 4,9 6,9 8,6 4,8 2,7 2,4 5,2
a. Jelaskan apa yang menjadi target populasi, unit sampling, unit analisis dan unit
observasi serta auxiliary variable-nya!
b. Masalah apa yang mungkin terjadi dalam mendapatkan unit observasinya?
c. Perkirakan dalam sebuah interval keyakinan 95 persen beserta rse-nya untuk rata-
rata besar pendapatan rumah tangga per bulan dari unit usaha rumah tangga berbasis
online di wilayah tersebut!
d. Interpretasikan hasil yang anda peroleh!
177
PEMBAHASAN SOAL UTS GENAP TAHUN 2020/2021
METODE PENARIKAN CONTOH II
1.
a. PPS merupakan Teknik sampling sekaligus Teknik estimasi dengan menggunakan ukuran dari
auxiliary variabel sebagai bahan dasar pertimbangan peluang suatu unit analisis yang akan
terpilih. Sedangkan Generalizes estimator merupakan metode estimasi bukan metode sampling.
Metode ini menggunakan pendekatan hubungan linier dari variabel amatan (Y) dengan variabel
auxiliary (X) dengan menentukan estimator konstanta k dari populasi dengan k berdasarkan
garis yang terbentuk oleh sampel amatan dan pasangan auxiliary variabelnya.
Perbedaan:
- PPS merupakan salah satu teknik sampling, sedangkan Generalized bukan.
- PPS hubungan antarvariabel tidak harus linier, sedangkan pada Generalized hubungan
antarvariabel lebih baik jika linier.
Persamaan:
𝑦̅
𝐶𝑜𝑣(𝑅̂ , 𝑥̅ ) = 𝐸(𝑅̂ 𝑥̅ ) − 𝐸(𝑅̂ )𝐸(𝑥̅ ) dimana 𝑅̂ =
𝑥̅
𝑦̅
𝐶𝑜𝑣(𝑅̂ , 𝑥̅ ) = 𝐸 ( . 𝑥̅ ) − 𝐸(𝑅̂ )𝐸(𝑥̅ )
𝑥̅
𝐶𝑜𝑣(𝑅̂ , 𝑥̅ ) = 𝐸(𝑦̅) − 𝐸(𝑅̂ )𝑥̅
𝐶𝑜𝑣(𝑅̂ , 𝑥̅ )
= 𝑅̂ − 𝐸(𝑅̂ )
𝑋̅
𝐶𝑜𝑣(𝑅̂ , 𝑥̅ )
= −𝐵𝑖𝑎𝑠(𝑅̂ )
𝑋̅
c. Penduga ratio tidak lebih baik dari penduga regresi. Hal ini berdasarkan sifat dari penduga
regresi yang meminimumkan kuadrat error. Selain itu, jika kita bandingkan formula varians
antara penduga ratio dan penduga regresi akan diperoleh hasil akhir sebagai berikut:
𝑣(𝑦̅𝑙𝑟 ) (1 − 𝜌2 )
=
𝑣(𝑦̅𝑅 ) 𝐶
(𝜌 − 𝐶𝑥 ) + (1 − 𝜌2 )
𝑦
178
Penduga regresi akan mempunyai efisiensi yang sama dengan penduga ratio hanya jika 𝑏 = 𝑅̂
𝐶
atau 𝜌 = 𝐶𝑥 . Akan tetapi, jika 𝜌 berbeda dari 𝐶𝑥 ⁄𝐶𝑦 maka efisiensi akan kurang dari 1 atau bisa
𝑦
dipastikan bahwa penduga regresi memiliki presisi yang lebih tinggi (lebih efisien) daripada
penduga ratio.
Survei jumlah panen buah menggunakan difference estimator dengan penentuan variabel yang
sama (penduga regresi) namun unit Y yang berbeda. Perbedaan unit tersebut akan menghasilkan
perbedaan populasi keduanya.
2. Diketahui:
n = 15 X = 140968
N = 115 𝑋̅ = 1225,809
𝑣(𝑦̅𝑅 ) = (0,058)(150,437)
179
Estimasi rata-rata:
𝑣(𝑦̅𝑅 ) = 8,720984
𝑆𝑒(𝑦̅𝑅 ) = √𝑣(𝑦̅𝑅 ) = 2,9531
𝑆𝑒(𝑦̅𝑅 ) 2,9531
𝑅𝑆𝐸 = 𝑥 100% = 𝑥 100% = 0,2419%
𝑦̅𝑅 1220,72
Dengan tingkat keyakinan 95% dapat disimpulkan bahwa rata-rata jumlah sapi tiap desa saat ini
mencapai 1221 ekor dengan simpangan sebesar 3 ekor.
Estimasi total:
𝑣(𝑦̂𝑅 ) = 𝑁 2 𝑣(𝑦̂𝑅 ) = 1152 (8,720984) = 115335
𝑆𝑒(𝑦̂𝑅 ) = √𝑣(𝑦̂𝑅 ) = 339,6101
𝑆𝑒(𝑦̂𝑅 ) 339,6101
𝑅𝑆𝐸 = 𝑥 100% = 𝑥 100% = 0,2419%
𝑦̂𝑅 140382,8
Dengan tingkat keyakinan 95% dapat disimpulkan bahwa total jumlah sapi tiap desa saat ini
mencapai 140.383 ekor dengan simpangan sebesar 340 ekor.
Dari ketiga estimasi varians di atas, diperoleh bahwa 𝑣(𝑦̅𝑙𝑟 ) < 𝑣(𝑦̅𝑅 ) < 𝑣(𝑦̅𝑆𝑅𝑆 ). Hal tersebut
menunjukkan bahwa estimator yang paling tinggi presisinya adalah penduga regresi. Sedangkan
penduga SRS memiliki presisi yang paling rendah. Maka disarankan untuk dapat menggunakan
180
penduga regresi karena variansnya minimum dibandingkan metode ratio maupun SRS, dan
memiliki presisi paling tinggi.
3.
a. Cluster sampling memprioritaskan kemuahan pelaksanaan dan efisiensi sumber daya baik dari
segi biaya operasional, tenaga, maupun waktu. Dalam praktiknya, kita memiliki sumber daya
yang terbatas untuk melakukan suatu penelitian. Bahkan saat cakupan pengamatan merupakan
wilayah cakupan yang luas seperti negara, provinsi, atau kabupaten/kota. Maka dari itu, metode
cluster sampling memiliki beberapa keuntungan dan kerugian apabila diterapkan.
Keuntungan:
- Pelaksanaan cenderung mudah,
- Menghemat biaya operasional, dan
- Pengumpulan data cenderung hanya di suatu wilayah tepilih saja.
Kerugian:
𝑆 2 = 𝑆𝑏 2 + 𝑆𝑤 2
∑ ∑(𝑦̅𝑖 − 𝑦̿)2 ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. )2
𝑆2 = +
𝑁−1 𝑁(𝑚 − 1)
𝑀(𝑁 − 1)𝑆𝑏 + 𝑁(𝑀 − 1)𝑆𝑤 2
2
𝑆2 =
𝑁𝑀 − 1
c. ρ (intracluster correlation coefficient) merupakan ukuran dan tingkat hubungan atau korelasi
antar amatan di dalam cluster. Saat ρ tinggi atau mendekati +1 maka variasi elemen dalam cluster
tersebut cenderung homogen. Namun, saat ρ rendah atau mendekati -1 maka variasi elemen
dalam cluster tersebut cenderung heterogen.
𝑀 𝑆𝑆𝑊 𝑆𝑆𝑊
𝜌 =1−( . ) dengan 0 ≤ ≤1
𝑀 − 1 𝑆𝑆𝑇 𝑆𝑆𝑇
1
Maka − 𝑀−1 ≤ 𝜌 ≤ 1.
Ingat bahwa 𝑆 2 = 𝑆𝑏2 + 𝑆𝑤 2 , dengan nilai varians estimator cluster sampling bergantung pada
𝑆𝑏 2.
181
- 𝑆𝑏 2 = 0, yang artinya cluster sampling akan efisien sempurna.
2) Jika homogen sempurna, maka
- 𝜌=1
𝑆𝑆𝑊
- 𝑆𝑆𝑇
= 0 atau SSW = 0 atau 𝑆𝑤 2 = 0 sehingga 𝑆 2 = 𝑆𝑏2 + 0
- 𝑆𝑏 = 𝑆 2, yang artinya cluster sampling tidak efisien.
2
4.
a. Target populasi : Rumah tangga yang memiliki bisnis basis online di suatu wilayah
Unit sampling : Blok sensus yang ada di wilayah tersebut
Unit analisis : Rumah tangga yang memiliki bisnis online di wilayah tersebut
Unit observasi : Kepala rumah tangga atau pelaku bisnis rumah tangga tersebut
Auxiliary variabel : Jumlah rumah tangga di masing-masing blok sensus, jumlah rumah
tangga dengan bisnis berbasis online di masing-masing blok sensus.
Strata nh Nh 𝑍̿ℎ ̅ℎ
𝑀
Desa 3 64 2.5159 6
Kota 2 46 4.8349 14
182
̅ℎ . 𝑁ℎ. 𝑍ℎ̿
∑𝑀
𝑍̿𝑠𝑡 =
∑𝑀̅ℎ . 𝑁ℎ
𝑍̿𝑠𝑡 = 3,9687
̿ )
𝑆𝑒(𝑍𝑠𝑡 0,65684
𝑅𝑠𝑒 = 𝑥100% = 𝑥100% = 16,55%
̿
𝑍𝑠𝑡 3,9687
Confident Interval:
d. Dengan tingkat keyakinan 95% dapat disimpulkan bahwa rata-rata pendapatan rumah tangga
yang memiliki bisnis berbasis online tiap bulannya mencapai 2,68 juta hingga 5,26 juta dengan
relative standar error sebesar 16,55%.
183
PENDAHULUAN MSDM-AP
185
Mendorong bawahan agar secara sukarela mengerjakan yang diperintahkan,
menciptakan suasana agar timbul inspirasi, semangat yang besar dalam melakukan
tugas, serta mendorong kreativitas anak buah untuk makin mampu bekerja.
9. Controling
Mengadakan penilaian dan evaluasi dan sekaligus mengadakan koreksi agar bawahan
dapat melakukan dengan benar. Dilaksanakan dengan melakukan pemeriksaan hasil,
pencocokan dengan standar/aturan.
10. Reporting
Menyampaikan perkembangan pelaksanaan pekerjaan, menyampaikan laporan hasil
pekerjaan, memberikan evaluasi tentang hasil pekerjaan dan usulan
penyempurnaannya di masa yang akan datang.
186
❖ Fungsi-Fungsi MSDM :
1. Perencanaan (Analisis pekerjaan, analisis masa depan ekonomi umum/perusahaan)
2. Pengadaan (Penarikan dan seleksi)
3. Pengarahan dan Pengorganisasian
4. Pengembangan (Penilaian prestasi, bimbingan, disiplin, latihan, perluasan karir)
5. Kompensasi (Evaluasi pekerjaan, pengupahan, insentif)
6. Pengendalian
7. Pengintegrasian
8. Pemeliharaan (Perburuhan, pelayanan karyawan, keamanan/Kesehatan)
9. Pemberhentian
10.Kedisiplinan
PENGADAAN KARYAWAN
187
❖ Pengadaan “karyawan” merupakan masalah penting, sulit dan kompleks karena untuk
mendapatkan dan menempatkan orang yang tepat tidak semudah “mesin”
❖ Dasar pengadaan : Analisis pekerjaan, Uraian Pekerjaan, Spesifikasi Pekerjaan, Syarat
Pekerjaan, Evaluasi Pekerjaan, Pemerkayaan Pekerjaan, dan Perluaan Pekerjaan.
188
❖ Persyaratan pekerjaan adalah hal-hal yang terkait dengan berbagai ketentuan tentang
ketrampilan yang dikehendaki untuk suatu pekerjaan. Misal, untuk pekerjaan pencacah
survei konsumsi syaratnya: mahasiswi atau ibu rumahtangga, penduduk setempat
(kelurahan), ijazah minimal SLA (SMU/SMK), teliti, jujur, dll.
D. PERAMALAN KEBUTUHAN
❖ Dari “struktur organisasi” dan “beban kerja” (masa kini dan yad) perlu dilakukan peramalan
kebutuhan pekerja (hindari kekosongan jabatan)
❖ Dapat dihitung dengan memperhatikan jumlah produksi, ramalan usaha, perluasan
perusahaan, perencanaan karier pegawai (faktor2 internal), serta perkembangan teknologi,
tingkat permintaan dan penawaran tenaga kerja (eksternal).
E. PRINSIP REKRUITMEN
❖ Rekruitmen adalah serangkaian kegiatan yang dimulai dari ketika perusahaan/ organisasi
membutuhkan tenaga kerja dan membuka lowongan sampai dengan mendapatkan sejumlah
calon karyawan yang diinginkan.
❖ Tujuan nya adalah untuk menerima pelamar sebanyak-banyaknya sesuai dengan kualifikasi
kebutuhan dari berbagai sumber, sehingga memungkinkan akan terjaring calon karyawan
dengan kualitas tertinggi dan terbaik
❖ Prinsip Rekruitmen :
1. Mutu karyawan yang direkrut sesuai dengan kebutuhan (analisis pekerjaan)
2. Jumlah karyawan sesuai dengan pekerjaan yang tersedia
3. Biaya diminimalkan
4. Perencanaan strategis (Renstra) SDM
5. Fleksibilitas
6. Pertimbangan Hukum
❖ E-Recruitment (Seperti yang dilakukan saat tes CPNS)
1. On-line, berbasis teknologi web/android
2. Melalui platform internal atau agen
3. Jangkauan lebih luas
4. Hemat biaya dan tenga (efisien)
5. Proses lebih singkat dan cepat
6. Mudah dan praktis
7. Lebih baik hasilnya
F. SELEKSI
❖ Seleksi adalah kegiatan memilih karyawan yang paling tepat (dalam arti qualified, kompeten,
dan kuantitas) yang akan menjabat dan mengerjakan tugas perusahaan.
❖ Harus memperhatikan peraturan pemerintah, misalnya tak boleh mempekerjakan anak-
anak, melarang pekerja wanita bekerja malam hari, dsb, Petugas seleksi harus jujur dan
objektif.
❖ Seleksi sangat bergantung pada ketepatan dalam penetapan analisis jabatan/pekerjaan
❖ Kualifikasi Seleksi mencakup umur, jenis kelamin, keahlian, pengalaman pendidikan, bakat,
kerjasama, tanggung jawab, interest, disiplin, inisiatif dan kreatif, fisik, kesehatan,
temperamen, kejujuran dsb.
❖ Sistem/pendekatan seleksi :
189
➢ Succesive-Hurdles Selection Approach
Setiap calon karyawan harus mengikuti semua prosedur seleksi secara bertahap. Jika
pelamar gagal di suatu test, tidak boleh lanjut ke tahap berikut (gugur).
➢ Compensatory Selection Approach
Setiap calon karyawan berkesempatan ikut semua prosedur seleksi. Nilai akumulasi
harus diatas batas lulus
❖ Metode Seleksi :
1. Surat lamaran, keterangan, dan formulir isian
2. Penelitian
3. Tes ketrampilan dan pengetahuan
4. Tes Kesehatan
5. Tes Psikologi
6. Wawancara
❖ Konsep Dasar Seleksi :
1. Validitas
Bahwa yang diujikan harus relevan dengan pekerjaan yang ditawarkan, mereka yang
lulus tes harus bekerja bagus atau sebaliknya.
2. Reliabilitas
Bahan tes harus menunjukkan konsistensi bila dilakukan terhadap orang tertentu (bila
dilakukan uji dua kali tidak konsisten bahan belum baik).
G. KENDALA REKRUITMEN
❖ Kebijakan Organisasi
Kebijaksanaan kompensasi dan kesejahteraan (bila terbatas susah mencari tenaga yang
baik), Kebijaksanaan promosi (bila sulit promosi, juga susah mencari tenaga yang baik),
Kebijaksanaan status karyawan (apabila mudah menjadi tenaga tetap, menjadi menarik
(jangan sudah bertahun-tahun tetap honorer)), Kebijaksanaan sumber tenaga kerja (apabila
membatasi tenaga lokal (putra daerah) susah mendapatkan yang terbaik)
❖ Persyaratan jabatan, semakin banyak persyaratan semakin sedikit pelamar
❖ Metode pelaksanaan, bila terbuka banyak yang melamar
❖ Kondisi pasar tenaga kerja, semakin besar penawaran semakin banyak yang baik, sebaliknya
semakin sedikit makin terbatas.
❖ Soliditas perusahaan, semakin solid perusahaan tersebut makin banyak pelamar dan
harapan mendapat yang baik makin besar
❖ Kondisi lingkungan eksternal, semakin ekonomi bertumbuh semakin sedikit pelamar, tetapi
pada saat resesi banyak pelamar.
❖ Penempatan Karyawan
Merupakan tindak lanjut dari seleksi, penempatan karyawan agar dapat mulai bertugas
sesuai jabatan. Harus sesuai job description dan job specification
❖ Orientasi Karyawan
Perkenalan karyawan sebagai pernyataan betul2 diterima agar bisa bekerjasama dengan
karyawan lain.
❖ Induksi Karyawan
Mengubah perilaku karyawan baru dan sesuaikan dengan tata tertib.
190
PENILAIAN PRESTASI KERJA (PPK) DAN KOMPENSASI
❖ Yang dinilai adalah perilaku dan prestasi kerja karyawan seperti kesetiaan/loyalitas, prestasi,
tanggung jawab, ketaatan, kejujuran, kerjasama, prakarsa, dan kepemimpinan
➢ Meningkatkan kepuasan karyawan, karena kita akan memberikan pengakuan atas hasil
kerjanya
➢ Harus jujur, objektif, dan mempunyai pengetahuan mendalam tentang unsur yang dinilai
191
➢ Tahu uraian pekerjaan karyawan yang akan dinilai
❖ Ukuran kinerja :
➢ Reliabel, konsisten
❖ Metode Penilaian :
Check list, penilai memberikan masukan informasi berdasarkan kriteria yang ada,
kemudian dihitung bobot nilai dan dipakai sebagai hasil rating.
➢ Modern, a.l. assesment centre, Management by objective dan human asset accounting
Human Asset Accounting – faktor pekerja dinilai sebagai individu modal jangka
panjang, sehingga sumber tenaga kerja dinilai dgn cara membandingkan thd
192
variabel2 yg dpt mempengaruhi keberhasilan perusahaan. Jika biaya tenaga kerja
meningkat dan mengakibatkan laba meningkat maka peningkatan tenaga kerja
disebut berhasil.
❖ Kendala Penilaian
➢ Kendala hukum/legal
Harus bebas dari diskriminasi. Jangan membedakan jenis kelamin, ras, bangsa, atau
diskriminasi umur dalam pemutusan hubungan kerja, promosi dsb. Penilaian yang
diskriminatif dapat mengakibatkan penuntutan perkara.
➢ Hallo Effect
Kecenderungan memberi nilai baik kepada yang dikenalnya saja. Beberapa sifat baik
mengakibatkan umumnya nilai baik. Satu atau beberapa nilai jelek ikut menarik ke nilai
jelek ➔ Indeks prestasi karyawan tidak nyata.
Ketentuan lebih lanjut mengenai penilaian kinerja diatur dengan Peraturan Pemerintah.
Ketentuan lebih lanjut mengenai penilaian kinerja PNS dan disiplin PNS diatur dengan
Peraturan Pemerintah.
➢ Manajemen Talenta → Kinerja pegawai harus menjadi salah satu dasar penempatan
talent pool
193
➢ Penghargaan → pemberian penghargaan berdasarkan pada penilaian kinerja yang
objektif dan transparan.
➢ Sanksi → penilaian kinerja PNS yang tidak mencapai target kinerja dikenakan sanksi
administrasi sampai dengan pemberhentian
❖ Pengadaan efektif; Kompensasi yang besar → pekerja yang qualified lebih mudah didapat.
❖ Stabilitas karyawan. Bila kompensasi adil dan wajar, maka turnover rendah
❖ Pengaruh serikat buruh. Bila kompensasi memadai dan adil, maka pengaruh serikat buruh
menjadi kecil, dan karyawan dapat berkonsentrasi ke pekerjaan.
➢ Adil , yang disesuaikan dengan jenis pekerjaan, resiko pekerjaan, tanggung jawab, jabatan
dsb.
❖ Metode Kompensasi
➢ Metode Jamak (Memperhatikan banyak faktor seperti ijazah, sifat pekerjaan, pendidikan
informal, dan jumlah keluarga)
❖ Sistem Kompensasi terdiri atas Sistem Waktu, Sistem Hasil, Sistem Borongan
194
F. KOMPENSASI PNS
❖ Gaji Pokok, yang dibedakan dengan pangkat (Golongan I/a-IV/e) dan lama dalam pangkat
tersebut
❖ Tunjangan Umum, yang terdiri dari Tunjangan keluarga, tunjangan jabatan, tunjangan pajak,
dan tunjangan lainnya (sekarang ada Tunjangan Kinerja/Remunerasi)
❖ Potongan-potongan
❖ Tunjangan keluarga terdiri dari tunjangan isteri atau suami (10 persen gaji pokok) dan
tunjangan anak (2 persen gaji pokok per anak sebanyak-banyaknya 2 orang)
❖ Tunjangan jabatan struktural (eselon IV s/d I) dan tunjangan jabatan fungsional (dosen,
peneliti, dll)
❖ Tunjangan lainnya termasuk tunjangan pangan (sebesar 10 kg per kepala dlm bentuk
nominal uang) dan tunjangan khusus.
❖ Tunjangan Kinerja: Untuk BPS berdasar Perpres Nomor 99 Tahun 2018 (juga 19 instansi lain,
dengan nomor lain)
A. PERENCANAAN KARIR
❖ PERENCANAAN KARIR adalah suatu perencanaan tentang kemungkinan-kemungkinan
seseorang anggota organisasi sebagai perorangan untuk dapat meniti proses kenaikan
pangkat dan jabatan sesuai dengan persyaratan dan kemampuannya.
195
❖ Memenuhi kebutuhan-kebutuhan organisasi akan sumber daya manusia di masa yang akan
datang.
❖ Memenuhi kebutuhan-kebutuhan organisasi akan sumber daya manusia di masa yang akan
datang.
❖ Mengembangkan pegawai yang dapat dipromosikan
❖ Menyediakan fasilitas bagi penempatan internasional, organisasi global menggunakan
perencanaan karir untuk membantu mengidentifikasikan dan mempersiapkan penempatan
di luar negeri.
❖ Membantu menciptakan keanekaragaman angkatan kerja.
❖ Membuka jalan bagi karyawan yang potensial, perencanaan karir memberikan keberanian
kepada karyawan untuk melangkah maju kemampuan potensial mereka karena mereka
mempunyai tujuan karir yang spesifik, tidak hanya mempersiapkan pekerja untuk lowongan
di masa depan.
C. PENGERTIAN MUTASI
❖ Mutasi adalah Suatu perubahan posisi/jabatan/pekerjaan yang dilakukan secara horisontal
maupun vertikal atau diagonal dalam suatu organisasi.
❖ Masuk dalam “Fungsi pengembangan karyawan” karena tujuannya untuk meningkatkan
efisiensi dan efektivitas dalam perusahaan tersebut.
D. TUJUAN MUTASI
❖ Meningkatkan produktivitas kerja
❖ Menciptakan keseimbangan antara tenaga kerja dan komposisi pekerjaan atau jabatan
❖ Memperluas atau menambah pengetahuan karyawan
❖ Menghilangkan kebosanan/kerutinan
❖ Mengatasi perselisihan karyawan
❖ Perangsang untuk berkarir lebih tinggi
❖ Hukuman atas pelanggaran karyawan
❖ Pengakuan atau imbalan atas prestasi
❖ Mendorong spirit kerja melalui persaingan terbuka
❖ Tindakan pengamanan
❖ Penyesuaian pekerjaan terhadap fisik karyawan
196
G. SEBAB MUTASI
❖ Atas Permintaan sendiri, alasan keluarga, kesehatan, suasana kerja (bisa tak dapat uang
pindah dan belum tentu jabatan sama)
❖ Alih tugas produktif (ATP), karena kehendak pimpinan perusahaan atas penilaian kerja
karyawan (biasanya vertikal:promosi/demosi)
197
J. PENEMPATAN DAN MUTASI DI BPS
❖ Peraturan Kepala (Perka) BPS Nomor 6/2013 tentang Pola Penempatan dan Pemindahan
Pegawai di Lingkungan BPS
❖ Isi dari Perka diatas yakni : Penempatan Calon Pegawai, Penempatan Pegawai (Setelah TB,
Setelah Kembali dari Instansi lain, Setelah Cuti LTN, dan Penempatan KSK), dan Pemindahan
Pegawai (karena nikah, antar wilayah kerja, struktural eselon IV dan III, antar instansi).
198
loyalitas, kreativitas diri, mempertinggi tanggung jawab terhadap tugas,
meningkatkan kesejahteraan karyawan, dan meningkatkan efisiensi alat dan bahan.
• Azas Motivasi
➢ Azas mengikuti sertakan (Manajer mengajak bawahan berpartisipasi dan
memberikan kesempatan untuk dapat mengajukan ide-ide).
➢ Azas komunikasi (Manajer menginformasikan secara jelas tujuan yang akan
dicapai, cara mengerjakannya dan kendala yang dihadapi).
➢ Azas pengakuan (Memberikan penghargaan dan pengakuan yang tepat serta
wajar kepada bawahan atas prestasi kerja mereka).
➢ Azas wewenang yang didelegasikan (Memberikan kesempatan kepada bawahan
memegang sebagian tanggung jawab).
➢ Azas perhatian timbal balik (Memotivasi bawahan dengan memberikan bonus
kenaikan gaji jika pekerjaan yang dilakukan mencapai target).
3. Kepemimpinan
• Cara seorang pemimpin untuk meme-ngaruhi perilaku bawahan, agar mau
bekerjasama dan bekerja secara produktif untuk mencapai tujuan organisasi.
• Gaya Kepemimpinan
➢ Otoriter
Kewenangan mutlak tetap ditangannya (sentralisasi wewenang). Pengambilan
keputusan ditetapkan sendiri, bawahan tidak diikutsertakan untuk saran, ide,
pertimbangan.
➢ Partisipasif
Melakukan secara persuasif, menciptakan kerjasama yang serasi, menumbuhkan
loyalitas dan partisipasi bawahannya.
➢ Delegatif
Mendelegasikan wewenang lebih banyak, bawahan dapat mengambil keputusan
dan kebijakan. Pemimpin hanya bersifat pengawasan meskipun kadang-kadang
perlu mengarahkan. Makin besar perusahaan makin “delegatif”
➢ Situasional
(Paul Hersey dan Kenneth H. Blanchard) ➔ tidak ada satupun cara yang terbaik
untuk memengaruhi orang lain. Sangat tergantung pada orang yang akan
dipengaruhi.
• Tipe Kepemimpinan menurut P.Siagian : Otokratis, Militeristis, Paternalistis,
Karismatis, Demokratis.
4. Kesepakatan Kerja Bersama (KKB)
• Diharapkan telah ada negosiasi/musyawarah dan persetujuan/mufakat antara
kelompok karyawan dan perusahaan.
• Problem KKB adalah seringnya serikat karyawan menjadi alat perusahaan bukan alat
karyawan.
5. Collective Bargaining
• Merupakan perundingan antara pimpinan perusahaan dengan pimpinan serikat
buruh dengan memperhatikan masing-masing kepentingan.
• Biasanya adu kuat argumentasi antara kedua pihak
199
B. PENGERTIAN, TUJUAN, DAN AZAS PEMELIHARAAN
❖ Pemeliharaan adalah Usaha untuk mempertahankan kondisi fisik, mental, dan sikap karyawan
agar mereka tetap loyal dan bekerja produktif untuk tercapainya tujuan perusahaan.
❖ Tujuan dari adanya pemeliharaan diantaranya Mempertahankan dan meningkatkan
produktivitas kerja karyawan, Meningkatkan disiplin dan menurunkan absensi, Meningkatkan
loyalitas dan menurunkan turn over, Memberikan ketenangan, keamanan dan kesehatan
karyawan, Meningkatkan kesejahteraan karyawan dan keluarganya, Memperbaiki kondisi
fisik, mental dan sikap karyawan, Mengurangi konflik serta manciptakan suasana yang
harmonis, Mengefektifkan pengadaan karyawan.
❖ Azas Pemeliharaan : Azas manfaat dan efisiensi, Azas kebutuhan dan kepuasan, Azas keadilan
dan kelayakan, Azas Peraturan (Legal), Azas kemampuan perusahaan.
C. METODE PEMELIHARAAN
❖ Komunikasi
➢ Komunikasi harus digunakan setiap penyampaian informasi (instruktif, informatif,
influencing, atau evaluatif) dari komunikator kepada komunikan.
➢ Dengan komunikasi yang baik dapat diselesaikan problem-problem yang terjadi dalam
perusahaan.
➢ Manajemen terbuka mendukung terciptanya keamanan, kesehatan, loyalitas para
karyawan. Konflik diselesaikan secara musawarah dan mufakat.
❖ Insentif
➢ Daya perangsang yang diberikan kepada karyawan tertentu berdasarkan prestasi
kerjanya agar karyawan terdorong meningkatkan produktivitas kerjanya, Manajer yang
efektif menciptakan pemeliharaan karyawan dengan menerapkan metode insentif yang
tepat
➢ Jenis2 insentif: positif (reward) dan negatif (punishment), Bentuk2 insentif: nonmaterial,
sosial, material.
❖ Program Kesejahteraan
➢ Program kesejahteraan ditujukan agar karyawan mau bekerja keras sampai mereka
pension.
➢ Kesejahteraan diharapkan dapat memenuhi kebutuhan fisik dan mental karyawan
beserta keluarganya.
➢ Program harus disusun berdasarkan peraturan legal, keadilan, dan kelayakan
❖ Keselamatan dan Kesehatan Kerja
➢ Keselamatan dan Kesehatan Kerja (KKK) akan menciptakan terwujudnya pemeliharaan
karyawan yang baik. KKK harus ditanamkan pada individu karyawan dengan penyuluhan
dan pembinaan yang baik agar mereka menyadari keselamatan kerja dirinya, yang jika
tidak maka akan dapat ikut merugikan perusahaan.
❖ Hubungan Industrial Pancasila
➢ Hubungan antara para pelaku dalam proses produksi barang dan jasa didasarkan nilai2
Pancasila. Hubungan ini harus mengakui dan meyakini sebagai pengabdian manusia
kepada Tuhan YME dan sesama manusia (Ke-Tuhan-an YME).
➢ Perusahaan tidak boleh menganggap buruh sekadar faktor produksi tetapi sebagai
manusia pribadi dengan harkat dan martabatnya (Kemanusiaan)
➢ Tidak membedakan golongan, perbedaan keyakinan, politik, paham, aliran, agama, suku
maupun kelamin untuk menjalin persatuan dan kesatuan (Persatuan Indonesia)
200
➢ Berdasarkan prinsip musyawarah untuk mencapai mufakat, berusaha menghi-langkan
perbedaan, mencari persamaan ke arah persetujuan buruh dan pengusaha (Kerakyatan –
Musyawarah – Mufakat)
➢ Mendorong kearah keadilan sosial, hasilnya dinikmati bersama antara karyawan dan
pengusaha
A. DISIPLIN
1. Pengertian
Disiplin adalah kesadaran dan kesediaan seseorang menaati semua peraturan
perusahaan/organisasi dan norma-norma yang berlaku. Kesadaran adalah sikap
seseorang yang secara sukarela menaati peraturan, dan kesediaan adalah suatu kemauan
melaksanakan ketetapan.
2. Pentingya Disiplin :
• Agar karyawan datang dan pulang dengan tepat waktu
• Agar karyawan dapat mengerjakan pekerjaan dengan baik
201
• Agar setiap karyawan dapat mematuhi semua peraturan perusahaan/organisasi dan
norma-norma yang ditetapkan oleh perusahaan/organisasi tersebut untuk mencapai
tujuan.
• Peraturan diperlukan untuk memberikan bimbingan dan penyuluhan bagi karyawan
dalam menciptakan tata tertib yang baik di perusahaan/organisasi
• Dengan tata tertib karyawan yang baik, maka semangat kerja, moral kerja, efisiensi,
dan efektivitas kerja karyawan akan meningkat.
3. Indikator Disiplin :
• Tujuan dan kemampuan, yang akan dicapai harus jelas dan cukup menantang bagi
kemampuan karyawan. Beban yang diberikan kepada karyawan harus sesuai dengan
kemampuan agar ybs dapat bekerja sungguh-sungguh dan disiplin untuk
mengerjakannya. Bila over burden disiplin dapat rendah.
• Teladan pimpinan, akan sangat menentukan disiplin karyawan. Pimpinan harus
memberi contoh yang baik, jujur, adil, serta sesuai kata dengan perbuatan, mengingat
masyarakat kita yang menganut paternalistik. Bila pimpinan tidak disiplin, jangan
harap anak buah disiplin.
• Balas jasa, memengaruhi disiplin karyawan, karena balas jasa akan memberikan
kepuasan dan kecintaan karyawan thdp perusahaan/ pekerjaannya. Jika
kecintaannya semakin baik, disiplin semakin baik pula. Semakin besar balas jasa,
semakin takut orang kehilangan pekerjaannya.
• Keadilan, ikut mendorong terwujudnya kedisiplinan karyawan, karena ego dan sifat
manusia yang selalu merasa dirinya penting dan minta diperlakukan sama dengan
lainnya. Keadilan dalam pemberian balas jasa dan hukuman akan merangsang
terciptanya kedisiplinan.
• Waskat, adalah tindakan nyata dan paling efektif dalam mewujudkan kedisiplinan.
Atasan harus aktif mengawasi perilaku, moral, sikap, gairah kerja, dan prestasi kerja
bawah-annya. Pimpinan harus selalu ada untuk mengawasi dan memberikan
petunjuk bila diperlukan bawahannya.
• Sanksi Hukuman, dengan sanksi hukuman yang semakin berat, karyawan akan takut
melanggar peraturan. Sanksi harus disesuaikan dengan pertimbangan logis, masuk
akal dan diinformasikan kepada karyawan. Usahakan tidak terlalu ringan dan tidak
terlalu berat, supaya tetap mendidik.
• Ketegasan, harus berani secara tegas menghukum setiap karyawan yang indisipliner
sesuai dengan sanksi hukuman yang telah ditetapkan, tanpa pandang bulu, adil dan
tidak membeda-kan. Pimpinan yang “lemah” jangan membuat peraturan, yang akan
menyusahkan dirinya.
• Hubungan kemanusiaan, bila harmonis sesama karyawan ikut membuat kedisiplinan
yang baik. Hubungan yang baik harus bersifat vertikal dan horizontal. Manajer harus
membuat hubungan kemanusiaan yang serasi serta mengikat vertikal maupun
horizontal.
4. Bentuk Disiplin Kerja :
• Disiplin Preventif, kegiatan yang dilaksanakan untuk mendorong agar karyawan
mengikuti berbagai standar dan aturan sehingga penyelewengan dapat dicegah,
Manajemen bertanggung jawab menciptakan iklim disiplin preventif dimana berbagai
standar harus diketahui/dipahami para karyawan.
202
• Disiplin Korektif, Kegiatan diambil untuk menangani pelanggaran terhadap
standar/aturan dan mencoba menghindari pelanggaran lebih lanjut. Sering berupa
hukuman dan disebut tindakan pendisiplinan → peringatan atau skorsing
• Disiplin Perspektif, bersifat retributive (mengkukum orang yang bersalah), berusaha
melindungi hak dasar individu, dan bersifat utilitarian (berfokus pada penggunaan
disiplin hanya pada saat konsekuensi Tindakan disiplin melebihi dampak negatifnya.
5. Pendekatan Disiplin :
• Aturan tungku panas (Hot stove role) dan Tindakan disiplin progresif (Progresive
Discipline) → terfokus pada perilaku masa lalu
• Tindakan Positif (Positif Discipline) → pendekatan untuk masa yang akan datang,
diusahakan tidak akan timbul lagi.
6. PP No.35 Tahun 2010 Tentang Disiplin PNS
• Mengatur tentang disiplin pegawai negeri sipil (PNS)
• Menetapkan kewajiban dan larangan, hukuman disiplin (pelanggaran, tingkat dan
jenis hukuman disiplin, pejabat yang berwenang menghukum, tata cara pemeriksaan,
penjatuhan dan penyampaian keputusan hukuman)
B. PEMBERHENTIAN PEGAWAI
1. Pengertian
Pemberhentian adalah pemutusan hubungan kerja seorang karyawan dengan
suatu organisasi perusahaan, berarti berakhirnya keterikatan kerja karyawan terhadap
perusahaan, pemberhentian ini dapat terjadi karena undang-undang, perusahaan, atau
ulah karyawan sendiri.
2. Alasan Pemberhentian :
• Undang Undang, misal UU No.12 tahun 1964 (KUHP) yang dapat menyebabkan
seorang karyawan harus diberhentikan dari suatu perusahaan karena kriteria
tertentu (seperti karyawan anak-anak, masalah pelanggaran imigrasi, terlibat
organisasi terlarang)
• Keinginan perusahaan, karena karyawan dinilai tak mampu bekerja dengan baik, atau
perilaku yang buruk, amoral, melanggar tata tertib perusahaan, serta tidak dapat
bekerja sama dengan karyawan lain.
• Keinginan karyawan (Atrisi), karena kepentingan / alasan seperti mengurus orang
tua, berwiraswasta, Kesehatan yang kurang baik, tidak ada promosi, melanjutkan
pendidikan, masa depan yang suram.
• Pensiun, Undang-undang menetapkan umur pensiun, karena dianggap mereka tidak
lagi produktif sekitar 55 tahun atau 15 tahun telah bekerja (UU-ASN/2014: usia
pensiun PNS adalah 58 tahun).
• Kontrak Kerja berakhir, Pemberhentian berdasarkan berakhirnya kontrak kerja tidak
membawa konsekuensi, karena telah terlebih dahulu diatur dalam perjanjian saat
mereka diterima.
• Kesehatan Karyawan
• Meninggal Dunia, Karyawan yang meninggal dunia, secara otomatis putus hubungan
dengan perusahaan. Perusahaan memberikan pensiun atau pesangon bagi keluarga
yang ditinggalkan, Bahkan ada perusahaan yang memberikan asuransi.
203
• Perusahaan Di Likuidasi (Ditutup), Bangkrutnya perusahaan harus didasarkan
peraturan perundang-undangan yang berlaku, sedang karyawan yang dilepas
mendapat pesangon sesuai dengan ketentuan.
• Pemberhentian khusus PNS :
o Pelanggaran disiplin berat → Pemberhentian dengan hormat tidak atas
permintaan sendiri atau tidak dengan hormat karena melanggar PP 53 tahun
2010 (Disiplin PNS).
o Pemberhentian sesuai dengan PP Nomor 32 tahun 1979 (Pensiun).
3. Lebih Lanjut tentang PP Nomor 32 tahun 1979 tentang Pensiun
• Pemberhentian atas permintaan sendiri, diberhentikan dengan hormat. Permintaan
dapat ditolak apabila yang bersangkutan masih punya ikatan/kewajiban.
• Pemberhentian karena mencapai batas usia pensiun (dapat diperpanjang untuk
jabatan-jabatan tertentu, misal 60 tahun untuk pejabat eselon I dan II dan 65 tahun
untuk ahli peneliti atau ahli madya, guru besar, lector kepala, lector, dan jabatan lain
yang ditentukan presiden).
• PP ini juga mengatur hak-hak kepegawaian yang diberhentikan dengan hormat, bila
telah mencapai umur sekurang-kurangnya 50 tahun dan memiliki masa kerja lebih
dari 10 tahun dapat diberikan hak pensiun., bila kurang umurnya dapat diberikan
uang tunggu, paling lama 1 tahun dan dapat diperpanjang tiap-tiap kali paling lama 1
tahun.
4. PP No. 10 tahun 1983 junto PP No.45 tahun 1990
• Mengatur tentang izin perkawinan dan perceraian bagi PNS
• PNS yang telah melangsungkan perkawinan wajib mengirimkan laporan perkawinan
secara tertulis kepada pejabat yang berwenang, selambat-lambatnya 1 (satu) tahun
terhitung mulai tanggal perkawinan dilangsungkan.
• PNS yang akan melakukan perceraian, wajib memperoleh izin tertulis lebih dahulu
dari pejabat yang berwenang.
• Apabila perceraian terjadi atas kehendak PNS Pria, maka ia wajib menyerahkan
sebagian gajinya untuk penghidupan bekas istri dan anak-anaknya
5. PP No.37 tahun 2004 (Pengganti PP No.5 tahun 1999)
• Tentang larangan PNS menjadi anggota partai politik
• Dalam ketentuan Pasal 3 Undang-Undang No. 8 Tahun 1974 jo. UU no. 43 Tahun 1999,
bahwa Pegawai Negeri sebagai unsur aparatur negara bertugas memberikan
pelayanan kepada masyarakat secara profesional, jujur, adil dan merata.
• Dalam kedudukan dan tugas tersebut, Pegawai Negeri harus netral dari pengaruh
semua golongan dan partai politik
• Pasal 2 → PNS dilarang menjadi anggota dan/atau pengurus partai politik; PNS yang
menjadi anggota dan/atau pengurus partai politik, diberhentikan sebagai PNS.
• Pasal 3 → PNS yang akan menjadi anggota dan/atau pengurus partai politik, wajib
mengundurkan diri sebagai PNS.
• Pasal 9 → PNS yang menjadi anggota dan/atau pengurus partai politik tanpa
mengundurkan diri, diberhentikan tidak dengan hormat sebagai PNS.
6. PP Nomor 9 Tahun 2003 tentang Pemberhentian
• Pemberhentian sementara dari jabatan negeri (pasal 18) → Presiden menetapkan
pemberhentian sementara dari jabatan negeri bagi PNS Pusat yang menduduki
jabatan struktural eselon I atau jabatan fungsional jenjang utama, Pejabat pembina
204
kepegawaian Pusat menetapkan pemberhentian sementara dari jabatan negeri bagi
PNS di lingkungannya yang menduduki eselon II atau jabatan fungsional setingkat,
Mereka dapat mendelegasikannya kepada pejabat lain bagi pemberhentian PNS
struktural eselon III ke bawah atau fungsional setingkat.
• Pejabat pembina kepegawaian Propinsi menetapkan pemberhentian sementara dari
(a) sekda propinsi (b) eselon II ke bawah, Mereka dapat mendelegasikannya kepada
pejabat lain bagi pemberhentian PNS struktural eselon III ke bawah atau fungsional
setingkat.
• Pejabat pembina kepegawaian Kabupaten/ Kota menetapkan pemberhentian
sementara (a) sekda Kab/Kot (b) jabatan negeri bagi PNS di lingkungannya yang
menduduki eselon II atau jabatan fungsional setingkat, Mereka dapat
mendelegasikannya kepada pejabat lain bagi pemberhentian PNS struktural eselon IV
ke bawah.
• Presiden menetapkan pemberhentian Pegawai Negeri Sipil Pusat yang berpangkat
Pembina Utama (Golongan ruang IV/e), Pembina Utama Madya (Golongan ruang
IV/d) dan Pembina Utama Muda (Golongan ruang IV/c).
A. SIM SDM
1. Pengertian
Sistem Informasi Manajemen (SIM) SDM adalah suatu prosedur sistematik
pengumpulan, pengolahan, penyimpanan, pemeliharaan, perolehan kembali, dan validasi
berbagai data SDM yang dibutuhkan suatu organisasi untuk pengambilan keputusan
(terutama) di bidang/ tentang SDM.
2. Kegunaan
• Sistem Informasi SDM memberikan wahana pengumpulan, peringkasan, dan
penganalisaan data yang berhubungan dengan manajemen SDM dan perencanaan
SDM.
• SIM SDM dirancang untuk membantu para manajer membuat keputusan- keputusan
yang lebih baik.
• Pemenuhan kebutuhan-kebutuhan yang berkaitan dengan fungsi-fungsi SDM seperti:
penilaian suplai SDM, aktivitas-aktivitas rekruitmen,pelatihan & pendidikan,
manajemen karier, dan kompensasi.
3. Komponen Dasar
• Masukan (Input), Mencakup sistem database dan data entry
• Pemeliharaan Data, Berkepentingan dengan kualitas data yang disimpan dalam
sistem
• Keluaran (Output), Berkaitan dengan proses penarikan data (retrieval)
4. Fungsi SIM-SDM
• Fungsi Masukan
➢ Merancangkan informasi yang akan dimasukkan (membuat kuesioner)
➢ Memeriksa kuesioner (editing)
➢ Menyusun Masterfile (agar isian terkontrol)
205
➢ Meng-entry data ke komputer media
➢ Melakukan validasi dan perbaikan
• Fungsi Pemeliharaan
➢ Mengelola kualitas data yang disimpan
➢ Menambah data baru (pegawai baru)
➢ Memutakhirkan data (revisi atas pangkat, golongan, dan pendidikan)
➢ Menghilangkan data yang tak diperlukan (meninggal, berhenti, pensiun)
• Fungsi Keluaran Data
➢ Memproduksi keluaran sesuai dengan kebutuhan organisasi
➢ Laporan standar maupun laporan khusus
➢ Dalam bentuk tayangan maupun dalam bentuk cetakan
➢ Data individu maupun data olahan
➢ Sorting menurut berbagai kriteria
5. Pengembangan SIM-SDM
• Usulan
Menjelaskan mengenai masalah yang dihadapi organisasi dan usulan pemecehan,
pada tahap ini konsep pengembangan diajukan, hingga menyinggung secara umum
analisis biaya dan manfaat serta dampak positifnya ditonjolkan.
• Analisis Kebutuhan
Merinci lebih lanjut dari usulan menjadi sasaran dan spesifikasi pemakai,
menemukan masalah sesungguhnya dan mengembangkan strategi untuk memenuhi
kebutuhan, dan terjadi trade off dalam berbagai alternatif yang ada agar diputuskan
top manajer.
• Spesifikasi Sistem
Merumuskan sistem dari segi pemakai, berbagai fungsi dasar dijelaskan serinci
mungkin untuk menentukan urutan kegiatan pemrosesan, semua ditetapkan mulai
dari produk akhir, fungsi manual yang disyaratkan, tingkat akurasi hingga jangka
waktunya.
• Desain Sistem
Sistem keseluruhan dirinci secara spesifik agar semua fungsi dapat diperiksa dan
semua program dapat disebutkan, perancang sistem kemudian menentukan
bagaimana sistem dapat mencapai sasaran, juga program komputer dibuat dengan
memperhatikan perangkat keras/lunak yang ada.
• Pengembangan Sistem
Program komputer dibuat, semua bagian sistem diuji dengan data yang diberikan
calon pemakai, berbagai program latihan dikembangkan dan dilakukan “dummy test”
maupun data sesungguhnya.
206
operasional lainnya dievaluasi dan dilaporkan kembali pada manajemen, pada tahp
ini modifikasi masih dapat dilakukan.
B. SISTEM PERKANTORAN
1. Pengertian
Sistem Perkantoran adalah Urutan baku operasi dalam suatu kegiatan
perusahaan dan berkenaan dengan bagaimana operasi itu dilaksanakan (metode)
maupun dimana dan bilamana dilaksanakan. Biasanya mencakup sejumlah prosedur dan
dapat meliputi sejumlah metode.
Sistem Informasi Manajemen (SIM) Perkantoran adalah suatu prosedur
sistematik pengumpulan, pengolahan, penyimpanan, pemeliharaan, perolehan kembali
dan validasi berbagai data yang dibutuhkan organisasi tentang kegiatan perkantoran
2. Sistem yang baik :
• Kelancaran pekerjaan dan mencegah kemungkinan kesalahan
• Pengurangan keterlambatan, hambatan
• Pengawasan menjadi baik
• Penghematan biaya dan tenaga
• Koordinasi berjalan mulus
• Kemudahan melatih petugas
3. Azas Perkantoran Yang Baik (Menurut J.C.Denyer)
• Mempunyai arus kerja yang lancar
• Menghindari kekembaran kerja dan warkat
• Pekerjaan mondar-mandir petugas menjadi minimum
• Menghindari tulis menulis yang tak perlu
• Memanfaatkan spesialisasi maksimum
• Menggunakan perbekalan minimum
• Mencegah pencatatan tak perlu
• Pengecualian terhadap peraturan diminimumkan
• Mencegah pengecekan tak perlu
• Manfaatkan mesin-mesin sebaik-baiknya
• Menggunakan azas kesederhanaan
4. Informasi
• Informasi adalah data yang dicatat, digolong-golongkan, disusun, dihubung-
hubungkan, atau ditafsirkan dalam kerangkan tertentu untuk memberitahukan
pengertian.
• Ciri Informasi :
➢ Benar atau salah; berhubungan dengan realitas
➢ Baru, segar bagi penerima
➢ Tambahan ; memperbaharui yang lama
➢ Korektif ; bagi informasi yang salah atau palsu
➢ Penegas ; meningkatkan persepsi penerima atas kebenarannya.
• Fungsi Informasi :
➢ Menggambarkan (describe)
➢ Menjelaskan (to explain)
➢ Memperkirakan (to predict)
➢ Mengevaluasi (to evaluate)
207
➢ Mengadakan Pembaharuan (to innovate)
• Perancangan Sistem Informasi
➢ Tentukan informasi apa yang diperlukan
➢ Buat penggolongan informasi sampai dengan klasifikasi pokok dan pola
klasifikasi
➢ Rumuskan maksud-maksud khusus atau manfaat informasi tersebut
➢ Tentukan pusat/lokasi penting dalam jaringan lalu-lintas informasi
➢ Rencanakan penyusunan pusat data
➢ Tentukan informasi mana yang akan diproses otomatis dan mana yang manual
• Beberapa SIM BPS
➢ Simpeg-Kepegawaian
➢ Simdir-Daftar Inventaris Ruangan
➢ Simbar-Barang yang habis dipakai
➢ Simken-Kendaraan
➢ Simstis
➢ Simtan-tanah
➢ Simruneg-rumah negara
➢ Simkeu-keuangan
➢ Simwas-pengawasan
➢ Simpub-publikasi
➢ Simpudik
208
LATIHAN SOAL
1. Mengapa perusahaan perlu memiliki manajemen sumber daya manusia yang Tangguh didalam
mendukung bisnis nya. Jelaskan menurut pendapat anda !
2. Berikan penjelasan tentang arti pentingnya penilaian kinerja bagi perusahaan dan karyawan!
4. Melihat situasi saat ini dimana pemerintah berusaha memangkas birokrasi dengan
pengalihfungsian sejumlah jabatan struktural ke jabatan fungsional, berikan pendapat anda
apakah diperlukan induksi karyawan oleh masing-masing instansi untuk dapat menyesuaikan
kinerja pegawai yang mengalami pengalifungsian jabatan tersebut!
7. Mengapa perusahaan besar harus memiliki sistem informasi kolaborasi ? Dari pandangan
karyawan dan manager.
8. Jika sistem informasi semakin banyak mendukung bisnis dan menghadirkan berbagai platform
baru yang semakin canggih, apa tantangan untuk organisasi bisnis itu sendiri ?
PEMBAHASAN
1. Sumber daya manusia yang terlatih, memang sangat diperlukan untuk mendukung
perkembangan perusahaan. Sumber daya manusia mempengaruhi efisiensi danefektivitas
organisasi, sumber daya manusia merancang dan memproduksi barangdan jasa, mengawasi
kualitas, memasarkan produk, mengalokasikan sumber dayafinansial, serta menentukan seluruh
tujuan dan strategi organisasi. Sumber dayamanusia merupakan pengeluaran utama organisasi
dalam menjalankan bisnis.Manajemen sumber daya menusia MSDM berhubungan dengan sistem
rancangan formal dalam suatu organisasi untuk menentukan efektivitas danefisiensi untuk
mewujudkan sasaran suatu organisasi.
• Pengembangan diri
209
• Peluang berkomunikasi dengan pihak atasan
Hasil penilaian kinerja akan digunakan oleh manajemen perusahaan untuk hal-hal penting
berikut ini :
• Sebagai bahan pertimbangan dalam menentukan jenis pelatihan atau training yang
dibutuhkan oleh karyawan.
3. Berangkat dari keyakinan bahwa sumber daya manusia merupakan aset yang penting,
perusahaan memandang penyeleksian pegawai, pelatihan dan pengembangan serta program
sumber daya manusia sebagai aspek terpenting dari eksistensi perusahaan. Pelatihan dan
program pengembangan secara kontinudiadakan bagi staf manajemen tingkat menengah dan
senior, untuk memastikan jenjang karir yang terus berkembang bagi setiap karyawan. jelas
bahwa struktur manajemen yang menguntungkan dan transparan diadopsi untuk memastikan
bahwa organisasi ini profesional dan bebas dari perselisihan kepentingan. Melalui pelatihan dan
pengembangan secara berkelanjutan maka perusahaan dapatmengurangi ketergantungan untuk
mencari karyawan baru.Jika karyawan dikembangkan semestinya, maka lowongan kerja dapat
ditemukan dalam perencanaan SDM dapat diisi dari sumber internal (internal resources).
4. Menurut saya, ketika terjadi pengalihfungsian sejumlah karyawan dari jabatan struktural ke
jabatan fungsional, tidak diperlukam induksi karyawan, mengingat induksi karyawan
ditunjukkan untuk karyawan baru dalam merubah perilakunya agar sesuai dengan tata tertib
yang berlaku, dalam hal ini pegawai yang mengalami alih fungsi jabatan perlu dibimbing oleh
pengajar bersertifikasi dalam bentuk diklat untuk dapat menjalani bidang barunya.
5. Kompensasi sangat penting bagi karyawan itu sendiri sebagai individu, karena besarnya
kompensasi merupakan pencerminan atau ukuran nilai pekerjaan karyawan itu sendiri.
Sebaliknya besarnya kompensasi dapat mempengaruhi prestasi kerja, motivasi dan kepuasan
kerja karyawan. Apabila kompensasi diberikan secara tepat dan benar para pegawai akan
memperoleh kepuasan kerja dan termotivasi untuk mencapai tujuan-tujuan organisasi.
Besarnya kompensasi yang dibayar kepada setiap karyawan harus disesuaikan dengan prestasi
kerja, jenis pekerjaan, risiko pekerjaan, tanggung jawab, jabatan pekerja, dan memenuhi internal
konsistensi.
Asas adil harus menjadi dasar penilaian, perlakuan dan pemberian hadiah atau hukuman bagi
setiap karyawan. Dengan asas adil akan tercipta suasana kerja sama yang baik, disiplin, loyalitas
dan stabilitas karyawan akan lebih baik.
Kompensasi yang diterima karyawan dapat memenuhi kebutuhannya pada tingkat normatif yang
ideal. Tolak ukur layak adalah relative, penetapan besarnya kompensasi didasarkan atas batas
upah minimal pemerintah dan eksternal konsistensi yang berlaku (Asas layak dan wajar).
210
6. Pemeliharaan karyawan dilakukan dengan beberapa metode yaitu komunikasi, insentif,
kesejahteraan karyawan, kesadaran, dan keselamatan kerja (K3), serta hubungan industrial
pancasila (HIP).
Komunikasi adalah suatu alat pengalihan informasi dari komunikator kepala komunikan agar
terjadi interaksi antara mereka. Interaksi terjadi bila komunikasinya efektif, atau dengan kata lain
dilakukan dalam waktu singkat, jelas/dipahami, dipersepsi/ditafsirkan, dan dilaksanakan sama
dengan maksud komunikator oleh komunikan.
Insentif adalah daya perangsang yang diberikan kepada karyawan tertentu berdasarkan prestasi
kerjanya agar karyawan terdorong meningkatkan produktivitas kerjanya. Dengan pemberian
insentif yang adil, layak dan saat yang tepat serta terbuka akan menciptakan pemeliharaan yang
baik.
Kesadaran dan Kesehatan kerja akan menciptakan terwujudnya pemeliharaan karyawan yang
baik. Hal ini harus ditanamkan pada tiap karyawan melalui penyuluhan dan pembinaan agar
mereka menyadari pentingnya keselamatan kerja. Bahkan perlu diberi hukuman bagi yang tidak
menggunakan alat pengaman saat bekerja.
Hubungan Industrial Pancasila adalah hubungan antar pelaku dalam proses produksi barang dan
jasa didasarkan atas nilai yang merupakan manifestasi dari keseluruhan sila-sila Pancasila dan
UUD 1945 yang tumbuh dan berkembang diatas kepribadian bangsa dan kebudayaan nasional
Indonesia.
Dapat membantu kinerja karyawan, karena dengan adnaya sistem informasi kolaborasi
karyawan akan lebih mudah kinerjanya diperusahaan. Mempermudah hubungan antar
karyawan, misalkan satu karyawan dengan karyawan yang lain jarak lokasinya jauh
walaupun masih dalam satu perusahaan, sehingga kolaborasinya atau kerja samanya
akan menjadi lebih efektif dan efisien serta menghemat waktu kerjanya.
• Harus selalu mengikuti perkembangan sistem informasi, supaya tidak tertinggal dengan
para kompetitor yang selalu mengikuti perkembangan sistem informasi, supaya lebih
mendukung bisnis yang dijalankan.
211
• Harus selalu update mengenai kemajuan sistem informasi, Banyak platform baru yang
semakin canggih pun bermunculan, untuk pengembangan bisnis yang lebih luas maka
diperlukan suatu sistem informasi yang terbaru atau tercanggih untuk mengantisipasi
adanya kesalahan yang terdapat di sistem informasi yang telah usang.
• Selektif dalam memilih platform, Dengan sistem informasi yang semakin banyak
mendukung bisnis serta menghasilkan platform baru yang semakin canggih, membuat
organisasi bisnis harus selektif dalam memilih plaform yang sesuai dengan kegiatan
bisnisnya
• Meningkatkan kinerja para spesialis dibidang sistem informasi, Beberapa tahun yang lalu,
para ahli dibidang sistem informasi mungkin belum menemukan hubungan antara
teknologi dan bisnis atau manajemen. Tetapi tahun-tahun belakangan ini, para ahli sistem
informasi sudah memikirkan adanya manfaat yang besar jika sistem informasi dijadikan
sebagai bagian dari bisnis dan manajemen, sehingga banyak bisnis sekarang ini yang
sudah menggunakan sistem informasi.
• Pemeliharaan Data, Berkepentingan dengan kualitas data yang disimpan dalam sistem
212
SATU DATA INDONESIA
A. PENGERTIAN SDI
Satu Data Indonesia adalah kebijakan tata kelola data pemerintah untuk menghasilkan data yang
akurat, mutakhir, terpadu, dan dapat dipertanggungjawabkan, serta mudah diakses dan
dibagipakaikan antar instansi pusat dan instansi daerah melalui pemenuhan Standar Data, Metadata,
Interoperabilitas Data, dan menggunakan Kode Referensi dan Data Induk.
B. TUJUAN SDI
1. Memberikan acuan pelaksanaan dan pedoman bagi Instansi Pusat dan Instansi Daerah dalam
rangka penyelenggaraan tata kelola data untuk mendukung perencanaan, pelaksanaan, evaluasi,
dan pengendalian pembangunan;
2. Mewujudkan ketersediaan data yang akurat, mutakhir, terpadu, dapat dipertanggungjawabkan,
serta mudah diakses dan dibagipakaikan antar Instansi Pusat dan Instansi Daerah sebagai dasar
perencanaan, pelaksanaan, evaluasi, dan pengendalian pembangunan;
3. Mendorong keterbukaan dan transparansi data sehingga tercipta perencanaan dan perumusan
kebijakan pembangunan yang berbasis pada data;
4. Mendukung Sistem Statistik Nasional (SSN) sesuai peraturan perundang-undangan.
C. MANFAAT SDI
1. Meningkatkan akuntabilitas pemerintah
2. Mempermudah publik mengakses data Indonesia
3. Mempermudah publik menggunakan data karena menggunakan data terbuka dan menggunakan
jenis file yang mudah digunakan
4. Menghasilkan sistem pemerintahan yang transparan
5. Meningkatkan partisipasi pemerintah, masyarakat dan juga swasta dalam membantu
meningkatkan
214
E. TANTANGAN PELAKSANAAN SDI
1. Kita memiliki lebih dari 600 walidata, ribuan walidata pendukung, dan ribuan produsen data, yang
mana pengelolaannya tidak mudah karena memiliki perbedaan konsep, definisi, serta kepentingan
tiap institusinya.
2. Banyak SDM pengelola data yang belum mengerti arti penting data, sehingga dibutuhkan diklat-
diklat yang membantu pemahaman mereka mengenai data.
3. Infrastruktur dan aplikasi belum terbangun dengan baik dan merata.
4. Masih belum dapat membuat peraturan yang selaras dengan peraturan yang sudah ada diluar
sektor mereka (masih tinggi egosektoralnya) sehingga harmonisasi sulit tercapai.
5. Harus mensosialisasikan SDI kepada seluruh stakeholder yang pemahamannya terhadap data
belum seperti yang diharapkan.
6. Standar data, Metadata, Interoperabilitas, dan Big Data.
F. PENYELENGGARAAN SDI
1. Perencanaan Data
Perencanaan Data merupakan kegiatan penentuan daftar data yang selanjutnya akan diteruskan
untuk mengumpulkan, memeriksa, dan menyebarluaskan data. Tahapan dalam perencanaan data
adalah sebagai berikut
a) Menetapkan daftar data yang dikumpulkan selanjutnya
b) Menetapkan data prioritas
c) Menetapkan rencana aksi
2. Pengumpulan Data
Pengumpulan Data merupakan kegiatan produksi data berdasarkan daftar data yang telah
ditetapkan pada tahap Perencanaan Data, dan dipantau oleh Koordinator Forum SDI. Adapun
Tahapannya sebagai berikut:
a) Terbitnya Penetapan Menteri PPN atau Kepala Bappenas tentang Data Prioritas dan Rencana
Aksi
b) Pembina Data menentukan landasan proses pengumpulan data, yang terdiri dari Standar Data,
Daftar Data yang Diputuskan Forum, dan Jadwal Pemutakhiran/Rilis Data
c) Pembina Data memberikan rekomendasi terkait metodologi pengumpulan data
d) Produsen Data mengumpulkan data dengan metodologi yang telah disetujui
e) Produsen Data memastikan data yang dikumpulkan sesuai dengan Prinsip SDI
f) Produsen Data menyerahkan Data yang sudah sesuai Prinsip SDI kepada Walidata
3. Pemeriksaan Data
Pemeriksaan dilakukan untuk melihat kesesuaian data dengan Prinsip SDI. Pemeriksaan data
dilakukan oleh Walidata setelah Produsen Data menyerahkan hasil Pengumpulan data. Adapun
tahap pemeriksaan data adalah :
a) Produsen Data menyerahkan data kepada walidata
b) Data diperiksa oleh walidata berdasarkan prinsip SDI, apabila data belum sesuai prinsip SDI
maka Produsen Data memperbaiki data terlebih dahulu.
c) Data telah sesuai prinsip SDI
d) Data disebarluaskan oleh walidata
4. Penyebarluasan Data
Penyebarluasan Data merupakan kegiatan Pemberian Akses, Pendistribusian, danPertukaran Data
oleh Walidata. Penyebarluasan dilakukan melalui Portal Satu Data Indonesia dan/atau media
lainnya.
a) Pengecekan ulang dilakukan oleh Pembina Data
215
b) Walidata mengunggah data ke Portal Satu Data Indonesia
c) Memastikan akses data dalam Portal Satu Data Indonesia melalui pemenuhan persyaratan
STANDAR DATA
216
B. PENGERTIAN STANDAR DATA
Standardisasi data adalah proses untuk membawa data ke dalam format umum yang memungkinkan
untuk perbandingan data, analisis lintas sektor yang bersifat kolaboratif, dan berbagi pakai data itu
sendiri.
Secara umum, standar data statistik bertujuan untuk memudahkan pengumpulan, berbagipakai, dan
pengintegrasian data serta memastikan adanya informasi yang jelas tentang data yang dihasilkan.
Sementara secara khusus standar data statistik bertujuan untuk memudahkan penggunaan data,
meningkatkan akurasi dan konsistensi data, memperjelas makna yang ambigu dan meminimalkan
pengumpulan data yang serupa oleh banyak Instansi Pusat dan/atau Instansi Daerah.
217
F. AZAS PEMBENTUKAN STANDAR DATA STATISTIK
1. Relevansi, Ketidakberpihakan, dan Keterbukaan
Relevan artinya agar dapat memfasilitasi dan memperhatikan kebutuhan Instansi Pusat dan/atau
Instansi Daerah dan tidak bertentangan dengan peraturan perundang-undangan yang berlaku.
Ketidakberpihakan artinya tidak memihak kepentingan Instansi Pusat dan/atau Instansi Daerah
tertentu. Keterbukaan artinya terbuka bagi semua Instansi Pusat dan/atau Instansi Daerah yang
berkepentingan dapat berpartisipasi dalam pengembangan standar dan dapat menyalurkan
kepentingannya dan diperlakukan secara adil.
2. Standar Profesional, Prinsip Ilmiah, dan Etika Profesional
Dalam penetapan standar, badan statistik memutuskan berdasarkan pertimbangan profesional,
termasuk prinsip ilmiah dan etika professional.
3. Akuntabilitas dan Transparansi
Akuntabilitas artinya penetapan standar harus sesuai dengan standar ilmiah tentang sumber,
metode dan prosedur statistik agar dapat digunakan untuk interpretasi data dengan benar.
Transparansi, artinya transparan agar semua Instansi Pusat dan/atau Instansi Daerah yang
berkepentingan dapat mengikuti dan mudah memperoleh semua informasi yang berkaitan
dengan pengembangan standar.
4. Sumber Statistik Resmi
Standar yang ditetapkan harus dijadikan sumber rujukan statistik resmi. Oleh karena itu standar
yang ditetapkan juga harus memiliki sumber yang sahih.
5. Koheren dengan Penggunaan Standar Internasional
Koheren dengan Penggunaan Standar Internasional artinya pengembangan standar sejalan
dengan standar internasional untuk menjamin keterbandingan data secara internasional dan
mendorong konsistensi dan efisiensi sistem statistik meskipun digunakan dengan cara yang
berbeda dan untuk berbagai penggunaan.
6. Berdimensi Pembangunan
Berdimensi pembangunan artinya memperhatikan kepentingan publik dan kepentingan nasional.
218
H. TAHAPAN IDENTIFIKASI STANDAR DATA STATISTIK
1. Identifikasi Indikator dan/atau Variabel
Pada tahapan ini indikator dan/atau variabel diidentifikasi berdasarkan jenis indikator dan/ atau
variabel tersebut. Variabel dapat dibedakan menjadi variabel tunggal dan variabel turunan yang
diperoleh dari kombinasi pernghitungan lebih dari satu variabel tunggal.
2. Penentuan Cakupan Indikator dan/atau Variabel
Pada tahapan ini cakupan dari satu indikator dan/ atau variabel yang sama dapat digunakan
dalam beberapa lingkup statistik yaitu statistik ekonomi, sosial, pertanian, neraca/analisis, sesuai
dengan tujuan dari pengumpulannya.
3. Pembentukan Komponen Standar Data Statistik
Pada tahapan ini variabel yang sudah diidentifikasi dan ditentukan cakupannya dibakukan
berdasarkan lima standar data yaitu konsep, definisi, klasifikasi, ukuran dan satuan.
METADATA
A. PENGERTIAN METADATA
Metadata adalah informasi dalam bentuk struktur dan format yang baku untuk menggambarkan
data, menjelaskan data, serta memudahkan pencarian, penggunaan, dan pengelolaan informasi data.
Metadata ini mengandung informasi mengenai isi dari suatu data yang diperlukan untuk keperluan
manajemen file/data yang nantinya terdapat dalam suatu basis data.
B. JENIS METADATA
Nasional Information Standards Organization (NISO) mengelompokan metadata menjadi 3 bagian
1. Metadata Deskriptif, yaitu metada yang menjelaskan suatu sumber untuk tujuan mencari dan
mengidentifikasi suatu data. Contoh : Metadata Kegiatan Statistik
2. Metadata Struktural, yaitu metadata yang mengidentifikasi teknis pembuatan suatu data. Contoh
: Metadata Indikator Statistik dan Metadata Variabel Statistik.
3. Metadata Fisik, yaitu metadata yang berisi informasi untuk membantu pengelola suatu sumber
daya. Contoh : Katalog Perpustakaan.
Sedangkan menurut UU No.16 tahun 1997 tentang Statistik, metadata dikelompokan menjadi
1. Metadata kegiatan statistik dasar
2. Metadata kegiatan statistik sektoral
3. Metadata kegiatan statistik khusus
C. MANFAAT METADATA
Bagi pengembang :
1. Menghindari duplikasi
2. Sebagai sarana untuk sharing informasi
3. Publikasi output
4. Mengurangi beban kerja
5. Sebagai dokumentasi data dan informasi
Bagi Pengguna :
1. Memudahkan pencarian dan evaluasi informasi
2. Memudahkan pemanfaatan data
3. Memudahkan identifikasi perolehan, perhitungan, dan estimasi data.
219
Bagi Organisasi :
1. Memudahkan pengelolaan data sebagai investasi organisasi
2. Dokumentasi, yang meliputi tahapan pengolahan, pengendalian mutu, definisi, penggunaan data,
dan keterbatasan.
D. METADATA STATISTIK
1. Metadata Kegiatan Statistik
Metadata kegiatan statistik adalah sekumpulan atribut informasi yang memberikan
gambaran/dokumentasi dari penyelenggaraan kegiatan statistik. Struktur baku metadata
kegiatan statistik dapat dilihat pada tabel di bawah ini :
220
INTEROPERABILITAS
A. PENGERTIAN INTEROPERABILITAS
Interoperabilitas adalah dimana suatu aplikasi bisa berinteraksi dengan aplikasi lainnya melalui
suatu protokol yang disetujui bersama lewat bermacam-macam jalur komunikasi, biasanya lewat
network TCP/IP dan protokol HTTP dengan memanfaatkan file XML. Adapun aplikasi disini boleh
berada di platform yang berbeda: Delphi Win32, .NET, Java, atau bahkan pada O/S yang berbeda.
Sementara, interoperabilitas data adalah kesiapan data untuk dibagipakaikan antar sistem
elektronik yang saling berinteraksi. (Perpres Nomor 39 tahun 2019 tentang Satu Data Indonesia)
B. MANFAAT INTEROPERABILITAS
1. Kemudahan dalam pengelolaan dan pengaksesan data
2. Pelayanan public yang lebih efektif
3. Pengambilan keputusan menjadi lebih relevan, akurat dan tepat waktu, karena waktu akses tyang
lebih cepat
4. Koordinasi program lebih mudah
5. Iklim berdemokrasi yang lebih bagus
B. TUJUAN NSPK
1. Mewujudkan Sistem Statistik Nasional yang andal, efektif, dan efisien
2. Meningkatkan koordinasi, integrasi, dan harmonisasi dalam pelaksanaan urusan pemerintahan
bidang statistik antara pemerintah pusat dan daerah
3. Menyediakan data statistik sektoral yang berkualitas
221
5. Statistik memenuhi nilai kualitas, waktu, biaya, dan menghindari beban atau kejenuhan
responden
6. Statistik mampu menjamin secara ketat kerahasiaan informasi individu dan sumbernya
7. Penyelenggaraan statistik berpedoman pada ketentuan peraturan perundang-undangan
8. Koordinasi dalam penyelenggaraan statistik untuk mewujudkan sistem statistik yang konsisten,
efisien, dan efektif
9. Menggunaan metodologi, konsep, definisi, klasifikasi, dan ukuran-ukuran statistik yang mengacu
pada standar internasional
10. Penyelenggaraan statistik dalam bentuk kerja sama diutamakan dalam rangka perbaikan statistik
nasional
b) Pemeriksaan
- BPS mengevaluasi rancangan penyelenggaraan kegiatan Survei yang disampaikan oleh
Pemerintah Daerah,
- BPS memberikan rekomendasi kepada Pemerintah Daerah berupa surat rekomendasi
berdasarkan hasil evaluasi.
- Surat rekomendasi disampaikan kepada Perangkat Daerah yang menangani urusan
pemerintahan bidang statistik serta ditembuskan kepada Perangkat Daerah pelaksana
urusan pemerintahan bidang perencanaan.
- Penyelenggaraan Survei yang sudah mendapatkan rekomendasi, wajib mencantumkan
identitas rekomendasi pada kuesioner.
222
c) Penyebarluasan Hasil
- Kegiatan Statistik Sektoral yang hasilnya dipublikasikan, wajib diserahkan hasilnya dalam
bentuk softcopy kepadaBPS.
- Diserahkan melalui Perangkat Daerah yang menangani urusan pemerintahan bidang
statistik dengan ketentuan diberikan kepada :
• BPS, apabila wilayah kegiatannya mencakup lebih dari satu provinsi.
• BPS Provinsi, apabila wilayah kegiatannya mencakup satu provinsi atau lebih dari satu
kabupaten/kota dalam satu provinsi.
• BPS Kabupaten/Kota, apabila wilayah kegiatannya mencakup satu kabupaten/kota.
4. KRITERIA
Untuk mendapatkan Statistik Sektoral yang berkualitas, Data yang dihasilkan harus memenuhi
kriteria:
a) Relevan, memenuhi kebutuhan pengguna Data.
b) Akurat, mampu secara tepat menggambarkan keadaan yang diukur.
c) Tepat waktu, baik dalam pelaksanaan lapangan maupun waktu penyajian.
d) Mudah diakses, oleh para pengguna Data.
e) Mudah ditafsirkan, didukung dengan penjelasan dan dilengkapi dengan Metadata.
f) Konsisten, dalam konteks antar waktu dan antar wilayah.
KONSEP INDIKATOR
A. PENGANTAR
Pada dasarnya, sebuah indikator memberikan tanda atau sinyal bahwa sesuatu itu ada atau benar.
Digunakan untuk menunjukkan keberadaan atau keadaan suatu situasi atau kondisi.
223
• Dalam Sosial, indikator biasanya mengacu pada potongan data sosial yang digunakan untuk
mengukur keadaan dan memberikan gambaran karakteristik wilayah atau masyarakat secara
keseluruhan. Contohnya Angka Harapan Hidup, Angka Partisipasi Sekolah.
• Dalam ekonomi, indikator biasanya mengacu pada potongan data ekonomi yang digunakan untuk
mengukur kesehatan ekonomi secara keseluruhan dan memprediksi arahnya. Contohnya: Indeks
Harga Konsumen (IHK), Produk Domestik Bruto (PDB), dan angka pengangguran
Indikator selalu menyederhanakan realitas yang kompleks, dengan fokus pada aspek-aspek tertentu
yang dianggap relevan dan tersedia datanya. Indikator hanya bermakna sebagai bagian dari kerangka
atau cerita. Indikator adalah bagian penting dari arus informasi yang kita gunakan untuk memahami
dunia, membuat keputusan, dan merencanakan tindakan kita.
Indikator adalah alat yang:
• Menyederhanakan masalah yang kompleks, membuatnya dapat diakses oleh audiens yang lebih
luas dan tidak ahli.
• Dapat mendorong pengambilan keputusan dengan menunjukkan langkah-langkah yang jelas
dalam rantai sebab akibat yang dapat diputus.
• Menginformasikan dan memberdayakan pembuat kebijakan dan orang awam dengan
menciptakan sarana untuk mengukur kemajuan dalam menangani kemajuan lingkungan.
Indikator tidak dapat menggantikan studi ilmiah tentang sebab dan akibat.
B. PENGERTIAN INDIKATOR
Pengertian indikator menurut beberapa sumber:
• Variabel kendali yang dapat digunakan untuk mengukur perubahan pada sebuah kejadian
• KBBI : sesuatu yang dapat memberikan petunjuk atau keterangan
• Menunjukkan suatu fenomena atau kondisi tertentu
• Bisa dipakai untuk mengukur perubahan yang terjadi
• Dituangkan berupa suatu angka (dapat disebut angka indeks)
• Dapat dirumuskan dari satu atau lebih variabel
Contoh indikator :
• Perbandingan antara jumlah penduduk dan luas area suatu wilayah dapat menjadi indikator
kepadatan penduduk per kilometer persegi.
• Berat badan bayi berdasarkan umur dapat menjadi indikator bagi status gizi bayi
Jenis indikator:
• Rujukan: data yang menyatakan kelompok sasaran dari permasalahan/program
• Input: sumber daya yang digunakan dalam pelaksanaan kegiatan/program
• Proses: partisipasi kelompok sasaran dalam kegiatan/program
• Output: hasil dari suatu kegiatan/program
• Outcome: manfaat dari program bagi kelompok sasaran/masyarakat
Indikator menurut jumlah variabel/karakteristik
• Tunggal: pengukuran permasalahan berdasarkan satu karakteristik % buta aksara, rata2 lama
sekolah (tahun), rata2 asupan energi (kkal/hari)
• Komposit: pengukuran permasalahan multi dimensi dengan menggunakan banyak indikator
dengan satu angka Indeks Pembangunan Manusia (IPM), Indeks Demokrasi Indonesia (IDI), Laju
Pertumbuhan
Penghitungan indikator bersifat:
• Rate, angka, tingkat: menyatakan suatu masalah yang dihadapi oleh sekian orang untuk setiap
jumlah tertentu penduduk (ratusan, ribuan, seratus ribuan)
224
• Rata-rata : suatu besaran angka dari sifat/karakteristik dari setiap penduduk/populasi
• Rasio: perbandingan antara 2 kelompok, menyatakan setiap satu orang berkaitan dengan
beberapa orang kelompok yang lain
Contoh penerapan :
Program pendidikan menengah:
• Rujukan: penduduk usia sekolah sekolah menengah (umum, kejuruan) (16-18 thn)
• Input: fasilitas yang digunakan dalam proses belajar mengajar: rasio muridguru, rasio murid-
kelas, dll
• Proses: banyaknya murid (sma,k) untuk setiap 100 anak usia 16-18 tahun: angka partisipasi
(murni, kasar, sekolah)
• Output: % murid SM lulus UAN, % murid SM mengulang,
• Outcome (semua jenjang): angka putus sekolah, angka buta huruf, rata lama sekolah
Intrepretasi indikator:
• Rasio murid-guru = 44, setiap guru mempunyai tanggung jawab untuk 44 murid; rasio murid-
kelas = 32, setiap kelas diisi 32 murid
• Angka Partisipasi Murni = 58, setiap 100 penduduk usia 16-18 tahun, 58 orang di antaranya
sedang bersekolah di SM
• Angka Putus Sekolah SMA = 2,6 =>sebanyak 2,6 dari setiap 100 murid SMA tidak dapat
menyelesaikan sekolah
• Angka kematian bayi = 28, => 28 bayi akan meninggal sebelum berumur satu tahun dari setiap
1000 kelahiran hidup
C. SYARAT INDIKATOR
Syarat indikator yang baik harus memenuhi:
• Spesifik (interpretasi jelas, tidak mengandung multi interpretasi)
• Valid (sahih, absah)
• Reliabel (andal, tepercaya, konsisten)
• Sensitif (dapat mendeteksi perubahan kecil)
• Data tersedia (untuk pengukuran, serta keberlanjutan monitoring dan evaluasi)
Namun, tidak semua indikator yang diperlukan untuk mengukur suatu fenomena tersedia datanya.
Oleh karena itu, dapat digunakan indikator proxy. Misalnya, indikator untuk mengukur kesejahteraan
petani, dapat digunakan perbandingan antara indeks harga yang diterima petani (It) dan indeks
harga yang dibayar petani (Ib), atau biasa disebut sebagai Nilai Tukar Petani (NTP)
the New Economics Foundation mengidentifikasi kriteria untuk indikator, yang terus menjadi
panduan yang berguna dalam memutuskan apakah suatu indikator merupakan indikator yang baik :
• Action focused (Fokus Tindakan). Indikator harus mengarah pada tindakan. Jika pemangku
kepentingan tidak dapat membayangkan apa yang harus dilakukan dengan data dari suatu
indikator, maka itu mungkin bukan indikator yang baik.
• Important (Penting). Pemangku kepentingan harus setuju bahwa indikator dan data yang akan
dihasilkannya memberikan kontribusi yang relevan dan signifikan untuk menentukan cara
merespons epidemi secara efektif.
• Mesurable (terukur). Metodologi pengumpulan data tidak hanya harus didefinisikan, tetapi juga
harus layak untuk mengumpulkan data.
• Simple (Sederhana). Indikator dibuat sesederhana mungkin sehingga bisa dimengerti oleh
audiens yang lebih luas (tidak ahli). Daripada mengejar indikator yang sempurna, jauh lebih baik
225
untuk mengidentifikasi indikator yang baik dan sederhana yang menyediakan data yang dapat
digunakan.
D. KOMPONEN INDIKATOR
• Judul. Judul singkat yang menangkap fokus indikator.
• Definisi. Deskripsi indikator yang jelas dan ringkas.
• Tujuan. Alasan adanya indikator tersebut; yaitu untuk apa
• Metode pengukuran. Urutan operasi yang logis dan spesifik yang digunakan untuk mengukur
indikator; misalnya alat pengumpulan data, kerangka sampling dan jaminan kualitas
• Perhitungan. Langkah-langkah khusus dalam proses untuk menentukan nilai indikator.
• Metode pengumpulan data. Pendekatan umum (misalnya survei, catatan, model, perkiraan) yang
digunakan untuk mengumpulkan data.
• Alat pengumpulan data. Alat khusus (misalnya Survei Indikator AIDS (AIS), Survei Demografi dan
Kesehatan (DHS), Penilaian Penyediaan Layanan (SPA), daftar pasien, surveilans klinik
antenatal) digunakan untuk mengumpulkan data.
• Frekuensi pengumpulan data. Interval di mana data dikumpulkan; misalnya triwulanan, tahunan,
dua tahunan.
• Disagregasi data. Subkelompok relevan yang mengumpulkan data dapat dipisahkan agar lebih
tepat memahami dan menganalisis temuan.
• Interprestasi
F. MEMILIH INDIKATOR
Indikator harus dipilih dengan hati-hati dan sistematis. Penting untuk mempertimbangkan konteks
atau lingkungan di mana mereka akan digunakan. Sama pentingnya untuk mempertimbangkan
kerangka indikator yang ada atau yang berlaku yang relevan dengan konteksnya. Selain itu, semua
indikator potensial harus dievaluasi menggunakan standar indikator internasional untuk
memastikan bahwa indikator tersebut dapat dan akan memberikan data yang berguna. Indikator
tersebut harus diambil dari rangkaian indikator yang diselaraskan dan/atau digunakan secara luas
yang memiliki rekam jejak yang sukses.
226
• Konteks. Ketika memilih indikator, penting untuk memahami konteks di mana mereka akan
digunakan untuk memilih yang paling tepat. Secara khusus, suatu negara harus memiliki
pemahaman yang baik tentang epidemi dan responsnya ketika memilih indikator.
• Kerangka indikator. Sebagian besar negara telah mengembangkan kerangka kerja indikator.
Secara umum, kerangka kerja ini menghubungkan tujuan utama, kegiatan dan/atau rencana kerja
dan hasil dengan indikator khusus dan metode pengumpulan data untuk indikator tersebut.
G. STANDAR INDIKATOR
Indikator yang baik harus memenuhi lima standar berikut:
1. Indikator yang dibutuhkan dan berguna.
2. Indikator memiliki manfaat teknis.
3. Indikator sepenuhnya ditentukan.
4. Adalah layak untuk mengukur indikator.
5. Indikator telah diuji coba di lapangan atau digunakan secara operasional
Selain itu, jika indikator disajikan sebagai bagian dari satu set, set ini harus memenuhi standar
keenam: Keseluruhan rangkaian koheren dan seimbang.
227
• Bias: Setiap efek selama pengumpulan atau interpretasi informasi yang mengarah pada kesalahan
sistematis dalam satu arah
I. JENIS DATA
• Data primer: data yang dikumpulkan sendiri untuk keperluan sendiri
• Data sekunder: data yang dikumpulkan pihak lain, definisi dari variabel yang digunakan
mengikuti penyelenggara survei
• Data cross-section: data set yang berisikan beberapa variabel dari tahun yang sama
• Data time series: data set yang berisikan variabel dari tahun yang berbeda dalam jangka waktu
periode yang panjang (> 10 tahun), periode bisa mingguan, bulanan, triwulanan
• Data obyektif: data yang dikumpulkan dengan definisi/kriteria/ ukuran yang sama menurut
responden
• Data subyektif: data yang dikumpulkan tentang satu variabel dimana kriteria/ukuran menurut
pandangan responden (bahagia, puas, senang, dll)
J. TINGKATAN INFORMASI
• Informasi: keterangan tentang sifat/karakteristik tertentu dari individu, kelompok, populasi
(nilai dari variabel)
• Tingkatan informasi dilihat dari kegunaan
• data: nilai karakteristik dari individu, e.g: umur, jenis kelamin, pendidikan
• statistik: agregasi dari suatu kelompok, penghitungan kumulatif dari nilai karakteristik
individu dalam kelompok, e.g: rata2 umur, sex ratio, % pendidikan sarjana
• Indikator: statistik yang dapat memberikan gambaran masalah, alat ukur untuk mengetahui
situasi dan posisi atas permasalahan yang tengah atau akan dihadapi/ditemui pada waktu
tertentu e.g: % buta huruf, % obesitas, kepadatan penduduk, indikator bensin, IPK, syarat
lulus ujian SIM
Tingkatan Informasi Statistik
JENIS INFORMASI DEFINISI CONTOH
DATA Sifat/nilai dari individual Umur, berat badan, gaji,
berdasarkan variabel atau alat kemampuan baca tulis
ukur (instrumen)
STATISTIK Agregasi dari data untuk suatu Median umur, % miskin (garis
populasi kemiskinan ditentukan), % buta
aksara, rata² asupan kalori
(kkal/kapita/hari)
INDIKATOR Statistik yang dapat % miskin, % menganggur, rata²
menunjukkan permasalahan berat badan, % obesitas, %
kurang kalori
K. TINGKATAN INDIKATOR
• Indikator rujukan: menunjukkan kelompok sasaran, e.g.: balita, wus, lansia, usia sekolah
• Indikator input: menunjukkan sumberdaya yang tersedia/diperlukan dalam suatu kegiatan, e.g.:
jumlah polisi per 10.000 penduduk, jumlah murid per guru, jumlah dokter per 10.000 penduduk
• Indikator proses: menunjukkan partisipasi masyarakat pada program, e.g.: APM, APK, CPR (%
pengguna kontrasepsi),
• Indikator output: hasil suatu kegiatan, e.g., % lulus UAN, angka kelahiran total, % lulus SMNPTN
228
• Indikator outcome: dampak dari suatu program, e.g. % putus sekolah, % penduduk miskin, %
pengangguran terbuka, angka kematian bayi
JENIS INDIKATOR DEFINISI CONTOH
Rujukan Kelompok sasaran program, Bayi, balita, usia sekolah, WUS,
kebijakan lansia, dll
Input Ketersediaan sumberdaya Rasio dosen-mahasiswa, rasio
terhadap kelompok sasaran murid-kelas, % dokter per 1000
program penduduk, % polisi per 1000
penduduk
Proses Partisipasi pada program APM, APK per jenjang, CPR
Output Hasil (keluaran) dari program % lulus per jenjang pendidikan,
TPAK
Outcome Dampak program TFR, tingkat putus sekolah, rata-
rata lama sekolah, IMR, e0, %
penduduk miskin
A. SEJARAH SDGs
Transformasi global menuju pembangunan berkelanjutan melalui 17 goals, 169 target, 241 indikator,
sebagai lanjutan MDGs
1. Pilar Pembangunan Sosial
2. Pilar Pembangunan Ekonomi
3. Pilar Pembangunan Lingkungan
4. Pilar Pembangunan Hukum & Tata Kelola
Masa Lingkungan Hidup melalui UN-Environment Program
✓ 1972 – Stockholm Human Environment Conference (Prof Emil Salim)
✓ 1978 – Dibentuk Kementerian LH
229
✓ 1997 – Definisi Pembangunan Berkelanjutan – Brundland Report
✓ 2009 – UU 32/2009 – Ditetapkan Definsi Pembangunan Berkelanjutan
✓ 2017 – Perpres No. 59/2017
Masa pembangunan melalui UN-Development Program
✓ 1992 – Agenda 21
✓ 2000 – MDGs dilaksanakan sebagai SD-Exercise
✓ 2015 – SDGs
✓ 2017 – Perpres No. 59/2017
No Perbedaan
MDGs (2010-2015) SDGs (2015-2030)
1. Diperuntukkan hanya untuk negara Diperuntukkan untuk seluruh negara maju
berkembang di dunia dan berkembang di dunia
2. Single platfom (state centered) Multi platfom (POAF=Pemerintah, OMS,
Akademisi, Filantropi)
3. Pembiayaan dari satu sumber (state Pembiayaan dari banyak sumber (state and
money) public money)
4. Left-behind (masih ada kesan No one left behind (ramah HAM)
diskriminatif)
5. Targetnya adalah memenuhi capaian Target zero goals di 2030 (target yang lebih
setengahnya dari target ambisius)
Prinsip SDGs
• No one left behind
• Universal
• Integration
230
3. Memastikan kehidupan yang sehat dan mendukung kesejahteraan bagi semua untuk semua usia
(Kesehatan yang baik dan kesejahteraan)
4. Memastikan pendidikan yang inklusif dan berkualitas setara, juga mendukung kesempatan
belajar seumur hidup bagi semua (Pendidikan bermutu)
5. Mencapai kesetaraan gender dan memberdayakan semua perempuan dan anak perempuan
(Kesetaraan gender)
6. Memastikan ketersediaan dan manajemen air bersih yang berkelanjutan dan sanitasi bagi semua
(Akses air bersih dan sanitasi)
7. Memastikan akses terhadap energi yang terjangkau, dapat diandalkan, berkelanjutan dan
modern bagi semua (Energi bersih dan terjangkau)
8. Mendukung pertumbuhan ekonomi yang inklusif dan berkelanjutan, tenaga kerja penuh dan
produktif dan pekerjaan yang layak bagi semua (Pekerjaan layak dan pertumbuhan ekonomi)
9. Membangun infrastruktur yang tahan lama, mendukung industrialisasi yang inklusif dan
berkelanjutan dan membantu perkembangan inovasi (Infrastruktur, industri dan inovasi)
10. Mengurangi ketimpangan didalam dan antar negara (Mengurangi ketimpangan)
11. Membangun kota dan pemukiman inklusif, aman, tahan lama dan berkelanjutan (Kota dan
komunitas yang berkelanjutan)
12. Memastikan pola konsumsi dan Produksi yang berkelanjutan (Konsumsi dan produksi yang
bertanggungjawab)
13. Mengambil aksi segera untuk memerangi perubahan iklim dan dampaknya (Penanganan
perubahan iklim)
14. Mengkonservasi dan memanfaatkan secara berkelanjutan sumber daya laut, samudra dan
maritim untuk pembangunan yang berkelanjutan (Menjaga ekosistem laut)
15. Melindungi, memulihkan dan mendukung penggunaan yang berkelanjutan terhadap ekosistem
daratan, mengelola hutan secara berkelanjutan, memerangi desertifikasi (penggurunan), dan
menghambat dan membalikkan degradasi tanah dan menghambat hilangnya keanekaragaman
hayati (Menjaga ekosistem darat)
16. Mendukung masyarakat yang damai dan inklusif untuk pembangunan berkelanjutan,
menyediakan akses terhadap keadilan bagi semua dan membangun institusi-institusi yang
efektif, akuntabel dan inklusif di semua level (Perdamaian, keadilan, dan kelembagaan yang kuat)
17. Menguatkan ukuran implementasi dan merevitalisasi kemitraan global untuk pembangunan yang
berkelanjutan (Kemitraan untuk mencapai tujuan)
231
Pemetaan Tujuan, Target, dan Indikator Nasional
232
TUJUAN-9 Industri, Inovasi, Infrastruktur • Tenaga Kerja;
TUJUAN-10 Berkurangnya Kesenjangan • Koperasi, Usaha Kecil, & Menengah;
TUJUAN-17 Kemitraan untuk mencapai tujuan • Pariwisata;
TUJUAN-6 Air Bersih, Sanitasi Layak • Penanaman Modal;
TUJUAN-11 Kota & Pemukiman yang • Perhubungan;
Berkelanjutan • PU & Penataan Ruang;
TUJUAN-12 Konsumen & Produksi yang • Perindustrian;
bertanggungjawab • Perdagangan;
TUJUAN-13 Penanggung Perubahan Iklim • Komunikasi & Informatika;
TUJUAN-14 Ekosistem Lautan • Sosial;
• Pemberdayaan masyarakat & desa;
• Pekerjaan Umum & Penataan Ruang
• Perhubungan;
• Ketentraman, Ketertian Umum, &
Perlindungan Masyarakat;
• Lingkungan Hidup;
• Kelautan & Perikanan;
• Kehutanan
PILAR PEMBANGUNAN HUKUM DAN TATA KELOLA URUSAN
TUJUAN-16 Perdamaian, keadilan, dan • Ketenteraman, Ketertiban Umum, &
kelembagaan yang tangguh Perlindungan Masyarakat;
• Pemberdayaan Perempuan &
Perlindungan Anak;
• Statistik;
• Komunikasi & Informatika
1. Sebagai acuan penyusunan peta jalan, RAN, RAD TPB/SDGs, dibutuhkan persepsi yang sama
tentang Tujuan, Target & Indikator TPB/SDGs.
2. Data SDGs digunakan untuk mengukur ketercapaian tiap tujuan dan target TPB/SDGs.
3. Sebagai dasar pelaksanaan monitoring, evaluasi dan pelaporan, serta keterbandingan pencapaian
TPB/SDGs antarnegara dan antardaerah di Indonesia.
233
• BPS yang diwakili Sekretaris Utama merupakan anggota Tim Pelaksana dan direktorat di BPS
yang terkait menjadi anggota Kelompok Kerja maupun Sub Kelompok Kerja.
• Peran dan tugas BPS selaku Tim Pelaksana (Pasal 4) salah satunya yaitu:
1. Membantu Koordinator Pelaksana dalam mengoordinasikan pengembangan dan
pemutakhiran data untuk penyusunan, pemantauan, evaluasi dan pelaporan pelaksanaan
Peta Jalan Nasional TPB, RAN TPB, dan RAD TPB.
A. PENGERTIAN
• Kode Referensi adalah tanda berisi karakter yang mengandung atau menggambarkan makna,
maksud, atau norma tertentu sebagai rujukan identitas Data yang bersifat unik.
• Data Induk adalah Data terpilih yang berasal dari daftar Data yang akan dikumpulkan pada tahun
selanjutnya yang disepakati dalam Forum Satu Data Indonesia.
Contoh kode refererensi
NIK (Nomor Induk Kependudukan) -> sebagai referensi tunggal data kependudukan Indonesia
NIK: 3172061506870005
NIK bersifat komposit dimana
234
• 6 digit pertama: kode provinsi, kab/kota, kecamatan
• 6 digit kedua: tanggal, bulan, tahun kelahiran
• 4 digit terakhir: nomor urut penerbitan
Contoh kode referensi lain:
• Kode Wilayah sebagai Referensi tunggal kode kewilayahan (antara Kemendagri dengan BPS)
• NPWP sebagai basis tunggal/referensi tunggal Data Usaha
Kode Referensi/Data Induk
• Kode Referensi sangat penting dalam pertukaran data karena akan menjadi kunci dalam me-link-
kan data
• Antar kode referensi harus bersinergi satu sama lain, misal NIK mengandung kode wilayah pada
4 digit pertama. Kode wilayah ini harus sama dengan kode referensi wilayah yang dikeluarkan
oleh Kemendagri
• Karena kode referensi bersifat unik, maka kode yang sudah pernah dipakai tidak dapat dipakai
kembali
• Data induk digunakan acuan utama dalam pengumpulan data, contohnya data induk
kependudukan menjadi acuan dalam SP2020.
B. ATRIBUT DALAM KODE REFERENSI DAN DATA INDUK HARUS MEMEHUHI STANDAR DATA
• Konsep : merupakan ide yang mendasari data dan tujuan data tersebut diproduksi
• Definisi : merupakan penjelasan tentang data yang memberi batas atau membedakan secara jelas
arti dan cakupan data tertentu dengan data yang lain
• Klasifikasi : merupakan penggolongan data seara sistematis ke dalam kelompok atau kategori
berdasarkan kriteria yang ditetapkan oleh Pembina Data dan dibakukan secara luas
• Ukuran : merupakan unit yang digunakan dalam pengukuran jumlah, kadar, atau cakupan
• Satuan : merupakan besaran tertentu dalam data yang digunakan sebagai standar untuk
mengukur atau menakar sebagai sebuah keseluruhan
235
2. Strategi Nasional diperlukan untuk menghadapi tantangan Globalisasi dan Revolusi Industri 4.0
dengan derasnya alur data dan statistik serta mencegah terjadinya duplikasi kegiatan oleh para
penyelenggara kegiatan statistik.
3. Strategi Nasional Pembangunan Statistik(NSDS) Indonesia merupakan strategi agar terwujud
suatu Sistem Statistik Nasional yang andal, efektif, dan efisien untuk memenuhi kebutuhan data
SDGs maupun SNAs dan indikator-indikator nasional seperti Nawacita dan RPJMN.
236
• DDA merupakan Cerminan SI dalam level yang lebih rendah. Data dalam DDA harus sinkron
ketika diagregatkan seluruh Indonesia dengan Data SI.
Langkah sinkronisasi SI dan DDA
• Menentukan Tabel KOR antara SI dan DDA
• Melakukan Standardisasi Tabel (Baris, Kolom, Metadata, Cut Off, Pembabakan)
• Membuat Sistem Informasi dengan fitur :
1. Repository Data
2. Manajemen Metadata
3. Input dan Approve Data
4. Membuat mekanisme kompilasi data
5. Monitoring dan Evaluasi
6. Sinkronisasi Data
7. Penyediaan Mekanisme dan Data untuk Dibagipakaikan
Tahapan penyusunan DDA
• Persiapan
o Updating menggunakan Aplikasi yang telah disediakan (simDASI)
o Updating tabel yang akan disajikan pada DDA 2022
o Penyiapan template tabel
• Pengumpulan
o Interoperabilitas data di BPS RI
o Pengumpulan data di daerah
o Input data di Simdasi
• Diseminasi
o FGD data sebelum rilis
o Rilis serentak sesuai Senarai Rencana Terbit (Advanced Release Calendar)
237
Suatu tatanan yang terdiri atas unsur-unsur yang secara teratur saling berkaitan, sehingga
membentuk totalitas dalam penyelenggaraan statistic
Penyelenggara Bagipakai Data dalam Tatanan SDI
• Data disebarluaskan melalui Portal Satu Data Indonesia dan Media Lainnya
Sampai saat ini, instansi dapat menggunakan media lain untuk menyebarluaskan data sepanjang
terintegrasi dengan Portal Satu Data Indonesia.
• Pengembangan Media Penyebarluasan/Bagipakai Data
Pengembangan media penyebarluasan/bagipakai data oleh instansi dilaksanakan dengan
mengikuti perundangan yang berlaku tentang Sistem Pemerintahan Berbasis Elektronik dan
diintegrasikan dengan Portal Satu Data Indonesia.
• Data yang diakses di Portal Satu Data Indonesia Tidak Dipungut Biaya
Dalam melakukan akses dan bagipakai data melalui Portal Satu Data Indonesia antar instansi
pemerintah tidak ada biaya yang dikenakan.
• Data yang diakses di Portal Satu Data Indonesia Tidak Perlu MoU
Dalam melakukan akses dan bagipakai data melalui Portal Satu Data Indonesia antar instansi
pemerintah tidak diperlukan adanya nota kesepahaman atau perjanjian kerjasama.
• Kerjasama Data Tertentu
Dalam hal diperlukan kerjasama khusus/tematik/tertentu antar instansi dalam pelaksanaan
bagipakai data, Walidata Instansi Pemrakarsa berkoordinasi melalui Forum Satu Data dengan
melibatkan Pembina Data.
Integrasi System Yang Sudah Terjalin Antara BPS Dan Kementerian/Lembaga
• Simdasi (BPS) dan Dapodik (Kementerian Pendidikan dan Kebudayaan)
• Simdasi (BPS) dan EMIS Online (Kementerian Agama)
• Web Merah Putih
Rencana ke Depan
• Portal Indonesia Data Hub (INDAH) untuk mendukung Satu Data Indonesia
• Penggunaan Kode Wilayah Kemedagri sebagai Kode Referensi Kewilayahan
• Sistem Pemerintah Berbasis Elektronik (SPBE) melalui Portal SDI
NOTE : MATA KULIAH OFFICIAL STATISTICS LANJUTAN MERUPAKAN MATA KULIAH BARU DI
SEMESTER 4. JADI BELUM ADA SOAL DAN PEMBAHASAN UTS YANG DITAMPILKAN. SEBAGAI
GANTINYA, KAMI MENAMPILKAN LATIHAN SOAL DAN PEMBAHASANNYA. SEMOGA
RANGKUMAN DAN LATIHAN SOAL YANG KAMI BERIKAN DAPAT MEMBANTU TEMAN-TEMAN
BELAJAR. SEMANGAT
238
LATIHAN SOAL
1. The Open Definition 2.1 memdefinisikan karya terbuka sebagai berikut ini, kecuali …
a. Open License or Status
b. Access
c. Timely and Comprehensive
d. Machine Readability
e. Open Format
2. Dibawah ini yang bukan merupakan permasalahan dalam mewujudkan Satu Data Indonesia adalah
a. Lokasi data yang menyebar
b. Format data yang sama
c. Data yang saling tumpeng tindih
d. Data masih manual
e. Sulit mengelola tim dan infrastruktur
3. Dalam penyelenggaraan Satu Data Indonesia tingkat daerah, terdapat instansi daerah yang bertugas
mengelola dan menyebarluaskan data disebut juga sebagai …
a. Pembina data
b. Walidata Tk daerah
c. Walidata Pendukung
d. Konsumen data
e. Produsen data
4. Berikut ini merupakan tahapan dalam pengumpulan data,
1) Pembina data memberikan rekomendasi terkait metodelogi pengumpulan data
2) Produsen data mengumpulkan data dengan metodelogi yang telah disetujui
3) Terbitnya Penetapan Menteri PPN atau Kepala Bappenas tentang Data Prioritas dan Rencana Aksi
4) Produsen data memastikan data yang dikumpulkan sesuai dengan prinsip SDI
5) Pembina data menentukan landasan proses pengumpulan data, yang terdiri dari Standar Data,
Daftar yang Diputuskan Forum , dan Jadwal Pemukhiran/Rilis Data
6) Produsen data menyerahkan data yang sesuai prinsip SDI kepada walidata
Manakan urutan di bawah ini yang benar?
a. 3-5-1-4-2-6
b. 2-3-1-5-6-4
c. 2-3-1-4-5-6
d. 3-5-2-4-1-5
e. 3-5-1-2-4-6
5. Yang manakah yang bukan merupakan prinsip-prinsip SDI berdasarkan Perpres No.39 tahun 2019
…
a. Data yang dihasilkan oleh Produsen Data seperti lembaga ataupun instansi pemerintah harus
memenuhi Standar Data yang telah ditetapkan
b. Data yang dihasilkan oleh Produsen Data harus memiliki Metadata
c. Data yang dihasilkan tidak harus menggunakan Kode Referensi dan/atau Data Induk
d. Data yang dihasilkan oleh instansi dan lembaga sebagai produsen Data harus mengikuti kaidah
Interoperabilitas Data
e. Data yang diproduksi oleh instansi dan lembaga pembuat Data harus menggunakan Kode
Referensi dan/atau Data Induk.
6. Berikut ini yang bukan merupakan azas pembentukan standar data statistik
a. Relevansi, ketidakberpihakan, dan keterbukaan
239
b. Standar Profesional, Prinsip Ilmiah, dan Etika Profesional
c. Akuntabilitas dan Transparansi
d. Sumber Statistik Resmi
e. Pencegahan Terhadap Penyalahgunaan
7. Penggolongan data secara sistematis ke dalam kelompok atau kategori berdasarkan kriteria yang
ditetapkan oleh Pembina data atau dibakukan secara luas dalam komponen standar data disebut
a. Konsep
b. Definisi
c. Klasifikasi
d. Ukuran
e. Satuan
8. Metadata yang mengidentifikasi teknis pembuatan suatu data disebut …
a. Metadata Dekskriptif
b. Metadata Struktural
c. Metadata Fisik
d. Metadata Kegiatan Statistik Dasar
e. Metadata Kegiatan Statistik Sektoral
9. Manakan yang merupakan manfaat metadata bagi organisasi?
a. Memudahkan pencarian dan evaluasi informasi
b. Menghindari duplikasi
c. Mengurangi beban kerja
d. Memudahkan pengelolaan data sebagai investasi organisasi
e. Memudahkan identifikasi perolehan, perhitungan, dan estimasi data
10. Berikut ini manakan yang bukan manfaat dari interoperabilitas
a. Kemudahan dalam pengelolaan dan pengaksesan data
b. Pelayanan public yang lebih efektif
c. Pengambilan keputusan menjadi lebih relevan, akurat dan tepat waktu, karena waktu akses yang
lebih cepat
d. Koordinasi program lebih sulit
e. Iklim berdemokrasi yang lebih bagus
11. BPS mengevaluasi rancangan penyelenggaraan kegiatan survei yang disampaikan oleh
pemerintahan daerah merupakan tahapan prosedur penyelenggaraan statistik sektoral bagian?
a. Perencanaan data
b. Pemeriksaan data
c. Pengumpulan data
d. Penyebarluasan data
e. Penyerahan data
12. Dalam Perban No.4 tahun 2019 tentang NPSK, ada 10 prinsip penyelenggaraan statistik sektoral,
manakah yang tidak termasuk?
a. Statistik merupakan hasil dari suatu proses intelektual yang dapat dipertanggungjawabkan
secara ilmiah
b. Statistik mengacu pada standar ilmiah
c. Statistik tidak bebas dari kesalahanpenggunaan
d. Statistik memenuhi nilai kualitas, waktu, biaya, dan menghindari beban atau kejenuhan
responden
e. Statistik mampu menjamin secara ketat kerahasiaan informasi individu dan sumbernya
240
13. Manakah yang termasuk kriteria dalam penyelenggaraan statistik sektoral?
a. Relevan
b. Akurat
c. Tepat waktu
d. Mudah disebarkan
e. Mudah diakses
14. Manakah yang bukan isi dari formulir pemberitahuan survei statistik sektoral
a. Identifikasi penyelenggara survei
b. Penanggung jawab survei
c. Informasi khusus dari survei
d. Tujuan survei dan peubah yang dikumpulkan
e. Rancangan survei
15. Apa dasar hukum penetapan NSPK penyelenggaraan statistik sektoral?
a. Peraturan BPS No. 4 tahun 2019
b. Peraturan Presiden No. 39 tahun 2019
c. Pasal 17 ayat 2 UU No. 16 tahun 1997
d. Peraturan BPS No. 4 tahun 2020
e. Peraturan Kepala BPS No. 126 tahun 2020
16. Berikut ini merupakan pengertian indikator menurut beberapa sumber, kecuali…
a. Variabel kendali yang dapat digunakan untuk mengukur perubahan pada sebuah kejadian
b. Menunjukkan suatu fenomena atau kondisi tertentu
c. Tidak bisa dipakai untuk mengukur perubahan yang terjadi
d. Dituangkan berupa suatu angka (dapat disebut angka indeks)
e. Dapat dirumuskan dari satu atau lebih variabel
17. Yang termasuk ke dalam beberapa jenis indikator adalah, kecuali…
a. Rujukan
b. Output
c. Input
d. Evaluasi
e. Proses
18. Yang bukan kriteria untuk indikator yang baik menurut the New Economics Foundation adalah…
a. Important
b. Complex
c. Simple
d. Measurable
e. Action focused
19. Di bawah ini yang bukan merupakan standar yang harus dipenuhi indikator yang baik adalah…
a. Indikator yang dibutuhkan dan berguna.
b. Indikator memiliki manfaat operasional
c. Indikator sepenuhnya ditentukan.
d. Adalah layak untuk mengukur indikator.
e. Indikator telah diuji coba di lapangan atau digunakan secara operasional
20. Ada tiga yang harus selalu diperhatikan terhadap kredibilitas data yaitu
a. Unbias, Komprehensif, Reliability
b. Comparable, Komprehensif, Reliability
c. Reliability, Validity, Bias
241
d. Unbias, Reliability, Validity
e. Bias, Comparable, Variable
21. Yang tidak termasuk TPB/SDGs menyempurnakan MDGs adalah…
a. Comparable
b. Stakeholder
c. Hak Asasi Manusia
d. Komprehensif
e. Zero Goals
22. Tujuan Pembangunan Berkelanjutan di Indonesia adalah pembangunan yang menjaga :
a. Keberlanjutan kehidupan sosial keluarga
b. Peningkatan kesejahteraan ekonomi perusahaan
c. Kualitas lingkungan hidup yang buruk
d. Pembangunan yang menjamin keadilan dan terlaksananya tata Kelola
e. Peningkatan kesejahteraan keluarga
23. Tujuan SDGs ke 5 adalah..
a. Tanpa kelaparan
b. Tanpa kemiskinan
c. Kesetaraan gender
d. Pendidikan berkualitas
e. Ekosistem lautan
24. Upaya-upaya yang dilakukan untuk melengkapi data SDGs adalah…
a. Pembinaan data statistik
b. Data SDGs yang berstandar nasional
c. Kerja sama dengan K/L lain
d. Kerja sama dengan pemerintah daerah
e. Pembinaan data statistic khusus
25. Tujuan SDGs ke-10 adalah..
a. Berkurangnya kesenjangan
b. Ekosistem daratan
c. Energi bersih dan terjangkau
d. Kehidupan sehat dan sejahtera
e. Penanganan perubahan iklim
26. Yang dijadikan sebagai referensi tunggal data kependudukan Indonesia adalah…
a. KK
b. SIM
c. KTP
d. BPJS
e. NIK
27. Dalam langkah sinkronisasi SI dan DDA, yang bukan merupakan fitur dalam membuat Sistem
Informasi adalah…
a. Repository Data
b. Manajemen Statistik
c. Input dan Approve Data
d. Membuat mekanisme kompilasi data
e. Sinkronisasi Data
28. Yang bukan merupakan penyelenggara bagipakai data dalam tatanan SDI adalah..
a. Data disebarluaskan melalui hanya melalui Portal Satu Data Indonesia
242
b. Pengembangan Media Penyebarluasan/Bagipakai Data
c. Data yang diakses di Portal Satu Data Indonesia Tidak Dipungut Biaya
d. Data yang diakses di Portal Satu Data Indonesia Tidak Perlu MoU
e. Kerjasama Data Tertentu
29. Yang termasuk tahapan penyusunan DDA yaitu…
a. Persiapan, Pemrosesan, Evaluasi
b. Persiapan, Pengumpulan, Diseminasi
c. Persiapan, Pengumpulan, Evaluasi
d. Persiapan, Pemrosesan, Diseminasi
e. Persiapan, Pemeriksaan, Diseminasi
30. Statistik Indonesia merupakan publikasi BPS yang menyajikan beragam jenis data yang bersumber
dari BPS dan institusi lain. Publikasi ini memuat gambaran umum tentang keadaan berikut ini,
kecuali…
a. geografi dan iklim
b. pemerintahan
c. perkembangan kondisi sosial-demografi
d. ilmu pengetahuan dan teknologi
e. perekonomian di Indonesia
243
PEMBAHASAN
1. Jawaban : C.
The Open Definition 2.1. memiliki empat elemen atau prinsip yang mendefinisikan sebuah karya
terbuka:
a) Open License or Status. Karya harus berada dalam domain publik atau disediakan di bawah lisensi
terbuka.
b) Access. Karya harus disediakan secara keseluruhan dan tidak lebih dari biaya reproduksi satu kali
yang wajar, dan harus dapat diunduh melalui Internet tanpa biaya.
c) Machine Readability. Pekerjaan harus disediakan dalam bentuk yang siap diproses oleh komputer
dan di mana elemen individu dari pekerjaan dapat dengan mudah diakses dan dimodifikasi.
d) Open Format. Karya harus disediakan dalam format terbuka. Format terbuka adalah format yang
tidak memberikan batasan, moneter atau lainnya, pada penggunaannya dan dapat sepenuhnya
diproses dengan setidaknya satu alat perangkat lunak bebas/gratis/sumber terbuka.
2. Jawaban : B
a) Lokasi Data yang tersebar
b) Format data yang berbeda-beda
c) Data yang saling tumpang tindih antara instansi
d) Proses menghubungkan dan penyeragaman data yang sulit
e) Implementasi Lambat dan seringkali merubah sistem eksisting
f) Data masih manual
g) Tools yang tersedia tidak memadai dan tidak lengkap
h) Sulit mengelola tim dan infrastruktur
i) Faktor Keamanan, privasi dan regulasi pemerintah
3. Jawaban : B
a) Walidata Tk Daerah adalah instansi daerah yang bertugas mengelola dan menyebarluaskan data
b) Pembina data adalah perwakilan BPS di daerah, yang diberikan tugas sebagai Pengelola SImpul
Jaringan Pemerintah Daerah
c) Walidata Pendukung adalah unit kerja di instansi daerah, sesuai penugasan dari kepala daerah
d) Produsen data adalah instansi yang melaksanakan kegiatan pengumpulan data
4. Jawaban : E
Pengumpulan Data merupakan kegiatan produksi data berdasarkan daftar data yang telah
ditetapkan pada tahap Perencanaan Data, dan dipantau oleh Koordinator Forum SDI. Adapun
Tahapannya sebagai berikut:
a) Terbitnya Penetapan Menteri PPN atau Kepala Bappenas tentang Data Prioritas dan Rencana
Aksi
b) Pembina Data menentukan landasan proses pengumpulan data, yang terdiri dari Standar Data,
Daftar Data yang Diputuskan Forum, dan Jadwal Pemutakhiran/Rilis Data
c) Pembina Data memberikan rekomendasi terkait metodologi pengumpulan data
d) Produsen Data mengumpulkan data dengan metodologi yang telah disetujui
e) Produsen Data memastikan data yang dikumpulkan sesuai dengan Prinsip SDI
f) Produsen Data menyerahkan Data yang sudah sesuai Prinsip SDI kepada Walidata
5. Jawaban : C
Berdasarkan Perpres no. 39 tahun 2019 mengenai SDI. SDI harus dilakukan berdasarkan prinsip-
prinsip sebagai berikut :
a) Data yang dihasilkan oleh Produsen Data seperti lembaga ataupun instansi pemerintah harus
memenuhi Standar Data yang telah ditetapkan
244
b) Data yang dihasilkan oleh Produsen Data harus memiliki Metadata
c) Data yang dihasilkan oleh instansi dan lembaga sebagai produsen Data harus mengikuti kaidah
Interoperabilitas Data dan
d) Data yang diproduksi oleh instansi dan lembaga pembuat Data harus menggunakan Kode
Referensi dan/atau Data Induk.
6. Jawaban : E
Azas pembentukan standar data statistik terdiri dari
a) Relevansi, ketidakberpihakan, dan keterbukaan
b) Standar Profesional, Prinsip Ilmiah, dan Etika Profesional
c) Akuntabilitas dan Transparansi
d) Sumber Statistik Resmi
e) Koheren dengan Penggunaan Standar Internasional
f) Berdimensi Pembangunan
7. Jawaban : C
8. Jawaban : B
9. Jawaban : D
10. Jawaban : D
11. Jawaban : B
Prosedur Pemeriksaan Data :
a) BPS mengevaluasi rancangan penyelenggaraan kegiatan Survei yang disampaikan oleh
Pemerintah Daerah,
b) BPS memberikan rekomendasi kepada Pemerintah Daerah berupa surat rekomendasi
berdasarkan hasil evaluasi.
c) Surat rekomendasi disampaikan kepada Perangkat Daerah yang menangani urusan
pemerintahan bidang statistik serta ditembuskan kepada Perangkat Daerah pelaksana urusan
pemerintahan bidang perencanaan.
d) Penyelenggaraan Survei yang sudah mendapatkan rekomendasi, wajib mencantumkan identitas
rekomendasi pada kuesioner.
12. Jawaban : C
13. Jawaban : D
14. Jawaban : C
Formulir pemberitahuan survei statistik sektoral tediri dari sebagai berikut :
a) Identifikasi penyelenggara survei (instansi dan alamat)
b) Penanggung jawab survei (nama penanggung jawab dan jabatan)
c) Informasi umum survei (keberlangsungan survei, tipe survei)
d) Tujuan survei dan peubah yang dikumpulkan
e) Rancangan survei (metode sampling, responden, cakupan, dll)
f) Rancangan sampel (kerangka sampel, sampling error, dll)
15. Jawaban : A
Dasar hukum penetapan NSPK ada pada
a) Peraturan BPS No. 4 tahun 2019 berisi tentang Norma, Standar, Prosedur, Kriteria
penyelenggaraan statistik nasional
b) UU No.23 tahun 2014 tentang Pemerintah Pusat pasal 16 ayat 1 mengenai kewenangan
pemerintah pusat
Sementara pilihan lain merupakan dasar hukum :
a) Peraturan Presiden No. 39 tahun 2019 berisikan tentang tata kelola data nasional (dasar hukum
SDI)
245
b) Pasal 17 ayat 2 UU No. 16 tahun 1997 tentang statistik (dasar hukum standar data)
c) Peraturan BPS No. 4 tahun 2020 berisikan tentang petunjuk teknis standar data statistik (dasar
hukum standar data)
d) Peraturan Kepala BPS No. 126 tahun 2020 berisikan tentang master file standar data statistik
tahun 2020 (dasar hukum standar data)
16. Jawaban : C
Pengertian indikator menurut beberapa sumber:
• Variabel kendali yang dapat digunakan untuk mengukur perubahan pada sebuah kejadian
• KBBI : sesuatu yang dapat memberikan petunjuk atau keterangan
• Menunjukkan suatu fenomena atau kondisi tertentu
• Bisa dipakai untuk mengukur perubahan yang terjadi
• Dituangkan berupa suatu angka (dapat disebut angka indeks)
• Dapat dirumuskan dari satu atau lebih variabel
17. Jawaban : D
Jenis indikator:
• Rujukan: data yang menyatakan kelompok sasaran dari permasalahan/program
• Input: sumber daya yang digunakan dalam pelaksanaan kegiatan/program
• Proses: partisipasi kelompok sasaran dalam kegiatan/program
• Output: hasil dari suatu kegiatan/program
• Outcome: manfaat dari program bagi kelompok sasaran/masyarakat
18. Jawaban : B
the New Economics Foundation mengidentifikasi kriteria untuk indikator, yang terus menjadi
panduan yang berguna dalam memutuskan apakah suatu indikator merupakan indikator yang baik:
• Action focused (Fokus Tindakan). Indikator harus mengarah pada tindakan. Jika pemangku
kepentingan tidak dapat membayangkan apa yang harus dilakukan dengan data dari suatu
indikator, maka itu mungkin bukan indikator yang baik.
• Important (Penting).Pemangku kepentingan harus setuju bahwa indikator dan data yang akan
dihasilkannya memberikan kontribusi yang relevan dan signifikan untuk menentukan cara
merespons epidemi secara efektif.
• Mesurable (terukur).Metodologi pengumpulan data tidak hanya harus didefinisikan, tetapi juga
harus layak untuk mengumpulkan data.
• Simple (Sederhana). Indikator dibuat sesederhana mungkin sehingga bisa dimengerti oleh
audiens yang lebih luas (tidak ahli). Daripada mengejar indikator yang sempurna, jauh lebih baik
untuk mengidentifikasi indikator yang baik dan sederhana yang menyediakan data yang dapat
digunakan.
19. Jawaban : B
Indikator yang baik harus memenuhi lima standar berikut:
1. Indikator yang dibutuhkan dan berguna.
2. Indikator memiliki manfaat teknis.
3. Indikator sepenuhnya ditentukan.
4. Adalah layak untuk mengukur indikator.
5. Indikator telah diuji coba di lapangan atau digunakan secara operasional
20. Jawaban : C
Ada tiga yang harus selalu diperhatikan terhadap kredibilitas data:
• Validity (Keabsahan): Sejauh mana suatu pengukuran atau tes secara akurat mengukur apa yang
dimaksudkan untuk diukur.
246
• Reliability (Keandalan): Konsistensi data ketika dikumpulkan berulang kali dengan
menggunakan prosedur yang sama dan dalam kondisi yang sama.
• Bias: Setiap efek selama pengumpulan atau interpretasi informasi yang mengarah pada kesalahan
sistematis dalam satu arah
21. Jawaban : A
TPB/SDGs menyempurnakan MDGs
• Komprehensif : lebih komprehensif disusun dengan melibatkan lebih banyak negara dengan
tujuan yang universal untuk negara maju dan berkembang.
• Sumber Pendanaan : memperluas sumber pendanaan, selain bantuan negara maju juga sumber
swasta.
• HAM : menekankan pada HAM agar diskriminasi tidak terjadi dalam penanggulangan kemiskinan
dalam segala dimensinya.
• Inklusif : secara specific menyasar kepada yang rentan-no one left behind.
• Stakeholder : pelibatan seluruh pemangku kepentingan (pemerintah, OMS & media, filantropi &
pelaku usaha, serta pakar & akademisi).
• Zero Goals : MDGs hanya menargetkan pengurangan “setengah”, SDGs menargetkan untuk
menuntaskan seluruh indikator -> “Zero Goals” .
• Cara Pelaksanaan : tidak hanya memuat Goals tetapi juga cara pelaksanaan.
22. Jawaban : D
Tujuan Pembangunan Berkelanjutan di Indonesia adalah pembangunan yang menjaga :
• Keberlanjutan kehidupan sosial masyarakat
• Peningkatan kesejahteraan ekonomi masyarakat
• Kualitas lingkungan hidup
• Pembangunan yang menjamin keadilan dan terlaksananya tata Kelola
23. Jawaban : C
24. Jawaban : C
UPAYA LAIN MELENGKAPI DATA SDGs
• Kerja sama dengan K/L lain
BPS bekerja sama dengan Kementerian/Lembaga telah dapat menghasilkan 39 indikator SDGs
• Pembinaan Data Sektoral
247
Melalui Perpres Satu Data Indonesia, BPS melakukan pembinaan data sektoral. Saat ini, ada 183
indikator SDGs yang merupakan data sektoral dan menjadi tanggung jawab K/L yang
bersangkutan yang perlu pembinaan
• Data SDGs yang Berstandar Global
BPS dengan disupport oleh UN (Unicef, UNFPA, UNDP, FAO dan UN yang lain) mengusahakan
agar data SDGs yang ada berstandar global, saat ini telah ada 33 indikator SDGs yang dihasilkan
oleh BPS berstandar global
25. Jawaban : A
26. Jawaban : E
NIK (Nomor Induk Kependudukan) -> sebagai referensi tunggal data kependudukan Indonesia
27. Jawaban : B
Membuat Sistem Informasi dengan fitur :
a. Repository Data
b. Manajemen Metadata
c. Input dan Approve Data
d. Membuat mekanisme kompilasi data
e. Monitoring dan Evaluasi
f. Sinkronisasi Data
g. Penyediaan Mekanisme dan Data untuk Dibagipakaikan
28. Jawaban : A
Penyelenggara Bagipakai Data dalam Tatanan SDI
• Data disebarluaskan melalui Portal Satu Data Indonesia dan Media Lainnya
Sampai saat ini, instansi dapat menggunakan media lain untuk menyebarluaskan data sepanjang
terintegrasi dengan Portal Satu Data Indonesia.
• Pengembangan Media Penyebarluasan/Bagipakai Data
Pengembangan media penyebarluasan/bagipakai data oleh instansi dilaksanakan dengan
mengikuti perundangan yang berlaku tentang Sistem Pemerintahan Berbasis Elektronik dan
diintegrasikan dengan Portal Satu Data Indonesia.
• Data yang diakses di Portal Satu Data Indonesia Tidak Dipungut Biaya
Dalam melakukan akses dan bagipakai data melalui Portal Satu Data Indonesia antar instansi
pemerintah tidak ada biaya yang dikenakan.
• Data yang diakses di Portal Satu Data Indonesia Tidak Perlu MoU
248
Dalam melakukan akses dan bagipakai data melalui Portal Satu Data Indonesia antar instansi
pemerintah tidak diperlukan adanya nota kesepahaman atau perjanjian kerjasama.
• Kerjasama Data Tertentu
Dalam hal diperlukan kerjasama khusus/tematik/tertentu antar instansi dalam pelaksanaan
bagipakai data, Walidata Instansi Pemrakarsa berkoordinasi melalui Forum Satu Data dengan
melibatkan Pembina Data.
29. Jawaban : B
Tahapan penyusunan DDA
• Persiapan
oUpdating menggunakan Aplikasi yang telah disediakan (simDASI)
oUpdating tabel yang akan disajikan pada DDA 2022
oPenyiapan template tabel
• Pengumpulan
oInteroperabilitas data di BPS RI
oPengumpulan data di daerah
oInput data di Simdasi
• Diseminasi
oFGD data sebelum rilis
oRilis serentak sesuai Senarai Rencana Terbit (Advanced Release Calendar)
30. Jawaban : D
Statistik Indonesia merupakan publikasi BPS yang menyajikan beragam jenis data yang bersumber
dari BPS dan institusi lain. Publikasi ini memuat gambaran umum tentang keadaan geografi dan iklim,
pemerintahan, serta perkembangan kondisi sosial-demografi dan perekonomian di Indonesia.
249
KONSEP DASAR SAINS DATA
251
Cross-Industry Standard Process for Data Mining (CRISP-DM)
A. PENGENALAN R
Diluncurkan pada tahun 1993 oleh Ross Ihaka dan Robert Gentlemen. Tersedia versi GUI-nya
berupa R-Studio.
Kelebihan
1. Didukung oleh library pengolahan data dan analisis statistik yang lengkap
2. Gratis dan open source
3. Mendukung versi markdown melalui RMarkdown, yaitu antara code/script, output, dan catatan
terintegrasi menjadi satu.
4. Tersedia layanan Cloud tanpa perlu instalasi melalui R-Studio Cloud
252
B. PENGENALAN PYTHON
Diluncurkan pada 1991 oleh Guido van Rossum. Sangat populer sebagai Bahasa pemrograman
dan sangat digemari oleh komunitas machine learning.
Kelebihan
1. Didukung oleh library-library pengolahan data yang lengkap, sama seperti R
2. Gratis dan open source
3. Terpopuler untuk pengolahan dengan teknik deep learning
4. Mendukung versi markdown melalui Jupyter Notebook, yaitu antara code/script, output, dan
catatan terintegrasi menjadi satu.
5. Tersedia layanan Cloud tanpa perlu instalasi melalui Google Colaboratory
DASAR PEMROGRAMAN
A. R SESSION
Sebuah R session terdiri dari langkah memulai R, menggunakan R untuk bekerja/analisa dan
kemudian penutupan R (gunakan fungsi q()). Dalam penggunaan R kita akan banyak menggunakan
fungsi-fungsi yang terdapat di R. Fungsi (function) adalah sebuah program kecil yang dapat
dijalankan untuk tujuan tertentu.
B. R STUDIO
RStudio merupakan suatu Integrated Development Environment (IDE) untuk R. Sebagaimana R,
RStudio juga bersifat gratis dan open sorce. RStudio tersedia dalam dua edisi, yaitu: RStudio Desktop
dan RStudio Server. RStudio Desktop berjalan secara lokal di komputer, sebagaimana aplikasi
desktop biasa lainnya. Sedangkan RStudio Server berjalan pada remote Linux server dan bisa diakses
dan dijalankan oleh komputer lainnya melalui jaringan.
C. DASAR-DASAR R
• R Sebagai Calculator, fungsi paling sederhana dari R adalah sebagai kalkulator. Input pada R
console.
• Assignment, Dalam R kita dapat memasukkan satu atau lebih nilai kepada sebuah object (ingat R
adalah Object Oriented Programming).
• Fungsi-fungsi sederhana R. terdapat banyak sekali fungsi dalam R, sehingga tidak memungkinkan
dimuat di sini semua. Namun yang utama adalah kita mengenal fungsi dasar matematika dan
fungsi-fungsi statistika
D. FUNGSI
Untuk hal yang sering dilakukan cukup ditulis satu kali dan saat diperlukan cukup dipanggil
SIntaks
name <- function(arg1, arg2, …) {
expression return()
}
E. IF STATEMENT
1. If (Hanya untuk vector berukuran 1)
Sintaks
if(cond1=true) {cmd1} else {cmd2}
253
2. Ifelse (untuk vector dengan panjang n)
Sintaks
ifelse(test, true_value, false_value
3. Switch (Untuk memilih lebih dari dua pilihan)
Sintaks
Switch (EXPR, …)
F. LOOP
1. For (Perulangan dilakukan sesuai dengan nilai pada counter
Sintaks
for (Vector counter) {statements}
2. While (Pengulangan dilakukan dengan memeriksa kondisi)
Sintaks
while (condition) {statements}
3. Repeat (Pengulangan dilakukan dengan memeriksa kondisi. Kondisi di periksa setelah
statement dilakukan)
Sintaks
repeat {Statements … if (condition) {breaks}}
G. APPLY
1. Apply (Untuk perulangan yang dapat digunakan pada matriks, vector dataframe, maupun list)
Sintaks
apply (X, Margin, Fun, Args)
2. Tapply (Melakukan implementasi dari sebuah fungsi ke array atau vector berjenis kategorik)
Sintaks
tapply (vector, factor, FUN)
3. Lapply dan sapply (Melakukan implementasi dari sebuah fungsi ke vector atau list)
Sintaks
• Lappy -> menghasilkan list (lapply (x, FUN))
• Sapply -> menghasilkan vector atau matrix (sapply (x, FUN))
DATA PREPARATION
254
o Majority class
o Minority class
B. VALIDASI DATA
Validasi data ingin mengonfirmasi apakah data memenuhi asumsi berdasarkan disiplin ilmu
tertentu (domain knowledge).
1. Aturan Validasi
• Jika responden menyatakan memiliki penghasilan dari 'kegiatan lain’; kolom ‘kegiatan
lainnya’ harus diisi,
• Seseorang yang berusia di bawah 15 tahun tidak dapat berpartisipasi dalam kegiatan
ekonomi,
• 'Kode wilayah' yang dikirimkan harus ada dalam daftar kode resmi,
• Hasil penjumlahan laba dan total biaya harus sama dengan dengan total pendapatan,
• Pasangan suami istri harus memiliki tahun perkawinan yang sama,
• Jika seseorang adalah anak dari referenced person, maka kode ayah dari anak tersebut harus
sama dengan kode referenced person,
• Jumlah karyawan harus sama dengan atau lebih besar dari nol, dst
2. Package “validate”
Dengan package ini, Anda bisa melakukan:
• Konfrontasi data dengan sekumpulan rules validasi yang bisa digunakan Kembali;
• Investigasi, membuat ringkasan, dan memvisualisasikan hasil validasi data;
• Import and export sekumpulan rules dari dan ke berbagai format;
• Memfilter, memilah dan memanipulasi rules validasi;
• Investigate, membuat ringkasan, dan visualisasi rule validasi.
C. DATA CLEANSING
1. Best Practice
Simpan data untuk setiap tahapan (raw, technically correct, consistent, aggregated and
formatted) secara terpisah agar bisa digunakan lagi jika diperlukan. Setiap langkah antar tahapan
dapat dilakukan dengan Rscript terpisah agar bisa direproduksi.
2. Missing Values
a) Solusi umum untuk missing data: listwise deletion (complete case analysis).
• Pro: mudah, default.
• Kontra: substantially lower the sample size, leading to a severe lack of power. It can also
lead to biased results, depending on why and in which patterns the data are missing.
• Fungsi untuk belajar missing values: help
b) Mekanisme hilangnya data
• MCAR (Missing Completely at Random)
• MAR (Missing at Random)
• MNAR (Missing Not at Random)
3. Outliers
a) Definisi
pengamatan dalam kumpulan data tertentu yang terletak jauh dari pengamatan lainnya.
• Alasan umum adanya outlier dalam datasetHuman error
• Intentional errors
• Sampling error
255
• Data processing error
• Sebagai akibat dari kesalahan instrument
• Experimental error
• Natural outliers
b) Jenis Outlier
• Univariate outliers
• Multivariate outliers
• Global outliers
• Collective outliers
• Contextual
• conditional outlier
c) How to identify outliers
• With box plot
• With scatter plot
• With DBSCAN
• With Z-Score
• With Inter Quartile Range (IQR)
• Z-Score or Extreme Value Analysis (parametric)
• Probabilistic and Statistical Modeling (parametric)
• Linear Regression Models (PCA, LMS)
• Proximity Based Models (non-parametric)
• Information Theory Models
• High Dimensional Outlier Detection Methods (high dimensional sparse data)
d) Menangani outliers di R
• Trimming/removing the outlier
• Quantile based flooring and capping
• Mean/Median/specific number imputation
4. Merapikan Data
a) Aturan dataset yang rapi
• Variabel ada di kolom
• Observasi ada di baris,
• Nilai ada di sel.
• Fungsi yang bergunaseparate();
• unite();
• pivot_longer();
• pivot_wider()
256
DATA WRANGLING
Data wrangling, seni mendapatkan data Anda ke R dalam bentuk yang berguna untuk visualisasi
dan pemodelan. Perselisihan data sangat penting: tanpa itu Anda tidak dapat bekerja dengan data Anda
sendiri! Ada tiga bagian utama untuk perselisihan data: import, tidy, transform. Data wrangling juga
mencakup transformasi data, yang telah sedikit dipelajari
A. TIBBLE
Tibbles adalah bingkai data, tetapi mereka mengubah beberapa perilaku yang lebih tua untuk
membuat hidup sedikit lebih mudah. R adalah bahasa lama, dan beberapa hal yang berguna 10 atau
20 tahun yang lalu sekarang menghalangi Anda. Sulit untuk mengubah basis R tanpa melanggar kode
yang ada, sehingga sebagian besar inovasi terjadi dalam paket. Di sini kita akan menjelaskan
tibble package, yang menyediakan bingkai data opini yang membuat bekerja di tidyverse sedikit lebih
mudah. Di sebagian besar tempat, saya akan menggunakan istilah tibble dan bingkai data secara
bergantian; ketika saya ingin menarik perhatian khusus pada kerangka data bawaan R, saya akan
menyebutnya data.frames. Dalam bab ini kita akan mengeksplorasi tibble package, bagian dari core
tidyverse.
Jika Anda sudah terbiasa dengan data.frame(), perhatikan bahwa tibble() tidak lebih sedikit:
tidak pernah mengubah jenis input (misalnya tidak pernah mengubah string menjadi faktor!), Itu
tidak pernah mengubah nama variabel, dan tidak pernah membuat nama baris. Dimungkinkan untuk
dapat diidiksi untuk memiliki nama kolom yang bukan nama variabel R yang valid, alias nama non-
sintaksis. Misalnya, mereka mungkin tidak mulai dengan huruf, atau mereka mungkin berisi karakter
yang tidak biasa seperti spasi.
B. TIDY DATA
Mendapatkan data Anda ke dalam format ini membutuhkan beberapa pekerjaan dimuka, tetapi
pekerjaan itu terbayar dalam jangka panjang. Setelah Anda memiliki data yang rapi dan alat rapi yang
disediakan oleh paket di tidyverse, Anda akan menghabiskan lebih sedikit waktu mengumpulkan
data dari satu representasi ke representasi lainnya, memungkinkan Anda untuk menghabiskan lebih
banyak waktu pada pertanyaan analitik yang ada. Anda dapat mewakili data dasar yang sama dalam
berbagai cara. Contoh di bawah ini menunjukkan data yang sama yang diatur dalam empat cara
berbeda. Setiap dataset menunjukkan nilai yang sama dari empat variabel negara, tahun, populasi, dan
kasus, tetapi setiap dataset mengatur nilai dengan cara yang berbeda.
Ada tiga aturan yang saling terkait yang membuat dataset tidy:
3. Setiap variabel harus memiliki kolom sendiri.
4. Setiap pengamatan harus memiliki baris sendiri.
5. Setiap nilai harus memiliki sel sendiri.
Ketiga aturan ini saling terkait karena tidak mungkin hanya memuaskan dua dari tiga.
Keterkaitan itu mengarah pada serangkaian instruksi praktis yang lebih sederhana:
1. Masukkan setiap dataset ke dalam tibble
2. Menempatkan setiap variabel dalam kolom.
C. RELATIONAL DATA
Relations selalu didefinisikan antara sepasang tabel. Semua hubungan lain dibangun dari ide
sederhana ini: hubungan tiga atau lebih tabel selalu menjadi milik hubungan antara masing-masing
pasangan. Terkadang kedua elemen pasangan bisa menjadi tabel yang sama.
257
Untuk bekerja dengan relational data Anda memerlukan kata kerja yang bekerja dengan
pasangan tabel. Ada tiga keluarga kata kerja yang dirancang untuk bekerja dengan data relasional:
• Bermutasi bergabung, yang menambahkan variabel baru ke satu bingkai data dari pencocokan
pengamatan di yang lain.
• Pemfilteran bergabung, yang memfilter pengamatan dari satu bingkai data berdasarkan apakah
mereka cocok dengan pengamatan di tabel lain atau tidak.
• Atur operasi, yang memperlakukan pengamatan seolah-olah mereka adalah elemen yang
ditetapkan.
Tempat paling umum untuk menemukan data relasional adalah dalam sistem manajemen
database relasional (atau RDBMS), istilah yang mencakup hampir semua database modern. Jika Anda
pernah menggunakan database sebelumnya, Anda hampir pasti menggunakan SQL. Umumnya, dplyr
sedikit lebih mudah digunakan daripada SQL karena dplyr mengkhususkan diri untuk melakukan
analisis data: itu membuat operasi analisis data umum lebih mudah, dengan mengorbankan
membuatnya lebih sulit untuk melakukan hal-hal lain yang biasanya tidak diperlukan untuk analisis
data.
D. STRINGS
Ekspresi reguler berguna karena string biasanya berisi data tidak terstruktur atau semi-
terstruktur, dan regexps adalah bahasa ringkas untuk menggambarkan pola dalam string. Ketika
Anda pertama kali melihat regexp, Anda akan berpikir seekor kucing berjalan melintasi keyboard
Anda, tetapi ketika pemahaman Anda meningkat, mereka akan segera mulai masuk akal. Bab ini akan
fokus pada paket stringr untuk manipulasi string, yang merupakan bagian dari inti tidyverse.
Anda dapat membuat string dengan satu kutipan atau kutipan ganda. Tidak seperti bahasa lain,
tidak ada perbedaan dalam perilaku. Saya sarankan selalu menggunakan ", kecuali jika Anda ingin
membuat string yang berisi banyak".
string1 <- "This is a string"
string2 <- 'If I want to include a "quote" inside a string, I use single
quotes'
Base R berisi banyak fungsi untuk bekerja dengan string tetapi kita akan menghindarinya karena
mereka bisa tidak konsisten, yang membuat mereka sulit diingat. Sebagai gantinya kita akan
menggunakan fungsi dari stringr. Ini memiliki nama yang lebih intuitif, dan semua dimulai dengan
str_. Misalnya, str_length() memberi tahu Anda jumlah karakter dalam string:
str_length(c("a", "R for data science", NA))
#> [1] 1 18 NA
E. FACTORS
Secara historis, faktor jauh lebih mudah untuk bekerja dengan daripada karakter. Akibatnya,
banyak fungsi di basis R secara otomatis mengubah karakter menjadi faktor. Ini berarti bahwa faktor-
faktor sering muncul di tempat-tempat di mana mereka tidak benar-benar membantu. Untungnya,
Anda tidak perlu khawatir tentang itu di sisi yang rapi, dan dapat fokus pada situasi di mana faktor-
faktor yang benar-benar berguna.
Bayangkan Anda memiliki variabel yang mencatat bulan:
x1 <- c("Dec", "Apr", "Jan", "Mar")
Menggunakan string untuk merekam variabel ini memiliki dua masalah:
1. Hanya ada dua belas bulan yang mungkin, dan tidak ada yang menyelamatkan Anda dari kesalahan
ketik:
X1 <- c("Dec", "Apr", "Jan", "Mar")
258
2. Itu tidak menyortir:
sort(x1)
#> [1] "Apr" "Dec" "Jan" "Mar"
3. Anda dapat memperbaiki kedua masalah ini dengan suatu faktor. Untuk membuat faktor, Anda
harus mulai dengan membuat daftar level yang valid:
month_levels <- c(
"Jan", "Feb", "Mar", "Apr", "May", "Jun",
"Jul", "Aug", "Sep", "Oct", "Nov", "Dec"
)
Sekarang Anda dapat membuat faktor:
y1 <- factor(x1, levels = month_levels)
y1
#> [1] Dec Apr Jan Mar
#> Levels: Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
sort(y1)
#> [1] Jan Mar Apr Dec
#> Levels: Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
259
EKSPLORASI DAN VISUALISASI DATA
A. STATISTIK DESTKRIPTIF
Terdiri atas ukuran pemusatan yaitu mean, median, modus, dan fraktil (quartil, desil, dan
persentil). Kemudian pula ukuran penyebaran/dispersi yaitu range, interquartile range, varians, dan
standar deviasi serta koefisien variasi. Kita bisa menggunakan R untuk melihat summary statistucs
yang terdiri dari min, quartil 1, median, mean, kuartil tiga dan nilai maksimum.
B. VISUALISASI DATA di R
Packages khusus untuk grafik
• grid
• lattice
• Ggplot2
Fungsi
• his () -> histogram
• boxplot () -> box-and-whisker plot
• stem () -> stem and leaf plot
• pie () -> pie chart
• persp () -> tiga dimensi scatter plot
• qqnorm (), qqline (), qqplot () -> pengecekan kenormalan data secara visual
• pairs () -> scatter plot lebih dari dua variabel
NOTE : MATA KULIAH PENGANTAR SAINS DATA MERUPAKAN MATA KULIAH BARU DI
SEMESTER 4. JADI BELUM ADA SOAL DAN PEMBAHASAN UTS YANG DITAMPILKAN. SEBAGAI
GANTINYA, KAMI MENAMPILKAN LATIHAN SOAL DAN PEMBAHASANNYA. SEMOGA
RANGKUMAN DAN LATIHAN SOAL YANG KAMI BERIKAN DAPAT MEMBANTU TEMAN-TEMAN
BELAJAR. SEMANGAT
260
LATIHAN SOAL
1. Dalam metodologi Sains Data terdapat KDD dan CRISP-DM, apakah sebenarnya mereka berbeda pada
konsepnya?
2. Dengan menggunakan data di bawah ini, menggunakan syntax data.frame()susunlah kembali
data di bawah ini
Jurusan Usia
Statistika 26
Komputasi Statistik 28
Ekonomi 27
Komunikasi 29
Statistika 26
Komputasi Statistik 27
Ekonomi 26
Komunikasi 26
Ekonomi 30
Komunikasi 26
3. Cek missing value pada data airquality yang sudah disediakan di R (airquality). Kemudian cek
apakah terdapat missing value pada data tersebut, kemudian ganti datanya dengan menggunakan
median dari data itu.
4. Dengan menggunakan R Studio berdasarkan data yang ditautkan pada link berikut:
https://s.stis.ac.id/DATA_PSD
Dari data tersebut, buatlah scatter plot antara Survival Time (Y) dan Umur (X) menurut variabel
Pecandu Rokok (Dua scatter plot)
PEMBAHASAN
1. Secara alur berpikir. Alur cycle untuk antar sub proses ataupun dari first dan last proses. Umumnya
alur disini membuat kita berfikir jika ada hal yang dirasa salah ketika berada dalam satu sub proses,
maka kita harus mundur untuk memperbaikinya. Jikapun tidak menemukan akar permasalahannya,
maka selesaikan hingga proses terakhir dan evaluasi secara keseluruhan untuk memperbaiki analisis
selanjutnya. Walaupun sekilas mereka mempunyai nama yang berbeda dalam sub prosesnya, secara
umum mereka mempunyai mindmap yang sama. Berikut adalah perbandingan dari kedua proses
tersebut:
KDD CRISP-DM
Pre KDD Business
Understanding
Selection Data Understanding
Pro Processing
Transformation Data Preparation
Data Mining Modeling
Interpretation/Evaluation Evaluation
Post KDD Deployment
Keterangan: Yang dishading segaris merupakan proses yang sama.
261
2. Syntax di bawah ini dapat digunakan
#Mengisi nilai untuk masing-masing kolom
Jurusan<-c("Statistika","Komputasi
Statistik","Ekonomi","Komunikasi","Statistika",
"Komputasi
Statistik","Ekonomi","Komunikasi","Ekonomi","Komunikasi")
Usia<-c("26","28","27","29","26","27","26","26","30","26")
#Menyatukan nilai-nilai tersebut
Data<-data.frame(Jurusan,Usia)
#Melihat tabel yang telah dibuat
View(Data)
262
sum(is.na(data$Solar.R))
sum(is.na(data$Wind))
sum(is.na(data$Temp))
sum(is.na(data$Month))
sum(is.na(data$Day))
Datafix<-airquality
#Mengganti Missing value dengan median yang sudah ditentukan sebelumnya
Datafix$Ozone[which(is.na(Datafix$Ozone))]<-21 #Median ozone is 21
Datafix$Solar.R[which(is.na(Datafix$Solar.R))]<-194 # median solar is 194
#Melihat data akhir
View(Datafix)
263
Kemudian setelah dilakukan penggantian missing value dengan syntax di atas maka hasilnya akan seperti
di bawah ini.
264
4. Syntax di bawah ini dapat digunakan (Menggunakan ggplot)
#LAKUKAN IMPORT DATA TERLEBIH DAHULU
library(readxl)
Data<-read_excel("C:/Users/user/Downloads/DATA LATIHAN PSD.xlsx")
View(Data)
#Package di bawah ini akan digunakan
library(tidyverse)
#Dalam contoh ini, nama tabelnya adalah "Data"
ggplot(Data,aes(x=Umur,y=Survival_Time))+
geom_point()+
scale_x_continuous("Umur")+
scale_y_continuous("Survival Time")+
265
labs(title="Scatter Plot Antara Survival Time
dan Umur Menurut Candu atau Tidak
Terhadap Rokok")+
theme_light()+facet_wrap(~Pecandu_Rokok)
266
PENGERTIAN SISTEM INFORMASI GEOGRAFIS
A. DEFINISI SIG
- Sistem Informasi merupakan sekumpulan komponen terintegrasi untuk mengumpulkan,
menyimpan, dan memproses data guna menghasilkan informasi, pengetahuan, dan produk
terkait lainnya
- Informasi Geografis merupakan informasi mengenai tempat-tempat, pengetahuan mengenai
letak objek dan informasi mengenai atribut yang terdapat di permukaan bumi yang posisinya
diketahui.
- Sistem Informasi Geografis (SIG) merupakan
• Sistem informasi yang dirancang untuk data yang memuat elemen lokasi.
• Sistem komputer untuk “menangkap”, menyimpan, memeriksa, mengolah dan
menampilkan data yang terkait dengan posisinya di permukaan bumi
- Secara umum, masalah geografis dikelompokkan menurut :
• Skala dan detil geografis → Misal : level lokal, regional, atau global.
• Maksud dan tujuan pemecahan → Misal : meminimumkan biaya, menyelamatkan jiwa,
dsb.
• Keingintahuan manusia → Misal : Bagaimana perubahan kawasan hunian atau pola
penyebaran kawasan hunian, dsb.
C. KOMPONEN SIG
Sebagai sistem SIG terdiri dari beberapa komponen terkait yaitu
- Data
- Procedures
- Hardware
268
- Software
- People
- Network
- Applications
E. PERKEMBANGAN SIG
Secara umum, era perkembangan SIG yaitu :
- Era Inovasi (Tahun 1963 – 1973)
- Era Komersialisasi (Tahun 1981 – 1999)
- Era keterbukaan dan penggunaan yang meluas (Tahun 2000 – sekarang)
269
SIFAT DATA GEOGRAFIS
270
- Skala merupakan resolusi spasial atau level detail dari data. Selain itu, skala juga diartikan
dengan cakupan proyek (wilayah, biaya, dan banyak orang yang terlibat). Skala peta adalah
rasio antara ukuran di peta dengan ukuran di dunia nyata, dinyatakan dalam pecahan.
Autokorelasi spasial sangat tergantung dari skala penyajian data.
B. SAMPLING SPASIAL
- Kerangka sampling merupakan himpunan seluruh peristiwa atau kejadian yang memenuhi
syarat(sesuai kriteria yang ditetapkan). Kerangka sampling spasial dapat berupa empat
persegi panjang atau himpunan objek geografis tertentu. Kualitas data geografis sangat
bergantung pada kualitas sampling yang digunakan untuk menghasilkan data.
- Teknik sampling spasial yang digunakan adalah sebagai berikut.
• Simple random sampling
Pemilihan n sampel dari populasi berukuran N dalam batas wilayah yang telah
ditetapkan sebagai wilayah populasi dilakukan secara acak sederhana. Kelemahan: ada
kemungkinan sampel terpilih berada di lokasi yang sulit disurvei.
• Systematic spatial sampling
Perlu dihitung interval k=N/n dan tiap elemen ke-k dipilih menjadi sampel. Secara
spasial, interval diterjemahkan dengan kisi-kisi(grid) berupa garis tegak dan mendatar
dengan jarak sama. Titik perpotongan dua garis tersebut akan menjadi sampel terpilih.
• Stratified random sampling
Wilayah populasi dibagi habis ke dalam n sub wilayah dengan luas yang sama dan setiap
sub wilayah diwakili oleh satu sampel.
• Stratified sampling with random variation in grid spacing
Teknik ini mirip dengan systematic spatial sampling, hanya saja interval kisinya dibuat
bervariasi.
• Clustered sampling.
Wilayah populasi dibagi ke dalam sub-sub wilayah yang berfungsi sebagai kluster.
Pemilihan dilakukan terhadap sub wilayah, kemudian seluruh elemen pada sub wilayah
terpilih dijadikan sebagai sampel
• Transect sampling
Cocok digunakan untuk wilayah geografis yang berundak. Sampel diambil dari setiap
undakan yang ada
• Contour sampling
Sampel diambil dari setiap kontur di hamparann populasi.
271
C. SAMPLING DAN VGI
- Pada kenyataannya, sering tidak dimungkinkan untuk mengumpulkan data sendiri dengan
disain sampling yang dibuat sendiri agar dapat diperoleh data spasial yang tidak bias. Seiring
dengan berlimpahnya data yang didominasi oleh Big Data dan Open Data, semakin banyak
data yang digunakan dalam analisis sebenarnya dikumpulkan oleh pihak lain (nonexpert atau
sukarelawan yang dapat menyebabkan bias) dan dengan tujuan yang berbeda.
- Salah satu pendekatan untuk menggunakan data cari Volunteered Geographic
Information(VGI) adalah dengan melakukan perbandingan antara data yang diperoleh
dengan lokasi di media sosial (mengecek content coverage dan data collection procedure).
Pemeriksaan perlu dilakukan untuk mengurangi kemungkinan terjadinya bias.
D. PELURUHAN JARAK
- Representasi dunia nyata dibuat berdasar sampel sehingga diperlukan cara untuk mengisi
kesenjangan antar titik-titik sampel agar diperoleh representasi yang baik. Diperlukan fungsi
interpolasi yang sesuai dan mempertimbangkan observasi-observasi sampel yang
berdekatan.
- Hukum Pertama Geografi-Tobler : “Semuanya terkait, tapi hal-hal dekat lebih terkait dari
pada hal-hal yang jauh. Hukum itu menunjukkan bahwa pengaruh nilai atribut suatu objek
akan luruh atau hilang seiring bertambahnya jarak terhadap objek.
- Fungsi peluruhan jarak di antaranya
Fungsi di atas menggambarkan bahwa efek jarak terjadi secara teratur, kontinu, dan seragam
ke segala arah(isotropik).
- Peta Isopleth merupakan visualisasi dari fenomena yang bervariasi secara kontinu di
permukaan. Dibuat dengan garis yang menghubungkan titik-titik dengan nilai atribut
sama(isoline).
Contoh :
272
- Peta Choropleth merupakan visualisasi nilai atribut dari area-area yang tidak saling tumpang
tindih di suatu hamparan. Tiap area diwarnai atau diarsir sesuai nilai variabelnya.
Contoh :
273
xj = banyak kejadian tertentu pada wilayah ke-j
𝑥̅ = rata-rata banyak kejadian tertentu
𝑤𝑖𝑗 = elemen matriks pembobotan antara daerah i dan j
W = jumlah dari semua elemen pada matriks pembobotan spasial
REPRESENTASI GEOGRAFIS
B. REPRESENTASI DIGITAL
- Berbagai macam peta, catatan sejarah, dan informasi semakin banyak yang disebarkan
dalam format digital. Banyaknya penggunaan representasi geografi disebabkan karena
representasi ini bersifat sederhana dan relatif murah biaya.
- Digital berasal dari kata digit yang berarti “bilangan” atau “jari”. Sistem representasi pada
komputer hanya menggunakan dua digit, yaitu 0 dan 1, dan dikenal sebagai sistem bilangan
biner. Sistem ini berkembang untuk representasi ada tidaknya arus listrik pada teknologi
elektronik yang menjadi basis pengembangan komputer. Hal ini mendasari semua item atau
informasi tentang permukaan bumi dalam basis data SIG juga disimpan dalam bentuk
kombinasi antara 0 dan 1.
- Penggunaan format digital memiliki keunggulan yaitu :
• Mudah ditransformasi;
• Mudah diolah; dan
• Mudah dianalisis.
C. PENGKODEAN
- Pengkodean dalam sistem bilangan biner, menggunakan digit berupa 0 atau 1 (disebut bit)
dan kumpulan 8 digit biner disebut byte.
- Pengkodean sistem bilangan bulat, yang dapat dibagi menjadi dua yaitu
• Short integer (2 byte/ 16 bit) yang menyimpan bilangan -32767 sampai +32767; dan
274
• Long integer (4 byte/ 32 bit) yang menyimpan bilangan -214783647 sampai
+214783647.
- Pengkodean bilangan pecahan (dengan posisi desimal), menggunakan representasi real atau
floating point :
• Single precision(32-bit) untuk menyimpan sampai 7 digit signifikan.
• Double precision(64-bit) untuk menyimpan samapi 14 digit signifikan.
- Pengkodean teks, umumnya digunakan sistem, ASCII (American Standard Code for
Information Interchange) 8-bit. Sistem ASCII memberi kode untuk tiap simbol teks, termasuk
huruf, bilangan, dan berbagai simbol umum lainnya(termasuk tanda baca).
- Penyimpanan gambar dan suara, memerlukan bit yang relatif sangat besar. Penyimpanan
gambar, citra, dan suara dalam SIG diakomodir dengan sistem pengkodean BLOB (Binary
Large Object) yang mengalokasikan sejumlah bit sesuai keperluan.
275
- Tidak semua objek di bumi dapat dikategorikan sebagai objek diskrit, misalnya
ketinggian(altitude atau elevetion) permukaan tanah. Untuk representasi objek yang
permukaannya kontinu dapat digunakan sudut pandang bidang kontinu. Dalam pandangan
bidang kontinu, dunia geografis dapat dideskripsikan dengan sejumlah variabel yang dapat
diukur di sebarang titik pada permukaan bumi dan nilainya dapat bervariasi antar
permukaan. Yang membedakan antar bidang kontinu adalah variabel (nilai yang bervariasi
dan seberapa kecil/besar variasinya). Pada bidang relatif datar variasi elevasi akan kecil,
sementara lereng landai akan memiliki variasi elevasi sedang, lereng tajam memiliki variasi
elevasi tinggi, dan untuk jurang variasi elevasinya sangat tajam.
- Data raster bisa didapatkan dari hasil penginderaan jauh(remote sensing) dari satelit dan
tangkapan sensor yang dipasang pada pesawat udara. Kualitas sumber data raster tersebut
ditentukan oleh :
• Resolusi → dinyatakan sebagai ukuran di lapangan yang direpresentasikan oleh panjang
sisi sel,
• Waktu jadwal atau pengambilan gambar/citra, dan
• Bagian spektrum yang tertangkap oleh sensor
- Raster sebenarnya merepresentasikan hasil proyeksi , yaitu proses mengubah permukaan
bumi yang lengkung ke permukaan datar. Oleh karena itu, sel bujur sangkar raster tidak bisa
menangkap permukaan bumi secara sempurna. Informasi dalam satu sel hanya diwakili oleh
satu nilai, akibatnya informasi tentang variasi di dalam sel akan hilang. Diperlukan aturan
untuk menentukan nilainya :
• Aturan bagian besar → nilai ditentukan dari bagian terbesar di dalam sel.
• Aturan titik tengah sel → nilai ditentukan berdasarkan nilai titik tengah sel.
276
- Data vektor dalam representasinya diperlukan :
• Garis, diperlukan sebagai dua titik yang dihubungkan oleh garis lurus.
• Poligon/ bidang, diartikan sebagai rangkaian titik-titik yang terhubung dengan garis
lurus dan membentuk bidang tertutup.
- Perbandingan antara data raster dan data vektor yaitu
Permasalahan Raster Vektor
Volume Data Bergantung ukuran sel Bergantung pada kepadatan
simpul.
Sources of data - Penginderaan jauh - Data sosial
- Perbandingan/ - Data yang berhubungan
perumpamaan dengan lingkungan
Penggunaan Sumber daya dan lingkungan Sosial, ekonomi, dan
administratif
Software - Raster GI System - Vector GI System
- Pengolahan citra - Variabel kartografi
otomatis
Resolusi Tetap Berubah-ubah
G. PETA KERTAS
Peta kertas merupakan representasi analog di mana model fisik dari realitas dunia direduksi
menggunakan skala. Peta ini telah menjadi alat yang efektif untuk mengkomunikasikan informasi
geografis. Kunci utama dari sebuah peta kertas adalah pada skala yang digunakannya. Peta kertas
juga telah dijadikan sebagai salah satu sumber data untuk basis data geografis.
H. GENERALISASI
- Generalisasi adalah proses penyederhanaan yang melibatkan tindakan untuk mendapatkan
informasi esensi sesuai tingkat detail dan periode waktu yang diinginkan dengan membuang
informasi yang tidak diinginkan. Proses ini dilakukan sebab isi dari basis data geografis harus
dipilih secara cermat agar sesuai dengan kapasitas penyimpanan komputer yang terbatas.
Generalisasi dibagi menjadi dua yaitu generalisasi tempat dan atribut.
- Generalisasi tempat, dijalankan karena seyogyanya tiap peta memuat spesifikasinya yang
menjelaskan bagaimana fitur-fitur riil di lapangan dipilih untuk dimasukkan pada peta. Jenis
aturan generalisasi (menurut McMaster & Shea) adalah sebagai berikut.
277
• Penyederhanaan → membuat bentuk yang lebih sederhana, misalnya dengan
menghilangkan titikk-titik di garis luar poligon.
• Smoothing → penggantian bentuk yang taja, dan kompleks dengan yang lebih halus.
• Collapse → penggantian objek area dengan kombinasi objek titik dan garis.
• Agregasi → penggantian sejumlah besar objek bersimbol berbeda dengan sejumlah kecil
simbol baru.
• Amalgamation → penggantian beberapa objek area dengan objek area tunggal.
• Merging → penggantian beberapa objek garis dengan jumlah objek garis yang lebih
sedikit.
• Refinement → penggantian pola objek yang kompleks dengan pilihan yang
mempertahankan bentuk umum pola.
• Exageration → pembesaran relatif dari suatu objek untuk mempertahankan
karakteristiknya jika karakteristik ini akan hilang apabila objek diperlihatkan skala.
• Enhancement → perubahan ukuran fisik dan bentuk simbol.
• Perpindahan → perpindahan benda dari posisi sebenarnya untuk mempertahankan
visibilitas dan kekhasan mereka
- Generalisasi atribut yaitu mengubah ukuran atribut yang disajikan agar dapat
merepresentasikan objek dengan baik. Atribut disesuaikan dengan representasi titik, garis,
atau area yang disajikan.
GEOREFERENSI
278
• Ketidakpastian yang besar → misal, wilayah luas akan direpresentasikan dengan satu
titik yang umumnya berada di tengah. Hal ini, tidak tepat jika yang ingin dirujuk adalah
wilayah di pinggiran wilayah tersebut.
• Tidak semua tempat memiliki landasan legal → beberapa tempat memiliki nama lokal
yang lebih dikenal untuk keperluan komunikasi, bukan nama asli.
C. ALAMAT IP
- Alamat IP merupakan alamat unik untuk perangkat yang terhubung dengan jaringan
(internet atau lokal) sehingga memungkinkan adanya pengiriman informasi antar perangkat.
Disebut protokol karena dasarnya terdiri dari sekumpulan aturan tentang format dari data
yang dikirim ke suatu jaringan. Karakteristik alamat IP adalah sebagai berikut.
• Terdiri dari empat rangkaian bilangan yang masing-masing dipisahkan tanda
titik. Contoh alamat IP : 182.0.178.85.
• Dua komponen pertama merupakan bagian jaringan(alamat yang memberikan
akses) dan dua komponen terakhir merupakan bagian host(alamat perangkat
dalam jaringan).
• Bukan alamat acak karena dibuat dan dialokasikan oleh Internet Assigned
Number Authority (IANA) yang merupakan bagian dari internet Corporation for
Assigned Names and Numbers(ICANN).
- Alamat IP dapat memperkirakan lokasi suatu perangkat karena dalam proses
registrasi untuk mendapatkannya pengguna wajib mencantumkan alamat rumah
atau kantor. Ketepatan lokasi riil bergantung pada jenis alamat IP yang digunakan.
279
sesuai kebutuhan. Sistem referensi linear digunakan untuk pengelolaan infrastruktur
transportasi untuk penanganan berbagai masalah kedaruratan.
- Kadastral merupakan peta kepemilikan tanah yang dihasilkan dari integrasi hasil
pengukuran tanah dalam rangka pendaftaran tanah (survei kadastral). Di Indonesia peta ini
dibuat dan dikelola oleh Kementerian Agraria dan Tata Ruang. Dengan administrasi yang
baik, peta kadastral layak dijadikan sumber georeferensi. Contoh peta kadastral :
280
garis lintang yaitu -90 ≤ 𝜆 ≤ 90 di mana nilai negatif menunjukkan lintang selatan (LS) dan
positif menunjukkan lintang utara(LU). Konversi nilai garis lintang sama dengan garis bujur.
KETIDAKPASTIAN
A. PENGERTIAN
Ketidakpastian dapat didefinisikan sebagai ukuran pemahaman pengguna tentang perbedaan
antara isi himpunan data yang merepresentasikan suatu fenomena dengan fenomena nyatanya.
Ketidakpastian dalam SIG merupakan istilah untuk menggambarkan situasi saat representasi
digital tidak lengkap dan sebagai ukuran kualitas umum dari representasi.
281
C. KETIDAKPASTIAN REPRESENTASI FENOMENA GEOGRAFIS
- Terdapat beberapa model konseptual dalam ketidakpastian representasi tempat/lokasi,
yaitu :
• Model vektor → menggunakan konseptualisasi apriori tentang karakteristik dan luas
objek geografis dan cara masing-masing objek membentuk zona.
• Model raster → mendefinisikan elemen individu sebagai sel persegi dengan batas yang
tidak berhubungan dengan fitur alami.
- Kasus nominal pada ketidakpastian representasi fenomena geografis :
• Menjelaskan struktur dan interpretasi matriks konfusi;
• Memberikan persamaan indeks kappa
• Dalam kasus model area vektor kesalahan memiliki dua bentuk, yaitu misalokasi kelas
dan batas area.
- Kasus interval/ rasio :
• Kesalahan karena perubahan nilai yang dipengaruhi distorsi. Nilai tidak bias apabila
distorsi rata-rata bernilai 0 dengan kesalahan positif negatif seimbang.
• Membedakan akurasi(berkaitan dengan besar kesalahan) dan presisi(variabilitas
pengukuran berulang dan jumlah digit pengukuran).
• Ketidakpastian umumnya diukur dengan RMSE dan prediksi besar kesalahan dilakukan
dengan Distribusi Gaussian.
282
,maka diperlukan kehati-hatian dan kecermatan. Efek skala dan agregasi dikenal sebagai
Modifable Areal Unit Problem(MAUP).
SOFTWARE SIG
A. SOFTWARE SIG
- Sotware dalam SIG merupakan sekumpulan mesin untuk melakukan penyimpanan,
pengolahan dan penyajian data geografis yang memungkinkan suatu sisem informasi
geografis dioperasikan. Software SIG mencakup sekumpulan software program yang
terintegrasi ditambah beberapa elemen seperti help files, sampel data dan peta, dokumentasi,
lisensi dan situs web terkait.
- Berbagai cara pendistribusian software SIG, yaitu :
• Shareware → berbayar setelah masa percobaan;
• Liteware → sebagian kapabilitas fungsinya dimatikan;
• Freeware → gratis dengan pembatasan hak cipta;
• Public domain → gratis tanpa pembatasan; dan
• Open-source → kode diberikan dengan persetujuan open-source license.
283
• Data Management → pengorganisasian file, basis data, dan web services.
• Tools → mendefinisikan kapabilitas dan fungsionalitas SIG untuk pengolahan data.
• User interface → sekumpulan menu, toolbar, dan kontrol terintegrasi untuk mengakses
tools penanganan informasi geografis.
- Model data dalam SIG mendefinisikan bagaimana represetasi dunia nyata. Model data
software mendefinisikan bagaimana pengelompokan berbagai tool, penggunaan kelompok
tool dan interaksi dengan data. Kustomisasi merupakan proses modifikasi SIG dengan
menggunakan berbagai bahasa pemrograman.
284
PEMODELAN DATA GEOGRAFIS
A. MODEL DATA
- Model data adalah kumpulan gagasan abstrak untuk mendeskripsikan dan
mereperesentasikan aspek-aspek tertentu dunia nyata di lingkungan digital guna
membangun SIG secara operasional. Model data menekankan pada hal yang diperlukan dan
cara mengelolanya. Pemilihan model data sangat penting untuk keberhasilan projek
informasi geografis. Dalam memilih model data hal yang perlu diperhatikan adalah :
• Kekontinuan dan kekompleksan dunia direpresentasikan dengan komputer yang
memiliki keterbatasan dan hanya dapat bekerja dengan data digital.
• Cara mengakomodir berbagai model data yang diperlukan untuk memenuhi kebutuhan
pengguna secara optimal.
- Kegunaan model data :
• Bagi pengembang → sebagai representasi domain aplikasi.
• Bagi pengguna → memberi deskripsi tentang struktur sistem.
285
• Implementasi aturan validasi dan relasi antar objek menjadi lebih mudah.
- Terdapat berbagai model data geografis, model-model tersebut yaitu sebagai berikut.
• CAD → menggunakan representasi simbolis berupa titik, garis, dan area.
• Kartografi Komputer → untuk memenuhi kebutuhan peta kertas topografis dan tematik
sederhana.
• Image Processing → merepresentasikan dunia nyata di permukaan bumi dengan hasil
pindai foto udara dan citra satelit.
• Raster → merepresentasikan objek dunia nyata menggunakan array dari sel atau pixel.
• Vektor → mengasosiasikan objek diskrit dan mengklasifikasikan objek berdasar jenis
geometrinya (titik, garis, area, atau bidang).
• Jaringan → memodelkan arus barang dan jasa dengan dua jenis jaringan yaitu radial
atau looped.
• Triangulated Irregular Network(TIN) → merepresentasikan permukaan kontinu yang
seluruhnya terdiri dari segitiga.
NOTE : MATA KULIAH SISTEM INFORMASI GEOGRAFIS MERUPAKAN MATA KULIAH BARU DI
SEMESTER 4. JADI BELUM ADA SOAL DAN PEMBAHASAN UTS YANG DITAMPILKAN. SEBAGAI
GANTINYA, KAMI MENAMPILKAN LATIHAN SOAL DAN PEMBAHASANNYA. SEMOGA
RANGKUMAN DAN LATIHAN SOAL YANG KAMI BERIKAN DAPAT MEMBANTU TEMAN-TEMAN
BELAJAR. SEMANGAT
286
LATIHAN SOAL
1. Jelaskan apa yang dimaksud dengan perspektif SIG sebagai sistem dan SIG sebagai sains.
2. Apa yang dimaksud dengan Autokorelasi spasial? Dan apa pula yang dimaksud dengan
autokorelasi spasial positif, negatif, dan nol?
3. Ada beberapa teknik sampling yang digunakan dalam menangani permasalahan spasial. Apa saja
teknik sampling itu? Dan berikan penjelasannya.
4. Terdapat dua format data yang umumnya digunakan untuk merepresentasikan permukaan bumi
dalam SIG, yaitu data raster dan data vektor. Apa yang dimaksud dengan data raster dan vektor?
Apakah perbedaan kedua data tersebut?
5. Georeferencing adalah proses menetapkan lokasi suatu fitur geografis. Untuk menjalankan
proses tersebut dibutuhkan suatu sistem baik yang dapat mengukur posisi lokasi dan jarak antar
lokasi. Sistem yang digunakan tersebut ialah sistem koordinat yang memanfaatkan garis lintang
dan garis bujur. Jelaskan apa yang dimaksud garis lintang dan garis bujur.
6. Proyeksi adalah proses pemipihan permukaan bumi ke dalam bentuk datar. Proyeksi dapat
dibedakan berdasarkan karakteristik, bentuk permukaan kertas, dan berdasarkan
perpotongannya terhadap bumi. Sebutkan macam-macam proyeksi berdasarkan karakteristik
dan bentuk permukaan bumi.
7. Terdapat tiga tingkatan dalam arsitektur software SIG. Sebutkan dan jelaskan ketiga tingkatan
tersebut.
8. Software dalam SIG merupakan sekumpulan mesin untuk melakukan penyimpanan, pengolahan
dan penyajian data geografis yang memungkinkan suatu sistem informasi geografis dioperasikan.
Apa saja cara dalam pendistribusian software SIG?
9. Model data SIG dimaksudkan untuk merepresentasikan aspek geografis dari dunia nyata dan
mendefinisikan jenis operasi geografis yang digunakan. Terdapat berbagai model untuk data SIG,
apa saja model data itu dan berikan penjelasannya?
10. Generalisasi adalah proses penyederhanaan yang melibatkan tindakan untuk mendapatkan
informasi esensi sesuai tingkat detail dan periode waktu yang diinginkan dengan membuang
informasi yang tidak diinginkan. Jelaskan jenis-jenis aturan generalisasi menurut McMaster &
Shea.
PEMBAHASAN
1. Sistem Informasi Geografis dapat diartikan dalam beberapa perspektif, dua di antaranya yaitu
perspektif SIG sebagai sistem dan SIG sebagai sains.
- Dari perspektif SIG sebagai sistem, SIG dapat diartikan sebagai alat berbasis komputer yang
untuk meningkatkan efisiensi dan efektivitas penanganan informasi tentang objek dan
peristiwa geografis dengan mengumpulkan, menyimpan, memproses, menganalisis, dan
memvisualisasikan informasi geografis tersebut .
- Dari perspektif SIG sebagai sains, SIG mencakup konsep, prinsip, dan metode yang diterapkan
dengan memanfaatkan alat dan teknik SIG. SIG juga menyediakan kerangka kerja untuk bukti
baru, pengetahuan, dan kebijaksanaan tentang bumi. Sebagai metode untuk memperoleh
pengetahuan baru, SIG sebagai sains harus memperhatikan kaidah :
• Transparansi asumsi dan metode;
• Objektivitas dan independensi;
• Kemungkinan replikasi;
• Validitas; dan
287
• Generalisasi
2. Autokorelasi spasial merupakan ukuran tentang kemiripan lokal dan atribut. Macam
autokorelasi spasial sebagai berikut.
- Autokorelasi spasial positif , yaitu pola di mana fitur memiliki kemiripan lokasi dan kemiripan
atribut(sejalan dengan Hukum Tobler).
- Autokorelasi spasial negatif, yaitu pola di mana fitur yang berdekatan dalam ruang memiliki
atribut yang cenderung berbeda dibanding fitur yang jauh (berlawanan dengan Hukum
Tobler).
- Autokorelasi spasial nol(0), yaitu ketika nilai atribut tidak ada ketergantungan dengan lokasi
fitur.
3. Terdapat tujuh teknik sampling yang digunakan dalam menangani masalah-masalah spasial.
Teknik-teknik tersebut yaitu sebagai berikut.
- Simple random sampling
Pemilihan n sampel dari populasi berukuran N dalam batas wilayah yang telah ditetapkan
sebagai wilayah populasi dilakukan secara acak sederhana. Kelemahan: ada kemungkinan
sampel terpilih berada di lokasi yang sulit disurvei.
- Systematic spatial sampling
Perlu dihitung interval k=N/n dan tiap elemen ke-k dipilih menjadi sampel. Secara spasial,
interval diterjemahkan dengan kisi-kisi(grid) berupa garis tegak dan mendatar dengan jarak
sama. Titik perpotongan dua garis tersebut akan menjadi sampel terpilih.
- Stratified random sampling
Wilayah populasi dibagi habis ke dalam n sub wilayah dengan luas yang sama dan setiap sub
wilayah diwakili oleh satu sampel.
- Stratified sampling with random variation in grid spacing
- Teknik ini mirip dengan systematic spatial sampling, hanya saja interval kisinya dibuat
bervariasi.
- Clustered sampling.
Wilayah populasi dibagi ke dalam sub-sub wilayah yang berfungsi sebagai kluster. Pemilihan
dilakukan terhadap sub wilayah, kemudian seluruh elemen pada sub wilayah terpilih
dijadikan sebagai sampel
- Transect sampling
Cocok digunakan untuk wilayah geografis yang berundak. Sampel diambil dari setiap
undakan yang ada
- Contour sampling
Sampel diambil dari setiap kontur di hamparann populasi.
4. Data raster adalah data yang dapat dipandang sama dengan foto digital. Seluruh permukaan peta
dibagi menjadi kisi-kisi yang sangat kecil(pixel). Nilai yang disimpan di setiap pixel merupakan
karakteristik atau informasi yang ada di pixel yang ditemukan di lokasi terkait di permukaan
bumi. Kegunaan utama dari data raster adalah untuk menyimpan informasi peta ke dalam bentuk
citra. Data Vektor adalah data yang dapat dipandang sebagai suatu daftar nilai. Semua objek yang
akan disajikan harus didaftar satu per satu. Setiap objek atau fitur harus dicatat sesuai dengan
bentuknya. Data vektor selain memuat bentuk objek atau fitur juga dapat memuat informasi
tambahan tentang fitur-fitur yang ada di dalam daftar. Informasi tambahan ini disebut sebagai
atribut, yang merepresentasikan karakteristik, ciri, atau sifat dari fitur sesuai dengan konteksnya.
Perbedaan kedua data tersebut yaitu
288
Permasalahan Raster Vektor
Volume Data Bergantung ukuran sel Bergantung pada kepadatan
simpul.
Sources of data - Penginderaan jauh - Data sosial
- Perbandingan/ - Data yang berhubungan
perumpamaan dengan lingkungan
Penggunaan Sumber daya dan Sosial, ekonomi, dan
lingkungan administratif
Software - Raster GI System - Vector GI System
- Pengolahan citra - Variabel kartografi
otomatis
Resolusi Tetap Berubah-ubah
5. Sistem garis lintang (latitude) dan garis bujur (longitude) merupakan sistem yang komprehensif
dan disebut sebagai sistem koordinat geografis.
- Garis lintang (𝜆) garis yang tegak lurus dengan sumbu bumi. Garis lintang yang berada di
tengah Kutub Utara dan Selatan disebut juga garis ekuator (garis lintang 0°. Rentang nilai
garis lintang yaitu -90 ≤ 𝜆 ≤ 90 di mana nilai negatif menunjukkan lintang selatan (LS) dan
positif menunjukkan lintang utara(LU).
- Garis bujur (𝝓) adalah garis yang melintasi Kutub Utara dan Selatan dan membagi bumi
menjadi belahan bumi timur(BT) dan barat(BB) sama luas. Garis bujur 0° (bujur utama)
terletak di Greenwich. Dalam SIG penyimpanan dilakukan dengan bentuk derajat desimal di
mana BB bernilai negatif dan BT bernilai positif, memiliki rentang -180 ≤ 𝝓 ≤ 180.
Konversi dari sistem penulisan DMS ke sistem derajat desimal untuk kedua garis tersebut
yaitu
𝑚𝑒𝑛𝑖𝑡 𝑑𝑒𝑡𝑖𝑘
𝐷𝐷 = 𝑑𝑒𝑟𝑎𝑗𝑎𝑡 + ( )+( )
60 3600
6. Berdasar karakteristik yang dipertahankan, proyeksi dibedakan jadi tiga yaitu
- Conformal → mempertahankan bentuk dari fitur-fitur (utamanya yang kecil) di permukaan
bumi. Sesuai dengan keperluan navigasi.
- Equal area → mempertahankan luas wilayah dari fitur-fitur permukaan bumi.
- Equidistant → mempertahankan jarak yang sama antara permukaan bumi dan hasil proyeksi.
Berdasar bentuk permukaan kertas, proyeksi dibedakan menjadi :
- Cylindrical → dilakukan seolah ‘membungkus’ bumi dengan kertas proyeksi yang dibentuk
serupa tabung. Proyeksi ini dapat dikelompokkan menurut posisi relatif : mercator (sejajar
kutub utara – selatan), transvere mercator(sejajar ekuator), dan oblique(kertas miring).
- Azimuthal → proyeksi ke kertas dasar.
- Conic → bentuk proyeksi menyerupai kerucut.
7. Tingkatan arsitektur software SIG :
- Data Management, yaitu pengorganisasian file, basis data, dan web services.
- Tools, yaitu mendefinisikan kapabilitas dan fungsionalitas SIG untuk pengolahan data.
- User interface, yaitu sekumpulan menu, toolbar, dan kontrol terintegrasi untuk mengakses
tools penanganan informasi geografis.
8. Berbagai cara pendistribusian software SIG, yaitu :
- Shareware → berbayar setelah masa percobaan;
- Liteware → sebagian kapabilitas fungsinya dimatikan;
- Freeware → gratis dengan pembatasan hak cipta;
- Public domain → gratis tanpa pembatasan; dan
289
- Open-source → kode diberikan dengan persetujuan open-source license.
9. Terdapat berbagai model data geografis, model-model tersebut yaitu sebagai berikut.
- CAD → menggunakan representasi simbolis berupa titik, garis, dan area.
- Kartografi Komputer → untuk memenuhi kebutuhan peta kertas topografis dan tematik
sederhana.
- Image Processing → merepresentasikan dunia nyata di permukaan bumi dengan hasil pindai
foto udara dan citra satelit.
- Raster → merepresentasikan objek dunia nyata menggunakan array dari sel atau pixel.
- Vektor → mengasosiasikan objek diskrit dan mengklasifikasikan objek berdasar jenis
geometrinya (titik, garis, area, atau bidang).
- Jaringan → memodelkan arus barang dan jasa dengan dua jenis jaringan yaitu radial atau
looped.
- Triangulated Irregular Network(TIN) → merepresentasikan permukaan kontinu yang
seluruhnya terdiri dari segitiga.
10. Jenis aturan generalisasi (menurut McMaster & Shea) adalah sebagai berikut.
- Penyederhanaan, yaitu membuat bentuk yang lebih sederhana, misalnya dengan
menghilangkan titikk-titik di garis luar poligon.
- Smoothing, yaitu penggantian bentuk yang taja, dan kompleks dengan yang lebih halus.
- Collapse, yaitu penggantian objek area dengan kombinasi objek titik dan garis.
- Agregasi, yaitu penggantian sejumlah besar objek bersimbol berbeda dengan sejumlah kecil
simbol baru.
- Amalgamation, yaitu penggantian beberapa objek area dengan objek area tunggal.
- Merging, yaitu penggantian beberapa objek garis dengan jumlah objek garis yang lebih
sedikit.
- Refinement, yaitu penggantian pola objek yang kompleks dengan pilihan yang
mempertahankan bentuk umum pola.
- Exageration, yaitu pembesaran relatif dari suatu objek untuk mempertahankan
karakteristiknya jika karakteristik ini akan hilang apabila objek diperlihatkan skala.
- Enhancement, yaitu perubahan ukuran fisik dan bentuk simbol.
- Perpindahan, yaitu perpindahan benda dari posisi sebenarnya untuk mempertahankan
visibilitas dan kekhasan mereka.
290