0% menganggap dokumen ini bermanfaat (0 suara)
3K tayangan290 halaman

62 Modul Uts d4-St

Dokumen tersebut membahas konsep-konsep dasar dalam analisis regresi linear sederhana, meliputi hubungan antar variabel, korelasi dan regresi, prosedur analisis regresi, model regresi linear sederhana, asumsi-asumsi model, pendugaan parameter, sifat-sifat estimator least square, penggunaan residual dan error, serta penggunaan matriks dalam regresi linear sederhana.

Diunggah oleh

looloo dua
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
3K tayangan290 halaman

62 Modul Uts d4-St

Dokumen tersebut membahas konsep-konsep dasar dalam analisis regresi linear sederhana, meliputi hubungan antar variabel, korelasi dan regresi, prosedur analisis regresi, model regresi linear sederhana, asumsi-asumsi model, pendugaan parameter, sifat-sifat estimator least square, penggunaan residual dan error, serta penggunaan matriks dalam regresi linear sederhana.

Diunggah oleh

looloo dua
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd

Hubungan Antar Variabel

A. Hubungan Antar Variabel


Hubungan Fungsional Hubungan Statistik

Hubungan Fungsional bersifat pasti sehingga Hubungan statistic tidak bersifat pasti sehingga
dapat dinyatakan dalam bentuk fungsi titik-titik hasil observasi tidak tepat jatuh pada
matematis. Maka, fungsi f(x) akan memetakan garis kurva hubungan antarvariabel. Dengan
nilai X tertentu ke tepat satu nilai Y secara pasti. demikian, suatu nilai X tertentu (fixed) akan
Hubungan matematis : 𝑌 = 𝑓(𝑥) terdapat banyak kemungkinan nilai Y (stochastic).
Nilai Y ini terdistribusi mengikuti distribusi
peluang tertentu.
Hubungan statistik : 𝑌 = 𝑓(𝑥) + 𝜀

7
B. Korelasi dan Regresi
Korelasi Regresi
• Mempelajari keeratan hubungan antara dua • Mempelajari bentuk hubungan antara kedua
variabel yang dinyatakan dalam besarnya variabel yang dinyatakan melalui suatu
angka, sedangkan tandanya menentukan persamaan.
arah hubungan. • Mengukur seberapa besar suatu variabel
• Nilainya −1 ≤ 𝜌 ≤ 1 memengaruhi variabel lainnya sehingga
• Correlation doesn’t imply causation. dapat digunakan untuk membuat peramalan.
(Korelasi tidak menyatakan sebab akibat) • Hubungan bisa saja berupa sebab akibat.

C. Prosedur Analisis Regresi


1. Identifikasi dan pembentukan model
• Menentukan variabel X dan Y
• Membuat scatter plot untuk mengetahui pola data linier atau tidak. Jika linier maka model
regresi linier dapat digunakan
2. Pendugaan parameter model, ada dua cara:
• Maximum Likelihood Method
• Least Square Method: Ordinary dan Generalized
3. Pengujian keberartian parameter
Uji hipotesis parameter:
𝐻0 : 𝛽1 = 0 (tidak berpengaruh secara signifikan)
𝐻1 : 𝛽1 ≠ 0 (berpengaruh secara signifikan)
4. Penilaian ketepatan model (Goodness of Fit) dan pemeriksaan asumsi
Jika berpengaruh secara signifikan, cek koefisien determinasi (𝑅 2)
Jika 𝑅 2 kecil, variabel lain harus ditambahkan.
Jika 𝑅 2 mendekati 1, model semakin baik.

Model Regresi Linear Sederhana

A. Model Regresi Linear Sederhana

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 untuk 𝑖 ∈ 1,2, … , 𝑛
Dengan :
𝑌𝑖 merupakan nilai dari variabel dependen untuk observasi ke-i
𝛽0 dan 𝛽1 merupakan parameter model
𝜀𝑖 merupakan komponen error
𝑋𝑖 merupakan nilai variabel bebas X pada observasi ke-i
n merupakan banyaknya data observasi (sampel)

8
B. Asumsi Regresi Linear Sederhana

1. 𝐸(𝜀𝑖 ) = 0 yakni rata-rata seluruh error bernilai nol untuk setiap nilai X yang terobservasi.
Maka, sifat regresi unbiased didapatkan 𝐸(𝑌𝑖 ) = 𝛽0 + 𝛽1 𝑋𝑖 . Sifat ini diilustrasikan pada
gambar dengan setiap garis melewati rata-rata distribusi normal.
2
2. 𝑉𝑎𝑟(𝜀𝑖 ) = 𝜎 2 atau 𝐸 [(𝜀 − 𝐸(𝜀)) ] = 𝐸[𝜀 2 ] = 𝜎 2 (homoscedastic).
Maka, pendugaan interval prediksi regresi dapat lebih akurat. Jika asumsi ini tidak terpenuhi,
penaksir regresi linear masih tetap unbias dan konsisten, tetapi tidak lagi efisien karena
variansnya berbeda-beda.
3. 𝜀𝑖 ∼𝑖𝑖𝑑 𝑁(0, 𝜎 2 ) error merupakan random variabel yang berdistribusi normal dengan rata-
rata nol dan varians 𝜎 2 . Sifat ini tergambarkan dengan distribusi normal yang identik pada
gambar di atas.
4. 𝐶𝑜𝑟(𝜀𝑖 , 𝜀𝑗 ) = 0 untuk 𝑖 ≠ 𝑗
sehingga 𝐶𝑜𝑣(𝜀𝑖 , 𝜀𝑗 ) = 𝐸(𝜀𝑖 𝜀𝑗 ) − 𝐸(𝜀𝑖 )𝐸(𝜀𝑗 ) = 𝐸(𝜀𝑖 𝜀𝑗 ) = 0 untuk 𝑖 ≠ 𝑗 (nonautocorrelation).
Maka, nilai variabel respons 𝑌𝑖 juga tidak saling berkorelasi dengan 𝑌𝑗 .

C. Pendugaan/Estimasi Parameter

Estimasi parameter pada regresi linear sederhana dapat dilakukan menggunakan dua cara, yakni
least square method dan maximum likelihood method.

• Least Square Method


Prinsipnya : Minimalkan ∑𝑛𝑖=1 𝜀𝑖2
Dari persamaan regresi, 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 dapat dinyatakan suku 𝜀𝑖 sebagai berikut.
𝜀𝑖 = 𝑌𝑖 − (𝛽0 + 𝛽1 𝑋𝑖 )
Ekspresi tersebut kemudian dikuadratkan dan dijumlahkan untuk setiap observasi ke-i.
𝑛 𝑛

𝑄(𝛽0 , 𝛽1 ) = ∑ 𝜀𝑖2 = ∑(𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 )2


𝑖=1 𝑖=1

9
Untuk meminimalkan fungsi di atas, lakukan turunan parsial terhadap 𝛽0 dan 𝛽1 sehingga
didapatkan penduganya, yakni 𝑏0 dan 𝑏1 :
Intercept Slope
𝑛 𝑛
𝜕𝑄(𝛽0 , 𝛽1 ) 𝜕𝑄(𝛽0 , 𝛽1 )
= 2 ∑(𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 )(−1) = 2 ∑(𝑌𝑖 − 𝛽0
𝜕𝛽0 𝜕𝛽1
𝑖=1 𝑖=1
𝑏0 = 𝑌̅ − 𝑏1 𝑋̅ − 𝛽1 𝑋𝑖 ) (−𝑋𝑖 )
𝑛∑𝑋𝑖 𝑌𝑖 − ∑𝑋𝑖∑𝑌𝑖
𝑏1 =
𝑛 ∑ 𝑋𝑖2 − (∑𝑋𝑖 )2

• Maximum Likelihood Estimator


Prinsipnya : Memaksimalkan fungsi likelihood
Dalam memaksimalkan fungsi likelihood, perlu dibuat asumsi mengenai distribusi dari error.
Dalam kasus regresi linear sederhana, asumsi distribusi dari error 𝜀𝑖 adalah distribusi normal
dengan 𝜀𝑖 ∼ 𝑁(0, 𝜎 2 ) sehingga distribusi dari 𝑌𝑖 adalah 𝑌𝑖 ∼ 𝑁(𝐸[𝑌𝑖 ], 𝜎 2 ).
1 1
− (𝑌 −𝛽 −𝛽 𝑋 )2
𝜀𝑖 = 𝑓(𝑌𝑖 ) = 𝑒 2𝜎2 𝑖 0 1 𝑖
√2𝜋𝜎
Dengan mengalikkannya untuk seluruh observasi, fungsi likelihood yang didapatkan adalah
sebagai berikut.
𝑛
1 1 𝑛
2) − ∑ (𝑌 −𝛽 −𝛽 𝑋 )2
𝐿(𝛽0 , 𝛽1 , 𝜎 =∏ 2𝜎2 𝑖=1 𝑖 0 1 𝑖
𝑛𝑒
(2𝜋𝜎 2 )2
𝑖=1
Jika dinyatakan dalam fungsi log likelihood:
𝑛
2)
𝑛 𝑛 1
ln 𝐿(𝛽0 , 𝛽1 , 𝜎 = − ln 2𝜋 − ln 𝜎 2 − 2 ∑(𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 )2
2 2 2𝜎
𝑖=1
Selanjutnya, gunakan turunan parsial untuk mendapatkan estimasi nilai 𝛽0 dan 𝛽1 . Dalam
kasus regresi linear, nilai dari estimasi dengan cara MLE akan sama dengan estimasi dari cara
least square. Akan tetapi, penduga dari 𝜎 2 dari MLE bersifat bias.
∑𝑛 (𝑌 −𝑌̂)
𝜎̂2
𝑀𝐿𝐸 = 𝑖=1 𝑖 𝑖 dengan bentuk unbiasnya untuk regresi linear sederhana adalah 𝑀𝑆𝐸 =
𝑛
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌𝑖 )
𝑛−2
.

D. Sifat-Sifat Estimator Least Square


Jika seluruh asumsi dari regresi linear terpenuhi, estimator dari least square akan bersifat
BLUE(best linear unbiased estimator) menurut teorema Gauss Markov.
• Best : varians yang minimum
• Linear : linear dalam variabel random Y
• Unbias : tidak bias

E. Sifat Garis Regresi


Garis regresi berdasarkan least square memiliki sifat berikut :
1. ∑𝑛𝑖=1 𝑒𝑖 = 0
2. Jumlahan ∑𝑛𝑖=1 𝑒𝑖2 bernilai minimum
3. ∑𝑛𝑖=1 𝑌𝑖 = ∑𝑛𝑖=1 𝑌
̂𝑖
4. ∑𝑛𝑖=1 𝑋𝑖 𝑒𝑖 = 0
5. ∑𝑛𝑖=1 𝑌̂𝑖 𝑒𝑖 = 0

10
6. Garis regresi selalu melewati titik (𝑋̅, 𝑌̅).

F. Residual dan Error


Sebaiknya kita membedakan istilah residual 𝑒𝑖 dan error 𝜀𝑖 . Error mengukur selisih nilai 𝑌𝑖
terhadap garis regresi sebenarnya yang tidak diketahui 𝜀𝑖 = 𝑌𝑖 − 𝐸(𝑌𝑖 ). Sementara itu, residual
̂𝑖 .
mengukur selisih nilai 𝑌𝑖 terhadap estimasi garis regresi yang sudah diperoleh 𝑒𝑖 = 𝑌𝑖 − 𝑌

G. Penggunaan Matriks dalam RLS


Model RLS :
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖
Dengan :
i= 1, 2, 3, …, n
n= banyaknya data observasi
Maka, akan terdapat sebanyak n persamaan sebagai berikut :
𝑌1 = 𝛽0 + 𝛽1 𝑋1 + 𝜀1
𝑌2 = 𝛽0 + 𝛽1 𝑋2 + 𝜀2
𝑌3 = 𝛽0 + 𝛽1 𝑋3 + 𝜀3

𝑌𝑛 = 𝛽0 + 𝛽1 𝑋𝑛 + 𝜀𝑛
Sebanyak n persamaan ini dapat diubah ke dalam bentuk matriks :
𝑌1 1 𝑋1 𝜀1
𝑌2 1 𝑋2 𝜀2
𝛽
𝑌3 = 1 𝑋3 [ 0 ] + 𝜀3
𝛽1 ⋮
⋮ ⋮ ⋮
[𝑌𝑛 ] [1 𝑋𝑛 ] [ 𝜀𝑛 ]

Inferensia Dalam Analisis Regresi

Dalam proses inferensia, terdapat dua proses yang dapat dilakukan, yakni estimasi interval dan
pengujian hipotesis. Estimasi interval biasanya dilakukan terhadap nilai rata-rata dari Y atau
observasi baru dari Y. Sementara itu, pengujian hipotesis biasanya dilakukan pada parameter regresi.

A. Inferensia 𝜷𝟏

• Hipotesis
Sebenarnya, hipotesis yang dapat dibuat tergantung pada penentuan nilai parameter yang akan
diuji. Dengan kata lain, secara general hipotesisnya adalah 𝛽1 = 𝛽10 . Akan tetapi, nilai parameter
yang sering diuji adalah apakah 𝛽1 = 0, yakni kasus saat 𝛽10 = 0.

Dua arah Satu arah kanan Satu arah kiri


𝐻0 ∶ 𝛽1 = 0 𝐻0 ∶ 𝛽1 ≤ 0 𝐻0 ∶ 𝛽1 ≥ 0
𝐻1 ∶ 𝛽1 ≠ 0 𝐻1 ∶ 𝛽1 > 0 𝐻1 ∶ 𝛽1 < 0

Inferensia parameter 𝛽1 dilakukan dengan menggunakan estimator 𝑏1 . Estimasi titik dan


standar error 𝑏1 diberikan sebagai berikut :

11
∑𝑛 ̅
𝑖=1(𝑋𝑖 −𝑋)(𝑌𝑖 −𝑌)
̅ 𝑀𝑆𝐸
𝑏1 = ∑𝑛 (𝑋 ̅ ) 2 𝑠(𝑏1 ) = √∑𝑛 ̅ 2
𝑖=1 𝑖 −𝑋 𝑖=1(𝑋𝑖 −𝑋)

dengan :
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌𝑖 )
𝑀𝑆𝐸 = 𝑛−2
pembagi bernilai n-2 karena terdapat dua parameter yang diestimasi dalam
kasus RLS.

• Statistik Uji
𝑏1
𝑡ℎ𝑖𝑡 =
𝑠(𝑏1 )
• Daerah Penolakan 𝑯𝟎

Dua arah Satu arah kanan Satu arah kiri


|𝑡ℎ𝑖𝑡 | > 𝑡(1−𝛼,𝑛−2) 𝑡ℎ𝑖𝑡 > 𝑡(1−𝛼,𝑛−2) 𝑡ℎ𝑖𝑡 < −𝑡(1−𝛼,𝑛−2)
2
Dengan :
𝑡(1−𝛼,𝑛−2) : Menyatakan titik kritis distribusi t dengan derajat bebas n-2 yang luasan kiri sebesar
2
𝛼
1−2.

• Kesimpulan
Jika 𝐻0 ditolak, kesimpulan yang didapatkan adalah terdapat pengaruh perubahan yang
signifikan dari variabel X terhadap variabel Y.

• Interval Kepercayaan
𝑃 [𝑏1 − 𝑡(1−𝛼,𝑛−2) 𝑠(𝑏1 ) ≤ 𝛽1 ≤ 𝑏1 + 𝑡(1−𝛼,𝑛−2) 𝑠(𝑏1 )] = 1 − 𝛼
2 2

B. Inferensia 𝜷𝟎
Inferensia untuk parameter 𝛽0 jarang dilakukan karena dalam analisis regresi tujuan yang
umumnya ingin dicapai adalah menentukan apakah variabel bebas yang digunakan berpengaruh
secara signifikan terhadap peningkatan dari variabel terikatnya. Akan tetapi, inferensia terhadap
parameter 𝛽0 sebenarnya dapat dilakukan saat cakupan model memuat 𝑋 = 0.
• Hipotesis
• Dua arah Satu arah kanan Satu arah kiri
𝐻0 ∶ 𝛽0 = 0 𝐻0 ∶ 𝛽0 ≤ 0 𝐻0 ∶ 𝛽0 ≥ 0
𝐻1 ∶ 𝛽0 ≠ 0 𝐻1 ∶ 𝛽0 > 0 𝐻1 ∶ 𝛽0 < 0
Inferensia parameter 𝛽0 dilakukan dengan menggunakan estimator 𝑏0 . Estimasi titik dan
standar error 𝑏0 diberikan sebagai berikut :
1 𝑋̅ 2
𝑏0 = 𝑌̅ − 𝑏1 𝑋̅ 𝑠(𝑏0 ) = √𝑀𝑆𝐸 [𝑛 + ∑𝑛 ̅ 2
]
𝑖=1 𝑖 −𝑋)
(𝑋
dengan :
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌𝑖 )
𝑀𝑆𝐸 = 𝑛−2
pembagi bernilai n-2 karena terdapat dua parameter yang diestimasi dalam
kasus RLS.
• Statistik Uji
𝑏0
𝑡ℎ𝑖𝑡 =
𝑠(𝑏0 )

12
• Daerah Penolakan 𝑯𝟎
Dua arah Satu arah kanan Satu arah kiri
|𝑡ℎ𝑖𝑡 | > 𝑡(1−𝛼,𝑛−2) 𝑡ℎ𝑖𝑡 > 𝑡(1−𝛼,𝑛−2) 𝑡ℎ𝑖𝑡 < −𝑡(1−𝛼,𝑛−2)
2
Dengan :
𝑡(1−𝛼,𝑛−2) : Menyatakan titik kritis distribusi t dengan derajat bebas n-2 yang luasan kiri sebesar
2
𝛼
1−2.

• Kesimpulan
Jika 𝐻0 ditolak, kesimpulan yang didapatkan adalah terdapat perbedaan nilai yang signifikan
dari nol untuk Y saat 𝑋 = 0.

• Interval Kepercayaan
𝑃 [𝑏0 − 𝑡(1−𝛼,𝑛−2) 𝑠(𝑏0 ) ≤ 𝛽0 ≤ 𝑏0 + 𝑡(1−𝛼,𝑛−2) 𝑠(𝑏0 )] = 1 − 𝛼
2 2

C. Pendekatan Anova dalam Analisis Regresi


Pendekatan anova ini akan lebih sering digunakan dalam kasus regresi linear berganda (RLB)
nantinya. Pendekatan anova ini melakukan uji overall signifikansi untuk seluruh parameter
regresi linear berganda (RLB) atau 𝐻0 : 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑘 . Akan tetapi, kasus untuk regresi linear
sederhana (RLS) pendekatan anova memiliki hipotesis null 𝐻0 : 𝛽1 = 0.

• Hipotesis
𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
Dasar : Partisi dari Sum of Squares Total (SST) dan derajat bebas.
𝑌𝑖 − 𝑌̅ = (𝑌𝑖 − 𝑌̂𝑖 ) + (𝑌
̂𝑖 − 𝑌̅)
𝑛 𝑛 𝑛
̂𝑖 )2 + ∑(𝑌
∑(𝑌𝑖 − 𝑌̅)2 = ∑(𝑌𝑖 − 𝑌 ̂𝑖 − 𝑌̅)2
𝑖=1 𝑖=1 𝑖=1
Dengan :
𝑆𝑆𝑇 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2
̂𝑖 )2
𝑆𝑆𝐸 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌
𝑆𝑆𝑅 = ∑𝑛𝑖=1(𝑌̂𝑖 − 𝑌̅)2
Dengan kata lain, 𝑆𝑆𝑇 = 𝑆𝑆𝐸 + 𝑆𝑆𝑅.

• Tabel Anova
Sumber Derajat Bebas Jumlah Kuadrat Rata-rata Jumlah Stat Uji (F)
Kuadrat
Regresi 1 SSR 𝑆𝑆𝑅 𝑀𝑆𝑅
𝑀𝑆𝑅 = 𝐹ℎ𝑖𝑡 =
1 𝑀𝑆𝐸
Error n-2 SSE 𝑆𝑆𝐸
𝑀𝑆𝐸 =
𝑛−2
Total n-1 SST

13
• Keputusan
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡 > 𝐹(1−𝛼;1,𝑛−2) .
𝐹(1−𝛼;1,𝑛−2) adalah titik kritis distribusi F dengan derajat bebas pembilang bernilai 1 dan derajat
bebas penyebut bernilai n-2 yang memiliki luasan kiri sebesar 1 − 𝛼.

D. Penilaian Ketepatan Model


• Koefisien Determinasi (𝑹𝟐 )
Mengukur proporsi keragaman total dari nilai observasi Y yang dapat diterangkan oleh garis
regresinya dengan menggunakan variabel bebas yang digunakan.
𝑆𝑆𝑅 𝑆𝑆𝐸
𝑅2 = =1− ; 0 ≤ 𝑅2 ≤ 1
𝑆𝑆𝑇 𝑆𝑆𝑇
Interpretasi : Keragaman variabel Y dapat diterangkan oleh variabel bebas X sebesar 𝑅 2,
sedangkan sisanya diterangkan oleh faktor lain yang tidak dimuat dalam model regresi.

• Koefisien Korelasi (𝒓)


Suatu ukuran yang dapat digunakan untuk mengukur keeratan hubungan linear antara variabel
X dan variabel Y.
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅)
𝑟 = ±√𝑅 2 = ; −1 ≤ 𝑟 ≤ 1
𝑛 (𝑋 ̅ 2 𝑛
√∑𝑖=1 𝑖 − 𝑋) √∑𝑖=1(𝑌𝑖 − 𝑌) ̅ 2

Dengan tanda dapat dilihat dari nilai 𝑏1 .

E. Estimasi Interval untuk Rata-Rata (𝑬(𝒀𝒉 ))


Untuk nilai 𝑋 = 𝑋ℎ , point estimator untuk rata-rata regresi adalah :
̂
𝑌ℎ = 𝑏0 + 𝑏1 𝑋ℎ
Dengan standar error :
1 (𝑋ℎ − 𝑋̅)2
̂
𝑠(𝑌ℎ ) = √𝑀𝑆𝐸 ( + )
𝑛 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌𝑖 )
𝑀𝑆𝐸 = 𝑛−2
pembagi bernilai n-2 karena terdapat dua parameter yang diestimasi dalam
kasus RLS.

Dengan demikian, dapat dibentuk interval kepercayaan (1 − 𝛼)100% untuk 𝐸(𝑌ℎ ) adalah :
̂
𝑃 [𝑌 ̂ ̂ ̂
ℎ − 𝑡(1−𝛼,𝑛−2) 𝑠(𝑌ℎ ) ≤ 𝐸(𝑌ℎ ) ≤ 𝑌ℎ + 𝑡(1−𝛼,𝑛−2) 𝑠(𝑌ℎ )] = 1 − 𝛼
2 2

F. Estimasi Interval dari Nilai Y Individu (𝒀𝒉.𝒏𝒆𝒘 )


Untuk nilai 𝑋 = 𝑋ℎ , perkiraan individu baru 𝑌ℎ.𝑛𝑒𝑤 perlu memperhitungkan mengenai distribusi
dari error sehingga interval yang dibuat akan lebih lebar dibandingkan saat memperkirakan rata-
rata.

Point estimator untuk 𝑌ℎ.𝑛𝑒𝑤 adalah :


𝑌̂
ℎ.𝑛𝑒𝑤 = 𝑏0 + 𝑏1 𝑋ℎ.𝑛𝑒𝑤

14
Dengan standar error :
1 (𝑋ℎ.𝑛𝑒𝑤 − 𝑋̅)2
𝑠(𝑌̂
ℎ.𝑛𝑒𝑤 ) = √𝑀𝑆𝐸 (1 + + )
𝑛 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
∑𝑛 ̂
𝑖=1(𝑌𝑖 −𝑌𝑖 )
𝑀𝑆𝐸 = pembagi bernilai n-2 karena terdapat dua parameter yang diestimasi dalam
𝑛−2
kasus RLS.

Dengan demikian, dapat dibentuk interval kepercayaan (1 − 𝛼)100% untuk 𝐸(𝑌ℎ ) adalah :
𝑃 [𝑌̂ ̂ ̂ ̂
ℎ.𝑛𝑒𝑤 − 𝑡(1−𝛼 ,𝑛−2) 𝑠(𝑌ℎ.𝑛𝑒𝑤 ) ≤ 𝑌ℎ.𝑛𝑒𝑤 ≤ 𝑌ℎ.𝑛𝑒𝑤 + 𝑡(1−𝛼,𝑛−2) 𝑠(𝑌ℎ.𝑛𝑒𝑤 )] = 1 − 𝛼
2 2

Lack of Fit Test

A. Syarat
Terdapat amatan berulang pada satu atau lebih nilai 𝑋.

B. Langkah Pengujian
• Hipotesis
𝐻0 : Model linear cocok untuk menjelaskan hubungan antara X danY
(𝐸(𝑌𝑖 ) = 𝛽0 + 𝛽1 𝑋𝑖 )
𝐻1 : Model linear tidak cocok untuk menjelaskan hubungan antara X danY
(𝐸(𝑌𝑖 ) ≠ 𝛽0 + 𝛽1 𝑋𝑖 )

• Perhitungan Anova
𝑆𝑆𝑇 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2
2
𝑆𝑆𝐸 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌
̂𝑖 )
2
𝑆𝑆𝑅 = ∑𝑛𝑖=1(𝑌
̂𝑖 − 𝑌̅)
Dan
𝑆𝑆𝑇 = 𝑆𝑆𝐸 + 𝑆𝑆𝑅

Selanjutnya
𝑆𝑆𝐸 = 𝑆𝑆𝑝𝑒 + 𝑆𝑆𝑙𝑜𝑓
Dengan
𝑘 𝑛𝑘
2
𝑆𝑆𝑝𝑒 = ∑ ∑(𝑌𝑖𝑗 − 𝑌̅𝑖 . )
𝑖=1 𝑗=1
𝑆𝑆𝑙𝑜𝑓 = 𝑆𝑆𝐸 − 𝑆𝑆𝑝𝑒
𝑛𝑖 =banyaknya amatan pada 𝑥𝑖 yang berulang
k =banyaknya 𝑥𝑖 yang mengandung pengulangan

Sumber Derajat Jumlah Rata-rata Jumlah Kuadrat Stat Uji (F)


Bebas Kuadrat
Regresi 1 SSR 𝑆𝑆𝑅 𝑀𝑆𝑅
𝑀𝑆𝑅 = 𝐹ℎ𝑖𝑡 =
1 𝑀𝑆𝐸

15
Error n-2 SSE 𝑆𝑆𝐸 𝐹
𝑀𝑆𝐸 = 𝑛−2 ℎ𝑖𝑡.𝑙𝑜𝑓=
𝑀𝑆𝑙𝑜𝑓
• Lack of Fit • k-2 • 𝑆𝑆𝑙𝑜𝑓 𝑆𝑆𝑙𝑜𝑓
𝑀𝑆𝑝𝑒
• 𝑀𝑆𝑙𝑜𝑓 =
• Pure error • n-k • 𝑆𝑆𝑝𝑒 𝑘−2
𝑆𝑆𝑝𝑒
• 𝑀𝑆𝑝𝑒 = 𝑛−𝑘
Total n-1 SST

• Daerah Penolakan
Tolak 𝐻0 jika didapatkan 𝐹ℎ𝑖𝑡.𝑙𝑜𝑓 > 𝐹(1−𝛼;𝑘−2,𝑛−𝑘). Jika didapatkan tolak 𝐻0 , model regresi lain
perlu digunakan. Jika didapatkan gagal tolak 𝐻0 , model linear sudah cocok untuk menjelaskan
hubungan antara X dan Y.

Pemeriksaan Diagnostics dalam RLS

A. Pemeriksaan Residual
Pemeriksaan residual bermanfaat untuk memeriksa adanya penyimpangan pada model regresi
linear sederhana dengan beberapa asumsi yang telah disebutkan. Beberapa penyimpangan pada
model regresi yang dapat terjadi di antaranya :
o Fungsi regresi tidak linear
o Suku error tidak memiliki varian konstan
o Suku error tidak saling bebas
o Outlier yang mengganggu model regresi
o Error yang tidak menyebar normal

B. Beberapa Plot Residual yang Bermanfaat


Pemeriksaan dari residual dapat dilakukan menggunakan plot residual sehingga dapat
diketahui apakah terdapat penyimpangan dari model regresi linear sederhana. Plot yang dapat
digunakan:
o Plot antara residual dan variabel bebas
o Plot antara residual dan fitted value ( 𝑌 ̂)
o Boxplot dari residual
o Normal probability plot dari residual

C. Pemeriksaan Asumsi Secara Visual


• Linearitas
̂𝑖 .
Linearitas dapat ditunjukkan dengan plot antara nilai-nilai residual 𝑒𝑖 dengan nilai 𝑋𝑖 atau 𝑌
Asumsi linearitas terpenuhi jika pencaran titik yang terbentuk tersebar secara acak di sekitar
nol.

• Normalitas
Normalitas dapat ditunjukkan dengan plot antara residual yang diurutkan 𝑒(𝑖) dengan nilai
harapannya 𝐸(𝑒(𝑖) ) (Normal Probability Plot). Asumsi kenormalan terpenuhi jika pencaran
titik-titiknya membentuk atau mendekati suatu garis linear.

• Homoskedastisitas

16
Homoskedastisitas dapat ditunjukkan dengan plot antara nilai-nilai residual 𝑒𝑖 dengan nilai 𝑋𝑖
̂𝑖 (plot yang untuk mengecek linearitas). Asumsi ini terpenuhi jika titik-titik pada plot
atau 𝑌
menunjukkan pola yang acak.

• Autokorelasi
Autokorelasi dapat terjadi terutama jika data yang digunakan untuk analisis regresi merupakan
data time series. Pemeriksaan autokorelasi dapat dilakukan dengan membuat plot antara 𝑒𝑡
(residual pada waktu ke t) dengan waktu (t).

Regresi Linear Berganda

A. Model Regresi Linear Berganda


Tidak seperti model regresi linear sederhana, model regresi linear berganda memiliki lebih dari
satu variabel bebas. Model regresi linear dapat dituliskan sebagai berikut :
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + ⋯ + 𝛽𝑗 𝑋𝑖𝑗 + ⋯ + 𝛽𝑘 𝑋𝑖𝑘 + 𝜀𝑖
Dengan :
𝑌𝑖 : Variabel terikat
𝑋𝑖𝑗 : Variabel bebas ke-j
𝜀𝑖 : Komponen error
𝛽0 : Parameter intercept regresi
𝛽𝑗 : Parameter koefisien regresi dari variabel bebas ke-j
k : Banyaknya variabel bebas regresi linear berganda
n : Banyaknya observasi
Dalam bentuk sistem persamaan, bentuk regresi linear berganda dapat dituliskan sebagai
berikut :
𝑌1 = 𝛽0 + 𝛽1 𝑋11 + 𝛽2 𝑋12 + ⋯ + 𝛽𝑗 𝑋1𝑗 + ⋯ + 𝛽𝑘 𝑋1.𝑘 + 𝜀1
𝑌2 = 𝛽0 + 𝛽1 𝑋21 + 𝛽2 𝑋22 + ⋯ + 𝛽𝑗 𝑋2𝑗 + ⋯ + 𝛽𝑘 𝑋2.𝑘 + 𝜀2
𝑌3 = 𝛽0 + 𝛽1 𝑋31 + 𝛽2 𝑋32 + ⋯ + 𝛽𝑗 𝑋3𝑗 + ⋯ + 𝛽𝑘 𝑋3.𝑘 + 𝜀3

𝑌𝑛 = 𝛽0 + 𝛽1 𝑋𝑛1 + 𝛽2 𝑋𝑛2 + ⋯ + 𝛽𝑗 𝑋𝑛𝑗 + ⋯ + 𝛽𝑘 𝑋𝑛.𝑘 + 𝜀𝑛
Bentuk di atas lebih mudah jika dituliskan dalam bentuk matriks sebagai berikut :
𝛽0
𝑌1 1 𝑋11 𝑋12 … 𝑋1𝑗 … 𝑋1.𝑘 𝛽1 𝜀1
𝑌2 1 𝑋21 𝑋 22 … 𝑋2𝑗 … 𝑋 2.𝑘 𝛽2 𝜀2
𝑌3 = 1 𝑋31 𝑋32 … 𝑋3𝑗 … 𝑋3.𝑘 ⋮ + 𝜀3
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋱ ⋮ 𝛽𝑗 ⋮
[𝑌𝑛 ] [1 𝑋𝑛1 𝑋𝑛2 … 𝑋𝑛𝑗 … 𝑋𝑛.𝑘 ] ⋮ [𝜀𝑛 ]
[𝛽𝑘 ]
Jika dimisalkan sebagai
1 𝑋11 ⋯ 𝑋1.𝑘 𝛽0 𝑌1 𝜀1
1 𝑋21 ⋯ 𝑋2.𝑘 𝛽1 𝑌2 𝜀2
𝐗=[ ] 𝜷=[ ] 𝒀=[ ] 𝜺=[⋮]
⋮ ⋮ ⋱ ⋮ ⋮ ⋮
1 𝑋𝑛1 ⋯ 𝑋𝑛.𝑘 𝛽𝑘 𝑌𝑛 𝜀𝑛
Dengan demikian, sistem persamaan tersebut dapat dituliskan sebagai berikut :
𝐘𝑛×1 = 𝐗 𝑛×(𝑘+1) 𝜷(𝑘+1)×1 + 𝜺𝑛×1

17
B. Estimasi Parameter Koefisien Regresi Linear Berganda
Salah satu metode yang dapat digunakan untuk mengestimasi parameter koefisien regresi linear
berganda adalah Ordinary Least Square (OLS). Caranya sama seperti pada kasus regresi linear
sederhana, yakni meminimalkan kuadrat residual.
𝑛 𝑛
2
𝑄= ∑ 𝜀𝑖2 = ∑[𝑌𝑖 − (𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + ⋯ + 𝛽𝑝−1 𝑋𝑖.𝑘 )]
𝑖=1 𝑖=1
Lakukan diferensial secara parsial fungsi Q terhadap masing-masing 𝛽0 , 𝛽1 , … , 𝛽𝑘 sama dengan
nol sehingga didapatkan persamaan normal untuk mencari 𝑏1 , 𝑏2 , … , 𝑏𝑘 dalam bentuk matriks
sebagai berikut :
𝒃 = (𝑿𝑇 𝑿)−𝟏 𝑿𝑇 𝒀
𝑛 𝑛 𝑛 −1 𝑛

𝑛 ∑ 𝑋𝑖1 ∑ 𝑋𝑖2 … ∑ 𝑋𝑖.𝑘 ∑ 𝑌𝑖


𝑖=1 𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 𝑛 𝑛 𝑛
𝑏0 ∑ 𝑋𝑖1 2
∑ 𝑋𝑖1 ∑ 𝑋𝑖1 𝑋𝑖2 … ∑ 𝑋𝑖1 𝑋𝑖.𝑘 ∑ 𝑋𝑖1 𝑌𝑖
𝑏1 𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1
𝑏2 = 𝑛 𝑛 𝑛 𝑛 𝑛
⋮ 2
∑ 𝑋𝑖2 ∑ 𝑋𝑖2 𝑋𝑖1 ∑ 𝑋𝑖2 … ∑ 𝑋𝑖2 𝑋𝑖.𝑘 ∑ 𝑋𝑖2 𝑌𝑖
[𝑏𝑘 ] 𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
𝑛 𝑛 𝑛 𝑛 𝑛
2
∑ 𝑋𝑖.𝑘 ∑ 𝑋𝑖.𝑘 𝑋𝑖1 ∑ 𝑋𝑖.𝑘 𝑋𝑖2 … ∑ 𝑋𝑖.𝑘 ∑ 𝑋𝑖.𝑘 𝑌𝑖
([ 𝑖=1 𝑖=1 𝑖=1 𝑖=1 ]) [ 𝑖=1 ]

C. Pengujian Hipotesis
• Uji Simultan
Pengujian simultan dilakukan untuk menguji secara simultan apakah terdapat variabel bebas
yang berpengaruh dalam regresi linear beganda. Pengujian ini dilakukan menggunakan
pendekatan ANOVA.

Hipotesis :
𝐻0 : 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑝−1 = 0
(Tidak terdapat satupun variabel bebas yang menjelaskan hubungan dengan variabel terikat)
𝐻1 : 𝛽𝑖 ≠ 0 ; 𝑖 ∈ {1,2, … , 𝑘}
(Terdapat minimal satu variabel bebas yang menjelaskan hubungan dengan variabel terikat)
Perhitungan ANOVA :

𝟏 1
SST = 𝐘 𝐓 𝒀 − 𝒏 𝒀𝑻 𝑱𝒀 = ∑ 𝑌 2 − 𝑛 (∑ 𝑌)2 = 𝑆𝑆𝑅 + 𝑆𝑆𝐸
𝟏 1
SSR = 𝛃𝐓 𝑿𝑻 𝒀 − 𝒏 𝒀𝑻 𝑱𝒀 =𝛃𝐓 𝑿𝑻 𝒀 − 𝑛 (∑ 𝑌)2
SSE = 𝐘 𝐓 𝒀 − 𝜷𝑻 𝑿𝑻 𝒀 = ∑ 𝑌 2 − 𝜷𝑻 𝑿𝑻 𝒀

Dengan :
1 1 … 1
1 1 … 1
𝐽=[ ]
⋮ ⋮ ⋱ ⋮
1 1 1 1 𝑛𝑥𝑛

18
Tabel ANOVA :

Sumber
SS Df MS 𝐹ℎ𝑖𝑡𝑢𝑛𝑔
Keragaman
𝑆𝑆𝑅
Regresi 𝑆𝑆𝑅 𝑘 𝑀𝑆𝑅 =
𝑘 𝑀𝑆𝑅
𝑆𝑆𝐸 𝑀𝑆𝐸
Error 𝑆𝑆𝐸 𝑛−𝑘−1 𝑀𝑆𝐸 =
𝑛−𝑘−1
Total 𝑆𝑆𝑇 𝑛−1

Daerah Penolakan 𝐻0 :
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹(1−𝛼;𝑘,𝑛−𝑘−1)
Jika tolak 𝐻0 , dapat dikatakan bahwa minimal ada satu variabel bebas yang signifikan/ model
dapat menjelaskan hubungan antar variabel.

• Uji Parsial
Uji ini digunakan untuk menguji apakah variabel bebas tertentu signifikan di dalam model
(apakah signifikan mempengaruhi variabel tak bebas).

Hipotesis:
𝐻0 : 𝛽𝑗 = 0
(variabel bebas ke-j tidak signifikan mempengaruhi variabel tak bebas)
𝐻1 : 𝛽𝑗 ≠ 0
(variabel bebas ke-j signifikan mempengaruhi variabel tak bebas)

Statistik uji:
𝑏𝑗
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
𝑠(𝑏𝑗 )
𝑠 2 (𝑏0 ) 𝑠 2 (𝑏0 , 𝑏1 ) 𝑠 2 (𝑏0 , 𝑏11 )
−𝟏 𝑆𝑆𝐸
𝑠 2 (𝑏) = 𝑀𝑆𝐸(𝐗 𝐓 𝑿) = [ 𝑠 2 (𝑏1 , 𝑏0 ) 𝑠 2 (𝑏1 ) 𝑠 2 (𝑏1 , 𝑏11 )] ; 𝑀𝑆𝐸 = 𝑛−𝑝
𝑠 2 (𝑏11 , 𝑏0 ) 𝑠 2 (𝑏11 , 𝑏1 ) 𝑠 2 (𝑏11 )

Daerah Penolakan 𝐻0 :
Tolak 𝐻0 jika |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | > |𝑡(1−𝛼;𝑛−2) |
2
Jika tolak 𝐻0 , dapat dikatakan bahwa variabel bebas ke-j signifikan mempengaruhi variabel tak
bebas (Y).

D. Asumsi Regresi Linear Berganda


1. Linieritas
Plot antara nilai-nilai residual (𝑒𝑖 ) dengan nilai 𝑋𝑖 memiliki pencaran titik yang membentuk
sebaran acak di sekitar nol, maka asumsi linieritas terpenuhi.

2. Normalitas
Plot antara residual yang diurutkan ei dengan nilai harapannya 𝐸(𝑒𝑖 ) memiliki pencaran titik
yang membentuk suatu garis linier, maka asumsi kenormalan terpenuhi.

19
3. Homoskedastisitas
Jika plot antara ei dengan Xi menunjukan pola acak, atau plot antara ei dengan Yi menunjukan
pola acak, maka asumsi kesamaan varians (homoskedastisitas) terpenuhi.

4. Independensi/Autokorelasi
Sering terjadi terutama pada data time series dan dapat menimbulkan masalah serius pada nilai
penduga dari varians sample (MSE).

5. Multikollinieritas
Merupakan korelasi antar variabel bebas pada model regresi berganda. Diindikasikan dengan
nilai VIF (Variance Inflaction Factor). Jika nilai VIF besar dari 10 meningindikasikan adanya
multikolinieritas. Untuk melakukan analisis regresi linier berganda, antar variabel independen
tidak boleh memiliki ketergantungan.

E. Keandalan Persamaan Regresi


• Koefisien Determinasi
Koefisien ini mengukur besarnya kontribusi variabel bebas yang ada di dalam model dalam
menjelaskan keragamaan variabel tak bebas.
𝑆𝑆𝑅 𝑆𝑆𝐸
𝑅2 = =1−
𝑆𝑆𝑇 𝑆𝑆𝑇
Permasalahan: setiap penambahan variabel bebas ke dalam model akan selalu meningkatkan
nilai koefisien determinasi.
• Koefisien Determinasi Adjusted
Untuk mengatasi permasalahan di atas, koefisien determinasi yang disesuaikan (adjusted 𝑅^2)
lebih dianjurkan untuk digunakan dalam kasus RLB.
𝑆𝑆𝐸
2
𝑅𝑎𝑑𝑗 =1− 𝑛 − 𝑘 − 1 = 1 − 𝑆𝑆𝐸(𝑛 − 1)
𝑆𝑆𝑇 𝑆𝑆𝑇(𝑛 − 𝑘 − 1)
𝑛−1

• Koefisien Determinasi Parsial


Pada model RLB dengan 2 variabel bebas aka nada koefisien determinasi parsian sebagai
berikut:
2
𝑅𝑦(𝑥 1 |𝑥2 )
:mengetahui proporsi keberagaman y yang dijelaskan oleh 𝑥1 tapi tidak dijelaskan
oleh 𝑥2
2
𝑅𝑦(𝑥 2 |𝑥1 )
:mengetahui proporsi keberagaman y yang dijelaskan oleh 𝑥2 tapi tidak dijelaskan
oleh 𝑥1
Langkah perhitungan: (pendekatan Extra Sums of Squares (Netter et al: 271))

a. Menentukan 𝑆𝑆𝐸(𝑋1 )
𝑆𝑆𝐸(𝑋1 ) adalah jumlah kuadrat error (residual) pada model regresi yang hanya melibatkan
𝑋1 sebagai variabel bebasnya, sedangkan 𝑆𝑆𝐸(𝑋1 , 𝑋2 ) adalah jumlah kuadrat error (residual)
yang didapat pada model regresi berganda yang terdapat 𝑋1 dan 𝑋2 sebagai variabel
bebasnya.
𝑌̂𝑖 = 𝑏0 + 𝑏1 𝑋𝑖
2
𝑆𝑆𝐸(𝑋𝑖 ) = ∑(𝑌𝑖 − 𝑌̂𝑖 ) = ∑ 𝑌 2 − 𝑏0 ∑ 𝑌 − 𝑏1 ∑ 𝑋𝑌

20
b. Menentukan 𝑆𝑆𝑅(𝑋𝑖 |𝑋𝑗 )
Contoh: 𝑆𝑆𝑅(𝑋1 |𝑋2 ) = 𝑆𝑆𝑅(𝑋1 , 𝑋2 ) − 𝑆𝑆𝑅(𝑋2 ) = 𝑆𝑆𝐸(𝑋2 ) − 𝑆𝑆𝐸(𝑋1 , 𝑋2 )

2
c. Menentukan 𝑅𝑦(𝑥 𝑖 |𝑥𝑗 )

2 𝑆𝑆𝑅(𝑋1 |𝑋2 ) 2 𝑆𝑆𝑅(𝑋1 |𝑋2 , 𝑋3 )


𝑅𝑌(𝑋1 |𝑋2 )
= 𝑆𝑆𝐸(𝑋2 )
𝑅𝑌(𝑋1 |𝑋2 ,𝑋3 )
= 𝑆𝑆𝐸(𝑋2 ,𝑋3 )

d. Kesimpulan
2
Misal: 𝑅𝑌(𝑋1 |𝑋2 )
= 0,86
Keragaman nilai variabel Y yang dapat dijelaskan oleh variabel 𝑋1 tetapi tidak dapat
dijelaskan oleh 𝑋2 sebesar 86%.

Regresi Variabel Dummy

A. Definisi
Regresi linear sederhana dan regresi linear berganda yang telah dibahas sebelumnya selalu
menggunakan variabel kuantitatif sebagai variabel bebasnya. Regresi dengan variabel dummy
atau regresi kualitatif pada dasarnya adalah meng”kuantitatifkan” data kualitatif dengan cara
menjadikannya kode 0 dan 1. Bila suatu variabel bebas memiliki k kategori, variabel indikator
yang dibuat sebanyak (k-1) variabel indikator yang masing-masing bernilai 0 atau 1. Dummy
yang bernilai 0 disebut dengan kategorik pembanding atau dasar atau reference.

 Variabel Dummy → pada prinsipnya merupakan perbandingan karakteristik. Misalnya:


◦ Perbandingan kondisi (besaran/jumlah) konsumen yang merasa puas terhadap suatu
produk dengan konsumen yang tidak puas.
◦ Perbandingan besarnya gaji antara laki-laki dan perempuan.

B. Contoh Bentuk Model Dasar


Contoh 1 :
Regresi dengan sebuah variabel bebas kualitatif
Y = Pengeluaran untuk konsumsi rumah tangga
X = Jenis kelamin Kepala Rumah Tangga (0=perempuan dan 1=Laki-laki)
Model :
𝑌𝑖 = 𝛽0 + 𝛽1 𝐷𝑖 + 𝜀𝑖
Dengan demikian,
• perkiraan rata-rata pengeluaran untuk konsumsi rumah tangga dengan kepala rumah tangga
berjenis kelamin perempuan adalah 𝛽0 .
• Sementara itu, perkiraan rata-rata pengeluaran untuk konsumsi rumah tangga dengan
kepala rumah tangga berjenis kelamin laki-laki adalah 𝛽0 + 𝛽1 .

Contoh 2 :
Regresi dengan variabel bebas kuantitatif dan kualitatif
Y = Gaji pegawai
𝑋1 =Pengalaman Kerja (tahun)
𝑋2 =Skor ujian
𝑋3 =Jenis kelamin (0=perempuan dan 1=laki-laki)

21
Model :
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + 𝛽3 𝐷𝑖3 + 𝜀𝑖
Dengan demikian,
• Perkiraan rata-rata gaji pegawai dengan pengalaman kerja 0 tahun, skor ujian 0, dan
berjenis kelamin perempuan adalah sebesar 𝛽0 .
• Jika pengalaman kerja naik sebesar 1, perkiraan rata-rata gaji pegawai akan naik sebesar 𝛽1
dengan skor ujian dan jenis kelamin yang sama.
• Jika skor ujian naik sebesar 1 satuan, perkiraan rata-rata gaji pegawai akan naik sebesar 𝛽2
dengan pengalaman kerja dan jenis kelamin yang sama.
• Jika pegawai berjenis kelamin laki-laki, perkiraan rata-rata gaji pegawai akan naik sebesar
𝛽3 dengan pengalaman kerja dan skor ujian yang sama.

Contoh 3 :
Regresi dengan variabel bebas kuantitatif dan kualitatif (lebih dari dua kategori)
Y = Gaji pegawai
𝑋1 =Pengalaman Kerja (tahun)
𝑋2 = Skor ujian
𝑋3 = Jenis Kelamin (0=perempuan dan 1=laki-laki)
𝑋4 = Tingkat Pendidikan (SMA, sarjana, dan pascasarjana)

Dalam kasus ini, variabel bebas 𝑋4 memiliki 3 kategori sehingga akan dibuat 2 indikator yang
masing-masing bernilai 0 atau 1. Indikator yang dimaksud 𝑋4.𝑠𝑎𝑟𝑗𝑎𝑛𝑎 dan 𝑋4.𝑝𝑎𝑠𝑐𝑎𝑠𝑎𝑟𝑗𝑎𝑛𝑎 . Jika
kedua indikator ini bernilai 0, berarti secara otomatis pegawai tersebut memiliki tingkat
Pendidikan SMA.
Model :
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + 𝛽3 𝐷𝑖3 + 𝛽4.𝑠𝑎𝑟𝑗𝑎𝑛𝑎 𝐷4.𝑠𝑎𝑟𝑗𝑎𝑛𝑎 + 𝛽4.𝑝𝑎𝑠𝑐𝑎𝑠𝑎𝑟𝑗𝑎𝑛𝑎 𝐷4.𝑝𝑎𝑠𝑐𝑎𝑠𝑎𝑟𝑗𝑎𝑛𝑎 + 𝜀𝑖

22
POLITEKNIK STATISTIKA STIS
JAKARTA
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2017/2018
MATA KULIAH : ANALISIS REGRESI
TINGKAT : II
DOSEN : TIM DOSEN
HARI/TANGGAL : RABU/25 APRIL 2018
WAKTU : 2 JAM
SIFAT UJIAN : TUTUP BUKU – BOLEH MENGGUNAKAN KALKULATOR
Berdoalan Sebelum Bekerja
1. (NILAI 30)
Indeks Pembangunan Manusia (IPM) menjelaskan bagaimana penduduk dapat mengakses hasil
pembangunan dalam memperoleh pendapatan, kesehatan, pendidikan dan sebagainya. Salah satu
variabel yang diduga memengaruhi nilai IPM suatu kabupaten adalah persentase pengeluaran
pemerintah daerah untuk pendidikan. Berikut data di setiap kabupaten di Provinsi Papua Barat tahun
2016 (data hipotetik).
Kabupaten IPM Presentase Pengeluaran
untuk pendidikan
Fakfak 66 8,2
Kaimana 62 7,8
Teluk Wondana 57 6,6
Teluk Bintuni 62 7,6
Manokwari 70 7,8
Sorong Selatan 59 7,0
Sorong 62 7,6
Raja Ampat 62 7,5
Tambrauw 50 4,7
Maybrat 56 6,3
Manokwari Selatan 57 6,3
Pegunungan Arfak 54 4,9
a. Bangun model regresi untuk menjelaskan pengaruh persentase pengeluaran pemerintah daerah
untuk pendidikan terhadap IPM di Provinsi Papua Barat tahun 2016. Interpretasikan nilai
koefisien regresi.
b. Apakah persentase pengeluaran pemerintah daerah untuk pendidikan signifikan memengaruhi
nilai IPM? Gunakan tingkat signifikansi 5%.
c. Buatlah prediksi interval 95% untuk IPM Kota Sorong yang memiliki persentase pengeluaran
untuk pendidikan 10,9%.

2. (NILAI 35)
Provinsi A ingin mengetahui model hubungan antara Tingkat Persentase Angkatan Kerja (TPAK)
terhadap performa perekonomian daerahnya yang dilihat dari aspek nilai total output (PDRB). Provinsi
A meliputi 15 kabupaten, di mana berdasarkan nilai TPAKnya kelima belas kabupaten/kota tersebut
terbagi menjadi 5 level. Model awal yang mereka lakukan adalah pemodelan linier sederhana. Namun
diperoleh informasi tambahan bahwa antara TPAK dengan PDRB tidak sesederhana itu, bisa saja
didapatkan efek hubungan yang tidak linier antara TPAK dengan nilai PDRB. Kemudian dilakukan

23
pemodelan kuadratik berdasarkan informasi tersebut. Anda sebagai seorang statistisi diminta
pendapatnya untuk menanggapi hasil dari dua pemodelan berikut ini. Gunakan tingkat signifikansi 5%.
Jika diperlukan.
Komponen yang diketahui Model Linier Sederhana Model Kuadratik
Jumlah Kuadrat Simpangan 0,2027 1,477
rata-rata PDRB terhadap
nilai estimasinya (fitted
value)
Jumlah kuadrat simpangan 0,58 -
nilai PDRB terhadap nilai
rata-rata pada setiap level
TPAK
Estimasi Varians Error 151 0.06
Konstanta 2,306 (𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 4,917) 7.96 (𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 6,323)
Efek Linier 0,007 (𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 1,151) -0,154 (𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = −4,399)
Efek Kuadratik - 0,001 (𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 4,618)
a. Sebaiknya model apa yang paling tepat untuk menjelaskan hubungan antara TPAK dan PDRB di
Provinsi A? Jelaskan alasannya secara sistematik dan statistik!
b. Tuliskan persamaan yang paling baik menunjukkan hubungan antara TPAK dengan PDRB.
Interpretasikan persamaannya!
c. Berapa nilai Koefisien determinasi model yang anda pilih dan jelaskan maknanya!

3. (NILAI 35). Seorang mahasiswa STIS ingin melakukan penelitian apakah nilai Analisis Regresi
seorang mahasiswa dipengaruhi oleh nilai Metode Statistika II (X1), lama belajar kelompok selama
seminggu (X2 dalam jam) dan lama belajar secara mandiri selama seminggu (X3 dalam jam). Berikut
ditampilkan output pengolahan dari 15 orang mahasiswa.
ANOVA
Model Sum of Square df Mean Square
1 Regression … … …
𝑋1 … …
𝑋2 , 𝑋3 |𝑋1 … …
Residual 0,830 … …
Total … …

Coefficient
Model Unstandardized Standardized 𝑏𝑖
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
Coefficient Coefficient 𝑠(𝑏𝑖 )
B Std.error Beta
1 Constant 0,232 0,552
𝑋1 0,213 0,064 0,245 …
𝑋2 0,101 0,040 0,344 …
𝑋3 0,152 0,042 0,383 …

Dependent variable: Y
Diketahui:
𝑆𝑆𝑅(𝑋1 ) = 13,630

24
𝑆𝑆𝐸(𝑋1 ) = 10,103
𝑆𝑆𝐸(𝑋2 ) = 3,015
𝑆𝑆𝐸(𝑋3 ) = 2,447
𝑆𝑆𝐸(𝑋1 , 𝑋2 ) = 1,795
𝑆𝑆𝐸(𝑋1 , 𝑋3 ) = 1,315
𝑆𝑆𝐸(𝑋2 , 𝑋3 ) = 1,678
a. Lengkapilah tabel ANOVA dan Coefficients tersebut!
b. Buatlah persamaan regresinya serta interpretasikan nilai koefisien regresinya!
c. Berapa persen keragaman nilai analisis regresi yang dapat dijelaskan oleh Metode Statistika II,
lama belajar kelompok dan lama belajar mandiri? Jelaskan!
d. Apakah ketiga variable tersebut memengaruhi nilai analisis regresi? Jelaskan!
e. Hitunglah Koefisien determinasi parsial dan koefisien korelasi parsial untuk setiap variable
bebas, jika 2 variabel bebas yang lain sudah ada di dalam model! Interpretasikan hasilnya!

25
PEMBAHASAN UTS GENAP 2017/2018
ANALISIS REGRESI

1.
∑ 𝑌 = 717

∑ 𝑋 = 82,3

∑ 𝑋 2 = 578,73

∑ 𝑋𝑌 = 4978,9

∑ 𝑌 2 = 43163
IPM sebagai variable dependen
𝑠𝑥𝑦 𝑛 ∑ 𝑋𝑌−∑ 𝑋 ∑ 𝑌 737,7
a. 𝑏1 = = 2 = = 4,3022
𝑠𝑥2 𝑛 ∑ 𝑋 −(∑ 𝑋)2 171,47
Interpretasi : Untuk setiap penambahan 1 persen pengeluaran pemerintah untuk pendidikan
akan meningkatkan Indeks Pembangunan Manusia (IPM) sebesar 4,3022 di Provinsi Papua.

𝑏0 = 𝑌̅ − 𝑏1 𝑋̅ = 59,75 − 4,3022 × 5,8583 = 30,244179


Interpretasi : Jika (𝑥=0) tidak ada pengeluaran pemerintah untuk pendidikan, maka Indeks
Pembangunan Manusia (IPM) di Provinsi Papua Barat sebesar 30,244.
𝑌̂𝑖 = 30,244179 + 4,3022𝑋𝑖

b.
➢ 𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠
𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
➢ Taraf Uji 𝛼 = 5%
➢ Statistik Uji
2
𝑆𝑆𝐸 ∑(𝑌𝑖 − 𝑌̂𝑖 ) ∑ 𝑌𝑖2 − 𝑏0 ∑ 𝑌𝑖 − 𝑏1 ∑ 𝑋𝑖 𝑌𝑖
𝑀𝑆𝐸 = = = = 5,7828
𝑛−2 𝑛−2 𝑛−2
𝑀𝑆𝐸
𝑠 2 (𝑏1 ) = = 0,4047
∑(𝑋𝑖 − 𝑋̅)2
𝑠(𝑏1 ) = √𝑠 2 (𝑏1 ) = √0,4047 = 0,6362
𝑏1 4,3022
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = = = 6,7628
𝑠(𝑏1 ) 0,6362
➢ Keputusan
Karena 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 > 𝑡𝛼 atau 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 < −𝑡𝛼 maka tolak 𝐻0
➢ Kesimpulan
Dengan tingkat kepercayaan 95% persentase pengeluaran pemerintah untuk pendidikan
berpengaruh signifikan terhadap indeks pembangunan manusia (IPM).

26
c.
2 2
1 (𝑋ℎ − 𝑋̂) 𝑛(𝑋ℎ − 𝑋̂)
𝑠 2 (𝑌ℎ 𝑛𝑒𝑤) = 𝑀𝑆𝐸(1 + + =
𝑛 ∑(𝑋 − 𝑋̂)2 𝑛 ∑ 𝑋 2 − (∑ 𝑋)2
𝑖
1 12(10,9 − 6,8583)2
= 5,7828 (1 + + ) = 12,8755
12 171,47
𝑠(𝑌ℎ 𝑛𝑒𝑤) = √12,8755 = 3,5882
𝑌̂ℎ = 30,2240 + 4,3022 × 10,9 = 77,1179
𝑃 [𝑌ℎ − 𝑡(1−𝛼;𝑛−2) 𝑠(𝑌̂ℎ 𝑛𝑒𝑤) ≤ 𝑌ℎ 𝑛𝑒𝑤 ≤ 𝑡(1−𝛼;𝑛−2) 𝑠(𝑌̂ℎ 𝑛𝑒𝑤) + 𝑌ℎ ] = 1 − 𝛼
2 2
𝑃[77,1179 − 2,2281 × 3,5882 ≤ 𝑌ℎ 𝑛𝑒𝑤 ≤ 77,1179 + 2,2281 × 3,5882] = 95%
𝑃[69,123 ≤ 𝑌ℎ 𝑛𝑒𝑤 ≤ 85,1128] = 95%

2.
a. Uji t
➢ Model Linier
𝐻0 : 𝛽0 = 0
𝐻1 : 𝛽0 ≠ 0

𝐻0: 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0

Taraf Uji 𝛼 = 5%

Statistik Uji
𝑏𝑖
𝑡=
𝑠(𝑏𝑖 )
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 4,917 (𝑏0 )
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 1,151 (𝑏1 )
𝑡0,975;13 = 2,160

Keputusan
Untuk 𝛽0 tolak 𝐻0 karena 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 ≥ 𝑡𝑡𝑎𝑏𝑒𝑙
Untuk 𝛽1 gagal tolak 𝐻0 karena 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 < 𝑡𝑡𝑎𝑏𝑒𝑙

Kesimpulan
Dengan signifikansi 5% dapat dinyatakan bahwa variabel 𝑥 tidak berpengaruh secara
signifikan terhadap variabel 𝑦.

➢ Model Kuadratik
𝐻0 : 𝛽0 = 0
𝐻1 : 𝛽0 ≠ 0

𝐻0: 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0

27
𝐻0: 𝛽11 = 0
𝐻1 : 𝛽11 ≠ 0

Taraf uji 𝛼 = 5%

Statistik Uji
𝑏𝑖
𝑡=
𝑠(𝑏𝑖 )
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 6,323 (𝑏0 )
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = −4,399 (𝑏1 )
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 4,618 (𝑏11 )
𝑡0,975;11 = 2,201
Keputusan
Untuk 𝛽0 , 𝛽1 , 𝛽11 tolak 𝐻0 karena 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 ≥ 𝑡𝑡𝑎𝑏𝑒𝑙 𝑎𝑡𝑎𝑢 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 ≤ −𝑡𝑡𝑎𝑏𝑒𝑙

Kesimpulan
Dengan taraf uji 0,05, efek linier dan efek kuadratik pada variabel 𝑥 di dalam model
berpengaruh secara signifikan terhadap variabel 𝑦.

Dari hasil tersebut, sudah cukup untuk mengatakan bahwa model kuadratik lebih cocok
digunakan karena semua koefisien regresinya signifikan. Dapat juga dilakukan uji ketepatan
model atau uji F dengan ANOVA.
Linier Kuadratik
𝑛=15 𝑐=5 𝑛=15
𝑆𝑆𝑅=0,2027 𝑆𝑆𝑅=1,477
𝑆𝑆𝑃𝐸=0,58 𝑀𝑆𝐸=0,06
Estimasi Varians Error = MSE = 151* 𝑆𝑆𝐸=𝑀𝑆𝐸×𝑑𝑓=0,06×12=0,72
𝑆𝑆𝑇=𝑆𝑆𝑅+𝑆𝑆𝐸=1,477+0,72=2,197

* Setelah dikonfirmasi dengan Pak Agung Priyo Utomo, nilai MSE = 151 tidak masuk akal,
karena nilai SSE dan SSR akan sangat berbeda jauh yang juga mengakibatkan nilai F-test yang
sangat besar. Sehingga menurut beliau angka tersebut adalah kesalahan soal.

b. 𝑌𝑖 = 7,96 − 0,154𝑋𝑖 + 0,001𝑋𝑖2


Interpretasi : Nilai (rata-rata) PDRB akan bernilai 7,96 jika tingkat persentase angkatan kerja
bernilai 0 dan nilai PDRB akan mengalami penurunan sebesar 0,154 sebagai efek linier dan
peningkatan 0,001 sebagai efek kuadratik jika tingkat persentase angkatan kerja bertambah 1.

𝑆𝑆𝑅 1,477
c. 𝑅 2 = 𝑆𝑆𝑇 = 2,197 = 0,67288 = 67,3%
Interpretasi : Dengan menggunakan model kuadratik, keragaman nilai PDRB yang dapat
dijelaskan oleh TPAK sebesar 67,3% dan sisanya dipengaruhi variabel lain yang tidak termasuk
ke dalam model.

3.
a. Melengkapi tabel
𝑆𝑆𝑅(𝑋2 , 𝑋3 |𝑋1 ) = 𝑆𝑆𝐸(𝑋1 ) − 𝑆𝑆𝐸(𝑋1 , 𝑋2 , 𝑋3 ) = 10,103 − 0,830 = 9,273

28
𝑆𝑆𝑅(𝑋1 , 𝑋2 , 𝑋3 ) = 𝑆𝑆𝑅(𝑋1 ) + 𝑆𝑆𝑅(𝑋2 , 𝑋3 |𝑋1 ) = 13,630 + 9,273 = 22,903
𝑆𝑆𝑇 = 𝑆𝑆𝑅 + 𝑆𝑆𝐸 = 22,903 + 0,830 = 23,733

ANOVA
Model Sum of Square df Mean Square
1 Regression 22,903 3 7,635
𝑋1 13,630 1
𝑋2 , 𝑋3 |𝑋1 9,273 2
Residual 0,830 11 0,0754
Total 23,733 14

Coefficient
Model Unstandardized Standardized 𝑏𝑖
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
Coefficient Coefficient 𝑠(𝑏𝑖 )
B Std.error Beta
1 Constant 0,232 0,552
𝑋1 0,213 0,064 0,245 3,34
𝑋2 0,101 0,040 0,344 2,525
𝑋3 0,152 0,042 0,383 3,619

b. 𝑌̂𝑖 = 0,232 + 0,213𝑋1 + 0,101𝑋2 + 0,153𝑋3


Interpretasi:
• Nilai (rata-rata) mata kuliah analisis regresi mahasiswa STIS sebesar 0,232 di saat tidak ada
pengaruh nilai metode statistika II, lama belajar kelompok dan lama belajar mandiri selama
seminggu (𝑋1, 𝑋2, 𝑋3 = 0).
• Nilai (rata-rata) mata kuliah analisis regresi mahasiswa STIS akan naik sebesar 0,213 jika
nilai metode statistika II naik sebesar satu satuan, ketika variabel lama belajar kelompok dan
lama belajar mandiri selama seminggu dianggap konstan.
• Nilai (rata-rata) mata kuliah analisis regresi mahasiswa STIS akan naik sebesar 0,101 jika
lama belajar kelompok ditambah satu jam per minggu, ketika variabel nilai metode statistika
II dan lama belajar mandiri selama seminggu dianggap konstan.

• Nilai (rata-rata) mata kuliah analisis regresi mahasiswa STIS akan naik sebesar 0,152 jika
lama belajar mandiri ditambah satu jam per minggu, ketika variabel nilai metode statistika II
dan lama belajar kelompok selama seminggu dianggap konstan.

2 𝑆𝑆𝐸(𝑛−1) 0,830(15−1)
c. 𝑅(𝑋1 ,𝑋2 ,𝑋3 ,)(𝑎𝑑𝑗)
= 1 − 𝑆𝑆𝑇(𝑛−𝑝) = 1 − 23,733(15−4) = 0,9554 = 95,54%
Interpretasi:
Keragaman nilai mata kuliah analisis regresi mahasiswa STIS dapat dijelaskan secara bersama-
sama oleh variabel nilai metode statistika II, jam belajar kelompok (per minggu), dan jam belajar
mandiri (per minggu) sebesar 95,54% dan 4,46% sisanya dipengaruhi variabel lain yang tidak
termasuk di dalam model.

29
d. Uji parsial masing-masing parameter
➢ Hipotesis
o 𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
o 𝐻0 : 𝛽2 = 0
𝐻1 : 𝛽2 ≠ 0
o 𝐻0 : 𝛽3 = 0
𝐻1 : 𝛽3 ≠ 0
➢ Taraf Uji
𝛼 = 5%
➢ Statistik Uji
𝑏𝑖
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
𝑠(𝑏𝑖 )

𝑡1 = 3,34
𝑡2∗ = 2,525
𝑡3∗ = 3,619
𝑡0,975;11 = 2,201
➢ Keputusan
Tolak 𝐻0 pada masing-masing parameter karena 𝑡𝑖∗ ≥ 𝑡0,975;11
➢ Kesimpulan
Dengan taraf uji 0,05, variabel nilai metode statistika II, lama jam belajar kelompok, lama jam
belajar mandiri berpengaruh secara signifikan terhadap nilai analisis regresi.

e. 𝑆𝑆𝑅(𝑋1 |𝑋2 , 𝑋3 ) = 𝑆𝑆𝐸(𝑋2 , 𝑋3 ) − 𝑆𝑆𝐸(𝑋1 , 𝑋2 , 𝑋3 ) = 1,678 − 0,83 = 0,848


𝑆𝑆𝑅(𝑋2 |𝑋1 , 𝑋3 ) = 𝑆𝑆𝐸(𝑋1 , 𝑋3 ) − 𝑆𝑆𝐸(𝑋1 , 𝑋2 , 𝑋3 ) = 1,315 − 0,83 = 0,485
𝑆𝑆𝑅(𝑋3 |𝑋1 , 𝑋2 ) = 𝑆𝑆𝐸(𝑋1 , 𝑋2 ) − 𝑆𝑆𝐸(𝑋1 , 𝑋2 , 𝑋3 ) = 1,795 − 0,83 = 0,965

2 𝑆𝑆𝑅(𝑋1 |𝑋2 , 𝑋3 ) 0,848


𝑅𝑦( 𝑋1 |𝑋2 , 𝑋3 ) 𝑆𝑆𝑅(𝑋 |𝑋 , 𝑋 ) = 1,678 = 0,505 = 50,5%
=
1 2 3
2 𝑆𝑆𝑅(𝑋2 |𝑋1 , 𝑋3 ) 0,485
𝑅𝑦( 𝑋2 |𝑋1 , 𝑋3 ) = 𝑆𝑆𝐸(𝑋 , 𝑋 ) = 1,315 = 0,368 = 36,8%
1 3
2 𝑆𝑆𝑅(𝑋 |𝑋
3 1 , 𝑋2 ) 0,965
𝑅𝑦( 𝑋3 |𝑋1 , 𝑋2 ) = 𝑆𝑆𝐸(𝑋 , 𝑋 ) = 1,795 = 0,53,7 = 53,7%
1 2
Interpretasi:
• Keragaman nilai analisis regresi yang dapat dijelaskan oleh variabel nilai metode statistika II
tetapi tidak dijelaskan oleh variabel jam belajar kelompok dan jam belajar mandiri sebesar
50,5%.
• Keragaman nilai analisis regresi yang dapat dijelaskan oleh variabel jam belajar kelompok
tetapi tidak dijelaskan oleh variabel nilai metode statistika II dan jam belajar mandiri sebesar
36,8%.
Keragaman nilai analisis regresi yang dapat dijelaskan oleh variabel jam belajar mandiri tetapi
tidak dijelaskan oleh variabel nilai metode statistika II dan jam belajar kelompok sebesar 53,7%.

30
POLITEKNIK STATISTIKA STIS JAKARTA
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2018/2019
MATA KULIAH : ANALISIS REGRESI
TINGKAT : II
DOSEN : TIM DOSEN
HARI/TANGGAL : RABU/11 MARET 2019
WAKTU : 2 JAM
SIFAT UJIAN : TUTUP BUKU – BOLEH MENGGUNAKAN KALKULATOR
Berdoalah Sebelum Bekerja

1. (NILAI 35)
Diduga ada hubungan antara banyaknya lagu yang ada dalam folder musik laptop seseorang
dengan sudah berapa lama orang tersebut memiliki laptop tersebut. Datanya ditampilkan pada
tabel berikut dengan X = lamanya waktu memiliki laptop (dalam minggu) dan 𝑦 = banyaknya
lagu dalam folder musik laptop.

X 23 2 28 5 32 23 4 26 1 13 5
y 49 8 58 12 73 45 6 48 4 27 14

Berdasarkan data di atas,


a. Bangun persamaan regresi linier untuk menjelaskan hubungan antara banyaknya lagu yang
ada dalam folder musik laptop dengan lamanya waktu memiliki laptop. Interpretasikan
hasilnya.
b. Taksir varians error dari model.
c. Uji apakah ada hubungan linier antara banyaknya lagu yang ada dalam folder musik laptop
dengan lamanya waktu memiliki laptop. d. Apakah model linier cocok untuk menjelaskan
hubungan antara banyaknya lagu yang ada dalam folder musik laptop dengan sudah berapa
lama laptop itu dimiliki pada data di atas? Jelaskan

2. (NILAI 35).
Diketahui bahwa gaji seseorang data scientist (dalam juta rupiah) dipengaruhi oleh pengalaman
kerja (X1) (dalam tahun), skor kemampuan bidang statistika (X2), dan skor kemampuan bidang
komputasi (X3). Berikut adalah beberapa ringkasan hasil pengolahan berdasarkan data yang ada.

ANOVA
Model Sum of Square df Mean Square
1 Regression … … …
𝑋1 … … …
𝑋2 |𝑋1 … … …
𝑋3 |𝑋1 , 𝑋2 … … …
Residual … … …
Total … …

31
Coefficient
Model Unstandardized Standardized
Coefficient Coefficient
B Beta
1 Constant 3,631
𝑋1 0,490 0,559
𝑋2 0,355 0,358
𝑋3 0,090 0,088

𝑆𝑆𝐸(𝑋1 ) = 99,256
𝑆𝑆𝑅(𝑋1 |𝑋2 ) = 111,242
𝑆𝑆𝐸(𝑋1 , 𝑋3 ) = 84,913
𝑆𝑆𝐸(𝑋2 ) = 166,214
𝑆𝑆𝐸(𝑋2 , 𝑋3 ) = 107,490
𝑆𝑆𝑅(𝑋3 ) = 2573,168
𝑆𝑆𝑅(𝑋3 , 𝑋2 ) = 2658,5
𝑛 = 15
2
𝑟𝑦2.13 = 0,368165

a. Buatlah persamaan regresi serta interpretasikan nilai koefisien regresinya!


b. Lengkapi tabel ANOVA di atas!
c. Uji apakah ada hubungan regresi antara variabel dependen dan variabel independen?
d. Apakah dapat disimpulkan bahwa 𝛽3 ≠ 0 ? Lakukan prosedur uji statistik!
e. Hitunglah masing-masing koefisien determinasi parsial dan koefisien korelasi parsial
tersebut! Interpretasikan hasilnya!

3. (NILAI 30)
Berikut ini adalah data ekologi tentang area sebaran kerang (m2) dan jumlah spesies (SPECIES).

NO 1 2 3 4 5 6 7 8 9 10
AREA (m2) 5 5 5 9 14 18 17 18 31 40
SPECIES 3 7 6 8 10 9 10 11 16 9

NO 11 12 13 14 15 16 17 18 19 20
AREA (m2) 44 45 50 45 55 75 71 91 137 203
SPECIES 13 14 12 14 20 22 15 20 15 24

Misalkan peneliti ingin menyusun model regresi antara variabel SPECIES (𝑦) dan AREA (X)
menggunakan model 𝑦𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝛽11 𝑋𝑖2 + 𝜀𝑖

a. Apakahterdapat hubungan regresi antara y dan X?


b. Apakah suku kuadratik dapat dihilangkan dari model tersebut? Lakukan pengujian dengan 𝛼
= 0,05.
c. Berapakah kontribusi suku kuadratik di dalam model.

32
Diketahui:
𝑆𝑆𝑇 = 583,8
𝑆𝑆𝑅(𝑋) = 354,0438
𝑆𝑆𝑅(𝑋, 𝑋 2 ) = 417,0525

33
PEMBAHASAN UTS GENAP 2018/2019
ANALISIS REGRESI

1.
∑ 𝑋 = 162

∑ 𝑌 = 344

∑ 𝑋 2 = 3782

∑ 𝑋𝑌 = 7895

∑ 𝑌 2 = 16608
Banyaknya lagu dalam folder music sebagai Variabel dependen

𝑠𝑥𝑦 𝑛 ∑ 𝑋𝑌−∑ 𝑋 ∑ 𝑌 31117


a. 𝑏1 = 𝑠𝑥2
= 2 = 15358 = 2,0261
𝑛 ∑ 𝑋 −(∑ 𝑋)2
Interpretasi: Untuk setiap penambahan 1 minggu lama memiliki laptop akan meningkatkan
banyaknya lagu dalam folder musik sebesar 2,0261.

𝑏0 = 𝑌̅ − 𝑏1 𝑋̅ = 31,2727 − 2,0261 × 14,7273 = 1,4336


Interpretasi: Jika lama seseorang memiliki laptop adalah 0 minggu, maka rata-rata banyaknya
lagu dalam folder musik adalah sebesar 1,4336.

̂𝑖 = 1,4336 + 2,0261𝑋𝑖
𝑌

b. Karena 𝜀𝑖 ~𝑁(0, 𝜎 2 ), maka taksiran bagi 𝜎 2 𝑎𝑑𝑎𝑙𝑎ℎ 𝜎̂ 2 = 𝑀𝑆𝐸


2
𝑆𝑆𝐸 ∑(𝑌𝑖 − 𝑌̂𝑖 ) ∑ 𝑌𝑖2 − 𝑏0 ∑ 𝑌𝑖 − 𝑏1 ∑ 𝑋𝑖 𝑌𝑖
𝑀𝑆𝐸 = = =
𝑛−2 𝑛−2 𝑛−2
16608 − 1,4336 × 344 − 2,0261 × 7895
= = 13,1980
11 − 2
Maka, taksiran varians error dari model adalah 13,1980

c. Dari persamaan regresi, dapat kita buat nilai estimasi sebagai berikut

𝑋 23 2 28 5 32 23 4 26 1 13 5
𝑦 49 8 58 12 73 45 6 48 4 27 14
𝑦̂ 48,03 5,49 58,16 11,56 66,27 48,03 9,54 54,11 3,46 27,77 11,56
(𝑦 − 𝑦̂)2 0,933 6,321 0,027 0,19 45,309 9,205 12,517 37,359 0,292 0,597 5,934

➢ 𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠
𝐻0 : 𝐸(𝑌) = 𝛽0 + 𝛽1 𝑋𝑖
𝐻1 : 𝐸(𝑌) ≠ 𝛽0 + 𝛽1 𝑋𝑖
➢ Taraf Uji 𝛼 = 5%
➢ CR: 𝐹 ∗ > 𝐹0,05;7;2 𝑎𝑡𝑎𝑢 𝐹 ∗ > 118,685

34
➢ Statistik Uji
𝑆𝑆𝑃𝐸 = ∑(𝑦 − 𝑦̂)2 = 118,685

𝑆𝑆𝑃𝐸 118,685
𝑀𝑆𝑃𝐸 = = = 59,342
11 − 9 2
𝑆𝑆𝐿𝐹 = 𝑆𝑆𝐸 − 𝑆𝑆𝑃𝐸 = 118,782 − 118,685 = 0,097
𝑆𝑆𝐿𝐹 0,097
𝑀𝑆𝐿𝐹 = = = 0,014
9−2 7
𝑀𝑆𝐿𝐹 0,014
𝐹∗ = = = 0,0002
𝑀𝑆𝑃𝐸 59,342

➢ Keputusan
Karena 𝐹 ∗ < 𝐹0,05;2;17 maka gagal tolak 𝐻0
➢ Kesimpulan
Dengan tingkat signifikansi 5%, terdapat cukup bukti untuk menyatakan bahwa terdapat
hubungan linier antara banyaknya lagu yang ada dalam folder musik laptop dengan lamanya
waktu memiliki laptop.

d. Koefisien Determinasi
2
(∑ 𝑌)2 3442
𝑆𝑆𝑇 = ∑ 𝑌 − = 16608 − = 5850,1818
𝑛 11
𝑆𝑆𝐸 118,7821
𝑅2 = 1 − =1− = 0,9797 = 97,97%
𝑆𝑆𝑇 5850,1818
Jadi, model linier sudah cocok untuk menjelaskan hubungan antara banyaknya lagu yang ada
dalam folder musik laptop dengan sudah berapa lama laptop itu dimiliki karena model mampu
menjelaskan keragaman banyak lagu dalam folder musik sebesar 97,97%.

2.
a. Berdasarkan tabel “coefficients”, dapat kita susun persamaan regresi sebagai berikut.
𝑌̂𝑖 = 3,631 + 0,49𝑋𝑖 + 0,355𝑋2 + 0,09𝑋3
Interpretasi:
➢ Rata-rata gaji seorang data scientist dengan mengabaikan pengalaman kerja, skor
kemampuan bidang statistik, dan skor kemampuan bidang komputasi adalah
Rp3.631.000,00.
➢ Rata-rata gaji seorang data scientist akan naik sebesar Rp490.000,00 jika lama pengalaman
kerja lebih lama 1 tahun dengan mengabaikan skor kemampuan bidang statistik dan skor
kemampuan bidang komputasi.
➢ Rata-rata gaji seorang data scientist akan naik sebesar Rp355.000,00 jika skor kemampuan
bidang statistiknya lebih tinggi 1 poin dengan mengabaikan lama pengalaman kerja dan skor
kemampuan bidang komputasi
➢ Rata-rata gaji seorang data scientist akan naik sebesar Rp90.000,00 jika skor kemampuan
bidang komputasinya lebih tinggi 1 poin dengan mengabaikan lama pengalaman kerja dan
skor kemampuan statistik

b. Untuk tabel ANOVA


𝑆𝑆𝐸(𝑋1 , 𝑋2 ) = 𝑆𝑆𝐸(𝑋2 ) − 𝑆𝑆𝐸(𝑋1 |𝑋2 ) = 166,214 − 111,242 = 54,972
𝑆𝑆𝑅(𝑋2 |𝑋1 ) = 𝑆𝑆𝐸(𝑋1 ) − 𝑆𝑆𝐸(𝑋2 ) + 𝑆𝑆𝑅(𝑋1 |𝑋2 ) = 44,293

35
2
𝑆𝑆𝑅(𝑋2 |𝑋1 , 𝑋3 ) = 𝑟𝑦2,13 × 𝑆𝑆𝐸(𝑋1 , 𝑋3 ) = 0,368165 × 84,913 = 31,262

𝑆𝑆𝐸(𝑋1 , 𝑋2 , 𝑋3 ) = 𝑆𝑆𝐸(𝑋1 , 𝑋3 ) − 𝑆𝑆𝑅(𝑋2 |𝑋1 , 𝑋3 ) = 84,913 − 31,262 = 53,651


𝑆𝑆𝑅(𝑋3 |𝑋1 , 𝑋2 ) = 𝑆𝑆𝐸(𝑋1 , 𝑋2 ) − 𝑆𝑆𝐸(𝑋1 , 𝑋2 , 𝑋3 ) = 54,972 − 53,651 = 1,321
𝑆𝑆𝑅(𝑋2 |𝑋3 ) = 𝑆𝑆𝑅(𝑋3 , 𝑋2 ) − 𝑆𝑆𝑅(𝑋3 ) = 2658,510 − 2573,168 = 85,342
𝑆𝑆𝐸(𝑋3 ) = 𝑆𝑆𝑅(𝑋2 |𝑋3 ) + 𝑆𝑆𝐸(𝑋2 , 𝑋3 ) = 85,342 + 107,490 = 192,832
𝑆𝑆𝑅(𝑋1 |𝑋3 ) = 𝑆𝑆𝐸(𝑋3 ) − 𝑆𝑆𝐸(𝑋1 , 𝑋3 ) = 192,832 − 84,913 = 107,919
𝑆𝑆𝑅(𝑋1 , 𝑋2 , 𝑋3 ) = 𝑆𝑆𝑅(𝑋3 ) + 𝑆𝑆𝑅(𝑋1 |𝑋3 ) + 𝑆𝑆𝑅(𝑋2 |𝑋1 , 𝑋3 ) = 2712,349
𝑆𝑆𝑅(𝑋1 ) = 𝑆𝑆𝑅(𝑋1 , 𝑋2 , 𝑋3 ) − 𝑆𝑆𝑅(𝑋2 |𝑋1 ) − 𝑆𝑆𝑅(𝑋3 |𝑋1 , 𝑋2 ) = 2666,735
𝑆𝑆𝑇 = 𝑆𝑆𝑅 + 𝑆𝑆𝐸 = 2712,349 + 23,710 = 2766

ANOVA
Model Sum of Square df Mean Square
1 Regression 2712,349 3 904,116
𝑋1 2666,735 1 2666,735
𝑋2 |𝑋1 44,293 1 44,293
𝑋3 |𝑋1 , 𝑋2 1,321 1 1,321
Residual 53,651 11 4,877
Total 2766 14

c. Hipotesis
𝐻0 : 𝛽1 = 𝛽2 = 𝛽2
𝐻1 : 𝑀𝑖𝑛𝑖𝑚𝑎𝑙 𝑎𝑑𝑎 𝑠𝑎𝑡𝑢 𝛽𝑖 ≠ 0; 𝑖 = 1,2,3
Taraf Uji 5%

Statistik Uji
𝑀𝑆𝑅 904,116
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = = = 185,3836
𝑀𝑆𝐸 4,877
𝐹𝛼;𝑝−1;𝑛−𝑝 = 𝐹0,05;2;12 = 3,587

Keputusan
Karena 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 maka tolak 𝐻0

Kesimpulan
Dengan demikian, kesimpulannya adalah dengan tingkat signifikansi 5%, terdapat cukup bukti
untuk menunjukkan bahwa terdapat hubungan regresi antara variabel dependen dan variabel
independen.

d.
➢ Hipotesis
𝐻0 : 𝛽3 = 0
𝐻1 : 𝛽3 ≠ 0
Taraf Uji 𝛼 = 5%

36
Statistik Uji
𝑆𝑆𝑅(𝑋3 )
𝑀𝑆𝑅 1 2573,168
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = = = = 173,476
𝑀𝑆𝐸 𝑆𝑆𝐸(𝑋3 ) 14,833
13

𝐹𝛼;1;𝑛−𝑝 = 𝐹0,05;1;13 = 4,667

Keputusan
Karena 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 maka tolak 𝐻0
Kesimpulan
Dengan demikian, kesimpulannya adalah dengan tingkat signifikansi 5%, terdapat cukup
bukti untuk menunjukkan bahwa 𝛽3 ≠ 0.

e. Penghitungan koefisien determinasi dan koefisien korelasi parsial

Koefisien determinasi parsial: Koefisien korelasi parsial:


𝑆𝑆𝑅(𝑋1 |𝑋2 , 𝑋3 ) = 𝑆𝑆𝐸(𝑋2 , 𝑋3 ) 2
𝑟𝑦1,23 = √𝑟𝑦1,23 = √0,5009 = 0,71
− 𝑆𝑆𝐸(𝑋1 , 𝑋2 , 𝑋3 )
= 107,490 − 53,651 2
𝑟𝑦2,13 = √𝑟𝑦2,13 = √0,3682 = 0,61
= 53,839
𝑆𝑆𝑅(𝑋1 |𝑋2 , 𝑋3 ) 53,839 2
2
𝑟𝑦1,23 = = 𝑟𝑦3,12 = √𝑟𝑦3,12 = √0,0,240 = 0,15
𝑆𝑆𝐸(𝑋2 , 𝑋3 ) 107,490
= 0,5009

2
𝑆𝑆𝑅(𝑋3 |𝑋1 , 𝑋2 ) 1,321
𝑟𝑦3,12 = = = 0,0240
𝑆𝑆𝐸(𝑋1 , 𝑋2 ) 54,972

Interpretasi:
➢ Keragaman gaji seseorang data scientist yang dapat dijelaskan oleh pengalaman kerja tetapi
tidak dapat dijelaskan oleh skor kemampuan bidang statistika dan skor kemampuan bidang
komputasi sebesar 50,09%.
➢ Keragaman gaji seseorang data scientist yang dapat dijelaskan oleh skor kemampuan bidang
statistika tetapi tidak dapat dijelaskan oleh pengalaman kerja dan skor kemampuan bidang
komputasi sebesar 36,82%.
➢ Keragaman gaji seseorang data scientist yang dapat dijelaskan oleh skor kemampuan bidang
komputasi tetapi tidak dapat dijelaskan oleh pengalaman kerja dan skor kemampuan bidang
statistika sebesar 2,40%.
➢ Hubungan antara gaji seseorang data scientist dan pengalaman kerja kuat (0,71) dan
berbanding lurus.
➢ Hubungan antara gaji seseorang data scientist dan skor kemampuan bidang statistika cukup
kuat (0,61) dan berbanding lurus.
➢ Hubungan antara gaji seseorang data scientist dan skor kemampuan bidang komputasi lemah
(0,15) dan berbanding lurus.

37
3. Kita ubah nilai 𝑋𝑖 menjadi 𝑥𝑖 dimana 𝑥𝑖 = 𝑋𝑖 − 𝑋̅ = 𝑋𝑖 − 48,9 dan diperoleh tabel baru sebagai
berikut:

𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖
-43,9 3 -3,9 14
-43,9 7 1,1 12
-43.9 6 -3,9 14
-39,9 8 6,1 20
-34,9 10 26,1 22
-30,9 9 22,2 14
-31,9 10 42,1 20
-30,9 11 88,1 15
-17,9 16 154,1 24
-8,9 9
-4,9 13

Selanjutnya kita lakukan perhitungan:


−1
𝑛 ∑𝑥 ∑ 𝑥2 ∑𝑦
𝑏0
𝑏 = [ 𝑏1 ] = (𝑋 𝑇 𝑋)−1 (𝑋 𝑇 𝑌) = ∑ 𝑥 ∑ 𝑥 2 ∑ 𝑥 3 ∑ 𝑥𝑦
𝑏11
2
[∑ 𝑥 ∑ 𝑥 3 ∑ 𝑥 4 ] [∑ 𝑥 2 𝑦]
−1
20 0 46461,8 258 14,218
=[ 0 46461,8 3988612,56 ] [ 4055.8 ] = [ 0,136 ]
46461,8 3988612,56 646128279,3 836468,58 −0,001

∑𝑦

𝑆𝑆𝐸 = 𝑌 𝑇 𝑌 − 𝑏 𝑇 𝑋 𝑇 𝑌 = [∑ 𝑦 2 ] − [𝑏0 𝑏1 𝑏11 ] ∑ 𝑥𝑦


2
[∑ 𝑥 𝑦]
= 3912 − (14,218 × 258) − (0,136 × 4055,8) + (0,001 × 836468,58) = 528,636

𝑆𝑆𝐸 528,636
𝑀𝑆𝐸 = = = 31,096
𝑛−3 17

𝑠 2 (𝑏0 ) 𝑠(𝑏0 , 𝑏1 ) 𝑠(𝑏0 , 𝑏11 )


2 (𝑏)
𝑠 = [ 𝑠(𝑏0 , 𝑏1 ) 𝑠 2 (𝑏1 ) 𝑠(𝑏1 , 𝑏11 )] = 𝑀𝑆𝐸 × (𝑋 𝑇 𝑋)−1
𝑠(𝑏0 , 𝑏11 ) 𝑠(𝑏1 , 𝑏11 ) 𝑠 2 (𝑏11 )
−1
20 0 46461,8
= 31,096 × [ 0 46461,8 3988612,56 ]
46461,8 3988612,56 646128279,3
2,4119 0,0316 −0,0004
= [ 0,0316 46461,8 −0,00001 ]
−0,0004 −0,00001 0,000000159

38
a. Uji Simultan
Dari persamaan regresi 𝑌̂𝑖 = 14,218 + 0,136𝑥𝑖 − 0,001𝑥𝑖2 kita dapatkan nilai dugaan dan kuadrat
residual sebagai berikut.

𝒙𝒊 𝒚𝒊 𝒚̂𝒊 (𝒚𝒊 − 𝒚̂𝒊 )𝟐


-43,9 3 6,32 11,025
-43,9 7 6,32 0,462
-43,9 6 6,32 0,103
-39,9 8 7,20 0,641
-34,9 10 8,25 3,050
-30,9 9 9,06 0,004
-31,9 10 8,86 1,295
-30,9 11 9,06 3,761
-17,9 16 11,46 20,583
-8,9 9 12,93 15,432
-4,9 13 13,53 0,278
-3,9 14 13,67 0,107
1,1 12 14,37 5,600
-3,9 14 13,67 0,107
6,1 20 15,01 24,896
26,1 22 17,09 24,144
22,1 15 16,74 3,011
42,1 20 18,17 3,345
88,1 15 18,44 11,820
154,1 24 11,43 158,035

➢ Hipotesis
𝐻0 : 𝐸(𝑌) = 𝛽0 + 𝛽1 𝑋𝑖 + 𝛽11 𝑋𝑖2
𝐻1 : 𝐸(𝑌) ≠ 𝛽0 + 𝛽1 𝑋𝑖 + 𝛽11 𝑋𝑖2
➢ 𝐶𝑅: 𝐹 ∗ ≥ 𝐹0,05;4;13 𝑎𝑡𝑎𝑢 𝐹 ∗ ≥ 3,179

➢ Statistik Uji
𝑆𝑆𝑃𝐸 = ∑(𝑦𝑖 − 𝑦̂𝑖 )2 = 287,697
𝑆𝑆𝑃𝐸 287,697
𝑀𝑆𝑃𝐸 = = = 71,924
20 − 16 4
𝑆𝑆𝐿𝐹 = 𝑆𝑆𝐸 − 𝑆𝑆𝑃𝐸 = 528,636 − 287,697 = 240,939
𝑆𝑆𝐿𝐹 240,939
𝑀𝑆𝐿𝐹 = = = 18,534
16 − 3 13
𝑀𝑆𝐿𝐹 18,534
𝐹∗ = = = 0,258
𝑀𝑆𝑃𝐸 71,924

➢ Keputusan
Karena 𝐹 ∗ < 𝐹0,05;4;13 maka gagal tolak 𝐻0

39
➢ Kesimpulan
Dengan tingkat signifikansi 5%, terdapat cukup bukti untuk menyatakan bahwa terdapat
hubungan regresi antara area sebaran kerang dan jumlah spesies.

b. Uji 𝛽11
➢ Hipotesis
𝐻0 : 𝛽11 = 0 (𝑡𝑖𝑑𝑎𝑘 𝑡𝑒𝑟𝑑𝑎𝑝𝑎𝑡 𝑒𝑓𝑒𝑘 𝑘𝑢𝑎𝑑𝑟𝑎𝑡𝑖𝑘)
𝐻1 : 𝛽11 ≠ 0 (𝑡𝑒𝑟𝑑𝑎𝑝𝑎𝑡 𝑒𝑓𝑒𝑘 𝑘𝑢𝑎𝑑𝑟𝑎𝑡𝑖𝑘)
➢ 𝐶𝑅: |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | ≥ 𝑡0,025;20−3 𝑎𝑡𝑎𝑢 |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | ≥ 2,110

➢ Statistik Uji
𝑏11 0,001
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = =− = −2,506
𝑠(𝑏11 ) 0,000399

➢ Keputusan
Karena |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | ≥ 2,110 maka Tolak 𝐻0

➢ Kesimpulan
Dengan tingkat signifikansi 5%, sudah cukup bukti untuk menyatakan bahwa terdapat efek
kuadratik dari hubungan antara area sebaran kerang dan jumlah spesies. Oleh karena itu,
sesuai memasukkan suku kuadratik ke dalam model

c. Koefisien Determinasi
2
𝑆𝑆𝑅(𝑋, 𝑋 2 ) 417,0525
𝑅 = = = 0,7144 = 71,44%
𝑆𝑆𝑇 583,8
Jadi, kontribusi suku kuadratik di dalam model sebesar 71,44%

40
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2019/2020
MATA KULIAH : ANALISIS REGRESI
TINGKAT : II(DUA)/D4 STATISTIKA
DOSEN : TIM
HARI/TANGGAL : SELASA/25 FEBRUARI 2020
WAKTU : 2 JAM
SIFAT UJIAN : TUTUP BUKU & RUMUS
BOLEH MENGGUNAKAN KALKULATOR
1. (NILAI 30). Data berikut memuat skor yang menunjukkan tingkat stress dan nilai ujian dari 9
mahasiwa. Semakin tinggi skor tingkat stres menunjukkan bahwa mahasiswa tersebut semakin
stres.

Tingkat Stres 23 14 14 0 17 20 20 15 21
Nilai Ujian 43 59 48 77 50 52 46 51 51

Jika model regresi linier sederhana 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 akan digunakan,


a. Buatlah persamaan regresi untuk menjelaskan hubungan antara tingkat stres (X) dengan nilai
ujiannya (Y). Interpretasikan hasilnya.
b. Uji signifikansi koefisien regresi. Gunakan 𝛼 = 5%.
c. Pada 𝛼 = 5%, apakah model linier cocok untuk menjelaskan hubungan antara tingkat stress
dengan nilai ujian pada data di atas? Jelaskan
Diketahui 𝑀𝑆𝐸(𝑠 2 ) = 19,2346

2. (NILAI). Suatu penelitian telah dilakukan untuk mengetahui hubungan antara tes kemampuan
bahasa (X) dan nilai karya ilmiah (Y) dari 10 siswa kelas I SMA. Diduga bahwa model regresi
polinomial kuadratik cocok digunakan.
Diketahui
0,1813176 −0,006212 −0,002259
(𝐗 ′ 𝐗)−𝟏 = [−0,006212 0,0032523 0,0001725 ]
−0,002259 0,0001725 0,0000627

∑ 𝑌𝑖 = 458 ∑ 𝑌𝑖2 = 21604 ∑ 𝑋𝑖 𝑌𝑖 = 304


∑ 𝑋𝑖2 𝑌𝑖 = 17252 2
∑ 𝑋𝑖 = 360 ∑ 𝑋𝑖4 = 31620
𝑆𝑢𝑚 𝑜𝑓 𝑆𝑞𝑢𝑎𝑟𝑒 𝐸𝑟𝑟𝑜𝑟 (𝑆𝑆𝐸) = 𝒀′ − 𝒃′𝑿′𝒀
Pertanyaan:
a. Tentukan penduga persamaan regresi polinomial kuadratik.
b. Tentukan koefisien determinasi ganda dan berikan maknanya.
c. Ujilah apakah suku linier dan suku kuadratik secara bersama-sama berpengaruh terhadap
variabel tak bebas. (Gunakan 𝛼 = 5%)
d. Apakah suku kuadratik bisa dihilangkan dari model? Jelaskan (Gunakan 𝛼 = 5%)

3. (NILAI 35). Diduga tiga buah variabel prediktor, yaitu X1 = PDRB Perkapita (juta rupiah), X2 =
upah minimum kabupaten/kota (ribuan rupiah), dan X3 = rata-rata lama sekolah (tahun)
berpengaruh terhadap persentase penduduk miskin (Y). Dari hasil pengolahan SPSS diperoleh
output sebagai berikut:

41
𝐀𝐍𝐎𝐕𝐀𝐚
Model Sum of Squares Df Mean Square F Sig.
Regression 4519,897 1 4519,897 21,537 , 000𝑏
1 Residual 3567,787 17 209,870
Total 8087,684 18
a. Dependent Variable: Y
b. Predictors: (Constant), X2

𝐀𝐍𝐎𝐕𝐀𝐚
Model Sum of Squares Df Mean Square F Sig.
Regression 3879,550 2 1939,775 7,375 , 005𝑏
1 Residual 4208,134 16 263,008
Total 8087,684 18
a. Dependent Variable: Y
b. Predictors: (Constant), X1,X3

𝐂𝐨𝐞𝐟𝐟𝐢𝐜𝐢𝐞𝐧𝐭𝐬 𝐚
Unstandarized Coefficients Standardized Coefficients
Model
B Std. Error Beta
(Constant) 87,188 21,552
X1 -,564 ,428 -,297
1
X2 -,513 ,224 -,567
X3 -,072 ,455 -,030

𝐀𝐍𝐎𝐕𝐀𝐚
Model Sum of Squares Df Mean Square
Regression … … …
X1,X3 … … …
1 X2|X1,X3 … … …
Residual 3121,006 … …
Total … …

a. Buatlah persamaan regresi serta interpretasikan nilai koefisien regresinya!


b. Lengkapilah tabel ANOVA di atas!
c. Uji apakah ada hubungan regresi antara variabel respon dan variabel prediktor baik secara
simultan maupun parsial. (Gunakan 𝛼 = 0,05)
d. Hitunglah masing-masing koefisien determinasi yang disesuaikan (adjusted 𝑅 2), koefisien
2
determinasi parsial (𝑟𝑌2.13 ) dan koefisien korelasi parsial (𝑟𝑌2.13)! Interpretasikan hasilnya!

42
PEMBAHASAN UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK
2019/2020

1. Regresi Linier Sederhana


Model yang diajukan : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖
Variabel :
• X : tingkat stres
• Y : nilai ujian
Observasi: Mahasiswa (n = 9)
a. Estimasi koefisien persamaan regresi
i 𝑋𝑖 𝑌𝑖 𝑋𝑖 𝑌𝑖 𝑋𝑖2 𝑌𝑖2 (𝑋𝑖 − 𝑌𝑖 )2
1 23 43 989 529 1849 49
2 14 59 826 196 3481 4
3 14 48 672 196 2304 4
4 0 77 0 0 5929 256
5 17 50 850 289 2500 1
6 20 52 1040 400 2704 16
7 20 46 920 400 2116 16
8 15 51 765 225 2601 1
9 21 51 1071 441 2601 25
Jumlah 144 477 7133 2676 26085 372

∑ 𝑋𝑖 = 144 ∑ 𝑌𝑖 = 477 ∑ 𝑋𝑖 𝑌𝑖 = 7133


∑ 𝑋𝑖2 = 2676 (∑ 𝑋𝑖 )2 = 20.736
𝑋̅ = 16 𝑌̅ = 53 𝑛=9

Estimasi 𝛽1 :
𝑛 ∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖
𝛽̂1 = 2 2
𝑛 ∑ 𝑋𝑖 −(∑ 𝑋𝑖 )
9(7133)−(144)(477)
= 9(2676)−20.736
−4491
= 3348
= −1,3414

Estimasi 𝛽0 :
𝛽̂0 = 𝑌̅ − 𝛽1 𝑋̅
= 53 − (−1,3414)(16)
= 76,4624
Diperoleh persamaan regresi linear sederhana: 𝑌̂ = 76,4624 − 1,3414 𝑋𝑖

Interpretasi :
Koefisien variabel 𝑋𝑖 bertanda negatif. Artinya, setiap kenaikan tingkat stress mahasiswa sebesar 1
satuan, nilai ujian mahasiswa akan turun sebesar 1,3414 poin.

b. Uji signifikansi koefisien regresi (𝛼 = 5%)


Inferensia 𝛽0 (jarang dilakukan):

43
Bentuk confidence interval: 𝛽̂0 ± 𝑡(1−𝛼;𝑛−2) . 𝑠(𝛽̂0 )
2

𝛽̂0 = 76,4624

Mencari nilai 𝑠(𝛽̂0 ):


∑(𝑌𝑖 −𝑌̂)2 ∑ 𝑌𝑖2 −𝛽
̂0 ∑ 𝑌𝑖 −𝛽
̂1 ∑ 𝑋𝑖 𝑌𝑖
𝑀𝑆𝐸 = = = 19,2346 (diketahui dari soal)
𝑑𝑓 𝑛−2
1 𝑋̅
𝑠 2 (𝛽̂0 ) = 𝑀𝑆𝐸. [𝑛 + ∑(𝑋 −𝑋̅)2 ]
𝑖

1 16
𝑠(𝛽̂0 ) = √(19,2346). (9 + 372) = 3,9210

Mencari nilai 𝑡(1−𝛼;𝑛−2):


2
𝑡(0,9725;7) = 2,3646

Confidence Interval:
𝛽̂0 ± 𝑡(1−𝛼;𝑛−2) . 𝑠(𝛽̂0 )
2
76,4624 ± 2,3646 (3,9210)
65,19 < 𝛽̂0 < 83,73

Interpretasi:
Dengan tingkat kepercayaan 95%, kita memercayai bahwa nilai 𝛽̂0 yang sebenarnya berada pada
interval 65,19 sampai 83,73.

Inferensia 𝛽1 :
Hipotesis:
𝐻0 ∶ 𝛽1 = 0
𝐻1 ∶ 𝛽1 ≠ 0
Taraf signifikansi: 𝛼 = 5%

𝑏
Statistik uji: 𝑡𝑜𝑏𝑠 = 𝑠(𝑏1 )
1
𝑏1 = −1,3414
𝑀𝑆𝐸 19,2346
𝑠(𝑏1 ) = √∑(𝑋 −𝑋̅)2 = √ 372
= 0,2274
𝑖
1,3414
𝑡𝑜𝑏𝑠 = − 0,2274 = −5,8989

Wilayah kritis:
Tolak H0 jika |𝑡𝑜𝑏𝑠 | > |𝑡(1−𝛼;𝑛−2) | = |𝑡(0,975;7) | = 2,3646
2

Keputusan: Tolak H0

Kesimpulan:
Dengan taraf signifikansi 5%, data menunjukkan cukup bukti bahwa 𝛽1 signifikan terhadap model
(𝛽1 ≠ 0). Artinya, terdapat pengaruh yang signifikan dari variabel tingkat stres terhadap nilai ujian
mahasiswa.

44
Confidence Interval 𝛽1 :
𝛽̂1 ± 𝑡(1−𝛼;𝑛−2) . 𝑠(𝛽̂1 )
2
−1,3414 ± 2,3646 (0,2274)
−1,88 < 𝛽1 < −0,80

Interpretasi:
Dengan tingkat kepercayaan 95%, kita memercayai bahwa nilai 𝛽1 yang sebenarnya berada pada
interval -1,88 sampai -0,88. Artinya, setiap peningkatan tingkat stress sebesar 1 unit akan
menurunkan nilai ujian mahasiswa antara 0,80 sampai 1,88.

c. Lack of Fit Test


Hipotesis:
𝐻0 : Model linier cocok untuk menjelaskan hubungan antara X dan Y
𝐸(𝑌𝑖 ) = 𝛽0 + 𝛽1 𝑋𝑖
𝐻1 : Model linier tcocok untuk menjelaskan hubungan antara X dan Y
𝐸(𝑌𝑖 ) ≠ 𝛽0 + 𝛽1 𝑋𝑖
Taraf signifikansi: 𝛼 = 5%
Perhitungan:
(∑ 𝑌𝑖 )2 (477)2
𝑆𝑆𝑇 = ∑(𝑌𝑖 − 𝑌̅)2 = ∑ 𝑌𝑖2 − 𝑛
= 26085 − 9
= 804
𝑆𝑆𝑅 = ∑(𝑌̂𝑖 − 𝑌̅)2 = 𝑏12 ∑(𝑋𝑖 − 𝑋̅)2 = (−1,3414)2 (372)2 = 669,3597
𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝑅 = 134,6403

𝑗
𝑋1 = 0 𝑋2 = 14 𝑋3 = 15 𝑋4 = 17 𝑋5 = 20 𝑋6 = 21 𝑋7 = 23
𝑖=1 77 48 51 50 46 51 43
𝑖=2 52
𝑌̅𝑗 77 53,5 51 50 49 51 43

𝑆𝑆𝑃𝐸 = ∑ ∑(𝑦𝑖𝑢 − 𝑦̅𝑖. )2 = (77 − 77)2 + (48 − 53,5)2 + ⋯ + (43 − 43)2 = 78,5
𝑆𝑆𝐿𝑂𝐹 = 𝑆𝑆𝐸 − 𝑆𝑆𝑃𝐸 = 134,6403 − 78,5 = 56,1403

ANOVA tabel:

Sumber Jumlah Kuadrat Derajat Rata-rata jumlah 𝐹ℎ𝑖𝑡𝑢𝑛𝑔


Keragaman bebas kuadrat
Regresi 669,3597 1 669,3597
Error 804 7 19,2343
0,2861
• Pure Error • 78,5 2 39,25
• Lack of Fit • 56,1403 5 11,2281
Total SST 8

Statistik uji:
𝑀𝑆𝐿𝑂𝐹
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑀𝑆𝑃𝐸
= 0,2861

45
Daerah kritis:
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹(1−𝛼;5;2) = 19,2964

Keputusan:
Gagal tolak H0

Kesimpulan:
Dengan tingkat signifikansi 5%, data belum menunjukkan cukup bukti bahwa tingkat stress
mahasiswa tidak berpengaruh signifikan terhadap nilai ujian mahasiswa. Artinya, model linier sudah
cocok untuk menjelaskan hubungan antara tingkat stress mahasiswa dengan nilai ujian mahasiswa.

2. Diketahui
0,1813176 −0,006212 −0,002259
(𝐗 ′ −𝟏
𝐗) = [−0,006212 0,0032523 0,0001725 ]
−0,002259 0,0001725 0,0000627
∑ 𝑌𝑖 = 458 ∑ 𝑌𝑖2 = 21604 ∑ 𝑋𝑖 𝑌𝑖 = 304
∑ 𝑋𝑖2 𝑌𝑖 = 17252 2
∑ 𝑋𝑖 = 360 ∑ 𝑋𝑖4 = 31620

a. Estimasi koefisien persamaan regresi


∑ 𝑦𝑖 458

𝐗 𝐘 = [ ∑ 𝑥𝑖 𝑦𝑖 ] = [ 304 ]
∑ 𝑥𝑖2 𝑦𝑖 17252
0,1813176 −0,006212 −0,002259 458 42,1827
𝐓 −𝟏 𝐓
𝐛 = (𝐗 𝑿) 𝐗 𝐘 = [−0,006212 0,0032523 0,0001725 ] [ 304 ] = [ 1,1196 ]
−0,002259 0,0001725 0,0000627 17252 0,0995
2
Model yang diajukan : 𝑌 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽11 𝑋𝑖1
2
Persamaan regresi : 𝑌̂ = 42,1827 + 1,1196𝑋𝑖1 + 0,0995𝑋𝑖1
Interpretasi:
Rata-rata nilai karya ilmiah kelas 1 SMA akan bernilai 42,1827 ketika nilai tes kemampuan bahasa
bernilai 0. Ketika nilai tek kemampuan bahasa kelas 1 SMA meningkat, nilai karya ilmiah akan
meningkat sebesar 1,1196 sebagai efek linear dan 0,0995 sebagai efek kuadratik.

b. Koefisien determinasi berganda


𝑆𝑆𝑅 𝑆𝑆𝐸
𝑅 2 = 𝑆𝑆𝑇 = 1 − 𝑆𝑆𝑇
SSE = 𝐘 𝐓 𝒀 − 𝜷𝑻 𝑿𝑻 𝒀 = ∑ 𝑌 2 − 𝜷𝑻 𝑿𝑻 𝒀
458
= 21604 − [42,1827 1,1196 0,0995] [ 304 ]
17252
= 21604 − 21376,6090 = 227,391
𝟏 1 1
SST = 𝐘 𝐓 𝒀 − 𝒏 𝒀𝑻 𝑱𝒀 = ∑ 𝑌 2 − 𝑛 (∑ 𝑌)2 = 21604 − 10 4582 = 627,6
𝑆𝑆𝑅 𝑆𝑆𝐸 227,391
𝑅 2 = 𝑆𝑆𝑇 = 1 − 𝑆𝑆𝑇 = 1 − 627,6
= 0,6377

46
Interpretasi:
Kontribusi variabel nilai tes kemampuan bahasa dalam menjelaskan keragaman nilai karya ilmiah
kelas I SMA adalah sebesar 63,77 persen. Artinya, 36,23 persen keragaman nilai karya ilmiah kelas
I SMA dijelaskan oleh faktor lain yang tidak tercakup dalam model.

𝑆𝑆𝐸 227,391
2 𝑛−𝑝 10−3
𝑅𝑎𝑑𝑗 =1− 𝑆𝑆𝑇 =1− 627,6 = 0,5342
𝑛−1 10−1

Interpretasi:
Kontribusi variabel nilai tes kemampuan bahasa dalam menjelaskan keragaman nilai karya ilmiah
kelas I SMA yang sudah ditimbang derajat bebasnya adalah sebesar 53,42 persen. Artinya, 46,58
persen keragaman nilai karya ilmiah kelas I SMA dijelaskan oleh faktor lain yang tidak tercakup
2
dalam model. 𝑅𝑎𝑑𝑗 biasa digunakan dalam regresi linier berganda. Sebasb ketika suatu model
memiliki variabel independen yang banyak, 𝑅 2 akan cenderung meningkat yang dapat
2
menimbulkan bias. Sehingga, 𝑅𝑎𝑑𝑗 digunakan dalam model.

c. Uji F simultan
• Hipotesis:
𝐻0 : 𝛽1 = 𝛽11 = 0
𝐻1 : 𝑚𝑖𝑛𝑖𝑚𝑎𝑙 𝑎𝑑𝑎 𝑠𝑎𝑡𝑢 𝛽𝑖 ≠ 0 ; 𝑖 = 1,11

• Taraf signifikansi:
𝛼 = 0,05

• Tabel ANOVA:

Sumber
SS Df MS 𝐹ℎ𝑖𝑡𝑢𝑛𝑔
Keragaman
Regresi 400,2090 2 200,1045
6,1600
Error 227,3910 7 21,4844
Total 627,6 9

• Statistik uji:
𝑀𝑆𝑅
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑀𝑆𝐸 = 6,1600

• Daerah kritis:
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹(1−𝛼;𝑘,𝑛−𝑘−1) = 𝐹(.95;2;7) = 4,7374

• Keputusan:
Tolak 𝐻0

• Kesimpulan:
Dengan tingkat signifikansi 5%, data menunjukkan cukup bukti bahwa paling tidak terdapat
satu 𝛽𝑖 yang signifikan terhadap variabel dependen.

47
d. Uji t parsial (efek kuadratik)
• Hipotesis:
𝐻0 : 𝛽11 = 0
𝐻1 : 𝛽11 ≠ 0
• Taraf signifikansi:
𝛼 = 0,05

• Statistik uji:
𝑏
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑠(𝑏11 )
11
𝑏11 = 0,0995
Matriks varians-covarians
−𝟏
𝜎 2 (𝑏) = 𝜎 2 (𝑿𝑻 𝑿)
Unbiased estimator untuk 𝜎 2 adalah 𝑠 2 , yaitu adalah 𝑀𝑆𝐸
0,1813176 −0,006212 −0,002259
2 (𝑏) 𝐓 −𝟏
𝑠 = 𝑀𝑆𝐸(𝐗 𝑿) = 𝟑𝟐, 𝟒𝟖𝟒𝟒 [−0,006212 0,0032523 0,0001725 ]
−0,002259 0,0001725 0,0000627
5,8900 −0,2018 −0,0734
= [−0,2018 0,1056 0,0056 ]
−0,0734 0,0056 0,0020

s2 (b11 ) = 0,0020 s(b11 ) = 0,0447


b11 0,0995
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = = = 2,2260
𝑠(b11 ) 0,0447

• Daerah kritis:
Tolak 𝐻0 jika |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | > |𝑡(1−𝛼;𝑛−𝑘−1) | = 𝑡(.975;10−3) = 2,3646
2

• Keputusan:
Gagal tolak 𝐻0

• Kesimpulan:
Dengan tingkat signifikansi 5%, data belum menunjukkan cukup bukti bahwa suku kuadratik
memiliki pengaruh signifikan terhadap model. Artinya, suku kuadratik dapat dihilangkan dari
model sehingga dapat dibentuk model baru hanya dengan suku efek linier. Namun, bisa juga
suku kuadratik tetap dipertahankan dalam model tetapi tidak diinterpretasikan besar
pengaruhnya pada variabel dependen karena tidak signifikan.

3. X1 = PDRB Perkapita (juta rupiah)


X2 = upah minimum kabupaten/kota (ribuan rupiah)
X3 = rata-rata lama sekolah (tahun)
Y = persentase penduduk miskin

a) Model regresi: Y = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝜀
Persamaan regresi: 𝑌̂ = 87,188 − 0,564𝑋1 − 0,513𝑋2 − 0,072𝑋3

48
Interpretasi:
• Persentase penduduk miskin adalah sebesar 87,188 persen ketika tidak ada pengaruh dari
variabel PDRB perkapita (X1=0), variabel upah minimumkabupaten/kota (X2 = 0), dan
variabel rata-rata lama sekolah (X3 = 0).
• Jika PDRB Perkapita (X1) mengalami kenaikan sebesar satu satuan, akan membuat
persentase penduduk miskin menurun sebesar 0,564 persen dengan asumsi bahwa variabel
upah minimum kabupaten/kota (X2) dan variabel rata-rata lama sekolah (X3) dianggap
konstan (X2, X3 = 0).
• Jika upah minimum kabupaten/kota (X1) mengalami kenaikan sebesar satu satuan, akan
membuat persentase penduduk miskin menurun sebesar 0,513 persen dengan asumsi bahwa
variabel PDRB Perkapita (X1) dan variabel rata-rata lama sekolah (X3) dianggap konstan (X1,
X3 = 0).
• Jika rata-rata lama sekolah (X3) mengalami kenaikan sebesar satu satuan, akan membuat
persentase penduduk miskin menurun sebesar 0,072 persen dengan asumsi bahwa variabel
PDRB Perkapita (X1) dan variabel upah minimum kabupaten/kota (X2) dianggap konstan
(X1, X2 = 0).

b) Melengkapi tabel anova


𝑆𝑆𝑅(𝑋1, 𝑋3) = 3879,550 *) SS regresi dari tabel anova kedua
𝑆𝑆𝑅(𝑋2|𝑋1, 𝑋3) = 𝑆𝑆𝐸(𝑋1, 𝑋3) − 𝑆𝑆𝐸(𝑋1, 𝑋2, 𝑋3)
𝑆𝑆𝑅(𝑋2|𝑋1, 𝑋3) = 4208,134 − 3121,006 = 1087,128
Model Sum of Squares Df Mean Square
Regression 4966,678 3 1655,559
X1,X3 3879,550 2 1939,775
1 X2|X1,X3 1087,128 1 1087,128
Residual 3121,006 15 208,0671
Total 8087,684 18

c) Uji hubungan regresi:


# Uji F simultan
• Hipotesis
𝐻0 : 𝛽0 = 𝛽1 = ⋯ = 𝛽𝑘 = 0
(model yang diajukan tidak dapat menjelaskan hubungan antar variabel)
𝐻1 : 𝑚𝑖𝑛𝑖𝑚𝑎𝑙 𝑎𝑑𝑎 𝑠𝑎𝑡𝑢 𝛽𝑗 ≠ 0 ; 𝑗 = 1, … , 𝑘
(minimal ada satu variabel bebas yang signifikan)

• Taraf signifikansi
𝛼 = 5%

• Statistik uji
𝑀𝑆𝑅 1655,559
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = = = 7,9569
𝑀𝑆𝐸 208,0671

• Daerah kritis:
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹(1−𝛼;𝑘,𝑛−𝑘−1) = 𝐹(.95;3,15) = 3,2874

49
• Keputusan:
Tolak H0

• Kesimpulan:
Dengan taraf signifikansi 5%, data menunjukkan cukup bukti bahwa paling tidak terdapat
satu variabel prediktor yang signifikan terhadap variabel respon.

# Uji T parsial
• Hipotesis
• 𝐻0 : 𝛽𝑗 = 0
(variabel bebas ke-j tidak signifikan mempengaruhi variabel tak bebas)
𝐻1 : 𝛽𝑗 ≠ 0
(variabel bebas ke-j signifikan mempengaruhi variabel tak bebas)

• Taraf signifikansi
𝛼 = 5%

• Statistik uji
𝑏
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑠(𝑏𝑗
𝑗)

Prediktor 𝑏𝑗 𝑠(𝑏𝑗 ) 𝑡ℎ𝑖𝑡𝑢𝑛𝑔


X1 -,564 ,428 -1,3178
X2 -,513 ,224 -2,2902
X3 -,072 ,455 -0,1582

• Daerah kritis
Tolak 𝐻0 jika |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | > 𝑡(1−𝛼;𝑛−𝑘−1) = 𝑡(0,975;15) = 2,13145
2
• Keputusan
Prediktor 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | Keputusan
X1 -1,3178 1,3178 Gagal tolak H0
X2 -2,2902 2,2902 Tolak H0
X3 -0,1582 0,1582 Gagal tolak H0

• Kesimpulan:
• X1
Dengan taraf signifikansi 5%, dengan data yang ada belum cukup bukti bahwa variabel
prediktor X1 signifikan terhadap variabel respon Y. Artinya, belum cukup bukti untuk
menyatakan bahwa PDRB Perkapita signifikan terhadap persentase penduduk miskin.
• X2
Dengan taraf signifikansi 5%, dengan data yang ada cukup bukti bahwa variabel
prediktor X2 signifikan terhadap variabel respon Y. Artinya, cukup bukti untuk
menyatakan bahwa upah minimum kabupaten/kota signifikan terhadap persentase
penduduk miskin.

50
• X3
Dengan taraf signifikansi 5%, dengan data yang ada belum cukup bukti bahwa variabel
prediktor X3 signifikan terhadap variabel respon Y. Artinya, belum cukup bukti untuk
menyatakan bahwa rata-rata lama sekolah signifikan terhadap persentase penduduk
miskin.

2
d) Mencari 𝑎𝑑𝑗𝑢𝑠𝑡𝑒𝑑 𝑅 2 , 𝑟𝑌2.13 , 𝑟𝑌2,13
• 𝑎𝑑𝑗𝑢𝑠𝑡𝑒𝑑 𝑅 2

𝑆𝑆𝐸 208,0671
2
𝑅𝑎𝑑𝑗 =1− 𝑛 − 𝑘 − 1 =1− 15 = 0,5369
𝑆𝑆𝑇 8087,684
𝑛−1 18
Interpretasi:
Kontribusi variabel PDRB Perkapita, variabel upah minimum kabupaten/kota, dan variabel
rata-rata lama sekolah dalam menjelaskan keragaman persentase penduduk miskin yang
sudah ditimbang derajat bebasnya adalah sebesar 53,69 persen. Artinya, 46,31 persen
keragaman persentase penduduk miskin dijelaskan oleh faktor lain yang tidak tercakup
dalam model.

• 2
𝑟𝑌2.13
2 𝑆𝑆𝐸(𝑋1,𝑋3)−𝑆𝑆𝐸(𝑋1,𝑋2,𝑋3) 4208,134−3121,006
𝑟𝑌2.13 = 𝑆𝑆𝐸(𝑋1,𝑋3)
= 4208,134
= 0,25834
Interpretasi:
Keragaman persentase penduduk miskin dapat dijelaskan oleh variabel upah minimum
kabupaten/kota tetapi tidak dapat dijelaskan oleh variabel PDRB Perkapita dan variabel rata-
rata lamanya sekolah adalah sebesar 25,834 persen.

• 𝑟𝑌2,13
2
𝑟𝑌2,13 = −√𝑟𝑌2,13 = −0,50827
Interpretasi:
Hubungan antara persentase penduduk miskin dengan upah minimum kabupaten/kota
sedang (0,50827) dan berbanding terbalik. Artinya, kenaikan upah minimum
kabupaten/kota menyebabkan penurunan persentase penduduk miskin dan sebaliknya
apabila PDRB Perkapita dan rata-rata lama sekolah tetap.

51
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2020/2021
MATA KULIAH : ANALISIS REGRESI
TINGKAT : II (DUA)/D-IV STATISTIKA/KS
DOSEN : TIM
HARI/TANGGAL : JUM’AT/26 MARET 2021
WAKTU : 2 JAM
SIFAT UJIAN : BOLEH MEMBUKA BUKU/REFERENSI

BERDO’ALAH SEBELUM BEKERJA

Kerjakan semua soal berikut


Diperkenankan menggunakan Komputer/Laptop/Kalkulator untuk melakukan
penghitungan/pengolahan data
1. (NILAI 20). Untuk varietas tanaman tertentu, peneliti ingin mengembangkan rumus untuk
memprediksi jumlah biji (dalam gram) sebagai fungsi dari kepadatan tanaman. Mereka melakukan
studi dengan empat level faktor X, yaitu jumlah tanaman per plot. Empat repetisi digunakan untuk
setiap tingkat X. Data ditampilkan sebagai berikut:

Jumlah tanaman per


Kuantitas biji (dalam gram)
plot
10 12,6 11,0 12,1 10,9
20 15,3 16,1 14,9 15,6
30 17,9 18,3 18,6 17,8
40 19,2 19,6 18,9 20,0

Apakah model regresi linier sederhana cocok untuk menganalisis data di atas? Gunakan tingkat
signifikasi 5%.

2. (NILAI 30). Sebuah penelitian dilakukan untuk mengetahui hubungan antara panjang ikan (Y) (dalam
mm) dengan umur ikan (X) (dalam tahun). Bentuk hubungan antara kedua variabel tersebut diduga
berbentuk polinomial kuadratik dengan model regresi:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝛽11 𝑋𝑖2 + 𝜀𝑖
Dari sampel sebanyak 25 ekor ikan, diperoleh hasil pengolahan sebagai berikut:
Model Sum of Squares df Mean Square
Regression ... ... ...
𝑋 ... ... ...
2 ... ... ...
𝑋 |𝑋
Error 2.181,227 ... ...
Total ... ...

Diketahui:
𝑆𝑆𝐸(𝑋) = 2.816,977 𝑆𝑆𝐸(𝑋2) = 4.176,277 𝑆𝑆𝑅(𝑋2) = 10.991,723

Pertanyaan:
a. Lengkapilah tabel ANOVA di atas!

52
b. Ujilah apakah suku linier dan suku kuadratik secara bersama-sama berpengaruh terhadap
variabel tak bebas? (Gunakan alpha 5%).
2
c. Hitunglah 𝑟𝑌𝑋 2 |𝑋 dan jelaskan maknanya.

3. (NILAI 50). Sebuah penelitian menunjukkan tinggi badan seseorang dipengaruhi oleh panjang badan
saat lahir dan tinggi badan orang tua. Data berikut menyajikan tinggi badan 20 orang remaja laki-laki
umur 18 tahun beserta data panjang badannya saat lahir dan tinggi badan ibu dan ayahnya saat
berumur 18 tahun. Semua data dalam satuan cm.

Tinggi badan Panjang Tinggi ibu Tinggi ayah


lahir
170 50 153 178
175 49 164 178
170 49 166 167
183 49 161 182
161 50 165 165
184 49 165 180
173 50 163 172
177 50 165 174
173 50 163 172
178 50 161 178
171 48 160 178
186 52 168 178
177 51 164 174
177 50 161 178
161 50 157 166
163 49 161 165
173 54 167 166
179 51 164 174
172 51 159 174
167 48 157 170

Berdasarkan data tersebut,


a. Bangun model yang dapat menjelaskan pengaruh panjang badan saat lahir, tinggi ibu, dan tinggi
ayah terhadap tinggi badan remaja laki-laki. Tuliskan persamaan yang diperoleh dan
interpretasikan persamaan tersebut.
b. Periksa variabel apa saja yang signifikan memengaruhi tinggi badan remaja laki-laki.
c. Dapatkan perkiraan interval 95% untuk tinggi seorang remaja laki-laki yang memiliki panjang
badan saat lahir 50 cm, tinggi ibu dan ayah masing-masing 152 cm dan 182 cm. Interpretasikan
hasilnya.
d. Berapa variasi tinggi badan remaja laki-laki yang dapat dijelaskan oleh model pada soal a?
e. Berapa variasi tinggi badan remaja laki-laki yang dapat dijelaskan oleh tinggi badan kedua orang
tuanya, tetapi tidak dapat dijelaskan oleh panjang badannya saat lahir? Gunakan tingkat
signifikansi 5%.

53
PEMBAHASAN UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK
2020/2021

1. Uji Kecocokan model linear


Data dapat ditulis ulang menjadi
X 10 10 10 10 20 20 20 20 30 30 30 30 40 40 40 40

Y 4,6 11 12,1 10,9 15,3 16,1 14,9 15,6 17,9 18,3 18,6 17,8 19,2 19,6 18,9 20,0

Pengolahan menggunakan Ms. Excel menghasilkan tabel ANOVA sebagai berikut :


Source df SS MS
Regression 1 135,2 135,2
Residual 14 10,47 0,747
Total 15 145,67

• Lack of Fit
𝒙 10 20 30 40
𝒚̅𝒊 11,65 15,475 18,15 19,425
𝒏𝒌 4 4 4 4
𝒏𝒆 3 3 3 3 ∑𝑛𝑒 =12
2
∑(𝒚𝒊𝒖 − 𝒚̅𝒊 )𝟐 2,09 0,7675 0,41 0,6875 ∑∑(𝑦𝑖𝑢 − 𝑦̅)
𝑖
= 3,955

• Pengujian
𝐻0 : Model RLS cocok untuk menjelaskan hubungan X dan Y (𝐸(𝑦𝑖 ) = 𝛽0 + 𝛽1 𝑋𝑖 )
𝐻1 : Model RLS tidak cocok untuk menjelaskan hubungan X dan Y (𝐸(𝑦𝑖 ) ≠ 𝛽0 + 𝛽1 𝑋𝑖 )
𝛼: 5%

➢ Statistik Uji
ANOVA Lack of Fit
Source df SS MS
Regression 1 135,2 135,2
Residual 14 10,47 0,747
Lack of Fit 2 6,515 3,2575
Pure Error 12 3,955 0,3295
Total 15 145,67
𝑀𝑆𝐿𝐹 3,2575
𝐹∗ = = = 9,8861
𝑀𝑆𝑃𝐸 0,3295
𝐹(1−𝛼; 2, 12) = 3,8852
Akan tolak 𝐻0 jika 𝐹 ∗ > 𝐹𝑡𝑎𝑏𝑒𝑙

Keputusan :
Tolak 𝐻0 karena 𝐹 ∗ > 𝐹𝑡𝑎𝑏𝑒𝑙

Kesimpulan :
Dengan taraf uji 5% dan sampel uji yang tersedia, terdapat cukup bukti bahwa model RLS yang
diajukan tidak tepat/ tidak cocok untuk menjelaskan hubungan antara 𝑋 dan 𝑌.

54
2. Model : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝛽11 𝑋𝑖2 + 𝜀𝑖
Diketahui:
𝑆𝑆𝐸(𝑋1 𝑋 2 ) = 2181,227 𝑆𝑆𝑅(𝑋 2 ) = 10991,723
𝑆𝑆𝐸(𝑋) = 2816,977 𝑛 = 25
𝑆𝑆𝐸(𝑋 2 ) = 4176,277

a) Melengkapi tabel Anova


Model Sum of Squares df Mean Square
Regression 12.986,733 2 6.493,3865
𝑋 12.351,023 1 12.351,023
2 635,75 1 635,75
𝑋 |𝑋
Error 2.181,227 22 99,1466
Total 24

𝑆𝑆𝑅(𝑋 2 |𝑋) = 𝑆𝑆𝐸(𝑋) − 𝑆𝑆𝐸(𝑋, 𝑋 2 )


= 2816,977 − 2181,227 = 635,75
𝑆𝑆𝑅(𝑋, 𝑋 = 𝑆𝑆𝑅(𝑋 2 ) + 𝑆𝑆𝑅(𝑋|𝑋 2 )
2)

= 𝑆𝑆𝑅(𝑋 2 ) + 𝑆𝑆𝐸(𝑋 2 ) − 𝑆𝑆𝐸(𝑋, 𝑋 2 )


= 10.991,723 + 4.176,277 − 2.181,227
= 12.986,773
𝑆𝑆𝑅 (𝑋) = 𝑆𝑆𝑅(𝑋, 𝑋 2 ) − 𝑆𝑆𝑅(𝑋 2 |𝑋)
= 12.986, 773 − 635,75
= 12.351,023

b) Uji Simultan
𝐻0 : 𝛽1 = 𝛽11 = 0
(X maupun 𝑋 2 tidak berpengaruh signifikan terhadap Y)
𝐻1 : 𝛽1 ≠ 0 𝑎𝑡𝑎𝑢 𝛽11 ≠ 0 𝑎𝑡𝑎𝑢 𝛽1 , 𝛽11 ≠ 0
(Setidaknya ada salah satu 𝛽𝑖 ≠ 0 atau signifikan berpengaruh terhadap Y)
𝛼: 5%

Statistik Uji :
Dengan menggunakan tabel ANOVA pada poin A
𝑀𝑆𝑅 6493,3865
𝐹∗ = = = 65,4927
𝑀𝑆𝐸 99,1466
Tolak 𝐻0 saat
𝐹 ∗ > 𝐹(1−𝛼;2,22) → 𝐹 ∗ > 3, 4435

Keputusan :
Tolak 𝐻0 karena 𝐹 ∗ > 𝐹𝑡𝑎𝑏𝑒𝑙

Kesimpulan :
Dengan taraf uji 5%, dapat dibuktikan bahwa terdapat setidaknya salah satu dari 𝛽1 dan 𝛽11 yang
tidak bernilai 0. Dengan kata lain, dapat dikatakan bahwa suku linear atau suku kuadratik akan
secara Bersama-sama memengaruhi nilai dari variabel tak bebas (𝑋, 𝑋 2 berpengaruh pada 𝑌).

55
c) Koefisien Determinasi Parsial
Dengan hasil pada ANOVA poin A
2 𝑆𝑆𝑅(𝑋 2 |𝑋) 635,75
𝑟𝑌𝑋 2 |𝑋 = = = 0,05147
𝑆𝑆𝑅(𝑋) 12351,023
Angka tersebut bermakna bahwa keragaman nilai Y di sekitar rataannya yang dapat dijelaskan
oleh suku 𝑋 2 , tetapi tidak dapat dijelaskan oleh suku linear (𝑋) adalah sebesar 0,05147 bagian
atau 5,147%.

3. Dari data yang tersaji


a. Bangun model regresi
Karena terdiri dari 3 variabel bebas, diajukan model regresi linear berganda.
𝑋1 =Panjang Lahir
𝑋2 =Tinggi Ibu
𝑋3 =Tinggi Ayah
𝑌=Tinggi badan
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + 𝛽3 𝑋𝑖3 + 𝜀𝑖
̂𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + 𝛽3 𝑋𝑖3
𝑌
Estimasi nilai 𝛽𝑖 dengan 𝑏𝑖 dapat dilakukan dengan matriks
−𝟏
𝒃 = (𝑿𝑻 𝑿) 𝑿𝑻 𝒀
Perhitungan dengan excel menghasilkan :
𝑏0 = −205, 369
𝑏1 = 1,0661
𝑏2 = 0,7995
𝑏3 = 1,12925
Maka,
̂𝑖 = −205,369 + 1,0661𝑋𝑖1 + 0,7995𝑋𝑖2 + 1,12929𝑋𝑖3
𝑌
Interpretasi:
𝑏0 : Tidak dapat diinterpretasikan karena nilai 𝑋1, 𝑋2, 𝑋3, 𝑌 tidak berarti/bermakna saat
bernilai 0 atau negative
𝑏1 : Besarnya pertambahan tinggi badan seseorang adalah sebesar 1,0661cm saat Panjang
lahirnya 1cm lebih Panjang dengan variabel lainnya bernilai konstan.
𝑏2 : Seseorang akan lebih tinggi 0,7995cm dari temannya jika ibunya lebih tinggi 1cm dari ibu
temannya dengan asumsi variabel lainnya dianggap sama.
𝑏3 : Seseorang dengan tinggi ayah 1cm lebih tinggi dari ayah lainnya, akan memiliki tinggi
badan 1,12929cm lebih tinggi ddari lainnya dengan asumsi pengaruh lainnya dianggap
konstan.

b. Uji parsial
𝐻0 : 𝛽1 = 0 (tidak signifikan memengaruhi)
𝐻1 : 𝛽1 ≠ 0 (signifikan memengaruhi)

𝐻0 : 𝛽2 = 0 (tidak signifikan memengaruhi)


𝐻1 : 𝛽2 ≠ 0 (signifikan memengaruhi)

𝐻0 : 𝛽3 = 0 (tidak signifikan memengaruhi)


𝐻1 : 𝛽3 ≠ 0 (signifikan memengaruhi)

56
𝛼: 5%
Statistik Uji :
𝛽𝑖
𝑡∗ = 𝑠 2 (𝑏) = 𝑀𝑆𝐸(𝑋 𝑇 𝑋)−1
𝑠(𝑏𝑖 )
𝟏𝟏𝟖𝟗, 𝟎𝟐 −6,4629 −2,871 −2,304
−6,462 𝟎, 𝟏𝟗𝟔𝟗 −0,028 0,0073
[ ]
−2,871 −0,028 𝟎, 𝟎𝟐𝟔𝟎 0,0043
−2,304 0,0073 0,00043 𝟎, 𝟎𝟏𝟎𝟕𝟖
𝑠 2 (𝑏1 ) = 0,1969 2 (𝑏 )
𝑠 2 = 0,0260 𝑠 3 (𝑏3 ) = 0,01078
𝑠(𝑏1 ) = 0,4437 𝑠(𝑏2 ) = 0,16148 𝑠(𝑏3 ) = 0,1038
𝑡 ∗ = 2,4024 𝑡 ∗ = 4,951 𝑡 ∗ = 10,878
Taraf uji tolak 𝐻0 saat :
|𝑡 ∗ | > 𝑡(1−𝛼;𝑛−4)
2
|𝑡 ∗ | > 2,4728
Keputusan :
𝑏1 gagal tolak 𝐻0
𝑏2 tolak 𝐻0
𝑏3 tolak 𝐻0
Kesimpulan :
Dengan taraf uji 5% dan dari sampel yang tersedia, dapat dibuktikan bahwa 𝑏2 dan 𝑏3
bernilai ≠ 0 atau 𝑋2 dan 𝑋3 signifikan memengaruhi, tetapi tidak dapat dibuktikan bahwa
𝛽1 ≠ 0 atau 𝑋1 tidak signifikan memengaruhi.

c. Perkiraan Interval
Untuk 𝑋1 = 50, 𝑋2 = 152, 𝑋3 = 182 amatan baru, adalah 𝑌̂ = 174, 999
CI : 𝑦̂
ℎ.𝑛𝑒𝑤 ± 𝑡(1−𝛼) 𝑠(𝑦ℎ.𝑛𝑒𝑤 )
2
𝑠 2 (𝑦ℎ.𝑛𝑒𝑤 ) = 𝑀𝑆𝐸 + 𝑠 2 (𝑦ℎ )
= 𝑀𝑆𝐸 + 𝑋ℎ′ 𝑠 2 (𝑏)𝑋ℎ
1
50
𝑋ℎ = [ ] 𝑋ℎ′ = [1 50 152 182]
152
182
𝑠 2 (𝑦ℎ ) = 3,71244
𝑠 2 (𝑦ℎ.𝑛𝑒𝑤 ) = 5,7524 + 3,7124 = 9,4648
𝑠(𝑦ℎ.𝑛𝑒𝑤 ) = 3,076
𝑡(1−𝛼;𝑛−4) = 2,4728 𝑀𝑎𝑟𝑔𝑖𝑛𝑂𝑓𝐸𝑟𝑟𝑜𝑟 = 7,6075
2
CI :
𝑃(174,999 − 7,6075 < 𝑌𝑖 < 174,999 + 7,6075) = 95%
𝑃(167,3915 < 𝑌𝑖 < 182,60) = 95%
Dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa tinggi anak dengan panjang lahir
50cm, tinggi ibu 152cm, tinggi ayah 182cm adalah antara 167,39 sampai 182,60cm.

2 𝑆𝑆𝐸 𝑛−1
d. 𝑅𝑎𝑑𝑗 = 1 − 𝑆𝑆𝑇 (𝑛−𝑘−1) = 0,884
Besar keragaman tinggi badan yang dapat dijelaskan oleh model adalah sebesar 88,4%, sedangkan
sisanya dijelaskan faktor lain yang tidak dimasukkan dalam model.

57
2 𝑆𝑆𝐸(𝑋1,𝑋2,𝑋3)
e. 𝑟𝑦𝑥 2 𝑥3 |𝑥1
=1− 𝑆𝑆𝐸(𝑋1 )
Didapatkan dari tabel ANOVA regresi bahwa
𝑆𝑆𝐸(𝑋1 , 𝑋2 , 𝑋3 ) = 92, 03981
𝑆𝑆𝐸(𝑋1 ) = 898, 3056
2 92,03981
𝑟𝑦𝑥 𝑥 |𝑥 = 1 − = 1 − 0,10245 = 0,8975
2 3 1 898,3056
Besar keragaman tinggi badan seseorang yang dapat dijelaskan oleh faktor tinggi badan ibu dan
ayahnya, tetapi tidak dapat dijelaskan oleh variabel panjang lahirnya adalah sebesar 89,75%.

HALO SEMUA! UNTUK PEMBAHASAN YANG DITAMPILKAN, DISARANKAN UNTUK TIDAK


DIJADIKAN PATOKAN KARENA PEMBAHASAN INI BELUM DIVALIDASI OLEH DOSEN YANG
MENGAJAR. MESKIPUN DEMIKIAN, SEMOGA SUDAH BISA MEMBANTU TEMAN-TEMAN
BELAJAR, YA. SUKSES SEMUANYA, SEMANGAT

58
PENGENALAN BASIS DATA

A. DEFINISI
▪ Basis Data atau Database adalah kumpulan dari data yang berhubungan.
▪ Database Management System (DBMS) adalah sebuah software yang mengatur dan
mengontrol akses ke database.
▪ Aplikasi Basis Data adalah program yang berinteraksi dengan basis data pada titik tertentu
dalam proses mengeksekusi.
Contoh:
o Membeli barang di supermarket
‣ Scan barcode → cari nama barang, harga, jumlah stok → Tampilkan di layar
o Saat kuliah
‣ Scan sidik jari → program aplikasi → Database siswa (Nama dan NIM)
▪ Sistem Basis Data atau Database System adalah kumpulan dari program aplikasi yang
berinteraksi dengan database.

B. SISTEM BERBASIS FILE (FILE BASED SYSTEM)


▪ Kumpulan program aplikasi yang melayani pengguna akhir/end user
contohnya : laporan dan formulir
▪ Setiap program mendefinisikan dan mengatur datanya sendiri.
Contohnya :

C. KETERBATASAN SISTEM BERBASIS FILE


▪ Pemisahan dan isolasi data
▪ Data yang sama berada pada program yang berbeda (Duplikasi Data)
▪ Boros ruang dan berpotensi adanya nilai atau format data yang berbeda untuk item data
yang sama.
▪ Boros waktu dan uang untuk memasukkan data lebih dari sekali.

D. DATABASE APPROACH
▪ Keterbatasan pada file based system menyebabkan:
o Setiap program aplikasi memelihara datanya sendiri sehingga kurangnya control dalam
pengelolaan data yang terpisah
o Data yang sama dikelola oleh aplikasi yang berbeda sehingga menyebabkan borosnya
waktu, biaya, dan space untuk mengentri data yang sama di tempat yang berbeda.
▪ Sehingga menghasilkan Database dan Database Management System (DBMS)

60
E. DATABASE
▪ Kumpulan data dan deskripsi dari data yang berhubungan secara logika yang dirancang dan
dibagikan untuk memenuhi kebutuhan organisasi akan informasi
▪ Data-data yang berhubungan meliputi entitas, atribut, dan hubungan dari informasi sebuah
organisasi.
o Entitas : Sebuah objek berbeda (orang, tempat, benda, konsep, atau kegiatan) dalam
organisasi yang direpresentasikan di database.
o Atribut: Sebuah property yang mendeskripsikan beberapa aspek dari objek yang
ingin kita simpan, seperti NIM, kode dosen, nama, kode matkul, dan jumlah SKS
o Relationship: Hubungan antara entitas, misal dosen mengajar mata kuliah.

F. DATABASE MANAGEMENT SYSTEM (DBMS)


▪ Sebuah system software yang memungkinkan pengguna untuk mendefinisikan, membuat,
mengontrol dan menjaga akses ke database.
▪ (Database) application program : Sebuah program komputer yang berinteraksi dengan
database dengan mengeluarkan permintaan yang sesuai (SQL Statement) ke DBMS

G. FUNGSI DBMS
▪ Data Definition Language (DDL)
o Untuk menspesifikasikan tipe data, struktur dan Batasan data lainnya.
▪ Data Manipulation Language (DML)
o General enquiry facility (Bahasa query) dari data
▪ Mengontrol akses ke database
o A security system
o An integrity system
o A concurrency control system
o A recovery control system
o A user-accessible catalog

H. VIEW
▪ Memungkinkan setiap pengguna untuk bisa melihat tampilan database-nya sendiri.
▪ Pada dasarnya, View merupakan bagian dari database
▪ Keuntungan
o Mengurangi kompleksitas dan mengatur tingkat keamanan
o Mengatur mekanisme untuk mengubah tampilan database
o Tingkat keamanan yang lebih baik

61
o Menyajikan struktur database yang tidak bisa diubah, bahkan jika database pokok
berubah

I. KOMPONEN LINGKUNGAN DBMS

▪ Hardware
o Berkisar antara PC sampai jaringan computer
o Arsitektur client-server (backend & frontend)
▪ Software
o DBMS, operating system(OS), network software (jika dibutuhkan), dan juga program
aplikasi (seperti Java, Visual Basic, SQL)
▪ Data
o Data operasional yang digunakan oleh organisasi dan deskripsi pada data yang disebut
skema.
▪ Prosedur
o Instruksi dan aturan yang seharusnya digunakan untuk mendesain dan menggunakan
database dan DBMS
▪ Orang (Pengguna)

J. PERAN-PERAN DI LINGKUNGAN DBMS


▪ Data Administrator (DA)
o Mengatur sumber data (DB planning, development and maintenance of standard, dll)
o Berkonsultasi dan menyarankan dengan manajer senior, memastikan bahwa arah
pengembangan database mendukung tujuan perusahaan
▪ Database Administrator (DBA)
o Realisasi fisik dari database (physical DB design & implementation, security and
integrity control,maintenance the OS, dll).
o Membutuhkan pengetahuan yang detail tentang target DBMS dan system envinroment
▪ Database Designers (Logis dan Fisik)
o Database Konseptual/Logis
‣ Mengidentifikasi data (entitas dan atribut), hubungan, serta batasannya
‣ Memahami data dan aturan bisnis ( karateristik utama data yang dilihat oleh
organisasi, kendala)
o Desain Fisik Database
‣ Menentukan bagaimana desain database logis menjadi realisasi fisik
‣ Contoh : memetakan desain database logis menjadi satu set table dan batasan
integritas, memilih struktur penyimpanan secara spesifik dan metode akses
untuk mencapai kemampuan bagus, mendesain ukuran keamanan yang
dibutuhkan pada data.
▪ Application Programmers
o Membuat program untuk mengakses ke database (retrieve, insert, update & delete data)
▪ End Users
o Kurang mengetahui DBMS
o Mutakhir : akrab dengan struktur database dan menyediakan fasilitas database

62
K. KEUNTUNGAN DBMS
▪ Mengontrol kelebihan data
▪ Konsistensi data
▪ Informasi yang lebih banyak dengan jumlah data yang sama
▪ Mengembangkan integritas data
▪ Peningkatan keamanan
▪ Pelaksanaan standar
▪ Meningkatkan aksesibilitas data dan responsive
▪ Meningkatkan produktivitas
▪ Meningkatkan maintenance melalui data independen
▪ Meningkatkan jasa backup dan recovery

L. KEKURANGAN DBMS
▪ Kompleksitas
▪ Ukuran yang besar
▪ Biaya mahal
o Biaya tambahan hardware
o Biaya pengubahan
▪ Performa
o DBMS dikembangkan untuk aplikasi umum dibandingkan untuk file-based system
▪ Dampak kegagalan lebih tinggi

RELATIONAL MODEL

A. TERMINOLOGI
▪ Relation → tabel dengan kolom dan baris
▪ Atribut → nama kolom pada relation (tabel)
o Informasi atau karakteristik tentang objek
▪ Domain → kumpulan nilai-nilai yang diijinkan pada satu atau lebih atribut
o Setiap atribut di relation didefinisikan oleh domain
o Mungkin berbeda untuk setiap atribut, atau dua atau lebih atribut mungkin didefinisikan
di domain yang sama
o Contoh : Nilai mata kuliah (bisa sama dan bisa berbeda), NIM, Nama
▪ Tuple → baris pada relation (tabel)
o Intension adalah struktur pada relation dengan domain dan batasan-batasan pada nilai
yang mungkin (biasanya tetap)
▪ Degree → jumlah atribut pada relation (tabel)
o Unary relation : sebuah relation dengan 1 atribut
o Binary relation : sebuah relation dengan 2 atribut
o Ternary relation : sebuah relation dengan 3 atribut
o N-ary relation : sebuah relation dengan lebih dari 3 atribut
▪ Cardinality → Jumlah tuple pada relation (tabel)
o Cardinality pada tabel adalah property dari tuple pada relation
▪ Relational Database adalah kumpulan relation yang dinormalisasi dengan nama relation
yang berbeda
o Terdiri atas relation yang terstruktur dengan tepat → dinormalisasi

63
B. CONTOH RELATION
▪ Relation pada Branch dan Staff

▪ Contoh atribut domain

C. TERMINOLOGI ALTERNATIF
Formal Terms Alternative 1 Alternative 2
Relation Tabel File
Tuple Baris Record
Attribute Kolom Field

D. PROPERTIES OF RELATIONS
▪ Nama relation (tabel) berbeda dari relation yang lain pada skema relation
▪ Setiap cell pada relation terdiri dari satu nilai
▪ Setiap atribut punya nama yang berbeda
▪ Nilai sebuah atribut berasal dari domain yang sama
▪ Setiap tuple berbeda; tidak ada duplicate tuple
▪ Order pada atribut tidak penting
▪ Order pada tuple tidak penting secara teori

E. RELATIONAL KEYS
▪ Tidak ada duplicate tuple pada relation (tabel) → mengidentifikasi satu atau lebih atribut
(disebut relational keys) yang mengidentifikasi secara unik setiap tuple pada relation
▪ Super key : Sebuah atribut atau kumpulan atribut (composite key) yang mengidentifikasi
secara unik sebuah tuple pada relation
▪ Candidate key
o Superkey(K) dimana tidak ada bagian dari superkey dengan relation
o Di setiap tuple pada relation, nilai K secara unik mengidentifikasi tuple (uniqueness)

64
o Tidak ada bagian dari K yang mempunyai keunikan property (irreducibility)
o Contoh Candidate key
o Branch→ branchNo, postcode

▪ Primary Key : Candidate key yang dipilih untuk mengidentifikasi tuple secara unik pada
relation
▪ Alternate Key : Candidate key yang tidak dipilih untuk menjadi primary key
▪ Foreign Key: Atribut, atau sekumpulan atribut pada satu relation yang cocok dengan
candidate key pada beberapa (kemungkinan sama) relation

F. REPRESENTASI DATABASE RELASIONAL SKEMA


▪ Beri nama relation juga nama atribut dalam tanda kurung; Biasanya primary key diberi
garis bawah
▪ Contoh
‣ Branch (branchNo, street, city, postcode)
‣ Staff(staffNo, fName, lName, position, sex, DOB, salary, branchNo)

G. INTEGRITY CONSTRAINT
▪ Sebuah data mempunyai dua bagian
o Bagian manipulasi, mendefinisikan tipe operasi yang diijinkan pada data
o Sekumpulan batasan integritas, yang menjamin bahwa data tersebut akurat
▪ Contoh
o Domain constraint → setiap atribut mempunyai sebuah domain yang terkait
o Integritas entitas
‣ Pada relation dasar, tidak ada primary key pada atribut bisa saja null
‣ Koresponden pada relation dasar untuk entitas dalam skema konseptual
o Integritas referensi
‣ Jika foreign key ada dalam relation, nilai foreign key lainnya harus sama dengan
nilai candidate key pada beberapa tuple di relation pokok atau foreign key harus
sepenuhnya null
o Keserberagaman
o Batasan umum
‣ Aturan tambahan yang dispesifikasikan oleh pengguna atau administrator
database yang mendefinisikan atau membatasi pada beberapa aspek perusahaan
‣ Contoh : mengatur batas pada kerja staff di cabang
▪ Null
o Merepresentasikan nilai pada sebuah atribut yang pada saat itu tidak diketahui atau
tak dapat diterapkan di tuple (baris) → merepresentasikan absennya sebuah nilai
o Terkait dengan tidak komplitnya data
o Tidak sama dengan 0 atau spasi, yang mana termasuk nilai

65
H. VIEW
▪ Tampilan dinamis dari satu atau lebih operasi relasional pada relation (tabel) dasar untuk
menghasilkan relation lain
▪ Relation berubah secara dinamis turun dari satu atau lebih relation dasar

▪ Sebuah tabel tak nyata yang tidak dibutuhkan benar-benar ada di database namun dihasilkan
berdasarkan permintaan, pada saat ada permintaan konten pada view didefinisikan sebagai
sebuah query pada satu atau lebih relation dasar
▪ Beberapa operasi pada view secara otomatis diubah menjadi operasi pada relation dari yang
diturunkan
▪ Views selalu dinamis
▪ Saat pengguna membuat perubahan ijin pada view, perubahan ini dibuat berdasarkan
relation pokok

I. TUJUAN VIEW
▪ Menyajikan mekanisme keamanan yang powerful dan fleksibel dengan menyembunyikan
bagian database pada pengguna tertentu
▪ Mengijinkan pengguna untuk mengakses data dengan cara yang disesuaikan, sehingga data
yang sama dapat dilihat oleh pengguna yang berbeda dengan cara yang berbeda, pada waktu
yang bersamaan.
▪ Dapat menyederhanakan operasi kompleks pada relation dasar
▪ Menyajikan struktur database yang tidak bisa diubah walaupun jika database pokok
berubah.

J. UPDATING VIEW
▪ Ada batasan pada pengubahan tipe yang bisa dilakukan melalui view
▪ Kondisi dimana kebanyakan sistem menentukan apakah mengijinkan update melalui view
o Update diijinkan melalui view didefinisikan menggunakan query sederhana melibatkan
satu relation dasar dan terdiri atas primary key atau candidate key di relation dasar
o Update tidak diijinkan melalui view yang melibatkan beberapa relation dasar
o Update tidak diijinkan melalui view melibatkan pengelompokan operasi
o Kelas pada view sudah didefinisikan bahwa secara teori tidak dapat diupdate, secara
teori dapat diupdate, dan sebagian bisa diupdate

66
ENTITY RELATIONALSHIP MODELING

A. KONSEP
▪ Entity Type Vs. Occurrence
o Entity Type → Kelompok objek dengan properties yang sama berada dalam organisasi
yang mempunyai eksistensi independen
o Entity occurrence → Objek yang teridentifikasi secara unik pada sebuah tipe entitas
▪ Relationship Type Vs. Occurence
o Relationship Type (Tipe Hubungan)
Himpunan relai (bisa lebih dari satu) antara dua atau lebih jenis entitas
o Relationship Occurrence (Terjadinya hubungan)
Hubungan antara dua atau lebih jenis entitas yang ditunjukkan oleh objek dari masing-
masing entitas.
o Jaringan semantic mempunyai tipe hubungan

o Degree of a Relationship
Jumlah entitas yang berpartisipasi dalam hubungan
o Degree of Relationship
‣ Binary = 2
‣ Ternary = 3
‣ Quarternary =4
o Hubungan Ternary
‣ Hubungan direpresentasikan menggunakan belah ketupat
‣ Nama hubungan terdapat di dalam belah ketupat
‣ Arah hubungan dihilangkan
‣ Contoh :

o Hubungan Quarternary

o Hubungan Rekursif/Unary
Tipe hubungan dimana tipe entitas sama berpartisipasi lebih dari sekali dengan peran
yang berbeda
o Hubungan diberikan nama peran untuk mengindikasi tujuan untuk setiap tipe entitas
berpartisipasi dalam sebuah hubungan

67
▪ Atribut
o Atribut → properti dari sebuah entitas atau tipe hubungan
o Domain Atribut
Kumpulan nilai yang diperbolehkan untuk satu atau lebih atribut
o Atribut simple/atomic
‣ Atribut yang terdiri satu komponen dengan eksistensi independen
‣ Contoh:posisi dan gaji pada entitas staff
o Atribut Komposit
Atribut yang terdiri dari beberapa komponen, dimana setiap komponen memiliki
eksistensi independen
Contoh: atribut alamat pada entitas Branch bisa dibagi menjadi jalan, kota dan pos kode
o Atribut bernilai tunggal
‣ Atribut yang memiliki nilai tunggal untuk setiap kejadian pada tipe entitas
‣ Contoh: setiap kejadian pada entitas Branch mempunyai satu nilai untuk setiap
atribut nomor cabang (branchNo)
o Atribut bernilai banyak
‣ Atribut yang memiliki nilai banyak untuk setiap kejadian pada sebuah tipe entitas
‣ Contoh: untuk setiap kejadian pada tipe entitas Branch bisa mempunyai nilai
banyak pada atribut telNo
o Atribut turunan
‣ Atribut yang merepresentasikan nilai yang diturunkan dari nilai pada atribut yang
berhubungan, atau sekumpulan atribut, yang tidak dibutuhkan di tipe entitas yang
sama

B. KEY
▪ Candidate Key
o Sekumpulan atribut yang teridentifikasi secara unik untuk setiap kejadian pada sebuah
tipe entitas
o Primary Key
‣ Candidate Key yang dipilih untuk mengidentifikasi secara unik setiap kejadian pada
sebuah tipe entitas
‣ Pilihan berdasarkan pertimbangan panjang atribut, jumlah minimal dari atribut
yang dibutuhkan dan certainty of uniqueness
o Composite Key
‣ Sebuah Candidate Key yang terdiri dari dua atau lebih atribut

C. REPRESENTATIF ATRIBUT SECARA DIAGRAM


▪ Persegi panjang entitas dibagi menjadi dua
o Bagian atas digunakan untuk nama entitas
o Bagian bawah merupakan daftar nama atribut
▪ Atribut Primary Key berada pada posisi paling atas
▪ Nama atribut ditampilkan dengan huruf pertama dalam huruf kecil dan huruf pertama untuk
setiap kata subsequent huruf capital (contoh: address &telNo)

D. TIPE ENTITAS
▪ Tipe Entitas Strong

68
o Tipe entitas yang eksistensinya tidak tergantung dengan tipe entitas lain
o Setiap entitas yang terjadi teridentifikasi secara unik menggunakan atribut Primary Key
pada tipe entitas tersebut
o Terkadang disebut sebagai induk, pemilik atau entitas dominan
▪ Tipe Entitas Weak
o Tipe entitas yang eksistensinya tergantung dengan tipe entitas lain
o Tidak mengidentifikasi terjadinya entitas hanya menggunakan atribut ini
o Terkadang disebut anak, dependent atau entitas subordinate

E. BATASAN STRUKTURAL
▪ Batasan tipe utama pada hubungan disebut multiplicity
▪ Multiplicity- jumlah (atau range) dari kemungkinan kejadian pada sebuah tipe entitas yang
mungkin berhubungan dengan sebuah kejadian pada asosiasi tipe entitas melalui hubungan
tertentu
▪ Merepresentasikan aturan(disebut aturan bisnis) established oleh pengguna atau
perusahaan
▪ Tingkat hubungan paling umum adalah biner
▪ Hubungan biner pada umumnya diartikan sebagai berikut:
o Satu ke satu (1:1)
o Satu ke banyak (1:*)
o Banyak ke banyak (*:*)
▪ Multiplicity dari hubungan Staf Manages Branch (1:1)

▪ Multiplicity dari tipe hubungan Staff Oversees PropertyForRent (1:*)

▪ Multiplicity dari hubungan Newspaper Advertises PropertyForRent (*:*)

69
▪ Multiplicity untuk hubungan kompleks
o Jumlah (atau range) kemungkinan terjadinya sebuah tipe entitas pada hubungan n-ary
ketika nilai lain (n-1) are fixed

▪ Hubungan ternary pada registers

▪ Ringkasan pada batasan multiplicity

▪ Batasan Struktural
o Multiplicity dibuat dalam dua tipe batasan pada hubungan : cardinality dan participation
o Cardinality
‣ Jumlah maksimum kemunculan dalam suatu hubungan relasi

o Participation
‣ Menentukan apakah semua atau hanya beberapa entitas yang berpartisipasi dalam
hubungan

F. PERMASALAHAN PADA ER MODEL


▪ Permasalahan mungkin muncul ketika mendesain sebuah konsep model data disebut
jebakan koneksi
▪ Sering terjadi karena misinterpretasi dalam arti pada hubungan tertentu
▪ rdapat dua tipe jebakan koneksi, yaitu Fan Trap dan Chasm Trap
▪ Fan Trap
o Ketika sebuah model direpresentasikan pada sebuah hubungan antara tipe entitas,
tetapi jalan antara entitas tertentu ambigu

70
o Restruktur ER Model untuk menghapus fan trap

o Jaringan semantic

▪ Chasm Trap
o Ketika sebuah model suggest eksistensi sebuah hubungan antara tipe entitas, tetapi
tidak ada jalur yang menghubungkannya

o Restruktur pada Model ER untuk menghapus Chasm Trap

o Jaringan Semantic

71
RELASI UNTUK DATA LOGIS

A. ENHANCED ENTITY RELATIONSHIP MODEL


▪ Sejak 1980-an, terdapat kebutuhan pada aplikasi database baru dengan bertambahnya
permintaan
▪ Konsep dasar ER model tidak cukup untuk merepresentasikan aplikasi lebih baru dan lebih
kompleks
▪ Tanggapannya adalah pengembangan konsep model semantic tambahan
▪ Konsep semantic tergabung menjadi model ER asli dan disebut model Enhanced Entity-
Relationship (EER)
▪ Contoh konsep tambahan model EER disebut
o Spesialisasi
o Agregasi
o Komposisi

B. TIPE ENTITAS KHUSUS UNTUK SPECIALIZATION/GENERALIZATION


▪ Superclass :Sebuah tipe entitas termasuk satu atau lebih perbedaan sub grup yang terjadi
▪ Subclass :Sebuah tipe entitas dengan sebuah perbedaan subgrup
▪ Contoh
o Entitas pada anggota tipe entitas Staff bisa diklafisikasikan menjadi Manager,
SalesPersonnel, dan Secretary
o Staff/Manager mempunyai hubungan superclass/subclass
▪ Karakteristik Hubungan Superclass/Subclass
o Hubungan superclass/subclass adalah satu ke satu (1:1)
o Superclass mungkin memiliki subclass yang berbeda
o Tidak semua anggota superclass membutuhkan anggota dari sebuah subclass
o Attribut Inheritance
o Kita juga bisa melihat hubungan yang hanya berasosiasi dengan tipe staff tertentu dan
tidak dengan staff secara umum

C. SPECIALIZATION/GENERALIZATION
▪ Specialization
o Proses memaksimalkan perbedaan antara anggota entitas dengan mengidentifikasi
karakteristik yang berbeda diantara mereka
o Top-down approach: mengidentifikasi perbedaan (atribut dan atau hubungan) antara
anggota pada entitas Staff
▪ Generalization
o Proses meminimumkan perbedaan antara anggota dengan mengidentifikasi
karakteristik umum mereka
o Botom-up approach: Menemukan atribut umum pada semua staff (Manager,
SalesPersonnel dan Secretary)

D. BATASAN DI SPECIALIZATION/GENERALIZATION
▪ 2 batasan yang mungkin digunakan pada Spesialisasi/generalisasi
o Batasan partisipan

72
‣ Menentukan apakah setiap anggota pada superclass harus berpartisipasi sebagai
anggota pada subclass
‣ Bisa perintah ataupun opsional
• Perintah: setiap anggota staff harus mempunyai kontrak
• Opsional: setiap anggota staff tidak membutuhkan tambahan peran kerja
o Batasan disjoint
‣ Mendeskripsikan hubungan antara anggota subclass dan mengindikasi apakah
anggota superclass bisa menjadi anggota pada sebuah atau lebih subclass
‣ Hanya digunakan ketika superclass mempunyai lebih dari satu subclass
‣ Bisa disjoint (OR) ataupun nondisjoint (AND)
▪ Terdapat empat kategori batasan pada spesialisasi dan generalisasi
o Perintah dan disjoint
o Opsional dan disjoint
o Perintah dan nondisjoint
o Opsional dan nondisjoint

E. AGGREGATION
▪ Representasi hubungan ‘Mempunyai sebuah’ atau ‘bagian dari’ antara tipe entitas, dimana
salahsatunya merepresentasikan semua dan lainnya merepresentasikan bagian
▪ Agregasi tidak bisa mengubah makna dari hubungan semua dan bagian

F. KOMPOSISI
▪ Bentuk spesifik dari aggregation yang merepresentasikan sebuah hubungan antar entitas
▪ Komposisi harus mengatur pembuatan dan penghancuran pada bagiannya
▪ Artinya, sebuah objek boleh menjadi bagian dari satu komposit pada satu waktu (dimana
aggregation diijinkan)

NORMALISASI

A. PENGENALAN
▪ Normalisasi adalah sebuah teknik untuk mendekomposisi suatu tabel menjadi beberapa
tabel agar tidak terjadi anomali pada waktu melakukan manipulasi
▪ Tujuan Normalisasi
o Menghilangkan data yang tidak perlu, yaitu data yang berulang (redundancy data)
o Mencegah terjadinya anomaly data
o Mengurangi kompleksitas

B. DATA REDUDANCY DAN UPDATE ANOMALIES


▪ Tujuan utama medesain relasional database berhubungan adalah untuk mengelompokan
atribut menjadi tabel untuk meminimumkan data redundancy
▪ Keuntungan mengimplementasikan database termasuk:
o Update data disimpan di database akan dicapai dengan jumlah operasi yang minimal
sehingga mengurangi kemungkinan inkonsistensi data
o Pengurangan ruang penyimpan dibutuhkan oleh tabel dasar sehingga meminimumkan
biaya

73
▪ Contoh Data Redundancy
‣ Masalah berhubungan dengan data redundancy diilustrasikan dengan membandingkan
tabel Staff dan Branch dengan tabel StaffBranch

‣ Tabel StaffBranch mempunyai redundant data; detail dari cabang diulangi untuk
setiap anggota staff yang bekerja di cabang tersebut
‣ Sebaliknya, informasi cabang ditampilkan hanya sekali untuk setiap cabang pada
tabel Branch dan hanya nomor cabang (BranchNo) yang diulangi di tabel Staff,
untuk merepresentasi dimana setiap anggota bekerja
▪ Update Anomali
‣ Tabel yang memiliki informasi berlebihan berpotensi terkena update anomaly
‣ Contoh update Anomali

‣ Insertion
• Untuk memasukan staff baru di cabang B007, kita juga harus memasukan detail
data pada cabang
• Untuk memasukan cabang baru yang tidak punya anggota menggunakan null
‣ Deletion
• Jika SA9 dihapus, B007 juga dihapus dari database
‣ Modification
• Untuk memperbarui alamat B003, kita harus memperbarui kolom semua staff
yang bekerja disana

C. KETERGANTUNGAN FUNGSIONAL
▪ Konsep penting yang berhubungan dengan normalisasi
▪ Ketergantungan fungsional mendeskripsikan hubungan antara atribut
▪ Contoh
o Jika A dan B adalah atribut dari tabel R
o B bergantung fungsional kepada A (dinotasikan dengan A→B)

74
o Jika setiap nilai di A di R berhubungan dengan satu nilai B di R
▪ Karakteristik Ketergantungan Fungsional
o Property dari meaning atau semantic atribut di tabel
o Representasi diagram

o Determinant dari ketergantungan fungsional referensi dari atribut atau grup berada di
sebelah kiri panah
▪ Contoh Ketergantungan Fungsional
o Contoh
Nim →nama [yes] (NIM Spesifik untuk sebuah nama) Alamat → kodepos [yes]
Nama→ Nim [no] (Nama tidak spesifik untuk sebuah NIM, misal “putra” bisa saja ada
beberapa NIM yang keluar)
Kodepos → alamat [no]
▪ Karakteristik dari Ketergantungan fungsional
o Determinan seharusnya mempunyai jumlah atribut yang minimal yang dibutuhkan
untuk menjaga ketergantungan fungsional dengan atribut yang di arah kanan panah
o Persyaratan ini disebut full functional dependency
o Full functional dependency mengindikasikan bahwa
‣ Jika A dan B adalah atribut dari tabelB secara penuh fungsional tergantung pada A,
jika B secara fungsional bergantung pada A
‣ Tetapi tidak pada subset A
o A bergantung fungsional A →B secara full functional dependency jika menghapus atribut
dari hasil A jika ketergantungan tidak ada
o A bergantung fungsional A→B secara parsial jika terdapat
o beberapa atribut yang bisa dihapus dari A dan tidak bergantung
o Contoh
‣ Tabel staff mempunyai staffNo, sName →branchNo

‣ Apakah Full functional Dependency


• Benar, setiap nilai dari staffNo dan sName berhubungan dengan nilai dari
branchNo
• Tetapi branchNo secara fungsional bergantung pada subset dari
staffNo,sName, dinamakan staffNo
• Contoh diatas termasuk ketergantungan parsial
▪ Karakteristik (Full) Functional Dependencies
o Karakteristik utama yang digunakan di normalisasi
‣ Terdapat hubungan satu-satu antara atribut yang berada di kiri panah
(determinant) dan kanan panah pada functional dependencies
‣ Menahan sepanjang waktu

75
‣ Determinant mempunyai jumlah minimal atribut yang dibutuhkan untuk menjaga
ketergantungan dengan atribut di sebelah kanan
▪ Mengidentifikasi Functional Dependencies
o Mengidentifikasi semua functional dependencies antara sekumpulan atribut cukup
mudah
‣ Jika makna dari setiap atribut dan hubungan antara atribut mudah dimengerti
o Informasi ini seharusnya disediakan oleh enterprise dalam bentuk diskusi dengan
pengguna dan atau dokumentasi seperti persyaratan spesifikasi pengguna
o Tetapi, jika pengguna tidak bisa berkonsultasi dan atau dokumen tidak komplit
kemudan tergantung pada aplikasi database itu mungkin dibutuhkan untuk database
designer untuk menggunakan pengalaman mereka untuk menyediakan informasi yang
hilang

D. ATURAN INFERENSIAL UNTUK KETERGANTUNGAN FUNGSIONAL


▪ Lebih lanjut tentang Functional Dependencies
o Sekumpulan functional Dependencies yang komplit untuk sebuah tabel bisa sangat besa
o Penting untuk menemukan car a yang bisa mengurangi sekumpulan ukuran yang bisa
diatur
o Biarkan A,B,C menjadi subset atribut dari tabel R
‣ Setiap A,B,C bisa menjadi atribut di R
‣ Armstrong’s axioms adalah sebagai berikut:
‣ Reflexivity : Jika B adalah subset dari A Kemudian A-> B
‣ Augmentation: Jika A-> B Kemudian A,C->B,C
‣ Transivity : Jika A->B dan B->C Kemudian A->C
o Aturan selanjutnya bisa diturunkan dari ketiga aturan
‣ Biarkan D menjadi subset atribut lainnya di R, kemudian : Reflexivity
‣ Augmentation
‣ Transivity
‣ Self- determination
‣ Transitive
‣ Dependecies
‣ Decomposition
‣ Union
‣ Composition
▪ Transitive Dependecies
o Penting untuk mengetahui transitive dependencies karena kehadirannya di tabel
kemungkinan disebabkan oleh update anomaly
o Transitive dependency mendeskripsikan sebuah kondisi dimana A,B,C adalah atribut
sebuah tabel seperti
‣ Jika A→B dan B→C,
‣ Kemudian C adalah transitive dependent pada A melalui B
‣ (membuktikan bahwa A tidak secara fungsional bergantung pada B atau C)
o Contoh1
‣ Pertimbangan functionaldependencies di tabel StaffBranch
• staffNo→sName,position,salary,branchNo,bAddr ess
• branchNo→bAddress
‣ Transitive dependency, branchNo→bAddress ada pada staffNo melalui branchNo

76
E. KETERGANTUNGAN FUNGSIONAL DAN PRIMARY KEY
▪ Mengidentifikasi Primary Key untuk Tabel menggunak Functional Dependencies
o Tujuan utama mengidentifikasi sekumpulan functional dependencies untuk sebuah
tabel adalah untuk menspesifikasikan sekumpulan batasan integritas yang harus
ditahan pada tabel
o Sebuah batasan integritas yang penting untuk dipertimbangkan pertama adalah
mengidentifikasi Candidate Key, dimana salah satunya dipilih untuk menjadi Primary
Key tabel
o Tabel StaffBranch mempunyai 5 functional dependencies
‣ staffNo →sName,position,salary,branchNo,bAddress
‣ branchNo→bAddress
‣ bAddress→branchNo
‣ branchNo,position → salary
‣ bAddress,position → salary
o Determinannya adalah staffNo, branchNo, bAddress, (branchNo,position) dan
(bAddress, position)
o Untuk mengidentifikasi semua Candidate Key, identifikasi atribut(atau sekumpulan
atribut) yang secara unik mengidentifikasi setiap kolam di tabel
o Semua atribut yang tidak menjadi bagian Candidate Key seharusnya menjadi functional
dependent kepada Key
o Satu Candidate Key dan kemudian menjadi Primary Key untuk tabel StaffBranch adalah
staffNo, semua atribut lainnya pada tabel menjadi functional dependent terhadap
staffNo
‣ staffNo →sName,position,salary,branchNo,bAddress
o Contoh
‣ Tabel sampel mempunyai 4 functional dependencies
• A→C
• C→A
• B→D
• A,B → E
‣ Determinant pada tabel Sampel adalah A,B,C dan (A,B). Tetapi salah satu
determinan yang secara fungsional menentukan semua bagian atribut adalah (A,B)
‣ (A,B) teridentifikasi menjadi Primary Key untuk tabel ini

F. PROSES NORMALISASI
▪ Teknik formal untuk menganalisis tabel berdasarkan Primary Keynya (atau Candidate key)
dan functional dependencies antara atribut dari tabel
▪ Sering dieksekusi sebagai rangkaian langkah
▪ Setiap langkah berkoresponden ke sebuah bentuk normal, yang disebut properties
▪ Saat normalisasi berjalan, tabel menjadi :
o Dengan progress lebih ketat (kuat) dalam format dan
o Mengurangi vulnerable untuk update anomaly
▪ Unnormalized Form (UNF)
o Table yang memiliki satu atau lebih kelompok yang berulang
o Untuk membuat sebuah tabel unnormalized, ubah data dari sumber informasi menjadi
format tabel dengan kolom dan baris

77
▪ UNF ke 1NF
o Nominasi sebuah atribut atau sekelompok atribut untuk beraksi sebagai kunci pada
tabel unnormalized
o Mengidentifikasi kelompok yang berulang di tabel unnormalized yang mengulangi
untuk atribut kunci
o Menghapus kelompok yang berulang dengan memasukan data yang sesuai di kolom
yang kosong
o Atau menghapus kelompok yang berulang dengan menempatkan data berulang
bersama dengan salinan atribut key nya di tabel yang berbeda
▪ First Normal Form (1NF)
o Sebuah tabel yang berpotong setiap baris dan kolom terdiri satu dan hanya satu nilai
▪ Permasalahan di 1NF
o Termasuk data redundancy yang signifikan
o Subjek untuk upadate anomaly
o Sehingga, muncul 2NF
▪ Second Normal Form (2NF)
o Berdasarkan pada konsep full functional dependency
o Full functional dependency mengindikasikan jika
‣ Atribut A dan B pada sebuah tabel
‣ B semuanya bergantung pada A jika B adalah fungsional bergantung pada A tetapi
tidak pada subset A
o Sebuah tabel di 1NF dan setiap atribut non-primary-key adalah semuanya functionally
dependent pada Primary Key
‣ Sehingga 2NF digunakan pada tabel dengan composite Key
‣ Sehingga, sebuah tabel dengan atribut primary key tunggal secara otomatis berada
2NF
▪ 1NF ke 2NF
o Identifikasi Primary Key pada tabel 1NF
o Identifikasi functional dependencies pada tabel
o Jika partial dependencies ada pada Primary Key, hapus mereka dengan menempatkan
mereka pada tabel baru beserta salinan determinant mereka
▪ Permasalahan pada 2NF
o Masih terdapat kemungkinan dari update anomaly
▪ Third Normal Form (3NF)
o Sebuah tabel yang berada di 1NF dan 2NF dan dimana tidak terdapat atribut non-
primary-key adalah transitively dependent pada Primary key
▪ 2NF ke 3 NF
o Identifikasi Primary Key pada tabel 2NF
o Identifikasi functional dependencies pada tabel
o Jika transitive dependencies ada pada primary key, hapus mereka dengan menempatkan
mereka pada tabel baru dengan salinan determinant mereka
o Definisi Umum 2NF ke 3NF2NF : Sebuah tabel pada 1NF dan setiap atribut non-primary-
key adalah secara penuh functionally dependent pada candidate key
o 3NF : Sebuah tabel pada 1NF dan 2NF dan tidak ada atribut non- primary-key yang
transitively dependent pada setiap candidate key

78
G. ALAT DEKOMPOSISI
▪ Dua peralatan penting pada dekomposisi
o Lossless-join property yang memudahkan kita untuk menemukan satu instansi pada
tabel asli dari instansi koresponden di tabel yang lebih kecil
o Dependency preservation property
‣ Memudahkan kita untuk memaksa batasan pada tabel asli dengan memaksa
beberapa batasan di setiap tabel yang lebih kecil
‣ Jika sebuah dekomposisi bukan dependency-preserving, kemudian, dependency
tersebut kehilangan dekomposisi

STRUCTURED QUERY LANGUAGE (1)

A. OBJECTIVES OF SQL
▪ SQL adalah transform-oriented language, bahasa yang didesain untuk menggunakan relation
untuk mengubah input menjadi output yang dibutuhkan
▪ Mempunyai 2 komponen utama
o DDL untuk mendefinisikan struktur database
o DML untuk membetulkan dan mengupdate data
▪ Tujuan SQL
o Membuat basis data dan struktur relasi
o Melakukan input, perubahan, dan penghapusan data dari suatu relasi
o Melakukan pencarian sederhana maupun kompleks
▪ Terdiri dari bahasa Inggris standar
o CREATE TABLE …;
o INSERT INTO … VALUES(…);
o SELECT … FROM … WHERE …;
▪ Bisa digunakan oleh semua pengguna
▪ Sebuah standar ISO saat ini sudah ada untuk SQL, membuat keduanya formal dan bahasa
standar secara de facto untuk relational database

B. MENULIS PERINTAH SQL


▪ Pernyataan SQL terdiri atas reserved word dan user-defined word
▪ Reserved word merupakan bagian yang sudah ada di dalam SQL dan harus ditulis sesuai
dengan yang dibutuhkan dan tidak dapat dijadikan variabel.
▪ User defined word merupakan kata yang dibuat oleh pengguna dan merepresentasikan
nama dari objek database seperti relation, kolom, dan view
▪ Semua komponen dalam SQL Statement adalah case insensitive (besar kecilnya huruf tidak
berpengaruh) , kecuali untuk karakter data literal
▪ Contoh : saat mencari kata ‘SMITH’, data tidak menampilkan kata ‘Smith’

C. LITERAL
▪ Literal adalah pernyataan yang sering digunakan di SQL
▪ Semua literal non numerik harus menggunakan kutipan ( Contoh: ‘London’)
▪ Semua literal numeric tidak menggunakan kutipan (Contoh :650.00)

79
D. SELECT STATEMENT
SELECT[DISTINCT|ALL]
{*| [columnExpression[AS newName]] [ , …]}
FROM TableName [alias] [ , …]
[WHERE condition]
[GROUP BY columList] [HAVING condition] [ORDER BY columnList]
▪ Penjelasan:
o FROM : menjelaskan tabel yang akan digunakan WHERE : menjelaskan kondisi
o GROUP BY : membentuk kelompok baris dengan nilai kolom yang sama HAVING :
menyaring subjek kelompok ke beberapa kondisi
o SELECT : menjelaskan kolom mana yang akan ditampilkan dalam output ORDER BY :
menjelaskan perintah output
‣ Urutan pada klausa tidak bisa diubah
‣ Hanya SELECT dan FROM yang merupakan perintah yang harus ada

E. CONTOH
▪ Semua Kolom dan Semua baris
SELECT staffNo, fName, lName, position, sex, DOB, salary, branchNo
( bisa diganti dengan * sehingga menjadi SELECT *)
FROM Staff;

▪ Kolom Tertentu dan Semua baris Misal kita


hanya ingin menampilkan
staffNo,fName,lName, dan salary
SELECT staffNo, fName, lName,
salary,
FROM Staff;

▪ Menggunakan DISTINCT Position


Kegunaan DISTINCT adalah untuk Manager
Menghapus duplikasi Assisstant
SELECT DISTINCT Supervisor
position FROM Staff

▪ Menghitung Fields
Menampilkan daftar gaji bulanan staff dan
hanya menampilkan
staffNo, fName, lName dan salary.
SELECT staffNo, fName,lName,
salary/12
FROM Staff

80
▪ Untuk mengubah nama kolom pada salary
SELECT staffNo, fName,lName,
salary/12 AS monthlySalary
FROM Staff

▪ Membandingkan Hasil Pencarian


o Daftar staff dengan gaji lebih dari 10000
SELECT staffNo, fName, lName, position, salary FROM Staff
WHERE salary>1000

o Daftar kantor cabang yang berada di London atau Glassgow


SELECT *
From Branch
WHERE city= ‘London’ OR city= ‘Glasgow’;

o Daftar staff dengan gaji antara 20000 sampai 30000


SELECT staffNo,fName,lName,position,salary
FROM Staff
WHERE salary BETWEEN 20000 AND 30000;
Pernyataan BETWEEN juga memiliki negasi yaitu NOT BETWEEN

▪ Mengatur Anggota
o Daftar manager dan supervisor
SELECT staffNo, fName, lName, position
FROM Staff
WHERE position IN
(‘Manager’, ‘Supervisor’);

o Versi negatif dari IN adalah NOT IN Cara lain penulisan


SELECT staffNo,fName,lName,position
FROM Staff
WHERE position=‘Manager’ OR position= ‘Supervisor’;
Catatan : IN lebih efisien jika nilai yang dicari banyak.

81
▪ Mencocokan Pola pada Pencarian
o Menemukan semua pemiliki yang memiliki kata ‘Glasgow’ pada kolom
alamatnya
SELECT ownerNo,fName,lName,address,telNo
FROM PrivateOwner
WHERE address LIKE ‘%Glasgow%’;

o SQL mempunyai 2 simbol pencocokan pola khusus:


‣ % : rangkaian 0 atau lebih karakter
‣ _ : satu karakter
LIKE ‘%Glasgow%’ berarti karakter yang memiliki kata ‘Glasgow’

▪ Pencarian pada kondisi NULL


SELECT clientNo, viewDate FROM Viewing
WHERE propertyNo= ‘PG4’ AND
comment IS NULL

▪ Single Column Ordering


Daftar gaji semua staff diurutkan dari yang terbesar
SELECT staffNo, fName, lName, salary
FROM Staff
ORDER BY salary DESC;

▪ Standar ISO mempunyai 5 fungsi agregat


o COUNT : menghitung banyaknya nilai pada kolom yang dipilih
SELECT COUNT (*) AS myCount FROM PropertyForRent WHERE rent
>350;
o SUM : menjumlahkan nilai pada kolom yang dipilih
Select SUM (salary) FROM Staff
WHERE position= ‘Manager’;
o AVG : menghasilkan rata-rata pada kolom yang dipilih
SELECT AVG (salary) FROM Staff;
o IN : mencari nilai minimal pada kolom yang dipilih
SELECT MIN (salary) FROM Staff;
o MAX : mencari nilai maksimal pada kolom yang dipilih
SELECT MAX (salary) FROM Staff;
o COUNT, MIN, MAX digunakan pada numeric dan non-numerik, tetapi SUM dan AVG
digunakan pada numeric saja
o Selain COUNT, setiap fungsi menghapus nilai null dahulu lalu menjalankan operasinya

▪ Menggunakan Having
Untuk setiap cabang dengan member lebih dari 1 orang, temukan jumlah staff di setiap
cabang dan jumlahkan gajinya
SELECT branchNo, COUNT(staffNo) AS myCount, SUM(salary)

82
AS mySum
FROM Staff
GROUP BY branchNo HAVING
COUNT(staffNo) > 1
ORDER BY branchNo;

STRUCTURED QUERY LANGUAGE (2)

A. ANY DAN ALL


▪ ANY dan ALL mungkin digunakan dengan subqueries yang
menghasilkan sebuah kolom angka
o ALL menghasilkan kondisi benar jika semua terdapat nilai
o ANY menghasilkan kondisi benar jika terdapat satu atau lebih nilai
▪ Jika subquery kosong, ALL bernilai benar dan ANY bernilai salah
▪ SOME mungkin digunakan menggantikan ANY
▪ Contoh SOME:
Menemukan staff dimana gajinya lebih besar dibandingkan dengan salah satu staff yang
bekerja di cabang B003
SELECT staffNo,fName,lName,position, salary FROM Staff
WHERE salary>SOME (SELECT salary FROM Staff
WHERE branchNo=’B003’);

▪ Contoh ALL
Mencari staff yang gajinya lebih tinggi daripada gaji semua staff yang bekerja di cabang B003
SELECT staffNo,fName,lName, position, salary FROM Staff
WHERE salary>ALL (SELECT salary FROM Staff
WHERE branchNo=’B003’);

B. MULTI TABLE QUERIES


▪ Bisa menggunakan subqueries yang menyediakan kolom hasil yang berasal dari tabel yang
sama
▪ Jika hasil kolom berasal dari lebih dari satu tabel, maka harus menggunakan join
▪ Untuk melakukan join, masukkan lebih dari satu tabel pada klausa FROM
▪ Gunakan koma sebagai pemisah dan khususnya masukkan klausa WHERE untuk
menspesifikasikan beberapa kolom join
▪ Kemungkinan juga menggunakan sebuah alias untuk sebuah nama tabel di klausa
▪ Alias dipisahkan dari nama tabel dengan spasi
▪ Contoh penggabungan sederhana:
Daftar nama semua klien yang sudah melihat sebuah property dengan komentar

83
SELECT
c.clientNo,c.fName,c.lName,v.propertyNo,v.comment FROM Client c,
Viewing v
WHERE c.clientNo=v.clientNo;

Penjelasan
Hanya baris dari kedua tabel yang mempunyai nilai yang identik/sama pada kolom
clientNo(c.clientNo=v.clientNo) yang masuk dalam output
▪ SQL menyediakan cara alternative untuk menspesifikasikan join
o FROM Client c JOIN Viewing v ON c.clientNo=v.clientNo
o FROM Client JOIN Viewing USING clientNo
o FROM Client NATURAL JOIN Viewing
▪ Contoh mengurutkan Join:
Untuk setiap cabang, tampilkan daftar nomor dan nama staff yang mengatur property dan
property yang dia atur
SELECT s.branchNo, s.staffNo, s.fName, s.lName, propertyNo FROM
Staff s, PropertyForRent p
WHERE s.staffNo=p.staffNo
ORDER BY s.branchNo,s.staffNo,propertyNo;

▪ Contoh Mengelompokkan Banyak Kolom


Mencari jumlah property yang dikendalikan oleh setiap staff
SELECT s.branchNo, s.staffNo, COUNT (*) AS myCount FROM Staff s,
PropertyForRent p
WHERE s.staffNo=p.staffNo
GROUP BY s.branchNo, s.staffNo
ORDER BY s.branchNo, s.staffNo;

C. COMPUTING A JOIN
▪ Prosedur untuk menghitung hasil dari sebuah join:
o Buat produk Cartesian dari nama tabel pada klausa FROM

84
o Jika terdapat klausa WHERE, gunakan kondisi pencarian pada setiap baris tabel produk,
sebagai penahan baris yang memuaskan kondisi pencarian
o Untuk setiap baris tersisa, tentukan nilai untuk setiap item di daftar SELECT untuk
menghasil sebuah baris dalam tabel hasil
o Jika DISTINCT sudah dispesifikasikan, hapus baris duplikasi dari hasil tabel
o Jika ada klausa ORDER BY, urutkan hasil tabel sesuai kebutuhan
▪ SQL menyediakan format khusus SELECT untuk produk Cartesian SELECT [DISTINCT|ALL]
{*|columnList}
FROM Table1 CROSSJOIN Table2
▪ Inner Joins
o Jika satu tabel dari tabel join tidak sama, baris dihilangkan dari tabel hasil
o Operasi inner join menahan baris yang tidak sesuai dengan kondisi join
o Perhatikan tabel dibawah ini

(Inner) Join dari tabel di atas SELECT b.*, p.*


FROM Branch1 b, PropertyForRent1 p
WHERE b.bCity=p.pCity;

Penjelasan:
o Tabel hasil mempunyai dua baris dimana memiliki kota yang sama
o Tidak ada baris untuk kota Bristol dan Aberdeen
o Untuk memasukkan baris yang tidak sama kedalam tabel, gunakan Outer Join
▪ Contoh Left Outer Join
Daftar cabang dan property yang sama juga dengan cabang yang tidak sama
SELECT b.*, p.*
FROM Branch1 b LEFT JOIN PropertyForRent1 p On
b.bCity=p.pCity;

Penjelasan:
o Termasuk baris pertama pada tabel pertama (kiri) yang tidak sama dengan baris tabel
kedua (kanan)
o Kolom dari tabel kedua tidak diisi atau kosong
▪ Contoh Right Outer Join
Daftar cabang dan property yang sama juga dengan cabang yang tidak sama
SELECT b.*, p.*
FROM Branch1 b RIGHT JOIN PropertyForRent1 p ON

85
b.bCity=p.pCity;

Penjelasan
Right Outer Join termasuk baris kedua (kanan) tabel yang tidak sama dengan baris dari tabel
pertama (kiri) Tabel pertama tidak diisi atau kosong
▪ Contoh Full Outer Join
Daftar cabang dan property yang sama juga dengan cabang yang tidak sama
SELECT b.*,p.*
FROM Branch1 b LEFT JOIN PropertyForRent1 p ON
b.bCIty=p.pCity UNION
SELECT b.*,p.*
FROM Branch1 b RIGHT JOIN PropertyForRent1 p ON
b.bCIty=p.pCity;

Penjelasan
o Termasuk baris yang tidak sama di kedua tabel
o Kolom yang tidak sama tidak diisi atau kosong

D. EXIST DAN NOT EXIST


▪ EXISTS dan NOT EXISTS adalah untuk digunakan hanya dengan subqueries
▪ NOT EXISTS adalah lawan dari EXISTS
▪ AS (NOT) EXISTS hanya untuk mengecek ada atau tidaknya baris di tabel hasil subqueries,
subquery bisa termasuk banyak angka pada kolom.
▪ Umumnya untuk subqueri diikuti (NOT) EXISTS dengan bentuk (SELECT *…)
▪ Contoh Menggunakan EXISTS
Temukan semua staff yang bekerja di cabang London
SELECT staffNo,fName,lName,position
FROM Staff s WHERE EXISTS (SELECT *
FROM Branch b
WHERE s.branchNo=b.branchNo AND b.city=’London’);

Penjelasan
o Kondisi pencarian s.branchNo=b.branchNo dibutuhkan untuk mempertimbangkan
record cabang yang benar untuk setiap anggota staff
o Jika dihilangkan, akan menampilkan semua daftar staff karena subquerinya adalah

86
SELECT * FROM Branch WHERE city=’London’
▪ Akan selalu bernilai benar dan queri akan menjadi
SELECT staffNo,fName,lName, position
FROM Staff WHERE true;
▪ Bisa juga queri ini ditulis menggunakan struktur Join
SELECT staffNo,fName,lName,position
FROM Staff s, Branch b
WHERE s.branchNo=b.branchNo AND city=’London’;

E. UNION, INTERSECT, DAN DIFFERENCE (EXCEPT)


▪ Bisa menggunakan operasi UNION, INTERSECTION dan DIFFERENCE untuk
mengkombinasikan hasil dari dua atau lebih queries menjadi satu tabel hasil
o UNION dari dua tabel, A dan B, adalah tabel yang berisi semua baris dari A atau B atau
keduanya
o INTERSECTION adalah tabel terdiri dari semua baris yang berada di kedua tabel A dan
B
o DIFFERENCE adalah tabel terdiri dari semua baris di A tetapi tidak di B
▪ Dua tabel harus cocok untuk digabung; keduanya harus mempunyai struktur yang sama
o Terdiri dari jumlah kolom yang sama dan
o Corresponding kolom mempunyai tipe data dan panjang yang sama
▪ Format klausa operator untuk setiap kasus adalah:
Op[ALL][CORRESPONDING [BY{column1[,…]}]]
▪ Jika CORRESPONDING BY dispesifikasikan, set operasi melakukan pada nama kolom
▪ Jika CORRESPONDING dispesifikasikan tetapi tidak menggunakan klausa BY, operasi
melakukan pada kolom biasa
▪ Jika ALL dispesifikasikan, hasil bisa termasuk baris duplikat
▪ Contoh menggunakan UNION
Daftar semua kota dimana terdapat sebuah kantor cabang atau sebuah property
(SELECT city (SELECT *
FROM Branch FROM Branch
WHERE city IS NOT NULL) WHERE city IS NOT NULL)
UNION UNION CORRESPONDING
(SELECT city BY city
FROM PropertyForRent SELECT *
WHERE city IS NOT NULL); FROMroperty ForRent
WHERE city
ISNOT NULL);
Output

▪ Contoh menggunakan INTERSECT


Daftar semua kota dimana terdapat sebuah kantor cabang dan sebuah property
(SELECT city FROM Branch)INTERSECT

87
(SELECT city FROM PropertyForRent);

▪ Penggunaan EXCEPT
Daftar nama kota dimana terdapat kantor cabang tetapi tidak ada property
(SELECT city FROM Branch) EXCEPT
(SELECT city FROM PropertyFromRent);
Atau
(SELECT * FROM Branch) EXCEPT CORRESPONDING BY city
(SELECT* FROM PropertyForRent);
▪ INSERT
Memasukkan data baru pada relation Contoh
INSERT INTO Staff
VALUES (‘SG16’ , ‘Alan’, ‘Brown’, ‘Assisstant’,
‘M’, ‘1957-05-25’, 8300, ‘B003’);
▪ UPDATE
Memperbarui data yang telah ada. Contoh :
UPDATE Staff
SET salary=salary*1.03;
DELETE
▪ Menghapus data yang sudah ada di tabel Contoh
DELETE FROM Viewing WHERE propertyNo= ‘PG14’;

DEFINISI DATA

A. DATA TIPE ISO SQL

B. DATA TIPE SQL SKALA


▪ Data Boolean
▪ Data Karakter
▪ Angka Numerik Pasti

88
▪ Angka Numerik Perkiraan

C. INTEGRITY ENHANCEMENT FEATURE (IEF)


▪ IEF: fasilitas yang disediakan oleh standar SQL untuk integrity control
▪ Integrity control terdiri dari batasan untuk
o Menjaga database agar tidak inkosisten
o Batasan ini bisa dispesifikasikan di CREATE dan ALTER TABLE
o Terdiri dari 5 tipe batasan integritas
▪ Data yang dibutuhkan
o Beberapa kolom harus memiliki nilai yang valid, tidak diperbolehkan untuk terisi null
o Null berbeda dari kosong atau 0, dan digunakan untuk merepresentasikan data yang
tidak tersedia, hilang atau tidak berlaku
o Standar ISO menyediakan kolom NOT NULL lebih spesifik di pernyataan CREATE dan
ALTER TABLE untuk batasan tipe ini. Ketika NOT NULL dispesifikasikan, sistem menolak
semua percobaan untuk memasukkan null pada kolom. Jika NULL dispesifikasikan,
sistem akan menerima null
o Default ISO adalah NULL
o Contoh, untuk menspesifikasikan posisi kolom pada tabel Staff tidak bisa diisi null, kita
tentukan kolom sbb.:
Position VARCHAR(10) NOT NULL
▪ Batasan Domain
o Setiap kolom mempunyai sebuah domain
o Contoh, jenis kelamin setiap staff adalah antara ‘M’ atau ‘F’, sehingga domain pada kolom
jenis kelamin pada tabel Staff adalah
o single character string terdiri dari ‘M’ atau ‘F’
o Domain bisa dihapus dari database menggunakan pernyataan DROP DOMAIN :
DROP DOMAIN DomainName[RESTRICT|CASCADE]
▪ Integritas Entitas
o Primary key pada tabel harus terdiri dari nilai yang unik, non- null pada setiap baris
PRIMARY KEY(propertyNo) PRIMARY KEY (ClientNo,propertyNo)
o Klausa PRIMARY KEY bisa dispesifikasikan hanya satu setiap tabel. Tetapi, ada
kemungkinan untuk mengamankan keunikan pada setiap ALTERNATE KEYS pada tabel
menggunakan kata kunci UNIQUE. Setiap kolom yang tampil dalam klausa UNIQUE
harus dideklarasikan sebagai NOT NULL.
o SQL menolak setiap operasi INSERT atau UPDATE yang dicoba untuk membuat nilai
duplikasi di setiap CANDIDATE KEY (PRIMARY KEY atau ALTERNATE KEY
o Contoh
ClientNo VARCHAR(5) NOT NULL,
propertyNo VARCHAR (5) NOT NULL, UNIQUE
▪ Integritas Referensial
o FOREIGN KEY adalah kolom atau sekumpulan kolom yang berhubungan dengan setiap
baris pada tabel dimana pada salah satu tabel menjadi FOREIGN KEY dan tabel lainnya
menjadi PRIMARY KEY
o Integritas referensial berarti jika FK terdiri dari nilai, nilai tersebut harus ada pada tabel
utama
o Standar ISO mensupport definisi klausa FOREIGN KEY di CREATE dan ALTER TABLE

89
o Keputusan diambil ketika mencoba mengupdate/ menghapus nilai CK di tabel induk
dengan mencocokan baris pada anak yang bergantung pada aksi referensial
dispesifikasikan menggunakan sub klausa ON UPDATE dan ON DELETE
o Saat pengguna mencoba untuk menghapus baris dari tabel induk, dan terdapat satu atau
lebih baris yang sama dengan tabel anak, SQL memberikan empat pilhan tergantung aksi
yang diambil
CASCADE, SET NULL, SET DEFAULT,NO ACTION
▪ Batasan Umum
Pembaruan pada tabel dibatasi oleh aturan umum yang direpresentasikan oleh UPDATE, bisa
menggunakan CHECK/UNIQUE di CREATE dan ALTER TABLE
o Sama dengan klausa CHECK, juga mempunyai: CREATE ASSERTION
Assertion Name CHECK (searchCondition)
o Berbeda dengan CHECK/UNIQUE, ASSERTION bisa digunakan pada lebih dari satu tabel
CREATE ASSERTION
StaffNotHandlingTooMuch CHECK(NOT EXISTS(SELECT staffNo
FROM PropertyForRent GROUP BY StaffNo HAVING COUNT (*)>100))
▪ Klausa CHECK, yang memungkinkan batasan untuk ditentukan pada kolom atau seluruh
tabel. Format klausa CHECK adalah
CHECK(searchCondition)
Sex CHAR NOT NULL CHECK(sex IN (‘M’, ‘F’))
▪ Domain dapat ditentukan lebih eksplisit dengan menggunakan pernyataan CREATE DOMAIN
CREATE DOMAIN DomainName[AS]data Type [DEFAULT
defaultOption]
[CHECK (searchCondition)]
CREATE DOMAIN sexType AS CHAR DEFAULT ‘M’
CHECK (VALUE (‘M’ , ‘F’));
sex SEXType NOT NULL
CREATE DOMAIN BranchNumber AS CHAR (4)
CHECK (VALUE IN (SELECT branchNo FROM
Branch));

D. SQL DDL
▪ SQL DDL mengijinkan objek database seperti skema, domain, tabel , view dan index bisa
dibuat dan dihapus
▪ Pernyataan utama SQL DDL adalah
CREATE SCHEMA DROP SCHEMA
CREATE/ALTER DOMAIN DROP DOMAIN
CREATE/ALTER TABLE DROP TABLE
CREATE VIEW DROP VIEW
▪ Banyak DBMS juga menyediakan (tidak standar)
CREATE INDEX DROP INDEX
▪ Relation(tabel) dan objek database lainnya ada di envinroment
▪ Setiap envinroment terdiri atas satu atau lebih catalog, dan setiap catalog terdiri atas
sekumpulan skema
▪ Skema adalah nama kumpulan objek database yang berhubungan
▪ Objek di skema bisa tabel, views, domain, assertion, collation, translations, dan sekumpulan
karakter. Semuanya mempunyai pemilik sama

90
E. CREATE TABLE
▪ Membuat tabel dengan satu atau lebih kolom dispesifikasikan di dataType
▪ Dengan NOT NULL, sistem menolak semua percobaan untuk memasukkan null di kolom
▪ Bisa menspesifikasikan nilai DEFAULT untuk kolom
▪ PRIMARY KEY seharusnya selalu dispesifikasikan sebagai NOT NULL
▪ Klausa FOREIGN KEY menspesifikasikan FOREIGN KEY dengan referential action
▪ Contoh :

F. ALTER TABLE
▪ Menambahkan kolom baru pada tabel
▪ Menghapus kolom pada tabel
▪ Menambahkan batasan tabel
▪ Menghapus batasan tabel
▪ Mengatur default pada kolom
▪ Menghapus default pada kolom
▪ Format dasar dari pernyataannya adalah :

Keterangan :
o DROP COLUMN mempunyai opsi kualifikasi dimana menspesifikasikan apakah aksi
DROP adalah cascade atau tidak
‣ RESTRICT : operasi akan ditolak jika kolom yang direferensikan oleh objek database
lain. Merupakan setting default
‣ CASCADE : operasi akan diproses dan secara otomatis menghapus kolom dari
setuap objek database yang direferensikan.

91
G. DROP TABLE
▪ DROP TABLE TableName[RESTRICT|CASCADE]
Contoh : DROP TABLE PropertyForRent
▪ Menghapus nama tabel dan semua baris di dalamnya
o Gunakan DELETE FROM PropertyForRent untuk menghapus baris saja
▪ Dengan RESTRICT, jika terdapat objek yang eksistensinya tergantung pada eksistensi pada
tabel ini, SQL tidak mengijinkan permintaan
▪ Dengan CASCADE, SQL menghapus semua objek dependen

92
UJIAN TENGAH SEMESTER TAHUN AKADEMIK 2017/2018
Mata Kuliah : Basis Data
Tingkat : II (Dua)
Pengajar : Tim Dosen
Hari, Tanggal : Senin, 23 April 2018
Waktu Ujian : 120 menit
Sistem Ujian : Tutup Buku

Jawablah seluruh pertanyaan berikut ini dengan lengkap, baik dan benar.
1. Dilan adalah seorang ketua club motor yang memiliki cabang organisasi di seluruh pulau Jawa. Setiap
cabang organisasi dipimpin oleh seorang ketua cabang. Dan untuk menjaga ketertiban, setiap
anggota club memiliki satu pengawas yang disebut sebagai sesepuh. Setiap anggota harus
mendaftarkan sepeda motor yang dimilikinya untuk keperluan organisasi. Organisasi yang dipimpin
Dilan memiliki hubungan yang baik dengan pihak kepolisian, dimana setiap cabang memiliki
pembina yang berasal dari pihak kepolisian. Jika Anda diminta bantuan oleh Dilan untuk merancang
basis data untuk klub motornya, maka identifikasilah entitas apa saja yang ada dalam basis data yang
dibuat dan buatlah Entity Relationship Diagram (ERD) dari entitas tersebut!

2. Diberikan database dengan struktur seperti berikut:


Pelanggan(idPelanggan, namaDepan, namaBelakang, kota, negara, telepon) Order(idOrder,
tanggalOrder, nomorOrder, idPelanggan) OrderItem(idOrderItem, idOrder, idProduk, kuantitas)
Produk(idProduk, namaProduk, idSupplier, hargaPerUnit, kemasan) Supplier(idSupplier,
namaPerusahaan, namaKontak, kota, negara, telepon, fax)
Dimana database tersebut sudah terdapat record di dalamnya sebagai berikut:
Pelanggan

idPelanggan namaDepan namaBelakang kota negara telepon


1 Maria Anders Berlin Germany 030-0074321
2 Ana Trujillo Mexico Mexico (5)555-4729
3 Antonio Moreno London UK (171)555-7788
4 Thomas Hardy Glasgow UK (171)555-2340
5 Andi Maulana Depok Indonesia +628568431209

Order
idOrder tanggalOrder nomorOrder idPelanggan
1 7/14/2012 12:00:00 542378 3
2 7/15/2012 10:00:00 542379 1
3 7/16/2012 09:00:00 542380 1
4 7/17/2012 11:00:00 542381 2
5 7/18/2012 14:00:00 542382 4

93
Order Item
idOrderItem idOrder idProduk kuantitas
1 1 11 20
2 1 12 40
3 1 13 10
4 2 11 10
5 2 14 15
6 3 14 20
7 3 15 20
8 3 16 20
9 4 12 25
10 4 16 10
11 4 17 10
12 5 13 20
13 5 14 25
14 5 17 25

Produk
idProduk namaProduk idSupplier hargaPerUnit kemasan
11 Vegetable Oils 1 18.000 10 boxes x 20 bags
12 Olive Oils 1 19.000 24-12 oz bottles
13 Aniseed Syrup 1 10.000 12-550 ml bottles
14 Chef Anton’s Cajun Seasoning 2 22.000 48-6 oz jars
Grandma’s Boysenberry
15 3 25.000 12-8 oz jars
Spread
16 Chef Anton’s Gumbo Mix 2 21.350 36 boxes
17 Uncle Bob’s Dried Pears 3 30.000 12-1 lb pkgs

Supplier
idSupplier namaPerusahaan namaKontak kota negara telepon fax
1 Ceria Liquids Sahid Jakarta Indonesia 021- 021-
8403241 8403241
2 New Cajun Bryan New USA - -
Delights Orleans
3 Grandma Melly Melbourne Australia - -
Homestead

Dari basis data tersebut, tuliskan SQL DDL dan DML untuk pertanyaan berikut, dan khusus untuk DML
tuliskan outputnya:
a) Buatlah tabel Pelanggan
b) Update kota menjadi California untuk supplier yang berasal dari USA
c) Tampilkan semua produk yang harganya antara 10.000 dan 20.000

94
d) Tampilkan produk-produk yang kemasannya dalam bottles dan pelanggan yang membeli produk
tersebut
e) Jika pelanggan Andi Maulana melakukan order yang baru dengan rincian:
- Order pada tanggal 7/19/2012 10:00:00 dengan nomor Order 542383
- Membeli produk Vegetable Oils dengan kuantitas sebanyak 15 unit dan Produk Olive Oils
dengan kuantitas sebanyak 10 unit
Menurut Anda, tabel-tabel mana yang perlu di-insert? Tuliskan DML untuk melakukan insert
tersebut?

3. Perhatikan tabel 1 yang terdapat pada lampiran soal. Dari tabel tersebut:
a) Buat tabel bentuk 1NF
b) Berikan 3 contoh masalah update anomalies yang muncul akibat redudansi data yang sudah ada
pada tabel tersebut
c) Identifikasi functional dependencies yang ada (termasuk tentukan candidate key, full functional
dependencies, partial dependency, dan transitive dependency jika ada)
d) Buat tabel bentuk 2NF
e) Buat tabel bentuk 3NF

95
PEMBAHASAN BASIS DATA

1. Entitas : Cabang, Anggota, Ketua, Pengawas, Pihak kepolisian

KETUA
idKetua
Nama
Alamat
noHp
1..1

Memiliki
1..1
CABANG KEPOLISIAN
noCabang noIdentitas
Alamat Dibina 1..1 Nama
Kota 1..* Alamat
noHp
1..1

Memiliki
1..*
PENGAWAS ANGGOTA
idPengawas 1..1 Mengawasi idAnggota
Nama Nama
Alamat 1..* Alamat
noHp noHp

2.
a)
Buatlah tabel Pelanggan
CREATE TABLE Pelanggan (
IdPelanggan VARCHAR(5) PRIMARY KEY,
namaDepan VARCHAR(15) NOT NULL,
namaBelakang VARCHAR(15),
kota VARCHAR(10) NOT NULL,
Negara VARCHAR(10) NOT NULL,
Telepon VARCHAR(25));

b) Update kota menjadi California untuk


supplier dari USA

UPDATE Supplier
SET kota=’California’
WHERE Negara=’USA’

96
OUTPUT :
Supplier
idSupplier namaPerusahaan namaKontak kota negara telepon fax
1 Ceria Liquids Sahid Jakarta Indonesia 021- 021-
8403241 8403241
2 New Cajun Bryan California USA - -
Delights
3 Grandma Melly Melbourne Australia - -
Homestead

c) Tampilkan semua produk yang harganya antara 10.000 dan 20.000


SELECT *
FROM produk
WHERE hargaPerUnit BETWEEN 10.000 AND 20.000; ???

d) Tampilkan produk-produk yang kemasannya dalam bottles dan pelanggan yang membeli produk
tersebut
SELECT p.idProduk, p.namaProduk, p.kemasan, l.idPelanggan, l.namaDepan, l.namaBelakang
FROM Produk p, OrderItem o, Order r, Pelanggan l
WHERE p.idProduk=o.idProduk AND o.idOrder=r.idOrder AND
r.idPelanggan=l.idPelanggan AND p.kemasan LIKE ‘%bottles%’;

idProduk namaProduk kemasan idPelanggan namaDepan namaBelakang


12 Olive Oils 24-12 oz bottles 3 Antonio Moreno
12 Olive Oils 24-12 oz bottles 2 Ana Trujillo
Aniseed 12-550 ml
13 bottles 3 Antonio Moreno
Syrup
Aniseed 12-550 ml
13 4 Thomas Hardy
Syrup bottles

e)
Jika pelanggan Andi Maulana melakukan order yang baru dengan rincian :
- Order pada tanggal 7/19/2012 10:00:00 dengan nomor Order 542383
- Membeli produk Vegetable Oils dengan kuantitas sebanyak 15 unit dan produk Olive Oils dengan
kuantitas sebanyak 10 unit
Menurut Anda, tabel-tabel mana yang perlu di-insert? Tuliskan DML untuk melakukan insert
tersebut?

97
Tabel yang perlu di-insert adalah tabel Order dan OrderItem

INSERT INTO Order


VALUES(‘6’,’ 7/19/2012 10:00:00’,’ 542383’,’5’);

INSERT INTO OrderItem


VALUES(‘1
5’,’6’,’1
1’,15),
(‘16’,’6’,’12
Outputnya akan muncul sama persis dengan printah di soal
3. a) 1NF ’,10);
Materi Bahasan
Kode Materi Materi Kode Pokok Bahasan Pokok Bahasan
M1 Kalimat N1 Kalimat Pernyataan
M1 Grammar N2 Present perfect tense

Kode Kode Kode Jenis Jenis Kode Jawaban


Pertanyaan Jawaban Benar
Materi Pertanyaan Pertanyaan Pertanyaan Jawaban

Berikut kalimat
Kami kurang
pernyataan tidak Jawaban Ya
M1 Q1 J1 A1 sependapat dengan
setuju yang santun Tunggal
gagasan saudara
adalah
Berikut kalimat
kami akan
pernyataan tidak Jawaban Tidak
M1 Q1 J1 A2 mempertimbangkan
setuju yang santun Tunggal
gagasan saudara
adalah
Berikut kalimat
pendapat anda
pernyataan tidak Jawaban Tidak
M1 Q1 J1 A3 perlu ditinjau
setuju yang santun Tunggal
kembali
adalah
berikut hal-hal yang
tidak perlu tanggapan yang
diperhatikan dalam Jawaban dikemukakan harus Tidak
M1 Q1 J2 A4
mengemukakan ganda berhubungan atau
pendapat atau sesuai dengan topik
tanggapan
berikut hal-hal yang
tidak perlu tanggapan
M1 Q1 diperhatikan dalam J2 Jawaban A5 dikemukakan dalam Tidak
mengemukakan ganda uraian yang lebar
pendapat atau
tanggapan

98
berikut hal-hal yang
tidak perlu menggunakan kata
M1 Q1 diperhatikan dalam J2 Jawaban A6 yang tepat dan Ya
mengemukakan ganda bersahaja
pendapat atau
tanggapan
My
M2 Q1 English…really…since J1 Jawaban A1 had/improve Tidak
I moved to Australia Tunggal

My
M2 Q1 English…really…since J1 Jawaban A2 has/improved Ya
I moved to Australia Tunggal

My
M2 Q1 English…really…since J1 Jawaban A3 is/Improving Tidak
I moved to Australia Tunggal

FD1 Kode materi, Kode Jenis Pertanyaan, Kode Jawaban → Jawaban ( primary key )
FD2 kode materi, kode jenis pertanyaan, kode jawabn, jawaban benar → Jawaban (partial dependency)
FD3 Kode Jenis Pertanyaan → Jenis Pertanyaan (Transitive dependency)

1NF ke 2NF
Materi bahasan
Kode Materi Materi Kode Pokok Bahasan Pokok Bahasan

M1 Kalimat N1 Kalimat Pernyataan

M1 Grammar N2 Present perfect tense

Materi Pertanyaan
Kode Kode Jenis Pertanyaan
Materi Pertanyaan
Berikut kalimat pernyataan tidak setuju yang santunadalah
M1 J1

berikut hal-hal yang tidak perlu diperhatikan dalam


M1 J2 mengemukakan pendapat atau tanggapan

M2 J1 My English…really…since I moved to Australia

99
Tabel 2
Kode Kode Jenis Jenis Kode Kode Jawaban
Jawaban Benar
Materi Pertanyaan Pertanyaan Pertanyaan Jawaban
Kami kurang
Jawaban Ya
M1 J1 Q1 A1 sependapat dengan
Tunggal
gagasan saudara
kami akan
Jawaban Tidak
M1 J1 Q1 A2 mempertimbangkan
Tunggal
gagasan saudara
pendapat anda
Jawaban Tidak
M1 J1 Q1 A3 perlu ditinjau
Tunggal
kembali
tanggapan yang
Jawaban dikemukakan harus Tidak
M1 J2 Q1 A4
ganda berhubungan atau
sesuai dengan topik
tanggapan
Jawaban dikemukakan dalam
M1 J2 Q1 A5 Tidak
ganda uraian yang lebar

menggunakan kata
Jawaban Ya
M1 J2 Q1 A6 yang tepat dan
ganda
bersahaja
Jawaban Tidak
M2 J1 Q1 A1 had/improve
Tunggal
Jawaban Ya
M2 J1 Q1 A2 has/improved
Tunggal
Jawaban Tidak
M2 J1 Q1 A3 is/Improving
Tunggal

2NF ke 3NF
Materi Bahasan
Kode Materi Materi Kode Pokok Bahasan Pokok Bahasan

M1 Kalimat N1 Kalimat Pernyataan

M1 Grammar N2 Present perfect tense

Materi Pertanyaan
Kode Kode Jenis Pertanyaan
Materi Pertanyaan
Berikut kalimat pernyataan tidak setuju yang santunadalah
M1 J1

berikut hal-hal yang tidak perlu diperhatikan dalam


M1 J2 mengemukakan pendapat atau tanggapan

M2 J1 My English…really…since I moved to Australia

100
Jenis Pertanyaan
Kode Jenis Pertanyaan Jenis Pertanyaan

J1 Jawaban Tunggal

J2 Jawaban Ganda

Tabel 3
Kode Kode Jenis Kode Kode Jawaban
Jawaban Benar
Materi Pertanyaan Pertanyaan Jawaban
Kami kurang
M1 J1 Q1 A1 sependapat dengan Ya
gagasan saudara
kami akan
M1 J1 Q1 A2 mempertimbangkan Tidak
gagasan saudara
pendapat anda
M1 J1 Q1 A3 perlu ditinjau Tidak
kembali
tanggapan yang
dikemukakan harus Tidak
M1 J2 Q1 A4
berhubungan atau
sesuai dengan topik
tanggapan
dikemukakan dalam
M1 J2 Q1 A5 Tidak
uraian yang lebar

menggunakan kata
M1 J2 Q1 A6 yang tepat dan Ya
bersahaja
M2 J1 Q1 A1 had/improve Tidak

M2 J1 Q1 A2 has/improved Ya

M2 J1 Q1 A3 is/Improving Tidak

101
UJIAN TENGAH SEMESTER TAHUN AKADEMIK 2018/2019
Mata Kuliah : Basis Data
Tingkat : II (Dua)
Pengajar : Tim Dosen
Hari, Tanggal : Selasa, 19 Maret 2019
Waktu Ujian : 120 menit
Sistem Ujian : Tutup Buku

PILIHAN GANDA
Nomor 1-20, bobot masing-masing soal 2 poin
1. Properti dari sebuah entitas atau relasi dalam basis data disebut....
a. Atribut
b. Asosiasi
c. Komponen
d. Baris

2. Berikut adalah ciri dari penerapan aplikasi dengan pendekatan File-Based Systems, kecuali ....
a. Setiap program yang berjalan memproses datanya sendiri
b. Memungkinkan data yang sama dikelola oleh aplikasi yang berbeda
c. Data disimpan secara terpisah dan independen terhadap aplikasi
d. Aplikasi yang dibangunan bertujuan untuk memproses fungsi kueri yang spesifik

3. Sekumpulan program aplikasi yang berjalan dan melakukan interasi dengan basis data disebut....
a. Database
b. Database Management System (DBMS)
c. Database Application
d. Database Systems

4. Pada Lingkungan DBMS, terdapat satu komponen yang menjembatani antara mesin dengan manusia
adalah....
a. Software
b. Procedures
c. Data
d. Application

5. Pernyataan-pernyataan di bawah ini benar, kecuali....


a. Urutan atau susunan kolom dari suatu relasi tidak ada pengaruhnya
b. Setiap tuple harus unik
c. Primary key merupakan candidate key yang terpilih dan menjadikan suatu tuple menjadi unik
d. Alternate key merupakan candidate key yang terpilih dan menjadikan suatu tuple menjadi unik

6. Yang dimaksud dengan entity constraint dalam relational database adalah ....
a. Setiap tuple harus tidak duplikat
b. Setiap kolom dalam suatu relasi tidak boleh sama
c. Atribut primary key harus memiliki nilai

102
d. Aturan-aturan tambahan yang didefinisikan karena kebutuhan bisnis proses

7. Tabel dinamis yang dihasilkan berdasarkan operasi dari satu atau beberapa table dalam database
dan tidak perlu ada di dalam database disebut....
a. Entitas
b. Views
c. Relations
d. SQL

Untuk soal nomor 8 dan 9, perhatikan gambar di bawah ini!

8. Atribut yang merupakan atribut komposit adalah...


a. Nama
b. Jalan
c. Umur
d. TglLahir

9. Atribut yang merupakan atribut turunan adalah...


a. Nama
b. Jalan
c. Umur
d. TglLahir

10. Suatu himpunan dari nilai yang memungkinkan dari satu atau beberapa atribut disebut...
a. Intension
b. Degree
c. Values
d. Domain

CarReg hireDate Make model custNo custName outletNo outletLoc


MS34 0GD 14/05/03 Ford Focus C100 Smith, J 01 Bearsden
MS34 0GD 15/05/03 Ford Focus C201 Hen, P 01 Bearsden
NS34 TPR 16/05/03 Nissan Sunny C100 Smith, J 01 Bearsden
MH34 BRP 14/05/03 Ford Ka C313 Blatt, O 02 Kelvinbridge

103
MH34 BRP 20/05/03 Ford Ka C100 Smith, J 02 Kelvinbridge
MD5 10PQ 20/05/03 Nissan Sunny C295 Pen, T 02 Kelvinbridge

11. Berdasarkan tabel di bawah, manakah pernyataan yang salah


a. model -> make
b. custName -> model
c. outletLoc -> outletNo
d. carReg, custNo -> hireDate

12. Pernyataan berikut yang tidak benar terkait dengan normalisasi data adalah…
a. Dilakukan dengan teknik bottom-up
b. Dapat menghemat ruang penyimpanan
c. Menghilangkan adanya anomali pada basis data
d. Proses query menjadi lebih mudah

13. Berikut merupakan entitas yang memiliki hubungan bersifat one-to-one adalah…
a. Negara – Ibukota
b. Departemen – Pegawai
c. Pelanggan – Transaksi
d. Produk – Pemasok

14. Yang bisa dilakukan dengan ALTER TABLE kecuali…


a. Menambah kolom baru
b. Menambah baris baru
c. Menghapus Batasan
d. Mengubah Batasan

15. Batasan yang mengatur tentang nilai suatu kolom berdasarkan kolom lain adalah…
a. Referential integrity
b. Entity integrity
c. Domain constraint
d. Required data

16. Jika kita ingin mengimplementasikan suatu kolom yang bertipe karakter dengan data kosong, maka
kita menggunakan nilai…
a. “ ”
b. “NULL”
c. ‘NULL’
d. NULL

17. kita ingin menyimpan data waktu kedatangan tamu di suatu hari, maka kita menggunakan tipe data…
a. DATE
b. DATETIME
c. TIME
d. DATE and TIME

104
18. Yang merupakan bukan kelemahan view adalah…
a. Perubahan di tabel dasar tidak langsung terlihat di view
b. Performa dari view bisa kurang bagus
c. Memungkinkan perubahan tampilan dari database
d. Kompleksitas query tidak dapat dikontrol

19. Perintah untuk menghapus semua data yang ada di tabel transaksi adalah…
a. Delete from transaksi;
b. Delete * from transaksi;
c. Drop table transaksi;
d. Drop table * transaksi;

20. Salah satu tugas Database Designers pada tahap desain basis data secara konseptual adalah....
a. Mengidentifikasi karakteristik data yang digunakan dalam proses bisnis organisasi (jawaban)
b. Mengatur sumber daya data yang digunakan dalam proses bisnis
c. Mengimplementasikan basis data dalam sebuah DBMS
d. Membuat aplikasi/program yang digunakan untuk mengakses basis data

SOAL ESAI
Soal nomor 21-23, bobot soal 10 poin
21. Sebutkan dan jelaskan limitasi/kelemahan aplikasi yang menggunakan pendekatan File- based
dalam mengelola data dan bagaimana kelemahan tersebut dapat dihindari dengan pendekatan
database!
22. Sebutkan tujuan dari pembuatan views!
23. Buatlah definisi tabel yang dapat digunakan untuk menyimpan data berikut.
Perkuliahan Hari Senin, 14 Januari 2019, Sesi 2
Kehadiran Dosen
Jam Masuk : 10:15:37
Jam Pulang : 12:42:39

Lama Perkuliahan : 2 Hours, 27 Minutes


Status Perkuliahan : Jadwal Regular
Keterangan Absensi : Anda sudah melakukan absen ke-2

Pokok Bahasan : Introduction to database system


Uraian Materi : Introduction to database system
Komentar :

Kehadiran Mahasiswa

Mahasiswa Hadir : 35 Mahasiswa


Mahasiswa Sakit : 0 Mahasiswa
Mahasiswa Ijin : 0 Mahasiswa Mahasiswa
Tidak Ijin : 1 Mahasiswa

105
24. Sebuah toko akan membuat basis data berdasarkan sumber data dari kumpulan order form yang ada
di toko tersebut. Anda diminta untuk membuat basis data berdasarkan form tersebut dengan
mengikuti kaidah normalisasi (UNF, 1NF, 2 NF dan 3NF).

Order Form

Date :
Order No : 1801 03/14/2019
Costumer No : 9876
Costumer Name : John Doe
CostumerAddress : Jalan Sigma No.19
City-Country : Jakarta, Indonesia

Product No Description Quantity Unit Price


A123 Pensil 200 Rp 1.500,-
B234 Penghapus 100 Rp 1.000,-
C345 Buku Tulis 300 Rp 2.000,-

25. Perhatikan beberapa tabel yang ada di bawah ini

Pelanggan
idPelanggan namaDepan namaBelakang kota negara telepon
1 Maria Anders Berlin Germany 030-0074321
2 Ana Trujillo Mexico Mexico (5) 555-4729
3 Antonio Moreno London UK (171) 555-7788
4 Thomas Hardy Glasgow UK (171) 555-2340
5 Andi Maulana Depok Indonesia +628568431209

Order
idOrder tanggalOrder nomorOrder idPelanggan
1 1/2/2019 12:00:00 542378 3
2 1/15/2019 10:00:00 542379 1
3 1/16/2019 09:00:00 542380 1
4 2/17/2019 11:00:00 542381 2
5 2/18/2019 14:00:00 542382 4

Order Item
idOrderItem idOrder idProduk Kuantitas
1 1 11 20
2 1 12 40
3 1 13 10
4 2 11 10
5 2 14 15
6 3 14 20
7 3 15 20

106
8 3 16 20
9 4 12 25
10 4 16 10
11 4 17 10
12 5 13 20
13 5 14 25
14 5 17 25

Produk
idProduk namaProduk idSupplier hargaPerUnit
11 VegetableOils 1 18.000
12 OliveOils 1 19.000
13 AniseedSyrup 1 10.000
14 ChefAnton’sCajunSeasoning 2 22.000
15 Grandma’sBoysenberrySpread 3 25.000
16 ChefAnton’sGumboMix 2 21.350
17 UncleBob’sDriedPears 3 30.000

Supplier
idSupplier namaPerusahaan namaKontak Kota negara telepon fax
1 Ceria Liquids Sahid Jakarta Indonesia 021- 021-
8403241 8403241
2 New Cajun Bryan New USA - -
Delights Orleans
3 Grandma Melly Melbourne Australia - -
Homestead

Tuliskan DML untuk menampilkan dan menginput informasi sebagai berikut:


a) Tampilkan nama produk, nama perusahaan supplier, jumlah (kuantitas) produk, dan harga total
per produk yang dibeli oleh Pelanggan Antonio Moreno
b) Update telepon dan fax untuk idSuplier = 2, dengan telepon 1-504-930783 dan fax 1-504-930784
c) Pelanggan baru seorang koki bernama Deni Martin yang berasal dari kota Jayapura melakukan
order sebanyak dua kali dengan rincian sebagai berikut:
I. Order pertama pada tanggal 2/19/2019 11:50:00 dengan nomor order 542383, membeli
Grandma’s Boysenberry Spread sebanyak 15 jars
II. Order kedua pada tanggal 2/20/2019 11:50:00 dengan nomor order 542384, membeli
Uncle Bob’s Dried Pears sebanyak 20 pack dan Aniseed Syrup sebanyak 25 bottles

107
PEMBAHASAN UTS GASAL 2018/2019
BASIS DATA

PILIHAN GANDA
1 A 6 C 11 B 16 D
2 B 7 B 12 A 17 C
3 C 8 A 13 D 18 C
4 A 9 B 14 D 19 A
5 D 10 D 15 A 20 C

ESAI
21. Keterbatasan pada File Based System :
▪ Pemisahan dan isolasi data
▪ Jika data dibatasi pada sejumlah file terpisah, maka akan lebih sukar untuk mendapatkan data
yang seharusnya tersedia.
▪ Duplikasi data
▪ Duplikasi akan menyebabkan pemborosan, Pemborosan waktu dan biaya untuk mencari data
karena harus dilakukan lebih dari sekali. Duplikasi juga dapat mendorong kearah hilangnya
integritas data; dengan kata lain tidak ada konsistensi data.
▪ Ketergantungan Program-Data
▪ Format file yang tidak sesuai
▪ Fixed Query pada program aplikasi

Hal tersebut dapat dihindari dengan pendekatan database Fasilitas pendekatan ini:
▪ Membagikan kumpulan data yang berhubungan yang di rancang untuk memenuhi kebutuhan
informasi dari suatu organisasi
▪ System Catalog(MetaData) untuk memberikan deskripsi data yang memungkinkan program data
independence
▪ Data secara logically terkait yang terdiri dari entitas, atribut, dan hubungan informasi organisasi
▪ Data Definition Language(DDL), permits untuk spesifikasi tipe data, struktur, dan
batasan(constraints)
▪ Data Manipulation Language(DML) untuk fasilitas general query (query language) dari data
▪ Menyediakan Akses Kontrol ke DataBase, seperti :
o Security System
o Integrity System
o Concurrency Control System
o Recovery Control
o User-Accessible Catalog

Keuntungan :
o Mengontrol duplikasi data
o Konsistensi data
o Penggunaan data secara bersama-sama
o data yang sama memiliki informasi yang banyak
o Pengembangan data yang sudah terintegritas

108
o Pengembangan keamanan data
o Standard yang lebih jelas
o Ekonomis
o Konflik kebutuhan dapat di seimbangkan
o Kemampuan akses dan respon yang lebih cepat
o Meningkatkan produktifitas
o Mempermudah maintenances
o Meningkatkan concurrency
o Meningkatkan kemampuan backup

22. Tujuan Views


▪ Menyajikan mekanisme keamanan yang powerful dan fleksibel dengan menyembunyikan bagian
database pada pengguna tertentu.
▪ Mengijinkan pengguna untuk mengakses data dengan cara yang disesuaikan, sehingga data yang
sama dapat dilihat oleh pengguna yang berbeda dengan cara yang berbeda, pada waktu yang
bersamaan.
▪ Dapat menyederhanakan operasi kompleks pada relation dasar.
▪ Perkuliahan

23. Perkuliahan
Field Type Data Field Size
Hari VARCHAR 10
Tanggal DATE
Jam TIME
Sesi CHAR 1

Kehadiran Dosen
Field Type Data Field Size Keterangan
kodeKD VARCHAR 5 Primary Key
idDosen VARCHAR 5 Foreign Key
NamaDosen VARCHAR 30 NOT NULL
JamMasuk TIME 30 NOT NULL
JamPulang TIME 15 NOT NULL
StatusPerkuliahan VARCHAR NOT NULL
KetAbsensi VARCHAR NOT NULL
PokokBahasan VARCHAR NOT NULL
UraianMateri VARCHAR NOT NULL
Komentar VARCHAR

Kehadiran Mahasiswa
Field Type Data Field Size Ket
KodeKM VARCHAR 5 Primary Key
MhsHadir Integer NOT NULL
MhsSakit Integer NOT NULL

109
MhsIjin Integer NOT NULL
MhsTidakIjin Integer NOT NULL

24. 1NF
Cust fName lName Address City Country Order Date Product Product Price Qty
No No No
9876 John Doe Jl.Sigma JKT IDN 1801 03/1 A123 Pensil Rp1500 200
No.19 4/19
9876 John Doe Jl.Sigma JKT IDN 1801 03/1 B234 Penghapus Rp1000 100
No.19 4/19
9876 John Doe Jl.Sigma JKT IDN 1801 03/1 C345 BukuTulis Rp2000 300
No.19 4/19

2NF
Cust
fName lName Address City Country orderNo Date ProductNo Qty
No
Jl.Sigma
9876 John Doe JKT IDN 1801 03/14/19 A123 200
No.19
Jl.Sigma
9876 John Doe JKT IDN 1801 03/14/19 B234 100
No.19
Jl.Sigma
9876 John Doe No.19 JKT IDN 1801 03/14/19 C345 300

ProductNo Product Price


A123 Pensil Rp1.500
B234 Penghapus Rp1.000
C345 BukuTulis Rp2.000

3NF
Costumer
CustNo fName lName Address City Country
9876 John Doe Jl.Sigma No19 JKT IDN

Order
OrderNo Date CustNo
1801 03/14/19 9876

Product
ProductNo Product Price
A123 Pensil Rp1.500
B234 Penghapus Rp1.000
C345 BukuTulis Rp2.000

110
Order Item
IdOrderItem OrderNo ProductNo Qty
1 1801 A123 200
2 1801 B234 100
3 1801 C345 300

25.
a. SELECT p.namaProduk, s.namaPerusahaan, o.Kuantitas, p.hargaPerUnit*o.kuantitas AS
totalharga
FROM Produk p, Supplier s, OrderItem o, Order c
WHERE p.idProduk=o.idProduk AND p.idSupplier=s.idSupplier AND o.idOrder=c.idOrder AND
c.idPelanggan='3';

b. UPDATE Supplier
SET telepon='1-504-930783' , fax='1-504-930784'
WHERE idSupplier='2';

c. INSERT INTO Pelanggan


VALUES(‘6’,’Deni’,’Martin’,’Jayapura’,’Indonesia’,NULL);
INSERT INTO Order
VALUES(‘6’,’2/19/2019 11:50:00’,’542383’,’6’),
(‘7’,’2/20/2019 11:50:00’,’542384’,’6’);

INSERT INTO OrderItem


VALUES(‘15’,’6’,’15’,15),
(‘16’,’7’,’17’,20),
(‘17’,’7’,’13’,25);

111
UJIAN TENGAH SEMESTER GASAL TAHUN AKADEMIK 2019/2020
Mata Kuliah : Basis Data
Tingkat : II (dua)
Dosen : Tim Dosen Prodi D4 Statistika
Hari/Tanggal : Selasa / 27 Oktober 2020
Waktu : 120 menit
Sistem Ujian : Tutup buku dan hanya boleh memakai kalkulator

PILIHAN GANDA
Nomer 1-20, bobot masing-masing soal 2 poin
1. Di antara atribut berikut ini, atribut yang paling tepat digunakan sebagai primary key adalah…
a. Nama Lengkap
b. Tanggal lahir
c. Email
d. Alamat

2. Sebuah tabel disebut memenuhi bentuk 1st NF jika tabel tersebut tidak terdapat…
a. Determinan
b. Repeating grups
c. Nilai null pada primary key
d. Functional dependencies

3. Banyaknya atribut dari sebuah entitas atau relasi dalam basis data disebut…
a. Atribut
b. Degree
c. Tuple
d. Record

4. Berikut yang tidak termasuk komponen dari lingkungan Database Management System adalah…
a. Softwere
b. Hardwere
c. Relation
d. Peoplz

5. Sebuah program aplikasi yang berjalan dan berintegrasi dengan basis data pada suatu titik saat
dijalankan disebut…
a. Database
b. Database Management System (DBMS)
c. Database Application
d. Database Systems

6. Membuat sebuah program aplikasi yang mengakses database (untuk mengambil, menambah,
memperbaharui, tau menghapus data) merupakan peran dari…
a. Application Programmers
b. Database Administrator
c. Aplication Designers

112
d. Database Designer

7. Berikut kekurangan dari penyimpanan dengan file-file approach, kecuali…


a. Ketergantungan antara program dan data
b. Tambahan biaya untuk perangkat keras yang digunakan
c. Tambahan biaya dan waktu untuk mengimput data lebih dari satu kali
d. Penyimpanan data terpisah dan terisolasi satu sama lain

8. Manakah dari pernyataan dibawah ini yang menjelaskan tentang primary key dengan tepat?
a. Primary key adalah field pertama dalam suatu record database
b. Primary key adalah data utama yang harus ada pada DBMS
c. Primary key adalah field yang menggunakan tipe data otomatis
d. Primary key digunakan untuk menentukan suatu nilai unik untuk mengidentifikasi record

9. Perhatikan data pada atribut A, B, C dibawah ini :


A B C
1 1 1
1 2 1
2 1 1

Berdasarkan data di atas, jika terdapat sebuah hubungan antar atribut {A,B} - > {C} maka hubungan
antar atribut tersebut bersifat:
a. Full function dependency
b. Partial dependency
c. Transitive dependency
d. Tidak ada dependency

10. Sintak mana yang tepat untuk membuat tabel?


a. CREATE PEGAWAI TABLE ( b. CREATE PEGAWAI TABLE {
NoPeg INT(3), NoPeg INT(3),
NamaPeg VARCHAR(50), NamaPeg VARCHAR(50),
Pekerjaan VARCHAR(20), Pekerjaan VARCHAR(20),
TanggalKontrak DATE,};
TanggalKontrak DATE,);
c. CREATE TABLE PEGAWAI ( d. A, B, C Benar
NoPeg INT(3),
NamaPeg VARCHAR(50),
Pekerjaan VARCHAR(20),
TanggalKontrak DATE );
]

11. Bagaimana cara menambahkkan kolom Alamat dan TTL pada tabel PEGAWAI.?
a. ALTER TABLE PEGAWAI
ADD Alamat VARCHAR 100,
TTL Date;
b. ALTER TABLE PEGAWAI
ADD (Alamat VARCHAR 100),
(TTL Date);
c. ALTER TABLE PEGAWAI

113
ADD (Alamat VARCHAR 100,
TTL Date);
d. ALTER TABLE PEGAWAI
ADD (Alamat (VARCHAR 100),
TTL (Date);

12. Sintak mana yang tepat untuk meng-insert dua baris dibawah ini ke tabel PEGAWAI!
NoPeg NamaPeg Pekerjaan TanggalKontrak

31 Adi Pengawas Gudang 14-02-2018

32 Bayu Staf Pengiriman 22-04-2018

a. INSERT INTO PEGAWAI


(31, ‘Adi’, ‘Pengawas Gudang’, ’14-02-2018’),
(32, ‘Bayu’, ‘Staf Pengiriman’, ’22-04-2018’);

b. INSERT INTO TABLE PEGAWAI VALUES


(31, ‘Adi’, ‘Pengawas Gudang’, ’14-02-2018’),
(32, ‘Bayu’, ‘Staf Pengiriman’, ’22-04-2018’);

c. INSERT INTO PEGAWAI VALUES


(31, ‘Adi’, ‘Pengawas Gudang’, ’14-02-2018’),
(32, ‘Bayu’, ‘Staf Pengiriman’, ’22-04-2018’);

d. INSERT INTO PEGAWAI VALUES


(31, ‘Adi’, ‘Pengawas Gudang’, ’14-02-2018’,
32, ‘Bayu’, ‘Staf Pengiriman’, ’22-04-2018’);

13. Berikut adalah Aggregate function yang didukung oleh SQL, kecuali :
a. SUM b. VARIANCE c. COUNT d. MAX

14. Subquery tidak mungkin muncul di clausa…


b. Select b. From c. Where d. Group by

15. Yang boleh muncul di select tanpa diikuti clausa group by kecuali :
a. Nama kolom saja
b. Fungsi agregat saja
c. Nama kolom dan fungsi agregat
d. Nama kolom dan konstanta

16. Operator mana yang digunakan untuk melakukan pencocokan pola?


a. BETWEEN operator
b. EXISTS operator
c. DISTINCT operator
d. LIKE operator

114
17. Berikut ini yang merupakan entitas yang bersifat konseptual adalah…
c. Produk b. Penjualan c. Pegawai d. Penyedia

18. Fungsi agregat boleh muncul di clausa…


d. Select b. From c. Where d. Group by

19. Untuk mengubah record menjadi bernilai pada kolom section ID menjadi NULL.
a. Drop sectionID from Section
b. Delete SectionID from Section
c. Update Section SET sectionID =NULL
d. Update Section SET sectionID IS NULL

20. Perhatikan gambar berikut ini:

STUDENT Name StudentNumber Class Major

Smith 17 1 CS

Brown 8 2 CS

COURSE CourseName CourseNumber CreditHours Departmen

Data Structures CS3320 3 CS

Discrete Math MATH2410 4 MATH

SECTION SectionID StudentNumber Semester Year Instructur

85 MATH2410 Fall 98 King

112 CS3320 Fall 98 Anderson

Grade_REPORT StudentNumber SectionIdentifier Grade

17 112 B

8 85 A

STUDENT CourseNumber Prereq_Number

CS3380 CS3320

Mana yang pasti benar


a. Insert into grade_report values (17,112,’B’)
b. Insert into grade_ report values (17,85,B)
c. Insert into grade_report (Studentnumber, sectionidentifier) values
(17,112)
d. Insert into grade_report values (17,85,’B’)

115
SOAL ESAI
21. Perhatikan tabel kunjungan pasien di bawah ini
No TglKunjungan NoPas UmurPas AlmtPas NoKlinik JenisKlinik Diagnosa

J001 2/1/2020 P1 35 Jatinegara K1 Umum Gejala Flu

J001 2/1/2020 P1 35 Jatinegara K2 THT Radang telimga

J002 10/1/2020 P2 17 Tebet K2 THT Sinusitis

J003 13/1/2020 P3 27 Cawang K3 Obgyn Periksa


Kehamilan

Pertanyaan berdasarkan data pada tabel di atas:


a. Tentukan function dependency dari tabel di atas. (10 poin)
b. Lakukan dekomposisi agar tabel di atas memenuhi bentuk normal yang ketiga (3st NF) (15 poin)

22. Berdasarkan tabel pada soal nomer 20, buat perintah SQL untuk mengubah course name yang di ajar
King pada section 85 menjadi “Discrete Mathematic”. (10 poin)
23. Sebutkan dan jelaskan kelebihan da kelemahan dari peenggunaan Database Management System! (10
poin)
24. Diberikan dua tabel sebagai berikut :
Nama Tabel: Location

Nama Tabel : Countries


country_id country_name region_id

country_id country_name region_id


AR Argentina 2
AU Australia 3
BE Belgium 1

116
BR Brazil 2
CA Canada 2
CH Switzerland 1
CN China 3
DE Germany 1
DK Denmark 1
EG Egypt 4
FR France 1
HK HongKong 3
IL Israel 4
IN India 3
IT Italy 1
JP Japan 3
KW Kuwait 4
MX Mexico 2
NG Nigeria 4
NL Netherlands 1
SG Singapore 3
UK United Kingd 1
US United State 2
ZM Zambia 4
ZW Zimbabwe 4

Berdasarkan tabel Locations dan Countries diatas


a. Tuliskan sintak SQL untuk menampilkan jumlah locations untuk setiap negara dan tuliskan
outputnya dengan format di bawah ini (10 poin)
country_id country_name region_id number_of_locations
b. Tuliskan sintak untuk menampilkan jumlah baris yang tidak memiliki nilai pada kolom
state_province ! (5 poin)

117
PEMBAHASAN SOAL UTS GENAP 2019/2020 BASDAT

PILIHAN GANDA
1. Tidak ada yang tepat
2. B
3. B
4. C
5. C
6. A
7. D
8. D
9. A
10. D
11. A
12. C
13. B
14. A
15. D
16. D
17. B
18. A
19. B
20. D

ESSAY
21.
a. Tabel kunjungan pasien
No TglKunjungan NoPas UmurPas AlamatPas NoKlinik JenisKlinik Diagnosa

J001 2/1/2020 P1 35 Jatinegara K1 Umum Gejala Flu

J001 2/1/2020 P1 35 Jatinegara K2 THT Radang


telimga

J002 10/1/2020 P3 17 Tebet K2 THT Sinusitis

J003 13/1/2020 P2 27 Cawang K3 Obgyn Periksa


Kehamilan

Function Dependency
No → TglKunjungan, NoPas, NoKlinik, Diagnosa NoPas à UmurPas, AlamatPas
Noklinik → Jenisklinik
No, NoPas → Noklinik, Diagnosa

118
b. 1NF
No TglKunjungan NoPas UmurPas AlmtPas NoKlinik JenisKlinik Diagnosa

J001 2/1/2020 P1 35 Jatinegara K1 Umum Gejala Flu

J001 2/1/2020 P1 35 Jatinegara K2 THT Radang


telimga

J002 10/1/2020 P2 17 Tebet K2 THT Sinusitis

J003 13/1/2020 P3 27 Cawang K3 Obgyn Periksa


Kehamilan

2NF
NoKlinik JenisKlinik

K1 Umum

K2 THT

K2 THT

K3 Obgyn

3NF
Pasien
NoPas UmurPas AlmtPas Diagnosa

P1 35 Jatinegara Gejala Flu

P1 35 Jatinegara Radang
telimga
P2 17 Tebet Sinusitis

P3 27 Cawang Periksa
Kehamilan

Poliklinik
NoKlinik JenisKlinik

K1 Umum

K2 THT

K2 THT

K3 Obgyn

119
Kunjungan
No TglKunjungan NoKlinik

J001 2/1/2020 K1

J001 2/1/2020 K2

J002 10/1/2020 K2

J003 13/1/2020 K3

Diagnosa
IdDiagnosa Diagnosa

1 Gejala Flu

1 Radang telimga

2 Sinusitis

3 Periksa
Kehamilan

Rekam Medis
No TglKunjungan NoPas UmurPas AlmtPas NoKlinik JenisKlinik Diagnosa

J001 2/1/2020 P1 35 Jatinegara K1 Umum Gejala Flu

J001 2/1/2020 P1 35 Jatinegara K2 THT Radang


telimga
J002 10/1/2020 P2 17 Tebet K2 THT Sinusitis

J003 13/1/2020 P3 27 Cawang K3 Obgyn Periksa


Kehamilan

22. SELECT CourseName


FROM COURSE
WHERE CourseNumber IN ( SELECT CourseNumber FROM SECTION
WHERE Instructor='King' AND (CourseName='Discrete
Mathematic') )

23. Kelebihan DBMS :


▪ Mengontrol kelebihan data
▪ Konsistensi data
▪ Lebih banyak informasi dari jumlah data yang sama
▪ Pembagian data
▪ Mengembangkan integritas data

120
▪ Peningkatan keamanan
▪ Pelaksanaan standar
▪ Meningkatkan aksesibilitas data dan responsive
▪ Meningkatkan produktivitas
▪ Meningkatkan maintenance melalui data independen
▪ Meningkatkan jasa backup dan recovery

Kekurangan DBMS :
▪ Kompleks
▪ Ukuran yang besar
▪ Biaya mahal (Biaya tambahan hardware dan biaya pengubahan)
▪ Performa (DBMS dikembangkan untuk aplikasi umum dibandingkan untuk filebased system)
▪ Dampak kegagalan lebih tinggi

24.
a) SELECT
c.country_id AS country_id, c.country_name AS country_name,
c.region_id AS region_id, COUNT(o.country_id) AS number_of_locations
FROM
Countries c
LEFT JOIN location o on c.country_id = o.country_id GROUP BY
c.country_id
b) SELECT
STATE_PROVINCE, COUNTRY_ID
FROM locations
WHERE state_province IS NULL;

121
UJIAN TENGAH SEMESTER GASAL TAHUN AKADEMIK 2020/2021
Mata Kuliah : Basis Data
Tingkat : II (dua)
Dosen : Tim Dosen Prodi D4 Statistika
Hari/Tanggal : Selasa / 23 Maret 2021
Waktu : 60 menit
Sistem Ujian : Tutup buku

1. Tuliskan perintah SQL untuk mendapatkan hasil daftar unit kerja serta jumlah karyawan pada tiap
unit kerja

a. SELECT u.kode_unit, nama_unit, SUM(*) FROM DaftarUnit u,


DaftarKaryawan k WHERE u.kode_unit = k.kode_unit GROUP BY u.kode_unit
b. SELECT u.kode_unit, nama_unit, COUNT(*) FROM DaftarUnit u,
DaftarKaryawan k WHERE u.kode_unit = k.kode_unit GROUP BY u.kode_unit
c. SELECT u.kode_unit, nama_unit, COUNT(*) FROM DaftarUnit u,
DaftarKaryawan k WHERE u.kode_unit = k.kode_unit GROUP BY u.kode_unit,
nama_unit
d. SELECT u.kode_unit, nama_unit, COUNT(*) FROM DaftarUnit u,
DaftarKaryawan k GROUP BY u.kode_unit WHERE u.kode_unit = k.kode_unit

2. Penulisan syntax DDL yang benar adalah..


a. CREATE TABLE pinjam (noPinjam CHAR(4) PRIMARY KEY, noAnggota CHAR(7),
noBuku CHAR(8), tglPinjam date, tglKembali date);
b. ALTER TABLE pinjam (noPinjam CHAR(4) PRIMARY KEY, noAnggota CHAR(7),
noBuku CHAR(8), tglPinjam date, tglKembali date);
c. SELECT * FROM pinjam;
d. CREATE TABLE pinjam VALUES (noPinjam CHAR(4) PRIMARY KEY, noAnggota
CHAR(7), noBuku CHAR(8), tglPinjam date, tglKembali date);

3. Jika satu entity occurrence sebuah entity dapat direlasikan dengan banyak entity occurrence pada
entity lain, dan juga sebaliknya, maka relationship-nya adalah…
a. Many-to-many
b. One-to-many

122
c. One-to-one
d. Many-to-one
4. 4.

a. SELECT * FORM DaftarNama;


b. SELECT id, nama FROM DaftarNama;
c. SELECT * FROM TABLE DaftarNama;
d. SELECT * FROM DaftarNama;

5. Manakah pernyataan yang tidak benar dari ERD di bawah ini?

a. Seorang pasien dapat menjadwalkan minimal 1 appointment dan maksimal banyak appointment
b. Multiplicity pada relationship “Mempunyai” 0..1 terdiri dari cardinality adalah 0 dan participation
adalah 1
c. Participation constraint pada relationship antara Patient dan Appointment merupakan
mandatory participation
d. Ada pasien yang tidak memiliki medical history

6. Pada Integrity Constraint, apabila kita menghapus suatu data di tabel induk yang menjadi referensi
pada tabel anaknya, kemudian data pada tabel anak tersebut juga ikut terhapus, Integrity constraint
yang seperti ini disebut....
a. SET DEFAULT
b. CASCADE
c. SET NULL
d. NO ACTION

7. Bahasa SQL yang digunakan untuk mengambil dan mengupdate data disebut … dan perintah yang
termasuk adalah ...
a. Data Modification Language, CREATE, UPDATE, INSERT
b. Data Manipulation Language, SELECT, INSERT, DELETE
c. Data Modification Language, SELECT, INSERT, DELETE
d. Data Manipulation Language, UPDATE, INSERT, DROP

8. Diketahui suatu tabel: Perintah SQL untuk menampilkan informasi lengkap semua mahasiswa yang
berasal dari Jabar dan Jatim adalah...

123
a. SELECT * FROM Mahasiswa WHERE asal_daerah='Jabar', asal_daerah='Jatim';
b. SELECT * FROM Mahasiswa WHERE asal_daerah='Jabar' OR asal_daerah='Jatim';
c. SELECT * FROM Mahasiswa WHERE asal_daerah='Jabar' AND asal_daerah='Jatim';
d. SELECT * FROM Mahasiswa WHERE asal_daerah='Jabar' JOIN asal_daerah='Jatim';

9. Hasil query dari SELECT alamatKota FROM penduduk WHERE alamatKota LIKE ‘%ng’ adalah ..
a. Padangsidempuan, Padangsiantar
b. Bengkalis, Bengkulu
c. Tangerang, Bandung
d. Ngawi, Nganjuk

10. Misal P, Q, R dan S adalah atribut-atribut pada suatu tabel. Berdasarkan data yang ada pada gambar,
manakah yang disebut sebagai transitive dependency....

a. Q -> R dan R -> S


b. P -> Q dan Q -> R
c. P -> R dan R -> S
d. R -> S dan S -> Q

11.

a. PRIMARY KEY = (nip)


b. PRIMARY KEY (nip)
c. PK = (nip)
d. PK (nip)

12. Jika Database Administrator ingin mengubah sebuah atribut biasa menjadi atribut yang menjadi
FOREIGN KEY pada relasi pinjam maka syntax yang benar adalah…
a. ALTER TABLE pinjam ADD FOREIGN KEY REFERENCES anggota(noAnggota) ON
DELETE CASCADE;
b. ALTER TABLE pinjam ADD FOREIGN KEY (noAnggota) REFERENCES
anggota(noAnggota);
c. MODIFY TABLE pinjam ADD FOREIGN KEY REFERENCES anggota(noAnggota) ON
DELETE CASCADE;

124
d. ALTER TABLE pinjam ADD FOREIGN KEY (noAnggota) REFERENCES anggota ON
DELETE CASCADE;

13. Relasi (tabel) yang memenuhi bentuk normal yang pertama (1NF) adalah relasi yang TIDAK
terdapat unsur....
a. Partial Dependency
b. Functional Dependency
c. Determinan
d. Kelompok yang berulang

14. Operator yang digunakan dalam SQL untuk membandingkan nilai NULL adalah…
a. HAVING
b. IS
c. IN
d. = (EQUAL)

15. Bentuk normal yang menghilangkan partial funcional dependecies adalah...


a. 2NF
b. 3NF
c. UNF
d. 1NF

16. Saat mengisi biodata, mahasiswa boleh tidak mengisi data tentang berat badan, maka isian ini akan
disimpan ke dalam basis data dalam bentuk...
a. NULL
b. 0
c. spasi
d. "NULL"

17. Apa yang terjadi jika sintaks ini dieksekusi? DROP TABLE Ujian;
a. Tabel Ujian akan dimasukkan ke dalam kotak sampah
b. Tabel Ujian dan datanya akan dihapus
c. Data tabel Ujian akan dihapus, namun tabel Ujian masih tetap ada
d. Tabel Ujian akan dihapus, namun datanya masih tetap ada

18. Manakah dari hal-hal berikut ini yang tidak bisa diubah atau diperbarui dengan perintah UPDATE
a. Mengubah nilai semua baris pada suatu kolom
b. Mengubah baris NULL dengan suatu nilai
c. Mengubah nilai beberapa kolom
d. Mengubah tipe data suatu kolom

19. Pada perancangan basis data, bentuk normal yang ke berapa yang menjadi pertimbangan suatu
rancangan basis data dikatakan cukup...
a. 4NF
b. 3NF
c. 2NF
d. 5NF

125
20. Berikut adalah kelemahan dari sistem berbasis file, KECUALI:
a. berpeluang kehilangan integritas data antar program aplikasi
b. item data yang sama bisa mempunyai tipe data yang berbeda di antara program aplikasi
c. pengelolaan data independen antar program aplikasi
d. item data yang sama bisa mempunyai nilai data yang berbeda di antara program aplikasi

21. Diketahui suatu entity X dengan sampel data seperti pada tabel bawah ini. x1, x2, dan x3 merupakan
entity occurrence dari entity type X. Apakah jenis atribut dari Atribut2 dan Atribut3?

a. Atribut2 adalah Composite Attribute, dan Atribut3 adalah Single-valued Attribute


b. Atribut2 adalah Single-valued Attribute, dan Atribut3 adalah Multi-valued Attribute
c. Atribut2 adalah Multi-valued Attribute, dan Atribut3 adalah Single-valued Attribute
d. Atribut2 adalah Derived Attribute, dan Atribut3 adalah Multi-valued Attribute

22. Diketahui sebuah tabel Film dengan atribut judulFilm dan durasi. Apa yang akan ditampilkan dari
pernyataan SQL di bawah ini?

a. Daftar film dengan durasi yang paling pendek


b. Daftar semua film
c. Daftar film dengan durasi yang paling lama
d. Daftar semua film kecuali film dengan durasi paling pendek

23. Tuliskan perintah SQL untuk mendapatkan hasil daftar karyawan yang bekerja di unit Marketing:

a. SELECT id, nama, umur FROM DaftarUnit u, DaftarKaryawan k WHERE u.kode_unit = k.kode_unit
AND u.kode_unit = 'C01'
b. SELECT u.id, k.nama, k.umur FROM DaftarUnit u, DaftarKaryawan k WHERE u.kode_unit =
k.kode_unit AND u.kode_unit = 'C01'
c. SELECT id, nama, umur FROM DaftarUnit u, DaftarKaryawan k WHERE u.kode_unit = k.kode_unit

126
d. SELECT u.kode_unit, nama_unit, COUNT(*) FROM DaftarUnit u, DaftarKaryawan k WHERE
u.kode_unit = k.kode_unit GROUP BY u.kode_unit

24. Penulisan relation instance yang benar dari Tabel Pinjam sebagai berikut, kecuali...

a. {noPinjam:P001, noAnggota:0123456, noBuku:33557711, tglPinjam:10032021,


tglKembali:17032021}
b. {noPinjam:P002, noAnggota: 0123457, noBuku: 22662312, tglPinjam: 11032021, tglKembali:
18032021}
c. {noPinjam: P003, noAnggota: 34235673, noBuku: 0123458, tglPinjam: 12032021, tglKembali:
19032021}
d. {noPinjam: P005, noAnggota: 0123460, noBuku: 85634533, tglPinjam: 14032021, tglKembali:
21032021}

25. Sebuah ER Diagram yang memuat entitas-entitas, relationship antar entitas tersebut, atribut-atribut
dalam setiap entitas, serta primary dan foreign key-nya adalah perancangan database pada tingkat
a. Schema
b. Logical
c. Physical
d. Conceptual

26. Dalam ER model dan relational model, manakah pernyataan berikut yang tidak benar?
a. Dalam satu baris data pada tabel relasional, satu atribut dapat memiliki lebih dari satu nilai
b. Dalam satu baris data pada tabel relasional, satu atribut dapat memiliki satu nilai atau nilai NULL
c. Sebuah atribut dari sebuah entity dapet merupakan gabungan (composite) beberapa atribut lain
d. Sebuah entity dapat memiliki lebih dari satu atribut

27. Keuntungan menggunakan sistem manajemen basis data adalah:


a. perfoma selalu lebih baik
b. dampak kegagalan lebih rendah
c. integritas data antar aplikasi lebih terjaga
d. kontrol terhadap redundansi data rendah

28. Pada saat melakukan query, apabila kita tidak melakukan pengurutan dengan klausa ORDER BY,
maka data akan ditampilkan secara...
a. diurutkan secara Ascending
b. sesuai urutan perintah query sebelumnya
c. Acak
d. diurutkan secara descending

127
29. Diketahui ERD sebagai berikut. Jika seorang pelanggan dapat mendaftar untuk langganan majalah
setiap tahunnya, Apakah peran atribut pelangganNo dan majalahNo pada entity Subscription?

a. Sebagai atribut primary key dan foreign key


b. Sebagai atribut foreign key
c. Sebagai derived attribute
d. Hanya atribut biasa

30. Perintah SQL “ALTER TABLE” digunakan untuk tujuan dibawah ini kecuali..
a. Menghapus sebuah record dalam sebuah tabel
b. Menambah sebuah kolom dalam sebuah tabel
c. Menambah batasan dalam sebuah tabel
d. Menghapus sebuah kolom dalam sebuah tabel

31. Bahasa SQL yang digunakan untuk mendefinisikan struktur database disebut ... dan perintah yang
termasuk adalah ...,
a. Data Driven Language, CREATE, ALTER, DROP
b. Data Definition Language, CREATE, ALTER, DELETE
c. Data Manipulation Language, SELECT, INSERT, UPDATE
d. Data Definition Language, CREATE, DROP, ALTER

32. Diketahui pernyataan untuk membuat sebuah tabel database sebagai berikut. Manakah pernyataan
berikut yang benar?

a. Jika dilakukan update data pada tabelB, maka baris data pada tabelA yang bersesuaian juga akan
ikut berubah
b. Jika dilakukan penghapusan data pada tabelA, maka baris data pada tabelB yang bersesuaian
akan tetap atau tidak berubah
c. Jika dilakukan penghapusan data pada tabelA, maka baris data pada tabelB yang bersesuaian juga
akan ikut terhapus
d. Jika dilakukan update data pada tabelA, maka baris data pada tabelB yang bersesuaian juga akan
ikut berubah

128
33. Manakah urutan yang benar dari sebuah pernyataan SQL?
a. SELECT, GROUP BY, WHERE, ORDER BY, HAVING
b. SELECT, WHERE, GROUP BY, HAVING, ORDER BY
c. SELECT, HAVING, WHERE, GROUP BY, ORDER BY
d. SELECT, WHERE, HAVING, ORDER BY, GROUP BY

34. Ciri dari model basis data relasional adalah, kecuali...


a. data dalam suatu relasi dikelompokkan dalam atribut
b. tiap atribut memiliki domain data yang sama
c. data disimpan dalam relasi berbentuk tabel
d. tiap relasi dapat memiliki primary key lebih dari satu

35. Perintah pada command line psql yang digunakan untuk melihat daftar tabel, pindah database, dan
melihat daftar database secara berturut-turut adalah..
a. \c, \dt namadatabase, \l
b. \dt, \c, \l namadatabase
c. \dt, \l, c namadatabase
d. \dt, \c namadatabase, \l

36. Perintah SQL yang digunakan untuk menghitung jumlah penduduk dari tabel penduduk menurut
kabupaten/kota adalah
a. SELECT idPenduduk, SUM (idPenduduk) FROM penduduk GROUP BY kabkota;
b. SELECT kabkot FROM Penduduk GROUP BY idPenduduk;
c. SELECT idPenduduk, COUNT (kabkot) FROM penduduk GROUP BY kabkot;
d. SELECT kabkot, COUNT (idPenduduk) FROM penduduk GROUP BY kabkota;

37. Tentukan atribut yang dapat menjadi candidate key dari tabel penduduk berikut serta berapa degree
dan kardinalitasnya secara berurutan..

a. tglLahir, 8, dan 5
b. NIK, 5, dan 8
c. noHP, 5, dan 8
d. NIK, 8, dan 5

38. Dari gambar berikut, atribut minimal yang dapat digunakan sebagai primary key adalah....

129
a. B
b. A
c. A,B
d. A, C

39. Suatu tabel memiliki atribut A1, A2, A3, A4, A5 diketahui memiliki functional dependencies A1 ->
A2, A3, A4, A5 dan A4 -> A5. Tabel ini dalam bentuk normal ke....
a. 1NF
b. 2NF
c. 4NF
d. 3NF

40. Perintah SQL Create View untuk melihat detil dokter yang berada pada RS cabang kota Semarang
adalah..
a. CREATE VIEW doktersemarang AS SELECT * FROM cabang where kotaRS
=’Semarang’;
b. CREATE VIEW doktersemarang AS SELECT * FROM dokter where kotaRS
=’Semarang’;
c. CREATE VIEW doktersemarang BY SELECT * FROM dokter where kotaRS
=’Semarang’;
d. CREATE VIEW AS doktersemarang SELECT * FROM dokter where kotaRS
=’Semarang’;

41. Pernyataan berikut yang TIDAK BENAR terkait dengan normalisasi data adalah
a. Dapat menghemat ruang penyimpan
b. Dilakukan dengan teknik bottom-up
c. Menghilangkan adanya anomali pada basis data
d. Proses query menjadi lebih mudah

42. Sebuah perusahaan mempunyai beberapa lokasi parkir yang dapat digunakan oleh pegawai-
pegawainya yang mempunyai mobil. Setiap lokasi parkir dibagi menjadi beberapa zona parkir
didalamnya. Setiap pegawai hanya dapat menggunakan satu zona untuk memarkir mobilnya. Semua
proses di atas akan dicatat dalam sebuah database.Multiplicity pada ERD di bawah ini yang paling
tepat untuk kebutuhan perusahaan di atas adalah

a. A = 1..1, B = 1..*, C = 0..1, D = 0..*


b. A = 1..*, B = 1..1, C = 0..*, D = 1..1
c. A = 1..1, B = 1..1, C = 1..1, D = 1..*
d. A = 1..*, B = 0..*, C = 0..1, D = 1..*

43. Dari gambar berikut, manakah yang menunjukkan full functional dependency

130
a. B -> C, A
b. B, C -> A
c. A, C -> B
d. A, B -> C dan B -> A

44. Manakah pernyataan SQL yang tepat untuk mengambil daftar mahasiswa dengan alamat KTP di
Tangerang dan Bogor tetapi domisilinya di Jakarta?
a. SELECT nama, ktp, domisili FROM mahasiswa WHERE ktp = ‘Tangerang’ OR
ktp = ‘Bogor’ OR domisili = ‘Jakarta’;
b. SELECT nama, ktp, domisili FROM mahasiswa WHERE ktp = ‘Tangerang’ AND
ktp = ‘Bogor’ AND domisili = ‘Jakarta’;
c. SELECT nama, ktp, domisili FROM mahasiswa WHERE ktp = ‘Tangerang’ AND
ktp = ‘Bogor’ OR domisili = ‘Jakarta’;
d. SELECT nama, ktp, domisili FROM mahasiswa WHERE ktp = ‘Tangerang’ OR
ktp = ‘Bogor’ AND domisili = ‘Jakarta’;

45. Jika diketahui relational database schema adalah sebagai berikut. Manakah SQL yang paling tepat
untuk mengubah data pegawai dimana semua pegawai di department Finance (deptName =
‘Finance’) dipindahkan ke department HRD?

a. UPDATE department SET deptname = ‘HRD’ WHERE deptname = ‘Finance’;


b. UPDATE employee set deptno = (SELECT deptno FROM department WHERE
deptname = 'HRD') WHERE deptno = (SELECT deptno FROM department WHERE
deptname = 'Finance');
c. UPDATE employee set deptno = (SELECT deptno FROM department WHERE
deptname = 'HRD') WHERE deptname = 'Finance');
d. UPDATE employee set deptno = 'HRD' WHERE deptno = 'Finance'; UPDATE
department set deptname = 'HRD' WHERE deptname = 'Finance';

46. Manakah pernyataan yang tidak benar tentang entity ERD di bawah ini?
a. Objek-objek yang memiliki atribut-atribut yang sama dikelompokan sebagai entity type
b. Strong dan weak entity type mempunyai primary keys untuk mengidentifikasi entity occurrence
secara unik
c. Strong entity type keberadaannya independent
d. Setiap weak entity harus direlasikan dengan entity lain

131
47.

a. SELECT * FORM DaftarNama;


b. SELECT id, nama FROM DaftarNama;
c. SELECT * FROM DaftarNama WHERE umur > 18;
d. SELECT * FROM DaftarNama WHERE umur = 19;

48. Jika terdapat foreign key dalam sebuah relasi maka nilai foreign key harus cocok dengan nilai
candidate key dari beberapa tuple pada relasi asalnya disebut..
a. Referential Integrity
b. User Defined Integrity
c. Entity Integrity
d. Domain Integrity

49. Tabel berikut adalah hasil join dari perintah query..

a. SELECT d.idDokter, d.alamatDokter, rs.idRS, rs.alamat RS FROM dokter


d, rs FULL JOIN rs ON alamatDokter = alamatRS;
b. SELECT d.idDokter, d.alamatDokter, rs.idRS, rs.alamat RS FROM dokter
d, rs RIGHT JOIN rs ON alamatDokter = alamatRS;
c. SELECT d.idDokter, d.alamatDokter, rs.idRS, rs.alamat RS FROM dokter
d, rs INNER JOIN rs ON alamatDokter = alamatRS;
d. SELECT d.idDokter, d.alamatDokter, rs.idRS, rs.alamat RS FROM dokter
d, rs LEFT JOIN rs ON alamatDokter = alamatRS;

50. Berikut yang bukan merupakan sintaks DDL adalah:


a. ALTER TABLE
b. CREATE TABLE
c. DROP TABLE
d. DELETE TABLE

132
HALO SEMUA! UNTUK PEMBAHASAN UTS BASIS DATA 2020/2021 BELUM BISA KAMI
TAMPILKAN KARENA BEBERAPA ALASAN. UNTUK BEBERAPA MATKUL YANG
TERCANTUMKAN PEMBAHASANNYA, DISARANKAN UNTUK TIDAK DIJADIKAN PATOKAN
KARENA PEMBAHASAN INI BELUM DIVALIDASI OLEH DOSEN YANG MENGAJAR. MESKIPUN
DEMIKIAN, SEMOGA SUDAH BISA MEMBANTU TEMAN-TEMAN BELAJAR, YA. SUKSES
SEMUANYA, SEMANGAT

133
PENDUGA RASIO (RATIO ESTIMATOR)

A. DEFINISI
Penduga Rasio (𝑅𝑎𝑡𝑖𝑜 𝐸𝑠𝑡𝑖𝑚𝑎𝑡𝑜𝑟) adalah suatu metode estimasi yang memanfaatkan
perbandingan/rasio antara variabel yang diteliti (𝑦) dengan variabel bantu/pendukung (𝑥)
dimana jumlah populasi (𝑋) harus diketahui untuk meningkatkan efisiensi pendugaan parameter
populasi.

B. MANFAAT MENGGUNAKAN ESTIMASI RASIO


1. Melakukan estimasi rasio suatu variabel terhadap variabel lainnya.
Contoh : Estimasi rasio produksi padi (𝑦) terhadap luas lahan (𝑥)
2. Melakukan estimasi total, namun ukuran populasi (𝑁) tidak diketahui.
Kita tidak dapat menggunakan rumus 𝑌̂ = 𝑁𝑦̅. Namun, kita mempunyai nilai total
karakteristik untuk variabel lain, misalkan 𝑋. Dengan demikian, ukuran populasi bisa
diestimasi dengan rumus :
𝑋
𝑁=
𝑥̅
Dan estimasi total karakteristik untuk variabel yang diteliti (𝑦) adalah :
𝑋
𝑌̂ = 𝑦̅
𝑥̅
3. Estimasi rasio sering kali digunakan untuk meningkatkan presisi dari estimasi rata-rata dan
estimasi total.
4. Estimasi rasio bisa digunakan untuk melakukan adjustment dari data sampel sehingga akan
diperoleh estimasi total yang lebih akurat.
5. Estimasi rasio bisa digunakan untuk adjustment nonrespon.

C. KONDISI RATIO ESTIMATOR


1. Rasio berupa karakteristik yang sama atau berhubungan dengan periode sebelumnya. 𝑋
adalah jenis karakteristik yang sama dengan 𝑌 tetapi berasal dari periode sebelumnya.
Contoh : 𝑋 : Penduduk tahun 2010
𝑌 : Penduduk tahun 2020
2. Rasio dari dua karakteristik berbeda yang berkorelasi kuat pada periode yang sama. 𝑋 dan 𝑌
merupakan dua buah karaktertistik berbeda yang berasal dari periode yang sama dan
diketahui berkorelasi positif.
Contoh : 𝑋 : Total anggota rumah tangga (ART)
𝑌 : Total konsumsi beras
3. Rasio dari suatu set-set total. Karakteristik 𝑌 merupakan bagian (subset) dari 𝑋, (yang
diperkirakan perubahannya sebanding dengan 𝑋).
Contoh : 𝑋 : Berat sebuah jeruk
𝑌 : Kadar vitamin C dalam sebuah jeruk

D. SIFAT-SIFAT RATIO ESTIMATOR


1. Secara umum, ratio estimator adalah estimator yang bias konsisten.
Bias konsisten → semakin besar ukuran sampel, maka biasnya semakin kecil.

135
2. Jika jumlah sampel (𝑛) besar, limiting distribution dari ratio estimate akan mengikuti
distribusi normal.
3. Jika jumlah sampel (𝑛) moderate, ratio estimate mempunyai kecenderungan mengikuti
positive skewness distribution.
4. Dalam penghitungan bias, terdapat rumus untuk berbagai ukuran sampel, tetapi perkiraan
varians hanya berlaku untuk jumlah sampel berukuran besar
5. Sebagai aturan praktis, Cochran menyatakan bahwa pendekatan large sample untuk
penghitungan varians dapat digunakan jika:
a. Ukuran sampel lebih dari 30
b. Koefisien variasi (CV) dari variabel 𝑥 dan variabel 𝑦, keduanya kurang dari 10%

E. ESTIMATOR
Jika penarikan sampel dilakukan secara simple random sampling, dan nilai karakteristik 𝑦 dan 𝑥
tersedia untuk setiap unit dalam sampel dengan nilai populasi 𝑋 diketahui, maka:
𝑦̅
Estimator rasio : 𝑅̂ = 𝑥̅
Estimator rata-rata : 𝑦̅𝑅 = 𝑅̂ 𝑋̅
Estimator total : 𝑌̂𝑅 = 𝑅̂ 𝑋

F. BIAS PADA RATIO ESTIMATOR


Pada penarikan sampel acak sederhana tanpa pemulihan, penduga bias rasio 𝑅̂ adalah :
̂
𝐶𝑜𝑣(𝑅,𝑥̅ )
𝐵(𝑅̂ ) = − 𝑋̅
Tidak seperti estimator 𝑦̅ dan 𝑌̂ pada SRS, ratio estimator merupakan estimator yang bias dalam
menduga nilai 𝑌̅𝑅 dan 𝑌𝑅 .
𝑋̅
Bias pada ratio estimator disebabkan karena 𝑦̅ kita kalikan dengan sehingga 𝐸(𝑦̅𝑅 ) ≠ 𝑌̅𝑅 .
𝑥̅
Pada desain SRS :
𝑛 1 1
𝐸(𝑅̂ − 𝑅) ≈ (1 − ) 2 [𝑅𝑠𝑥2 − 𝜌(𝑥,𝑦) 𝑠𝑥 𝑠𝑦 ] = 2 [𝑅𝑣(𝑥̅ ) − 𝑐𝑜𝑣(𝑥̅ , 𝑦̅)]
𝑁 𝑛𝑋 𝑋
Kesimpulan :
Bias dari 𝑅̂ akan kecil jika :
1) Sampel size (𝑛) besar
𝑛
2) Fraksi sampling (𝑁) besar
3) 𝑋 besar
4) 𝑠𝑥 kecil
5) Correlation coefficient antara 𝑥 dan 𝑦 [𝜌(𝑥,𝑦) ] mendekati 1

G. ESTIMASI VARIANS
Varians rata-rata :
𝑛
1−𝑓 2
𝑣(𝑦̅𝑅 ) = ∑(𝑦𝑖 − 𝑅̂ 𝑥𝑖 )
𝑛(𝑛 − 1)
𝑖=1
Rumus di atas dapat dijabarkan menjadi :
𝑛 𝑛 𝑛
1−𝑓
𝑣(𝑦̅𝑅 ) = [∑ 𝑦𝑖2 − 2𝑅̂ ∑ 𝑦𝑖 𝑥𝑖 + 𝑅̂ 2 ∑ 𝑥𝑖2 ]
𝑛(𝑛 − 1)
𝑖=1 𝑖=1 𝑖=1

136
1−𝑓 2
𝑣(𝑦̅𝑅 ) = (𝑠𝑦 − 2𝑅̂ 𝑠𝑦𝑥 + 𝑅̂ 2 𝑠𝑥2 )
𝑛

Keterangan :
1
𝑠𝑦𝑥 = ∑𝑛 (𝑦 − 𝑦̅)(𝑥𝑖 − 𝑥̅ ) → sample covariance
𝑛−1 𝑖=1 𝑖
Diketahui :
∑𝑁
𝑖 (𝑦𝑖 − 𝑦
̅)(𝑥𝑖 − 𝑥̅ ) 𝑠𝑦𝑥
𝜌= =
(𝑛 − 1)𝑠𝑦 𝑠𝑥 𝑠𝑦 𝑠𝑥
Maka :
1−𝑓 2
𝑣(𝑦̅𝑅 ) = (𝑠𝑦 − 2𝑅̂ 𝜌𝑠𝑥 𝑠𝑦 + 𝑅̂ 2 𝑠𝑥2 )
𝑛
Varians rasio :
𝑣(𝑦̅𝑅 )
𝑣(𝑅̂ ) =
𝑋̅ 2
1−𝑓 2
𝑣(𝑅̂ ) = (𝑠 − 2𝑅̂ 𝑠𝑦𝑥 + 𝑅̂ 2 𝑠𝑥2 )
𝑛𝑋̅ 2 𝑦
Varians total :
𝑣(𝑌̂𝑅 ) = 𝑁 2 𝑣(𝑦̅𝑅 )
𝑁 2 (1 − 𝑓) 2
𝑣(𝑌̂𝑅 ) = (𝑠𝑦 − 2𝑅̂𝑠𝑦𝑥 + 𝑅̂ 2 𝑠𝑥2 )
𝑛

H. SELANG KEPERCAYAAN
Untuk ukuran sampel 𝑛 besar, dugaan bagi rata-rata atau total dapat diasumsikan memiliki
sebaran normal. Dengan demikian selang kepercayaan untuk penduga-penduga tersebut adalah
sebagai berikut:
Selang kepercayaan (1 − 𝛼)% bagi rasio 𝑅 adalah :
𝑃{𝑅̂ − 𝑍𝛼⁄2 𝑆𝑒(𝑅̂ ) ≤ 𝑅 ≤ 𝑅̂ + 𝑍𝛼⁄2 𝑆𝑒(𝑅̂ )} = 1 − 𝛼
Selang kepercayaan (1 − 𝛼)% bagi rata-rata 𝑌̅̂ adalah : 𝑅
𝑃 {𝑌̅̂𝑅 − 𝑍𝛼⁄2 𝑆𝑒(𝑌̅̂𝑅 ) ≤ 𝑌̅𝑅 ≤ 𝑌̅̂𝑅 + 𝑍𝛼⁄2 𝑆𝑒(𝑌̅̂𝑅 )} = 1 − 𝛼
Selang kepercayaan (1 − 𝛼)% bagi total ratio 𝑌̂𝑅 adalah :
𝑃{𝑌̂𝑅 − 𝑍𝛼⁄2 𝑆𝑒(𝑌̂𝑅 ) ≤ 𝑌𝑅 ≤ 𝑌̂𝑅 + 𝑍𝛼⁄2 𝑆𝑒(𝑌̂𝑅 )} = 1 − 𝛼

I. EFISIENSI RATIO ESTIMATOR TERHADAP SRS


Varians SRS
𝑠𝑦2
𝑣(𝑌̂𝑠𝑟𝑠 ) = 𝑁 2 (1 − 𝑓) ∙
𝑛
Varians rasio estimator
𝑁 2 (1 − 𝑓)
𝑣(𝑌̂𝑅 ) = ∙ (𝑠𝑦2 − 2𝑅̂ 𝜌𝑠𝑦 𝑠𝑥 + 𝑅̂ 2 𝑠𝑥2 )
𝑛
Relatif Efisiensi :
𝑣(𝑌̂𝑅 ) 𝑠𝑦2 − 2𝑅̂ 𝜌𝑠𝑦 𝑠𝑥 + 𝑅̂ 2 𝑠𝑥2
=
𝑣(𝑌̂𝑠𝑟𝑠 ) 𝑠𝑦2
Ratio estimator akan lebih efisien daripada SRS jika :
𝑣(𝑌̂𝑅 )
<1
𝑣(𝑌̂𝑠𝑟𝑠 )

137
𝑠𝑦2 − 2𝑅̂ 𝜌𝑠𝑦 𝑠𝑥 + 𝑅̂ 2 𝑠𝑥2
<1
𝑠𝑦2
𝑠𝑦2 − 2𝑅̂ 𝜌𝑠𝑦 𝑠𝑥 + 𝑅̂ 2 𝑠𝑥2 < 𝑠𝑦2
−2𝑅̂𝜌𝑠𝑦 𝑠𝑥 + 𝑅̂ 2 𝑠𝑥2 < 0

2𝑅̂ 𝜌𝑠𝑦 𝑠𝑥 > 𝑅̂ 2 𝑠𝑥2


𝑅̂ 𝑠𝑥
𝜌>
2𝑠𝑦
𝐶𝑉(𝑥)
𝜌>
2𝐶𝑉(𝑦)

J. PERBANDINGAN ANTARA VARIAN RASIO DENGAN SRS


Agar estimasi rasio lebih efisien dari SRS, maka :
𝑆𝑦2 + 𝑅 2 𝑆𝑥2 − 2𝜌𝑅𝑆𝑥 𝑆𝑦 < 𝑆𝑦2
𝑆𝑥
𝑅𝑆𝑥 ̅ 𝐶𝑥
𝜌> = 𝑋 =
2𝑆𝑦 𝑆𝑦 2𝐶𝑦
2 ̅
𝑌
Dengan demikian, bila :
𝐶
𝜌 > 2𝐶𝑥 maka estimasi rasio lebih efisien
𝑦
𝐶𝑥
𝜌= 2𝐶𝑦
maka kedua estimasi memiliki kesalahan sampling sama
𝐶𝑥
𝜌< 2𝐶𝑦
maka estimasi rasio kurang efisien
Dari data yang telah ada dapat dipelajari besaran dari korelasi untuk penyempurnaan
penggunaan estimasi rasio.
• Korelasi yang tinggi antara 𝑋 dan 𝑌
Korelasi yang tinggi akan sangat mempengaruhi penurunan ragam. Bila korelasi antara 𝑋
dan 𝑌 lebih dari 0,90 maka estimasi rasio akan menghasilkan akurasi yang berarti. Untuk
1
menghasilkan ragam yang sama dengan SRS, maka 𝑛𝑅𝑎𝑠𝑖𝑜 = 5 𝑛𝑆𝑅𝑆 untuk 𝜌 = 0,90 dengan
kondisi 𝐶𝑥 = 𝐶𝑦 .
• Korelasi yang rendah antara 𝑋 dan 𝑌
Bila korelasi kurang dari 0,20 kemungkinan estimasi akan meningkatkan varian,
meskipun umumnya tidak terlalu besar.

K. RATIO ESTIMATOR PADA STRATIFIED SAMPLING


Separate Ratio Estimator
Penghitungan rasio dilakukan untuk masing-masing strata
𝑦̅ℎ 𝑌̂ℎ
𝑅̂ℎ = =
𝑥̅ℎ 𝑋̂ℎ
Estimasi total :
𝐿 𝐿
𝑦̅ℎ
𝑌̂𝑅𝑠 = ∑ ∙ 𝑋 = ∑ 𝑅̂ℎ 𝑋ℎ
𝑥̅ℎ ℎ
ℎ=1 ℎ=1

138
𝐿
𝑁ℎ 2 (1 − 𝑓ℎ ) 2 2 2
𝑣(𝑌̂𝑅𝑠 ) = ∑ (𝑠𝑦ℎ − 2𝑅̂ℎ 𝜌ℎ 𝑠𝑦ℎ 𝑠𝑥ℎ + 𝑅̂ℎ 𝑠𝑥ℎ )
𝑛ℎ
ℎ=1
Formula di atas akan valid jika jumlah sampel di setiap strata cukup besar sehingga penduga 𝑌̂𝑅𝑠
adalah bias (tapi bias dapat diabaikan) dan approksimasi rumus varians bisa diterapkan untuk
masing-masing strata. Di samping itu, jika jumlah sampel tiap strata kecil dan jumlah strata besar,
biasnya akan besar (tidak dapat diabaikan).

Combined Ratio Estimator


Penghitungan rasio berdasarkan estimasi rata-rata atau total populasi, dan rasio tersebut
digunakan untuk semua strata.
𝑦̅𝑠𝑡 ∑𝐿ℎ=1 𝑊ℎ 𝑦̅ℎ
𝑅̂𝑐 = 𝑅̂ = =
𝑥̅𝑠𝑡 ∑𝐿ℎ=1 𝑊ℎ 𝑥̅ℎ
Atau
𝑌̂𝑠𝑡 ∑𝐿ℎ=1 𝑌̂ℎ
𝑅̂𝑐 = 𝑅̂ = = 𝐿
𝑋̂𝑠𝑡 ∑ℎ=1 𝑋̂ℎ

Estimasi total :
𝐿
𝑌̂𝑠𝑡
𝑌̂𝑠𝑡 = ∑ 𝑁ℎ 𝑦̅ℎ −→ 𝑦̅𝑠𝑡 =
𝑁
ℎ=1
𝐿
𝑋̂𝑠𝑡
𝑌̂𝑠𝑡 = ∑ 𝑁ℎ 𝑥̅ℎ −→ 𝑥̅𝑠𝑡 =
𝑁
ℎ=1

𝑌̂𝑠𝑡 𝑦̅𝑠𝑡
𝑌̂𝑅𝑐 = 𝑅̂𝑐 𝑋 = ∙𝑋 = .𝑋
𝑋̂𝑠𝑡 𝑥̅𝑠𝑡
𝐿
𝑁ℎ 2 (1 − 𝑓ℎ ) 2 2 2
𝑣(𝑌̂𝑅𝑐 ) = ∑ (𝑠𝑦ℎ − 2𝑅̂𝑐 𝜌ℎ 𝑠𝑦ℎ 𝑠𝑥ℎ + 𝑅̂𝑐 𝑠𝑥ℎ )
𝑛ℎ
ℎ=1
Estimator 𝑌̂𝑅𝑐 tidak memerlukan informasi mengenai 𝑋ℎ , hanya membutuhkan informasi 𝑋. Bias
dari combined ratio estimator pada umumnya lebih kecil daripada separate ratio estimator. Jika
jumlah sampel di setiap strata kecil, combined estimator lebih direkomendasikan untuk
digunakan.

L. PERBANDINGAN EFISIENSI COMBINED DAN SEPARATE RATIO ESTIMATOR


Selisih varians :
𝐿
𝑁ℎ 2 (1 − 𝑓ℎ ) 2
𝑣(𝑌̂𝑅𝐶 ) − 𝑣(𝑌̂𝑅𝑆 ) = ∑ [(𝑅̂2 − 𝑅̂ℎ ) 𝑠𝑥ℎ
2
− 2(𝑅̂ − 𝑅̂ℎ )𝜌ℎ 𝑠𝑦ℎ 𝑠𝑥ℎ ]
𝑛ℎ
ℎ=1
𝐿
𝑁ℎ 2 (1 − 𝑓ℎ ) 2
=∑ [(𝑅̂ 2 − 𝑅̂ℎ ) 𝑠𝑥ℎ
2
+ 2(𝑅̂ℎ − 𝑅̂ )𝜌ℎ 𝑠𝑦ℎ 𝑠𝑥ℎ ]
𝑛ℎ
ℎ=1
Jika jumlah sampel di setiap strata besar dan 𝑅̂ℎ perbedaannya signifikan antar strata, pada
umumnya separate estimator lebih efisien daripada combined estimator.

139
M. KESIMPULAN
• Jika sampel setiap strata kecil, gunakan combined ratio estimator, kecuali ada perbedaan
yang besar antara rasio tiap strata.
• Jika ukuran sampel setiap strata besar, lebih baik gunakan separate ratio estimator,
kecuali sulit melakukan penghitungannya. Jika ini terjadi, pastikan keuntungannya
sebelum menggunakan.
• Jika 𝑋ℎ diketahui independen dari strata ke strata, gunakan separate ratio estimator.
Ketika 𝑋ℎ = 𝑁ℎ , estimator menjadi sama dengan estimator strata dan tidak masalah
dengan bias dari estimasinya.
• Jika sampling unitnya adalah elementary units dan denominator dari rasio adalah jumlah
dari elementary units dalam sampel, kedua estimatornya adalah unbiased.
• Dalam kasus ini, estimator yang dipilih harus mempertimbangkan varians dan
keuntungan yang diperoleh.

Penduga Beda (Difference Estimator) dan


Penduga Regresi (Regression Estimator)

A. DEFINISI
Penduga Beda dan Penduga Regresi adalah suatu metode estimasi dengan mengambil manfaat
hubungan yang kuat antara variabel pendukung 𝑥𝑖 dengan variabel yang diteliti 𝑦𝑖 (Jumlah
populasi 𝑋 dari 𝑥𝑖 harus diketahui) dimana hubungannya mendekati linier namun garisnya tidak
melalui titik origin. Seperti halnya ratio estimator, linear regression estimator menggunakan
auxiliary information untuk meningkatkan presisi.

B. GENERALIZED ESTIMATOR
𝑦̅𝐺 = 𝑦̅ + 𝑐(𝑋̅ − 𝑥̅ )
Dengan c merupakan sesuatu yang belum ditetapkan (konstan atau variabel)
Keterangan :
1. Jika 𝑐 = 0 maka 𝑦̅𝐺 = 𝑦̅ → (rata-rata sederhana)
2. Jika 𝑐 = 𝑘 (𝑘 adalah konstanta, tidak tergantung pada sampel), maka 𝑦̅𝐷 = 𝑦̅ + 𝑘(𝑋̅ − 𝑥̅ ) →
(difference estimator/penduga beda)
3. Jika 𝑐 = 𝛽 (𝛽 adalah konstanta, koefisien regresi populasi), maka 𝑦̅𝑙𝑟 = 𝑦̅ + 𝛽(𝑋̅ − 𝑥̅ ) →
(regression estimator/penduga regresi)
4. Jika 𝑐 = 𝑏 (𝑏 adalah random variable, estimator untuk 𝛽), maka 𝑦̅𝑙𝑟 = 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅ ) →
(regression estimator/penduga regresi)
𝑦̅
5. Jika 𝑐 = 𝑟 (𝑟 = ⁄𝑥̅ ), maka 𝑦̅𝐺 = 𝑦̅ + 𝑟(𝑋̅ − 𝑥̅ ) = 𝑟𝑋̅ → (ratio estimator/penduga rasio)
Estimasi varians sampling untuk 𝑦̅𝑐 :
𝑣(𝑦̅𝑐 ) = 𝑣(𝑦̅) − 2𝑐 𝑐𝑜𝑣(𝑦̅, 𝑥̅ ) + 𝑐 2 𝑣(𝑥̅ )
Jika penarikan sampel secara SRS WOR
1−𝑓 2
𝑣(𝑦̅) = 𝑠
𝑛 𝑦

140
1−𝑓 2
𝑣(𝑥̅ ) = 𝑠
𝑛 𝑥
1−𝑓
𝑐𝑜𝑣(𝑦̅, 𝑥̅ ) = 𝑠
𝑛 𝑦𝑥
Jika penarikan sampel secara PPS
𝑛
1 𝑦𝑖 2
𝑣(𝑦̅) = 2 ∑ ( − 𝑁𝑦̅)
𝑁 𝑛(𝑛 − 1) 𝑝𝑖
𝑖=1
𝑛
1 𝑥𝑖 2
𝑣(𝑥̅ ) = ∑ ( − 𝑁𝑥̅ )
𝑁 2 𝑛(𝑛 − 1) 𝑝𝑖
𝑖=1
𝑛
1 𝑦𝑖 𝑥𝑖
𝑐𝑜𝑣(𝑦̅, 𝑥̅ ) = ∑( − 𝑁𝑦̅) ( − 𝑁𝑥̅ )
𝑁 2 𝑛(𝑛 − 1) 𝑝𝑖 𝑝𝑖
𝑖=1

C. DIFFERENCE ESTIMATOR
Misalkan 𝑦 dan 𝑥 merupakan karakteristik yang berkorelasi.
Dari satu gugus sampel yang berukuran 𝑛 dan ditarik secara simple random sampling, maka akan
diperoleh unbiased estimator 𝑦̅ dan 𝑥̅ untuk 𝑌̅ dan 𝑋̅.
Difference estimator didefinisikan sebagai
𝑦̅𝐷 = 𝑦̅ + 𝑘(𝑋̅ − 𝑥̅ )
𝑘 adalah konstanta yang telah ditentukan dan diketahui.
Variance bagi 𝑦̅𝐷 adalah
𝑉(𝑦̅𝐷 ) = 𝑉(𝑦̅) − 2𝑘 𝑐𝑜𝑣(𝑥̅ , 𝑦̅) + 𝑘 2 𝑉(𝑥̅ )
Dalam SRS WOR, varians sampling penduga beda adalah
𝑉(𝑥̅ ) 𝑐𝑜𝑣(𝑦̅, 𝑥̅ )
𝑉(𝑦̅𝐷 ) = 𝑉(𝑦̅) + 𝑘 2 𝑉(𝑥̅ ) − 2𝑘 𝑐𝑜𝑣(𝑦̅, 𝑥̅ ) = 𝑉(𝑦̅) (1 + 𝑘 2 − 2𝑘 )
𝑉(𝑦̅) 𝑉(𝑦̅)
𝑆𝑥 𝑆𝑦
= 𝑉(𝑦̅) (1 + 𝛼 2 − 2𝑘𝜌 ) = 𝑉(𝑦̅)(1 + 𝛼 2 − 2𝛼𝜌)
𝑆𝑦 2
Dimana 𝜌 adalah koefisien korelasi antara 𝑥 dan 𝑦 dan 𝛼 = 𝑘 𝑆𝑥 ⁄𝑆𝑦
Corollary :
𝑌
Untuk kasus 𝑐 = 𝑅 = ( ), varians dari penduga beda dengan penduga rasio aproksimasi order
𝑋
pertama akan tepat sama.
Penduga beda 𝑦̅𝐷 akan lebih tepat dari penduga mean per unit 𝑦̅ jika 𝑐 < 2𝜌 𝑆𝑦 ⁄𝑆𝑥
Bila 𝜌 = 𝛼 ⁄2, maka 𝑉(𝑦̅𝐷 ) = 𝑉(𝑦̅)
Dalam SRS WOR, penduga tak bias dari 𝑉(𝑦̅𝐷 ):
(1 − 𝑓) 2
𝑣(𝑦̅𝐷 ) = (𝑠𝑦 + 𝑘 2 𝑠𝑥2 − 2𝑘𝑠𝑦𝑥 )
𝑛
𝑠𝑦
Difference estimator akan lebih baik (precise) dibandingkan penduga SRS, bila 𝑘 < 2𝜌
𝑠𝑥

141
Penduga Regresi (Regression Estimator)
Dari rumus difference estimator 𝑦̅𝐷 = 𝑦̅ + 𝑘(𝑋̅ − 𝑥̅ ), nilai 𝑘 yang meminimumkan varians bisa
diperoleh dengan mendiferensiasikan 𝑉(𝑦̅𝐷 ) terhadap 𝑘 dan menyamakannya dengan nol
sehingga diperoleh :
𝐶𝑜𝑣(𝑥̅ , 𝑦̅)
𝑘=𝛽=
𝑉(𝑥̅ )
Jelaslah, bahwa 𝑘 = 𝛽 adalah koefisien regresi linier sederhana 𝑌 dalam 𝑋, dengan demikian
estimator dengan nilai optimum dari 𝑘 = 𝛽 adalah
𝑦̅𝑙𝑟 = 𝑦̅ + 𝛽(𝑋̅ − 𝑥̅ )
𝑦̅𝑙𝑟 ∶ 𝑙𝑖𝑛𝑒𝑎𝑟 𝑟𝑒𝑔𝑟𝑒𝑠𝑠𝑖𝑜𝑛 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑜𝑟 untuk penduga rata-rata
Pada umumnya koefisien regresi 𝛽 tidak diketahui sehingga harus diestimasi dari sampel.
Misalkan 𝑦𝑖 dan 𝑥𝑖 (𝑖 = 1,2,3, … , 𝑛) diperoleh dari setiap unit sampel yang ditarik secara SRS, nilai
𝛽 diestimasi dengan metode kuadrat terkecil (Least Square Method), yaitu
𝑠𝑦𝑥 ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝑏= 2 =
𝑠𝑥 ∑(𝑥𝑖 − 𝑥̅ )2

Unbiased sampling variance :


𝑣(𝑦̅𝑙𝑟 ) = 𝑣(𝑦̅) − 2𝑏𝑐𝑜𝑣(𝑥̅ , 𝑦̅) + 𝑏 2 𝑣(𝑥̅ )

Untuk penarikan sampel secara SRS WOR :

1−𝑓 2
𝑣(𝑦̅) = 𝑠
𝑛 𝑦
1−𝑓 2
𝑣(𝑥̅ ) = 𝑠
𝑛 𝑥
(1 − 𝑓)
𝑐𝑜𝑣(𝑥̅ , 𝑦̅) = 𝑠𝑦𝑥
𝑛
𝑠𝑦𝑥
𝑏= 2
𝑠𝑥
𝑆𝑦𝑥 = 𝜌𝑠𝑦 𝑠𝑥
1−𝑓 2 2
𝑣(𝑦̅𝑙𝑟 ) = (𝑠𝑦 − 2𝑏𝜌𝑠𝑦 𝑠𝑥 + 𝑏 𝑠2𝑥 )
𝑛
Dengan substitusi formula di atas pada rumus 𝑣(𝑦̅𝑙𝑟 ) diperoleh bentuk lain dari rumus unbiased
sampling variance yang lebih sederhana yaitu :
1−𝑓 2
𝑣(𝑦̅𝑙𝑟 ) = 𝑠 (1 − 𝜌2 )
𝑛 𝑦
Beberapa hal yang bisa disimpulkan dari rumus varians tersebut :
• Bila regresi linier, dan 𝑏 adalah Least Square Estimate bagi 𝛽, maka 𝑦̅𝑙𝑟 presisinya lebih
tinggi daripada 𝑦̅𝐷 .
• Bila regresi 𝑦 dalam 𝑥 linier sempurna sehingga |𝜌| ≈ 1 , maka 𝑣(𝑦̅𝑙𝑟 ) ≈ 0.
• Bila 𝑦 dan 𝑥 tak berkorelasi 𝜌 = 0 , maka 𝑦̅𝑙𝑟 = 𝑦̅ (penduga regresi sama dengan penduga
SRS).

142
Estimasi total dengan menggunakan penduga regresi dirumuskan:
𝑌̂𝑙𝑟 = 𝑁𝑦̅𝑙𝑟 = 𝑁[𝑦̅ + 𝑏(𝑋̅ − 𝑥̅ )] = 𝑌̂ + 𝑏(𝑋 − 𝑋̂)
Sampling varians untuk estimasi total :
(1 − 𝑓) 2
𝑣(𝑌̂𝑙𝑟 ) = 𝑁 2 𝑣(𝑦̅𝑙𝑟 ) = 𝑁 2 𝑠𝑦 (1 − 𝜌2 )
𝑛

Bias dari Estimasi Regresi


Regression estimator merupakan penduga yang bias karena:
• 𝛽 adalah nilai rasio dari dua buah nilai estimasi 𝑐𝑜𝑣(𝑦̅, 𝑥̅ ) dan 𝑉(𝑥̅ )
• Mengandung perkalian dua buah nilai estimasi, yaitu 𝑏𝑥̅
• Pada desain simple random sampling, bias dari 𝑦̅𝑙𝑟 bisa diapproksimasi dengan rumus :
𝐵(𝑦̅𝑙𝑟 ) = −𝑐𝑜𝑣(𝑥̅ , 𝑏)

Perbandingan Penduga Regresi dengan Penduga SRS


Secara umum, regression estimator akan selalu lebih efisien dari pada estimator rata-rata per
unit yang diperoleh dari penghitungan sampel acak sederhana (SRS).
Regression estimator akan mempunyai efisiensi yang sama dengan penduga SRS hanya jika
variabel 𝑥 dan 𝑦 tidak berkorelasi (𝜌 = 0)
Bukti :
1−𝑓 2 2
𝑣(𝑦̅𝑙𝑟 )
= 𝑛 𝑠𝑦 (1 − 𝜌 ) = (1 − 𝜌2 )
𝑣(𝑦̅) 1−𝑓 2
𝑠
𝑛 𝑦

Nilai (1 − 𝜌2 ) akan selalu lebih kecil atau sama dengan 1, sehingga penduga SRS akan sama efisien
dengan penduga regresi hanya jika 𝜌 = 0.
Perbandingan Penduga Regresi dengan Penduga Ratio
Secara umum, regression estimator akan lebih efisien dari pada ratio estimator.
Regression estimator akan mempunyai efisiensi yang sama dengan ratio estimator hanya jika 𝑏 =
𝐶
𝑅̂ atau 𝜌 = 𝐶𝑥
𝑦

Catatan :
Penduga regresi tidak selalu merupakan sebuah pilihan yang tepat meskipun memberikan
varians yang sama dengan atau kurang dari varians yang lain (varians rasio). Yang perlu
diperhatikan adalah :
1. Jika informasi sebelumnya pada sebuah nilai yang tepat dari (𝛽 = 𝑐) tersedia, dengan
penghitungan sederhana hasil yang bagus dapat diperoleh dengan nilai 𝑐 seperti itu dengan
penduga beda.
2. Jika 𝜌 ≅ 𝜎𝑥 ⁄𝜎𝑦 , penduga beda dengan 𝑐 = 1 akan memberikan hasil ketepatan yang sama
seperti penduga regresi.
3. Jika 𝜌 ≅ 𝐶𝑥 ⁄𝐶𝑦 , penduga rasio akan memberikan hasil ketepatan yang sama seperti penduga
regresi.

143
4. Jika 𝜌 berbeda dari 𝜎𝑥 ⁄𝜎𝑦 , penduga regresi seharusnya lebih disukai. Dalam situasi ini,
penduga beda dengan 𝑐 = 1 akan memberikan hasil yang tepat.
5. Jika 𝜌 berbeda dari 𝐶𝑥 ⁄𝐶𝑦 , penduga rasio seharusnya lebih disukai. Dalam situasi ini, varians
penduga rasio akan lebih besar dari pada penduga regresi.
6. Jika penghitungan penduga regresi adalah berat, membutuhkan waktu dan mahal,
penggunaannya disarankan hanya jika keuntungan dari penghitungan seperti ini adalah jauh
lebih signifikan dari pada biaya tambahan.

Estimasi Regresi pada Stratified Sampling


a. Separate Regression Estimator
Tepat digunakan jika true regression coefficient (𝛽ℎ ) nilainya bervariasi antar strata.
Koefisien regresi diestimasi pada masing-masing strata.
𝑐𝑜𝑣(𝑦̅ℎ , 𝑥̅ℎ )
𝑏ℎ =
𝑣(𝑥̅ℎ )
Jika penarikan sampel secara SRS maka :
𝑠𝑦𝑥ℎ ∑𝑛𝑖=1

(𝑦ℎ𝑖 − 𝑦̅ℎ )(𝑥ℎ𝑖 − 𝑥̅ℎ )
𝑏ℎ = 2 =
𝑠𝑥ℎ ∑𝑛𝑖=1

(𝑥ℎ𝑖 − 𝑥̅ℎ )2
Estimasi rata-rata karakteristik di strata ke-h dirumuskan :
𝑦̅𝑙𝑟ℎ = 𝑦̅ℎ + 𝑏ℎ (𝑋̅ℎ − 𝑥̅ℎ )
Varians strata :
1 − 𝑓ℎ 2 1 − 𝑓ℎ 2
𝑣(𝑦̅𝑙𝑟ℎ ) = (𝑠𝑦ℎ − 2𝑏ℎ 𝑠𝑦𝑥ℎ + 𝑏ℎ2 𝑠𝑥ℎ2
)= 𝑠 (1 − 𝜌ℎ 2 )
𝑛ℎ 𝑛ℎ 𝑦ℎ

Estimasi rata-rata karakteristik populasi dirumuskan :


𝐿

𝑦̅𝑙𝑟𝑠 = ∑ 𝑊ℎ 𝑦̅𝑙𝑟ℎ
ℎ=1

𝐿 𝐿 𝐿
𝑁ℎ 1 1 𝑌̂𝑙𝑟𝑠
𝑦̅𝑙𝑟𝑠 =∑ 𝑦̅𝑙𝑟ℎ = [∑ 𝑌̂ℎ + 𝑏ℎ (𝑋ℎ − 𝑋̂ℎ )] = ∑ 𝑌̂𝑙𝑟ℎ =
𝑁 𝑁 𝑁 𝑁
ℎ=1 ℎ=1 ℎ=1
Varians :
𝐿 𝐿
2 𝑊ℎ 2 (1 − 𝑓ℎ ) 2
𝑣(𝑦̅𝑙𝑟𝑠 ) = ∑ 𝑊ℎ 𝑣(𝑦̅𝑙𝑟ℎ ) = ∑ (𝑠𝑦ℎ − 2𝑏ℎ 𝑠𝑦𝑥ℎ + 𝑏ℎ2 𝑠𝑥ℎ
2
)
𝑛ℎ
ℎ=1 ℎ=1
𝐿 2
𝑊ℎ (1 − 𝑓ℎ ) 2
=∑ 𝑠𝑦ℎ (1 − 𝜌ℎ 2 )
𝑛ℎ
ℎ=1
Estimasi total karakteristik populasi dirumuskan :
𝐿

𝑌̂𝑙𝑟𝑠 = 𝑁𝑦̅𝑙𝑟𝑠 = ∑ 𝑌̂𝑙𝑟ℎ


ℎ=1

144
Varians :
𝐿 𝐿 𝐿
𝑁ℎ 2 (1 − 𝑓ℎ ) 2
𝑣(𝑌̂𝑙𝑟𝑠 ) = 𝑁 2 𝑣(𝑦̅𝑙𝑟𝑠 ) = ∑ 𝑣(𝑌̂𝑙𝑟𝑠 ) = ∑ 𝑁ℎ 2 𝑣(𝑦̅𝑙𝑟ℎ ) = ∑ (𝑠𝑦ℎ − 2𝑏ℎ 𝑠𝑦𝑥ℎ + 𝑏ℎ2 𝑠𝑥ℎ
2
)
𝑛ℎ
ℎ=1 ℎ=1 ℎ=1
𝐿 2
𝑁ℎ (1 − 𝑓ℎ ) 2
= ∑ 𝑠𝑦ℎ (1 − 𝜌ℎ 2 )
𝑛ℎ
ℎ=1

b. Combined Regression Estimator


Tepat digunakan jika true regression coefficient (𝛽ℎ ) diasumsikan sama untuk semua strata.
Jika penarikan sampel secara SRS WOR, estimasi rata-rata karakteristik y dan x dirumuskan :
𝐿

𝑦̅𝑠𝑡 = ∑ 𝑊ℎ 𝑦̅ℎ
ℎ=1
𝐿

𝑥̅𝑠𝑡 = ∑ 𝑊ℎ 𝑥̅ℎ
ℎ=1
Sampling variance dan sampling covariance :
𝐿
(1 − 𝑓ℎ ) 2
𝑣(𝑦̅𝑠𝑡 ) = ∑ 𝑊ℎ 2 𝑠𝑦ℎ
𝑛ℎ
ℎ=1
𝐿
(1 − 𝑓ℎ ) 2
𝑣(𝑥̅𝑠𝑡 ) = ∑ 𝑊ℎ 2 𝑠𝑥ℎ
𝑛ℎ
ℎ=1

𝐿
(1 − 𝑓ℎ )
𝑐𝑜𝑣(𝑦̅𝑠𝑡 , 𝑥̅𝑠𝑡 ) = ∑ 𝑊ℎ 2 𝑠𝑦𝑥ℎ
𝑛ℎ
ℎ=1
Estimasi Combined Regression Coefficient :
𝑐𝑜𝑣(𝑦̅𝑠𝑡 , 𝑥̅𝑠𝑡 )
𝑏𝑐 =
𝑣(𝑥̅𝑠𝑡 )

Estimasi rata-rata karakteristik :


𝑦̅𝑙𝑟𝑐 = 𝑦̅𝑠𝑡 + 𝑏𝑐 (𝑋̅ − 𝑥̅𝑠𝑡 )
Unbiased sampling variance :
𝐿
𝑊ℎ 2 (1 − 𝑓ℎ ) 2 2
𝑣(𝑦̅𝑙𝑟𝑐 ) = ∑ (𝑠𝑦ℎ − 2𝑏𝑐 𝑠𝑦𝑥ℎ + 𝑏𝑐2 𝑠𝑥ℎ )
𝑛ℎ
ℎ=1
Estimasi total karakteristik :
𝑌̂𝑙𝑟𝑐 = 𝑁𝑦̅𝑙𝑟𝑐
Unbiased sampling variance :
𝑣(𝑌̂𝑙𝑟𝑐 ) = 𝑁 2 𝑣(𝑦̅𝑙𝑟𝑐 )

Catatan :
• Tidak ada aturan yang pasti apakah separate atau combined yang lebih baik (lebih
akurat) untuk digunakan pada kondisi tertentu.
• Konsekuensi dari separate regression estimator adalah biasnya akan besar jika jumlah
sampel dalam tiap strata kecil.

145
• Konsekuensi dari combined regression estimator adalah variansnya akan besar jika
koefisien regresi populasi tiap strata (𝛽ℎ ) berbeda antar strata.
• Jika garis regresi adalah linear dan 𝛽ℎ diperkirakan sama untuk semua strata, combined
regression estimator lebih direkomendasikan.
• Jika garis regresi adalah linear (sehingga nilai bias diperkirakan kecil) dan 𝛽ℎ berbeda
antar strata, separate regression estimator lebih baik untuk digunakan.
• Jika garis regresi cenderung curvilinear (agak melengkung) lebih baik menggunakan
combined regression estimator, kecuali jika jumlah sampel di setiap strata besar.

Product Estimator

Digunakan bila korelasi antara 𝑦 dan 𝑥 adalah negatif.


𝑥̅
Estimasi rata-rata : 𝑌̅̂𝑃 = 𝑦̅ 𝑋̅
𝑥̅ 𝑋 ̂
Estimasi total : 𝑌̂𝑃 = 𝑁𝑦̅ 𝑋̅ = 𝑌̂ 𝑋
Varians sampling : 𝑉(𝑌̂𝑃 ) ≈ 𝑉(𝑌̂) + 2𝑅𝑐𝑜𝑣(𝑋̂, 𝑌̂) + 𝑅 2 𝑉(𝑋̂)
𝐵(𝑌̂𝑃 ) 𝑁−𝑛
Relatif bias : 𝑌
≅ 𝑁𝑛
𝜌𝐶𝑥 𝐶𝑦

CONTOH SOAL
1. Manajer suatu perusahaan tertarik memperkirakan total penjualan dalam ribuan untuk 300
cabangnya. Dari catatan tahun lalu, total penjualan dalam ribuan untuk semua 300 cabang
adalah 21300. Pemeriksaan catatan tahun ini diperoleh dengan cermat untuk SRS dari 15
cabang dengan hasil sebagai berikut:

Penjualan Penjualan Penjualan Penjualan


Cabang tahun lalu (𝑥) tahun ini (𝑦) Cabang tahun lalu (𝑥) tahun ini (𝑦)
(dalam ribuan) (dalam ribuan) (dalam ribuan) (dalam ribuan)
1 50 56 9 100 165
2 35 8 10 250 409
3 12 22 11 50 73
4 10 14 12 50 70
5 15 18 13 150 95
6 30 26 14 100 55
7 9 11 15 40 83
8 25 30

Perkirakan total penjualan menggunakan ratio estimator dan regression estimator.

Jawaban:
a. Ratio estimator
𝑁 = 300 𝑋 = 21300 (𝑑𝑎𝑙𝑎𝑚 𝑟𝑖𝑏𝑢𝑎𝑛) 𝑛 = 15
𝑥̅ = 61,7333 𝑦̅ = 78,3333

146
𝑠𝑥 2 = 4302,4952 𝑠𝑦 2 = 9983,8095
𝑠𝑥 = 65,5934 𝑠𝑦 = 99,9190
𝑋̅ = 71
𝜌 = 0,9069
𝑦̅ 78,3333
𝑅̂ = = = 1,2689
𝑥̅ 61,7333

Estimasi rata-rata :
𝑦̅𝑅 = 𝑅̂ × 𝑋̅ = 1,2689 × 71 = 90,0918
(1 − 𝑓)
𝑣(𝑦̅𝑅 ) = (𝑠𝑦 2 − 2𝑅̂ 𝜌𝑠𝑥 𝑠𝑦 + 𝑅̂ 2 𝑠𝑥 2 )
𝑛
(300 − 15)
= (9983,8095 − 2(1,2689)(0,9069)(65,5934)(99,9190)
300 × 15
+ (1,2689)2 (4302,4952)) = 115,6812
𝑠𝑒(𝑦̅𝑅 ) = √𝑣(𝑦̅𝑅 ) = √115,6812 = 10,7555
𝐿𝐶𝐿 = 𝑦̅𝑅 − 1,96(𝑠𝑒(𝑦̅𝑅 )) = 90,0918 − 1,96(10,7555) = 69,0110
𝑈𝐶𝐿 = 𝑦̅𝑅 + 1,96(𝑠𝑒(𝑦̅𝑅 )) = 90,0918 + 1,96(10,7555) = 111,1726
𝑠𝑒(𝑦̅𝑅 ) 10,7555
𝑟𝑠𝑒(𝑦̅𝑅 ) = × 100% = × 100% = 11,94%
𝑦̅𝑅 90,0918

Estimasi rata-rata penjualan dalam ribuan untuk 300 cabang adalah sebesar 90,0918 dengan
standar error sebesar 10,7555. Estimasi rata-rata penjualan dalam ribuan untuk 300 cabang
berkisar antara 69,0110 sampai 111,1726 dengan relative standar error sebesar 11,94%.

Estimasi total :
𝑌̂𝑅 = 𝑁𝑦̅𝑅 = 300 × 90,0918 = 27027,5378
𝑣(𝑌̂𝑅 ) = 𝑁 2 𝑣(𝑦̅𝑅 ) = 3002 × 115,6812 = 10411312,02

𝑠𝑒(𝑌̂𝑅 ) = √𝑣(𝑌̂𝑅 ) = √10411312,02 = 3226,6565

𝐿𝐶𝐿 = 𝑌̂𝑅 − 1,96 (𝑠𝑒(𝑌̂𝑅 )) = 27027,5378 − 1,96(3226,6565) = 20703,2911


𝑈𝐶𝐿 = 𝑌̂𝑅 + 1,96 (𝑠𝑒(𝑌̂𝑅 )) = 27027,5378 + 1,96(3226,6565) = 33351,7845
𝑠𝑒(𝑌̂𝑅 ) 3226,6565
𝑟𝑠𝑒(𝑌̂𝑅 ) = × 100% = × 100% = 11,94%
𝑌̂𝑅 27027,54

Estimasi total penjualan dalam ribuan untuk 300 cabang adalah sebesar 27027,5378 dengan
standar error sebesar 3226,6565. Estimasi total penjualan dalam ribuan untuk 300 cabang
berkisar antara 20703,2911 sampai 33351,7845 dengan relative standar error sebesar
11,94%.

b. Regression estimator
𝑁 = 300 𝑋 = 21300 (𝑑𝑎𝑙𝑎𝑚 𝑟𝑖𝑏𝑢𝑎𝑛) 𝑛 = 15
𝑥̅ = 61,7333 𝑦̅ = 78,3333
𝑠𝑥 2 = 4302,4952 𝑠𝑦 2 = 9983,8095
𝑠𝑥 = 65,5934 𝑠𝑦 = 99,9190
𝑋̅ = 71

147
𝜌 = 0,9069
𝑏 = 1,3815

Estimasi rata-rata :
𝑦̅𝐿𝑅 = 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅ ) = 78,3333 + 1,3815(71 − 61,7333) = 91,1355
(1 − 𝑓)
𝑣(𝑦̅𝐿𝑅 ) = (𝑠𝑦 2 − 2𝑏𝜌𝑠𝑥 𝑠𝑦 + 𝑏 2 𝑠𝑥 2 )
𝑛
(300 − 15)
= (9983,8095 − 2(1,3815)(0,9069)(65,5934)(99,9190)
300 × 15
+ (1,3815)2 (4302,4952)) = 112,2245
𝑠𝑒(𝑦̅𝐿𝑅 ) = √𝑣(𝑦̅𝐿𝑅 ) = √112,2245 = 10,5936
𝐿𝐶𝐿 = 𝑦̅𝐿𝑅 − 1,96(𝑠𝑒(𝑦̅𝐿𝑅 )) = 91,1355 − 1,96(10,5936) = 70,3720
𝑈𝐶𝐿 = 𝑦̅𝐿𝑅 + 1,96(𝑠𝑒(𝑦̅𝐿𝑅 )) = 91,1355 + 1,96(10,5936) = 111,899
𝑠𝑒(𝑦̅𝐿𝑅 ) 10,5936
𝑟𝑠𝑒(𝑦̅𝐿𝑅 ) = × 100% = × 100% = 11,62%
𝑦̅𝐿𝑅 91,1355

Estimasi rata-rata penjualan dalam ribuan untuk 300 cabang adalah sebesar 91,1355 dengan
standar error sebesar 10,5936. Estimasi rata-rata penjualan dalam ribuan untuk 300 cabang
berkisar antara 70,3720 sampai 111,899 dengan relative standar error sebesar 11,62%.

Estimasi total :
𝑌̂𝐿𝑅 = 𝑁𝑦̅𝐿𝑅 = 300 × 91,1355 = 27340,6518
𝑣(𝑌̂𝐿𝑅 ) = 𝑁 2 𝑣(𝑦̅𝐿𝑅 ) = 3002 × 112,2245 = 10100204,36

𝑠𝑒(𝑌̂𝐿𝑅 ) = √𝑣(𝑌̂𝐿𝑅 ) = √10100204,362 = 3178,0819

𝐿𝐶𝐿 = 𝑌̂𝐿𝑅 − 1,96 (𝑠𝑒(𝑌̂𝐿𝑅 )) = 27340,6518 − 1,96(3178,0819) = 21111,6114

𝑈𝐶𝐿 = 𝑌̂𝐿𝑅 + 1,96 (𝑠𝑒(𝑌̂𝐿𝑅 )) = 27340,6518 + 1,96(3178,0819) = 33569,6923


𝑠𝑒(𝑌̂𝐿𝑅 ) 3178,0819
𝑟𝑠𝑒(𝑌̂𝐿𝑅 ) = × 100% = × 100% = 11,62%
𝑌̂𝐿𝑅 27340,65

Estimasi total penjualan dalam ribuan untuk 300 cabang adalah sebesar 27340,6518 dengan
standar error sebesar 3178,0819. Estimasi total penjualan dalam ribuan untuk 300 cabang
berkisar antara 21111,6114 sampai 33569,6923 dengan relative standar error sebesar
11,62%.

2. Data berikut dikumpulkan dalam sebuah pilot survei untuk memperkirakan perluasan dari
penanaman dan produksi buah segar di 3 wilayah di suatu daerah:

Total luas Jumlah


Jumlah Luas kebun buah sample
Wilayah kebun desa Jumlah pohon
desa (ha)
buah (ha) sample
4,63; 2,90; 1,45; 3,38; 5,17; 290,6; 179,5; 92,3; 212,4;
A 985 3.253 6
3,35 318,7; 221,4

148
8,66; 6,61; 7,35; 9,87; 6,42; 565,1; 436,2; 490,6; 648,1;
B 1.196 9.115 8
8,60; 9,70; 6,75 450,5; 560,7; 635,5; 446,0
11,60; 15,29; 17,94; 14,29; 810,4; 927; 1374; 995,8;
C 1.020 15.270 11 18,00; 13,20; 11,50; 14,70; 1499; 750; 861,3; 847;
12,01; 17,96; 23,15 879,7; 1420,5; 2115

Perkirakan total pohon di 3 wilayah tersebut beserta rse-nya!


Jawaban:
𝑁 = 3201
𝑁𝐴 = 985 𝑁𝐵 = 1196 𝑁𝐶 = 1020
𝑋𝐴 = 3252 𝑋𝐵 = 9115 𝑋𝐶 = 15270
𝑛𝐴 = 6 𝑛𝐵 = 8 𝑛𝐶 = 11

Metode yang digunakan adalah Separate Rasio Estimator karena nilai auxiliary variable dan
variabel yang diteliti melewati titik origin (jika x=0 maka y=0) dimana ketika luas lahan bernilai
nol maka jumlah pohon juga bernilai nol dan karena nilai 𝑅̂ setiap strata cukup berbeda maka
digunakan separate ratio estimator.
Strata 𝑁ℎ 𝑋ℎ 𝑛ℎ 𝑥ℎ𝑖 𝑦ℎ𝑖 𝑥̅ℎ 𝑦̅ℎ 𝑠𝑥ℎ 2 𝑠𝑦ℎ 2
4,63 290,6
2,9 179,5
1,45 92,3
A 985 3253 6 3,48 219,15 1,7326 6545,795
3,38 212,4
5,17 318,7
3,35 221,4
8,66 565,1
6,61 436,2
7,35 490,6
9,87 648,1
B 1196 9115 8 7,995 529,0875 1,9422 7281,8212
6,42 450,5
8,6 560,7
9,7 635,5
6,75 446
11,6 810,4
15,29 927
17,94 1374
C 1020 15270 11 14,29 995,8 15,4218 1134,52 12,75 177078,93
18 1499
13,2 750
11,5 861,3

149
14,7 847
12,01 879,7
17,96 1420,5
23,15 2115

Strata 𝜌ℎ 𝑅̂ℎ 𝑌̂ℎ 𝑣(𝑌̂ℎ )


A 0,9978 62,9741 204854,8707 5403180,232
B 0,995 66,1773 603206,0741 22300640,27
C 0,9497 73,5658 1123349,558 3379298360

𝑌̂𝑅𝑆 = ∑ 𝑌̂ℎ = 204854,8707 + 603206,0741 + 1123349,558 = 1931410,503


𝑖=1
3

𝑣(𝑌̂𝑅𝑆 ) = ∑ 𝑣(𝑌̂ℎ ) = 5403180,232 + 22300640,27 + 3379298360 = 3407002180


𝑖=1

𝑠𝑒(𝑌̂𝑅𝑆 ) = √𝑣(𝑌̂𝑅𝑆 ) = √3407002180 = 58369.5313

𝐿𝐶𝐿 = 𝑌̂𝑅𝑆 − 1,96 (𝑠𝑒(𝑌̂𝑅𝑆 )) = 1931410,503 − 1,96(58369.5313) = 1817006,221


𝑈𝐶𝐿 = 𝑌̂𝑅𝑆 + 1,96 (𝑠𝑒(𝑌̂𝑅𝑆 )) = 1931410,503 + 1,96(58369.5313) = 2045814,784
𝑠𝑒(𝑌̂𝑅𝑆 ) 58369.5313
𝑟𝑠𝑒(𝑌̂𝑅𝑆 ) = × 100% = × 100% = 3,02%
̂
𝑌𝑅𝑆 1931410,503

Estimasi total jumlah pohon di 3 wilayah tersebut adalah sebesar 1931410,503 pohon dengan
standard error sebesar 58369,5313 pohon. Estimasi total jumlah pohon di 3 wilayah tersebut
berkisar antara 1817006,221 pohon sampai 2045814,784 pohon dengan relative standard error
sebesar 3,02%.

𝑌̂𝑅𝑆 1931410,503
𝑦̅𝑅𝑆 = = = 603,3772
𝑁 3201
𝑣(𝑌̂𝑅𝑆 ) 3407002180
𝑣(𝑦̅𝑅𝑆 ) = = = 332,5072
𝑁2 32012
𝑠𝑒(𝑦̅𝑅𝑆 ) = √𝑣(𝑦̅𝑅𝑆 ) = √332,5072 = 18,2348

𝐿𝐶𝐿 = 𝑦̅𝑅𝑆 − 1,96(𝑠𝑒(𝑦̅𝑅𝑆 )) = 603,3772 − 1,96(18,2348) = 567,6371


𝑈𝐶𝐿 = 𝑦̅𝑅𝑆 + 1,96(𝑠𝑒(𝑦̅𝑅𝑆 )) = 603,3772 + 1,96(18,2348) = 639,1174
𝑠𝑒(𝑦̅𝑅𝑆 ) 18,2348
𝑟𝑠𝑒(𝑦̅𝑅𝑆 ) = × 100% = × 100% = 3,02%
𝑦̅𝑅𝑆 603,3772

Estimasi rata-rata jumlah pohon di 3 wilayah tersebut adalah sebesar 603,3772 pohon dengan
standard error sebesar 18,2348 pohon. Estimasi rata-rata jumlah pohon di 3 wilayah tersebut

150
berkisar antara 567,6371 pohon sampai 639,1174 pohon dengan relative standard error sebesar
3,02%.

TWO STAGES SAMPLING

A. DEFINISI
Two Stage Sampling adalah suatu metode penarikan contoh dimana pengambilan pertama adalah
memilih contoh dari unit-unit utama (primary sampling units/psu) dan kemudian pada
pengambilan kedua adalah memilih sejumlah elemen-elemen dari unit-unit utama yang terpilih
(secondary sampling units/ssu).

B. ALASAN DIGUNAKANNYA TWO STAGE SAMPLING


1. Tidak tersedianya kerangka sampel yang memuat unit-unit sampel yang terkecil, karena
untuk membuatnya dibutuhkan biaya, waktu dan tenaga yang besar;
2. Biaya yang tinggi untuk mensurvei unit-unit sampling yang menyebar;
3. Kesulitan untuk mengelola rencana sampling dimana unit-unit sampling sangat terpencar.

C. KEUNTUNGAN MENGGUNAKAN TWO STAGE SAMPLING


1. Psu lebih mudah disiapkan
2. Ssu hanya diperlukan pada psu terpilih saja
3. Pengawasan lapangan lebih dapat ditingkatkan sehingga nonsampling error dapat ditekan;
4. Dari segi biaya, lebih efisien dibandingkan dengan penarikan sampel acak sederhana.

D. KELEMAHAN MENGGUNAKAN TWO STAGE SAMPLING


Jila elemen dalam unit utama yang sama sangat dekat, timbul persoalan kurangnya keseimbangan
antara ketelitian secara statistik dan biaya.

E. TWO STAGE SAMPLING WITH EQUAL FIRST STAGE UNITS: SRS WOR - SRS WOR
Notasi:
𝑦𝑖𝑗 = nilai ssu ke − j pada psu ke − i
𝑚
𝑦𝑖𝑗
𝑦̅𝑖. = ∑ = rata − rata elemen per ssu pada psu ke − i
𝑚
𝑗
𝑦𝑖𝑗 = nilai ssu ke − j pada psu ke − i
𝑛
𝑦̅𝑖.
𝑦̅ = ∑ = rata − rata keseluruhan elemen
𝑛
𝑖

Estimasi Total

Jika n-psu dan m-ssu dipilih secara SRS WOR, maka penduga totalnya adalah:

151
𝑛 𝑚
𝑁𝑀
𝑌̂ = ∑ ∑ 𝑦𝑖𝑗
𝑛𝑚
𝑖=1 𝑗=1

𝑌̂ = 𝑁𝑀𝑦̅

Estimasi Rata-Rata

𝑛 𝑚
𝑌̂ 1
𝑦̅ = = ∑ ∑ 𝑦𝑖𝑗
𝑁𝑀 𝑛𝑚
𝑖=1 𝑗=1

Estimasi Varians Rata-Rata


(1 − 𝑓1 ) 2 𝑓1 (1 − 𝑓2 ) 2
𝑣(𝑦̅) = 𝑆 𝑏+ 𝑆 𝑤
𝑛 𝑛𝑚
𝑆𝑒(𝑦̅) = √𝑣(𝑦̅)
𝑆𝑒(𝑦̅)
𝑅𝑠𝑒(𝑦̅) = 𝑥 100%
𝑦̅

Estimasi Varians Total


(1 − 𝑓1 ) 2 (1 − 𝑓2 ) 2
𝑉(𝑌̂) = 𝑁 2 𝑀2 𝑆 𝑏 + 𝑁 2 𝑀2 𝑆 𝑤
𝑛 𝑛𝑚
(1 − 𝑓1 ) 2 (1 − 𝑓2 ) 2
𝑉(𝑌̂) = 𝑁 2 𝑀2 [ 𝑆 𝑏+ 𝑆 𝑤]
𝑛 𝑛𝑚
𝑉(𝑌̂) = 𝑁 2 𝑀2 𝑣(𝑦̅)

𝑆𝑒(𝑌̂) = √𝑉(𝑌̂)
𝑆𝑒(𝑌̂)
𝑅𝑠𝑒(𝑌̂) = 𝑥 100%
𝑌̂

F. TWO STAGE SAMPLING WITH UNEQUAL FIRST STAGE UNITS: SRS WOR - PPS WR

Jika sebuah sampel dari n psu dipilih secara PPS WR, kemudian dari psu terpilih diambil Kembali
sebanyak 𝑚𝑖 ssu dengan metode SRS WOR, maka:

Estimasi Total Populasi:

𝑛
1 𝑀𝑖 𝑦̅𝑖.
𝑌̂ = ∑
𝑛 𝑝𝑖
𝑖=1

152
Dimana:
𝑚𝑖
𝑦𝑖𝑗
𝑦̅𝑖. = ∑
𝑚𝑖
𝑗=1
𝑁

∑ 𝑝𝑖 = 1
𝑖=1

Estimasi Varians Populasi:


𝑀 𝑦̅
∑𝑛𝑖=1( 𝑖 𝑖. − 𝑌̂) 𝑛
𝑀𝑖 2 (1 − 𝑓2𝑖 )𝑠𝑤𝑖 2
̂ 𝑝𝑖
𝑣(𝑌𝑝𝑝𝑠 ) = +∑
𝑛(𝑛 − 1) 𝑛2 𝑝𝑖 2 𝑚𝑖
𝑖=1

G. Alokasi Sampel Optimum: Equal First Stage Unit


Fungsi biaya sederhana dalam two stage sampling (equal size) adalah sebagai berikut:

𝐶 ′ = 𝐶0 + 𝑛𝐶1 + 𝑛𝑚𝐶2

Dalam praktek, umumnya 𝐶1 lebih besar dari 𝐶2 , sehingga peningkatan n akan meningkatkan
biaya lebih dari pada peningkatan m.

1. Dengan Fixed Cost


Dalam menentukan jumlah n dan m yang optimum, kita harus menetapkan terlebih
dahulu besarnya biaya berdasarkan pengalaman survei sebelumnya untuk mendapatkan
varians yang seminimal mungkin.
𝐴2 𝐶1
𝑚𝑜𝑝𝑡𝑖𝑚𝑢𝑚 = √
𝐴1 𝐶2
(𝐶 ′ − 𝐶0 )√𝐴2 /𝐶1
𝑛𝑜𝑝𝑡𝑖𝑚𝑢𝑚 =
√𝐴1 /𝐶1 + √𝐴2 /𝐶2
1 2
𝑉(𝑦̅) = ′ [(√𝐴1 /𝐶1 + √𝐴2 /𝐶2 ) ] + 𝐴3
(𝐶 − 𝐶0 )

2. Dengan Fixed Varians


Dalam menentukan jumlah n dan m yang optimum, kita harus menetapkan terlebih
dahulu nilai varians yang diharapkan untuk meminimalisasi cost atau biaya.

𝐴2 𝐶1
𝑚𝑜𝑝𝑡𝑖𝑚𝑢𝑚 = √
𝐴1 𝐶2

√𝐴1 /𝐶1 + √𝐴2 /𝐶2 𝐴1


𝑛𝑜𝑝𝑡𝑖𝑚𝑢𝑚 = √
𝑉0 − 𝐴3 𝐶1

153
POLITEKNIK STATISTIKA STIS JAKARTA
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2017/2018
Mata Kuliah : Metode Penarikan Contoh II

Hari/Tanggal : Rabu/02 Mei 2018

Tingkat : 2 (Dua)

Pengajar : Tim Dosen

Waktu : 120 menit

Sistem Ujian : Tutup buku (Buka 2 halaman rumus)

==================================================

PETUNJUK:

1. Berdoalah sebelum mengerjakan soal!


2. Bekerjalah dengan cermat dan teliti.
3. Periksalah kembali jawaban saudara sebelum diserahkan ke pengawas ujian.
==================================================

1. Jawablah
a. Jelaskan alasan penggunaan metode penduga rasio, regresi dan beda!
b. Jelaskan persamaan dan perbedaan metode penduga rasio, regresi dan beda, lengkapi jawaban
anda dengan contoh penerapannya!
c. Pada kondisi bagaimana penduga regresi mempunyai efisiensi yang sama dengan penduga SRS
dan penduga rasio?, buktikan masing-masing melalui rumus!

2. Sebuah survei untuk mengestimasi produksi susu sapi perah dilakukan di suatu daerah dengan
memilih 20 desa dari 1200 desa secara acak tanpa pengembalian. Hasil produksi susu sapi perah
berdasarkan hasil survei dan hasil sensus di periode sebelumnya dari tiap desa terpilih sebagai
berikut :
Produksi Susu Liter Produksi Susu Liter
Nomor Nomor
Data Data Data Data
Desa Desa
Sensus Survei Sensus Survei
(1) (2) (3) (1) (2) (3)
1 3115 3270 11 10225 10550
2 3450 3480 12 5345 2960
3 2670 2650 13 3530 3535
4 1465 1575 14 8975 9450
5 345 390 15 7030 5615
6 4210 3200 16 590 575
7 2375 3460 17 1650 1875
8 1855 1460 18 1090 1875
9 805 1050 19 1090 1060
10 1490 2775 20 1020 1260

154
Bandingkan efisiensi antara metode penduga rasio dengan metode penduga regresi! Beri
kesimpulan! (Jika diketahui dari hasil sensus di periode sebelumnya produksi susu dari semua desa
sebanyak 3,3 juta liter)

3. Sekelompok mahasiswa melakukan penelitian disebuah kabupaten di provinsi Kepulauan Riau.


Penelitian tersebut bertujuan untuk mengestimasi jumlah penduduk dengan menggunakan
“Stratified PPS Cluster Sampling”. Berkaitan dengan itu, maka:
a. Jelaskan apa yang dimaksud dengan “Stratified PPS Cluster Sampling” dan menurut anda apa yang
menjadi strata, cluster dan size yang tepat untuk penelitian tersebut? (berikan alasannya)
b. Berdasarkan jawaban poin (a), sebutkan Populasi, Populasi Target, Kerangka Sampel, Unit
Sampling, Unit Analisis dan Nilai Karakteristik yang diestimasi dari penelitian tersebut!
c. Tuliskan rumus estimasi yang digunakan sesuai dengan tujuan dan desain sampling pada
penelitian tersebut!

4. Suatu penelitian dilakukan untuk mengetahui total produksi sepatu per hari dari Perusahaan Sepatu
merk “DRA”. Perusahaan ini diketahui membawahi sebanyak 60 anak perusahaan yang tersebar di
beberapa tempat. Setiap anak perusahaan tersebut dikelompokkan menjadi 2 strata, dimana strata
pertama adalah anak perusahaan yang memiliki jumlah mesin kurang dari 10 dan strata kedua
adalah anak perusahaan yang memiliki jumlah mesin 10 atau lebih. Pada strata pertama, ada
sebanyak 24 anak perusahaan dengan total mesin yang dimiliki ada sebanyak 192 buah mesin dari
sebanyak 624 buah mesin. Kemudian diambil sampel sebanyak 3 anak perusahaan dimasing-masing
strata dengan cara SRS WOR dan data yang diperoleh adalah sebagai berikut :

Jumlah
Mesin di
Strata setiap anak Produksi Sepatu (dalam ratusan pasang)
perusahaan
sampel
6 2 5 3 5 8 1
I 7 5 1 3 7 8 6 5
8 7 5 9 3 6 3 11 4
10 12 16 13 18 15 9 19 11 12 15
II 11 10 20 12 14 13 16 10 11 17 19 23
12 15 18 19 15 21 17 14 10 19 11 13 20

Berdasarkan data tersebut di atas, perkirakan total produksi sepatu per hari dari Perusahaan Sepatu
merk “DRA” dalam sebuah selang kepercayaan 95% beserta Rse-nya! Kemudian interpretasikan
hasil yang diperoleh.

155
PEMBAHASAN SOAL UTS GENAP TAHUN 2017/2018
METODE PENARIKAN CONTOH II

1. Jawaban
a. Ratio estimator, difference estimator dan regression estimator adalah suatu metode estimasi
dengan mengambil manfaat hubungan yang kuat antara variabel pendukung, 𝑥𝑖 dengan variabel
yang diteliti, 𝑦𝑖 . Syarat menggunakan ketiga estimator tersebut adalah adalah jumlah populasi 𝑋
dari 𝑥𝑖 harus diketahui.

Ratio estimator digunakan untuk meningkatkan efisiensi pendukung parameter populasi


𝑦̅
(𝑅̂ = 𝑟 = 𝑥̅ ), dan garisnya melalui titik origin (𝑥 = 0 dan 𝑦 = 0). Ketika 𝑥 = 0 dan 𝑦 = 0, maka
digunakan ratio estimator. Difference estimator dan regression estimator digunakan jika 𝑥 = 0
namun 𝑦 ≠ 0. Hubungan 𝑥 dan 𝑦 mendekati linier namun garisnya tidak melalui titik origin.
Perbedaaannya adalah difference estimator digunakan jika nilai 𝑐 atau 𝑘 (gradien) diketahui,
sedangkan pada regression estimator nilai 𝑐 atau 𝑘 (gradien) harus dicari terlebih dahulu.

b. Persamaan dan Perbedaan


Metode Penduga Perbedaan Persamaan
Garisnya melalui titik origin
Rasio
(0,0) Suatu metode estimasi dengan
Garis linier tidak melalui mengambil manfaat hubungan
titik origin, nilai 𝑐 atau 𝑘 yang kuat antara variabel
Regresi
(gradien) dicari terlebih pendukung, 𝑥𝑖 dengan variabel
dahulu. yang diteliti 𝑦𝑖 . Syaratnya
Garis liniernya tidak adalah jumlah populasi 𝑋 dari
Beda melalui titik origin, nilai 𝑐 𝑥𝑖 harus diketahui.
atau 𝑘 (gradien) diketahui.

Contoh penerapan:
➢ Penduga Rasio
𝑥 = 0 dan 𝑦 = 0
misal: 𝑥 = luas lahan pertanian
𝑦 = produksi padi
Jika 𝑥 = 0 (lahan pertanian tidak ada), otomatis 𝑦 = 0 (jika tidak ada lahan pertanian mana
mungkin ada padi).

➢ Penduga Regresi
𝑥 = 0 dan 𝑦 ≠ 0
misal: 𝑥 = jumlah pupuk yang digunakan
𝑦 = produksi padi
Jika 𝑥 = 0 (petani menanam tidak memakai pupuk), nilai 𝑦 ≠ 0 (produksi padi akan tetap
ada).

Nilai 𝑐 atau 𝑘 (gradien) harus dicari terlebih dahulu.

156
➢ Penduga Beda
Sama seperti penduga regresi, tetapi nilai 𝑐 atau 𝑘 (gradien) diketahui dari survei sebelumnya
ataupun survei pendahuluan. Penduga beda digunakan untuk melihat perbedaan nilai suatu
karakteristik yang sama dari repeated survey.

c. Penduga regresi mempunyai efisiensi yang sama dengan penduga SRS hanya jika variabel 𝑥 dan
𝑦 tidak berkorelasi (𝜌 = 0)
Bukti:
1−f 2
𝑣(𝑦̅𝐿𝑅 ) n 𝑠𝑦 (1 − 𝜌2 )
= = 1 − 𝜌2
𝑣(𝑦̅𝑆𝑅𝑆 ) 1−f 2
n 𝑠𝑦
2
Nilai 1 − 𝜌 akan selalu lebih kecil atau sama dengan 1, sehingga penduga SRS akan sama efisien
dengan penduga regresi hanya jika 𝜌 = 0.

2. Diketahui:
Populasi 𝑁 = 1200
Sampel 𝑛 = 20
Dimana,
𝑋~ Jumlah produksi sapi perah hasil sensus di periode sebelumnya (dalam liter)
𝑌~ Jumlah produksi sapi perah hasil survei (dalam liter)
𝑁

𝑋 = ∑ 𝑥𝑖 = 3300000
𝑖=1

Sehingga diperoleh:
𝑋
𝑋̅ = = 2750
𝑁
∑𝑛𝑖=1 𝑥𝑖 62325
𝑥̅ = = = 3116,25
𝑛 20
∑𝑛𝑖=1 𝑦𝑖 62065
𝑦̅ = = = 3103,25
𝑛 20
𝑛
2
(𝑥𝑖 − 𝑥̅ )2
𝑠𝑥 = ∑ = 7815407,566
𝑛−1
𝑖=1
𝑛
(𝑦𝑖 − 𝑦̅)2
𝑠𝑦2 = ∑ = 7182408,618
𝑛−1
𝑖=1
𝑠𝑥𝑦
𝜌̂ = = 0,95576
𝑠𝑥 𝑠𝑦

Metode Ratio Estimator


𝑦̅
𝑅̂ = = 0,9958283193
𝑥̅
𝑌̂𝑅 = 𝑅̂ 𝑋 = 3286233,454
1−f
𝑣(𝑌̂𝑅 ) = 𝑁 2 × × [𝑠𝑦2 + 𝑅̂ 2 𝑠𝑥2 − 2𝜌̂𝑅̂𝑠𝑥 𝑠𝑦 ] = 47498541530
n

157
𝑠𝑒(𝑌̂𝑅 ) = √𝑣(𝑌̂𝑅 ) = 217941,6012

Interpretasi:
Dengan menggunakan metode ratio estimator, perkiraan jumlah produksi susu sapi perah adalah
sebesar 3286233,454 liter dengan standard error (penyimpangan terhadap total sebenarnya)
sebesar 217941,6012 liter.

Metode Regression Estimator


𝑠𝑥𝑦
𝑏= = 0,916241867
𝑠𝑥2
𝑦̅𝐿𝑅 = 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅ ) = 2767,676416
𝑌̂𝐿𝑅 = 𝑁 ∙ 𝑌̂𝐿𝑅 = 3321211,699
1−f
𝑣(𝑌̂𝐿𝑅 ) = 𝑁 2 × × [𝑠𝑦2 + 𝑏 2 𝑠𝑥2 − 2𝜌̂𝑏𝑠𝑥 𝑠𝑦 ] = 43993741950
n
𝑠𝑒(𝑌̂𝐿𝑅 ) = √𝑣(𝑌̂𝐿𝑅 ) = 209746,8521
Interpretasi:
Dengan menggunakan metode regression estimator, perkiraan jumlah produksi susu sapi perah
adalah sebesar 3321211,699 liter dengan standard error (penyimpangan terhadap total
sebenarnya) sebesar 209746,8521 liter.

Efisiensi
𝑣(𝑦̅𝐿𝑅 ) 43993741950
𝑅𝐸 = = = 0,9262124801
𝑣(𝑦̅𝑅 ) 47498541530
Interpretasi:
Karena 𝑅𝐸 < 1, maka 𝑣(𝑦̅𝐿𝑅 ) < 𝑣(𝑦̅𝑅 ) sehingga penduga regresi lebih efisien daripada penduga
rasio.
Karena 𝑣(𝑦̅𝐿𝑅 ) < 𝑣(𝑦̅𝑅 ), sehingga dalam perkiraan jumlah produksi susu sapi perah, penduga
regresi lebih presisi/akurat dibandingkan penduga rasio.

3. “Stratified PPS Cluster Sampling” Provinsi Kepulauan Riau Estimasi Jumlah Penduduk
a. Pengambilan sampel secara klaster (sekumpulan elemen-elemen yang tidak saling tumpang
tindih) dengan memerhatikan size cluster saat memilih klaster, dan sebelumnya klaster telah
dikelompokkan menjadi strata-strata tertentu.
Strata : Jumlah penduduk berdasarkan sensus terdekat
Klaster : Kabupaten atau Kota
Size : Jumlah penduduk berdasarkan sensus terdekat

b. Populasi : Seluruh penduduk Kepulauan Riau


Populasi Target : Seluruh penduduk Kepulauan Riau
Kerangka Sampel : Kabupaten/Kota Provinsi Kepulauan Riau
Unit Sampling : Kabupaten/Kota Provinsi Kepulauan Riau
Unit Analisis : Penduduk Klaster terpilih
Nilai Karakteristik : Total Penduduk

158
c. Rumus estimasi
Untuk tiap-tiap strata:
➢ Rata-rata strata
∑𝑛𝑖=1

z̅ℎ 𝑖
z̅ℎ =
𝑛ℎ
𝑀ℎ 𝑖 𝑦̅ℎ 𝑖
z̅ℎ 𝑖 =
𝑀0ℎ 𝑝ℎ 𝑖
➢ Total per strata
Ẑℎ = 𝑁ℎ 𝑀0ℎ z̅ℎ

➢ Rata-rata keseluruhan

z̅𝑛 =
𝑁𝑀0
➢ Total keseluruhan
𝐿

Ẑ = ∑ Ẑℎ
ℎ=1

Untuk tiap-tiap strata, jika PPS WOR dengan size banyaknya elemen
❖ Varians rata-rata strata
𝑁
1 2
𝑣(z̅ℎ ) = ∑(𝑦̅ℎ 𝑖 − 𝑦̅ℎ )
𝑛ℎ (𝑛ℎ − 1)
𝑖=1
❖ Varians total strata
𝑣(Ẑℎ ) = 𝑁ℎ2 𝑀02ℎ 𝑣(z̅ℎ )

❖ Varians rata-rata keseluruhan


𝑣(Ẑ)
𝑣(z̅𝑛 ) = 2 2
𝑁 𝑀0
❖ Varians total keseluruhan
𝐿

𝑣(Ẑ) = ∑ 𝑣(Ẑℎ )
ℎ=1
4. Stratified Unequal Cluster Sampling
𝑁 = 60 𝑀0 = 624 buah mesin
𝑁1 = 24 𝑛1 = 3 𝑀01 = 192
𝑁2 = 36 𝑛2 = 3 𝑀0 2 = 432
Karena 𝑀0 diketahui maka menggunakan 3 cara:
Didapatkan nilai-nilai statistik sebagai berikut:

𝑀𝑖 624
̅ = ∑𝑁
𝑀 𝑖=1 = = 10,4 ̅1 = 192 = 8
𝑀 ̅2 = 432 = 12
𝑀
𝑁 60 24 36

∑3𝑖=1 𝑀𝑖 𝑦̅𝑖 (6 × 4) + (7 × 5) + (8 × 6) 107


𝑦̅1∗ = = = = 3,4294871795
𝑛𝑀̅ 3 × 10,4 31,2
∑3𝑖=1 𝑀𝑖 𝑦̅𝑖 (10 × 14) + (11 × 15) + (12 × 16) 497
𝑦̅2∗ = = = = 15,929487179
𝑛𝑀̅ 3 × 10,4 31,2

159
2
𝑀𝑖 𝑦̅𝑖
∑𝑛𝑖=1 ( ̅ − 𝑦̅ℎ )
𝑣(𝑦̅1∗ ) = (1 − f) 𝑀
𝑛(𝑛 − 1)

24 2 35 2 48 2
3 (10,2−3,4294871795) +(10,2−3,4294871795) +(10,2−3,4294871795)
= (1 − 24
) 3(3−1)

21 1,158951297 + 0,000003554628225 + 1,629184639


= ×
24 6
21 2,78813949
= ×
24 6
𝑣(𝑦̅1∗ ) = 0,4066036757

2
𝑀𝑖 𝑦̅𝑖
∑𝑛𝑖=1 ( ̅ − 𝑦̅ℎ )
𝑣(𝑦̅2∗ ) = (1 − f) 𝑀
𝑛(𝑛 − 1)
140 2 165 2 192 2
3 (10,2−15,929487179) +(10,2−15,929487179) +(10,2−15,929487179)
= (1 − 36
) 3(3−1)
33 4,857602701 + 0,06100080444 + 8,375480445
= ×
36 6
33 13,29408395
= ×
36 6
𝑣(𝑦̅2∗ ) = 2,031040604

Penduga varians total:


2 2
∑𝑛 𝑀 𝑦̅
̅ℎ 𝑖=1 𝑖 𝑖 = ∑ 𝑁ℎ 𝑀
𝑌̂𝑠𝑡 = ∑ 𝑁ℎ 𝑀 ̅ℎ 𝑦̅𝑖∗
̅
𝑛𝑀
ℎ=1 ℎ=1

= (24 × 8 × 3,4294871795) + (36 × 12 × 15,929487179)

= 658,4615385 + 6881,538461

𝑌̂𝑠𝑡 = 7540

Penduga varians total:


2
2 𝑀𝑖 𝑦̅𝑖
∑𝑛𝑖=1 ( ̅ − 𝑦̅ℎ )
𝑣(𝑌̂𝑠𝑡 ) = ∑ 𝑁ℎ2 𝑀
̅ℎ2 (1 − f) 𝑀
𝑛(𝑛 − 1)
ℎ=1
2
̅ℎ2 𝑣(𝑦̅ℎ∗ )
= ∑ 𝑁ℎ2 𝑀
ℎ=1
= (242 × 82 × 0,4066036757) + (362 × 122 × 2,031040604)
= 14989,0379 + 379040,9217
̂
𝑣(𝑌𝑠𝑡 ) = 394029,9596

𝑠𝑒(𝑌̂𝑠𝑡 ) = √𝑣(𝑌̂𝑠𝑡 ) = 627,7180574

160
Confidence Interval:

𝑃 [𝑌̂𝑠𝑡 − Zα 𝑠𝑒(𝑌̂𝑠𝑡 ) < 𝑌 < 𝑌̂𝑠𝑡 + Zα 𝑠𝑒(𝑌̂𝑠𝑡 )] = 95%


2 2

𝑃[7540 − (1,96 × 627,7180574) < 𝑌 < 7540 + (1,96 × 627,7180574)] = 95%

𝑃[6309,672607 < 𝑌 < 8770,327393] = 95%

𝑠𝑒(𝑌̂𝑠𝑡 ) 627,7180574
𝑅𝑆𝐸 = × 100% = × 100% = 8,325%
𝑌̂𝑠𝑡 7540

Interpretasi :

Perkiraan total produksi sepatu per hari dari Perusahaan Sepatu merk “DRA” sekitar 7540 (dalam
ratusan pasang) dengan penyimpangan terhadap total sebenarnya sekitar 627,7180574. Dengan
selang kepercayaan 95%, perkiraan total produksi sepatu per hari antara 6310 sampai 8770 (dalam
ratusan pasang) dengan tingkat ketelitian yang kita duga sebesar 91,675% ( 100% − 𝑅𝑆𝐸).

161
POLITEKNIK STATISTIKA STIS JAKARTA
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2018/2019
==================================================

MATA KULIAH : MPC2

TINGKAT : II (Dua) Prodi D4 Statistika

DOSEN : Tim Dosen

HARI/TANGGAL : Jumat/ 15 Maret 2019

WAKTU : 120 menit

SIFAT UJIAN : Tutup buku namun boleh buka rumus)

==================================================

∑𝑛
𝑖=1 𝑥𝑖 ∑𝑛
𝑖=1 𝑦𝑖
1. Jika 𝑥̅ = 𝑛
dan 𝑦̅ =
yang diperoleh dari 𝑛 elemen sampel yang dipilih secara SRS (dari 𝑁
𝑛
elemen populasi), sehingga masing-masing merupakan unbiased estimator dari parameter 𝑋̅ =
∑𝑁
𝑖=1 𝑥𝑖 ∑𝑁
𝑖=1 𝑦𝑖 𝑦̅
𝑁
dan 𝑌̅ = 𝑁
. Maka rasio sampel 𝑅̂ = 𝑥̅ merupakan unbiased estimator bagi parameternya
𝑌̅
𝑅 = 𝑋̅.
a. Tuliskan formula bias dari penduga rasio tersebut
𝑦̅
b. Buktikan dengan angka fiktif, bahwa 𝑅̂ = merupakan penduga yang bias.
𝑥̅

2. Seorang peneliti industri kecil melakukan penelitian terhadap usaha masyarakat yang memproduksi
sepatu di suatu wilayah. Untuk mendukung penelitiannya, diambil sampel di wilayah tersebut
sebanyak 10 rumah tangga secara acak sederhana tanpa pengembalian (SRS-WOR). Diketahui di
wilayah tersebut ada sebanyak 100 rumah tangga yang mengusahakan industri sepatu dengan mesin
yang dimilikinya yang seluruhnya berjumlah 450 mesin. Dari hasil wawancara terhadap 10 rumah
tangga usaha sepatu yang terpilih sampel, diperoleh informasi sebagai berikut:

No urut ruta 1 2 3 4 5 6 7 8 9 10 Jumlah


Jumlah mesin untuk
9 5 7 8 9 4 4 6 3 5 60
industri rumah tangga (𝑥𝑖 )
Hasil produksi sepatu
65 45 57 60 58 40 43 50 35 47 500
(dalam satuan pasang/𝑦𝑖 )

Berdasarkan informasi diatas, perkirakan statistik rata-rata produksi sepatu per-industri rumah
tangga, standar error, dan relative standar error (rse)-nya dengan:

a. penduga rasio (gunakan 4 digit dibelakang koma)!


b. penduga regresi (gunakan 4 digit dibelakang koma)!

162
3. Cluster sampling adalah salah satu teknik sampling berpeluang dimana setiap unit samplingnya
memiliki peluang yang sama untuk dipilih sebagai sampel (equal probability sampling). Dalam
kegiatan survei skala besar, cluster sampling ini paling sering digunakan. Berdasarkan hal tersebut:
a. Jelaskan pengertian cluster sampling berikut kelemahan dan kelebihannya!
b. Jika seseorang ingin meneliti tentang produktifitas petani tanaman padi di sebuah Kabupaten di
propinsi Maluku Utara menggunakan metode “Stratified Cluster Systematic Sampling” dengan
clusternya adalah semua desa/kelurahan yang ada di kabupaten tersebut, Jelaskan arti dari
metode sampling tersebut, sertai jawaban anda dengan menyebutkan Populasi, Populasi Target,
Kerangka Sampel, Unit Sampling, Unit Analisis dan Nilai Karakteristik yang diestimasi dari
penelitian tersebut!

4. Diketahui suatu akademi memiliki 24 kelas yang masing-masing kelas terdiri dari 8 mahasiswa.
Untuk memperkirakan jumlah buku statistik yang dimiliki oleh mahasiswa, dilakukan pengambilan
sampel secara SRS WOR sebanyak 4 kelas, kemudian dilakukan wawancara terhadap semua
mahasiswa yang berada pada kelas terpilih. Data yang diperoleh:
No urut sampel Mahasiswa
kelas 1 2 3 4 5 6 7 8
1 3 1 6 8 2 2 4 2
2 7 2 4 4 9 8 7 4
3 6 1 2 9 2 6 4 5
4 8 4 8 1 4 3 8 8
Perkirakan total buku statistik yang dimiliki mahasiswa di akademi tersebut beserta standard error
dan rse-nya!

5. PPS sampling dapat diterapkan dalam sampling Cluster. Salah satu syarat digunakannya PPS adalah
adanya korelasi positif antara size yang digunakan dalam PPS dengan variable yang akan diteliti
dalam survei. Terkait size, maka jawablah pertanyaan di bawah ini:
a. Jelaskan, kenapa size dengan nilai korelasi yang tidak terlalu kuat akan menyebabkan estimasi
akan cenderung bias?
b. Terdapat hubungan antara nilai Efisiensi cluster PPS terhadap SRS dengan cluster size (𝑀𝑖).
Jelaskan bentuk hubungan tersebut?

163
PEMBAHASAN SOAL UTS GENAP TAHUN 2018/2019
METODE PENARIKAN CONTOH II

1. Penduga Rasio (Ratio Estimator)


a. Formula bias dari penduga rasio tersebut dapat dituliskan sebagai berikut.

𝑋̅𝐸(𝑅̂ ) 𝑌̅ 𝐸(𝑥̅ )𝐸(𝑅̂ ) − 𝐸(𝑦̅) 𝐸(𝑥̅ )𝐸(𝑅̂ ) − 𝐸(𝑅̂ 𝑥̅ )


𝐵(𝑅̂ ) = 𝐸(𝑅̂ ) − 𝑅 = − = =
𝑋̅ 𝑋̅ 𝑋̅ 𝑋̅
(𝑅̂ , 𝑥̅ )
𝐵(𝑅̂ ) = −𝐶𝑜𝑣(
𝑋̅
(𝑅,𝑥̅ ) ̂
Jadi, formula bias dari penduga rasio tersebut adalah 𝐵(𝑅̂ ) = −𝐶𝑜𝑣( ̅
𝑋

b. Misalkan kita buat suatu data populasi sebagai berikut.


X Y ∑𝑋 𝑌̅ 3
∑ 𝑋 = 6 → 𝑋̅ = =2 𝑅= =
3 𝑋̅ 2
1 1
2 3 ∑ 𝑌 = 9 → 𝑌̅ =
∑𝑌
=3
3
3 5

Lalu, kita akan ambil satu sampel, sehingga all posible sample-nya adalah sebagai berikut
X Y X Y X Y
1 1 2 3 3 5
3 5
𝑅̂1 = 1 𝑅̂2 = 𝑅̂1 =
2 3

3 5
∑ 𝑅̂𝑖 1 + 2 + 3 25
𝐸(𝑅̂ ) = = =
𝑛 3 18
25 3
𝐸(𝑅̂ ) = ≠
18 2
𝑦̅
Jadi, terbukti bahwa 𝑅̂ = 𝑥̅ merupakan penduga bias dari 𝑅 karena 𝐸(𝑅̂ ) ≠ 𝑅.

2. Diketahui:
Populasi 𝑁 = 100
Sampel 𝑛 = 10
Dimana,
𝑋~ Jumlah mesin untuk industri rumah tangga
𝑌~ Hasil produksi sepatu (dalam satuan pasang)

𝑋 = ∑ 𝑥𝑖 = 450
𝑖=1

164
Sehingga diperoleh:
𝑋 450
𝑋̅ = = = 4,5
𝑁 100
𝑛
∑𝑖=1 𝑥𝑖 60
𝑥̅ = = =6
𝑛 10
𝑛
∑𝑖=1 𝑦𝑖 500
𝑦̅ = = = 50
𝑛 10
𝑛
(𝑥𝑖 − 𝑥̅ )2
𝑠𝑥2 = ∑ = 4,6667
𝑛−1
𝑖=1
𝑛
(𝑦𝑖 − 𝑦̅)2
𝑠𝑦2 =∑ = 94
𝑛−1
𝑖=1
𝑠𝑥𝑦 20,3333
𝜌̂ = = = 0,9708
𝑠𝑥 𝑠𝑦 2,1602 × 9,6954

a. Penduga Rasio
𝑦̅ 50
𝑅̂ = = = 8,3333
𝑥̅ 6
𝑦̅𝑅 = 𝑅̂ 𝑋̅ = 8,3333 × 4,5 = 37,5
1−f
𝑣(𝑦̅𝑅 ) = × [𝑠𝑦2 + 𝑅̂ 2 𝑠𝑥2 − 2𝜌̂𝑅̂𝑠𝑥 𝑠𝑦 ] = 7,1267
n

𝑠𝑒(𝑦̅𝑅 ) = √𝑣(𝑦̅𝑅 ) = 2,6696

𝑠𝑒(𝑦̅𝑅 )
𝑟𝑠𝑒(𝑦̅𝑅 ) = × 100% = 7,1189%
𝑦̅𝑅

Interpretasi:

Dengan menggunakan metode ratio estimator, perkiraan rata-rata produksi sepatu per industri
rumah tangga adalah sebesar 37,5 pasang sepatu dengan standard error (penyimpangan
terhadap total sebenarnya) sebesar 2,6696 pasang dan relative standar error sebesar 7,1189%

b. Penduga Regresi
𝑠𝑥𝑦 20,3333
𝑏= = = 4,3571
𝑠𝑥2 4,6667
𝑦̅𝐿𝑅 = 𝑦̅ + 𝑏(𝑋̅ − 𝑥̅ ) = 50 + 4,3571(4,5 − 6) = 43,4643
1−f
𝑣(𝑦̅𝐿𝑅 ) = × [𝑠𝑦2 + 𝑏 2 𝑠𝑥2 − 2𝜌̂𝑏𝑠𝑥 𝑠𝑦 ] = 0,4864
n
𝑠𝑒(𝑦̅𝐿𝑅 ) = √𝑣(𝑦̅𝐿𝑅 ) = 0,6974
𝑠𝑒(𝑦̅𝐿𝑅 )
𝑟𝑠𝑒(𝑦̅𝐿𝑅 ) = × 100% = 1,6046%
𝑦̅𝐿𝑅

Interpretasi:
Dengan menggunakan metode regression estimator, perkiraan rata-rata produksi sepatu per
industri rumah tangga adalah sebesar 43,4643 pasang sepatu dengan standard error

165
(penyimpangan terhadap total sebenarnya) sebesar 0,6974 pasang dan relative standar error
sebesar 1,6046%.

3. Cluster Sampling
a. Cluster Sampling adalah suatu metode penarikan sampel di mana unit penarikan sampel (unit
sampling)-nya adalah merupakan kumpulan elemen-elemen yang tidak saling tumpang tindih.
Cluster Sampling dilakukan ketika daftar kerangka contoh yang memuat seluruh unit-unit
analisis dalam populasi tidak tersedia secara lengkap dan mutakhir, dan biaya untuk membuat
daftar kerangka contoh sangat mahal, serta biaya transportasi antar unit-unit contoh sangat
mahal dan tidak sebanding dengan biaya untuk penelitian per unit contoh. Cluster Sampling
memiliki beberapa kelebihan dan kelemahan sebagai berikut.
Kelebihan Kelemahan
• Pengumpulan data untuk elemen yang
berdekatan mudah, cepat, dan secara
operasional lebih baik/nyaman
Standard error yang dihasilkan sering
lebih tinggi dibandingkan dengan
• Biaya kecil dibanding SRS pada
metode sampling lain, karena listing
penghematan waktu perjalanan,
unit dalam klaster yang sama sering
identifikasi, kontak, dll
homogen
• Dapat dilakukan ketika kerangka
sampling dari elemen tidak tersedia
dengan mudah

b. Stratified Cluster Systematic Sampling adalah metode pengambilan sampel secara sistematik di
dalam klaster, dan sebelumnya klaster telah dikelompokkan menjadi strata-strata tertentu.
Populasi : Seluruh petani padi di sebuah kabupaten di Provinsi Maluku Utara
Populasi Target : Seluruh petani padi di sebuah kabupaten di Provinsi Maluku Utara
Kerangka Sampel : Data petani padi di setiap desa/kelurahan di kabupaten tersebut
Unit Sampling : Petani padi di setiap desa/kelurahan di kabupaten tersebut
Unit Analisis : Petani terpilih di desa/kelurahan terpilih
Nilai Karakteristik : Produktivitas petani padi

4. Diketahui:
𝑁 = 24 𝑛 = 4 𝑀 = 8
𝑀
𝑦1𝑗 3 + 1 + 6 + 8 + 2 + 2 + 4 + 2 28
𝑦̅1. = ∑ = = = 3,5
𝑀 8 8
𝑗=1

𝑀
𝑦2𝑗 7 + 2 + 4 + 4 + 9 + 8 + 7 + 4 45
𝑦̅2. = ∑ = = = 5,625
𝑀 8 8
𝑗=1
𝑀
𝑦3𝑗 6 + 1 + 2 + 9 + 2 + 6 + 4 + 5 35
𝑦̅3. = ∑ = = = 4,375
𝑀 8 8
𝑗=1

𝑀
𝑦4𝑗 8 + 4 + 8 + 1 + 4 + 3 + 8 + 8 44
𝑦̅4. = ∑ = = = 5,5
𝑀 8 8
𝑗=1

166
𝑛
𝑦̅𝑖. 3,5 + 5,625 + 4,375 + 5,5 19
𝑦̅𝑛 = ∑ = = = 4,75
𝑛 4 4
𝑖=1
𝑦̅ = 𝑀𝑦̅𝑛 = 8 × 4,75 = 38
𝑛
(𝑦𝑖. − 𝑦̅)2 (28 − 38)2 + (45 − 38)2 + (35 − 38)2 + (44 − 38)2
𝑠𝑏2 =∑ = = 64,6667
𝑛−1 3
𝑖=1

𝑌̂𝑐 = 𝑁𝑦̅ = 24 × 38 = 912


𝑁−𝑛 2 24 − 4
𝑣(𝑌̂𝑐 ) = 𝑁 2 ( ) 𝑠𝑏 = 242 ( ) × 64,6667 = 7760
𝑁𝑛 24 × 4

𝑠𝑒(𝑌̂𝑐 ) = √𝑣(𝑌̂𝑐 ) = √7760 = 88,0909


𝑠𝑒(𝑌̂𝑐 )
𝑟𝑠𝑒(𝑌̂𝑐 ) = × 100% = 9,6591%
𝑌̂𝑐
Jadi, perkiraan total buku statistik yang dimiliki mahasiswa di akademi tersebut sebanyak 912 buku
dengan standar error-nya sebesar 88,0909 serta relative standar error-nya sebesar 9,6591%.

5. PPS Cluster Sampling


a. Dalam PPS cluster sampling jika kita menggunakan size yang memiliki nilai korelasi yang tidak
terlalu kuat akan menyebabkan estimasi cenderung bias. Hal ini disebabkan jika nilai size yang
digunakan adalah elemen. Jika elemen yang digunakan memiliki korelasi yang tidak kuat dengan
variabel yang diteliti, maka akan menyebabkan underestimate atau overestimate, atau dengan
kata lain estimasi yang dihasilkan akan cenderung bias.

b. Untuk menghitung nilai efisiensi cluster PPS terhadap SRS, digunakan rumus sebagai berikut.
𝜎2
𝑅𝐸 = 𝑀̅ 𝑏
𝜎2
Kita lihat bahwa untuk menghitung nilai efisiensi cluster PPS terhadap SRS, dibutuhkan
komponen 𝑀 ̅ = 1 ∑𝑀𝑖 , sehingga rumus 𝑅𝐸 tersebut dapat juga ditulis sebagai berikut.
̅ dimana 𝑀
𝑁

𝑁
𝜎𝑏2 1 𝜎𝑏2
̅
𝑅𝐸 = 𝑀 = ∑ 𝑀𝑖 2
𝜎2 𝑁 𝜎
𝑖=1

Dapat kita lihat bahwa nilai efisiensi cluster PPS terhadap SRS memiliki hubungan dengan cluster
size (𝑀𝑖 ) dan hubungannya berbanding lurus.

167
UJIAN TENGAH SEMESTER GENAP TAHUN AKADEMIK 2019/2020
MATA KULIAH : Metode Penarikan Contoh II
TINGKAT : II (Dua) Prodi D4 Statistika
DOSEN : Tim Dosen
HARI/TANGGAL : Kamis/5 Maret 2020
WAKTU : 120 menit
SIFAT UJIAN : Tutup buku namun boleh buka rumus

1. Dalam mengestimasi hasil dari kegiatan survei sering kali digunakan variabel pembantu
(auxilliary variable), yaitu variabel yang memiliki hubungan (correlation) yang kuat dengan
variabel yang diteliti, sebagai metode untuk memperkecil nilai varians sehingga dapat
meningkatkan presisi estimator-nya. Beberapa metode yang menggunakan variabel pembantu
tersebut adalah penduga rasio, regresi dan beda. Berdasarkan hal tersebut :
a. Jelaskan alasan penggunaan metode penduga rasio, regresi dan beda!
b. Jelaskan persamaan dan perbedaan metode penduga rasio, regresi dan beda, lengkapi
jawaban anda dengan contoh penerapannya!
c. Pada kondisi bagaimana penduga regresi mempunyai efisiensi yang sama dengan penduga
SRS dan penduga rasio? Buktikan masing-masing melalui rumus!

2. Penduduk yang padat, selalu memberikan berbagai dampak positif dan negatifnya. Salah satunya
peningkatan kejadian kecelakaan lantas. Jakarta yang terkenal dengan penduduknya yang padat
memang memiliki catatan kejadian kecelakaan lantas yang tinggi. pengendara yang terburu-buru,
melawan arus, sambil menelpon/chating, dan lain-lain diberitakan menjadi penyebab kecelakaan
lantas. Berbagai upaya sebenarnya sudah dilakukan oleh pemerintahan melalui kepolisian
setempat untuk mengurangi kejadian kecelakaan tersebut, akan tetapi catatan kecelakaan tetap
tinggi, bahkan mengalami peningkatan. Informasi mengenai kejadian kecelakaan lantas sangat
diperlukan bagi kepolisian setempat untuk merencanakan berbagai upaya pencegahannya
sekaligus evaluasi upaya pencegahan yang sudah dilakukan. Sebuah penelitian yang dilakukan di
11 kecamatan dari 44 kecamatan di Jakarta dilakukan secara acak tanpa pengembalian untuk
memperkirakan kejadian kecelakaan lantas di Jakarta berdasarkan jumlah total kepemilikan
kendaraan bermotor dan data yang diperoleh seperti terlihat pada Tabel 1.
Tabel 1. Jumlah Kejadian Kecelakaan per bulan berdasarkan Kecamatan dan Jenis Kendaraan
Tahun X
Jumlah kendaraan yang dimiliki penduduk Jumlah kejadian
Kecamatan (ribu unit) kecelakaan per
Motor Mobil bulan
1 271.5 69.3 9
2 420.3 56.1 12
3 272.4 69.3 8
4 331.4 89.1 10
5 445.5 81.2 10
6 232.7 119.8 13
7 368.1 62.4 9

168
8 397.2 99 10
9 324.1 106.1 11
10 294.5 87.3 9
11 290 78.9 9
Berdasarkan hal tersebut bila anda diminta membantu mengestimasi kejadian kecelakaan lantas,
maka jawablah beberapa hal berikut :
a. Diantara metode estimasi rasio dan regresi, mana yang akan kalian sarankan untuk
digunakan dalam estimasi yang dimaksud?
b. Berdasarkan jawaban poin a, berapa estimasi rata-rata kejadian kecelakaan lantas per bulan
di tiap kecamatan di Jakarta? Berapa pula relative standar error-nya? Beri interpretasi!
Diketahui jumlah kepemilikan mobil di Jakarta pada Tahun X adalah sebesar 3,5 juta unit dan
motor sebesar 9,6 juta unit.

3. Dalam penarikan sampel dari populasi yang heterogen, seringkali digunakan teknik
pengelompokan dengan tujuan memperoleh hasil pendugaan yang lebih efisien baik dari sisi
biaya (cost) maupun dari tingkat keragamannya. Beberapa teknik pengelompokan yang bisa
digunakan diantaranya metode stratifikasi, metode klaster maupun gabungan antara keduanya.
a. Jelaskan perbedaan metode stratified random sampling dan metode cluster sampling.
b. Jelaskan keuntungan dan kerugian menggunakan metode cluster sampling dibandingkan
simple random sampling, serta jelaskan bagaimana mengukur perbandingan antara cluster
sampling dan simple random sampling!
c. Berikan contoh penggunaan metode stratified random sampling, metode cluster sampling
dan metode gabungan keduanya (stratified cluster sampling)!

4. Suatu penelitian dilakukan untuk mengetahui omzet penjualan barongko per bulan dari suatu
UMKM dengan merk “HAYATI”. Usaha ini diketahui memiliki 60 lokasi penjualan yang terbesar
di beberapa tempat, dan setiap lokasi memiliki outlet yang dapat memudahkan penjualan.
Kemudian lokasi tersebut dikelompokkan menjadi 2 strata berdasarkan standar kelas outlet,
dimana strata pertama adalah outlet beromzet besar dan strata kedua adalah outlet beromzet
kecil. Pada strata pertama ada sebanyak 36 lokasi dengan total 432 outlet dari sebanyak 624
outlet yang ada. Kemudian diambil sampel sebanyak 3 lokasi di masing-masing strata dengan SRS
WOR dan data yang diperoleh adalah sebagai berikut :
Tabel 2. Jumlah barongko Terjual berdasarkan Lokasi dan Outlet Tahun X
Jumlah
Lokasi outlet di Jumlah barongko terjual (ratusan bungkus)
setiap lokasi
12 15 18 19 15 21 17 14 10 19 11 13 20
Outlet
dengan 10 12 16 13 18 15 9 19 11 12 15
omzet besar 11 10 20 12 14 13 16 10 11 17 19 23

Outlet 7 5 1 3 7 8 6 5
dengan 8 7 5 9 3 6 3 11 4
omzet kecil 6 2 5 3 5 8 1

169
Berdasarkan data penjualan tersebut, bila diketahui harga per bungkus barongko adalah
Rp3.000,- perkirakan omzet dari penjualan barongko tersebut dalam sebuah confident interval
95 persen beserta relative standard error-nya!

170
PEMBAHASAN SOAL UTS GENAP TAHUN 2019/2020
METODE PENARIKAN CONTOH II
1.
a. Jelaskan alasan penggunaan metode penduga rasio, regresi dan beda!
Alasan penggunaan metode penduga rasio, regresi dan beda adalah untuk mengestimasi
suatu variabel terhadap variabel lainnya dan untuk meningkatkan presisi dari estimasi rata-
rata dan estimasi total.
Rastio estimator adalah suatu metode estimasi yang membandingkan antara variabel yang
diteliti (𝑦) dengan variabel bantu/pendukung (𝑥) untuk meningkatkan efisiensi pendukung
𝑦̅
parameter populasi (𝑅̂ = 𝑟 = ), dan garisnya melalui titik origin (𝑥 = 0 𝑑𝑎𝑛 𝑦 = 0).
𝑥̅
Difference estimator digunakan jika nilai c atau k diketahui. Regression estimator digunakan
jika 𝑥 = 0 namun 𝑦 ≠ 0, kedua metode ini adalah metode estimasi dengan mengambil
manfaat hubungan yang kuat antara 𝑥 dengan variabel 𝑦. Syaratnya adalah jumlah populasi
𝑋 dari 𝑥𝑖 harus diketahui. Hubungan antara 𝑥 dan 𝑦 mendekati linier namun garisnya tidak
melalui titik origin.
b. Jelaskan persamaan dan perbedaan metode penduga rasio, regresi dan beda, lengkapi
jawaban anda dengan contoh penerapannya!
Persamaan dan perbedaan
Metode Penduga Perbedaan Persamaan
Rasio Garisnya melalui titik origin (0,0) Suatu metode estimasi
Garis liniernya tidak melalui titik dengan mengambil
Regresi
origin manfaat hubungan yang
kuat antar variabel
pendukung 𝑥𝑖 , dengan
Nilai c atau k diketahui dan garis variabel yang diteliti 𝑦𝑖 .
Beda Syaratnya adalah jumlah
liniernya tidak melalui titik origin.
populasi 𝑋 dari 𝑥𝑖 harus
diketahui.
Contoh penerapan :
Penduga Rasio
𝑥 = 0 𝑑𝑎𝑛 𝑦 = 0
Misal : 𝑥 = 𝑙𝑢𝑎𝑠 𝑙𝑎ℎ𝑎𝑛 𝑝𝑒𝑟𝑡𝑎𝑛𝑖𝑎𝑛
𝑦 = 𝑝𝑟𝑜𝑑𝑢𝑘𝑠𝑖 𝑝𝑎𝑑𝑖
Jika 𝑥 = 0 (lahan pertanian tidak ada), maka 𝑦 = 0 (jika tidak ada lahan pertanian maka tidak
memproduksi padi)
Penduga Regresi
𝑥 = 0 𝑑𝑎𝑛 𝑦 ≠ 0
Misal : 𝑥 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑝𝑢𝑝𝑢𝑘 𝑦𝑎𝑛𝑔 𝑑𝑖𝑔𝑢𝑛𝑎𝑘𝑎𝑛
𝑦 = 𝑝𝑟𝑜𝑑𝑢𝑘𝑠𝑖 𝑝𝑎𝑑𝑖
Jika 𝑥 = 0 (petani menanam tidak memakai pupuk), nilai 𝑦 ≠ 0 (produksi padi akan tetap
ada)

171
Penduga Beda

Nilai 𝑘 sudah diketahui dari survei sebelumnya. Penduga beda digunakan untuk melihat
perbedaan nilai suatu karakteristik yang sama dari repeated survey.

c. Pada kondisi bagaimana penduga regresi mempunyai efisiensi yang sama dengan penduga
SRS dan penduga rasio? Buktikan masing-masing melalui rumus!
Regression estimator akan mempunyai efisiensi yang sama dengan penduga SRS hanya jika
variabel 𝑥 dan 𝑦 tidak berkorelasi (𝜌 = 0)
Bukti :
1−𝑓 2
𝑣(𝑦̅𝑙𝑟 ) 𝑠𝑦 (1 − 𝜌2 )
= 𝑛 = (1 − 𝜌2 )
𝑣(𝑦̅) 1−𝑓 2
𝑛 𝑠𝑦

Nilai (1 − 𝜌2 ) akan selalu lebih kecil atau sama dengan 1, sehingga penduga SRS akan sama
efisien dengan penduga regresi hanya jika 𝜌 = 0.

Regression estimator akan mempunyai efisiensi yang sama dengan ratio estimator hanya jika
𝐶𝑥
𝑏 = 𝑅̂ atau 𝜌 =
𝐶𝑦
Bukti :
1−𝑓 2 1−𝑓 2
𝑣(𝑦̅𝑙𝑟 ) 𝑛 𝑠𝑦 (1 − 𝜌2 ) 𝑛 𝑠𝑦 (1 − 𝜌2 ) (1 − 𝜌2 )
= = =
𝑣(𝑦̅𝑟 ) 1 − 𝑓 2 − 2𝜌𝑅̂ 𝑠 𝑠 + 𝑅̂ 2 𝑠 2 1−𝑓 2 𝑦̅ 𝑠𝑥 𝑦̅ 2 𝑠𝑥 2 𝐶𝑥 𝐶𝑥 2
(𝑠 ) 𝑠 (1 − 2𝜌 + ( ) ( ) ) (1 − 2𝜌 + ( )
𝐶𝑦 )
𝑛 𝑦 𝑦 𝑥 𝑥 𝑦
𝑛 𝑥̅ 𝑠𝑦 𝑥̅ 𝑠𝑦 𝐶𝑦
(1 − 𝜌2 ) (1 − 𝜌2 )
= =
𝐶 𝐶 2 𝐶 𝐶 2
(1 − 2𝜌 𝐶𝑥 + (𝐶𝑥 ) + 𝜌2 − 𝜌2 ) (𝜌2 − 2𝜌 𝐶𝑥 + (𝐶𝑥 ) + 1 − 𝜌2 )
𝑦 𝑦 𝑦 𝑦
(1 − 𝜌 2)
=
2
𝐶
((𝐶𝑥 − 𝜌) + (1 − 𝜌2 ))
𝑦

Persamaan di atas selalu bernilai kurang dari atau sama dengan 1 sehingga secara umum
regresi lebih efisien dari pada ratio estimator.
Regresi akan sama efisien dengan ratio jika :
𝑣(𝑦̅𝑙𝑟 ) (1 − 𝜌2 )
= =1
𝑣(𝑦̅𝑟 ) 𝐶 2
((𝐶𝑥 − 𝜌) + (1 − 𝜌2 ))
𝑦

2
𝐶𝑥
(1 − 𝜌2 ) = ( − 𝜌) + (1 − 𝜌2 )
𝐶𝑦
2
𝐶𝑥 𝐶𝑥 𝐶𝑥
( − 𝜌) = 0 ↔ −𝜌=0↔𝜌=
𝐶𝑦 𝐶𝑦 𝐶𝑦

172
2.
a. Diantara metode estimasi rasio dan regresi, mana yang akan kalian sarankan untuk
digunakan dalam estimasi yang dimaksud?
Metode estimasi yang disarankan untuk digunakan adalah metode estimasi rasio karena
garisnya melalui titik origin (0,0) dimana jika penduduk tidak memiliki kendaraan
(𝑥 = 0 ) maka tidak ada kejadian kecelakaan (𝑦 = 0).

b. Berdasarkan jawaban poin a, berapa estimasi rata-rata kejadian kecelakaan lantas per bulan
di tiap kecamatan di Jakarta? Berapa pula relative standar error-nya? Beri interpretasi!
Jumlah kepemilikan mobil : 𝑋1 = 9,6 𝑗𝑢𝑡𝑎 = 9.600 (𝑟𝑖𝑏𝑢 𝑢𝑛𝑖𝑡)
Jumlah kepemilikan motor : 𝑋2 = 3,5 𝑗𝑢𝑡𝑎 = 3.500 (𝑟𝑖𝑏𝑢 𝑢𝑛𝑖𝑡)
Jumlah kepemilikan kendaraan (mobil dan motor) :
𝑋 = 𝑋1 + 𝑋2 = 13.100 (𝑟𝑖𝑏𝑢 𝑢𝑛𝑖𝑡)
𝑁 = 44
𝑛 = 11
Kecamatan 1 2 3 4 5 6 7 8 9 10 11
Jumlah
kendaraan (𝑥) 340,8 476,4 341,7 420,5 526,7 352,5 430,5 496,2 430,2 381,8 368,9
(ribu unit)
Jumlah
9 12 8 10 10 13 9 10 11 9 9
Kecelakaan (𝑦)

∑𝑛𝑖=1 𝑥𝑖 340,8 + 476,4 + ⋯ + 368,9 4566,2


𝑥̅ = = = = 415,1091
𝑛 11 11
∑𝑛𝑖=1 𝑦𝑖 9 + 12 + ⋯ + 9 110
𝑦̅ = = = = 10
𝑛 11 11
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑠𝑥2 = = 4135,3929
𝑛−1
𝑠𝑥 = 64,3070
∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2
𝑠𝑦2 = = 2,2
𝑛−1
𝑠𝑦 = 1,4832
𝜌 = 0,2465
𝑋 13100
𝑋̅ = = = 297,7273
𝑁 44
𝑦̅ 10
𝑅̂ = = = 0,0241
𝑥̅ 415,1091
𝑦̅𝑅 = 𝑅̂ × 𝑋̅ = 0,0241 × 297,7273 = 7,1723

173
1−𝑓 2 (𝑁 − 𝑛) 2
𝑣(𝑦̅𝑅 ) = (𝑠𝑦 − 2𝑅̂ 𝜌𝑠𝑥 𝑠𝑦 + 𝑅̂ 2 𝑠𝑥2 ) = (𝑠𝑦 − 2𝑅̂ 𝜌𝑠𝑥 𝑠𝑦 + 𝑅̂ 2 𝑠𝑥2 )
𝑛 𝑁𝑛
(44 − 11)
= (2,2 − 2(0,0241)(0,2465)(64,3070)(1,4832)
44 × 11
+ (0,0241)2 (4135,3929)) = 0,2364
𝑠𝑒(𝑦̅𝑅 ) = √𝑣(𝑦̅𝑅 ) = √0,2364 = 0,4862
𝐿𝐶𝐿 = 𝑦̅𝑅 − 1,96 × 𝑠𝑒(𝑦̅𝑅 ) = 7,1723 − 1,96 × 0,4862 = 6,2193
𝑈𝐶𝐿 = 𝑦̅𝑅 + 1,96 × 𝑠𝑒(𝑦̅𝑅 ) = 7,1723 + 1,96 × 0,4862 = 8,1252
√𝑣 (𝑦̅𝑅 ) 0,4862
𝑟𝑠𝑒(𝑦̅𝑅 ) = × 100% = × 100% = 6,78%
𝑦̅𝑅 7,1723

Estimasi rata-rata jumlah kejadian kecelakaan per bulan di setiap kecamatan di Jakarta
adalah sebesar 7,1723 kecelakaan dengan standard error atau penyimpangan sebesar
0,4862. Estimasi rata-rata jumlah kejadian kecelakaan per bulan di setiap kecamatan di
Jakarta berkisar antara 6,2193 sampai 8,1252 kecelakaan dengan relative standard error
sebesar 6,78%.

174
POLITEKNIK STATISTIKA STIS JAKARTA
UJIAN TENGAH SEMESTER GANJIL TAHUN AKADEMIK 2020/2021
========================================================

MATA KULIAH : MPC2

TINGKAT : II (Dua) Prodi D4 Statistika

DOSEN : Tim Dosen

HARI/TANGGAL : Selasa/30 Maret 2021

WAKTU : 120 menit

SIFAT UJIAN : Tutup buku dan gunakan selembar rumus

========================================================

1. Dalam metode pendugaan parameter populasi, seringkali digunakan peubah penyerta


(auxiliary variable) untuk meningkatkan presisi hasil pendugaan. Diantara metode yang
cukup popular adalah Probability Proportional to Size (PPS) sampling dan Generalized
estimator. Beberapa bentuk dari metode Generalized estimator diantaranya adalah Ratio
estimator, Regression estimator dan difference estimator.
Pertanyaan :
a. Jelaskan persamaan dan perbedaan antara metode PPS sampling dan Generalized
estimator.
b. Sifat dari Ratio Estimator adalah bias konsisten. Buktikan !
c. Penduga manakah yang lebih baik di antara Ratio Estimator dan Regression
estimator estimator? Jelaskan!
d. Sebutkan contoh survei yang pendugaan parameternya masing-
masing menggunakan ratio estimator, regression estimator dan difference
estimator!

2. Pemerintah suatu daerah bermaksud untuk mempelajari produksi susu sapi perah yang
menjadi salah satu produksi pertanian andalan di daerah tersebut. 15 desa sampel acak
yang menjadi pusat pengembangan sapi perah dipilih dari total 115 desa, kemudian dicatat
jumlah sapi tiap desa tersebut beserta hasil pendataan di tahun sebelumnya.

Jumlah sapi Jumlah sapi


Desa Tahun Desa Tahun
Saat ini Saat ini
sebelumnya Sebelumnya
1 1129 1141 9 1164 1189
2 1144 1144 10 1130 1137
3 1125 1127 11 1153 1170
4 1138 1153 12 1125 1115
5 1137 1117 13 1116 1130

175
6 1127 1140 14 1115 1118
7 1163 1153 15 1112 1122
8 1153 1146
Diketahui jumlah populasi sapi di tahun sebelumnya sebesar 140968 ekor. Berdasarkan
informasi tersebut, jawab dan jelaskan beberapa hal berikut

a. Perkirakan rata-rata jumlah sapi tiap desa serta total sapi saat ini beserta
standard errornya, dengan menggunakan metode estimasi rasio. Interpretasikan!
b. Bandingkan efisiensi jawaban pada pertanyaan (a) dengan metode estimasi regresi
dan random sampling! Apa yang bisa kamu sarankan dari hasil tersebut. Jelaskan!

3. Klaster sampling adalah suatu metode pengambilan sampel dimana masing-masing unit
sampelnya merupakan kumpulan dari eleman yang tidak tumpang tindih yang disebut
sebagai klaster. Berkaitan dengan ini:

a. Jelaskan alasan perlunya penerapan dari klaster sampling, lengkapi jawaban anda
dengan keuntungan dan kelemahannya.!
∑𝑁 𝑀 ̅ 2
𝑖=1 ∑𝑗=1(𝑦𝑖𝑗 −𝑌)
b. Jika 𝑆 2 = 𝑁𝑀−1
𝑀(𝑁−1)𝑆𝑏2 +𝑁(𝑀−1)𝑆𝑤 2
Buktikan bahwa 𝑆 2 =
𝑁𝑀−1

c. Jelaskan apa yang dimaksud ρ (intracluster correlation coefficient ) dan apa


hubungannya dengan penduga pada klaster sampling?

4. Sebuah penelitian dilakukan di suatu wilayah untuk mengetahui rata-rata pendapatan


rumah tangga per bulan dari unit usaha rumah tangga berbasis online di suatu wilayah
pada tahun 2021. Berdasarkan data dari Kantor BPS setempat diketahui bahwa di wilayah
tersebut ada sebanyak 110 blok sensus (BS) yang terbagi ke dalam 64 BS di perdesaan dan
46 BS di perkotaan. Banyaknya rumah tangga di wilayah perdesaan adalah 7232, dimana
sebanyak 448 diantaranya adalah rumah tangga yang memiliki unit usaha berbasis online.
Sedangkan di wilayah perkotaan ada sebanyak 9108 rumah tangga dengan 690 rumah
tangga diantara juga memiliki unit usaha berbasis online. Kemudian dilakukan
pengambilan sampel BS di masing-masing wilayah dengan menggunakan PPS-WR dan data
yang diperoleh adalah sebagai berikut:

Jumlah rumah
Jumla Jumlah rumah tangga yang
Jumla h BS tangga di memiliki unit
strata Pendapatan rumah tangga per bulan (juta rupiah)
h BS Samp masing-masing usaha online di
el BS terpilih masing-masing
BS terpilih
120 6 0,5 1,2 3,1 0,8 4,2 2,5
Desa 64 3 105 8 1,3 0,6 1,8 3,4 3,8 2,3 4,4 1,7
115 4 3,6 4,1 0,9 2,6

176
180 12 1,1 2,9 3,6 5,2 8,4 4,2 1,9 2,4 3,7 4,6 4,9 6,5
Kota 46 2
210 16 1,3 1,9 2,6 7,4 4,4 5,8 6,3 6,6 5,4 4,9 6,9 8,6 4,8 2,7 2,4 5,2

Berdasarkan informasi tersebut:

a. Jelaskan apa yang menjadi target populasi, unit sampling, unit analisis dan unit
observasi serta auxiliary variable-nya!
b. Masalah apa yang mungkin terjadi dalam mendapatkan unit observasinya?
c. Perkirakan dalam sebuah interval keyakinan 95 persen beserta rse-nya untuk rata-
rata besar pendapatan rumah tangga per bulan dari unit usaha rumah tangga berbasis
online di wilayah tersebut!
d. Interpretasikan hasil yang anda peroleh!

177
PEMBAHASAN SOAL UTS GENAP TAHUN 2020/2021
METODE PENARIKAN CONTOH II

1.
a. PPS merupakan Teknik sampling sekaligus Teknik estimasi dengan menggunakan ukuran dari
auxiliary variabel sebagai bahan dasar pertimbangan peluang suatu unit analisis yang akan
terpilih. Sedangkan Generalizes estimator merupakan metode estimasi bukan metode sampling.
Metode ini menggunakan pendekatan hubungan linier dari variabel amatan (Y) dengan variabel
auxiliary (X) dengan menentukan estimator konstanta k dari populasi dengan k berdasarkan
garis yang terbentuk oleh sampel amatan dan pasangan auxiliary variabelnya.

Perbedaan:
- PPS merupakan salah satu teknik sampling, sedangkan Generalized bukan.
- PPS hubungan antarvariabel tidak harus linier, sedangkan pada Generalized hubungan
antarvariabel lebih baik jika linier.

Persamaan:

- Baik PPS maupun Generalized merupakan salah satu metode estimasi.


- Keduanya menggunakan auxiliary variabel.
- Semakin besar nilai ρ maka semakin efisien estimatornya.

b. Sifat dari Ratio Estimator adalah bias konsisten


Suatu estimator dikatakan bias jika 𝐸(𝜃̂) ≠ 𝜃 atau 𝐸(𝜃̂) − 𝜃 ≠ 0
̂
𝐶𝑜𝑣(𝑅,𝑥̅ )
𝐵(𝑅̂ ) = − 𝑋̅

𝑦̅
𝐶𝑜𝑣(𝑅̂ , 𝑥̅ ) = 𝐸(𝑅̂ 𝑥̅ ) − 𝐸(𝑅̂ )𝐸(𝑥̅ ) dimana 𝑅̂ =
𝑥̅
𝑦̅
𝐶𝑜𝑣(𝑅̂ , 𝑥̅ ) = 𝐸 ( . 𝑥̅ ) − 𝐸(𝑅̂ )𝐸(𝑥̅ )
𝑥̅
𝐶𝑜𝑣(𝑅̂ , 𝑥̅ ) = 𝐸(𝑦̅) − 𝐸(𝑅̂ )𝑥̅

𝐶𝑜𝑣(𝑅̂ , 𝑥̅ )
= 𝑅̂ − 𝐸(𝑅̂ )
𝑋̅
𝐶𝑜𝑣(𝑅̂ , 𝑥̅ )
= −𝐵𝑖𝑎𝑠(𝑅̂ )
𝑋̅
c. Penduga ratio tidak lebih baik dari penduga regresi. Hal ini berdasarkan sifat dari penduga
regresi yang meminimumkan kuadrat error. Selain itu, jika kita bandingkan formula varians
antara penduga ratio dan penduga regresi akan diperoleh hasil akhir sebagai berikut:

𝑣(𝑦̅𝑙𝑟 ) (1 − 𝜌2 )
=
𝑣(𝑦̅𝑅 ) 𝐶
(𝜌 − 𝐶𝑥 ) + (1 − 𝜌2 )
𝑦

178
Penduga regresi akan mempunyai efisiensi yang sama dengan penduga ratio hanya jika 𝑏 = 𝑅̂
𝐶
atau 𝜌 = 𝐶𝑥 . Akan tetapi, jika 𝜌 berbeda dari 𝐶𝑥 ⁄𝐶𝑦 maka efisiensi akan kurang dari 1 atau bisa
𝑦

dipastikan bahwa penduga regresi memiliki presisi yang lebih tinggi (lebih efisien) daripada
penduga ratio.

d. Survei produktivitas petani menggunakan penduga ratio dengan:


Y = Jumlah panen, dan
X = Luas lahan.

Survei jumlah panen buah menggunakan penduga ratio saat:


Y = Jumlah panen, dan
X = Luas lahan atau Jumlah pohon.

Survei jumlah panen buah menggunakan penduga regresi saat:


Y = Jumlah panen, dan
X = Jumlah pupuk/ Jumlah pekerja/ Jumlah panen tahun sebelumnya.

Survei jumlah panen buah menggunakan difference estimator dengan penentuan variabel yang
sama (penduga regresi) namun unit Y yang berbeda. Perbedaan unit tersebut akan menghasilkan
perbedaan populasi keduanya.

2. Diketahui:
n = 15 X = 140968
N = 115 𝑋̅ = 1225,809

a. Dari tabel pada soal diperoleh:


𝑥̅ = 1140,133
𝑦̅ = 1135,4
𝑦̅ 1135,4
𝑅̂ = = = 0,9958
𝑥̅ 1140,133
𝑦̅𝑅 = 𝑅̂ 𝑋̅ = 0,9958 (1225,809) = 1220,72
𝑦̂𝑅 = 𝑁𝑦̅𝑅 = 115 (1220,72) = 140382,8
1−𝑓
= 0,058
𝑛
∑(𝑥𝑖 − 𝑥̅ )2
𝑆𝑥 2 = = 423,6952
𝑛−1
∑(𝑦𝑖 − 𝑦̅)2
𝑆𝑦 2 = = 284,2571
𝑛−1
𝑆𝑥𝑦 = ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) = 278,1571
1−𝑓 2
𝑣(𝑦̅𝑅 ) = (𝑠𝑦 − 2𝑅̂ 𝑠𝑦𝑥 + 𝑅̂ 2 𝑠𝑥2 )
𝑛
𝑣(𝑦̅𝑅 ) = (0,058)[284,2571 − 2(0,9958)(278,1571) + 0,99582 (423,6952)]

𝑣(𝑦̅𝑅 ) = (0,058)(150,437)

179
Estimasi rata-rata:
𝑣(𝑦̅𝑅 ) = 8,720984
𝑆𝑒(𝑦̅𝑅 ) = √𝑣(𝑦̅𝑅 ) = 2,9531
𝑆𝑒(𝑦̅𝑅 ) 2,9531
𝑅𝑆𝐸 = 𝑥 100% = 𝑥 100% = 0,2419%
𝑦̅𝑅 1220,72

Dengan tingkat keyakinan 95% dapat disimpulkan bahwa rata-rata jumlah sapi tiap desa saat ini
mencapai 1221 ekor dengan simpangan sebesar 3 ekor.
Estimasi total:
𝑣(𝑦̂𝑅 ) = 𝑁 2 𝑣(𝑦̂𝑅 ) = 1152 (8,720984) = 115335
𝑆𝑒(𝑦̂𝑅 ) = √𝑣(𝑦̂𝑅 ) = 339,6101
𝑆𝑒(𝑦̂𝑅 ) 339,6101
𝑅𝑆𝐸 = 𝑥 100% = 𝑥 100% = 0,2419%
𝑦̂𝑅 140382,8

Dengan tingkat keyakinan 95% dapat disimpulkan bahwa total jumlah sapi tiap desa saat ini
mencapai 140.383 ekor dengan simpangan sebesar 340 ekor.

b. Perbandingan efisiensi penduga ratio dengan penduga regresi dan SRS

Varians penduga ratio:


1−𝑓 2
𝑣(𝑦̅𝑅 ) = (𝑠𝑦 − 2𝑅̂ 𝑠𝑦𝑥 + 𝑅̂ 2 𝑠𝑥2 )
𝑛
𝑣(𝑦̅𝑅 ) = (0,058)[284,2571 − 2(0,9958)(278,1571) + 0,99582 (423,6952)]
𝑣(𝑦̅𝑅 ) = (0,058)(150,437)
𝑣(𝑦̅𝑅 ) = 8,720984

Varians penduga regresi:


1−𝑓 2
𝑣(𝑦̅𝑙𝑟 ) = (𝑠𝑦 − 2𝑏𝑠𝑥𝑦 + 𝑏 2 𝑠𝑥2 )
𝑛
𝑆𝑥𝑦 278,1571
𝑏= = = 0,6565
𝑆𝑥 2 423,6952
𝑣(𝑦̅𝑙𝑟 ) = (0,058)[423,6952 − 2(0,6565)(278,1571) + (0,65652 )(423,6952)]
𝑣(𝑦̅𝑙𝑟 ) = 2,4275

Varians penduga SRS:


1−𝑓 2
𝑣(𝑦̅𝑆𝑅𝑆 ) = (𝑠𝑦 )
𝑛
𝑣(𝑦̅𝑆𝑅𝑆 ) = (0,058)(284,2571)
𝑣(𝑦̅𝑆𝑅𝑆 ) = 16,4787

Dari ketiga estimasi varians di atas, diperoleh bahwa 𝑣(𝑦̅𝑙𝑟 ) < 𝑣(𝑦̅𝑅 ) < 𝑣(𝑦̅𝑆𝑅𝑆 ). Hal tersebut
menunjukkan bahwa estimator yang paling tinggi presisinya adalah penduga regresi. Sedangkan
penduga SRS memiliki presisi yang paling rendah. Maka disarankan untuk dapat menggunakan

180
penduga regresi karena variansnya minimum dibandingkan metode ratio maupun SRS, dan
memiliki presisi paling tinggi.

3.
a. Cluster sampling memprioritaskan kemuahan pelaksanaan dan efisiensi sumber daya baik dari
segi biaya operasional, tenaga, maupun waktu. Dalam praktiknya, kita memiliki sumber daya
yang terbatas untuk melakukan suatu penelitian. Bahkan saat cakupan pengamatan merupakan
wilayah cakupan yang luas seperti negara, provinsi, atau kabupaten/kota. Maka dari itu, metode
cluster sampling memiliki beberapa keuntungan dan kerugian apabila diterapkan.
Keuntungan:
- Pelaksanaan cenderung mudah,
- Menghemat biaya operasional, dan
- Pengumpulan data cenderung hanya di suatu wilayah tepilih saja.

Kerugian:

- Tidak lebih efisien daripada metode lain,


- Karakteristik elemen pada setiap cluster cenderung homogen, dan antar cluster cenderung
heterogen, yang mengakibatkan varians antar cluster tinggi dan presisinya rendah.
- Tidak dapat memberikan gambaran karakteristik pada level cluster (karena cenderung
homogen)
2
2 ∑𝑁 𝑀 ̅
𝑖=1 ∑𝑗=1(𝑦𝑖𝑗 −𝑌)
b. Jika 𝑆 = 𝑁𝑀−1
𝑀(𝑁−1)𝑆𝑏2 +𝑁(𝑀−1)𝑆𝑤 2
Buktikan bahwa 𝑆 2 = 𝑁𝑀−1
.
Bukti:

𝑆 2 = 𝑆𝑏 2 + 𝑆𝑤 2
∑ ∑(𝑦̅𝑖 − 𝑦̿)2 ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. )2
𝑆2 = +
𝑁−1 𝑁(𝑚 − 1)
𝑀(𝑁 − 1)𝑆𝑏 + 𝑁(𝑀 − 1)𝑆𝑤 2
2
𝑆2 =
𝑁𝑀 − 1
c. ρ (intracluster correlation coefficient) merupakan ukuran dan tingkat hubungan atau korelasi
antar amatan di dalam cluster. Saat ρ tinggi atau mendekati +1 maka variasi elemen dalam cluster
tersebut cenderung homogen. Namun, saat ρ rendah atau mendekati -1 maka variasi elemen
dalam cluster tersebut cenderung heterogen.

𝑀 𝑆𝑆𝑊 𝑆𝑆𝑊
𝜌 =1−( . ) dengan 0 ≤ ≤1
𝑀 − 1 𝑆𝑆𝑇 𝑆𝑆𝑇
1
Maka − 𝑀−1 ≤ 𝜌 ≤ 1.

Ingat bahwa 𝑆 2 = 𝑆𝑏2 + 𝑆𝑤 2 , dengan nilai varians estimator cluster sampling bergantung pada
𝑆𝑏 2.

1) Jika heterogen sempurna, maka


1
- 𝜌=−
𝑀−1
𝑆𝑆𝑊
- 𝑆𝑆𝑇
= 1 atau SSW = SST atau 𝑆𝑤 2 = 𝑆 2

181
- 𝑆𝑏 2 = 0, yang artinya cluster sampling akan efisien sempurna.
2) Jika homogen sempurna, maka
- 𝜌=1
𝑆𝑆𝑊
- 𝑆𝑆𝑇
= 0 atau SSW = 0 atau 𝑆𝑤 2 = 0 sehingga 𝑆 2 = 𝑆𝑏2 + 0
- 𝑆𝑏 = 𝑆 2, yang artinya cluster sampling tidak efisien.
2

4.
a. Target populasi : Rumah tangga yang memiliki bisnis basis online di suatu wilayah
Unit sampling : Blok sensus yang ada di wilayah tersebut
Unit analisis : Rumah tangga yang memiliki bisnis online di wilayah tersebut
Unit observasi : Kepala rumah tangga atau pelaku bisnis rumah tangga tersebut
Auxiliary variabel : Jumlah rumah tangga di masing-masing blok sensus, jumlah rumah
tangga dengan bisnis berbasis online di masing-masing blok sensus.

b. Masalah yang mungkin terjadi dalam mendapatkan unit observasinya:


- Responden terpilih tidak sedang berada di rumahnya
- Suatu cluster terpilih tidak memiliki elemen yang dibutuhkan atau dimaksud
- Rumah sampel terpilih ternyata ditempati orang lain
- Karakteristik bisnis cenderung homogen atau tidak bervariasi.

c. Jumlah rumah tangga di masing-masing blok sensus sebagai auxiliary variabel

Strata nh Nh xi mhi 𝑦̅ℎ𝑖 pi 𝑍̅𝑖

120 6 2.6142 0.01659 2.11

Desa 3 64 105 8 3.0333 0.0145 3.73

115 4 3.04 0.0159 1.706

180 12 4.723 0.0197 4.156


Kota 2 46
210 16 5.482 0.0237 5.513

𝑋𝑜ℎ = 7232 (jumlah rumah tangga di desa) dengan 𝑀0 = 448

𝑋𝑏ℎ = 9108 (jumlah rumah tangga di kota) dengan 𝑀0 = 690

Strata nh Nh 𝑍̿ℎ ̅ℎ
𝑀

Desa 3 64 2.5159 6

Kota 2 46 4.8349 14

𝑍̿𝑠𝑡 = ∑ 𝑊ℎ. 𝑍̿ℎ

182
̅ℎ . 𝑁ℎ. 𝑍ℎ̿
∑𝑀
𝑍̿𝑠𝑡 =
∑𝑀̅ℎ . 𝑁ℎ

𝑍̿𝑠𝑡 = 3,9687

Varians dalam tiap strata:


𝑆𝑏2
- Varians strata desa 𝑆𝑏 2 = 1,475 dan v(𝑍ℎ̅ ) = = 0,3825
𝑛ℎ
𝑆𝑏 2
- Varians strata kota 𝑆𝑏 2 = 0,9212 dan v(𝑍ℎ̅ ) = 𝑛ℎ = 0,4606

̿ ) = ∑ 𝑊ℎ. v(𝑍ℎ̅ ) = 0,43144


𝑣(𝑍𝑠𝑡

𝑆𝑒(𝑍̿𝑠𝑡 ) = √𝑣(𝑍̿𝑠𝑡 ) = 0,65684

̿ )
𝑆𝑒(𝑍𝑠𝑡 0,65684
𝑅𝑠𝑒 = 𝑥100% = 𝑥100% = 16,55%
̿
𝑍𝑠𝑡 3,9687

Confident Interval:

LCL = 2,681375 dan UCL = 5,256142

𝑃(2,681375 < 𝑌̅ < 5,256142) = 0,95

d. Dengan tingkat keyakinan 95% dapat disimpulkan bahwa rata-rata pendapatan rumah tangga
yang memiliki bisnis berbasis online tiap bulannya mencapai 2,68 juta hingga 5,26 juta dengan
relative standar error sebesar 16,55%.

HALO SEMUA! UNTUK PEMBAHASAN YANG DITAMPILKAN, DISARANKAN UNTUK TIDAK


DIJADIKAN PATOKAN KARENA PEMBAHASAN INI BELUM DIVALIDASI OLEH DOSEN YANG
MENGAJAR. MESKIPUN DEMIKIAN, SEMOGA SUDAH BISA MEMBANTU TEMAN-TEMAN
BELAJAR, YA. SUKSES SEMUANYA, SEMANGAT

183
PENDAHULUAN MSDM-AP

A. PENGERTIAN, TUJUAN, UNSUR, DAN FUNGSI MANAJEMEN


❖ Manajemen adalah ilmu dan seni yang mengatur proses pemanfaatan sumber daya manusia
dan sumber daya lainnya secara efektif dan efisien untuk mencapai tujuan tertentu.
Manajemen dipandang sebagai ilmu karena prinsip dan konsep manajemen dapat
diperlajari, proses decision making dapat didekati dengan kaidah-kaidah ilmiah, objek dan
sarananya adalah elemen-elemen yang bersifat materi, serta dalam penerapannya
manajemen memerlukan ilmu lain seperti ekonomi, statistik, akuntansi, dan matematika.
Manajemen dipandang sebagai seni karena dipengaruhi dan didukung oleh sifat-sifat dan
bakat para manajer, naluri, perasaan, dan intelektual, serta kekuatan pribadi yang kreatif dan
skillnya.
❖ Tujuan dari manajemen itu sendiri terdiri atas 2 bagian besar :
1. Mendapatkan laba, yang dilakukan oleh perusahaan.
2. Pengabdian sosial, yang dilakukan oleh perusahaan nirlaba termasuk didalamnya
organisasi pemerintahan.
❖ Unsur Manajemen terdiri atas Man(Manusia), Money (Uang), Machine (Mesin), Methods
(Metode), Material (Bahan), Market (Pemasaran), dan juga Time (Waktu).
❖ Fungsi Manajemen terdiri atas :
1. Forecasting
Kegiatan meramalkan, memproyeksikan atau mengadakan taksiran di masa depan
dengan didasarkan pada naluri maupun metode ilmiah.
2. Planning
Merencanakan dari awal/persiapan sampai dengan akhir/penyelesaian. Menetapkan
jawaban atas pertanyaan apa (what), mengapa (why), dimana (where), kapan (when),
siapa (who) dan bagaimana (how) sesuatu akan dilaksanakan
3. Organizing
Ditetapkan organisasi: pengelompokan kegiatan, penetapan tugas, fungsi, wewenang
dan tanggung jawab unit, serta kedudukan dan sifat hubungan masing-masing unit.
4. Staffing
Penyusunan personalia dalam organisasi: melakukan analisis jabatan, pengadaan
tenaga kerja (pengumuman, seleksi dsb), pemanfaatan dan pengembangan karyawan,
kompensasi, kedisiplinan, evaluasi dan pengendalian mutu.
5. Directing
Memberikan bimbingan, saran, perintah kepada bawahan dalam pelaksanaan tugas
masing-masing, termasuk mengkoordinasi berbagai unsur organisasi agar efektif
menuju tujuan yang diinginkan.
6. Leading
Pekerjaan yang dilakukan oleh manajer yang menyebabkan orang lain bertindak, a.l:
mengambil keputusan, mengadakan komunikasi, memberi semangat dan dorongan
kepada bawahan, memperbaiki bawahan agar trampil.
7. Coordinating
Mengusahakan agar tidak terjadi percekcokan, kekacauan, ataupun kekosongan
kegiatan, kemudian menghubungkan, menyatupadukan, dan menyelaraskan pekerjaan.
8. Motivating

185
Mendorong bawahan agar secara sukarela mengerjakan yang diperintahkan,
menciptakan suasana agar timbul inspirasi, semangat yang besar dalam melakukan
tugas, serta mendorong kreativitas anak buah untuk makin mampu bekerja.
9. Controling
Mengadakan penilaian dan evaluasi dan sekaligus mengadakan koreksi agar bawahan
dapat melakukan dengan benar. Dilaksanakan dengan melakukan pemeriksaan hasil,
pencocokan dengan standar/aturan.
10. Reporting
Menyampaikan perkembangan pelaksanaan pekerjaan, menyampaikan laporan hasil
pekerjaan, memberikan evaluasi tentang hasil pekerjaan dan usulan
penyempurnaannya di masa yang akan datang.

B. MANAJEMEN SDM (DEFINI, TERMINOLOGI, PENDEKATAN, CAKUPAN, FUNGSI, DAN


PRINSIP)
❖ Menurut Hasibuan (2011), MSDM adalah aktivitas manajemen yang bertanggung jawab
untuk menarik, mengembangkan, memotivasi, dan memelihara tenaga kerja agar berkarya
tinggi dalam organisasi.
❖ Terminologi :
Komponen MSDM Terdiri atas :
1. Penguasaha, orang yang menginvestasikan sejumlah uang untuk memperoleh
pendapatan yang besarnya tergantung dari laba yang didapatkan.
2. Karyawan, orang yang menjual jasa pikiran/tenaganya untuk mendapatkan kompensasi
yang ditetapkan terlebih dahulu.(Terdiri atas karyawan operasional (bawahan) dan
karyawan manajerial (atasan))
3. Manajer, seorang yang karena wewenang atau kepemimpinannya dapat mengarahkan
orang lain untuk mencapai tujuan (terdiri atas manajer lini dan manajer staf).
❖ Pendekatan MSDM :
1. Pendekatan Mekanis, menitikberatkan analisisnya kepada spesialisasi, efektivitas,
standardisasi dan memberlakukan karyawan seperti mesin. Dengan pendekatan ini
karyawan menjadi semakin terampil, tetapi pekerjaan menjadi membosankan dan
mempersempit ruang kreasi.
2. Pendekatan Paternalis, menanggap karyawan seperti anak dengan memberikan sejumlah
fasilitas dan kemudahan, pada akhirnya karyawan menjadi malas, manja, dan
produktivitas menurun.
3. Pendekatan Sosial, Dijalin kerjasama yang harmonis, pemikiran adanya saling
ketergantungan, menganggap semua orang mempunyai peran, dan mengharapkan hasil
keluaran yang maksimal.
❖ Cakupan MSDM :
Menetapkan jumlah, kualitas dan penempatan tenaga kerja yang efektif, Menetapkan
penarikan, seleksi dan penempatan karyawan, Menetapkan program kesejahteraan,
pengembangan dan pemberhentian, Meramalkan penawaran dan permintaan tenaga kerja
yang akan datang, Memantau UU Perburuhan dan kebijaksanaan balas jasa perusahaan
sejenis, Memantau kebijaksanaan teknik perkembangan serikat buruh, Melaksanakan
pendidikan, pelatihan dan penilaian prestasi karyawan, Mengatur mutasi karyawan baik
vertikal (promosi/demosi) dan horizontal (penyegaran), Mengatur pensiun, pemberhentian
dan pesangonnya, Memantau perkembangan ekonomi pada khususnya (inflasi) dan
perkembangan perusahaan.

186
❖ Fungsi-Fungsi MSDM :
1. Perencanaan (Analisis pekerjaan, analisis masa depan ekonomi umum/perusahaan)
2. Pengadaan (Penarikan dan seleksi)
3. Pengarahan dan Pengorganisasian
4. Pengembangan (Penilaian prestasi, bimbingan, disiplin, latihan, perluasan karir)
5. Kompensasi (Evaluasi pekerjaan, pengupahan, insentif)
6. Pengendalian
7. Pengintegrasian
8. Pemeliharaan (Perburuhan, pelayanan karyawan, keamanan/Kesehatan)
9. Pemberhentian
10.Kedisiplinan

C. MANAJEMEN ADMINISTRASI PERKANTORAN (DEFINI, TERMINOLOGI, TUJUAN,


FUNGSI)
❖ Manajemen administrasi perkantoran adalah rangkaian aktivitas merencanakan,
mengorganisasikan, mengarahkan, mengawasi, dan mengendalikan segala hal yang
berhubungan dengan pekerjaan perkantoran.
❖ Terminologi :
Para ahli beranggapan bahwa administrasi dengan manajemen sebetulnya adalah 2 hal yang
berbeda, mereka menekankan bahwa administrasi ditujukan terhadap penentuan tujuan
pokok dan kebijakannya, sedangkan manajemen ditujukan terhadap pelaksanaan kegiatan
dengan maksud mencapai tujuan tertentu.
❖ Tujuan Manajemen Administrasi Perkantoran :
1. Untuk memberi keterangan yang lengkap bagi yang memerlukan guna pelaksanaan tugas
organisasi secara efisien.
2. Untuk memberi catatan dan laporan yang bermanfaat dengan biaya yang terjangkau.
3. Untuk membantu perusahaan/badan, memelihara, dan memenuhi kebutuhannya.
4. Untuk memberikan pekerjaan tata usaha yang cermat dan membantu memberikan
pelayanan kepada para langganan atau mitra kerja.
5. Untuk membuat catatan yang lebih baik dengan biaya yang terjangkau.
❖ Fungsi Manajemen Administrasi Perkantoran :
1. Kepegawaian perkantoran (personnel)
2. Metode Perkantoran (Methods)
3. Perlengkapan Perkantoran (Equipment)
4. Faktor fisik dalam kantor (physical)
5. Biaya Perkantoran (Cost)
6. Kebijakan Perkantoran (Policy)

PENGADAAN KARYAWAN

A. PENGERTIAN DAN PENTINGNYA PENGADAAN


❖ Pengadaan adalah proses penarikan (rekrutmen), seleksi-seleksi, penempatan, orientasi,
dan induksi untuk mendapatkan karyawan yang efektif dan efisien guna tercapainya tujuan
perusahaan.

187
❖ Pengadaan “karyawan” merupakan masalah penting, sulit dan kompleks karena untuk
mendapatkan dan menempatkan orang yang tepat tidak semudah “mesin”
❖ Dasar pengadaan : Analisis pekerjaan, Uraian Pekerjaan, Spesifikasi Pekerjaan, Syarat
Pekerjaan, Evaluasi Pekerjaan, Pemerkayaan Pekerjaan, dan Perluaan Pekerjaan.

B. ANALISIS PEKERJAAN (JOB ANALYSIS)


❖ Analisis Pekerjaan adalah kegiatan menganalisis dan mendesain pekerjaan apa yang harus
dikerjakan, bagaimana mengerjakan, dan mengapa pekerjaan itu harus dikerjakan.
Memberikan informasi mengenai uraian pekerjaan, spesifikasi pekerjaan, evaluasi
pekerjaan, bahkan dapat dipakai memperkirakan pemerkayaan pekerjaan, perluasan
pekerjaan dan penyederhanan di masa datang
❖ Perbedaan mendasar antara Job Analysis dan Motion Study

❖ Langkah Analisis Pekerjaan :


Menentukan penggunaan hasil informasi analisis pekerjaan → Mengumpulkan informasi
latar belakang → Menyeleksi wakil jabatan yang akan dianalisis → Mengumpulkan informasi
analisis pekerjaan → Meninjau informasi dengan pihak-pihak yang berkepentingan →
Menyusun uraian pekerjaan dan spesifikasi pekerjaan → Meramalkan/mempertimbangkan
perkembangan perusahaan.

C. EVALUASI, PENYEDERHANAAN, PENGAYAAN, DAN PERSYARATAN PEKERJAAN


❖ Evaluasi pekerjaan adalah kegiatan Menilai berat/ringan dan resiko pekerjaan yang dapat
dimanfaatkan untuk pemberian kompensasi
❖ Dengan kemajuan teknologi dan komunikasi dimungkinkan dilakukan evaluasi yang dapat
mengusahakan pekerjaan menjadi makin sederhana efektif dan efisien
❖ Kemudian Perluasan pekerjaan dan tanggung jawab yang akan dikerjakan seorang pejabat
dalam jabatannya, Menambahkan variasi pekerjaan yang memiliki ketrampilan yang lebih,
Memberikan kesempatan kepada karyawan untuk mengembangkan pribadinya.
❖ SPES-PEK adalah Uraian persyaratan minimum orang yg bisa diterima agar dapat
menjalankan suatu jabatan dengan baik dan kompeten. Mencakup pendidikan, pengalaman,
persyaratan mental, supervise, dan kondisi kerja.

188
❖ Persyaratan pekerjaan adalah hal-hal yang terkait dengan berbagai ketentuan tentang
ketrampilan yang dikehendaki untuk suatu pekerjaan. Misal, untuk pekerjaan pencacah
survei konsumsi syaratnya: mahasiswi atau ibu rumahtangga, penduduk setempat
(kelurahan), ijazah minimal SLA (SMU/SMK), teliti, jujur, dll.

D. PERAMALAN KEBUTUHAN
❖ Dari “struktur organisasi” dan “beban kerja” (masa kini dan yad) perlu dilakukan peramalan
kebutuhan pekerja (hindari kekosongan jabatan)
❖ Dapat dihitung dengan memperhatikan jumlah produksi, ramalan usaha, perluasan
perusahaan, perencanaan karier pegawai (faktor2 internal), serta perkembangan teknologi,
tingkat permintaan dan penawaran tenaga kerja (eksternal).

E. PRINSIP REKRUITMEN
❖ Rekruitmen adalah serangkaian kegiatan yang dimulai dari ketika perusahaan/ organisasi
membutuhkan tenaga kerja dan membuka lowongan sampai dengan mendapatkan sejumlah
calon karyawan yang diinginkan.
❖ Tujuan nya adalah untuk menerima pelamar sebanyak-banyaknya sesuai dengan kualifikasi
kebutuhan dari berbagai sumber, sehingga memungkinkan akan terjaring calon karyawan
dengan kualitas tertinggi dan terbaik
❖ Prinsip Rekruitmen :
1. Mutu karyawan yang direkrut sesuai dengan kebutuhan (analisis pekerjaan)
2. Jumlah karyawan sesuai dengan pekerjaan yang tersedia
3. Biaya diminimalkan
4. Perencanaan strategis (Renstra) SDM
5. Fleksibilitas
6. Pertimbangan Hukum
❖ E-Recruitment (Seperti yang dilakukan saat tes CPNS)
1. On-line, berbasis teknologi web/android
2. Melalui platform internal atau agen
3. Jangkauan lebih luas
4. Hemat biaya dan tenga (efisien)
5. Proses lebih singkat dan cepat
6. Mudah dan praktis
7. Lebih baik hasilnya

F. SELEKSI
❖ Seleksi adalah kegiatan memilih karyawan yang paling tepat (dalam arti qualified, kompeten,
dan kuantitas) yang akan menjabat dan mengerjakan tugas perusahaan.
❖ Harus memperhatikan peraturan pemerintah, misalnya tak boleh mempekerjakan anak-
anak, melarang pekerja wanita bekerja malam hari, dsb, Petugas seleksi harus jujur dan
objektif.
❖ Seleksi sangat bergantung pada ketepatan dalam penetapan analisis jabatan/pekerjaan
❖ Kualifikasi Seleksi mencakup umur, jenis kelamin, keahlian, pengalaman pendidikan, bakat,
kerjasama, tanggung jawab, interest, disiplin, inisiatif dan kreatif, fisik, kesehatan,
temperamen, kejujuran dsb.
❖ Sistem/pendekatan seleksi :

189
➢ Succesive-Hurdles Selection Approach
Setiap calon karyawan harus mengikuti semua prosedur seleksi secara bertahap. Jika
pelamar gagal di suatu test, tidak boleh lanjut ke tahap berikut (gugur).
➢ Compensatory Selection Approach
Setiap calon karyawan berkesempatan ikut semua prosedur seleksi. Nilai akumulasi
harus diatas batas lulus
❖ Metode Seleksi :
1. Surat lamaran, keterangan, dan formulir isian
2. Penelitian
3. Tes ketrampilan dan pengetahuan
4. Tes Kesehatan
5. Tes Psikologi
6. Wawancara
❖ Konsep Dasar Seleksi :
1. Validitas
Bahwa yang diujikan harus relevan dengan pekerjaan yang ditawarkan, mereka yang
lulus tes harus bekerja bagus atau sebaliknya.
2. Reliabilitas
Bahan tes harus menunjukkan konsistensi bila dilakukan terhadap orang tertentu (bila
dilakukan uji dua kali tidak konsisten bahan belum baik).

G. KENDALA REKRUITMEN
❖ Kebijakan Organisasi
Kebijaksanaan kompensasi dan kesejahteraan (bila terbatas susah mencari tenaga yang
baik), Kebijaksanaan promosi (bila sulit promosi, juga susah mencari tenaga yang baik),
Kebijaksanaan status karyawan (apabila mudah menjadi tenaga tetap, menjadi menarik
(jangan sudah bertahun-tahun tetap honorer)), Kebijaksanaan sumber tenaga kerja (apabila
membatasi tenaga lokal (putra daerah) susah mendapatkan yang terbaik)
❖ Persyaratan jabatan, semakin banyak persyaratan semakin sedikit pelamar
❖ Metode pelaksanaan, bila terbuka banyak yang melamar
❖ Kondisi pasar tenaga kerja, semakin besar penawaran semakin banyak yang baik, sebaliknya
semakin sedikit makin terbatas.
❖ Soliditas perusahaan, semakin solid perusahaan tersebut makin banyak pelamar dan
harapan mendapat yang baik makin besar
❖ Kondisi lingkungan eksternal, semakin ekonomi bertumbuh semakin sedikit pelamar, tetapi
pada saat resesi banyak pelamar.
❖ Penempatan Karyawan
Merupakan tindak lanjut dari seleksi, penempatan karyawan agar dapat mulai bertugas
sesuai jabatan. Harus sesuai job description dan job specification
❖ Orientasi Karyawan
Perkenalan karyawan sebagai pernyataan betul2 diterima agar bisa bekerjasama dengan
karyawan lain.
❖ Induksi Karyawan
Mengubah perilaku karyawan baru dan sesuaikan dengan tata tertib.

190
PENILAIAN PRESTASI KERJA (PPK) DAN KOMPENSASI

A. PENGERTIAN, APA, DAN MENGAPA DINILAI


❖ Penilaian prestasi kerja karyawan (PPK) adalah kegiatan manajer untuk mengevaluasi
perilaku dan prestasi kerja karyawan untuk menetapkan kebijaksanaan selanjutnya.

❖ Yang dinilai adalah perilaku dan prestasi kerja karyawan seperti kesetiaan/loyalitas, prestasi,
tanggung jawab, ketaatan, kejujuran, kerjasama, prakarsa, dan kepemimpinan

❖ Diperlukan penilaian prestasi kerja untuk :

➢ Meningkatkan kepuasan karyawan, karena kita akan memberikan pengakuan atas hasil
kerjanya

➢ Memelihara potensi kerja, karena merasa hasil kerjanya diapresiasi

➢ Mengukur prestasi kerja karyawan, yang baik sebagai contoh

➢ Mengukur kompensasi yang seharusnya dibayarkan dan kemampuan membayar


perusahaan yang bersangkutan

➢ Mengumpulkan data guna menetapkan program kepegawaian selanjutnya

B. KEGUNAAN, TUJUAN PENILAIAN


❖ Kegunaan penilaian diantaranya : Perbaikan prestasi kerja, penyesuaian kompensasi,
keputusan penempatan, kebutuhan latihan dan pengembangan, perencangan dan
pengembangan karier, penyimpangan proses staffing, ketidakakuratan informasi, kesalahan
desain pekerjaan, kesempatan kerja yang adil, tantangan-tantangan eksternal.

❖ Tujuan penilaian diantaranya : Dasar promosi,demosi, pemberhentian,dan penetapan balas


jasa, mengukur prestasi sejauh mana kemampuan karyawan, dasar mengevaluasi efektivitas
kegiatan dalam perusahaan, sebagai alat meningkatkan motivasi kerja karyawan agar
performance baik, Sebagai dasar evaluasi program latihan dan efektivitas jam kerja, metode
kerja, struktur organisasi, pengawasan, kondisi dan peralatan kerja, Sebagai indikator untuk
menentukan kebutuhan pelatihan karyawan, Sebagai alat untuk mendorong atasan
mengobservasi perilaku bawahan, Untuk mengeva-luasi kelemahan di masa lampau dan
memper-baiki berikutnya, Sebagai alat seleksi dan penem-patan karyawan, Memper-baiki dan
mengem-bangkan uraian pekerjaan, Mengindentifi-kasi kelemahan karyawan dan
menempatkan ke tempat sesuai.

C. PENILAIAN KINERJA PNS


❖ Syarat penilai :

➢ Harus jujur, objektif, dan mempunyai pengetahuan mendalam tentang unsur yang dinilai

➢ Mendasarkan benar/salah, buruk/baik; tidak didasarkan atas suka/tak suka

191
➢ Tahu uraian pekerjaan karyawan yang akan dinilai

➢ Mempunyai kewenangan formal

➢ Harus beragama dan beriman agar jujur dan adil

❖ Ukuran kinerja :

➢ Praktis, Keterkaitan langsung dengan pekerjaan seseorang, penilaian ditujukan untuk


keberhasilan pekerjaan

➢ Kejelasan standar, Harus mempunyai nilai kompetitif sebagai pembanding antar


karyawan

➢ Objektif, Ukuran yang mudah digunakan dan handal

❖ Instrumen penilaian kinerja :

➢ Reliabel, konsisten

➢ Relevan, harus dihubungkan dengan keluaran riil suatu kegiatan

➢ Sensitivitas, harus dihubungkan dengan keluaran riil suatu kegiatan

➢ Praktikal, harus dapat diukur

❖ Metode Penilaian :

➢ Traditional, a.l. rating scale, employee computation/employee comparation (alternation


ranking, paired comparation, porced comparation, check list, freeform essay dan critical
incident)

Rating Scale, pengukuran dilakukan subjektif tentang inisiatif, ketergantungan,


kematangan dan konstribusinya terhadap pekerjaan.

Employee Comparison, terdiri atas alternation rangking (Mengurutkan nilai


karyawan dari terendah ke tertinggi), paired comparation (Membandingkan seorang
dengan yang lain), dan porced comparison (perbandingan dengan kriteria yang lebih
jelas).

Check list, penilai memberikan masukan informasi berdasarkan kriteria yang ada,
kemudian dihitung bobot nilai dan dipakai sebagai hasil rating.

Freeform essay, setiap karyawan diminta membuat tulisan untuk dinilai.

Critical Incident, pencatatan mengenai perilaku karyawan secara terus menerus.

➢ Modern, a.l. assesment centre, Management by objective dan human asset accounting

Assessment centre - penilaian dilakukan dengan wawancara, permainan bisnis dll.


Nilai indeks prestasi karyawan adalah rata-rata bobot dari tim penilai

Manajemen Berdasarkan Sasaran (MBS)/ Management by Objective (MBO) -


karyawan diikut sertakan dalam perumusan persoalan mnrt kemampuan karyawan

Human Asset Accounting – faktor pekerja dinilai sebagai individu modal jangka
panjang, sehingga sumber tenaga kerja dinilai dgn cara membandingkan thd

192
variabel2 yg dpt mempengaruhi keberhasilan perusahaan. Jika biaya tenaga kerja
meningkat dan mengakibatkan laba meningkat maka peningkatan tenaga kerja
disebut berhasil.

❖ Kendala Penilaian

➢ Kendala hukum/legal

Harus bebas dari diskriminasi. Jangan membedakan jenis kelamin, ras, bangsa, atau
diskriminasi umur dalam pemutusan hubungan kerja, promosi dsb. Penilaian yang
diskriminatif dapat mengakibatkan penuntutan perkara.

➢ Hallo Effect

Kecenderungan memberi nilai baik kepada yang dikenalnya saja. Beberapa sifat baik
mengakibatkan umumnya nilai baik. Satu atau beberapa nilai jelek ikut menarik ke nilai
jelek ➔ Indeks prestasi karyawan tidak nyata.

❖ Reformasi Manajemen Kinerja Pegawai

❖ Dasar Hukum Penilaian Kinerja PNS (PP NOMOR 30 tahun 2019)

➢ UU 5 Tahun 2014 ASN Pasal 78

Ketentuan lebih lanjut mengenai penilaian kinerja diatur dengan Peraturan Pemerintah.

➢ PP 11 Tahun 2017 MANAJEMEN PNS Pasal 230

Ketentuan lebih lanjut mengenai penilaian kinerja PNS dan disiplin PNS diatur dengan
Peraturan Pemerintah.

❖ Pentingnya Manajemen Kinerja PNS

➢ Pengembangan Karier PNS → Mutasi, Promosi dan Pengembangan Kompetensi


berdasarkan kinerja

➢ Manajemen Talenta → Kinerja pegawai harus menjadi salah satu dasar penempatan
talent pool

➢ Tunjangan → Kinerja Tunjangan Kinerja dibayarkan berdasarkan pencapaian kinerja

193
➢ Penghargaan → pemberian penghargaan berdasarkan pada penilaian kinerja yang
objektif dan transparan.

➢ Sanksi → penilaian kinerja PNS yang tidak mencapai target kinerja dikenakan sanksi
administrasi sampai dengan pemberhentian

D. TUJUAN PENTINGNYA KOMPENSASI


❖ Ikatan kerjasama, dimana karyawan akan mengerjakan tugasnya dengan baik dan pengusaha
membayar sesuai kesepakatan.

❖ Kepuasan kerja, dengan balas jasa dapat dipenuhi kebutuhan karyawan.

❖ Pengadaan efektif; Kompensasi yang besar → pekerja yang qualified lebih mudah didapat.

❖ Motivasi. Bila kompensasi cukup, mudah memotivasi karyawan

❖ Stabilitas karyawan. Bila kompensasi adil dan wajar, maka turnover rendah

❖ Disiplin. Kompensasi besar, maka disiplin tinggi

❖ Pengaruh serikat buruh. Bila kompensasi memadai dan adil, maka pengaruh serikat buruh
menjadi kecil, dan karyawan dapat berkonsentrasi ke pekerjaan.

❖ Pengaruh pemerintah. Bila kompensasi sesuai dengan undang-undang yang berlaku,


intervensi pemerintah kecil.

E. AZAS, METODE, DAN SISTEM KOMPENSASI


❖ Azas Kompensasi

➢ Adil , yang disesuaikan dengan jenis pekerjaan, resiko pekerjaan, tanggung jawab, jabatan
dsb.

➢ Layak/wajar , yang sekurang-kurangnya dapat memenuhi kebutuhan normatif (batas


upah minimal)

➢ Dinamis, menyesuaikan dengan perkembangan (minimalkan turn-over)

❖ Metode Kompensasi

➢ Metode tunggal (Hanya didasarkan atas ijazah)

➢ Metode Jamak (Memperhatikan banyak faktor seperti ijazah, sifat pekerjaan, pendidikan
informal, dan jumlah keluarga)

❖ Sistem Kompensasi terdiri atas Sistem Waktu, Sistem Hasil, Sistem Borongan

194
F. KOMPENSASI PNS
❖ Gaji Pokok, yang dibedakan dengan pangkat (Golongan I/a-IV/e) dan lama dalam pangkat
tersebut

❖ Tunjangan Umum, yang terdiri dari Tunjangan keluarga, tunjangan jabatan, tunjangan pajak,
dan tunjangan lainnya (sekarang ada Tunjangan Kinerja/Remunerasi)

❖ Potongan-potongan

❖ Tunjangan keluarga terdiri dari tunjangan isteri atau suami (10 persen gaji pokok) dan
tunjangan anak (2 persen gaji pokok per anak sebanyak-banyaknya 2 orang)

❖ Tunjangan jabatan struktural (eselon IV s/d I) dan tunjangan jabatan fungsional (dosen,
peneliti, dll)

❖ Tunjangan pajak diberikan sebesar pajak yang harus dibayarkan

❖ Tunjangan lainnya termasuk tunjangan pangan (sebesar 10 kg per kepala dlm bentuk
nominal uang) dan tunjangan khusus.

❖ Tunjangan Kinerja: Untuk BPS berdasar Perpres Nomor 99 Tahun 2018 (juga 19 instansi lain,
dengan nomor lain)

PERENCANAAN KARIR DAN MUTASI

A. PERENCANAAN KARIR
❖ PERENCANAAN KARIR adalah suatu perencanaan tentang kemungkinan-kemungkinan
seseorang anggota organisasi sebagai perorangan untuk dapat meniti proses kenaikan
pangkat dan jabatan sesuai dengan persyaratan dan kemampuannya.

❖ Konsep dasar perencanaan karir :


➢ Karir , merupakan seluruh posisi kerja yang dijabat selama siklus kehidupan pekerjaan
seseorang.
➢ Jenjang karir , merupakan model posisi pekerjaan berurutan yang membentuk karir
seseorang
➢ Jalur karir , adalah pola pekerjaan yang berurutan yang membentuk karir seseorang
➢ Tujuan karir , merupakan posisi mendatang yang diupayakan pencapaiannya oleh
seseorang sebagai bagian karirnya. Tujuan-tujuan ini berperan sebagai benchmark
sepanjang jenjang karir seseorang.
➢ Pengembangan karir, terdiri dari peningkatan pribadi yang dilakukan oleh seseorang
dalam mencapai rencana karir pribadinya.

B. MANFAAT PERENCANAAN KARIR


❖ Menurunkan tingkat perputaran karyawan (turnover)
❖ Mendorong pertumbuhan, dimana perencanaan karir yang baik akan dapat mendorong
semangat kerja karyawan untuk tumbuh dan berkembang, dengan demikian motivasi
karyawan dapat terpelihara.

195
❖ Memenuhi kebutuhan-kebutuhan organisasi akan sumber daya manusia di masa yang akan
datang.
❖ Memenuhi kebutuhan-kebutuhan organisasi akan sumber daya manusia di masa yang akan
datang.
❖ Mengembangkan pegawai yang dapat dipromosikan
❖ Menyediakan fasilitas bagi penempatan internasional, organisasi global menggunakan
perencanaan karir untuk membantu mengidentifikasikan dan mempersiapkan penempatan
di luar negeri.
❖ Membantu menciptakan keanekaragaman angkatan kerja.
❖ Membuka jalan bagi karyawan yang potensial, perencanaan karir memberikan keberanian
kepada karyawan untuk melangkah maju kemampuan potensial mereka karena mereka
mempunyai tujuan karir yang spesifik, tidak hanya mempersiapkan pekerja untuk lowongan
di masa depan.

C. PENGERTIAN MUTASI
❖ Mutasi adalah Suatu perubahan posisi/jabatan/pekerjaan yang dilakukan secara horisontal
maupun vertikal atau diagonal dalam suatu organisasi.
❖ Masuk dalam “Fungsi pengembangan karyawan” karena tujuannya untuk meningkatkan
efisiensi dan efektivitas dalam perusahaan tersebut.

D. TUJUAN MUTASI
❖ Meningkatkan produktivitas kerja
❖ Menciptakan keseimbangan antara tenaga kerja dan komposisi pekerjaan atau jabatan
❖ Memperluas atau menambah pengetahuan karyawan
❖ Menghilangkan kebosanan/kerutinan
❖ Mengatasi perselisihan karyawan
❖ Perangsang untuk berkarir lebih tinggi
❖ Hukuman atas pelanggaran karyawan
❖ Pengakuan atau imbalan atas prestasi
❖ Mendorong spirit kerja melalui persaingan terbuka
❖ Tindakan pengamanan
❖ Penyesuaian pekerjaan terhadap fisik karyawan

E. PRINSIP DAN DASAR MUTASI


❖ Prinsip mutasi ialah Menempatkan karyawan pada tempat yang sesuai, agar
❖ semangat dan produktivitas kerja meningkat.
❖ Dasar mutasi terdiri atas merit system, seniority system, dan spoiled system

F. RUANG LINGKUP MUTASI


❖ Mutasi Horizontal, yakni tour of area (perpindahan tempat kerja), tour of duty (perubahan
jabatan setingkat)
❖ Mutasi Vertikal, yakni promosi/demosi (meningkat/menurun kewajiban, kekuasaan dan
tanggung jawab)
❖ Mutasi Diagonal, yakni jabatan struktural ke fungsional (dan sebaliknya)

196
G. SEBAB MUTASI
❖ Atas Permintaan sendiri, alasan keluarga, kesehatan, suasana kerja (bisa tak dapat uang
pindah dan belum tentu jabatan sama)
❖ Alih tugas produktif (ATP), karena kehendak pimpinan perusahaan atas penilaian kerja
karyawan (biasanya vertikal:promosi/demosi)

H. PROMOSI DAN DEMOSI


❖ Dasar promosi
➢ Senioritas, berdasarkan lama kerja dan mereka yang berpengelaman mendapat prioritas
➢ Kecakapan, Dievaluasi berdasarkan hasil yang dicapai
➢ Dapat pula kombinasi antara senioritas dan kecakapan
❖ Syarat promosi :
➢ Kejujuran
➢ Disiplin/ketaatan/loyalitas
➢ Prestasi kerja/kecakapan/pengalaman
➢ Kerjasama/komunikasi
➢ Kepemimpinan/tanggung jawab
➢ Pendidikan
➢ Prakarsa
❖ Demosi, terjadi karena pelaksanaan kerja yang kurang baik dan tidak seperti yang
diharapkan, atau mungkin kurang disiplin dan kurang jujur, sehingga dipindahkan ke pangkat
yang lebih rendah bahkan tidak berpangkat yang otomatis pendapatan akan berkurang.

I. JABATAN STRUKTURAL DAN JABATAN FUNGSIONAL


❖ Peraturan Pemerintah tentang jabatan :
➢ Jabatan Struktural, PP No. 15 tahun 1994 (dicabut), diganti dengan PP 100 tahun 2000
dan diubah dengan PP No. 13 Tahun 2002 (Ketentuan Pelaksanaan: Kep Ka BKN No.
13/2002)
➢ Jabatan fungsional, PP No. 16 tahun 1994 tentang pengaturan jabatan fungsional, diubah
dengan PP No. 40 Tahun 2010. (Keppres No. 87/1999 ttg Rumpun Jabatan Fungsional.)
❖ Syarat Jabatan Struktural :
➢ Berstatus sebagai PNS
➢ Serendah-rendahnya pangkatnya 1 tingkat dibawah jenjang pangkat yang akan
ditentukan
➢ Memiliki kualifikasi dan tingkat pendidikan yang ditentukan
➢ Semua unsur PPK sekurang-kurangnya baik 2 tahun terakhir
➢ Memiliki kompetensi jabatan yang diperlukan
➢ Sehat jasmani dan rohani
➢ Pejabat pembina wajib memperhatikan senioritas, usia, diklat jabatan, dan pengalaman
➢ Wajib ikut diklat selambat-lambatnya 12 bulan setelah dilantik
➢ Tidak boleh menduduki jabatan rangkap
❖ Jabatan Fungsional → Kedudukan yang menunjukkan tugas, tanggung jawab, wewenang, dan
hak seseorang PNS dalam suatu satuan organisasi yang dalam melaksanakan tugasnya
didasarkan atas keahlian tertentu yang bersifat mandiri.
Kalau di BPS sendiri, ada widyaiswara, statistisi, pranata komputer, peneliti, dosen, auditor,
dsb.

197
J. PENEMPATAN DAN MUTASI DI BPS
❖ Peraturan Kepala (Perka) BPS Nomor 6/2013 tentang Pola Penempatan dan Pemindahan
Pegawai di Lingkungan BPS
❖ Isi dari Perka diatas yakni : Penempatan Calon Pegawai, Penempatan Pegawai (Setelah TB,
Setelah Kembali dari Instansi lain, Setelah Cuti LTN, dan Penempatan KSK), dan Pemindahan
Pegawai (karena nikah, antar wilayah kerja, struktural eselon IV dan III, antar instansi).

INTEGRASI DAN PEMELIHARAAN

A. PENGINTEGRASIAN (PENGERTIAN, TUJUAN DAN PRINSIP, METODE)


❖ Pengintegrasian merupakan kegiatan yang menyatu padukan keinginan karyawan dan
kepentingan perusahaan agar tercipta kerjasama yang memberikan kepuasan bersama
❖ Agar pengintegrasian berhasil karyawan harus diikutsertakan dalam setiap kegiatan,
berperan aktif, karena mereka berbeda dengan mesin, modal ataupun material.
❖ Tujuan dari pengintegrasian adalah untuk memanfaatkan karyawan agar mereka bersedia
bekerja keras dan berpartisipasi aktif dalam pencapaian tujuan perusahaan serta
terpenuhinya kebutuhan karyawan.
❖ Prinsip dari kegiatan pengintegrasian ialah menempatkan kerjasama yang baik dan saling
menguntungkan (win-win solution)
❖ Metode/Cara Pengintegrasian :
1. Hubungan antar manusia (Human Relationship)
• Hubungan kemanusiaan yang harmonis, agar tercapai kesadaran dan kesediaan
melebur keinginan individu menjadi kepentingan bersama agar menghasilkan
integrasi yang kukuh.
• Memerlukan kecakapan manager tentang komunikasi, psikologi , sosiologi,
anthropologi, dsb
• Manajer hendaknya terbuka serta mendorong partisipasi dan keberanian bawahan
untuk menyampaikan pendapat dan keluhannya; sehingga tercipta komunikasi dua
arah, formal atau informal, vertikal atau horizontal, agar terdapat saling pengertian
dan penghayatan mengenai kebijaksanaan yang diambil.
• Dengan cara ini bawahan merasa dapat pengakuan sehingga mereka berpartisipasi
aktif dan mengerjakan pekerjaannya dengan antusias.
2. Motivasi
• Usaha manajer mengarahkan potensi bawahan, agar mau bekerja sama secara
produktif untuk mencapai tujuan yang sama-sama ditentukan.
• Untuk memotivasi karyawan perlu diperhatikan pemenuhan kebutuhan
jasmani/rohani, materi/non materi dsb.
• Motivasi adalah hal yang menyebabkan, menyalurkan dan mendukung perilaku
manusia, supaya mau bekerja giat dan antusias mencapai hasil optimal. Motivasi
semakin penting karena manajer membagi pekerjaan kepada bawahannya untuk
dikerjakan dengan baik dan terintegrasi.
• Tujuan motivasi diantaranya meningkatkan moral kerja karyawan, meningkatkan
produktivitas kerja, menstabilkan karyawan, meningkatkan disiplin kerja karyawan,
mengefektifkan kerja karyawan, menciptakan suasana kerja yang baik, meningkatkan

198
loyalitas, kreativitas diri, mempertinggi tanggung jawab terhadap tugas,
meningkatkan kesejahteraan karyawan, dan meningkatkan efisiensi alat dan bahan.
• Azas Motivasi
➢ Azas mengikuti sertakan (Manajer mengajak bawahan berpartisipasi dan
memberikan kesempatan untuk dapat mengajukan ide-ide).
➢ Azas komunikasi (Manajer menginformasikan secara jelas tujuan yang akan
dicapai, cara mengerjakannya dan kendala yang dihadapi).
➢ Azas pengakuan (Memberikan penghargaan dan pengakuan yang tepat serta
wajar kepada bawahan atas prestasi kerja mereka).
➢ Azas wewenang yang didelegasikan (Memberikan kesempatan kepada bawahan
memegang sebagian tanggung jawab).
➢ Azas perhatian timbal balik (Memotivasi bawahan dengan memberikan bonus
kenaikan gaji jika pekerjaan yang dilakukan mencapai target).
3. Kepemimpinan
• Cara seorang pemimpin untuk meme-ngaruhi perilaku bawahan, agar mau
bekerjasama dan bekerja secara produktif untuk mencapai tujuan organisasi.
• Gaya Kepemimpinan
➢ Otoriter
Kewenangan mutlak tetap ditangannya (sentralisasi wewenang). Pengambilan
keputusan ditetapkan sendiri, bawahan tidak diikutsertakan untuk saran, ide,
pertimbangan.
➢ Partisipasif
Melakukan secara persuasif, menciptakan kerjasama yang serasi, menumbuhkan
loyalitas dan partisipasi bawahannya.
➢ Delegatif
Mendelegasikan wewenang lebih banyak, bawahan dapat mengambil keputusan
dan kebijakan. Pemimpin hanya bersifat pengawasan meskipun kadang-kadang
perlu mengarahkan. Makin besar perusahaan makin “delegatif”
➢ Situasional
(Paul Hersey dan Kenneth H. Blanchard) ➔ tidak ada satupun cara yang terbaik
untuk memengaruhi orang lain. Sangat tergantung pada orang yang akan
dipengaruhi.
• Tipe Kepemimpinan menurut P.Siagian : Otokratis, Militeristis, Paternalistis,
Karismatis, Demokratis.
4. Kesepakatan Kerja Bersama (KKB)
• Diharapkan telah ada negosiasi/musyawarah dan persetujuan/mufakat antara
kelompok karyawan dan perusahaan.
• Problem KKB adalah seringnya serikat karyawan menjadi alat perusahaan bukan alat
karyawan.
5. Collective Bargaining
• Merupakan perundingan antara pimpinan perusahaan dengan pimpinan serikat
buruh dengan memperhatikan masing-masing kepentingan.
• Biasanya adu kuat argumentasi antara kedua pihak

199
B. PENGERTIAN, TUJUAN, DAN AZAS PEMELIHARAAN
❖ Pemeliharaan adalah Usaha untuk mempertahankan kondisi fisik, mental, dan sikap karyawan
agar mereka tetap loyal dan bekerja produktif untuk tercapainya tujuan perusahaan.
❖ Tujuan dari adanya pemeliharaan diantaranya Mempertahankan dan meningkatkan
produktivitas kerja karyawan, Meningkatkan disiplin dan menurunkan absensi, Meningkatkan
loyalitas dan menurunkan turn over, Memberikan ketenangan, keamanan dan kesehatan
karyawan, Meningkatkan kesejahteraan karyawan dan keluarganya, Memperbaiki kondisi
fisik, mental dan sikap karyawan, Mengurangi konflik serta manciptakan suasana yang
harmonis, Mengefektifkan pengadaan karyawan.
❖ Azas Pemeliharaan : Azas manfaat dan efisiensi, Azas kebutuhan dan kepuasan, Azas keadilan
dan kelayakan, Azas Peraturan (Legal), Azas kemampuan perusahaan.

C. METODE PEMELIHARAAN
❖ Komunikasi
➢ Komunikasi harus digunakan setiap penyampaian informasi (instruktif, informatif,
influencing, atau evaluatif) dari komunikator kepada komunikan.
➢ Dengan komunikasi yang baik dapat diselesaikan problem-problem yang terjadi dalam
perusahaan.
➢ Manajemen terbuka mendukung terciptanya keamanan, kesehatan, loyalitas para
karyawan. Konflik diselesaikan secara musawarah dan mufakat.
❖ Insentif
➢ Daya perangsang yang diberikan kepada karyawan tertentu berdasarkan prestasi
kerjanya agar karyawan terdorong meningkatkan produktivitas kerjanya, Manajer yang
efektif menciptakan pemeliharaan karyawan dengan menerapkan metode insentif yang
tepat
➢ Jenis2 insentif: positif (reward) dan negatif (punishment), Bentuk2 insentif: nonmaterial,
sosial, material.
❖ Program Kesejahteraan
➢ Program kesejahteraan ditujukan agar karyawan mau bekerja keras sampai mereka
pension.
➢ Kesejahteraan diharapkan dapat memenuhi kebutuhan fisik dan mental karyawan
beserta keluarganya.
➢ Program harus disusun berdasarkan peraturan legal, keadilan, dan kelayakan
❖ Keselamatan dan Kesehatan Kerja
➢ Keselamatan dan Kesehatan Kerja (KKK) akan menciptakan terwujudnya pemeliharaan
karyawan yang baik. KKK harus ditanamkan pada individu karyawan dengan penyuluhan
dan pembinaan yang baik agar mereka menyadari keselamatan kerja dirinya, yang jika
tidak maka akan dapat ikut merugikan perusahaan.
❖ Hubungan Industrial Pancasila
➢ Hubungan antara para pelaku dalam proses produksi barang dan jasa didasarkan nilai2
Pancasila. Hubungan ini harus mengakui dan meyakini sebagai pengabdian manusia
kepada Tuhan YME dan sesama manusia (Ke-Tuhan-an YME).
➢ Perusahaan tidak boleh menganggap buruh sekadar faktor produksi tetapi sebagai
manusia pribadi dengan harkat dan martabatnya (Kemanusiaan)
➢ Tidak membedakan golongan, perbedaan keyakinan, politik, paham, aliran, agama, suku
maupun kelamin untuk menjalin persatuan dan kesatuan (Persatuan Indonesia)

200
➢ Berdasarkan prinsip musyawarah untuk mencapai mufakat, berusaha menghi-langkan
perbedaan, mencari persamaan ke arah persetujuan buruh dan pengusaha (Kerakyatan –
Musyawarah – Mufakat)
➢ Mendorong kearah keadilan sosial, hasilnya dinikmati bersama antara karyawan dan
pengusaha

D. KONFLIK, STRESS, DAN KONSELING


❖ Konflik adalah persaingan yang kurang sehat berdasarkan ambisi dan sikap emosional dalam
memperoleh kemenangan.
❖ Nilai positif dari adanya konflik diantaranya membantu pengawasan menghindarkan
kelompok, hal-hal yang kurang beres segera dapat sampai ke pimpinan, harus dijaga agak
tidak berlarut-larut dan mendatangkan efek negative.
❖ Metode Penyelesaian Konflik diantaranya :
➢ Dominasi/Penekanan, kekerasan yang bersifat penekanan otokratik, penenangan dan
penghindaran.
➢ Kompromi, pemisahan,perwasitan, kembali ke peraturan, atau penyuapan.
➢ Pemecahan Integratif, consensus, konfrontasi, atau penggunaan tujuan yang lebih tinggi.
❖ Stress adalah suatu kondisi ketegangan (yang menciptakan adanya ketidakseimbangan fisik
dan psikis,) yang memengaruhi emosi, proses berpikir, dan kondisi seseorang.
❖ Penyebab dari adanya stress (On the Job) diantaranya beban kerja berlebihan,
tekanan/desakan waktu, kualitas supervise, iklim politis yang taka man, umpan balik tentang
pelaksanaan kerja yang tidak memadai, kemenduaan peranan, wewenang yang tak
mencukupi melaksanakan tanggung jawab, frustasi, konflik antar pribadi maupun kelompok,
perbedaan antara nilai perusahaan dan karyawan, berbagai bentuk perubahan. Penyebab
dari adanya stress (Off the job) diantaranya kekuatiran finansial, masalah dengan
keluarga/anak, masalah fisik, masalah perkawinan, perubahan yang terjadi di tempat tinggal,
masalah pribadi lainnya.
❖ Konseling atau pembimbingan dan penyuluhan adalah pembahasan suatu masalah dengan
seorang karyawan, dengan maksud pokok untuk membantu karyawan tersebut agar dapat
menangani masalah secara baik-baik.
❖ Fungsi Konseling ialah sebagai pemberian nasihat, komunikasi, penentraman hati,
pengenduran ketegangan emosional, penjernihan pemikiran, dan reorientasi.

DISIPLIN DAN PEMBERHENTIAN PEGAWAI

A. DISIPLIN
1. Pengertian
Disiplin adalah kesadaran dan kesediaan seseorang menaati semua peraturan
perusahaan/organisasi dan norma-norma yang berlaku. Kesadaran adalah sikap
seseorang yang secara sukarela menaati peraturan, dan kesediaan adalah suatu kemauan
melaksanakan ketetapan.
2. Pentingya Disiplin :
• Agar karyawan datang dan pulang dengan tepat waktu
• Agar karyawan dapat mengerjakan pekerjaan dengan baik

201
• Agar setiap karyawan dapat mematuhi semua peraturan perusahaan/organisasi dan
norma-norma yang ditetapkan oleh perusahaan/organisasi tersebut untuk mencapai
tujuan.
• Peraturan diperlukan untuk memberikan bimbingan dan penyuluhan bagi karyawan
dalam menciptakan tata tertib yang baik di perusahaan/organisasi
• Dengan tata tertib karyawan yang baik, maka semangat kerja, moral kerja, efisiensi,
dan efektivitas kerja karyawan akan meningkat.
3. Indikator Disiplin :
• Tujuan dan kemampuan, yang akan dicapai harus jelas dan cukup menantang bagi
kemampuan karyawan. Beban yang diberikan kepada karyawan harus sesuai dengan
kemampuan agar ybs dapat bekerja sungguh-sungguh dan disiplin untuk
mengerjakannya. Bila over burden disiplin dapat rendah.
• Teladan pimpinan, akan sangat menentukan disiplin karyawan. Pimpinan harus
memberi contoh yang baik, jujur, adil, serta sesuai kata dengan perbuatan, mengingat
masyarakat kita yang menganut paternalistik. Bila pimpinan tidak disiplin, jangan
harap anak buah disiplin.
• Balas jasa, memengaruhi disiplin karyawan, karena balas jasa akan memberikan
kepuasan dan kecintaan karyawan thdp perusahaan/ pekerjaannya. Jika
kecintaannya semakin baik, disiplin semakin baik pula. Semakin besar balas jasa,
semakin takut orang kehilangan pekerjaannya.
• Keadilan, ikut mendorong terwujudnya kedisiplinan karyawan, karena ego dan sifat
manusia yang selalu merasa dirinya penting dan minta diperlakukan sama dengan
lainnya. Keadilan dalam pemberian balas jasa dan hukuman akan merangsang
terciptanya kedisiplinan.
• Waskat, adalah tindakan nyata dan paling efektif dalam mewujudkan kedisiplinan.
Atasan harus aktif mengawasi perilaku, moral, sikap, gairah kerja, dan prestasi kerja
bawah-annya. Pimpinan harus selalu ada untuk mengawasi dan memberikan
petunjuk bila diperlukan bawahannya.
• Sanksi Hukuman, dengan sanksi hukuman yang semakin berat, karyawan akan takut
melanggar peraturan. Sanksi harus disesuaikan dengan pertimbangan logis, masuk
akal dan diinformasikan kepada karyawan. Usahakan tidak terlalu ringan dan tidak
terlalu berat, supaya tetap mendidik.
• Ketegasan, harus berani secara tegas menghukum setiap karyawan yang indisipliner
sesuai dengan sanksi hukuman yang telah ditetapkan, tanpa pandang bulu, adil dan
tidak membeda-kan. Pimpinan yang “lemah” jangan membuat peraturan, yang akan
menyusahkan dirinya.
• Hubungan kemanusiaan, bila harmonis sesama karyawan ikut membuat kedisiplinan
yang baik. Hubungan yang baik harus bersifat vertikal dan horizontal. Manajer harus
membuat hubungan kemanusiaan yang serasi serta mengikat vertikal maupun
horizontal.
4. Bentuk Disiplin Kerja :
• Disiplin Preventif, kegiatan yang dilaksanakan untuk mendorong agar karyawan
mengikuti berbagai standar dan aturan sehingga penyelewengan dapat dicegah,
Manajemen bertanggung jawab menciptakan iklim disiplin preventif dimana berbagai
standar harus diketahui/dipahami para karyawan.

202
• Disiplin Korektif, Kegiatan diambil untuk menangani pelanggaran terhadap
standar/aturan dan mencoba menghindari pelanggaran lebih lanjut. Sering berupa
hukuman dan disebut tindakan pendisiplinan → peringatan atau skorsing
• Disiplin Perspektif, bersifat retributive (mengkukum orang yang bersalah), berusaha
melindungi hak dasar individu, dan bersifat utilitarian (berfokus pada penggunaan
disiplin hanya pada saat konsekuensi Tindakan disiplin melebihi dampak negatifnya.
5. Pendekatan Disiplin :
• Aturan tungku panas (Hot stove role) dan Tindakan disiplin progresif (Progresive
Discipline) → terfokus pada perilaku masa lalu
• Tindakan Positif (Positif Discipline) → pendekatan untuk masa yang akan datang,
diusahakan tidak akan timbul lagi.
6. PP No.35 Tahun 2010 Tentang Disiplin PNS
• Mengatur tentang disiplin pegawai negeri sipil (PNS)
• Menetapkan kewajiban dan larangan, hukuman disiplin (pelanggaran, tingkat dan
jenis hukuman disiplin, pejabat yang berwenang menghukum, tata cara pemeriksaan,
penjatuhan dan penyampaian keputusan hukuman)

B. PEMBERHENTIAN PEGAWAI
1. Pengertian
Pemberhentian adalah pemutusan hubungan kerja seorang karyawan dengan
suatu organisasi perusahaan, berarti berakhirnya keterikatan kerja karyawan terhadap
perusahaan, pemberhentian ini dapat terjadi karena undang-undang, perusahaan, atau
ulah karyawan sendiri.
2. Alasan Pemberhentian :
• Undang Undang, misal UU No.12 tahun 1964 (KUHP) yang dapat menyebabkan
seorang karyawan harus diberhentikan dari suatu perusahaan karena kriteria
tertentu (seperti karyawan anak-anak, masalah pelanggaran imigrasi, terlibat
organisasi terlarang)
• Keinginan perusahaan, karena karyawan dinilai tak mampu bekerja dengan baik, atau
perilaku yang buruk, amoral, melanggar tata tertib perusahaan, serta tidak dapat
bekerja sama dengan karyawan lain.
• Keinginan karyawan (Atrisi), karena kepentingan / alasan seperti mengurus orang
tua, berwiraswasta, Kesehatan yang kurang baik, tidak ada promosi, melanjutkan
pendidikan, masa depan yang suram.
• Pensiun, Undang-undang menetapkan umur pensiun, karena dianggap mereka tidak
lagi produktif sekitar 55 tahun atau 15 tahun telah bekerja (UU-ASN/2014: usia
pensiun PNS adalah 58 tahun).
• Kontrak Kerja berakhir, Pemberhentian berdasarkan berakhirnya kontrak kerja tidak
membawa konsekuensi, karena telah terlebih dahulu diatur dalam perjanjian saat
mereka diterima.
• Kesehatan Karyawan
• Meninggal Dunia, Karyawan yang meninggal dunia, secara otomatis putus hubungan
dengan perusahaan. Perusahaan memberikan pensiun atau pesangon bagi keluarga
yang ditinggalkan, Bahkan ada perusahaan yang memberikan asuransi.

203
• Perusahaan Di Likuidasi (Ditutup), Bangkrutnya perusahaan harus didasarkan
peraturan perundang-undangan yang berlaku, sedang karyawan yang dilepas
mendapat pesangon sesuai dengan ketentuan.
• Pemberhentian khusus PNS :
o Pelanggaran disiplin berat → Pemberhentian dengan hormat tidak atas
permintaan sendiri atau tidak dengan hormat karena melanggar PP 53 tahun
2010 (Disiplin PNS).
o Pemberhentian sesuai dengan PP Nomor 32 tahun 1979 (Pensiun).
3. Lebih Lanjut tentang PP Nomor 32 tahun 1979 tentang Pensiun
• Pemberhentian atas permintaan sendiri, diberhentikan dengan hormat. Permintaan
dapat ditolak apabila yang bersangkutan masih punya ikatan/kewajiban.
• Pemberhentian karena mencapai batas usia pensiun (dapat diperpanjang untuk
jabatan-jabatan tertentu, misal 60 tahun untuk pejabat eselon I dan II dan 65 tahun
untuk ahli peneliti atau ahli madya, guru besar, lector kepala, lector, dan jabatan lain
yang ditentukan presiden).
• PP ini juga mengatur hak-hak kepegawaian yang diberhentikan dengan hormat, bila
telah mencapai umur sekurang-kurangnya 50 tahun dan memiliki masa kerja lebih
dari 10 tahun dapat diberikan hak pensiun., bila kurang umurnya dapat diberikan
uang tunggu, paling lama 1 tahun dan dapat diperpanjang tiap-tiap kali paling lama 1
tahun.
4. PP No. 10 tahun 1983 junto PP No.45 tahun 1990
• Mengatur tentang izin perkawinan dan perceraian bagi PNS
• PNS yang telah melangsungkan perkawinan wajib mengirimkan laporan perkawinan
secara tertulis kepada pejabat yang berwenang, selambat-lambatnya 1 (satu) tahun
terhitung mulai tanggal perkawinan dilangsungkan.
• PNS yang akan melakukan perceraian, wajib memperoleh izin tertulis lebih dahulu
dari pejabat yang berwenang.
• Apabila perceraian terjadi atas kehendak PNS Pria, maka ia wajib menyerahkan
sebagian gajinya untuk penghidupan bekas istri dan anak-anaknya
5. PP No.37 tahun 2004 (Pengganti PP No.5 tahun 1999)
• Tentang larangan PNS menjadi anggota partai politik
• Dalam ketentuan Pasal 3 Undang-Undang No. 8 Tahun 1974 jo. UU no. 43 Tahun 1999,
bahwa Pegawai Negeri sebagai unsur aparatur negara bertugas memberikan
pelayanan kepada masyarakat secara profesional, jujur, adil dan merata.
• Dalam kedudukan dan tugas tersebut, Pegawai Negeri harus netral dari pengaruh
semua golongan dan partai politik
• Pasal 2 → PNS dilarang menjadi anggota dan/atau pengurus partai politik; PNS yang
menjadi anggota dan/atau pengurus partai politik, diberhentikan sebagai PNS.
• Pasal 3 → PNS yang akan menjadi anggota dan/atau pengurus partai politik, wajib
mengundurkan diri sebagai PNS.
• Pasal 9 → PNS yang menjadi anggota dan/atau pengurus partai politik tanpa
mengundurkan diri, diberhentikan tidak dengan hormat sebagai PNS.
6. PP Nomor 9 Tahun 2003 tentang Pemberhentian
• Pemberhentian sementara dari jabatan negeri (pasal 18) → Presiden menetapkan
pemberhentian sementara dari jabatan negeri bagi PNS Pusat yang menduduki
jabatan struktural eselon I atau jabatan fungsional jenjang utama, Pejabat pembina

204
kepegawaian Pusat menetapkan pemberhentian sementara dari jabatan negeri bagi
PNS di lingkungannya yang menduduki eselon II atau jabatan fungsional setingkat,
Mereka dapat mendelegasikannya kepada pejabat lain bagi pemberhentian PNS
struktural eselon III ke bawah atau fungsional setingkat.
• Pejabat pembina kepegawaian Propinsi menetapkan pemberhentian sementara dari
(a) sekda propinsi (b) eselon II ke bawah, Mereka dapat mendelegasikannya kepada
pejabat lain bagi pemberhentian PNS struktural eselon III ke bawah atau fungsional
setingkat.
• Pejabat pembina kepegawaian Kabupaten/ Kota menetapkan pemberhentian
sementara (a) sekda Kab/Kot (b) jabatan negeri bagi PNS di lingkungannya yang
menduduki eselon II atau jabatan fungsional setingkat, Mereka dapat
mendelegasikannya kepada pejabat lain bagi pemberhentian PNS struktural eselon IV
ke bawah.
• Presiden menetapkan pemberhentian Pegawai Negeri Sipil Pusat yang berpangkat
Pembina Utama (Golongan ruang IV/e), Pembina Utama Madya (Golongan ruang
IV/d) dan Pembina Utama Muda (Golongan ruang IV/c).

SISTEM INFORMASI MANAJEMEN (SIM) SUMBER DAYA MANUSIA DAN


PERKANTORAN

A. SIM SDM
1. Pengertian
Sistem Informasi Manajemen (SIM) SDM adalah suatu prosedur sistematik
pengumpulan, pengolahan, penyimpanan, pemeliharaan, perolehan kembali, dan validasi
berbagai data SDM yang dibutuhkan suatu organisasi untuk pengambilan keputusan
(terutama) di bidang/ tentang SDM.
2. Kegunaan
• Sistem Informasi SDM memberikan wahana pengumpulan, peringkasan, dan
penganalisaan data yang berhubungan dengan manajemen SDM dan perencanaan
SDM.
• SIM SDM dirancang untuk membantu para manajer membuat keputusan- keputusan
yang lebih baik.
• Pemenuhan kebutuhan-kebutuhan yang berkaitan dengan fungsi-fungsi SDM seperti:
penilaian suplai SDM, aktivitas-aktivitas rekruitmen,pelatihan & pendidikan,
manajemen karier, dan kompensasi.
3. Komponen Dasar
• Masukan (Input), Mencakup sistem database dan data entry
• Pemeliharaan Data, Berkepentingan dengan kualitas data yang disimpan dalam
sistem
• Keluaran (Output), Berkaitan dengan proses penarikan data (retrieval)
4. Fungsi SIM-SDM
• Fungsi Masukan
➢ Merancangkan informasi yang akan dimasukkan (membuat kuesioner)
➢ Memeriksa kuesioner (editing)
➢ Menyusun Masterfile (agar isian terkontrol)

205
➢ Meng-entry data ke komputer media
➢ Melakukan validasi dan perbaikan
• Fungsi Pemeliharaan
➢ Mengelola kualitas data yang disimpan
➢ Menambah data baru (pegawai baru)
➢ Memutakhirkan data (revisi atas pangkat, golongan, dan pendidikan)
➢ Menghilangkan data yang tak diperlukan (meninggal, berhenti, pensiun)
• Fungsi Keluaran Data
➢ Memproduksi keluaran sesuai dengan kebutuhan organisasi
➢ Laporan standar maupun laporan khusus
➢ Dalam bentuk tayangan maupun dalam bentuk cetakan
➢ Data individu maupun data olahan
➢ Sorting menurut berbagai kriteria
5. Pengembangan SIM-SDM
• Usulan
Menjelaskan mengenai masalah yang dihadapi organisasi dan usulan pemecehan,
pada tahap ini konsep pengembangan diajukan, hingga menyinggung secara umum
analisis biaya dan manfaat serta dampak positifnya ditonjolkan.
• Analisis Kebutuhan
Merinci lebih lanjut dari usulan menjadi sasaran dan spesifikasi pemakai,
menemukan masalah sesungguhnya dan mengembangkan strategi untuk memenuhi
kebutuhan, dan terjadi trade off dalam berbagai alternatif yang ada agar diputuskan
top manajer.
• Spesifikasi Sistem
Merumuskan sistem dari segi pemakai, berbagai fungsi dasar dijelaskan serinci
mungkin untuk menentukan urutan kegiatan pemrosesan, semua ditetapkan mulai
dari produk akhir, fungsi manual yang disyaratkan, tingkat akurasi hingga jangka
waktunya.
• Desain Sistem
Sistem keseluruhan dirinci secara spesifik agar semua fungsi dapat diperiksa dan
semua program dapat disebutkan, perancang sistem kemudian menentukan
bagaimana sistem dapat mencapai sasaran, juga program komputer dibuat dengan
memperhatikan perangkat keras/lunak yang ada.
• Pengembangan Sistem
Program komputer dibuat, semua bagian sistem diuji dengan data yang diberikan
calon pemakai, berbagai program latihan dikembangkan dan dilakukan “dummy test”
maupun data sesungguhnya.

• Instalasi dan Konversi


Pelaksanaan pekerjaan ditempat calon pemakai diuji, dilaksanakan dengan data
sesungguhnya dan calon pelaksana kerja sebenarnya, penyesuaian dilakukan, dan
sistem berjalan seperti yang diharapkan.
• Evaluasi
Kerja sistem diukur dengan sasaran yang telah ditetapkan pada tahap awal, biaya
pelaksanaan sistem, akurasi, ketepatan laporan dan berbagai karakteristik

206
operasional lainnya dievaluasi dan dilaporkan kembali pada manajemen, pada tahp
ini modifikasi masih dapat dilakukan.

B. SISTEM PERKANTORAN
1. Pengertian
Sistem Perkantoran adalah Urutan baku operasi dalam suatu kegiatan
perusahaan dan berkenaan dengan bagaimana operasi itu dilaksanakan (metode)
maupun dimana dan bilamana dilaksanakan. Biasanya mencakup sejumlah prosedur dan
dapat meliputi sejumlah metode.
Sistem Informasi Manajemen (SIM) Perkantoran adalah suatu prosedur
sistematik pengumpulan, pengolahan, penyimpanan, pemeliharaan, perolehan kembali
dan validasi berbagai data yang dibutuhkan organisasi tentang kegiatan perkantoran
2. Sistem yang baik :
• Kelancaran pekerjaan dan mencegah kemungkinan kesalahan
• Pengurangan keterlambatan, hambatan
• Pengawasan menjadi baik
• Penghematan biaya dan tenaga
• Koordinasi berjalan mulus
• Kemudahan melatih petugas
3. Azas Perkantoran Yang Baik (Menurut J.C.Denyer)
• Mempunyai arus kerja yang lancar
• Menghindari kekembaran kerja dan warkat
• Pekerjaan mondar-mandir petugas menjadi minimum
• Menghindari tulis menulis yang tak perlu
• Memanfaatkan spesialisasi maksimum
• Menggunakan perbekalan minimum
• Mencegah pencatatan tak perlu
• Pengecualian terhadap peraturan diminimumkan
• Mencegah pengecekan tak perlu
• Manfaatkan mesin-mesin sebaik-baiknya
• Menggunakan azas kesederhanaan
4. Informasi
• Informasi adalah data yang dicatat, digolong-golongkan, disusun, dihubung-
hubungkan, atau ditafsirkan dalam kerangkan tertentu untuk memberitahukan
pengertian.
• Ciri Informasi :
➢ Benar atau salah; berhubungan dengan realitas
➢ Baru, segar bagi penerima
➢ Tambahan ; memperbaharui yang lama
➢ Korektif ; bagi informasi yang salah atau palsu
➢ Penegas ; meningkatkan persepsi penerima atas kebenarannya.
• Fungsi Informasi :
➢ Menggambarkan (describe)
➢ Menjelaskan (to explain)
➢ Memperkirakan (to predict)
➢ Mengevaluasi (to evaluate)

207
➢ Mengadakan Pembaharuan (to innovate)
• Perancangan Sistem Informasi
➢ Tentukan informasi apa yang diperlukan
➢ Buat penggolongan informasi sampai dengan klasifikasi pokok dan pola
klasifikasi
➢ Rumuskan maksud-maksud khusus atau manfaat informasi tersebut
➢ Tentukan pusat/lokasi penting dalam jaringan lalu-lintas informasi
➢ Rencanakan penyusunan pusat data
➢ Tentukan informasi mana yang akan diproses otomatis dan mana yang manual
• Beberapa SIM BPS
➢ Simpeg-Kepegawaian
➢ Simdir-Daftar Inventaris Ruangan
➢ Simbar-Barang yang habis dipakai
➢ Simken-Kendaraan
➢ Simstis
➢ Simtan-tanah
➢ Simruneg-rumah negara
➢ Simkeu-keuangan
➢ Simwas-pengawasan
➢ Simpub-publikasi
➢ Simpudik

NOTE : MATA KULIAH MANAJEMEN SUMBER DAYA MANUSIA DAN ADMINISTRASI


PERKANTORAN MERUPAKAN MATA KULIAH BARU DI SEMESTER 4. JADI BELUM ADA SOAL
DAN PEMBAHASAN UTS YANG DITAMPILKAN. SEBAGAI GANTINYA, KAMI MENAMPILKAN
LATIHAN SOAL DAN PEMBAHASANNYA. SEMOGA RANGKUMAN DAN LATIHAN SOAL YANG
KAMI BERIKAN DAPAT MEMBANTU TEMAN-TEMAN BELAJAR. SEMANGAT

208
LATIHAN SOAL
1. Mengapa perusahaan perlu memiliki manajemen sumber daya manusia yang Tangguh didalam
mendukung bisnis nya. Jelaskan menurut pendapat anda !

2. Berikan penjelasan tentang arti pentingnya penilaian kinerja bagi perusahaan dan karyawan!

3. Mengapa perusahaan perlu merencanakan program pelatihan dan pengembangan karyawan


secara periodik?

4. Melihat situasi saat ini dimana pemerintah berusaha memangkas birokrasi dengan
pengalihfungsian sejumlah jabatan struktural ke jabatan fungsional, berikan pendapat anda
apakah diperlukan induksi karyawan oleh masing-masing instansi untuk dapat menyesuaikan
kinerja pegawai yang mengalami pengalifungsian jabatan tersebut!

5. Apakah yang dimasud dengan kompensasi/remunerasi bag sumber daya manusia di


perusahaan? Dan mengapa pemberiannya harus secara adil?

6. Bagaimana pemeliharaan pegawai dilakukan?

7. Mengapa perusahaan besar harus memiliki sistem informasi kolaborasi ? Dari pandangan
karyawan dan manager.

8. Jika sistem informasi semakin banyak mendukung bisnis dan menghadirkan berbagai platform
baru yang semakin canggih, apa tantangan untuk organisasi bisnis itu sendiri ?

9. Sebut dan jelaskan komponen dasar dalam SIM SDM !

10. Sebut dan jelaskan bentuk disiplin kerja !

PEMBAHASAN
1. Sumber daya manusia yang terlatih, memang sangat diperlukan untuk mendukung
perkembangan perusahaan. Sumber daya manusia mempengaruhi efisiensi danefektivitas
organisasi, sumber daya manusia merancang dan memproduksi barangdan jasa, mengawasi
kualitas, memasarkan produk, mengalokasikan sumber dayafinansial, serta menentukan seluruh
tujuan dan strategi organisasi. Sumber dayamanusia merupakan pengeluaran utama organisasi
dalam menjalankan bisnis.Manajemen sumber daya menusia MSDM berhubungan dengan sistem
rancangan formal dalam suatu organisasi untuk menentukan efektivitas danefisiensi untuk
mewujudkan sasaran suatu organisasi.

2. Penilaian kinerja karyawan memiliki sejumlah manfaat penting berikut ini :

• Munculnya motivasi kerja yang lebih baik.

• Adanya kejelasan dari standar kerja yang sudah dilakukan

• Umpan balik terhadap kinerja yang sudah lalu.

• Pengembangan diri

• Peluang untuk mendiskusikan berbagai permasalahan selama menjalankankerja

209
• Peluang berkomunikasi dengan pihak atasan

Hasil penilaian kinerja akan digunakan oleh manajemen perusahaan untuk hal-hal penting
berikut ini :

• Sebagai feedback bagi bagian personalia serta karyawan yang bersangkutan.

• Sebagai bahan pertimbangan untuk memberikanreward and punishment.

• Sebagai bahan pertimbangan untuk melakukan promosi, pemindahan, penurunan


pangkat hingga pemecatan.

• Sebagai bahan pertimbangan dalam menentukan jenis pelatihan atau training yang
dibutuhkan oleh karyawan.

3. Berangkat dari keyakinan bahwa sumber daya manusia merupakan aset yang penting,
perusahaan memandang penyeleksian pegawai, pelatihan dan pengembangan serta program
sumber daya manusia sebagai aspek terpenting dari eksistensi perusahaan. Pelatihan dan
program pengembangan secara kontinudiadakan bagi staf manajemen tingkat menengah dan
senior, untuk memastikan jenjang karir yang terus berkembang bagi setiap karyawan. jelas
bahwa struktur manajemen yang menguntungkan dan transparan diadopsi untuk memastikan
bahwa organisasi ini profesional dan bebas dari perselisihan kepentingan. Melalui pelatihan dan
pengembangan secara berkelanjutan maka perusahaan dapatmengurangi ketergantungan untuk
mencari karyawan baru.Jika karyawan dikembangkan semestinya, maka lowongan kerja dapat
ditemukan dalam perencanaan SDM dapat diisi dari sumber internal (internal resources).

4. Menurut saya, ketika terjadi pengalihfungsian sejumlah karyawan dari jabatan struktural ke
jabatan fungsional, tidak diperlukam induksi karyawan, mengingat induksi karyawan
ditunjukkan untuk karyawan baru dalam merubah perilakunya agar sesuai dengan tata tertib
yang berlaku, dalam hal ini pegawai yang mengalami alih fungsi jabatan perlu dibimbing oleh
pengajar bersertifikasi dalam bentuk diklat untuk dapat menjalani bidang barunya.

5. Kompensasi sangat penting bagi karyawan itu sendiri sebagai individu, karena besarnya
kompensasi merupakan pencerminan atau ukuran nilai pekerjaan karyawan itu sendiri.
Sebaliknya besarnya kompensasi dapat mempengaruhi prestasi kerja, motivasi dan kepuasan
kerja karyawan. Apabila kompensasi diberikan secara tepat dan benar para pegawai akan
memperoleh kepuasan kerja dan termotivasi untuk mencapai tujuan-tujuan organisasi.

Besarnya kompensasi yang dibayar kepada setiap karyawan harus disesuaikan dengan prestasi
kerja, jenis pekerjaan, risiko pekerjaan, tanggung jawab, jabatan pekerja, dan memenuhi internal
konsistensi.

Asas adil harus menjadi dasar penilaian, perlakuan dan pemberian hadiah atau hukuman bagi
setiap karyawan. Dengan asas adil akan tercipta suasana kerja sama yang baik, disiplin, loyalitas
dan stabilitas karyawan akan lebih baik.

Kompensasi yang diterima karyawan dapat memenuhi kebutuhannya pada tingkat normatif yang
ideal. Tolak ukur layak adalah relative, penetapan besarnya kompensasi didasarkan atas batas
upah minimal pemerintah dan eksternal konsistensi yang berlaku (Asas layak dan wajar).

210
6. Pemeliharaan karyawan dilakukan dengan beberapa metode yaitu komunikasi, insentif,
kesejahteraan karyawan, kesadaran, dan keselamatan kerja (K3), serta hubungan industrial
pancasila (HIP).

Komunikasi adalah suatu alat pengalihan informasi dari komunikator kepala komunikan agar
terjadi interaksi antara mereka. Interaksi terjadi bila komunikasinya efektif, atau dengan kata lain
dilakukan dalam waktu singkat, jelas/dipahami, dipersepsi/ditafsirkan, dan dilaksanakan sama
dengan maksud komunikator oleh komunikan.

Insentif adalah daya perangsang yang diberikan kepada karyawan tertentu berdasarkan prestasi
kerjanya agar karyawan terdorong meningkatkan produktivitas kerjanya. Dengan pemberian
insentif yang adil, layak dan saat yang tepat serta terbuka akan menciptakan pemeliharaan yang
baik.

Kesejahteraan karyawan adalah balas jasa pelengkap yang diberikan berdasarkan


kebijaksanannya. Tujuannya adalah mempertahankan dan memperbaiki kondisi fisik dan mental
karyawan agar produktivitas kerjanya meningkat.

Kesadaran dan Kesehatan kerja akan menciptakan terwujudnya pemeliharaan karyawan yang
baik. Hal ini harus ditanamkan pada tiap karyawan melalui penyuluhan dan pembinaan agar
mereka menyadari pentingnya keselamatan kerja. Bahkan perlu diberi hukuman bagi yang tidak
menggunakan alat pengaman saat bekerja.

Hubungan Industrial Pancasila adalah hubungan antar pelaku dalam proses produksi barang dan
jasa didasarkan atas nilai yang merupakan manifestasi dari keseluruhan sila-sila Pancasila dan
UUD 1945 yang tumbuh dan berkembang diatas kepribadian bangsa dan kebudayaan nasional
Indonesia.

7. Sistem informasi kolaborasi:

• Dari pandangan karyawan

Dapat membantu kinerja karyawan, karena dengan adnaya sistem informasi kolaborasi
karyawan akan lebih mudah kinerjanya diperusahaan. Mempermudah hubungan antar
karyawan, misalkan satu karyawan dengan karyawan yang lain jarak lokasinya jauh
walaupun masih dalam satu perusahaan, sehingga kolaborasinya atau kerja samanya
akan menjadi lebih efektif dan efisien serta menghemat waktu kerjanya.

• Dari pandangan manager

Membantu kinerja manager, manager bertugas untuk mengawasi kinerja karyawannya,


sehingga saat terdapat kendala (masalah) dalam pekerjaannya, manager bisa langsung
membenahi kinerja karyawannya. Memperluas jaringan komunikasi bisnisnya,
maksudnya adalah manager itu perlu banyak komunikasi atau kerja sama denggan
manager di divisi yang lain, supaya lebih efektif dan efisien dalam pengembangan
bisnisnya dan melancarkan bisnis di perusahaannya.

8. Tantangan organisasi bisnis:

• Harus selalu mengikuti perkembangan sistem informasi, supaya tidak tertinggal dengan
para kompetitor yang selalu mengikuti perkembangan sistem informasi, supaya lebih
mendukung bisnis yang dijalankan.

211
• Harus selalu update mengenai kemajuan sistem informasi, Banyak platform baru yang
semakin canggih pun bermunculan, untuk pengembangan bisnis yang lebih luas maka
diperlukan suatu sistem informasi yang terbaru atau tercanggih untuk mengantisipasi
adanya kesalahan yang terdapat di sistem informasi yang telah usang.

• Selektif dalam memilih platform, Dengan sistem informasi yang semakin banyak
mendukung bisnis serta menghasilkan platform baru yang semakin canggih, membuat
organisasi bisnis harus selektif dalam memilih plaform yang sesuai dengan kegiatan
bisnisnya

• Meningkatkan kinerja para spesialis dibidang sistem informasi, Beberapa tahun yang lalu,
para ahli dibidang sistem informasi mungkin belum menemukan hubungan antara
teknologi dan bisnis atau manajemen. Tetapi tahun-tahun belakangan ini, para ahli sistem
informasi sudah memikirkan adanya manfaat yang besar jika sistem informasi dijadikan
sebagai bagian dari bisnis dan manajemen, sehingga banyak bisnis sekarang ini yang
sudah menggunakan sistem informasi.

9. Komponen Dasar SIM SDM :

• Masukan (Input), Mencakup sistem database dan data entry

• Pemeliharaan Data, Berkepentingan dengan kualitas data yang disimpan dalam sistem

• Keluaran (Output), Berkaitan dengan proses penarikan data (retrieval)

10. Bentuk Disiplin Kerja :

• Disiplin Preventif, kegiatan yang dilaksanakan untuk mendorong agar karyawan


mengikuti berbagai standar dan aturan sehingga penyelewengan dapat dicegah,
Manajemen bertanggung jawab menciptakan iklim disiplin preventif dimana berbagai
standar harus diketahui/dipahami para karyawan.

• Disiplin Korektif, Kegiatan diambil untuk menangani pelanggaran terhadap


standar/aturan dan mencoba menghindari pelanggaran lebih lanjut. Sering berupa
hukuman dan disebut tindakan pendisiplinan → peringatan atau skorsing

• Disiplin Perspektif, bersifat retributive (mengkukum orang yang bersalah), berusaha


melindungi hak dasar individu, dan bersifat utilitarian (berfokus pada penggunaan
disiplin hanya pada saat konsekuensi Tindakan disiplin melebihi dampak negatifnya.

212
SATU DATA INDONESIA

A. PENGERTIAN SDI
Satu Data Indonesia adalah kebijakan tata kelola data pemerintah untuk menghasilkan data yang
akurat, mutakhir, terpadu, dan dapat dipertanggungjawabkan, serta mudah diakses dan
dibagipakaikan antar instansi pusat dan instansi daerah melalui pemenuhan Standar Data, Metadata,
Interoperabilitas Data, dan menggunakan Kode Referensi dan Data Induk.

B. TUJUAN SDI
1. Memberikan acuan pelaksanaan dan pedoman bagi Instansi Pusat dan Instansi Daerah dalam
rangka penyelenggaraan tata kelola data untuk mendukung perencanaan, pelaksanaan, evaluasi,
dan pengendalian pembangunan;
2. Mewujudkan ketersediaan data yang akurat, mutakhir, terpadu, dapat dipertanggungjawabkan,
serta mudah diakses dan dibagipakaikan antar Instansi Pusat dan Instansi Daerah sebagai dasar
perencanaan, pelaksanaan, evaluasi, dan pengendalian pembangunan;
3. Mendorong keterbukaan dan transparansi data sehingga tercipta perencanaan dan perumusan
kebijakan pembangunan yang berbasis pada data;
4. Mendukung Sistem Statistik Nasional (SSN) sesuai peraturan perundang-undangan.

C. MANFAAT SDI
1. Meningkatkan akuntabilitas pemerintah
2. Mempermudah publik mengakses data Indonesia
3. Mempermudah publik menggunakan data karena menggunakan data terbuka dan menggunakan
jenis file yang mudah digunakan
4. Menghasilkan sistem pemerintahan yang transparan
5. Meningkatkan partisipasi pemerintah, masyarakat dan juga swasta dalam membantu
meningkatkan

D. JENIS DATA YANG TERCAKUP DI SDI


1. Data Statistik, yaitu informasi berupa angka tentang karakteristik (ciri-ciri khusus) suatu populasi
yang diperoleh dengan cara pengumpulan, pengolahan, penyajian, dan analisis. Contohnya adalah
Indeks Pembangunan Manusia (IPM), Inflasi, Produk Domestik Bruto (PDB), Jumlah Guru, Jumlah
Kendaraan, dan lain sebagainya.
2. Data Geospasial yaitu data tentang lokasi geografis, dimensi atau ukuran, dan/atau karakteristik
objek alam dan/atau buatan manusia yang berada di bawah, pada, atau di atas permukaan bumi.
Contoh : peta lahan sawah yang dilindungi minimal skala 1:5.000, peta kawasan pemukiman
kumuh skala 1:5.000, peta lokasi kilang minyak skala 1:50.000, dan lain sebagainya.
3. Data Keuangan Negara Tingkat Pusat. Data yang disusun oleh Pemerintah Pusat berdasarkan
sistem akuntansi pemerintah yang mencakup semua hak dan kewajiban negara yang dapat dinilai
dengan uang, serta segala sesuatu baik berupa uang maupun berupa barang yang dapat dijadikan
milik negara berhubung dengan pelaksanaan hak dan kewajiban tersebut. Contoh : Rencana Kerja
dan Anggaran (RKA) Kementerian atau Lembaga (K/L), Rencana Dana Pengeluaran Bendahara
Umum Negara (RDP BUN), dan lain sebagainya.
4. Data lain yang dibutuhkan untuk perencanaan, pelaksanaan, evaluasi, serta pengendalian
pembangunan. Contoh : Big Data, Data Peraturan Perundang-undangan, dan lain sebagainya.

214
E. TANTANGAN PELAKSANAAN SDI
1. Kita memiliki lebih dari 600 walidata, ribuan walidata pendukung, dan ribuan produsen data, yang
mana pengelolaannya tidak mudah karena memiliki perbedaan konsep, definisi, serta kepentingan
tiap institusinya.
2. Banyak SDM pengelola data yang belum mengerti arti penting data, sehingga dibutuhkan diklat-
diklat yang membantu pemahaman mereka mengenai data.
3. Infrastruktur dan aplikasi belum terbangun dengan baik dan merata.
4. Masih belum dapat membuat peraturan yang selaras dengan peraturan yang sudah ada diluar
sektor mereka (masih tinggi egosektoralnya) sehingga harmonisasi sulit tercapai.
5. Harus mensosialisasikan SDI kepada seluruh stakeholder yang pemahamannya terhadap data
belum seperti yang diharapkan.
6. Standar data, Metadata, Interoperabilitas, dan Big Data.

F. PENYELENGGARAAN SDI
1. Perencanaan Data
Perencanaan Data merupakan kegiatan penentuan daftar data yang selanjutnya akan diteruskan
untuk mengumpulkan, memeriksa, dan menyebarluaskan data. Tahapan dalam perencanaan data
adalah sebagai berikut
a) Menetapkan daftar data yang dikumpulkan selanjutnya
b) Menetapkan data prioritas
c) Menetapkan rencana aksi
2. Pengumpulan Data
Pengumpulan Data merupakan kegiatan produksi data berdasarkan daftar data yang telah
ditetapkan pada tahap Perencanaan Data, dan dipantau oleh Koordinator Forum SDI. Adapun
Tahapannya sebagai berikut:
a) Terbitnya Penetapan Menteri PPN atau Kepala Bappenas tentang Data Prioritas dan Rencana
Aksi
b) Pembina Data menentukan landasan proses pengumpulan data, yang terdiri dari Standar Data,
Daftar Data yang Diputuskan Forum, dan Jadwal Pemutakhiran/Rilis Data
c) Pembina Data memberikan rekomendasi terkait metodologi pengumpulan data
d) Produsen Data mengumpulkan data dengan metodologi yang telah disetujui
e) Produsen Data memastikan data yang dikumpulkan sesuai dengan Prinsip SDI
f) Produsen Data menyerahkan Data yang sudah sesuai Prinsip SDI kepada Walidata
3. Pemeriksaan Data
Pemeriksaan dilakukan untuk melihat kesesuaian data dengan Prinsip SDI. Pemeriksaan data
dilakukan oleh Walidata setelah Produsen Data menyerahkan hasil Pengumpulan data. Adapun
tahap pemeriksaan data adalah :
a) Produsen Data menyerahkan data kepada walidata
b) Data diperiksa oleh walidata berdasarkan prinsip SDI, apabila data belum sesuai prinsip SDI
maka Produsen Data memperbaiki data terlebih dahulu.
c) Data telah sesuai prinsip SDI
d) Data disebarluaskan oleh walidata
4. Penyebarluasan Data
Penyebarluasan Data merupakan kegiatan Pemberian Akses, Pendistribusian, danPertukaran Data
oleh Walidata. Penyebarluasan dilakukan melalui Portal Satu Data Indonesia dan/atau media
lainnya.
a) Pengecekan ulang dilakukan oleh Pembina Data

215
b) Walidata mengunggah data ke Portal Satu Data Indonesia
c) Memastikan akses data dalam Portal Satu Data Indonesia melalui pemenuhan persyaratan

G. UPAYA IMPLEMENTASI SDI OLEH BPS


1. SISNERLING (Sistem Neraca EKonomi dan Lingkungan Terintegrasi)
Data Flow – Data Exchange Process dari SISNERLING mengacu dan mengimplementasikan
konsep-konsep yang terdapat dalam Satu Data Indonesia.
2. SIRUSA (Sistem Informasi Rujukan Statistik).
SIRUSA adalah suatu aplikasi berbasis adalah suatu aplikasi berbasis website yang menyediakan
informasi metadata statistik yang ada di Indonesia. Metadata merupakan salah satu prinsip SDI.
3. SIMDASI (Sistem Informasi Manajemen Data Statistik Terintegrasi)
SIMDASI merupakan salah satu sumber data bagi Portal Satu Data
4. ROMANTIK Online (Rekomendasi Kegiatan Statistik Online)
ROMANTIC merupakan fitur untuk melakukan pencarian kegiatan statistik (survei dan kompilasi
produk administrasi) yang sudah pernah mendapatkan rekomendasi dari BPS.
5. SIG (Sistem Informasi Geografis)
SIG bertujuan untuk menyajikan kepada publik berbagai informasi yang terkait dengan kerangka
wilayah kerja statistik, peta, dan data
6. WEBSITE BPS

H. PARTISIPASI MASYARAKAT UNTUK DATA STATISTIK


1. Mau menjadi responden dan memberikan datanya apabila diminta
2. Peningkatan kualitas data registrasi dapat diperoleh jika masyarakat aktif melaporkan
perubahan data kepada dinas terkait
3. Memberikan umpan balik (feedback) terhadap data statistik yang telah digunakan baik untuk
Pendidikan/penelitian/pembangunan
4. Aktif meng-update data diri dalan Sensus Online SP2020 nanti

STANDAR DATA, METADATA STATISTIK, DAN INTEROPERABILITAS

STANDAR DATA

A. LATAR BELAKANG STANDAR DATA


Kegiatan statistik memerlukan suatu standar dalam penyelenggarannya atas dasar sebagai berikut :
1. Upaya penyediaan data dan penyebarluasan data yang dihasilkan pemerintah.
2. Penggunaan standar data mampu menjaga konsistensi penggunaan data agar dapat dibandingkan
antar periode waktu maupun antar wilayah.
3. Penggunaan standar data mampu menurunkan ambiguitas data yang dihasilkan beragam
produsen data.
4. Penggunaan standar data mampu menggaransi kualitas data itu sendiri.
5. Penggunaan standar data mampu menguji efektifitas kegiatan statistik agar kegiatan yang sama
tidak dilakukan berulang dan data menjadi lebih mudah untuk dibagipakaikan.
6. Penyusunan standar data statistik merupakan inti dari harmonisasi dan integrasi yang
diharapkan dari penerapan Sistem Statistik Nasional.

216
B. PENGERTIAN STANDAR DATA
Standardisasi data adalah proses untuk membawa data ke dalam format umum yang memungkinkan
untuk perbandingan data, analisis lintas sektor yang bersifat kolaboratif, dan berbagi pakai data itu
sendiri.
Secara umum, standar data statistik bertujuan untuk memudahkan pengumpulan, berbagipakai, dan
pengintegrasian data serta memastikan adanya informasi yang jelas tentang data yang dihasilkan.
Sementara secara khusus standar data statistik bertujuan untuk memudahkan penggunaan data,
meningkatkan akurasi dan konsistensi data, memperjelas makna yang ambigu dan meminimalkan
pengumpulan data yang serupa oleh banyak Instansi Pusat dan/atau Instansi Daerah.

C. TUJUAN STANDAR DATA


1. Memudahkan pengumpulan, berbagipakai, dan pengintegrasian data dengan memastikan bahwa
ada pemahaman yang jelas tentang data yang dihasilkan
2. Memudahkan penggunaan data,
3. Memberikan akurasi dan konsistensi data,
4. Memperjelas makna yang ambigu dan meminimalkan pengumpulan data yang serupa oleh
banyak Instansi Pusat dan/atau Instansi Daerah.

D. MANFAAT STANDAR DATA


1. Meningkatkan integritas dataset yang dirilis oleh pemerintah melalui standardisasi
penyelenggaraan data pemerintah dalam hal penetapan konsep, definisi, klasifikasi, ukuran,
aturan dan asumsi.
2. Memperbaiki alur koordinasi dan komunikasi antar Pembina Data selaku Badan Pemerintah yang
memiliki kewenangan untuk melakukan pembinaan bagi pengembangan dan pembakuan Standar
Data Statistik dengan Walidata dan Produsen data di setiap Instansi Pemerintah.
3. Menghindari terjadinya multi standar penyelenggaraan data rilis pemerintah melalui mekanisme
harmonisasi data antar instansi pemerintah, penentuan ownership (kepemilikan) pada setiap
rilis dataset, dan penetapan kode referensi pada data.

E. DASAR HUKUM STANDAR DATA


1. Pasal 17 ayat 2 UU Nomor 16 Tentang Statistik
Dalam rangka mewujudkan dan mengembangkan Sistem Statistik Nasional, Badan Pusat Statistik
bekerja sama dengan instansi pemerintah dan masyarakat untuk membangun pembakuan
konsep, definisi, klasifikasi, dan ukuran-ukuran.
2. Perpres No. 39 Tahun 2019 tentang Satu Data Indonesia
a) Pasal 4 ayat (1), Data yang dihasilkan oleh Produsen Data harus memenuhi Standar Data.
b) Pasal 6 ayat (1), Standar Data yang berlaku lintas Instansi Pusat dan/atau Instansi Daerah
ditetapkan oleh Pembina Data tingkat pusat.
3. Peraturan BPS
a) Peraturan BPS No. 4 Tahun 2020 Tentang Petunjuk Teknis Standar Data Statistik
b) Peraturan Kepala BPS No. 126 Tahun 2020 Tentang Master File Standar Data Statistik Tahun
2020

217
F. AZAS PEMBENTUKAN STANDAR DATA STATISTIK
1. Relevansi, Ketidakberpihakan, dan Keterbukaan
Relevan artinya agar dapat memfasilitasi dan memperhatikan kebutuhan Instansi Pusat dan/atau
Instansi Daerah dan tidak bertentangan dengan peraturan perundang-undangan yang berlaku.
Ketidakberpihakan artinya tidak memihak kepentingan Instansi Pusat dan/atau Instansi Daerah
tertentu. Keterbukaan artinya terbuka bagi semua Instansi Pusat dan/atau Instansi Daerah yang
berkepentingan dapat berpartisipasi dalam pengembangan standar dan dapat menyalurkan
kepentingannya dan diperlakukan secara adil.
2. Standar Profesional, Prinsip Ilmiah, dan Etika Profesional
Dalam penetapan standar, badan statistik memutuskan berdasarkan pertimbangan profesional,
termasuk prinsip ilmiah dan etika professional.
3. Akuntabilitas dan Transparansi
Akuntabilitas artinya penetapan standar harus sesuai dengan standar ilmiah tentang sumber,
metode dan prosedur statistik agar dapat digunakan untuk interpretasi data dengan benar.
Transparansi, artinya transparan agar semua Instansi Pusat dan/atau Instansi Daerah yang
berkepentingan dapat mengikuti dan mudah memperoleh semua informasi yang berkaitan
dengan pengembangan standar.
4. Sumber Statistik Resmi
Standar yang ditetapkan harus dijadikan sumber rujukan statistik resmi. Oleh karena itu standar
yang ditetapkan juga harus memiliki sumber yang sahih.
5. Koheren dengan Penggunaan Standar Internasional
Koheren dengan Penggunaan Standar Internasional artinya pengembangan standar sejalan
dengan standar internasional untuk menjamin keterbandingan data secara internasional dan
mendorong konsistensi dan efisiensi sistem statistik meskipun digunakan dengan cara yang
berbeda dan untuk berbagai penggunaan.
6. Berdimensi Pembangunan
Berdimensi pembangunan artinya memperhatikan kepentingan publik dan kepentingan nasional.

G. KOMPONEN STANDAR DATA


1. Konsep merupakan ide yang mendasari data dan tujuan data tersebut diproduksi
2. Definisi merupakan penjelasan tentang data yang memberi batas atau membedakan secara jelas
arti dan cakupan data tertentu dengan data yang lain
3. Klasifikasi merupakan penggolongan data secara sistematis ke dalam kelompok atau kategori
berdasarkan kriteria yang ditetapkan oleh Pembina Data atau dibakukan secara luas
4. Ukuran merupakan unit yang digunakan dalam pengukuran jumlah, kadar, atau cakupan
5. Saturan merupakan besaran tertentu dalam Data yang digunakan sebagai standar untuk
mengukur atau menakar sebagai sebuah keseluruhan
Contoh
Konsep : Kemiskinan
Definisi : Ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan
bukan makanan yang diukur dari sisi pengeluaran
Klasifikasi : identifikasi berdasarkan kKedalaman Kemiskinan (Poverty Gap Index-P1), Klasifikasi
berdasarkan Keparahan Kemiskinan (Poverty Severity Index-P2).
Ukuran : Indeks
Satuan : Persentase

218
H. TAHAPAN IDENTIFIKASI STANDAR DATA STATISTIK
1. Identifikasi Indikator dan/atau Variabel
Pada tahapan ini indikator dan/atau variabel diidentifikasi berdasarkan jenis indikator dan/ atau
variabel tersebut. Variabel dapat dibedakan menjadi variabel tunggal dan variabel turunan yang
diperoleh dari kombinasi pernghitungan lebih dari satu variabel tunggal.
2. Penentuan Cakupan Indikator dan/atau Variabel
Pada tahapan ini cakupan dari satu indikator dan/ atau variabel yang sama dapat digunakan
dalam beberapa lingkup statistik yaitu statistik ekonomi, sosial, pertanian, neraca/analisis, sesuai
dengan tujuan dari pengumpulannya.
3. Pembentukan Komponen Standar Data Statistik
Pada tahapan ini variabel yang sudah diidentifikasi dan ditentukan cakupannya dibakukan
berdasarkan lima standar data yaitu konsep, definisi, klasifikasi, ukuran dan satuan.

METADATA

A. PENGERTIAN METADATA
Metadata adalah informasi dalam bentuk struktur dan format yang baku untuk menggambarkan
data, menjelaskan data, serta memudahkan pencarian, penggunaan, dan pengelolaan informasi data.
Metadata ini mengandung informasi mengenai isi dari suatu data yang diperlukan untuk keperluan
manajemen file/data yang nantinya terdapat dalam suatu basis data.

B. JENIS METADATA
Nasional Information Standards Organization (NISO) mengelompokan metadata menjadi 3 bagian
1. Metadata Deskriptif, yaitu metada yang menjelaskan suatu sumber untuk tujuan mencari dan
mengidentifikasi suatu data. Contoh : Metadata Kegiatan Statistik
2. Metadata Struktural, yaitu metadata yang mengidentifikasi teknis pembuatan suatu data. Contoh
: Metadata Indikator Statistik dan Metadata Variabel Statistik.
3. Metadata Fisik, yaitu metadata yang berisi informasi untuk membantu pengelola suatu sumber
daya. Contoh : Katalog Perpustakaan.
Sedangkan menurut UU No.16 tahun 1997 tentang Statistik, metadata dikelompokan menjadi
1. Metadata kegiatan statistik dasar
2. Metadata kegiatan statistik sektoral
3. Metadata kegiatan statistik khusus

C. MANFAAT METADATA
Bagi pengembang :
1. Menghindari duplikasi
2. Sebagai sarana untuk sharing informasi
3. Publikasi output
4. Mengurangi beban kerja
5. Sebagai dokumentasi data dan informasi
Bagi Pengguna :
1. Memudahkan pencarian dan evaluasi informasi
2. Memudahkan pemanfaatan data
3. Memudahkan identifikasi perolehan, perhitungan, dan estimasi data.

219
Bagi Organisasi :
1. Memudahkan pengelolaan data sebagai investasi organisasi
2. Dokumentasi, yang meliputi tahapan pengolahan, pengendalian mutu, definisi, penggunaan data,
dan keterbatasan.

D. METADATA STATISTIK
1. Metadata Kegiatan Statistik
Metadata kegiatan statistik adalah sekumpulan atribut informasi yang memberikan
gambaran/dokumentasi dari penyelenggaraan kegiatan statistik. Struktur baku metadata
kegiatan statistik dapat dilihat pada tabel di bawah ini :

2. Metadata Variabel Statistik


Metadata variabel adalah sekumpulan atribut informasi yang
memberikangambaran/dokumentasi dari penyusunan suatu variabel, standar ukuran dan satuan
yang digunakan, aturan pengisian, bentuk pertanyaan yang digunakan, dan informasi lain yang
mendukung dasar pemilihan suatu variabel dalam kegiatan statistik. Struktur baku metadata
variabel statistik dapat dilihat pada tabel di bawah ini :

3. Metadata Indikator Statistik


Metadata indikator adalah sekumpulan atribut informasi yang memberikan
gambaran/dokumentasi dasar terbentuknya suatu indikator dalam upaya memberikan
pemahaman dan penggunaan secara tepat suatu indikator. Struktur baku metadata indikator
statistik dapat dilihat pada tabel di bawah ini:

220
INTEROPERABILITAS

A. PENGERTIAN INTEROPERABILITAS

Interoperabilitas adalah dimana suatu aplikasi bisa berinteraksi dengan aplikasi lainnya melalui
suatu protokol yang disetujui bersama lewat bermacam-macam jalur komunikasi, biasanya lewat
network TCP/IP dan protokol HTTP dengan memanfaatkan file XML. Adapun aplikasi disini boleh
berada di platform yang berbeda: Delphi Win32, .NET, Java, atau bahkan pada O/S yang berbeda.
Sementara, interoperabilitas data adalah kesiapan data untuk dibagipakaikan antar sistem
elektronik yang saling berinteraksi. (Perpres Nomor 39 tahun 2019 tentang Satu Data Indonesia)

B. MANFAAT INTEROPERABILITAS
1. Kemudahan dalam pengelolaan dan pengaksesan data
2. Pelayanan public yang lebih efektif
3. Pengambilan keputusan menjadi lebih relevan, akurat dan tepat waktu, karena waktu akses tyang
lebih cepat
4. Koordinasi program lebih mudah
5. Iklim berdemokrasi yang lebih bagus

NORMA, STANDAR, PROSEDUR, DAN KRITERIA PENYELENGGARAAN STATISTIK


SEKTORAL

A. LATAR BELAKANG NSPK


Tidak semua data dapat dipenuhi BPS karena BPS hanya berfokus pada statistik dasar yang bersifat
makro dan lintas sektoral. Oleh karena itu, dibutuhkan peran K/L/D/I untuk memenuhi data
sektoral yang sesuai dengan Norma, Standar, Prosedur, dan Kriteria penyelenggaraan Statistik
Sektoral. setiap institusi pemerintah memiliki kekhasan dalam ragam data serta memiliki
pendekatan masing-masing dalam penyediaan data dan informasi untuk perencanaannya sehingga
dibutuhkan NPSK agar sistem statistik nasional menjadi lebih efektif dan efisien.

B. TUJUAN NSPK
1. Mewujudkan Sistem Statistik Nasional yang andal, efektif, dan efisien
2. Meningkatkan koordinasi, integrasi, dan harmonisasi dalam pelaksanaan urusan pemerintahan
bidang statistik antara pemerintah pusat dan daerah
3. Menyediakan data statistik sektoral yang berkualitas

C. PRINSIP PENYELENGGARAAN STATISTIK SEKTORAL


1. Statistik ditempatkan sebagai instrumen penting dalam kehidupan masyarakat dan tersedia bagi
siapapun tanpa terkecuali
2. Statistik merupakan hasil dari suatu proses intelektual yang dapat dipertanggungjawabkan
secara ilmiah
3. Statistik mengacu pada standar ilmiah
4. Statistik bebas dari kesalahanpenggunaan

221
5. Statistik memenuhi nilai kualitas, waktu, biaya, dan menghindari beban atau kejenuhan
responden
6. Statistik mampu menjamin secara ketat kerahasiaan informasi individu dan sumbernya
7. Penyelenggaraan statistik berpedoman pada ketentuan peraturan perundang-undangan
8. Koordinasi dalam penyelenggaraan statistik untuk mewujudkan sistem statistik yang konsisten,
efisien, dan efektif
9. Menggunaan metodologi, konsep, definisi, klasifikasi, dan ukuran-ukuran statistik yang mengacu
pada standar internasional
10. Penyelenggaraan statistik dalam bentuk kerja sama diutamakan dalam rangka perbaikan statistik
nasional

D. NSPK PENYELENGGARAAN STATISTIK NASIONAL


1. NORMA
a) Diselenggarakan secara profesional, objektif, berintegritas, dan akuntabel
b) Menghormati kontribusi dan kepemilikan intelektual.
2. STANDAR
a) Memiliki sumber daya manusia yang kompeten di bidang Statistik
b) Memiliki sarana dan prasarana yang memadai.
c) Menggunakan konsep definisi, metadata, dan metodologi Statistik yang baku
3. PROSEDUR
Dalam penyelenggaraan kegiatan statistik sektoral, pemerintah daerah memperoleh data melalui
survei, kompilasi produk administrasi, maupun cara lain sesuai perkembangan.

Berikut ini tahapan penyelenggaraan kegiatan statistik sektoral


a) Perencanaan data
Pemerintah Daerah yang akan menyelenggarakan survei dan hasilnya dipublikasikan, wajib:
- Meminta rekomendasi BPS dengan didahului pemberitahuan rancangan penyelenggaraan
kegiatan Survei kepada BPS;
- Mengikuti rekomendasi yang diberikan BPS;
- Menyerahkan hasil penyelenggaraan kepada BPS.

Sebelum menyampaikan rancangan penyelenggaraan kegiatan Survei, Pemerintah Daerah


berkewajiban terlebih dahulu mempelajari dan membandingkan rancangannya dengan
rancangan yang telah ada di rujukan Statistik dan Data yang ada di BPS. Pengusulan rancangan
penyelenggaraan melalui Perangkat Daerah yang menangani urusan pemerintahan bidang
Statistik menggunakan formulir pemberitahuan Survei Statistik Sektoral.

b) Pemeriksaan
- BPS mengevaluasi rancangan penyelenggaraan kegiatan Survei yang disampaikan oleh
Pemerintah Daerah,
- BPS memberikan rekomendasi kepada Pemerintah Daerah berupa surat rekomendasi
berdasarkan hasil evaluasi.
- Surat rekomendasi disampaikan kepada Perangkat Daerah yang menangani urusan
pemerintahan bidang statistik serta ditembuskan kepada Perangkat Daerah pelaksana
urusan pemerintahan bidang perencanaan.
- Penyelenggaraan Survei yang sudah mendapatkan rekomendasi, wajib mencantumkan
identitas rekomendasi pada kuesioner.

222
c) Penyebarluasan Hasil
- Kegiatan Statistik Sektoral yang hasilnya dipublikasikan, wajib diserahkan hasilnya dalam
bentuk softcopy kepadaBPS.
- Diserahkan melalui Perangkat Daerah yang menangani urusan pemerintahan bidang
statistik dengan ketentuan diberikan kepada :
• BPS, apabila wilayah kegiatannya mencakup lebih dari satu provinsi.
• BPS Provinsi, apabila wilayah kegiatannya mencakup satu provinsi atau lebih dari satu
kabupaten/kota dalam satu provinsi.
• BPS Kabupaten/Kota, apabila wilayah kegiatannya mencakup satu kabupaten/kota.

4. KRITERIA
Untuk mendapatkan Statistik Sektoral yang berkualitas, Data yang dihasilkan harus memenuhi
kriteria:
a) Relevan, memenuhi kebutuhan pengguna Data.
b) Akurat, mampu secara tepat menggambarkan keadaan yang diukur.
c) Tepat waktu, baik dalam pelaksanaan lapangan maupun waktu penyajian.
d) Mudah diakses, oleh para pengguna Data.
e) Mudah ditafsirkan, didukung dengan penjelasan dan dilengkapi dengan Metadata.
f) Konsisten, dalam konteks antar waktu dan antar wilayah.

E. KOORDINASI PENYELENGGARAAN STATISTIK SEKTORAL


1. Dalam penyelenggaraan Statistik Sektoral, Pemerintah Daerah dapat berkoordinasi dengan BPS
sesuai dengan ketentuan peraturan perundang-undangan.
2. Pemerintah Daerah dapat bekerja sama dengan BPS untuk membakukan konsep, definisi,
klasifikasi, ukuran, dan satuan yang dibangun dalam penyelenggaraan kegiatan Statistik Sektoral.

F. PEMBINAAN, MONITORING, DAN EVALUASI PENYELENGGARAAN STATISTIK SEKTORAL


1. BPS melakukan pembinaan, monitoring, dan evaluasi terhadap penyelenggaraan Statistik
Sektoral oleh Pemerintah Daerah sesuai dengan ketentuan peraturan perundang-undangan.
2. BPS menyampaikan laporan hasil pembinaan, monitoring, dan evaluasi terhadap
penyelenggaraan Statistik Sektoral oleh Pemerintah Daerah kepada Presiden melalui Menteri
Dalam Negeri

G. PENDANAAN PENYELENGGARAAN STATISTIK SEKTORAL


Pendanaan pelaksanaan kebijakan, program, dan kegiatan Statistik Sektoral di Pemerintahan Daerah
bersumber dari Anggaran Pendapatan Belanja Daerah(APBD)atau sumber lain yang sah.

KONSEP INDIKATOR

A. PENGANTAR
Pada dasarnya, sebuah indikator memberikan tanda atau sinyal bahwa sesuatu itu ada atau benar.
Digunakan untuk menunjukkan keberadaan atau keadaan suatu situasi atau kondisi.

223
• Dalam Sosial, indikator biasanya mengacu pada potongan data sosial yang digunakan untuk
mengukur keadaan dan memberikan gambaran karakteristik wilayah atau masyarakat secara
keseluruhan. Contohnya Angka Harapan Hidup, Angka Partisipasi Sekolah.
• Dalam ekonomi, indikator biasanya mengacu pada potongan data ekonomi yang digunakan untuk
mengukur kesehatan ekonomi secara keseluruhan dan memprediksi arahnya. Contohnya: Indeks
Harga Konsumen (IHK), Produk Domestik Bruto (PDB), dan angka pengangguran
Indikator selalu menyederhanakan realitas yang kompleks, dengan fokus pada aspek-aspek tertentu
yang dianggap relevan dan tersedia datanya. Indikator hanya bermakna sebagai bagian dari kerangka
atau cerita. Indikator adalah bagian penting dari arus informasi yang kita gunakan untuk memahami
dunia, membuat keputusan, dan merencanakan tindakan kita.
Indikator adalah alat yang:
• Menyederhanakan masalah yang kompleks, membuatnya dapat diakses oleh audiens yang lebih
luas dan tidak ahli.
• Dapat mendorong pengambilan keputusan dengan menunjukkan langkah-langkah yang jelas
dalam rantai sebab akibat yang dapat diputus.
• Menginformasikan dan memberdayakan pembuat kebijakan dan orang awam dengan
menciptakan sarana untuk mengukur kemajuan dalam menangani kemajuan lingkungan.
Indikator tidak dapat menggantikan studi ilmiah tentang sebab dan akibat.

B. PENGERTIAN INDIKATOR
Pengertian indikator menurut beberapa sumber:
• Variabel kendali yang dapat digunakan untuk mengukur perubahan pada sebuah kejadian
• KBBI : sesuatu yang dapat memberikan petunjuk atau keterangan
• Menunjukkan suatu fenomena atau kondisi tertentu
• Bisa dipakai untuk mengukur perubahan yang terjadi
• Dituangkan berupa suatu angka (dapat disebut angka indeks)
• Dapat dirumuskan dari satu atau lebih variabel
Contoh indikator :
• Perbandingan antara jumlah penduduk dan luas area suatu wilayah dapat menjadi indikator
kepadatan penduduk per kilometer persegi.
• Berat badan bayi berdasarkan umur dapat menjadi indikator bagi status gizi bayi
Jenis indikator:
• Rujukan: data yang menyatakan kelompok sasaran dari permasalahan/program
• Input: sumber daya yang digunakan dalam pelaksanaan kegiatan/program
• Proses: partisipasi kelompok sasaran dalam kegiatan/program
• Output: hasil dari suatu kegiatan/program
• Outcome: manfaat dari program bagi kelompok sasaran/masyarakat
Indikator menurut jumlah variabel/karakteristik
• Tunggal: pengukuran permasalahan berdasarkan satu karakteristik % buta aksara, rata2 lama
sekolah (tahun), rata2 asupan energi (kkal/hari)
• Komposit: pengukuran permasalahan multi dimensi dengan menggunakan banyak indikator
dengan satu angka Indeks Pembangunan Manusia (IPM), Indeks Demokrasi Indonesia (IDI), Laju
Pertumbuhan
Penghitungan indikator bersifat:
• Rate, angka, tingkat: menyatakan suatu masalah yang dihadapi oleh sekian orang untuk setiap
jumlah tertentu penduduk (ratusan, ribuan, seratus ribuan)

224
• Rata-rata : suatu besaran angka dari sifat/karakteristik dari setiap penduduk/populasi
• Rasio: perbandingan antara 2 kelompok, menyatakan setiap satu orang berkaitan dengan
beberapa orang kelompok yang lain
Contoh penerapan :
Program pendidikan menengah:
• Rujukan: penduduk usia sekolah sekolah menengah (umum, kejuruan) (16-18 thn)
• Input: fasilitas yang digunakan dalam proses belajar mengajar: rasio muridguru, rasio murid-
kelas, dll
• Proses: banyaknya murid (sma,k) untuk setiap 100 anak usia 16-18 tahun: angka partisipasi
(murni, kasar, sekolah)
• Output: % murid SM lulus UAN, % murid SM mengulang,
• Outcome (semua jenjang): angka putus sekolah, angka buta huruf, rata lama sekolah
Intrepretasi indikator:
• Rasio murid-guru = 44, setiap guru mempunyai tanggung jawab untuk 44 murid; rasio murid-
kelas = 32, setiap kelas diisi 32 murid
• Angka Partisipasi Murni = 58, setiap 100 penduduk usia 16-18 tahun, 58 orang di antaranya
sedang bersekolah di SM
• Angka Putus Sekolah SMA = 2,6 =>sebanyak 2,6 dari setiap 100 murid SMA tidak dapat
menyelesaikan sekolah
• Angka kematian bayi = 28, => 28 bayi akan meninggal sebelum berumur satu tahun dari setiap
1000 kelahiran hidup

C. SYARAT INDIKATOR
Syarat indikator yang baik harus memenuhi:
• Spesifik (interpretasi jelas, tidak mengandung multi interpretasi)
• Valid (sahih, absah)
• Reliabel (andal, tepercaya, konsisten)
• Sensitif (dapat mendeteksi perubahan kecil)
• Data tersedia (untuk pengukuran, serta keberlanjutan monitoring dan evaluasi)
Namun, tidak semua indikator yang diperlukan untuk mengukur suatu fenomena tersedia datanya.
Oleh karena itu, dapat digunakan indikator proxy. Misalnya, indikator untuk mengukur kesejahteraan
petani, dapat digunakan perbandingan antara indeks harga yang diterima petani (It) dan indeks
harga yang dibayar petani (Ib), atau biasa disebut sebagai Nilai Tukar Petani (NTP)
the New Economics Foundation mengidentifikasi kriteria untuk indikator, yang terus menjadi
panduan yang berguna dalam memutuskan apakah suatu indikator merupakan indikator yang baik :
• Action focused (Fokus Tindakan). Indikator harus mengarah pada tindakan. Jika pemangku
kepentingan tidak dapat membayangkan apa yang harus dilakukan dengan data dari suatu
indikator, maka itu mungkin bukan indikator yang baik.
• Important (Penting). Pemangku kepentingan harus setuju bahwa indikator dan data yang akan
dihasilkannya memberikan kontribusi yang relevan dan signifikan untuk menentukan cara
merespons epidemi secara efektif.
• Mesurable (terukur). Metodologi pengumpulan data tidak hanya harus didefinisikan, tetapi juga
harus layak untuk mengumpulkan data.
• Simple (Sederhana). Indikator dibuat sesederhana mungkin sehingga bisa dimengerti oleh
audiens yang lebih luas (tidak ahli). Daripada mengejar indikator yang sempurna, jauh lebih baik

225
untuk mengidentifikasi indikator yang baik dan sederhana yang menyediakan data yang dapat
digunakan.

D. KOMPONEN INDIKATOR
• Judul. Judul singkat yang menangkap fokus indikator.
• Definisi. Deskripsi indikator yang jelas dan ringkas.
• Tujuan. Alasan adanya indikator tersebut; yaitu untuk apa
• Metode pengukuran. Urutan operasi yang logis dan spesifik yang digunakan untuk mengukur
indikator; misalnya alat pengumpulan data, kerangka sampling dan jaminan kualitas
• Perhitungan. Langkah-langkah khusus dalam proses untuk menentukan nilai indikator.
• Metode pengumpulan data. Pendekatan umum (misalnya survei, catatan, model, perkiraan) yang
digunakan untuk mengumpulkan data.
• Alat pengumpulan data. Alat khusus (misalnya Survei Indikator AIDS (AIS), Survei Demografi dan
Kesehatan (DHS), Penilaian Penyediaan Layanan (SPA), daftar pasien, surveilans klinik
antenatal) digunakan untuk mengumpulkan data.
• Frekuensi pengumpulan data. Interval di mana data dikumpulkan; misalnya triwulanan, tahunan,
dua tahunan.
• Disagregasi data. Subkelompok relevan yang mengumpulkan data dapat dipisahkan agar lebih
tepat memahami dan menganalisis temuan.
• Interprestasi

E. KAPAN INDIKATOR AKAN BERGUNA


• Ketika berguna untuk memiliki ukuran standar yang dapat dibandingkan dari waktu ke waktu
dan/atau tempat.
• Ketika sebuah indikator telah menunjukkan keunggulan teknis. Para ahli yang bekerja di bidang
teknis tertentu menganggap indikator ini secara teknis masuk akal.
• Ketika indikator sepenuhnya ditentukan. Cara mendasar untuk memastikan kualitas data yang
dikumpulkan oleh suatu indikator adalah dengan menggunakan indikator berkualitas tinggi.
• Ketika sebuah indikator memiliki rekam jejak yang terbukti. Ini telah berhasil diuji lapangan atau
digunakan secara operasional dan nilainya telah ditunjukkan.
• Ketika ingin menangkap data tren. Oleh karena itu, penting untuk mengumpulkan data secara
berkala (misalnya dua tahunan, tahunan) selama periode yang diperpanjang.
• Ketika itu bisa menjadi bagian yang berguna dari set yang dipilih dengan cermat. Karena
indikator hanya menunjukkan, akan berguna untuk memasukkan beberapa indikator ke dalam
rangkaian yang terdefinisi dengan baik. Perangkat yang dipilih dengan cermat memberikan
informasi yang seimbang tentang epidemi dan respons yang dapat digunakan oleh pembuat
keputusan

F. MEMILIH INDIKATOR
Indikator harus dipilih dengan hati-hati dan sistematis. Penting untuk mempertimbangkan konteks
atau lingkungan di mana mereka akan digunakan. Sama pentingnya untuk mempertimbangkan
kerangka indikator yang ada atau yang berlaku yang relevan dengan konteksnya. Selain itu, semua
indikator potensial harus dievaluasi menggunakan standar indikator internasional untuk
memastikan bahwa indikator tersebut dapat dan akan memberikan data yang berguna. Indikator
tersebut harus diambil dari rangkaian indikator yang diselaraskan dan/atau digunakan secara luas
yang memiliki rekam jejak yang sukses.

226
• Konteks. Ketika memilih indikator, penting untuk memahami konteks di mana mereka akan
digunakan untuk memilih yang paling tepat. Secara khusus, suatu negara harus memiliki
pemahaman yang baik tentang epidemi dan responsnya ketika memilih indikator.
• Kerangka indikator. Sebagian besar negara telah mengembangkan kerangka kerja indikator.
Secara umum, kerangka kerja ini menghubungkan tujuan utama, kegiatan dan/atau rencana kerja
dan hasil dengan indikator khusus dan metode pengumpulan data untuk indikator tersebut.

G. STANDAR INDIKATOR
Indikator yang baik harus memenuhi lima standar berikut:
1. Indikator yang dibutuhkan dan berguna.
2. Indikator memiliki manfaat teknis.
3. Indikator sepenuhnya ditentukan.
4. Adalah layak untuk mengukur indikator.
5. Indikator telah diuji coba di lapangan atau digunakan secara operasional
Selain itu, jika indikator disajikan sebagai bagian dari satu set, set ini harus memenuhi standar
keenam: Keseluruhan rangkaian koheren dan seimbang.

H. SUMBER DATA DARI INDIKATOR


Dalam pekerjaan statistik, pengumpulan data untuk indikator selalu dilakukan secara terencana
dengan pencatatan menggunakan instrument (daftar isian dan pedoman pelaksanaan).
Jenis pengumpulan data:
• SENSUS, pencatatan dilakukan pada seluruh unit observasi
• SURVEI, pencatatan dilakukan pada sebagian unit observasi
• CATATAN ADMINISTRASI, dilakukan sebagai hasil catatan pelaksanaan layanan pada masyarakat
• EKSPERIMEN, pencatatan dilakukan pada percobaan yang sedang berlangsung pada waktu
tertentu
• OBSERVASI LANGSUNG, pencatatan dilakukan pada saat kejadian di tempat kejadian berlangsung
Pada sensus dan survei pengumpulan data dilakukan melalui wawancara (pencacahan) antara
petugas (pencacah) dengan responden
• Sumber Data di BPS
• Sensus Penduduk, Sensus Ekonomi dan Sensus Pertanian dilakukan setiap 10 tahun
• Survei Sosial Ekonomi Nasional:
o Kor, setahun 2 kali
o Modul, setiap 3 tahun, ada 3 modul
• Survei Angkatan Kerja Nasional (Sakernas): semesteran
• Survei Industri, Energi, Pertanian, Kontruksi, Perhotelan, Harga, Perdagangan E-Commerce,
dilakukan setiap tahun
• Survei Penduduk Antar Sensus (SUPAS): setiap 10 tahun, pada tahun berakhiran angka ‘5’
dan Survei Pertanian Antar Sensus (SUTAS), pada tahun berakhiran angka ‘8’
• Survei Demografi dan Kesehatan Indonesia: setiap 5 tahun, pada tahun berakhiran angka ‘2’
dan angka ‘7’
Ada tiga yang harus selalu diperhatikan terhadap kredibilitas data:
• Validity (Keabsahan): Sejauh mana suatu pengukuran atau tes secara akurat mengukur apa yang
dimaksudkan untuk diukur.
• Reliability (Keandalan): Konsistensi data ketika dikumpulkan berulang kali dengan
menggunakan prosedur yang sama dan dalam kondisi yang sama.

227
• Bias: Setiap efek selama pengumpulan atau interpretasi informasi yang mengarah pada kesalahan
sistematis dalam satu arah

I. JENIS DATA
• Data primer: data yang dikumpulkan sendiri untuk keperluan sendiri
• Data sekunder: data yang dikumpulkan pihak lain, definisi dari variabel yang digunakan
mengikuti penyelenggara survei
• Data cross-section: data set yang berisikan beberapa variabel dari tahun yang sama
• Data time series: data set yang berisikan variabel dari tahun yang berbeda dalam jangka waktu
periode yang panjang (> 10 tahun), periode bisa mingguan, bulanan, triwulanan
• Data obyektif: data yang dikumpulkan dengan definisi/kriteria/ ukuran yang sama menurut
responden
• Data subyektif: data yang dikumpulkan tentang satu variabel dimana kriteria/ukuran menurut
pandangan responden (bahagia, puas, senang, dll)

J. TINGKATAN INFORMASI
• Informasi: keterangan tentang sifat/karakteristik tertentu dari individu, kelompok, populasi
(nilai dari variabel)
• Tingkatan informasi dilihat dari kegunaan
• data: nilai karakteristik dari individu, e.g: umur, jenis kelamin, pendidikan
• statistik: agregasi dari suatu kelompok, penghitungan kumulatif dari nilai karakteristik
individu dalam kelompok, e.g: rata2 umur, sex ratio, % pendidikan sarjana
• Indikator: statistik yang dapat memberikan gambaran masalah, alat ukur untuk mengetahui
situasi dan posisi atas permasalahan yang tengah atau akan dihadapi/ditemui pada waktu
tertentu e.g: % buta huruf, % obesitas, kepadatan penduduk, indikator bensin, IPK, syarat
lulus ujian SIM
Tingkatan Informasi Statistik
JENIS INFORMASI DEFINISI CONTOH
DATA Sifat/nilai dari individual Umur, berat badan, gaji,
berdasarkan variabel atau alat kemampuan baca tulis
ukur (instrumen)
STATISTIK Agregasi dari data untuk suatu Median umur, % miskin (garis
populasi kemiskinan ditentukan), % buta
aksara, rata² asupan kalori
(kkal/kapita/hari)
INDIKATOR Statistik yang dapat % miskin, % menganggur, rata²
menunjukkan permasalahan berat badan, % obesitas, %
kurang kalori

K. TINGKATAN INDIKATOR
• Indikator rujukan: menunjukkan kelompok sasaran, e.g.: balita, wus, lansia, usia sekolah
• Indikator input: menunjukkan sumberdaya yang tersedia/diperlukan dalam suatu kegiatan, e.g.:
jumlah polisi per 10.000 penduduk, jumlah murid per guru, jumlah dokter per 10.000 penduduk
• Indikator proses: menunjukkan partisipasi masyarakat pada program, e.g.: APM, APK, CPR (%
pengguna kontrasepsi),
• Indikator output: hasil suatu kegiatan, e.g., % lulus UAN, angka kelahiran total, % lulus SMNPTN

228
• Indikator outcome: dampak dari suatu program, e.g. % putus sekolah, % penduduk miskin, %
pengangguran terbuka, angka kematian bayi
JENIS INDIKATOR DEFINISI CONTOH
Rujukan Kelompok sasaran program, Bayi, balita, usia sekolah, WUS,
kebijakan lansia, dll
Input Ketersediaan sumberdaya Rasio dosen-mahasiswa, rasio
terhadap kelompok sasaran murid-kelas, % dokter per 1000
program penduduk, % polisi per 1000
penduduk
Proses Partisipasi pada program APM, APK per jenjang, CPR
Output Hasil (keluaran) dari program % lulus per jenjang pendidikan,
TPAK
Outcome Dampak program TFR, tingkat putus sekolah, rata-
rata lama sekolah, IMR, e0, %
penduduk miskin

L. TINGKATAN ATAU SKALA PENGUKURAN


SKALA DEFINISI dan CONTOH PENGGUNAAN
Nominal Berdasarkan sifat :M/F, Tua/Muda, Kuantifikasi sebagai lambang, label :
Miskin/Tidak Miskin, bermakna M=1, F=2, dummy variable dalam
kualitatif model
Ordinal Berdasarkan tingkatan/urutan Skala Likert, digunakan untuk
(kualitas) : urutan pemenang lomba menentukan satu lebih baik dari
marathon, tingkatan SES : tinggi, yang lain, tanpa tahu berapa
sedang, rendah, ukuran baju : Large, bedanya
Medium, Small
Interval Berdasarkan alat terukur : berat Bisa dilakukan manipulasi statistik
(kg), umur (tahun), gaji (Rp, $) (+,-,x,/). Penghitungan statistik
dengan skala satuan mengukur jarak
yang sama. Data kontinue
Rasio Perbandingan dari ukuran interval

SUSTAINABLE DEVELOPMENT GOALS (SDGs)

A. SEJARAH SDGs
Transformasi global menuju pembangunan berkelanjutan melalui 17 goals, 169 target, 241 indikator,
sebagai lanjutan MDGs
1. Pilar Pembangunan Sosial
2. Pilar Pembangunan Ekonomi
3. Pilar Pembangunan Lingkungan
4. Pilar Pembangunan Hukum & Tata Kelola
Masa Lingkungan Hidup melalui UN-Environment Program
✓ 1972 – Stockholm Human Environment Conference (Prof Emil Salim)
✓ 1978 – Dibentuk Kementerian LH

229
✓ 1997 – Definisi Pembangunan Berkelanjutan – Brundland Report
✓ 2009 – UU 32/2009 – Ditetapkan Definsi Pembangunan Berkelanjutan
✓ 2017 – Perpres No. 59/2017
Masa pembangunan melalui UN-Development Program
✓ 1992 – Agenda 21
✓ 2000 – MDGs dilaksanakan sebagai SD-Exercise
✓ 2015 – SDGs
✓ 2017 – Perpres No. 59/2017

No Perbedaan
MDGs (2010-2015) SDGs (2015-2030)
1. Diperuntukkan hanya untuk negara Diperuntukkan untuk seluruh negara maju
berkembang di dunia dan berkembang di dunia
2. Single platfom (state centered) Multi platfom (POAF=Pemerintah, OMS,
Akademisi, Filantropi)
3. Pembiayaan dari satu sumber (state Pembiayaan dari banyak sumber (state and
money) public money)
4. Left-behind (masih ada kesan No one left behind (ramah HAM)
diskriminatif)
5. Targetnya adalah memenuhi capaian Target zero goals di 2030 (target yang lebih
setengahnya dari target ambisius)

TPB/SDGs menyempurnakan MDGs


1. Komprehensif : lebih komprehensif disusun dengan melibatkan lebih banyak negara dengan
tujuan yang universal untuk negara maju dan berkembang.
2. Sumber Pendanaan : memperluas sumber pendanaan, selain bantuan negara maju juga sumber
swasta.
3. HAM : menekankan pada HAM agar diskriminasi tidak terjadi dalam penanggulangan kemiskinan
dalam segala dimensinya.
4. Inklusif : secara specific menyasar kepada yang rentan-no one left behind.
5. Stakeholder : pelibatan seluruh pemangku kepentingan (pemerintah, OMS & media, filantropi &
pelaku usaha, serta pakar & akademisi).
6. Zero Goals : MDGs hanya menargetkan pengurangan “setengah”, SDGs menargetkan untuk
menuntaskan seluruh indikator -> “Zero Goals” .
7. Cara Pelaksanaan : tidak hanya memuat Goals tetapi juga cara pelaksanaan.

Prinsip SDGs
• No one left behind
• Universal
• Integration

B. TUJUAN PEMBANGUNAN BERKELANJUTAN/SDGs


1. Mengakhiri kemiskinan dalam segala bentuk dimanapun (Menghapus kemiskinan)
2. Mengakhiri kelaparan, mencapai ketahanan pangan dan nutrisi yang lebih baik dan mendukung
pertanian berkelanjutan (Mengakhiri kelaparan)

230
3. Memastikan kehidupan yang sehat dan mendukung kesejahteraan bagi semua untuk semua usia
(Kesehatan yang baik dan kesejahteraan)
4. Memastikan pendidikan yang inklusif dan berkualitas setara, juga mendukung kesempatan
belajar seumur hidup bagi semua (Pendidikan bermutu)
5. Mencapai kesetaraan gender dan memberdayakan semua perempuan dan anak perempuan
(Kesetaraan gender)
6. Memastikan ketersediaan dan manajemen air bersih yang berkelanjutan dan sanitasi bagi semua
(Akses air bersih dan sanitasi)
7. Memastikan akses terhadap energi yang terjangkau, dapat diandalkan, berkelanjutan dan
modern bagi semua (Energi bersih dan terjangkau)
8. Mendukung pertumbuhan ekonomi yang inklusif dan berkelanjutan, tenaga kerja penuh dan
produktif dan pekerjaan yang layak bagi semua (Pekerjaan layak dan pertumbuhan ekonomi)
9. Membangun infrastruktur yang tahan lama, mendukung industrialisasi yang inklusif dan
berkelanjutan dan membantu perkembangan inovasi (Infrastruktur, industri dan inovasi)
10. Mengurangi ketimpangan didalam dan antar negara (Mengurangi ketimpangan)
11. Membangun kota dan pemukiman inklusif, aman, tahan lama dan berkelanjutan (Kota dan
komunitas yang berkelanjutan)
12. Memastikan pola konsumsi dan Produksi yang berkelanjutan (Konsumsi dan produksi yang
bertanggungjawab)
13. Mengambil aksi segera untuk memerangi perubahan iklim dan dampaknya (Penanganan
perubahan iklim)
14. Mengkonservasi dan memanfaatkan secara berkelanjutan sumber daya laut, samudra dan
maritim untuk pembangunan yang berkelanjutan (Menjaga ekosistem laut)
15. Melindungi, memulihkan dan mendukung penggunaan yang berkelanjutan terhadap ekosistem
daratan, mengelola hutan secara berkelanjutan, memerangi desertifikasi (penggurunan), dan
menghambat dan membalikkan degradasi tanah dan menghambat hilangnya keanekaragaman
hayati (Menjaga ekosistem darat)
16. Mendukung masyarakat yang damai dan inklusif untuk pembangunan berkelanjutan,
menyediakan akses terhadap keadilan bagi semua dan membangun institusi-institusi yang
efektif, akuntabel dan inklusif di semua level (Perdamaian, keadilan, dan kelembagaan yang kuat)
17. Menguatkan ukuran implementasi dan merevitalisasi kemitraan global untuk pembangunan yang
berkelanjutan (Kemitraan untuk mencapai tujuan)

C. TUJUAN PEMBANGUNAN BERKELANJUTAN/SDGs INDONESIA


TPB/SDGs di Indonesia : 17 Goals, 94 Target/Sasaran Global, 319 Indikator Sasaran Nasional
Perpres 59/2017 : Pelaksanaan Pencapaian Tujuan Pembangunan Berkelanjutan.
Tujuan Pembangunan Berkelanjutan di Indonesia adalah pembangunan yang menjaga :
• Keberlanjutan kehidupan sosial masyarakat
• Peningkatan kesejahteraan ekonomi masyarakat
• Kualitas lingkungan hidup
• Pembangunan yang menjamin keadilan dan terlaksananya tata Kelola
Pemetaan Indikator Global dan penerapannya di Indonesia
…Sudah memiliki indikator yang sama dengan global sebanyak 85 indikator dan 76 indikator
menggunakan proxy…

231
Pemetaan Tujuan, Target, dan Indikator Nasional

D. TUJUAN, TARGET, DAN INDIKATOR SDGs


PILAR PEMBANGUNAN SOSIAL URUSAN
TUJUAN-1 Tanpa Kemiskinan • Sosial;
(7 Target, 12 Indikator) • Kesehatan;
TUJUAN-2 Tanpa Kelaparan • Pendidikan;
(8 Target, 14 Indikator) • Perumahan rakyat & kawasan
TUJUAN-3 Kehidupan Sehat, dan Sejahtera permukiman;
(13 Target, 26 Indikator) • Tenaga Kerja;
• Pangan;
TUJUAN-4 Pendidikan Berkualitas • Adminduk capil;
(10 Target, 11 Indikator) • Koperasi UKM;
TUJUAN-5 Kesetaraan Gender • ESDM;
(9 Target, 14 Indikator) • Kelautan perikanan;
• Dalduk KB;
• Pemberdayaan masyarakat Desa;
• Pemberdayaan Perempuan &
Perlindungan Anak;
PILAR PEMBANGUNAN EKONOMI URUSAN
TUJUAN-7 Energi Bersih Terjangkau • ESDM;
TUJUAN-8 Pekerjaan Layak, Pertumbuhan • Statistik;
Ekonomi

232
TUJUAN-9 Industri, Inovasi, Infrastruktur • Tenaga Kerja;
TUJUAN-10 Berkurangnya Kesenjangan • Koperasi, Usaha Kecil, & Menengah;
TUJUAN-17 Kemitraan untuk mencapai tujuan • Pariwisata;
TUJUAN-6 Air Bersih, Sanitasi Layak • Penanaman Modal;
TUJUAN-11 Kota & Pemukiman yang • Perhubungan;
Berkelanjutan • PU & Penataan Ruang;
TUJUAN-12 Konsumen & Produksi yang • Perindustrian;
bertanggungjawab • Perdagangan;
TUJUAN-13 Penanggung Perubahan Iklim • Komunikasi & Informatika;
TUJUAN-14 Ekosistem Lautan • Sosial;
• Pemberdayaan masyarakat & desa;
• Pekerjaan Umum & Penataan Ruang
• Perhubungan;
• Ketentraman, Ketertian Umum, &
Perlindungan Masyarakat;
• Lingkungan Hidup;
• Kelautan & Perikanan;
• Kehutanan
PILAR PEMBANGUNAN HUKUM DAN TATA KELOLA URUSAN
TUJUAN-16 Perdamaian, keadilan, dan • Ketenteraman, Ketertiban Umum, &
kelembagaan yang tangguh Perlindungan Masyarakat;
• Pemberdayaan Perempuan &
Perlindungan Anak;
• Statistik;
• Komunikasi & Informatika

E. PENTINGNYA KETERSEDIAAN DATA


Ketersediaan data
• Pengembangan database
• Disagregasi data by sex, urban-rural, regional (provincial and district), disable-non, disable, poor
and non-poor

1. Sebagai acuan penyusunan peta jalan, RAN, RAD TPB/SDGs, dibutuhkan persepsi yang sama
tentang Tujuan, Target & Indikator TPB/SDGs.
2. Data SDGs digunakan untuk mengukur ketercapaian tiap tujuan dan target TPB/SDGs.
3. Sebagai dasar pelaksanaan monitoring, evaluasi dan pelaporan, serta keterbandingan pencapaian
TPB/SDGs antarnegara dan antardaerah di Indonesia.

Amanat Perpres 59/2017 dan Kepmen PPN No 127 Tahun 2018


Perpres No. 59/2017 tentang TPB/SDGs, Pasal 6:
“Dalam rangka mendukung pencapaian TPB Kementerian/Lembaga terkait melakukan penyediaan
dan pemutakahiran data”
Kepmen PPN No. 127/2018 tentang Pembentukan Tim Pelaksana, Kelompok Kerja, dan Tim Pakar
Tujuan Pembangunan Berkelanjutan Tahun 2017-2019:

233
• BPS yang diwakili Sekretaris Utama merupakan anggota Tim Pelaksana dan direktorat di BPS
yang terkait menjadi anggota Kelompok Kerja maupun Sub Kelompok Kerja.
• Peran dan tugas BPS selaku Tim Pelaksana (Pasal 4) salah satunya yaitu:
1. Membantu Koordinator Pelaksana dalam mengoordinasikan pengembangan dan
pemutakhiran data untuk penyusunan, pemantauan, evaluasi dan pelaporan pelaksanaan
Peta Jalan Nasional TPB, RAN TPB, dan RAD TPB.

Indikator SDGs berdasarkan kewenangan


Jumlah Indikator TPB berdasarkan Urusan dan Kewenangannya
Total Indikator TPB dalam Metadata TPB : 319
Indikator-indikator SDGs dibagi dalam 4 (empat) kewenangan, meliputi:
1. Pusat →Jumlah indikator yang menjadi kewenangan pusat: 319
2. Provinsi →Jumlah indikator yang menjadi kewenangan provinsi: 235
3. Kabupaten →Jumlah indikator yang menjadi kewenangan kabupaten: 204
4. Kota →Jumlah indikator yang menjadi kewenangan kota: 207
Catatan :
Dari 319 indikator TPB Indonesia:
• 21 indikator bersifat khusus untuk daerah tertentu
• 298 indikator bersifat umum
Setiap daerah memiliki jumlah indikator yang berbeda.

F. UPAYA LAIN MELENGKAPI DATA SDGs


• Kerja sama dengan K/L lain
BPS bekerja sama dengan Kementerian/Lembaga telah dapat menghasilkan 39 indikator SDGs
• Pembinaan Data Sektoral
Melalui Perpres Satu Data Indonesia, BPS melakukan pembinaan data sektoral. Saat ini, ada 183
indikator SDGs yang merupakan data sektoral dan menjadi tanggung jawab K/L yang
bersangkutan yang perlu pembinaan
• Data SDGs yang Berstandar Global
BPS dengan disupport oleh UN (Unicef, UNFPA, UNDP, FAO dan UN yang lain) mengusahakan
agar data SDGs yang ada berstandar global, saat ini telah ada 33 indikator SDGs yang dihasilkan
oleh BPS berstandar global

KODE REFERENSI/DATA INDUK, PENYAJIAN DATA PEMBANGUNAN DAN


KOLABORASI DATA

A. PENGERTIAN
• Kode Referensi adalah tanda berisi karakter yang mengandung atau menggambarkan makna,
maksud, atau norma tertentu sebagai rujukan identitas Data yang bersifat unik.
• Data Induk adalah Data terpilih yang berasal dari daftar Data yang akan dikumpulkan pada tahun
selanjutnya yang disepakati dalam Forum Satu Data Indonesia.
Contoh kode refererensi
NIK (Nomor Induk Kependudukan) -> sebagai referensi tunggal data kependudukan Indonesia
NIK: 3172061506870005
NIK bersifat komposit dimana

234
• 6 digit pertama: kode provinsi, kab/kota, kecamatan
• 6 digit kedua: tanggal, bulan, tahun kelahiran
• 4 digit terakhir: nomor urut penerbitan
Contoh kode referensi lain:
• Kode Wilayah sebagai Referensi tunggal kode kewilayahan (antara Kemendagri dengan BPS)
• NPWP sebagai basis tunggal/referensi tunggal Data Usaha
Kode Referensi/Data Induk
• Kode Referensi sangat penting dalam pertukaran data karena akan menjadi kunci dalam me-link-
kan data
• Antar kode referensi harus bersinergi satu sama lain, misal NIK mengandung kode wilayah pada
4 digit pertama. Kode wilayah ini harus sama dengan kode referensi wilayah yang dikeluarkan
oleh Kemendagri
• Karena kode referensi bersifat unik, maka kode yang sudah pernah dipakai tidak dapat dipakai
kembali
• Data induk digunakan acuan utama dalam pengumpulan data, contohnya data induk
kependudukan menjadi acuan dalam SP2020.

B. ATRIBUT DALAM KODE REFERENSI DAN DATA INDUK HARUS MEMEHUHI STANDAR DATA
• Konsep : merupakan ide yang mendasari data dan tujuan data tersebut diproduksi
• Definisi : merupakan penjelasan tentang data yang memberi batas atau membedakan secara jelas
arti dan cakupan data tertentu dengan data yang lain
• Klasifikasi : merupakan penggolongan data seara sistematis ke dalam kelompok atau kategori
berdasarkan kriteria yang ditetapkan oleh Pembina Data dan dibakukan secara luas
• Ukuran : merupakan unit yang digunakan dalam pengukuran jumlah, kadar, atau cakupan
• Satuan : merupakan besaran tertentu dalam data yang digunakan sebagai standar untuk
mengukur atau menakar sebagai sebuah keseluruhan

C. PENYAJIAN DATA PERENCANAAN PEMBANGUNAN


Latar belakang

Pentingnya strategi nasional dalam mewujudkan sistem Statistik Nasional


1. Strategi nasional adalah bentuk cara yang harus dilakukan dalam pelaksanaan kebijakan yang
telah ditetapkan di politik nasional untuk mencapai tujuan nasional.

235
2. Strategi Nasional diperlukan untuk menghadapi tantangan Globalisasi dan Revolusi Industri 4.0
dengan derasnya alur data dan statistik serta mencegah terjadinya duplikasi kegiatan oleh para
penyelenggara kegiatan statistik.
3. Strategi Nasional Pembangunan Statistik(NSDS) Indonesia merupakan strategi agar terwujud
suatu Sistem Statistik Nasional yang andal, efektif, dan efisien untuk memenuhi kebutuhan data
SDGs maupun SNAs dan indikator-indikator nasional seperti Nawacita dan RPJMN.

D. JENIS PEMANFAATAN STATISTIK


UU No 16 Tahun 1997 Pasal 5
Berdasarkan tujuan pemanfaatannya, jenis statistic terdiri atas
• Statistik Dasar : dikumpulkan BPS
• Statistik Sektoral : dikumpulkan instansi pemerintah (K/L/I/D)
• Statistik Khusus : dikumpulkan oleh Lembaga, organisasi, perorangan, dan atau unsur masyarkat
lainnya.
Mekanisme pengumpulan data statistic sectoral saat ini
1. Data Tingkat Nasional : Kementrian/Lembaga Pusat
2. Data Tingkat Provinsi : Dinas/Instansi Provinsi
3. Data Tingkat Kabupaten/Kota : Dinas/Instansi Kabupaten/Kota
Mekanisme pengumpulan seperti ini, menimbulkan masalah inkonsistensi data yang disajikan
Kondisi saat ini : Adanya inkonsistensi data di level nasional (SI) dan daerah (DDA) menjadi
penghalang terwujudnya Satu Data Indonesia.
Cara mengatasi inkonsistensi data : SIMDASI
1. Standar data
2. Metadata standar
3. Interoperabilitas

E. PUBLIKASI PENDUKUNG PERENCANAAN PEMBANGUNAN


STATISTIK INDONESIA (SI)
• Perencanaan pembangunan dilakukan agar pembangunan tepat sasaran dan tepat guna. Sebelum
melakukan perencanaan pembangunan, K/L maupun Organisasi Perangkat Daerah (OPD)
membutuhkan data dari kegiatan sebelumnya.
• BPS menerbitkan publikasi Statistik Indonesia (SI) dan Daerah Dalam Angka (DDA) tiap tahun
untuk mendukung perencanaan pembangunan.
• Statistik Indonesia merupakan publikasi BPS yang menyajikan beragam jenis data yang
bersumber dari BPS dan institusi lain. Publikasi ini memuat gambaran umum tentang keadaan
geografi dan iklim, pemerintahan, serta perkembangan kondisi sosial-demografi dan
perekonomian di Indonesia. Beberapa tabel tertentu menyajikan data pada tingkat provinsi dan
internasional untuk melihat perbandingan antarwilayah dan antarnegara. Untuk memudahkan
pemahaman dan pemanfaatan data, disertakan juga penjelasan teknis dari setiap jenis statistik
yang disajikan.
DAERAH DALAM ANGKA (DDA)
• Daerah Dalam Angka menyajikan data dari berbagai bidang baik dari hasil sensus maupun survei
serta data sekunder yang dihimpun dari dinas/instansi/perusahaan yang ada di wilayah tersebut.
• Publikasi DDA tersedia dari level Provinsi hingga level Kabupaten/Kota. Contoh DDA antara lain
Jawa Barat Dalam Angka, Kabupaten Bekasi Dalam Angka, Kota Bekasi Dalam Angka, dan
sebagainya. BPS mewajibkan BPS Provinsi dan BPS Kabupaten/Kota menerbitkan DDA.

236
• DDA merupakan Cerminan SI dalam level yang lebih rendah. Data dalam DDA harus sinkron
ketika diagregatkan seluruh Indonesia dengan Data SI.
Langkah sinkronisasi SI dan DDA
• Menentukan Tabel KOR antara SI dan DDA
• Melakukan Standardisasi Tabel (Baris, Kolom, Metadata, Cut Off, Pembabakan)
• Membuat Sistem Informasi dengan fitur :
1. Repository Data
2. Manajemen Metadata
3. Input dan Approve Data
4. Membuat mekanisme kompilasi data
5. Monitoring dan Evaluasi
6. Sinkronisasi Data
7. Penyediaan Mekanisme dan Data untuk Dibagipakaikan
Tahapan penyusunan DDA
• Persiapan
o Updating menggunakan Aplikasi yang telah disediakan (simDASI)
o Updating tabel yang akan disajikan pada DDA 2022
o Penyiapan template tabel
• Pengumpulan
o Interoperabilitas data di BPS RI
o Pengumpulan data di daerah
o Input data di Simdasi
• Diseminasi
o FGD data sebelum rilis
o Rilis serentak sesuai Senarai Rencana Terbit (Advanced Release Calendar)

F. KOLABORASI DATA ANTAR KEMENTRIAN/LEMBAGA


Interoperabilitas dan Kolaborasi Data
• Interoperabilitas adalah dimana suatu aplikasi bisa berinteraksi dengan aplikasi lainnya melalui
suatu protokol yang disetujui bersama lewat bermacam-macam jalur komunikasi, biasanya lewat
network TCP/IP dan protokol HTTP dengan memanfaatkan file XML. Adapun aplikasi disini boleh
berada di platform yang berbeda: Delphi Win32, .NET, Java, atau bahkan pada O/S yang berbeda.
• Interoperabilitas data adalah kesiapan data untuk dibagipakaikan antar system elektronik yang
saling berinteraksi. (Perpres Nomor 39 tahun 2019 tentang Satu Data Indonesia)
• Interoperabilitas adalah prasyarat dalam Kolaborasi Data
Komitmen Strategis Kolaborasi Data
• Satu Data Indonesia (SDI)
Tata kelola data pemerintah untuk menghasilkan data yang akurat, mutakhir, terpadu, dan dapat
dipertanggungjawabkan, serta mudah diakses dan dibagipakaikan melalui pemenuhan prinsip
SDI
• Sistem Pemerintahan Berbasis Elektronik (SPBE)
Tata kelola pemerintahan dan pelayanan publik yang bersih, efektif, efisien, akuntabel dan
terpercaya serta meningkatkan efisiensi dan keterpaduan penyelenggaraan Pemerintahan
Berbasis Elektronik
• Sistem Statistik Nasional (SSN)

237
Suatu tatanan yang terdiri atas unsur-unsur yang secara teratur saling berkaitan, sehingga
membentuk totalitas dalam penyelenggaraan statistic
Penyelenggara Bagipakai Data dalam Tatanan SDI
• Data disebarluaskan melalui Portal Satu Data Indonesia dan Media Lainnya
Sampai saat ini, instansi dapat menggunakan media lain untuk menyebarluaskan data sepanjang
terintegrasi dengan Portal Satu Data Indonesia.
• Pengembangan Media Penyebarluasan/Bagipakai Data
Pengembangan media penyebarluasan/bagipakai data oleh instansi dilaksanakan dengan
mengikuti perundangan yang berlaku tentang Sistem Pemerintahan Berbasis Elektronik dan
diintegrasikan dengan Portal Satu Data Indonesia.
• Data yang diakses di Portal Satu Data Indonesia Tidak Dipungut Biaya
Dalam melakukan akses dan bagipakai data melalui Portal Satu Data Indonesia antar instansi
pemerintah tidak ada biaya yang dikenakan.
• Data yang diakses di Portal Satu Data Indonesia Tidak Perlu MoU
Dalam melakukan akses dan bagipakai data melalui Portal Satu Data Indonesia antar instansi
pemerintah tidak diperlukan adanya nota kesepahaman atau perjanjian kerjasama.
• Kerjasama Data Tertentu
Dalam hal diperlukan kerjasama khusus/tematik/tertentu antar instansi dalam pelaksanaan
bagipakai data, Walidata Instansi Pemrakarsa berkoordinasi melalui Forum Satu Data dengan
melibatkan Pembina Data.
Integrasi System Yang Sudah Terjalin Antara BPS Dan Kementerian/Lembaga
• Simdasi (BPS) dan Dapodik (Kementerian Pendidikan dan Kebudayaan)
• Simdasi (BPS) dan EMIS Online (Kementerian Agama)
• Web Merah Putih
Rencana ke Depan
• Portal Indonesia Data Hub (INDAH) untuk mendukung Satu Data Indonesia
• Penggunaan Kode Wilayah Kemedagri sebagai Kode Referensi Kewilayahan
• Sistem Pemerintah Berbasis Elektronik (SPBE) melalui Portal SDI

G. PORTAL SATU DATA INDONESIA DALAM TAHAP PENGEMBANGAN


• Portal Open Data
Portal yang berisi data yang sudah sesuai dengan Prinsip SDI, dan bersifat terbuka (hak akses
ditentukan oleh Walidata melalui Forum SDI)
• Portal Forum SDI
Portal dengan hak akses terbatas, yang memiliki beberapa fasilitas untuk mendukung terciptanya
Satu Data (kualitas data, penyelesaian permasalahan data, dan kebijakan terkait data lainnya).

NOTE : MATA KULIAH OFFICIAL STATISTICS LANJUTAN MERUPAKAN MATA KULIAH BARU DI
SEMESTER 4. JADI BELUM ADA SOAL DAN PEMBAHASAN UTS YANG DITAMPILKAN. SEBAGAI
GANTINYA, KAMI MENAMPILKAN LATIHAN SOAL DAN PEMBAHASANNYA. SEMOGA
RANGKUMAN DAN LATIHAN SOAL YANG KAMI BERIKAN DAPAT MEMBANTU TEMAN-TEMAN
BELAJAR. SEMANGAT

238
LATIHAN SOAL

1. The Open Definition 2.1 memdefinisikan karya terbuka sebagai berikut ini, kecuali …
a. Open License or Status
b. Access
c. Timely and Comprehensive
d. Machine Readability
e. Open Format
2. Dibawah ini yang bukan merupakan permasalahan dalam mewujudkan Satu Data Indonesia adalah
a. Lokasi data yang menyebar
b. Format data yang sama
c. Data yang saling tumpeng tindih
d. Data masih manual
e. Sulit mengelola tim dan infrastruktur
3. Dalam penyelenggaraan Satu Data Indonesia tingkat daerah, terdapat instansi daerah yang bertugas
mengelola dan menyebarluaskan data disebut juga sebagai …
a. Pembina data
b. Walidata Tk daerah
c. Walidata Pendukung
d. Konsumen data
e. Produsen data
4. Berikut ini merupakan tahapan dalam pengumpulan data,
1) Pembina data memberikan rekomendasi terkait metodelogi pengumpulan data
2) Produsen data mengumpulkan data dengan metodelogi yang telah disetujui
3) Terbitnya Penetapan Menteri PPN atau Kepala Bappenas tentang Data Prioritas dan Rencana Aksi
4) Produsen data memastikan data yang dikumpulkan sesuai dengan prinsip SDI
5) Pembina data menentukan landasan proses pengumpulan data, yang terdiri dari Standar Data,
Daftar yang Diputuskan Forum , dan Jadwal Pemukhiran/Rilis Data
6) Produsen data menyerahkan data yang sesuai prinsip SDI kepada walidata
Manakan urutan di bawah ini yang benar?
a. 3-5-1-4-2-6
b. 2-3-1-5-6-4
c. 2-3-1-4-5-6
d. 3-5-2-4-1-5
e. 3-5-1-2-4-6
5. Yang manakah yang bukan merupakan prinsip-prinsip SDI berdasarkan Perpres No.39 tahun 2019

a. Data yang dihasilkan oleh Produsen Data seperti lembaga ataupun instansi pemerintah harus
memenuhi Standar Data yang telah ditetapkan
b. Data yang dihasilkan oleh Produsen Data harus memiliki Metadata
c. Data yang dihasilkan tidak harus menggunakan Kode Referensi dan/atau Data Induk
d. Data yang dihasilkan oleh instansi dan lembaga sebagai produsen Data harus mengikuti kaidah
Interoperabilitas Data
e. Data yang diproduksi oleh instansi dan lembaga pembuat Data harus menggunakan Kode
Referensi dan/atau Data Induk.
6. Berikut ini yang bukan merupakan azas pembentukan standar data statistik
a. Relevansi, ketidakberpihakan, dan keterbukaan

239
b. Standar Profesional, Prinsip Ilmiah, dan Etika Profesional
c. Akuntabilitas dan Transparansi
d. Sumber Statistik Resmi
e. Pencegahan Terhadap Penyalahgunaan
7. Penggolongan data secara sistematis ke dalam kelompok atau kategori berdasarkan kriteria yang
ditetapkan oleh Pembina data atau dibakukan secara luas dalam komponen standar data disebut
a. Konsep
b. Definisi
c. Klasifikasi
d. Ukuran
e. Satuan
8. Metadata yang mengidentifikasi teknis pembuatan suatu data disebut …
a. Metadata Dekskriptif
b. Metadata Struktural
c. Metadata Fisik
d. Metadata Kegiatan Statistik Dasar
e. Metadata Kegiatan Statistik Sektoral
9. Manakan yang merupakan manfaat metadata bagi organisasi?
a. Memudahkan pencarian dan evaluasi informasi
b. Menghindari duplikasi
c. Mengurangi beban kerja
d. Memudahkan pengelolaan data sebagai investasi organisasi
e. Memudahkan identifikasi perolehan, perhitungan, dan estimasi data
10. Berikut ini manakan yang bukan manfaat dari interoperabilitas
a. Kemudahan dalam pengelolaan dan pengaksesan data
b. Pelayanan public yang lebih efektif
c. Pengambilan keputusan menjadi lebih relevan, akurat dan tepat waktu, karena waktu akses yang
lebih cepat
d. Koordinasi program lebih sulit
e. Iklim berdemokrasi yang lebih bagus
11. BPS mengevaluasi rancangan penyelenggaraan kegiatan survei yang disampaikan oleh
pemerintahan daerah merupakan tahapan prosedur penyelenggaraan statistik sektoral bagian?
a. Perencanaan data
b. Pemeriksaan data
c. Pengumpulan data
d. Penyebarluasan data
e. Penyerahan data
12. Dalam Perban No.4 tahun 2019 tentang NPSK, ada 10 prinsip penyelenggaraan statistik sektoral,
manakah yang tidak termasuk?
a. Statistik merupakan hasil dari suatu proses intelektual yang dapat dipertanggungjawabkan
secara ilmiah
b. Statistik mengacu pada standar ilmiah
c. Statistik tidak bebas dari kesalahanpenggunaan
d. Statistik memenuhi nilai kualitas, waktu, biaya, dan menghindari beban atau kejenuhan
responden
e. Statistik mampu menjamin secara ketat kerahasiaan informasi individu dan sumbernya

240
13. Manakah yang termasuk kriteria dalam penyelenggaraan statistik sektoral?
a. Relevan
b. Akurat
c. Tepat waktu
d. Mudah disebarkan
e. Mudah diakses
14. Manakah yang bukan isi dari formulir pemberitahuan survei statistik sektoral
a. Identifikasi penyelenggara survei
b. Penanggung jawab survei
c. Informasi khusus dari survei
d. Tujuan survei dan peubah yang dikumpulkan
e. Rancangan survei
15. Apa dasar hukum penetapan NSPK penyelenggaraan statistik sektoral?
a. Peraturan BPS No. 4 tahun 2019
b. Peraturan Presiden No. 39 tahun 2019
c. Pasal 17 ayat 2 UU No. 16 tahun 1997
d. Peraturan BPS No. 4 tahun 2020
e. Peraturan Kepala BPS No. 126 tahun 2020
16. Berikut ini merupakan pengertian indikator menurut beberapa sumber, kecuali…
a. Variabel kendali yang dapat digunakan untuk mengukur perubahan pada sebuah kejadian
b. Menunjukkan suatu fenomena atau kondisi tertentu
c. Tidak bisa dipakai untuk mengukur perubahan yang terjadi
d. Dituangkan berupa suatu angka (dapat disebut angka indeks)
e. Dapat dirumuskan dari satu atau lebih variabel
17. Yang termasuk ke dalam beberapa jenis indikator adalah, kecuali…
a. Rujukan
b. Output
c. Input
d. Evaluasi
e. Proses
18. Yang bukan kriteria untuk indikator yang baik menurut the New Economics Foundation adalah…
a. Important
b. Complex
c. Simple
d. Measurable
e. Action focused
19. Di bawah ini yang bukan merupakan standar yang harus dipenuhi indikator yang baik adalah…
a. Indikator yang dibutuhkan dan berguna.
b. Indikator memiliki manfaat operasional
c. Indikator sepenuhnya ditentukan.
d. Adalah layak untuk mengukur indikator.
e. Indikator telah diuji coba di lapangan atau digunakan secara operasional
20. Ada tiga yang harus selalu diperhatikan terhadap kredibilitas data yaitu
a. Unbias, Komprehensif, Reliability
b. Comparable, Komprehensif, Reliability
c. Reliability, Validity, Bias

241
d. Unbias, Reliability, Validity
e. Bias, Comparable, Variable
21. Yang tidak termasuk TPB/SDGs menyempurnakan MDGs adalah…
a. Comparable
b. Stakeholder
c. Hak Asasi Manusia
d. Komprehensif
e. Zero Goals
22. Tujuan Pembangunan Berkelanjutan di Indonesia adalah pembangunan yang menjaga :
a. Keberlanjutan kehidupan sosial keluarga
b. Peningkatan kesejahteraan ekonomi perusahaan
c. Kualitas lingkungan hidup yang buruk
d. Pembangunan yang menjamin keadilan dan terlaksananya tata Kelola
e. Peningkatan kesejahteraan keluarga
23. Tujuan SDGs ke 5 adalah..
a. Tanpa kelaparan
b. Tanpa kemiskinan
c. Kesetaraan gender
d. Pendidikan berkualitas
e. Ekosistem lautan
24. Upaya-upaya yang dilakukan untuk melengkapi data SDGs adalah…
a. Pembinaan data statistik
b. Data SDGs yang berstandar nasional
c. Kerja sama dengan K/L lain
d. Kerja sama dengan pemerintah daerah
e. Pembinaan data statistic khusus
25. Tujuan SDGs ke-10 adalah..
a. Berkurangnya kesenjangan
b. Ekosistem daratan
c. Energi bersih dan terjangkau
d. Kehidupan sehat dan sejahtera
e. Penanganan perubahan iklim
26. Yang dijadikan sebagai referensi tunggal data kependudukan Indonesia adalah…
a. KK
b. SIM
c. KTP
d. BPJS
e. NIK
27. Dalam langkah sinkronisasi SI dan DDA, yang bukan merupakan fitur dalam membuat Sistem
Informasi adalah…
a. Repository Data
b. Manajemen Statistik
c. Input dan Approve Data
d. Membuat mekanisme kompilasi data
e. Sinkronisasi Data
28. Yang bukan merupakan penyelenggara bagipakai data dalam tatanan SDI adalah..
a. Data disebarluaskan melalui hanya melalui Portal Satu Data Indonesia

242
b. Pengembangan Media Penyebarluasan/Bagipakai Data
c. Data yang diakses di Portal Satu Data Indonesia Tidak Dipungut Biaya
d. Data yang diakses di Portal Satu Data Indonesia Tidak Perlu MoU
e. Kerjasama Data Tertentu
29. Yang termasuk tahapan penyusunan DDA yaitu…
a. Persiapan, Pemrosesan, Evaluasi
b. Persiapan, Pengumpulan, Diseminasi
c. Persiapan, Pengumpulan, Evaluasi
d. Persiapan, Pemrosesan, Diseminasi
e. Persiapan, Pemeriksaan, Diseminasi
30. Statistik Indonesia merupakan publikasi BPS yang menyajikan beragam jenis data yang bersumber
dari BPS dan institusi lain. Publikasi ini memuat gambaran umum tentang keadaan berikut ini,
kecuali…
a. geografi dan iklim
b. pemerintahan
c. perkembangan kondisi sosial-demografi
d. ilmu pengetahuan dan teknologi
e. perekonomian di Indonesia

243
PEMBAHASAN

1. Jawaban : C.
The Open Definition 2.1. memiliki empat elemen atau prinsip yang mendefinisikan sebuah karya
terbuka:
a) Open License or Status. Karya harus berada dalam domain publik atau disediakan di bawah lisensi
terbuka.
b) Access. Karya harus disediakan secara keseluruhan dan tidak lebih dari biaya reproduksi satu kali
yang wajar, dan harus dapat diunduh melalui Internet tanpa biaya.
c) Machine Readability. Pekerjaan harus disediakan dalam bentuk yang siap diproses oleh komputer
dan di mana elemen individu dari pekerjaan dapat dengan mudah diakses dan dimodifikasi.
d) Open Format. Karya harus disediakan dalam format terbuka. Format terbuka adalah format yang
tidak memberikan batasan, moneter atau lainnya, pada penggunaannya dan dapat sepenuhnya
diproses dengan setidaknya satu alat perangkat lunak bebas/gratis/sumber terbuka.
2. Jawaban : B
a) Lokasi Data yang tersebar
b) Format data yang berbeda-beda
c) Data yang saling tumpang tindih antara instansi
d) Proses menghubungkan dan penyeragaman data yang sulit
e) Implementasi Lambat dan seringkali merubah sistem eksisting
f) Data masih manual
g) Tools yang tersedia tidak memadai dan tidak lengkap
h) Sulit mengelola tim dan infrastruktur
i) Faktor Keamanan, privasi dan regulasi pemerintah
3. Jawaban : B
a) Walidata Tk Daerah adalah instansi daerah yang bertugas mengelola dan menyebarluaskan data
b) Pembina data adalah perwakilan BPS di daerah, yang diberikan tugas sebagai Pengelola SImpul
Jaringan Pemerintah Daerah
c) Walidata Pendukung adalah unit kerja di instansi daerah, sesuai penugasan dari kepala daerah
d) Produsen data adalah instansi yang melaksanakan kegiatan pengumpulan data
4. Jawaban : E
Pengumpulan Data merupakan kegiatan produksi data berdasarkan daftar data yang telah
ditetapkan pada tahap Perencanaan Data, dan dipantau oleh Koordinator Forum SDI. Adapun
Tahapannya sebagai berikut:
a) Terbitnya Penetapan Menteri PPN atau Kepala Bappenas tentang Data Prioritas dan Rencana
Aksi
b) Pembina Data menentukan landasan proses pengumpulan data, yang terdiri dari Standar Data,
Daftar Data yang Diputuskan Forum, dan Jadwal Pemutakhiran/Rilis Data
c) Pembina Data memberikan rekomendasi terkait metodologi pengumpulan data
d) Produsen Data mengumpulkan data dengan metodologi yang telah disetujui
e) Produsen Data memastikan data yang dikumpulkan sesuai dengan Prinsip SDI
f) Produsen Data menyerahkan Data yang sudah sesuai Prinsip SDI kepada Walidata
5. Jawaban : C
Berdasarkan Perpres no. 39 tahun 2019 mengenai SDI. SDI harus dilakukan berdasarkan prinsip-
prinsip sebagai berikut :
a) Data yang dihasilkan oleh Produsen Data seperti lembaga ataupun instansi pemerintah harus
memenuhi Standar Data yang telah ditetapkan

244
b) Data yang dihasilkan oleh Produsen Data harus memiliki Metadata
c) Data yang dihasilkan oleh instansi dan lembaga sebagai produsen Data harus mengikuti kaidah
Interoperabilitas Data dan
d) Data yang diproduksi oleh instansi dan lembaga pembuat Data harus menggunakan Kode
Referensi dan/atau Data Induk.
6. Jawaban : E
Azas pembentukan standar data statistik terdiri dari
a) Relevansi, ketidakberpihakan, dan keterbukaan
b) Standar Profesional, Prinsip Ilmiah, dan Etika Profesional
c) Akuntabilitas dan Transparansi
d) Sumber Statistik Resmi
e) Koheren dengan Penggunaan Standar Internasional
f) Berdimensi Pembangunan
7. Jawaban : C
8. Jawaban : B
9. Jawaban : D
10. Jawaban : D
11. Jawaban : B
Prosedur Pemeriksaan Data :
a) BPS mengevaluasi rancangan penyelenggaraan kegiatan Survei yang disampaikan oleh
Pemerintah Daerah,
b) BPS memberikan rekomendasi kepada Pemerintah Daerah berupa surat rekomendasi
berdasarkan hasil evaluasi.
c) Surat rekomendasi disampaikan kepada Perangkat Daerah yang menangani urusan
pemerintahan bidang statistik serta ditembuskan kepada Perangkat Daerah pelaksana urusan
pemerintahan bidang perencanaan.
d) Penyelenggaraan Survei yang sudah mendapatkan rekomendasi, wajib mencantumkan identitas
rekomendasi pada kuesioner.
12. Jawaban : C
13. Jawaban : D
14. Jawaban : C
Formulir pemberitahuan survei statistik sektoral tediri dari sebagai berikut :
a) Identifikasi penyelenggara survei (instansi dan alamat)
b) Penanggung jawab survei (nama penanggung jawab dan jabatan)
c) Informasi umum survei (keberlangsungan survei, tipe survei)
d) Tujuan survei dan peubah yang dikumpulkan
e) Rancangan survei (metode sampling, responden, cakupan, dll)
f) Rancangan sampel (kerangka sampel, sampling error, dll)
15. Jawaban : A
Dasar hukum penetapan NSPK ada pada
a) Peraturan BPS No. 4 tahun 2019 berisi tentang Norma, Standar, Prosedur, Kriteria
penyelenggaraan statistik nasional
b) UU No.23 tahun 2014 tentang Pemerintah Pusat pasal 16 ayat 1 mengenai kewenangan
pemerintah pusat
Sementara pilihan lain merupakan dasar hukum :
a) Peraturan Presiden No. 39 tahun 2019 berisikan tentang tata kelola data nasional (dasar hukum
SDI)

245
b) Pasal 17 ayat 2 UU No. 16 tahun 1997 tentang statistik (dasar hukum standar data)
c) Peraturan BPS No. 4 tahun 2020 berisikan tentang petunjuk teknis standar data statistik (dasar
hukum standar data)
d) Peraturan Kepala BPS No. 126 tahun 2020 berisikan tentang master file standar data statistik
tahun 2020 (dasar hukum standar data)
16. Jawaban : C
Pengertian indikator menurut beberapa sumber:
• Variabel kendali yang dapat digunakan untuk mengukur perubahan pada sebuah kejadian
• KBBI : sesuatu yang dapat memberikan petunjuk atau keterangan
• Menunjukkan suatu fenomena atau kondisi tertentu
• Bisa dipakai untuk mengukur perubahan yang terjadi
• Dituangkan berupa suatu angka (dapat disebut angka indeks)
• Dapat dirumuskan dari satu atau lebih variabel
17. Jawaban : D
Jenis indikator:
• Rujukan: data yang menyatakan kelompok sasaran dari permasalahan/program
• Input: sumber daya yang digunakan dalam pelaksanaan kegiatan/program
• Proses: partisipasi kelompok sasaran dalam kegiatan/program
• Output: hasil dari suatu kegiatan/program
• Outcome: manfaat dari program bagi kelompok sasaran/masyarakat
18. Jawaban : B
the New Economics Foundation mengidentifikasi kriteria untuk indikator, yang terus menjadi
panduan yang berguna dalam memutuskan apakah suatu indikator merupakan indikator yang baik:
• Action focused (Fokus Tindakan). Indikator harus mengarah pada tindakan. Jika pemangku
kepentingan tidak dapat membayangkan apa yang harus dilakukan dengan data dari suatu
indikator, maka itu mungkin bukan indikator yang baik.
• Important (Penting).Pemangku kepentingan harus setuju bahwa indikator dan data yang akan
dihasilkannya memberikan kontribusi yang relevan dan signifikan untuk menentukan cara
merespons epidemi secara efektif.
• Mesurable (terukur).Metodologi pengumpulan data tidak hanya harus didefinisikan, tetapi juga
harus layak untuk mengumpulkan data.
• Simple (Sederhana). Indikator dibuat sesederhana mungkin sehingga bisa dimengerti oleh
audiens yang lebih luas (tidak ahli). Daripada mengejar indikator yang sempurna, jauh lebih baik
untuk mengidentifikasi indikator yang baik dan sederhana yang menyediakan data yang dapat
digunakan.
19. Jawaban : B
Indikator yang baik harus memenuhi lima standar berikut:
1. Indikator yang dibutuhkan dan berguna.
2. Indikator memiliki manfaat teknis.
3. Indikator sepenuhnya ditentukan.
4. Adalah layak untuk mengukur indikator.
5. Indikator telah diuji coba di lapangan atau digunakan secara operasional
20. Jawaban : C
Ada tiga yang harus selalu diperhatikan terhadap kredibilitas data:
• Validity (Keabsahan): Sejauh mana suatu pengukuran atau tes secara akurat mengukur apa yang
dimaksudkan untuk diukur.

246
• Reliability (Keandalan): Konsistensi data ketika dikumpulkan berulang kali dengan
menggunakan prosedur yang sama dan dalam kondisi yang sama.
• Bias: Setiap efek selama pengumpulan atau interpretasi informasi yang mengarah pada kesalahan
sistematis dalam satu arah
21. Jawaban : A
TPB/SDGs menyempurnakan MDGs
• Komprehensif : lebih komprehensif disusun dengan melibatkan lebih banyak negara dengan
tujuan yang universal untuk negara maju dan berkembang.
• Sumber Pendanaan : memperluas sumber pendanaan, selain bantuan negara maju juga sumber
swasta.
• HAM : menekankan pada HAM agar diskriminasi tidak terjadi dalam penanggulangan kemiskinan
dalam segala dimensinya.
• Inklusif : secara specific menyasar kepada yang rentan-no one left behind.
• Stakeholder : pelibatan seluruh pemangku kepentingan (pemerintah, OMS & media, filantropi &
pelaku usaha, serta pakar & akademisi).
• Zero Goals : MDGs hanya menargetkan pengurangan “setengah”, SDGs menargetkan untuk
menuntaskan seluruh indikator -> “Zero Goals” .
• Cara Pelaksanaan : tidak hanya memuat Goals tetapi juga cara pelaksanaan.
22. Jawaban : D
Tujuan Pembangunan Berkelanjutan di Indonesia adalah pembangunan yang menjaga :
• Keberlanjutan kehidupan sosial masyarakat
• Peningkatan kesejahteraan ekonomi masyarakat
• Kualitas lingkungan hidup
• Pembangunan yang menjamin keadilan dan terlaksananya tata Kelola
23. Jawaban : C

24. Jawaban : C
UPAYA LAIN MELENGKAPI DATA SDGs
• Kerja sama dengan K/L lain
BPS bekerja sama dengan Kementerian/Lembaga telah dapat menghasilkan 39 indikator SDGs
• Pembinaan Data Sektoral

247
Melalui Perpres Satu Data Indonesia, BPS melakukan pembinaan data sektoral. Saat ini, ada 183
indikator SDGs yang merupakan data sektoral dan menjadi tanggung jawab K/L yang
bersangkutan yang perlu pembinaan
• Data SDGs yang Berstandar Global
BPS dengan disupport oleh UN (Unicef, UNFPA, UNDP, FAO dan UN yang lain) mengusahakan
agar data SDGs yang ada berstandar global, saat ini telah ada 33 indikator SDGs yang dihasilkan
oleh BPS berstandar global
25. Jawaban : A

26. Jawaban : E
NIK (Nomor Induk Kependudukan) -> sebagai referensi tunggal data kependudukan Indonesia
27. Jawaban : B
Membuat Sistem Informasi dengan fitur :
a. Repository Data
b. Manajemen Metadata
c. Input dan Approve Data
d. Membuat mekanisme kompilasi data
e. Monitoring dan Evaluasi
f. Sinkronisasi Data
g. Penyediaan Mekanisme dan Data untuk Dibagipakaikan
28. Jawaban : A
Penyelenggara Bagipakai Data dalam Tatanan SDI
• Data disebarluaskan melalui Portal Satu Data Indonesia dan Media Lainnya
Sampai saat ini, instansi dapat menggunakan media lain untuk menyebarluaskan data sepanjang
terintegrasi dengan Portal Satu Data Indonesia.
• Pengembangan Media Penyebarluasan/Bagipakai Data
Pengembangan media penyebarluasan/bagipakai data oleh instansi dilaksanakan dengan
mengikuti perundangan yang berlaku tentang Sistem Pemerintahan Berbasis Elektronik dan
diintegrasikan dengan Portal Satu Data Indonesia.
• Data yang diakses di Portal Satu Data Indonesia Tidak Dipungut Biaya
Dalam melakukan akses dan bagipakai data melalui Portal Satu Data Indonesia antar instansi
pemerintah tidak ada biaya yang dikenakan.
• Data yang diakses di Portal Satu Data Indonesia Tidak Perlu MoU

248
Dalam melakukan akses dan bagipakai data melalui Portal Satu Data Indonesia antar instansi
pemerintah tidak diperlukan adanya nota kesepahaman atau perjanjian kerjasama.
• Kerjasama Data Tertentu
Dalam hal diperlukan kerjasama khusus/tematik/tertentu antar instansi dalam pelaksanaan
bagipakai data, Walidata Instansi Pemrakarsa berkoordinasi melalui Forum Satu Data dengan
melibatkan Pembina Data.
29. Jawaban : B
Tahapan penyusunan DDA
• Persiapan
oUpdating menggunakan Aplikasi yang telah disediakan (simDASI)
oUpdating tabel yang akan disajikan pada DDA 2022
oPenyiapan template tabel
• Pengumpulan
oInteroperabilitas data di BPS RI
oPengumpulan data di daerah
oInput data di Simdasi
• Diseminasi
oFGD data sebelum rilis
oRilis serentak sesuai Senarai Rencana Terbit (Advanced Release Calendar)
30. Jawaban : D
Statistik Indonesia merupakan publikasi BPS yang menyajikan beragam jenis data yang bersumber
dari BPS dan institusi lain. Publikasi ini memuat gambaran umum tentang keadaan geografi dan iklim,
pemerintahan, serta perkembangan kondisi sosial-demografi dan perekonomian di Indonesia.

249
KONSEP DASAR SAINS DATA

A. KONSEP SAINS DATA


Sains Data adalah ilmu yang mengkombinasikan tiga kemampuan yang berbeda dan saling
beririsan, terdiri dari:
1. Kemampuan statistik: merangkum dan memodelkan data
2. Kemampuan programming: mendesain dan membuat algoritma untuk menyimpan, memproses
dan memvisualisasi data secara efisien
3. Kemampuan domain expertise: merumuskan pertanyaan yang tepat dan menempatkan jawaban
sesuai dengan konteks/teori yang terkait.
Sains Data adalah disiplin ilmu untuk membuat keputusan berdasarkan data yang diolah
menggunakan ilmu komputasi. Sains data mengkombinasikan teknologi komputer dan ilmu statistika
untuk mengeksplorasi data, memprediksi, hingga membuat kesimpulan berdasarkan data. Sains data
memfasilitasi penggunaan data dan informasi serta penggunaan alat pengolah data untuk
mendapatkan analisis yang lebih akurat dan reliabel. Sains data dapat diimplementasikan untuk
berbagai macam bidang ilmu.

B. ALUR KERJA SAINS DATA


Menurut Grolemund dan Wickham, alur kerja sains data adalah
1. Mengimpor data ke dalam program pengolahan data (pada mata kuliah ini akan digunakan R)
2. Merapikan data agar memiliki struktur yang konsisten. Kolom untuk variabel dan baris untuk
observasi
3. Eksplorasi dan memahami
4. Memahami hasil analisis dan menomunikasikan hasil sesuai dengan teori/konteks kelimuan.

C. METODOLOGI SAINS DATA


1. Knowledge Dicovery Database (KDD)

251
Cross-Industry Standard Process for Data Mining (CRISP-DM)

D. TUJUAN SAINS DATA


1. Memperoleh insight dari data/Big Data
2. Membuat keputusan yang lebih akurat dan terpercaya untuk menghasilkan keuntungan yang
lebih baik.
3. Menghilangkan gangguan data dan merapikan data ke dalam dimensi yang lebih sederhana
sehingga dapat diperoleh actionable insight untuk memudahkan pengambilan keputusan.
4. Membuat interpretable model yang mampu menerjemahkan data menjadi informasi yang
relevan untuk mengambil keputusan.

E. APLIKASI SAINS DATA


Badan kepemerintahan mulai mengubah sistem database dari analog menjadi elektronik
sehingga pengolahan data menjadi semakin mudah. Fungsi sains data di lingkup kepemerintahan
terletak pada menerjemahkan jutaan data menjadi informasi dan membuat keputusan serta
kebijakan yang mempengaruhi hidup seluruh penduduknya. Sains data dalam kepemerintahan dapat
digunakan dalam berbagai sektor mulai dari pertanian, iklim, konsumsi, pertahanan, ekonomi,
lingkungan, Pendidikan, perumahan, dan pembangunan desa.

TOOLS SAINS DATA

A. PENGENALAN R
Diluncurkan pada tahun 1993 oleh Ross Ihaka dan Robert Gentlemen. Tersedia versi GUI-nya
berupa R-Studio.
Kelebihan
1. Didukung oleh library pengolahan data dan analisis statistik yang lengkap
2. Gratis dan open source
3. Mendukung versi markdown melalui RMarkdown, yaitu antara code/script, output, dan catatan
terintegrasi menjadi satu.
4. Tersedia layanan Cloud tanpa perlu instalasi melalui R-Studio Cloud

252
B. PENGENALAN PYTHON
Diluncurkan pada 1991 oleh Guido van Rossum. Sangat populer sebagai Bahasa pemrograman
dan sangat digemari oleh komunitas machine learning.
Kelebihan
1. Didukung oleh library-library pengolahan data yang lengkap, sama seperti R
2. Gratis dan open source
3. Terpopuler untuk pengolahan dengan teknik deep learning
4. Mendukung versi markdown melalui Jupyter Notebook, yaitu antara code/script, output, dan
catatan terintegrasi menjadi satu.
5. Tersedia layanan Cloud tanpa perlu instalasi melalui Google Colaboratory

DASAR PEMROGRAMAN

A. R SESSION
Sebuah R session terdiri dari langkah memulai R, menggunakan R untuk bekerja/analisa dan
kemudian penutupan R (gunakan fungsi q()). Dalam penggunaan R kita akan banyak menggunakan
fungsi-fungsi yang terdapat di R. Fungsi (function) adalah sebuah program kecil yang dapat
dijalankan untuk tujuan tertentu.

B. R STUDIO
RStudio merupakan suatu Integrated Development Environment (IDE) untuk R. Sebagaimana R,
RStudio juga bersifat gratis dan open sorce. RStudio tersedia dalam dua edisi, yaitu: RStudio Desktop
dan RStudio Server. RStudio Desktop berjalan secara lokal di komputer, sebagaimana aplikasi
desktop biasa lainnya. Sedangkan RStudio Server berjalan pada remote Linux server dan bisa diakses
dan dijalankan oleh komputer lainnya melalui jaringan.

C. DASAR-DASAR R
• R Sebagai Calculator, fungsi paling sederhana dari R adalah sebagai kalkulator. Input pada R
console.
• Assignment, Dalam R kita dapat memasukkan satu atau lebih nilai kepada sebuah object (ingat R
adalah Object Oriented Programming).
• Fungsi-fungsi sederhana R. terdapat banyak sekali fungsi dalam R, sehingga tidak memungkinkan
dimuat di sini semua. Namun yang utama adalah kita mengenal fungsi dasar matematika dan
fungsi-fungsi statistika

D. FUNGSI
Untuk hal yang sering dilakukan cukup ditulis satu kali dan saat diperlukan cukup dipanggil
SIntaks
name <- function(arg1, arg2, …) {
expression return()
}

E. IF STATEMENT
1. If (Hanya untuk vector berukuran 1)
Sintaks
if(cond1=true) {cmd1} else {cmd2}

253
2. Ifelse (untuk vector dengan panjang n)
Sintaks
ifelse(test, true_value, false_value
3. Switch (Untuk memilih lebih dari dua pilihan)
Sintaks
Switch (EXPR, …)

F. LOOP
1. For (Perulangan dilakukan sesuai dengan nilai pada counter
Sintaks
for (Vector counter) {statements}
2. While (Pengulangan dilakukan dengan memeriksa kondisi)
Sintaks
while (condition) {statements}
3. Repeat (Pengulangan dilakukan dengan memeriksa kondisi. Kondisi di periksa setelah
statement dilakukan)
Sintaks
repeat {Statements … if (condition) {breaks}}

G. APPLY
1. Apply (Untuk perulangan yang dapat digunakan pada matriks, vector dataframe, maupun list)
Sintaks
apply (X, Margin, Fun, Args)
2. Tapply (Melakukan implementasi dari sebuah fungsi ke array atau vector berjenis kategorik)
Sintaks
tapply (vector, factor, FUN)
3. Lapply dan sapply (Melakukan implementasi dari sebuah fungsi ke vector atau list)
Sintaks
• Lappy -> menghasilkan list (lapply (x, FUN))
• Sapply -> menghasilkan vector atau matrix (sapply (x, FUN))

DATA PREPARATION

A. OVERVIEW ON DATA PREPARATION


1. Why Data Preprocessing:
• Data in the world is dirty (noisy, inconsistent)
• Tidak lengkap atau kurang variable penting (incomplete)
• Analisa pada data yang tidak di preprocess menghasilkan insight yang kurang tepat (no
quality)
• Data perlu disesuaikan dengan metode sains data dan software yang digunakan
Data Preparation/Preprocessing adalah teknik awal data mining untuk mengubah raw data
(unstructured data) menjadi format dan informasi yang lebih efisien dan bermanfaat (prepared
data/structured) untuk proses pemodelan menggunakan Machine Learning (ML)
2. Kondisi Data
• Terstruktur
• Tidak terstruktur
• Imbalanced data

254
o Majority class
o Minority class

B. VALIDASI DATA
Validasi data ingin mengonfirmasi apakah data memenuhi asumsi berdasarkan disiplin ilmu
tertentu (domain knowledge).
1. Aturan Validasi
• Jika responden menyatakan memiliki penghasilan dari 'kegiatan lain’; kolom ‘kegiatan
lainnya’ harus diisi,
• Seseorang yang berusia di bawah 15 tahun tidak dapat berpartisipasi dalam kegiatan
ekonomi,
• 'Kode wilayah' yang dikirimkan harus ada dalam daftar kode resmi,
• Hasil penjumlahan laba dan total biaya harus sama dengan dengan total pendapatan,
• Pasangan suami istri harus memiliki tahun perkawinan yang sama,
• Jika seseorang adalah anak dari referenced person, maka kode ayah dari anak tersebut harus
sama dengan kode referenced person,
• Jumlah karyawan harus sama dengan atau lebih besar dari nol, dst
2. Package “validate”
Dengan package ini, Anda bisa melakukan:
• Konfrontasi data dengan sekumpulan rules validasi yang bisa digunakan Kembali;
• Investigasi, membuat ringkasan, dan memvisualisasikan hasil validasi data;
• Import and export sekumpulan rules dari dan ke berbagai format;
• Memfilter, memilah dan memanipulasi rules validasi;
• Investigate, membuat ringkasan, dan visualisasi rule validasi.

C. DATA CLEANSING
1. Best Practice
Simpan data untuk setiap tahapan (raw, technically correct, consistent, aggregated and
formatted) secara terpisah agar bisa digunakan lagi jika diperlukan. Setiap langkah antar tahapan
dapat dilakukan dengan Rscript terpisah agar bisa direproduksi.
2. Missing Values
a) Solusi umum untuk missing data: listwise deletion (complete case analysis).
• Pro: mudah, default.
• Kontra: substantially lower the sample size, leading to a severe lack of power. It can also
lead to biased results, depending on why and in which patterns the data are missing.
• Fungsi untuk belajar missing values: help
b) Mekanisme hilangnya data
• MCAR (Missing Completely at Random)
• MAR (Missing at Random)
• MNAR (Missing Not at Random)
3. Outliers
a) Definisi
pengamatan dalam kumpulan data tertentu yang terletak jauh dari pengamatan lainnya.
• Alasan umum adanya outlier dalam datasetHuman error
• Intentional errors
• Sampling error

255
• Data processing error
• Sebagai akibat dari kesalahan instrument
• Experimental error
• Natural outliers
b) Jenis Outlier
• Univariate outliers
• Multivariate outliers
• Global outliers
• Collective outliers
• Contextual
• conditional outlier
c) How to identify outliers
• With box plot
• With scatter plot
• With DBSCAN
• With Z-Score
• With Inter Quartile Range (IQR)
• Z-Score or Extreme Value Analysis (parametric)
• Probabilistic and Statistical Modeling (parametric)
• Linear Regression Models (PCA, LMS)
• Proximity Based Models (non-parametric)
• Information Theory Models
• High Dimensional Outlier Detection Methods (high dimensional sparse data)
d) Menangani outliers di R
• Trimming/removing the outlier
• Quantile based flooring and capping
• Mean/Median/specific number imputation
4. Merapikan Data
a) Aturan dataset yang rapi
• Variabel ada di kolom
• Observasi ada di baris,
• Nilai ada di sel.
• Fungsi yang bergunaseparate();
• unite();
• pivot_longer();
• pivot_wider()

256
DATA WRANGLING

Data wrangling, seni mendapatkan data Anda ke R dalam bentuk yang berguna untuk visualisasi
dan pemodelan. Perselisihan data sangat penting: tanpa itu Anda tidak dapat bekerja dengan data Anda
sendiri! Ada tiga bagian utama untuk perselisihan data: import, tidy, transform. Data wrangling juga
mencakup transformasi data, yang telah sedikit dipelajari
A. TIBBLE
Tibbles adalah bingkai data, tetapi mereka mengubah beberapa perilaku yang lebih tua untuk
membuat hidup sedikit lebih mudah. R adalah bahasa lama, dan beberapa hal yang berguna 10 atau
20 tahun yang lalu sekarang menghalangi Anda. Sulit untuk mengubah basis R tanpa melanggar kode
yang ada, sehingga sebagian besar inovasi terjadi dalam paket. Di sini kita akan menjelaskan
tibble package, yang menyediakan bingkai data opini yang membuat bekerja di tidyverse sedikit lebih
mudah. Di sebagian besar tempat, saya akan menggunakan istilah tibble dan bingkai data secara
bergantian; ketika saya ingin menarik perhatian khusus pada kerangka data bawaan R, saya akan
menyebutnya data.frames. Dalam bab ini kita akan mengeksplorasi tibble package, bagian dari core
tidyverse.
Jika Anda sudah terbiasa dengan data.frame(), perhatikan bahwa tibble() tidak lebih sedikit:
tidak pernah mengubah jenis input (misalnya tidak pernah mengubah string menjadi faktor!), Itu
tidak pernah mengubah nama variabel, dan tidak pernah membuat nama baris. Dimungkinkan untuk
dapat diidiksi untuk memiliki nama kolom yang bukan nama variabel R yang valid, alias nama non-
sintaksis. Misalnya, mereka mungkin tidak mulai dengan huruf, atau mereka mungkin berisi karakter
yang tidak biasa seperti spasi.

B. TIDY DATA
Mendapatkan data Anda ke dalam format ini membutuhkan beberapa pekerjaan dimuka, tetapi
pekerjaan itu terbayar dalam jangka panjang. Setelah Anda memiliki data yang rapi dan alat rapi yang
disediakan oleh paket di tidyverse, Anda akan menghabiskan lebih sedikit waktu mengumpulkan
data dari satu representasi ke representasi lainnya, memungkinkan Anda untuk menghabiskan lebih
banyak waktu pada pertanyaan analitik yang ada. Anda dapat mewakili data dasar yang sama dalam
berbagai cara. Contoh di bawah ini menunjukkan data yang sama yang diatur dalam empat cara
berbeda. Setiap dataset menunjukkan nilai yang sama dari empat variabel negara, tahun, populasi, dan
kasus, tetapi setiap dataset mengatur nilai dengan cara yang berbeda.
Ada tiga aturan yang saling terkait yang membuat dataset tidy:
3. Setiap variabel harus memiliki kolom sendiri.
4. Setiap pengamatan harus memiliki baris sendiri.
5. Setiap nilai harus memiliki sel sendiri.
Ketiga aturan ini saling terkait karena tidak mungkin hanya memuaskan dua dari tiga.
Keterkaitan itu mengarah pada serangkaian instruksi praktis yang lebih sederhana:
1. Masukkan setiap dataset ke dalam tibble
2. Menempatkan setiap variabel dalam kolom.

C. RELATIONAL DATA
Relations selalu didefinisikan antara sepasang tabel. Semua hubungan lain dibangun dari ide
sederhana ini: hubungan tiga atau lebih tabel selalu menjadi milik hubungan antara masing-masing
pasangan. Terkadang kedua elemen pasangan bisa menjadi tabel yang sama.

257
Untuk bekerja dengan relational data Anda memerlukan kata kerja yang bekerja dengan
pasangan tabel. Ada tiga keluarga kata kerja yang dirancang untuk bekerja dengan data relasional:
• Bermutasi bergabung, yang menambahkan variabel baru ke satu bingkai data dari pencocokan
pengamatan di yang lain.
• Pemfilteran bergabung, yang memfilter pengamatan dari satu bingkai data berdasarkan apakah
mereka cocok dengan pengamatan di tabel lain atau tidak.
• Atur operasi, yang memperlakukan pengamatan seolah-olah mereka adalah elemen yang
ditetapkan.
Tempat paling umum untuk menemukan data relasional adalah dalam sistem manajemen
database relasional (atau RDBMS), istilah yang mencakup hampir semua database modern. Jika Anda
pernah menggunakan database sebelumnya, Anda hampir pasti menggunakan SQL. Umumnya, dplyr
sedikit lebih mudah digunakan daripada SQL karena dplyr mengkhususkan diri untuk melakukan
analisis data: itu membuat operasi analisis data umum lebih mudah, dengan mengorbankan
membuatnya lebih sulit untuk melakukan hal-hal lain yang biasanya tidak diperlukan untuk analisis
data.

D. STRINGS
Ekspresi reguler berguna karena string biasanya berisi data tidak terstruktur atau semi-
terstruktur, dan regexps adalah bahasa ringkas untuk menggambarkan pola dalam string. Ketika
Anda pertama kali melihat regexp, Anda akan berpikir seekor kucing berjalan melintasi keyboard
Anda, tetapi ketika pemahaman Anda meningkat, mereka akan segera mulai masuk akal. Bab ini akan
fokus pada paket stringr untuk manipulasi string, yang merupakan bagian dari inti tidyverse.
Anda dapat membuat string dengan satu kutipan atau kutipan ganda. Tidak seperti bahasa lain,
tidak ada perbedaan dalam perilaku. Saya sarankan selalu menggunakan ", kecuali jika Anda ingin
membuat string yang berisi banyak".
string1 <- "This is a string"
string2 <- 'If I want to include a "quote" inside a string, I use single
quotes'
Base R berisi banyak fungsi untuk bekerja dengan string tetapi kita akan menghindarinya karena
mereka bisa tidak konsisten, yang membuat mereka sulit diingat. Sebagai gantinya kita akan
menggunakan fungsi dari stringr. Ini memiliki nama yang lebih intuitif, dan semua dimulai dengan
str_. Misalnya, str_length() memberi tahu Anda jumlah karakter dalam string:
str_length(c("a", "R for data science", NA))
#> [1] 1 18 NA

E. FACTORS
Secara historis, faktor jauh lebih mudah untuk bekerja dengan daripada karakter. Akibatnya,
banyak fungsi di basis R secara otomatis mengubah karakter menjadi faktor. Ini berarti bahwa faktor-
faktor sering muncul di tempat-tempat di mana mereka tidak benar-benar membantu. Untungnya,
Anda tidak perlu khawatir tentang itu di sisi yang rapi, dan dapat fokus pada situasi di mana faktor-
faktor yang benar-benar berguna.
Bayangkan Anda memiliki variabel yang mencatat bulan:
x1 <- c("Dec", "Apr", "Jan", "Mar")
Menggunakan string untuk merekam variabel ini memiliki dua masalah:
1. Hanya ada dua belas bulan yang mungkin, dan tidak ada yang menyelamatkan Anda dari kesalahan
ketik:
X1 <- c("Dec", "Apr", "Jan", "Mar")

258
2. Itu tidak menyortir:
sort(x1)
#> [1] "Apr" "Dec" "Jan" "Mar"
3. Anda dapat memperbaiki kedua masalah ini dengan suatu faktor. Untuk membuat faktor, Anda
harus mulai dengan membuat daftar level yang valid:
month_levels <- c(
"Jan", "Feb", "Mar", "Apr", "May", "Jun",
"Jul", "Aug", "Sep", "Oct", "Nov", "Dec"
)
Sekarang Anda dapat membuat faktor:
y1 <- factor(x1, levels = month_levels)
y1
#> [1] Dec Apr Jan Mar
#> Levels: Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
sort(y1)
#> [1] Jan Mar Apr Dec
#> Levels: Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec

F. DATE AND TIMES


Tanggal dan waktu sulit karena mereka harus mendamaikan dua fenomena fisik (rotasi Bumi dan
orbitnya mengelilingi matahari) dengan seluruh rakit fenomena geopolitik termasuk bulan, zona
waktu, dan DST.
Ada tiga jenis data tanggal / waktu yang mengacu pada instan dalam waktu:
1. Tanggal. Tibbles mencetak ini sebagai <date>.
2. Waktu dalam sehari. Tibbles mencetak ini sebagai <time>.
3. Tanggal-waktu adalah tanggal ditambah waktu: secara unik mengidentifikasi instan dalam waktu
(biasanya ke detik terdekat). Tibbles mencetak ini sebagai <dttm>. Di tempat lain di R ini disebut
POSIXct, tapi saya tidak berpikir itu nama yang sangat berguna.
Untuk mendapatkan tanggal atau tanggal waktu saat ini, Anda dapat menggunakan today() atau
now().
today()
#> [1] "2020-10-09"
now()
#> [1] "2020-10-09 11:59:37 UTC"
Jika tidak, ada tiga cara Anda cenderung membuat tanggal / waktu:
1. Dari string.
2. Dari komponen tanggal-waktu individu.
3. Dari objek tanggal/waktu yang ada.

259
EKSPLORASI DAN VISUALISASI DATA

A. STATISTIK DESTKRIPTIF
Terdiri atas ukuran pemusatan yaitu mean, median, modus, dan fraktil (quartil, desil, dan
persentil). Kemudian pula ukuran penyebaran/dispersi yaitu range, interquartile range, varians, dan
standar deviasi serta koefisien variasi. Kita bisa menggunakan R untuk melihat summary statistucs
yang terdiri dari min, quartil 1, median, mean, kuartil tiga dan nilai maksimum.

B. VISUALISASI DATA di R
Packages khusus untuk grafik
• grid
• lattice
• Ggplot2
Fungsi
• his () -> histogram
• boxplot () -> box-and-whisker plot
• stem () -> stem and leaf plot
• pie () -> pie chart
• persp () -> tiga dimensi scatter plot
• qqnorm (), qqline (), qqplot () -> pengecekan kenormalan data secara visual
• pairs () -> scatter plot lebih dari dua variabel

NOTE : MATA KULIAH PENGANTAR SAINS DATA MERUPAKAN MATA KULIAH BARU DI
SEMESTER 4. JADI BELUM ADA SOAL DAN PEMBAHASAN UTS YANG DITAMPILKAN. SEBAGAI
GANTINYA, KAMI MENAMPILKAN LATIHAN SOAL DAN PEMBAHASANNYA. SEMOGA
RANGKUMAN DAN LATIHAN SOAL YANG KAMI BERIKAN DAPAT MEMBANTU TEMAN-TEMAN
BELAJAR. SEMANGAT

260
LATIHAN SOAL
1. Dalam metodologi Sains Data terdapat KDD dan CRISP-DM, apakah sebenarnya mereka berbeda pada
konsepnya?
2. Dengan menggunakan data di bawah ini, menggunakan syntax data.frame()susunlah kembali
data di bawah ini

Jurusan Usia
Statistika 26
Komputasi Statistik 28
Ekonomi 27
Komunikasi 29
Statistika 26
Komputasi Statistik 27
Ekonomi 26
Komunikasi 26
Ekonomi 30
Komunikasi 26
3. Cek missing value pada data airquality yang sudah disediakan di R (airquality). Kemudian cek
apakah terdapat missing value pada data tersebut, kemudian ganti datanya dengan menggunakan
median dari data itu.
4. Dengan menggunakan R Studio berdasarkan data yang ditautkan pada link berikut:
https://s.stis.ac.id/DATA_PSD
Dari data tersebut, buatlah scatter plot antara Survival Time (Y) dan Umur (X) menurut variabel
Pecandu Rokok (Dua scatter plot)

PEMBAHASAN
1. Secara alur berpikir. Alur cycle untuk antar sub proses ataupun dari first dan last proses. Umumnya
alur disini membuat kita berfikir jika ada hal yang dirasa salah ketika berada dalam satu sub proses,
maka kita harus mundur untuk memperbaikinya. Jikapun tidak menemukan akar permasalahannya,
maka selesaikan hingga proses terakhir dan evaluasi secara keseluruhan untuk memperbaiki analisis
selanjutnya. Walaupun sekilas mereka mempunyai nama yang berbeda dalam sub prosesnya, secara
umum mereka mempunyai mindmap yang sama. Berikut adalah perbandingan dari kedua proses
tersebut:

KDD CRISP-DM
Pre KDD Business
Understanding
Selection Data Understanding
Pro Processing
Transformation Data Preparation
Data Mining Modeling
Interpretation/Evaluation Evaluation
Post KDD Deployment
Keterangan: Yang dishading segaris merupakan proses yang sama.

261
2. Syntax di bawah ini dapat digunakan
#Mengisi nilai untuk masing-masing kolom
Jurusan<-c("Statistika","Komputasi
Statistik","Ekonomi","Komunikasi","Statistika",
"Komputasi
Statistik","Ekonomi","Komunikasi","Ekonomi","Komunikasi")
Usia<-c("26","28","27","29","26","27","26","26","30","26")
#Menyatukan nilai-nilai tersebut
Data<-data.frame(Jurusan,Usia)
#Melihat tabel yang telah dibuat
View(Data)

Outputnya akan seperti ini

3. Syntax di bawah ini dapat digunakan


data<-airquality
#Cek missing value untuk seluruh data frame
any(is.na(data))
#Cek missing value untuk masing-masing kolom
sum(is.na(data$Ozone))

262
sum(is.na(data$Solar.R))
sum(is.na(data$Wind))
sum(is.na(data$Temp))
sum(is.na(data$Month))
sum(is.na(data$Day))

#Mengganti missing value dengan median untuk mendapatkan nilai median


data$Ozone[is.na(data$Ozone)]<-0
data$Solar.R[is.na(data$Solar.R)]<-0
median(data$Ozone)
median(data$Solar.R)

Datafix<-airquality
#Mengganti Missing value dengan median yang sudah ditentukan sebelumnya
Datafix$Ozone[which(is.na(Datafix$Ozone))]<-21 #Median ozone is 21
Datafix$Solar.R[which(is.na(Datafix$Solar.R))]<-194 # median solar is 194
#Melihat data akhir
View(Datafix)

Sebelum diganti dengan median terlihat bahwa terdapat missing value

263
Kemudian setelah dilakukan penggantian missing value dengan syntax di atas maka hasilnya akan seperti
di bawah ini.

264
4. Syntax di bawah ini dapat digunakan (Menggunakan ggplot)
#LAKUKAN IMPORT DATA TERLEBIH DAHULU
library(readxl)
Data<-read_excel("C:/Users/user/Downloads/DATA LATIHAN PSD.xlsx")
View(Data)
#Package di bawah ini akan digunakan
library(tidyverse)
#Dalam contoh ini, nama tabelnya adalah "Data"
ggplot(Data,aes(x=Umur,y=Survival_Time))+
geom_point()+
scale_x_continuous("Umur")+
scale_y_continuous("Survival Time")+

265
labs(title="Scatter Plot Antara Survival Time
dan Umur Menurut Candu atau Tidak
Terhadap Rokok")+
theme_light()+facet_wrap(~Pecandu_Rokok)

Outputnya akan menjadi seperti di bawah ini

266
PENGERTIAN SISTEM INFORMASI GEOGRAFIS

A. DEFINISI SIG
- Sistem Informasi merupakan sekumpulan komponen terintegrasi untuk mengumpulkan,
menyimpan, dan memproses data guna menghasilkan informasi, pengetahuan, dan produk
terkait lainnya
- Informasi Geografis merupakan informasi mengenai tempat-tempat, pengetahuan mengenai
letak objek dan informasi mengenai atribut yang terdapat di permukaan bumi yang posisinya
diketahui.
- Sistem Informasi Geografis (SIG) merupakan
• Sistem informasi yang dirancang untuk data yang memuat elemen lokasi.
• Sistem komputer untuk “menangkap”, menyimpan, memeriksa, mengolah dan
menampilkan data yang terkait dengan posisinya di permukaan bumi
- Secara umum, masalah geografis dikelompokkan menurut :
• Skala dan detil geografis → Misal : level lokal, regional, atau global.
• Maksud dan tujuan pemecahan → Misal : meminimumkan biaya, menyelamatkan jiwa,
dsb.
• Keingintahuan manusia → Misal : Bagaimana perubahan kawasan hunian atau pola
penyebaran kawasan hunian, dsb.

B. DATA, INFORMASI, BUKTI, PENGETAHUAN, DAN KEBIJAKSANAAN


- Data merupakan sekumpulan angka/bilangan, teks, atau simbol yang bebas konteks, apa
adanya, dan tidak memiliki makna jika berdiri sendiri.
- Informasi merupakan data yang telah diberikan makna atau interpretasi. Karakteristik
pentingnya yaitu mudah untuk diolah atau digabung dengan informasi lainnya.
- Bukti merupakan informasi terkait masalah tertentu yang konsisten kevalidasiannya.
- Pengetahuan merupakan informasi yang memiliki nilai tambah sesuai interpretasi, konteks,
dan tujuan tertentu. Diartikan juga sebagai kesadaran atau pengenalan terhadap sesuatu.
- Kebijaksanaan merupakan keputusan yang diambil atau saran yang diberikan dengan
mempertimbangkan semua pengetahuan dan bukti yang ada.
- Hierarki dalam pengambilan keputusan :

C. KOMPONEN SIG
Sebagai sistem SIG terdiri dari beberapa komponen terkait yaitu
- Data
- Procedures
- Hardware

268
- Software
- People
- Network
- Applications

D. PERSPEKTIF SIG SEBAGAI SISTEM


- Sebagai sistem, SIG merupakan alat berbasis komputer , dengan kegunaan :
• Untuk mengumpulkan, menyimpan, memproses, menganalisis, dan memvisualisasikan
informasi geografis.
• Untuk meningkatkan efisiensi dan efektivitas penanganan informasi geografis.
• Untuk penyelesaian masalah yang memiliki keterkaitan dengan informasi geografis.
- Sebagai sains, SIG :
• Mencakup konsep, prinsip, dan metode yang diterapkan dengan alat dan teknik SIG.
• Menjadi kerangka kerja mengenai bukti baru, pengetahuan, dan kebijaksanaan tentang
bumi yang dibuat secara efisien, efektif, dan aman.
• Merupakan metode untuk mendapat pengetahuan baru di bidang geografis.
- Untuk memperoleh pengetahuan baru garus sejakan dengan kaidah metode ilmiah :
• Transparansi asumsi dan metode → untuk memverifikasi penambahan pengetahuan
baru.
• Menjaga objektivitas dan independensi.
• Memungkinkan replikasi.
• Validitas → menggunakan hasil analisis atau sumber informasi lain yang terpercaya.
• Generalisasi → representasi parsial untuk tujuan analitis ke realitas objektif yang lebih
luas yang dimaksudkan untuk direpresentasikan.

E. PERKEMBANGAN SIG
Secara umum, era perkembangan SIG yaitu :
- Era Inovasi (Tahun 1963 – 1973)
- Era Komersialisasi (Tahun 1981 – 1999)
- Era keterbukaan dan penggunaan yang meluas (Tahun 2000 – sekarang)

F. SIG SEBAGAI ALAT BANTU


Permasalahan geografis dapat dikelompokkan menjadi, permasalahan :
- Individual → didominasi pengetahuan kognitif (pemahaman konsep spasial, belajar dan
beragumen tentang data geografis, serta interaksi manusia-komputer).
- Komputer → didominasi penelitian di bidang komputer (persoalan representasi, adaptasi,
dan visualisasi).
- Masyarakat → fokus pada dampak dan konteks sosial SIG.

G. POLA-POLA DALAM PENERAPAN SIG


- Manajemen data → menyimpan, mengelola, dan menjaga catatan geospasial.
- Perencanaan dan Analisis → nila tambah informasi dengan menggabungkan data dalam
konteks spasial.
- Pelaksanaan Lapangan → Mendapat informasi ke dalam dan keluar lapangan.
- Kesadaran Operasional → Pemantauan sumber daya untuk keputusan berdasar informasi.
- Penyebaran Data → menyebarkan data dalam beragam format dan platform.

269
SIFAT DATA GEOGRAFIS

A. AUTOKORELASI SPASIAL DAN SKALA


- Topologi merupakan salah satu konsep dasar yang penting dalam geografi. Topologi adalah
tata ruang yang tidak berubah dalam deformasi dwikontinu atau ruang yang dapat ditekuk,
dilipat, disusut, direntangkan dan dipilin (tetapi tidak dirobek, ditusuk, dipotong atau
dilekatkan). Dalam konteks SIG, topologi berarti posisi relatif dari objek atau fitur-fitur
geograsi di suatu hamparan. Dimensi dalam topologi dalam SIG adalah sebagai berikut.
• Dimensi 0 → objek atau fitur tidak memiliki panjang, lebar, dan kedalaman.
• Dimensi 1 → objek atau fitur geografis yang hanya memiliki panjang, tetapi tidak
memiliki lebar, dan kedalaman.
• Dimensi 2 → objek atau fitur geografis yang memiliki panjang dan lebar, tetapi tidak
memiliki kedalaman.
• Dimensi 3 → objek atau fitur geografis yang sekaligus memeiliki panjang, lebar, dan
kedalaman.
- Objek geografis berdasarkan dimensi topologi adalah sebagai berikut.
• Titik → merepresentasikan lokasi kejadian spasial atau fitur. Dalam peta skala kecil, titik
merepresentasikan kota sedangkan dalam peta skala besar titik merepresentasikan
suatu tempat di kota.
• Garis → merepresentasikan objek jalan, pipa, kabel.
• Area/ polygon → merepresentasikan suatu kawasan, misalnya kawasan hunian.
• Volume → merepresentasikan objek yang memiliki volume, seperti cerungan sungai,
bangunan, dsb.
• Ada beberapa pihak yang memasukkan waktu sebagai dimensi ke-4
- Objek-objek dimensi lebih rendah dapat diturunkan dari dimensi yang lebih tinggi, tetapi
tidak berlaku sebaliknya.
- Variasi spasial dipengaruhi oleh tiga prinsip, yaitu :
• Efek kedekatan
• Skala geografis dan tingkat detail
• Kovariasi antar berbagai engukuran tentang dunia
- Autokorelasi spasial merupakan ukuran tentang kemiripan lokal dan atribut. Macam
autokorelasi spasial sebagai berikut.
• Positif → pola di mana fitur memiliki kemiripan lokasi dan atribut.
• Negatif → pola di mana fitur yang berdekatan dalam ruang memiliki atribut yang
cenderung berbeda dibanding fitur yang jauh.
• Nol (0) → jika nilai atribut tidak ada ketergantungan dengan lokasi fitur.

270
- Skala merupakan resolusi spasial atau level detail dari data. Selain itu, skala juga diartikan
dengan cakupan proyek (wilayah, biaya, dan banyak orang yang terlibat). Skala peta adalah
rasio antara ukuran di peta dengan ukuran di dunia nyata, dinyatakan dalam pecahan.
Autokorelasi spasial sangat tergantung dari skala penyajian data.

B. SAMPLING SPASIAL
- Kerangka sampling merupakan himpunan seluruh peristiwa atau kejadian yang memenuhi
syarat(sesuai kriteria yang ditetapkan). Kerangka sampling spasial dapat berupa empat
persegi panjang atau himpunan objek geografis tertentu. Kualitas data geografis sangat
bergantung pada kualitas sampling yang digunakan untuk menghasilkan data.
- Teknik sampling spasial yang digunakan adalah sebagai berikut.
• Simple random sampling
Pemilihan n sampel dari populasi berukuran N dalam batas wilayah yang telah
ditetapkan sebagai wilayah populasi dilakukan secara acak sederhana. Kelemahan: ada
kemungkinan sampel terpilih berada di lokasi yang sulit disurvei.
• Systematic spatial sampling
Perlu dihitung interval k=N/n dan tiap elemen ke-k dipilih menjadi sampel. Secara
spasial, interval diterjemahkan dengan kisi-kisi(grid) berupa garis tegak dan mendatar
dengan jarak sama. Titik perpotongan dua garis tersebut akan menjadi sampel terpilih.
• Stratified random sampling
Wilayah populasi dibagi habis ke dalam n sub wilayah dengan luas yang sama dan setiap
sub wilayah diwakili oleh satu sampel.
• Stratified sampling with random variation in grid spacing
Teknik ini mirip dengan systematic spatial sampling, hanya saja interval kisinya dibuat
bervariasi.
• Clustered sampling.
Wilayah populasi dibagi ke dalam sub-sub wilayah yang berfungsi sebagai kluster.
Pemilihan dilakukan terhadap sub wilayah, kemudian seluruh elemen pada sub wilayah
terpilih dijadikan sebagai sampel
• Transect sampling
Cocok digunakan untuk wilayah geografis yang berundak. Sampel diambil dari setiap
undakan yang ada
• Contour sampling
Sampel diambil dari setiap kontur di hamparann populasi.

271
C. SAMPLING DAN VGI
- Pada kenyataannya, sering tidak dimungkinkan untuk mengumpulkan data sendiri dengan
disain sampling yang dibuat sendiri agar dapat diperoleh data spasial yang tidak bias. Seiring
dengan berlimpahnya data yang didominasi oleh Big Data dan Open Data, semakin banyak
data yang digunakan dalam analisis sebenarnya dikumpulkan oleh pihak lain (nonexpert atau
sukarelawan yang dapat menyebabkan bias) dan dengan tujuan yang berbeda.
- Salah satu pendekatan untuk menggunakan data cari Volunteered Geographic
Information(VGI) adalah dengan melakukan perbandingan antara data yang diperoleh
dengan lokasi di media sosial (mengecek content coverage dan data collection procedure).
Pemeriksaan perlu dilakukan untuk mengurangi kemungkinan terjadinya bias.

D. PELURUHAN JARAK
- Representasi dunia nyata dibuat berdasar sampel sehingga diperlukan cara untuk mengisi
kesenjangan antar titik-titik sampel agar diperoleh representasi yang baik. Diperlukan fungsi
interpolasi yang sesuai dan mempertimbangkan observasi-observasi sampel yang
berdekatan.
- Hukum Pertama Geografi-Tobler : “Semuanya terkait, tapi hal-hal dekat lebih terkait dari
pada hal-hal yang jauh. Hukum itu menunjukkan bahwa pengaruh nilai atribut suatu objek
akan luruh atau hilang seiring bertambahnya jarak terhadap objek.
- Fungsi peluruhan jarak di antaranya

Fungsi di atas menggambarkan bahwa efek jarak terjadi secara teratur, kontinu, dan seragam
ke segala arah(isotropik).
- Peta Isopleth merupakan visualisasi dari fenomena yang bervariasi secara kontinu di
permukaan. Dibuat dengan garis yang menghubungkan titik-titik dengan nilai atribut
sama(isoline).
Contoh :

272
- Peta Choropleth merupakan visualisasi nilai atribut dari area-area yang tidak saling tumpang
tindih di suatu hamparan. Tiap area diwarnai atau diarsir sesuai nilai variabelnya.
Contoh :

E. MENGUKUR EFEK JARAK SEBAGAI AUTOKORELASI SPASIAL


- Autokorelasi spasial mengukur kemiripan lokasi sesuai dengan atribut. Kemiripan lokasi
diakomodir melalui matriks penimbang spasial (W) dengan elemen-elemennya
menunjukkan penimbang spasial dari suatu objek ke objek lain. W disusun berdasar jarak
atau lokasi objek. Untuk objek area dan atributnya memiliki skala rasio, autokorelasi spasial
dihitung dengan Indeks Moran.
- Indeks Moran → ukuran autokorelasi spasial yang merupakan perluasan dari koefisien
korelasi Pearson dan disimbolkan dengan I.

Dengan 𝑧𝑖 = (𝑥𝑖 − 𝑥̅ ) dan 𝑧𝑗 = (𝑥𝑗 − 𝑥̅ )


Keterangan :
I = Indeks Moran
n = banyak lokasi kejadian
xi = banyak kejadian tertentu pada wilayah ke-i

273
xj = banyak kejadian tertentu pada wilayah ke-j
𝑥̅ = rata-rata banyak kejadian tertentu
𝑤𝑖𝑗 = elemen matriks pembobotan antara daerah i dan j
W = jumlah dari semua elemen pada matriks pembobotan spasial

F. INDUKSI DAN DEDUKSI


Data spasial bersifat sangat kompleks karena itu diperlukan tidak hanya kompetensi teknis
tentang software tetapi juga pemahaman yang baik tentang sifat data geografis yang akan
dianalisis agar dapat melakukan induksi (argumen berdasar data hasil observasi) dan deduksi
(argumen berdasar prinsip atau teori) agar representasi yang dihasilkan layak digunakan.

REPRESENTASI GEOGRAFIS

A. KONSEP DASAR PENYAJIAN PERMUKAAN BUMI


- Kegunaan representasi permukaan bumi antara lain untuk mempelajari, berpikir, dan
membangun nalar tentang berbagai tempat dan waktu di luar pengalaman keseharian yang
biasa dijumpai.
- Dunia merupakan suatu objek yang sangat kompleks, jika pengamatan semakin dekat, akan
semakin banyak detail yang terungkap. Hampir tidak mungkin menyajikan realitas geografis
karena terlalu kompleks sehingga perlu dibuat model yang merepresentasikan realitas
geografi.
- Model merupakan penyederhanaan realitas dengan pertimbangan hal yang disajikan, tingkat
kerincian, dan periode waktu yang disajikan.

B. REPRESENTASI DIGITAL
- Berbagai macam peta, catatan sejarah, dan informasi semakin banyak yang disebarkan
dalam format digital. Banyaknya penggunaan representasi geografi disebabkan karena
representasi ini bersifat sederhana dan relatif murah biaya.
- Digital berasal dari kata digit yang berarti “bilangan” atau “jari”. Sistem representasi pada
komputer hanya menggunakan dua digit, yaitu 0 dan 1, dan dikenal sebagai sistem bilangan
biner. Sistem ini berkembang untuk representasi ada tidaknya arus listrik pada teknologi
elektronik yang menjadi basis pengembangan komputer. Hal ini mendasari semua item atau
informasi tentang permukaan bumi dalam basis data SIG juga disimpan dalam bentuk
kombinasi antara 0 dan 1.
- Penggunaan format digital memiliki keunggulan yaitu :
• Mudah ditransformasi;
• Mudah diolah; dan
• Mudah dianalisis.

C. PENGKODEAN
- Pengkodean dalam sistem bilangan biner, menggunakan digit berupa 0 atau 1 (disebut bit)
dan kumpulan 8 digit biner disebut byte.
- Pengkodean sistem bilangan bulat, yang dapat dibagi menjadi dua yaitu
• Short integer (2 byte/ 16 bit) yang menyimpan bilangan -32767 sampai +32767; dan

274
• Long integer (4 byte/ 32 bit) yang menyimpan bilangan -214783647 sampai
+214783647.
- Pengkodean bilangan pecahan (dengan posisi desimal), menggunakan representasi real atau
floating point :
• Single precision(32-bit) untuk menyimpan sampai 7 digit signifikan.
• Double precision(64-bit) untuk menyimpan samapi 14 digit signifikan.
- Pengkodean teks, umumnya digunakan sistem, ASCII (American Standard Code for
Information Interchange) 8-bit. Sistem ASCII memberi kode untuk tiap simbol teks, termasuk
huruf, bilangan, dan berbagai simbol umum lainnya(termasuk tanda baca).
- Penyimpanan gambar dan suara, memerlukan bit yang relatif sangat besar. Penyimpanan
gambar, citra, dan suara dalam SIG diakomodir dengan sistem pengkodean BLOB (Binary
Large Object) yang mengalokasikan sejumlah bit sesuai keperluan.

D. PERSOALAN DALAM REPRESENTASI


- Komponen dasar data geografis adalah sebagai berikut :
• Lokasi → dinyatakan dalam bentuk koordinat, walaupun bisa juga brupa nama tempat
yang dapat diidentifikasi lokasinya atau dikenal.
• Waktu → dinyatakan sesuai kebutuhan, bisa dalam bentuk detik, menit jam; hari atau
bahkan tahun.
• Deskripsi karakteristik → keterangan tentang sifat atau karakteristik dari objek di
lokasi, disebut juga sebagai atribut karena merupakan ciri dari objeknya.
- Masalah mendasar dalam membuat representasi adalah realitas dunia sangat kompleks.
Untuk menyajikan realitas secara lengkap tidak memungkinkan untuk dilakukan. Solusi
permasalahan tersebut yaitu :
• Representasi dibuat parsial; atau
• Membatasi level kerincian ; atau
• Mengabaikan perubahan karena waktu; atau
• Mengabaikan atribut tertentu.
- Cara yang umum digunakan untuk membatasi tingkat kerincian adalah mengabaikan
informasi untuk wilayah kecil(tidak melihat terlalu dekat). Dalam tampilan peta global,
wilayah yang luasnya kurang dari 100 km tidak akan tampak di layar/ tidak dapat terlihat.
Meskipun ada informasi yang ‘dibuang’, masih mungkin untuk diperoleh representasi yang
relatif representatif. Selain itu, strategi lain untuk membatasi tingkat kerincian adalah dengan
memperhatikan karakteristik yang relatif tidak berubah untuk cakupan yang luas.

E. OBJEK DISKRIT DAN BIDANG KONTINU OBJEK DISKRIT


- Solusi untuk membuat representasi permukaan bumi yang kompleks adalah dengan
membuat pilihan tingkat detail yang disajikan dan cara merepresentasikan geografis
(menyajikan sebagai objek diskrit dan bidang kontinu.
- Objek diskrit memiliki karakteristik utama yaitu dapat dihitung atau memiliki batas yang
jelas(dapat dipisahkan dengan objek lain). Dalam sudut pandang objek diskrit, dunia
geografis dapat disajikan sebagai objek-objek dengan batas yang jelas dan selebihnya sebagai
ruang kosong. Objek-objek yang disajikan dibagi ke dalam tiga kelompok sesuai dengan
dimensinya, yaitu kelompok objek berupa titik (dimensi 0), garis (dimensi 1), dan
bidang/poligon (dimensi 2). Selain itu, untuk dimensi tiga hanya berupa aprokmasi/
pendekatan. Contoh objek diskrit : kota, gunung, hunian, tower, dsb.

275
- Tidak semua objek di bumi dapat dikategorikan sebagai objek diskrit, misalnya
ketinggian(altitude atau elevetion) permukaan tanah. Untuk representasi objek yang
permukaannya kontinu dapat digunakan sudut pandang bidang kontinu. Dalam pandangan
bidang kontinu, dunia geografis dapat dideskripsikan dengan sejumlah variabel yang dapat
diukur di sebarang titik pada permukaan bumi dan nilainya dapat bervariasi antar
permukaan. Yang membedakan antar bidang kontinu adalah variabel (nilai yang bervariasi
dan seberapa kecil/besar variasinya). Pada bidang relatif datar variasi elevasi akan kecil,
sementara lereng landai akan memiliki variasi elevasi sedang, lereng tajam memiliki variasi
elevasi tinggi, dan untuk jurang variasi elevasinya sangat tajam.

F. RASTER DAN VEKTOR


- Komputer yang digunakan untuk membangun SIG memiliki keterbatasan dalam jumlah objek
atau informasi yang dikelola. Diperlukan suatu metode untuk merepresentasikan data
geografis menggunakan komputer digital dengan memperhatikan konsep sebagai berikut.
• Konsep bidang kontinu, direpresentasikan dengan data raster.
• Konsep objek diskrit, direpresentasikan dengan data vektor.
- Dalam representasi raster, dunia dibagi ke dalam array dari sel-sel dan memberikan nilai
atribut ke setiap sel tersebut. Setiap sel berupa empat persegi panjang, pada umumnya
berbentuk bujur sangkar. Semua variasi geografis diekspresikan dengan memberikan
karakteristik atau atribut ke setiap sel. Sel-sel tersebut biasanya disebut sebagai pixel yang
merupakan kependekan dari picture element. Contoh data raster :

- Data raster bisa didapatkan dari hasil penginderaan jauh(remote sensing) dari satelit dan
tangkapan sensor yang dipasang pada pesawat udara. Kualitas sumber data raster tersebut
ditentukan oleh :
• Resolusi → dinyatakan sebagai ukuran di lapangan yang direpresentasikan oleh panjang
sisi sel,
• Waktu jadwal atau pengambilan gambar/citra, dan
• Bagian spektrum yang tertangkap oleh sensor
- Raster sebenarnya merepresentasikan hasil proyeksi , yaitu proses mengubah permukaan
bumi yang lengkung ke permukaan datar. Oleh karena itu, sel bujur sangkar raster tidak bisa
menangkap permukaan bumi secara sempurna. Informasi dalam satu sel hanya diwakili oleh
satu nilai, akibatnya informasi tentang variasi di dalam sel akan hilang. Diperlukan aturan
untuk menentukan nilainya :
• Aturan bagian besar → nilai ditentukan dari bagian terbesar di dalam sel.
• Aturan titik tengah sel → nilai ditentukan berdasarkan nilai titik tengah sel.

276
- Data vektor dalam representasinya diperlukan :
• Garis, diperlukan sebagai dua titik yang dihubungkan oleh garis lurus.
• Poligon/ bidang, diartikan sebagai rangkaian titik-titik yang terhubung dengan garis
lurus dan membentuk bidang tertutup.
- Perbandingan antara data raster dan data vektor yaitu
Permasalahan Raster Vektor
Volume Data Bergantung ukuran sel Bergantung pada kepadatan
simpul.
Sources of data - Penginderaan jauh - Data sosial
- Perbandingan/ - Data yang berhubungan
perumpamaan dengan lingkungan
Penggunaan Sumber daya dan lingkungan Sosial, ekonomi, dan
administratif
Software - Raster GI System - Vector GI System
- Pengolahan citra - Variabel kartografi
otomatis
Resolusi Tetap Berubah-ubah

G. PETA KERTAS
Peta kertas merupakan representasi analog di mana model fisik dari realitas dunia direduksi
menggunakan skala. Peta ini telah menjadi alat yang efektif untuk mengkomunikasikan informasi
geografis. Kunci utama dari sebuah peta kertas adalah pada skala yang digunakannya. Peta kertas
juga telah dijadikan sebagai salah satu sumber data untuk basis data geografis.

H. GENERALISASI
- Generalisasi adalah proses penyederhanaan yang melibatkan tindakan untuk mendapatkan
informasi esensi sesuai tingkat detail dan periode waktu yang diinginkan dengan membuang
informasi yang tidak diinginkan. Proses ini dilakukan sebab isi dari basis data geografis harus
dipilih secara cermat agar sesuai dengan kapasitas penyimpanan komputer yang terbatas.
Generalisasi dibagi menjadi dua yaitu generalisasi tempat dan atribut.
- Generalisasi tempat, dijalankan karena seyogyanya tiap peta memuat spesifikasinya yang
menjelaskan bagaimana fitur-fitur riil di lapangan dipilih untuk dimasukkan pada peta. Jenis
aturan generalisasi (menurut McMaster & Shea) adalah sebagai berikut.

277
• Penyederhanaan → membuat bentuk yang lebih sederhana, misalnya dengan
menghilangkan titikk-titik di garis luar poligon.
• Smoothing → penggantian bentuk yang taja, dan kompleks dengan yang lebih halus.
• Collapse → penggantian objek area dengan kombinasi objek titik dan garis.
• Agregasi → penggantian sejumlah besar objek bersimbol berbeda dengan sejumlah kecil
simbol baru.
• Amalgamation → penggantian beberapa objek area dengan objek area tunggal.
• Merging → penggantian beberapa objek garis dengan jumlah objek garis yang lebih
sedikit.
• Refinement → penggantian pola objek yang kompleks dengan pilihan yang
mempertahankan bentuk umum pola.
• Exageration → pembesaran relatif dari suatu objek untuk mempertahankan
karakteristiknya jika karakteristik ini akan hilang apabila objek diperlihatkan skala.
• Enhancement → perubahan ukuran fisik dan bentuk simbol.
• Perpindahan → perpindahan benda dari posisi sebenarnya untuk mempertahankan
visibilitas dan kekhasan mereka
- Generalisasi atribut yaitu mengubah ukuran atribut yang disajikan agar dapat
merepresentasikan objek dengan baik. Atribut disesuaikan dengan representasi titik, garis,
atau area yang disajikan.

GEOREFERENSI

A. PENGERTIAN DAN KONSEP DASAR


- Komponen dasar dari SIG terdiri dari lokasi(komponen wajib), atribut(melekat pada lokasi),
dan waktu(opsional).
- Georeferencing adalah proses menetapkan lokasi suatu fitur geografis. Georeferencing juga
dikenal dengan geocoding atau geolocating. Melalui proses gereferencing, record dari fitur
geografis diikat ke suatu lokasi tertentu. Data yang diikat adalah data raster/vektor, yang
dilakukan dengan pemberian koordinat untuk tiap pixel dalam raster tersebut. Proses
georeferencing ditujukan untuk pembuatan peta dan penghitungan jarak antar objek dengan
memanfaatkan koordinat.
- Georeferencing sering disamakan dengan geotagging, tetapi keduanya sebenarnya sangat
berbeda. Perbedaan tersebut yaitu data yang diikat pada georeferencing adalah data raster/
vektor sedangkan pada geotagging yang diikat adalah data foto atau video.
- Syarat utama Georeferencing
• Unik → satu lokasi memiliki satu georeferensi
• Nama yang digunakan untuk georeferencing adalag nama yang dikenal luas.
- Georeferencing dapat dilakukan berdasarkan nama sederhana dan metric georeferences atau
continuous gereferences. Dalam praktiknya, georeferensi yang dibuat berdasarkan nama
sering menimbulkan masalah karena seringkali terjadi duplikasi nama atau nama yang sama
digunakan untuk lokasi yang berbeda.
- Nama tempat dan point of interest pada umumnya memiliki makna yang bervariasi sesuai
dengan masyarakat dan konteks penggunaannya. Georeferensi berdasar nama cenderung
menimbulkan masalah seperti :

278
• Ketidakpastian yang besar → misal, wilayah luas akan direpresentasikan dengan satu
titik yang umumnya berada di tengah. Hal ini, tidak tepat jika yang ingin dirujuk adalah
wilayah di pinggiran wilayah tersebut.
• Tidak semua tempat memiliki landasan legal → beberapa tempat memiliki nama lokal
yang lebih dikenal untuk keperluan komunikasi, bukan nama asli.

B. ALAMAT DAN KODE POS


- Alamat pos dikenalkan setelah perkembangan pengiriman surat pada abad-19. Asumsi yang
digunakan untuk alamat pos adalah sebagai berikut.
• Setiap tempat tinggal dan kantor merupakan tujuan potensial untuk surat.
• Tempat tinggal dan kantor disusun di sepanjang jalan atau gang dan diberi nomor urut.
• Jalan dan gang memiliki nama unik di daerah setempat.
• Daerah lokal memiliki nama unik dalam suatu wilayah yang lebih besar.
• Wilayah memiliki nama unik dalam suatu wilayah yang lebih besar.
Bila asumsi terpenuhi, alamat pos menjadi identifikasi unik untuk setiap tempat tinggal di
bumi. Alamat pos memiliki keterbatasan seperti
• Hanya mencakup alamat yang potensial sebagai tujuan surat (fitur-fitur geografis
lainnya terabaikan).
• Kurang dapat dimanfaatkan di suatu wilayah karena penomoran jalan cenderung acak.
- Kode pos merupakan kode yang digunakan untuk memudahkan penyortiran surat. Kode ini
diperkenalkan pada akhir abad-20. Kode pos di hampir semua negara menunjukkan
perkembangan yang relatif stabil dan dapat dimanfaatkan untuk tujuan pemetaan. Selain itu,
kode pos juga digunakan untuk berbagai kepentingan bisnis dan pencarian lokasi.

C. ALAMAT IP
- Alamat IP merupakan alamat unik untuk perangkat yang terhubung dengan jaringan
(internet atau lokal) sehingga memungkinkan adanya pengiriman informasi antar perangkat.
Disebut protokol karena dasarnya terdiri dari sekumpulan aturan tentang format dari data
yang dikirim ke suatu jaringan. Karakteristik alamat IP adalah sebagai berikut.
• Terdiri dari empat rangkaian bilangan yang masing-masing dipisahkan tanda
titik. Contoh alamat IP : 182.0.178.85.
• Dua komponen pertama merupakan bagian jaringan(alamat yang memberikan
akses) dan dua komponen terakhir merupakan bagian host(alamat perangkat
dalam jaringan).
• Bukan alamat acak karena dibuat dan dialokasikan oleh Internet Assigned
Number Authority (IANA) yang merupakan bagian dari internet Corporation for
Assigned Names and Numbers(ICANN).
- Alamat IP dapat memperkirakan lokasi suatu perangkat karena dalam proses
registrasi untuk mendapatkannya pengguna wajib mencantumkan alamat rumah
atau kantor. Ketepatan lokasi riil bergantung pada jenis alamat IP yang digunakan.

D. SISTEM REFERENSI LINIER DAN KADASTRAL


- Sistem referensi linier mengidentifikasi lokasi pada jaringan dengan mengukur jarak dari titik
referensi yang ditentukan di sepanjang jalur yang ditentukan dalam jaringan. Sistem yang
menggunakan ukuran jarak secara eksplisit ini dapat memudahkan identifikasi suatu lokasi

279
sesuai kebutuhan. Sistem referensi linear digunakan untuk pengelolaan infrastruktur
transportasi untuk penanganan berbagai masalah kedaruratan.
- Kadastral merupakan peta kepemilikan tanah yang dihasilkan dari integrasi hasil
pengukuran tanah dalam rangka pendaftaran tanah (survei kadastral). Di Indonesia peta ini
dibuat dan dikelola oleh Kementerian Agraria dan Tata Ruang. Dengan administrasi yang
baik, peta kadastral layak dijadikan sumber georeferensi. Contoh peta kadastral :

E. GARIS LINTANG DAN GARIS BUJUR


- Sistem koordinat geografis disusun dari sistem garis lintang (latitude) dan garis
bujur(longitude). Sistem ini dibuat berasar rotasi bumi pada titik pusatnya dengan sumbu
rotasinya adalah garis (imajiner) yang menghubungkan Kutub Utara dan Selatan.
- Garis bujur (𝝓) adalah garis yang melintasi Kutub Utara dan Selatan dan membagi bumi
menjadi belahan bumi timur(BT) dan barat(BB) sama luas. Garis bujur 0° (bujur utama)
terletak di Greenwich. Dalam SIG penyimpanan dilakukan dengan bentuk derajat desimal di
mana BB bernilai negatif dan BT bernilai positif, memiliki rentang -180 ≤ 𝝓 ≤ 180. Konversi
dari sistem penulisan DMS ke sistem derajat desimal adalah
𝑚𝑒𝑛𝑖𝑡 𝑑𝑒𝑡𝑖𝑘
𝐷𝐷 = 𝑑𝑒𝑟𝑎𝑗𝑎𝑡 + ( )+( )
60 3600
- Garis lintang (𝜆) garis yang tegak lurus dengan sumbu bumi. Garis lintang yang berada di
tengah Kutub Utara dan Selatan disebut juga garis ekuator (garis lintang 0°. Rentang nilai

280
garis lintang yaitu -90 ≤ 𝜆 ≤ 90 di mana nilai negatif menunjukkan lintang selatan (LS) dan
positif menunjukkan lintang utara(LU). Konversi nilai garis lintang sama dengan garis bujur.

F. PROYEKSI DAN KOORDINAT


- Proyeksi adalah proses pemipihan permukaan bumi ke dalam bentuk datar. Proyeksi
memberikan hasil permukaan bumi yang mengalami distorsi di beberapa bagian. Hasil
proyeksi menghasilkan peta distorsi terhadap bentuk area, atau jarak. Berdasar karakteristik
yang dipertahankan, proyeksi dibedakan jadi tiga yaitu
• Conformal → mempertahankan bentuk dari fitur-fitur (utamanya yang kecil) di
permukaan bumi. Sesuai dengan keperluan navigasi.
• Equal area → mempertahankan luas wilayah dari fitur-fitur permukaan bumi.
• Equidistant → mempertahankan jarak yang sama antara permukaan bumi dan hasil
proyeksi.
Berdasar bentuk permukaan kertas, proyeksi dibedakan menjadi :
• Cylindrical → dilakukan seolah ‘membungkus’ bumi dengan kertas proyeksi yang
dibentuk serupa tabung. Proyeksi ini dapat dikelompokkan menurut posisi relatif :
mercator (sejajar kutub utara – selatan), transvere mercator(sejajar ekuator), dan
oblique(kertas miring).
• Azimuthal → proyeksi ke kertas dasar.
• Conic → bentuk proyeksi menyerupai kerucut.
Sedangkan berdasar perpotongan dengan permukaan bumi, proyeksi dikelompokkan
menjadi :
• Tangent projection → permukaan kertas hanya bersentuhan dengan permukaan bumi.
• Secant projection → permukaan kertas mengiris permukaan bumi.

KETIDAKPASTIAN

A. PENGERTIAN
Ketidakpastian dapat didefinisikan sebagai ukuran pemahaman pengguna tentang perbedaan
antara isi himpunan data yang merepresentasikan suatu fenomena dengan fenomena nyatanya.
Ketidakpastian dalam SIG merupakan istilah untuk menggambarkan situasi saat representasi
digital tidak lengkap dan sebagai ukuran kualitas umum dari representasi.

B. KETIDAKPASTIAN PEMAHAMAN FENOMENA GEOGRAFIS


- Definisi yang digunakan untuk merepresentasi tempat atau atribut bisa tidak selalu
sesuai dengan tujuan yang diharapkan. Hal tersebut dapat terjadi karena tidak
tersedianya unit analisis natural untuk analisis geografis.
- Pemahaman tentang atribut :
• Ketidakjelasan → muncul pada posisi batas-batas suatu zona maupun
atributnya. Seringkali terjadi karena keterbatasan unit analisis natural.
• Ambiguitas → muncul karena penggunaan indikator yang kurang sempurna dari
suatu fenomena. Seringkali terjadi karena Konsep keterkaitan antara setiap
indikator dengan suatu fenomena sebenarnya bersifat subjektif.

281
C. KETIDAKPASTIAN REPRESENTASI FENOMENA GEOGRAFIS
- Terdapat beberapa model konseptual dalam ketidakpastian representasi tempat/lokasi,
yaitu :
• Model vektor → menggunakan konseptualisasi apriori tentang karakteristik dan luas
objek geografis dan cara masing-masing objek membentuk zona.
• Model raster → mendefinisikan elemen individu sebagai sel persegi dengan batas yang
tidak berhubungan dengan fitur alami.
- Kasus nominal pada ketidakpastian representasi fenomena geografis :
• Menjelaskan struktur dan interpretasi matriks konfusi;
• Memberikan persamaan indeks kappa

• Dalam kasus model area vektor kesalahan memiliki dua bentuk, yaitu misalokasi kelas
dan batas area.
- Kasus interval/ rasio :
• Kesalahan karena perubahan nilai yang dipengaruhi distorsi. Nilai tidak bias apabila
distorsi rata-rata bernilai 0 dengan kesalahan positif negatif seimbang.
• Membedakan akurasi(berkaitan dengan besar kesalahan) dan presisi(variabilitas
pengukuran berulang dan jumlah digit pengukuran).
• Ketidakpastian umumnya diukur dengan RMSE dan prediksi besar kesalahan dilakukan
dengan Distribusi Gaussian.

D. KETIDAKPASTIAN ANALISIS FENOMENA GEOGRAFIS


Analisis spasial dapat diartikan sebagai proses untuk mengubah data spasial menjadi informasi
spasial yang berguna . Hasil analisis spasial berubah ketika kerangka atau ukuran yang sedang
dianalisis berubah. Diperlukan validasi terhadap data dan hasil analisis. Validasi tersebut sebagai
berikut.
- Validasi internal dan eksternal melalui analisis spasial
Analisis yang baik tidak dapat menggantikan konsep geografi atau perwakilan yang buruk
tetapi hal itu dapat menandai kemungkinan konsekuensi dari keduanya. Sistem informasi
geografis menyediakan cara untuk memvalidasi representasi, kadang-kadang dengan atau
tanpa referensi ke sumber data eksternal.
• Validasi internal → melalui simulasi terhadap kemungkinan hasil.
• Validasi eksternal → melalui penggabungan berbagai sumber data.
- Validasi melalui autokorelasi
Data hasil operasi SIG diukur dampak ketidakpastiannya dengan propagasi kesalahan.
Terdapat strategi untuk mengevaluasi propagasi kesalahan yaitu dengan mendapatkan
deskripsi lengkap dari efek kesalahan dan menyimulasikan dampak ketidakpastian pada
hasil. Autokorelasi spasial antara kesalahan dalam database geografis dapat memabntu
meminimalkan dampak pada banyak operasi sistem GI.
- Validasi melalui penyelidikan efek agregasi dan skala
Kesimpulan yang tidak tepat dari data agregat tentang karakteristik individu disebut fallacy
ekologi. Proses agregasi dan perbedaan skala dapat menimbulkan persoalan dalam analisis

282
,maka diperlukan kehati-hatian dan kecermatan. Efek skala dan agregasi dikenal sebagai
Modifable Areal Unit Problem(MAUP).

SOFTWARE SIG

A. SOFTWARE SIG
- Sotware dalam SIG merupakan sekumpulan mesin untuk melakukan penyimpanan,
pengolahan dan penyajian data geografis yang memungkinkan suatu sisem informasi
geografis dioperasikan. Software SIG mencakup sekumpulan software program yang
terintegrasi ditambah beberapa elemen seperti help files, sampel data dan peta, dokumentasi,
lisensi dan situs web terkait.
- Berbagai cara pendistribusian software SIG, yaitu :
• Shareware → berbayar setelah masa percobaan;
• Liteware → sebagian kapabilitas fungsinya dimatikan;
• Freeware → gratis dengan pembatasan hak cipta;
• Public domain → gratis tanpa pembatasan; dan
• Open-source → kode diberikan dengan persetujuan open-source license.

B. EVOLUSI SOFTWARE SIG


Perkembangan software SIG :
- Tahun 1964 → SIG dibangun untuk menganalisis pengumpulan data lahan yang
berkaitan dengan pengembangan lahan pertanian;
- Tahun 1970an dan 1980an → muncul permintaan pasar untuk aplikasi interface
pengguna standar.
- Akhir 1980-an dan 1990-an → muncul Graphical User Interface(GUI) dan kustomisasi
kapabilitas.
- Sekarang → memungkinkan adanya perkembangan SIG yang menggunakan layanan
website.

C. ARSITEKTUR SOFTWARE SIG


- Skala implementasi SIG dibagi menjadi tiga, yaitu :
• Projek → data dikumpulkan untuk kepentingan projek, tidak ada visi organisasi, dan
prioritas untuk berbagi data dan pengalaman rendah.
• Departemen → menggabungkan projek-projek yang telah distandardisasi dalam satu
departemen.
• Enterprise → standardisasi antar departemen dan sumber daya dikelola serta didanai
secara terpusat.
- Tingkatan arsitektur software SIG :

283
• Data Management → pengorganisasian file, basis data, dan web services.
• Tools → mendefinisikan kapabilitas dan fungsionalitas SIG untuk pengolahan data.
• User interface → sekumpulan menu, toolbar, dan kontrol terintegrasi untuk mengakses
tools penanganan informasi geografis.
- Model data dalam SIG mendefinisikan bagaimana represetasi dunia nyata. Model data
software mendefinisikan bagaimana pengelompokan berbagai tool, penggunaan kelompok
tool dan interaksi dengan data. Kustomisasi merupakan proses modifikasi SIG dengan
menggunakan berbagai bahasa pemrograman.

D. MEMBANGUN SOFTWARE SIG


Membangunan software SIG dimulai dengan mendesain sistem software secara formal,
membangun tiap komponen secara terpisah, dan akhirnya merangkai tiap komponen menjadi
sistem utuh. Kor dari software SIG umumnya ditulis dengan bahasa pemrograman modern.

E. VENDOR SOFTWARE SIG


- Terdapat beberapa penyedia software SIG yang telah dikenal secara umum, di antaranya :
• Autodesk → produk : AutoCAD
• Bentley → produk : MicroStation
• ESRI → produk : ArcGIS
• Intergraph → produk : GeoMedia
- SIG dapat dibedakan menjadi berbagai jenis. Jenis-jenis SIG yaitu sebagai berikut.
• Sistem Desktop
• Sistem Pemetaan Web
• Server SIG
• Virtual globes
• Developer SIG
• Mobile SIG

284
PEMODELAN DATA GEOGRAFIS

A. MODEL DATA
- Model data adalah kumpulan gagasan abstrak untuk mendeskripsikan dan
mereperesentasikan aspek-aspek tertentu dunia nyata di lingkungan digital guna
membangun SIG secara operasional. Model data menekankan pada hal yang diperlukan dan
cara mengelolanya. Pemilihan model data sangat penting untuk keberhasilan projek
informasi geografis. Dalam memilih model data hal yang perlu diperhatikan adalah :
• Kekontinuan dan kekompleksan dunia direpresentasikan dengan komputer yang
memiliki keterbatasan dan hanya dapat bekerja dengan data digital.
• Cara mengakomodir berbagai model data yang diperlukan untuk memenuhi kebutuhan
pengguna secara optimal.
- Kegunaan model data :
• Bagi pengembang → sebagai representasi domain aplikasi.
• Bagi pengguna → memberi deskripsi tentang struktur sistem.

B. TINGKAT ABSTRAKSI MODEL DATA


- Tingkat abstraksi dapat diartikan sebagai tingkat generalisasi atau simplifikasi. Abstraksi
model data terdiri dari empat tingkat yaitu sebagai berikut.
• Realitas → dibentuk oleh fenomena riil seperti bangunan, jalan, sumur, orang, dsb dan
mecakup semua aspek yang dianggap relevan dengan aplikasi.
• Model konseptual → model dari objek atau proses yang dianggap relevan dengan
masalah tertentu.
• Model logis → representasi realitas berorientasi implementasi dan sering ditunjukkan
dalam bentuk diagram dan daftar.
• Model fisik → implementasi aktual dalam SIG yang seringkali terdiri dari tabel-tabel
yang disimpan dalam fail dan basis data model.
- Pemodelan data dilakukan dengan beberapa tahapan, yaitu :
• Fase 1 → pendefinisian jenis utama objek yang akan direpresentasikan dalam basis data
informasi geografis.
• Fase 2 → deskripsi konseptual jenis utama objek dan hubungan antar objek.
• Fase 3 → pembuatan diagram dan daftar (berisi nama, perilaku, dan interaksi antar
objek)
• Fase 4 → pembuatan model yang dapat digunakan secara digital dalam basis dara
informasi geografis.

C. MODEL DATA GEOGRAFIS


- Model data SIG dimaksudkan untuk merepresentasikan aspek geografis dari dunia nyata dan
mendefinisikan jenis operasi geografis yang digunakan.
- Pemodelan dunia nyata untuk representasi dalam basis data informasi geografis umumnya
dikelompokkan berdasar jenis geometrisnya. Kumpulan entitas dari geometris yang sama
disebut dengan kelas layer.
- Layer merupakan himpunan entitas geografis dengan jenis geometri sama yang dibangun
dengan melakukan digitasi peta analog. Pengelompokkan entitas menurut jenis geografis
memiliki keuntungan yaitu :
• Penyimpanan basis data geografis lebih efisien; dan

285
• Implementasi aturan validasi dan relasi antar objek menjadi lebih mudah.
- Terdapat berbagai model data geografis, model-model tersebut yaitu sebagai berikut.
• CAD → menggunakan representasi simbolis berupa titik, garis, dan area.
• Kartografi Komputer → untuk memenuhi kebutuhan peta kertas topografis dan tematik
sederhana.
• Image Processing → merepresentasikan dunia nyata di permukaan bumi dengan hasil
pindai foto udara dan citra satelit.
• Raster → merepresentasikan objek dunia nyata menggunakan array dari sel atau pixel.
• Vektor → mengasosiasikan objek diskrit dan mengklasifikasikan objek berdasar jenis
geometrinya (titik, garis, area, atau bidang).
• Jaringan → memodelkan arus barang dan jasa dengan dua jenis jaringan yaitu radial
atau looped.
• Triangulated Irregular Network(TIN) → merepresentasikan permukaan kontinu yang
seluruhnya terdiri dari segitiga.

D. MODEL DATA OBJEK


- Objek merupakan paket mendiri dari informasi yang menggambarkan karakteristik dan
kemampuan entitas. Setiap entitas yang dimasukkan dalam basis data adalah objek. Semua
objek yang berjenis sama disebut sebagai kelas sehingga kelas merupakan template dari
objek. Hubungan adalah interaksi antara dua objek
- Terdapat tiga aspek kunci dalam model data objek, aspek tersebut yaitu :
• Encapsulation → tiap objek merupakan paket yang memiliki state(mirip sifat dan
atribut objek) dan behavior(metode untuk suatu objek).
• Inheritance → dapat menggunakan sebagian atau semua karakteristik suatu objek
untuk objek lain.
• Polymorphism → tiap objek memiliki implementasi spesifik untuk pengoperasiannya.

E. PRAKTEK PEMODELAN DATA GEOGRAFIS


Kualitas analisis geografis akan tergantung dari kualitas model data yang digunakan untuk
membangun basis data. Tahapan dalam pemodelan data geografis adalah sebagai berikut.
- Pendefinisian secara jelas tentang tujuan dari projek geografisnya;
- Pemahaman tentang kebutuhan pengguna;
- Pendefinisian objek dan relationship;
- Formulasi model logis; dan
- Pembuatan model fisik

NOTE : MATA KULIAH SISTEM INFORMASI GEOGRAFIS MERUPAKAN MATA KULIAH BARU DI
SEMESTER 4. JADI BELUM ADA SOAL DAN PEMBAHASAN UTS YANG DITAMPILKAN. SEBAGAI
GANTINYA, KAMI MENAMPILKAN LATIHAN SOAL DAN PEMBAHASANNYA. SEMOGA
RANGKUMAN DAN LATIHAN SOAL YANG KAMI BERIKAN DAPAT MEMBANTU TEMAN-TEMAN
BELAJAR. SEMANGAT

286
LATIHAN SOAL
1. Jelaskan apa yang dimaksud dengan perspektif SIG sebagai sistem dan SIG sebagai sains.
2. Apa yang dimaksud dengan Autokorelasi spasial? Dan apa pula yang dimaksud dengan
autokorelasi spasial positif, negatif, dan nol?
3. Ada beberapa teknik sampling yang digunakan dalam menangani permasalahan spasial. Apa saja
teknik sampling itu? Dan berikan penjelasannya.
4. Terdapat dua format data yang umumnya digunakan untuk merepresentasikan permukaan bumi
dalam SIG, yaitu data raster dan data vektor. Apa yang dimaksud dengan data raster dan vektor?
Apakah perbedaan kedua data tersebut?
5. Georeferencing adalah proses menetapkan lokasi suatu fitur geografis. Untuk menjalankan
proses tersebut dibutuhkan suatu sistem baik yang dapat mengukur posisi lokasi dan jarak antar
lokasi. Sistem yang digunakan tersebut ialah sistem koordinat yang memanfaatkan garis lintang
dan garis bujur. Jelaskan apa yang dimaksud garis lintang dan garis bujur.
6. Proyeksi adalah proses pemipihan permukaan bumi ke dalam bentuk datar. Proyeksi dapat
dibedakan berdasarkan karakteristik, bentuk permukaan kertas, dan berdasarkan
perpotongannya terhadap bumi. Sebutkan macam-macam proyeksi berdasarkan karakteristik
dan bentuk permukaan bumi.
7. Terdapat tiga tingkatan dalam arsitektur software SIG. Sebutkan dan jelaskan ketiga tingkatan
tersebut.
8. Software dalam SIG merupakan sekumpulan mesin untuk melakukan penyimpanan, pengolahan
dan penyajian data geografis yang memungkinkan suatu sistem informasi geografis dioperasikan.
Apa saja cara dalam pendistribusian software SIG?
9. Model data SIG dimaksudkan untuk merepresentasikan aspek geografis dari dunia nyata dan
mendefinisikan jenis operasi geografis yang digunakan. Terdapat berbagai model untuk data SIG,
apa saja model data itu dan berikan penjelasannya?
10. Generalisasi adalah proses penyederhanaan yang melibatkan tindakan untuk mendapatkan
informasi esensi sesuai tingkat detail dan periode waktu yang diinginkan dengan membuang
informasi yang tidak diinginkan. Jelaskan jenis-jenis aturan generalisasi menurut McMaster &
Shea.

PEMBAHASAN
1. Sistem Informasi Geografis dapat diartikan dalam beberapa perspektif, dua di antaranya yaitu
perspektif SIG sebagai sistem dan SIG sebagai sains.
- Dari perspektif SIG sebagai sistem, SIG dapat diartikan sebagai alat berbasis komputer yang
untuk meningkatkan efisiensi dan efektivitas penanganan informasi tentang objek dan
peristiwa geografis dengan mengumpulkan, menyimpan, memproses, menganalisis, dan
memvisualisasikan informasi geografis tersebut .
- Dari perspektif SIG sebagai sains, SIG mencakup konsep, prinsip, dan metode yang diterapkan
dengan memanfaatkan alat dan teknik SIG. SIG juga menyediakan kerangka kerja untuk bukti
baru, pengetahuan, dan kebijaksanaan tentang bumi. Sebagai metode untuk memperoleh
pengetahuan baru, SIG sebagai sains harus memperhatikan kaidah :
• Transparansi asumsi dan metode;
• Objektivitas dan independensi;
• Kemungkinan replikasi;
• Validitas; dan

287
• Generalisasi
2. Autokorelasi spasial merupakan ukuran tentang kemiripan lokal dan atribut. Macam
autokorelasi spasial sebagai berikut.
- Autokorelasi spasial positif , yaitu pola di mana fitur memiliki kemiripan lokasi dan kemiripan
atribut(sejalan dengan Hukum Tobler).
- Autokorelasi spasial negatif, yaitu pola di mana fitur yang berdekatan dalam ruang memiliki
atribut yang cenderung berbeda dibanding fitur yang jauh (berlawanan dengan Hukum
Tobler).
- Autokorelasi spasial nol(0), yaitu ketika nilai atribut tidak ada ketergantungan dengan lokasi
fitur.
3. Terdapat tujuh teknik sampling yang digunakan dalam menangani masalah-masalah spasial.
Teknik-teknik tersebut yaitu sebagai berikut.
- Simple random sampling
Pemilihan n sampel dari populasi berukuran N dalam batas wilayah yang telah ditetapkan
sebagai wilayah populasi dilakukan secara acak sederhana. Kelemahan: ada kemungkinan
sampel terpilih berada di lokasi yang sulit disurvei.
- Systematic spatial sampling
Perlu dihitung interval k=N/n dan tiap elemen ke-k dipilih menjadi sampel. Secara spasial,
interval diterjemahkan dengan kisi-kisi(grid) berupa garis tegak dan mendatar dengan jarak
sama. Titik perpotongan dua garis tersebut akan menjadi sampel terpilih.
- Stratified random sampling
Wilayah populasi dibagi habis ke dalam n sub wilayah dengan luas yang sama dan setiap sub
wilayah diwakili oleh satu sampel.
- Stratified sampling with random variation in grid spacing
- Teknik ini mirip dengan systematic spatial sampling, hanya saja interval kisinya dibuat
bervariasi.
- Clustered sampling.
Wilayah populasi dibagi ke dalam sub-sub wilayah yang berfungsi sebagai kluster. Pemilihan
dilakukan terhadap sub wilayah, kemudian seluruh elemen pada sub wilayah terpilih
dijadikan sebagai sampel
- Transect sampling
Cocok digunakan untuk wilayah geografis yang berundak. Sampel diambil dari setiap
undakan yang ada
- Contour sampling
Sampel diambil dari setiap kontur di hamparann populasi.
4. Data raster adalah data yang dapat dipandang sama dengan foto digital. Seluruh permukaan peta
dibagi menjadi kisi-kisi yang sangat kecil(pixel). Nilai yang disimpan di setiap pixel merupakan
karakteristik atau informasi yang ada di pixel yang ditemukan di lokasi terkait di permukaan
bumi. Kegunaan utama dari data raster adalah untuk menyimpan informasi peta ke dalam bentuk
citra. Data Vektor adalah data yang dapat dipandang sebagai suatu daftar nilai. Semua objek yang
akan disajikan harus didaftar satu per satu. Setiap objek atau fitur harus dicatat sesuai dengan
bentuknya. Data vektor selain memuat bentuk objek atau fitur juga dapat memuat informasi
tambahan tentang fitur-fitur yang ada di dalam daftar. Informasi tambahan ini disebut sebagai
atribut, yang merepresentasikan karakteristik, ciri, atau sifat dari fitur sesuai dengan konteksnya.
Perbedaan kedua data tersebut yaitu

288
Permasalahan Raster Vektor
Volume Data Bergantung ukuran sel Bergantung pada kepadatan
simpul.
Sources of data - Penginderaan jauh - Data sosial
- Perbandingan/ - Data yang berhubungan
perumpamaan dengan lingkungan
Penggunaan Sumber daya dan Sosial, ekonomi, dan
lingkungan administratif
Software - Raster GI System - Vector GI System
- Pengolahan citra - Variabel kartografi
otomatis
Resolusi Tetap Berubah-ubah
5. Sistem garis lintang (latitude) dan garis bujur (longitude) merupakan sistem yang komprehensif
dan disebut sebagai sistem koordinat geografis.
- Garis lintang (𝜆) garis yang tegak lurus dengan sumbu bumi. Garis lintang yang berada di
tengah Kutub Utara dan Selatan disebut juga garis ekuator (garis lintang 0°. Rentang nilai
garis lintang yaitu -90 ≤ 𝜆 ≤ 90 di mana nilai negatif menunjukkan lintang selatan (LS) dan
positif menunjukkan lintang utara(LU).
- Garis bujur (𝝓) adalah garis yang melintasi Kutub Utara dan Selatan dan membagi bumi
menjadi belahan bumi timur(BT) dan barat(BB) sama luas. Garis bujur 0° (bujur utama)
terletak di Greenwich. Dalam SIG penyimpanan dilakukan dengan bentuk derajat desimal di
mana BB bernilai negatif dan BT bernilai positif, memiliki rentang -180 ≤ 𝝓 ≤ 180.
Konversi dari sistem penulisan DMS ke sistem derajat desimal untuk kedua garis tersebut
yaitu
𝑚𝑒𝑛𝑖𝑡 𝑑𝑒𝑡𝑖𝑘
𝐷𝐷 = 𝑑𝑒𝑟𝑎𝑗𝑎𝑡 + ( )+( )
60 3600
6. Berdasar karakteristik yang dipertahankan, proyeksi dibedakan jadi tiga yaitu
- Conformal → mempertahankan bentuk dari fitur-fitur (utamanya yang kecil) di permukaan
bumi. Sesuai dengan keperluan navigasi.
- Equal area → mempertahankan luas wilayah dari fitur-fitur permukaan bumi.
- Equidistant → mempertahankan jarak yang sama antara permukaan bumi dan hasil proyeksi.
Berdasar bentuk permukaan kertas, proyeksi dibedakan menjadi :
- Cylindrical → dilakukan seolah ‘membungkus’ bumi dengan kertas proyeksi yang dibentuk
serupa tabung. Proyeksi ini dapat dikelompokkan menurut posisi relatif : mercator (sejajar
kutub utara – selatan), transvere mercator(sejajar ekuator), dan oblique(kertas miring).
- Azimuthal → proyeksi ke kertas dasar.
- Conic → bentuk proyeksi menyerupai kerucut.
7. Tingkatan arsitektur software SIG :
- Data Management, yaitu pengorganisasian file, basis data, dan web services.
- Tools, yaitu mendefinisikan kapabilitas dan fungsionalitas SIG untuk pengolahan data.
- User interface, yaitu sekumpulan menu, toolbar, dan kontrol terintegrasi untuk mengakses
tools penanganan informasi geografis.
8. Berbagai cara pendistribusian software SIG, yaitu :
- Shareware → berbayar setelah masa percobaan;
- Liteware → sebagian kapabilitas fungsinya dimatikan;
- Freeware → gratis dengan pembatasan hak cipta;
- Public domain → gratis tanpa pembatasan; dan

289
- Open-source → kode diberikan dengan persetujuan open-source license.
9. Terdapat berbagai model data geografis, model-model tersebut yaitu sebagai berikut.
- CAD → menggunakan representasi simbolis berupa titik, garis, dan area.
- Kartografi Komputer → untuk memenuhi kebutuhan peta kertas topografis dan tematik
sederhana.
- Image Processing → merepresentasikan dunia nyata di permukaan bumi dengan hasil pindai
foto udara dan citra satelit.
- Raster → merepresentasikan objek dunia nyata menggunakan array dari sel atau pixel.
- Vektor → mengasosiasikan objek diskrit dan mengklasifikasikan objek berdasar jenis
geometrinya (titik, garis, area, atau bidang).
- Jaringan → memodelkan arus barang dan jasa dengan dua jenis jaringan yaitu radial atau
looped.
- Triangulated Irregular Network(TIN) → merepresentasikan permukaan kontinu yang
seluruhnya terdiri dari segitiga.
10. Jenis aturan generalisasi (menurut McMaster & Shea) adalah sebagai berikut.
- Penyederhanaan, yaitu membuat bentuk yang lebih sederhana, misalnya dengan
menghilangkan titikk-titik di garis luar poligon.
- Smoothing, yaitu penggantian bentuk yang taja, dan kompleks dengan yang lebih halus.
- Collapse, yaitu penggantian objek area dengan kombinasi objek titik dan garis.
- Agregasi, yaitu penggantian sejumlah besar objek bersimbol berbeda dengan sejumlah kecil
simbol baru.
- Amalgamation, yaitu penggantian beberapa objek area dengan objek area tunggal.
- Merging, yaitu penggantian beberapa objek garis dengan jumlah objek garis yang lebih
sedikit.
- Refinement, yaitu penggantian pola objek yang kompleks dengan pilihan yang
mempertahankan bentuk umum pola.
- Exageration, yaitu pembesaran relatif dari suatu objek untuk mempertahankan
karakteristiknya jika karakteristik ini akan hilang apabila objek diperlihatkan skala.
- Enhancement, yaitu perubahan ukuran fisik dan bentuk simbol.
- Perpindahan, yaitu perpindahan benda dari posisi sebenarnya untuk mempertahankan
visibilitas dan kekhasan mereka.

290

Anda mungkin juga menyukai