Anda di halaman 1dari 16

Nama : Inayah Aini Amirullah

NIM : 200112501017
Kelas : 01/A

RANGKUMAN VARIANSI 4

Minggu, 09 Oktober 2022

1. Pendahuluan
Pengetahuan dasar sebelum mempelajari SEM
• Regresi Linear
Metode statistika yang digunakan untuk menyelidiki dan memodelkan hubungan
linear antara variabel dependen y, dan independent X.

• Analisis Jalur
Pengembangan regresi linear yang menjelaskan hubungan langsung dan tak
langsung antara variabel eksogen (independent) dan endogen (dependen).

• Analisis Faktor
Metode statistika yang digunakan untuk menguji kelompok variabel, dihipotesiskan
secara teoritis, yang menggambarkan hal/faktor yang sama. Pendekatan pemodelan
untuk mempelajari konstruksi hipotesis, faktor, dengan menggunakan berbagai
indikator yang dapat diamati/diukur secara langsung (Raykov & Marcoulides, 2006).
a. Exploratory Factor Analysis, EFA
- Analisis faktor yang digunakan ketika perhatian penelitian adalah penentuan
berapa banyak faktor/konstruksi laten, yang diperlukan untuk menjelaskan
dengan baik hubungan di antara serangkaian variabel yang teramati (Raykov &
Marcoulides, 2006).
- Metode statistic yang digunakan untuk menemukan satu konstruksi atau faktor
laten dari sejumlah besar item survei atau variabel yang diamati (Whittaker &
Shumacher, 2022).
- Bertujuan untuk menyusun konsep/teori.
b. Confirmatory Factor Analysis, CFA
- Analisis faktor yang digunakan ketika perhatian penelitian adalah pengujian
seberapa baik suatu faktor/konstruksi laten diukur menggunakan variabel
indikator.
- Bertujuan untuk mengonfirmasi/meng-evaluasi teori.

2. Structural Equation Modeling

3. Diagram dan Persamaan


a. Structural Equation Modeling (SEM)
b. Measurement Model Var. Laten Eksogen

c. Measurement Model Var. Laten Endogen

4. Asumsi Model SEM


a. Konsep Dasar
- Structural Equation Modeling dikembangkan oleh Jӧreskog (1973) dengan
pendekatan covariance yang dikenal sebagai covariance-based SEM (CBSEM).
- SEM merupakan metode analisis yang digunakan untuk menggambarkan pola
hubungan linear antara indikator dan variabel latennya (Schumacker dan Lomax
2010).
- Model CBSEM bersifat confirmatory
- SEM merupakan model yang memuat hubungan:
• Variabel laten (construct, factor): variabel yang tidak dapat diukur secara
langsung
• Variabel pangamatan (manifest, proxy, indicator): gejala dari variabel laten yang
dapat diukur secara langsung
• Error (galat): kesalahan dari hasil pengukuran
- Gabungan regresi linear, analisis jalur dan analisis faktor.

b. Komponen Model SEM


a) Model Pengukuran (outer)
- Model yang menghubungan variabel laten dengan variabel indikator.
- Menggunakan konsep confirmatory factor analysis.
b) Model Struktural (inner)
- Model yang menghubungkan variabel laten dengan variabel indikator.

c. Perumusan Model SEM


a) Variabel Laten
- Digambarkan dalam bentuk oval.
- Variabel laten endogen ( η), eta.
- Variabel laten eksogen ( ξ ) ksi.

b) Variabel Manifes
- Digambarkan dalam bentuk persegi (panjang).
- Variabel laten untuk variabel laten endogen, y.
- Variabel laten untuk variabel laten eksogen, x.

c) Jenis Hubungan
- Pengaruh →
- Korelasi ↔

d) Model Pengukuran (outer)


- Loading antara laten dengan manifes (λ), lambda
- Untuk variabel eksogen (λx) dan untuk variabel endogen (λy)
- Kesalahan pengukuran untuk variabel eksogen (δ), delta
- Kesalahan pengukuran untuk variabel endogen (ε), epsilon

e) Model Struktural (inner)


- Pengaruh variabel endogen ke endogen sebesar (β), lambda
- Pengaruh variabel eksogen ke endogen sebesar (γ), gamma
- Covarians antar variabel laten (Φ), phi
- Galat struktural ( ζ ), zeta

d. Diagram Jalur

e. Persamaan Diagram Jalur


a) Model Pengukuran (outer)

b) Model Struktural (inner)


f. Asumsi Model SEM
a) Ukuran sampel
- Ukuran sampel (n) adalah minimal 100 untuk kebutuhan pendugaan parameter,
n bersifat acak.
- Ukuran sampel (n) sebanyak 5 – 10 kali variabel manifes dari keseluruhan
variabel laten.
- Ukuran sampel (n) sebanyak 5 – 10 kali banyaknya parameter.

b) Normalitas dan linearitas


- Galat menyebar normal.
- Hubungan antar estimated parameter bersifat linear.

c) Outlier
- Tidak terdapat pengamatan yang ekstrim, univariat maupun multivariat.

d) Multikolinearitas dan singularitas


- Determinan matriks covarians yang sangat kecil mengindikasikan adanya
multikolinearitas.
- Determinan matriks covarians sama dengan nol mengindikasikan adanya
singularitas.

g. Tahapan Penggunaan SEM


1) Mengembangkan model, konsep dan teori
- Mengkaji konsep/teori yang dapat digunakan sebagai dasar penyusunan
hubungan sebab-akibat dari variabel eksogen (bebas, independen) dengan
variabel endogen (terikat, dependen).
- Model hipotetik/konseptual/teoritis dapat berdasarkan hasil kajian sehingga
landasan teori harus kuat.
2) Menguji parameter
Uji-t digunakan pada:
- Parameter λ untuk validitas instrument
- Parameter δ dan ε untuk realibilitas instrument
- γ untuk pengaruh eksogen endogen
- 𝛽 untuk pengaruh endogen endogen
3) Menguji model pengukuran
- Koefisien korelasi digunakan untuk uji validitas
- Nilai error digunakan untuk uji realibilitas
4) Menguji model structural
- Koefisien determinasi (R2) sebagaimana pada regresi linear
5) Menguji model keseluruhan
- Integrasi model pengukuran dan structural
6) Mengevaluasi model

Bukti Kehadiran
RANGKUMAN VARIANSI 4

Senin, 10 Oktober 2022

Manfaat pelaksanaan transformasi proses bisnis statistika


1. Perbaikan Tata Laksana proses bisnis statistika
2. Efisiensi proses bisnis statistika
3. Pemanfaatan big data, sebagai salah satu sumber potensial dalam menghasilkan official
statistic

MODERNISASI PRODUK STATISTIK


Pemanfaatan Sumber Data Baru: BIG DATA
• Mampu menghasilkan data secara near real-time
• Melengkapi data-gap untuk statistic resmi negara (Official Statistics) yang tidak mempu
disediakan oleh sumber data tradisional
• Memberikan informasi pendukung untuk memperkuat hasil official statistics
Small Area Estimation (SAE)
Pengembangan indikator dan modeling statistik dalam memperkuat metodologi pada
area sampling dan estimasi. Penggunaan SAE dapat menghemat biaya pelaksanaan kegiatan
statistik.
Geospatial Statistics
The global statistical geospatial merupakan integrasi statistic dan geospasial digunakan
pada berbagai proses dalam penyelenggaraan statistik.

TANTANGAN: Pemenuhan terhadap 10 Prinsip Dasar Official Statistics


- Prinsip relevansi, ketidakberpihakan, dan kesetaraan akses
- Prinsip standar professional, prinsip, ilmiah, dan etika profesi
- Prinsip akuntabilitas dan transparasi
- Prinsip pencegahan penyalahgunaan
- Prinsip sumber statistik official
- Prinsip kerahasiaan
- Prinsip legislasi
- Prinsip koordinasi nasional
- Prinsip penggunaan standar internasional
- Prinsip kerjasama internasional

BIG DATA INITIATIVES AND DEVELOPMENTS IN BPS


Web-crawling
• Marketplace → E-commerce Data
• Flight tracker, bus booking site → transportation analitycs
• Job vacancy site → labara analysis
• Online booking site and review → room occupancy rate, number of tourist, et
• Air quality, weather reporting site → enviromental and disaster statistics
• Mobil123, rumah123 → property and vehicles statistics
Complementary information untuk official statistics
“increasing people mobality: signal for economic recovery”
“availability of job vacancy is associated with unemployment”

DIGITAL ECONOMY
1. Marketplace data shifting by product category in the online marketplace
2. Consumer price index official

Pengembangan small area estimation


• Tuntutan dan kebutuhan ketersediaan data sampai area kecil semakin meningkat dari waktu
ke waktu.
• Direct estimation dari data survey pada area kecil (ukuran sampel tidak cukup)
menghasilkan standard error (kesalahan baku) yang besar, akibatnya RSE nya juga akan
besar.
• Menambah jumlah sampel berakibat meningkatnya biaya, waktu, tenaga, meningkatnya
nonsampling error, dsb.
• Metode Small Area Estimation (SAE) dikembangkan untuk mengatasi permasalahan
kurangnya ukuran sampel di area kecil.
• SAE dibutuhkan untuk meningkatkan efektivitas ukuran sampel dan meningkatkan efisiensi
pendugaan parameter.
INOVASI SAE : Pengembangan Model
• Menerapkan big data sebagai auxiliary variable.
• Menggunakan data survey sebagai auxiliary variable.
• Memperkuat direct estimation dengan suatu model. Misalnya model direct estimates dari
data susenas MSBP dikapitalisasikan di Susenas KOR sehingga direct estimatesnya lebih
baik.

INOVASI SAE : R-Package


• Membangun R-Package untuk SAE yang memudahkan user. Ada lebih dari 20 R-Package
yang dihasilkan oleh dosen Polstat STIS bekerjasama dengan mahasiswa. Semuanya sudah
dirilis di CRAN https://cran.r-project.org
• Diantara R-Package ‘msae’ berhasil masuk di R Journal (Scopus Q1)
• Package ‘msae’ dan ‘saeME’ sering disebut dalam forum SAE internasional oleh ahli SAE
top dunia.
• R-Package SAE tsb sudah mampu menangani pola data tidak normal, wilayah tidak
tersampel, auxiliary variabel yang mengandung kesalahan pengukuran, pengaruh spasial,
data panel, pengaruh overdispersi, pengaruh efek nilai nol, dsb.

Penerapan SAE di bps


• Povety mapping tahun 2002
• Food Security and Vulnerability Atlas (Peta Kerawanan Pangan) tingkat kecamatan tahun
2018-2021. Kerjasama BPS, Badan Pangan Nasional dan World food Programme(WFP)
• Metropolitan Statistical Area (MSA) di Cekungan Bandung tahun 2019 dan Banjar Bakula
tahun 2021.
• Perhitungan Prevalensi Stunting level kabupaten/kota tahun 2021.
• Perhitungan indikator SDG’s level kabupaten/kota (13 indikator) tahun 2018-2021.
• Perhitungan indeks Perlindungan Anak (IPA), IPHA dan IPKA Level kabupaten/kota tahun
2020 dan 2021.

Small Area Estimation, Big Data, dan Measurement Error


• Mengkombinasikan data survey dengan berbagai jenis sumber peubah penyerta :
Big data atau survey lain.
Potensi Deep Learning untuk Identifikasi Karakteristik Wilayah

Urban/Rural Wealth Index


Good
Human Performance
Settlement Activity Deep Learning
Volume Classification (No
Index Interpretable
Model)
Income, Overcrowding
and Environment

Tujuan Kajian
1. Membangun model klasifikasi karakteristik desa (klasifikasi urban/rural dan Indek Desa
Membangun) : deep learning citra satelit dengan mempertimbangkan kombinasi input level
dan neighboring effect di provinsi Jawa Barat.
2. Mengevaluasi model decision dan human decision untuk menginterpretasi model deep
learning dengan teknik interpretable machine learning.

Machine Learning Model


1. Input
2. Feature extraction
3. Classification
4. Output

Deep Learning Model


1. Input
2. Neural Networks
3. Output
- Arsitektur deep learning yang digunakan pada penelitian ini adalah Resnet (2016) dan
Densenet (2017).
- Kedua arsitektur dapat mengatasi degredation problem yang terjadi ketika model CNN
dilatih untuk layer yang lebih dalam. Resnet mengatasi permasalahan dengan shortcut
connection dan Densenet mengatasinya dengan dense connectivity.
Desa : Urban/Rural
- Desa adalah wilayah administrasi terendah dalam hierarki pembagian wilayah administasi
Indonesia di bawah kecamatan.
- Desa Urban/Rural diklasifikasikan dengan persyaratan tertentu : kepadatan penduduk,
persentase keluarga pertanian, dan keberadaan/akses ke fasilitas.
- Persyaratan tersebut dikumpulkan 10 tahun sekali melalui sensus penduduk.
- Desa urban/rural ditentukan dengan skoring : desa dengan kepadatan penduduk tinggi,
presentasi keluarga pertanian kecil, dan banyaknya keberadaan/akses fasilitas → urban,
selain rural.

Data evaluation : input data level


Pertimbangan tingkat input data terbalik :
- Akurasi dan presisi model dengan tingkat input berbeda tidak memberikan hasil yang
berbeda signifikan untuk klasifikasi urban/rural.
- Input desa memberikan AUC yang lebih baik. Ensemble voting (input SLS) tidak
memberikan klasifikasikan yang lebih baik.
- Untuk itu dipilih model dengan input desa sebagai input terbaik. Input desa juga
membutuhkan komputasi lebih rendah dan lebih mudah diinterpretasika.

STATISTIKA SPASIAL
• Metode statistika yang digunakan untuk menganalisis data spasial.
• Karena berhubungan dengan lokasi, data amatan tidak saling bebas. Ada autokorelasi antar
data amatan (korelasi spasial).
• Data yang berkaitan dengan lokasi.
• Disajikan dalam posisi geografis atau peta.
• Penyajian datanya bisa dengan menggunakan titik, garis atau luasan.
• Dapat berupa data diskrit maupun kontinu.
• Umumnya pendekatan analisisnya : eksplorasi data yang disajikan dalam bentuk peta
tematik.

Tipe Data Spasial


Berdasarkan jenis data, data spasial terbagi 3 (Cressie, 1993) :
1. Pola titik (Point Patterns)
Menunjukkan lokasi yang berupa titik, misalnya berupa:
Longitude dan Latitude.
2. Data Geostatistik (biasa disebut geostatistical data/data line) Continuous spatial surface
Contoh : Arah Aliran Sungai
3. Data area (Polygons or lattice data)
Menunjukkan lokasi yang berupa luasan, seperti suatu Negara, provinsi, kabupaten, kota,
kecamatan dan lainnya.
• Berkaitan dengan wilayah spasial.
• Merupakan kumpulan data atribut diskrit.
• Studi epidemiology umumnya menggunakan data area.
• Wilayah yang diteliti (misalnya kota Makassar dipartisi menjadi sub wilayah
kecamatan).
• Menggunakan data agregat dari sub wilayah.
• Data area lebih mudah tersedia daripada jenis data spasial lainnya.

Pemodelan Data Spasial


1. Berdasarkan Data Spasial Titik :
Data cross-sectional
• Geographically Weighted Regression (GWR) → 𝑌~𝑁(𝜇, 𝜎 2 )
• Geographically Weighted Poisson Regression (GWPR) → 𝑌~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 (𝜆)
• Geographically Weighted Logistic Regression (GWLR) → 𝑌 ~ 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙 (𝑛, 𝑝)
Data Time-Series
• Space-Time Autoregressive (STAR)
• Generalized Space Time Autoregressive (GSTAR)
2. Berdasarkan Data Spasial Area :
Data cross-sectional
• Spatial Autoregressive Model (SAR)
• Spatial Error Model (SEM)
• Spatial Autoregressive Moving Average (SARMA)
• Bayesian Spatial Conditional Autoregressive (CAR) :
a. CAR BYM
b. CAR Leroux
c. CAR log Normal
d. Intrinsic CAR
e. CAR Localised
Data Time-Series
Bayesian Spatio-temporal Conditional Autoregressive (ST CAR) :
a. ST CAR linear
b. ST CAR ANOVA
c. ST CAR Separate Spatial
d. ST CAR AR
e. ST CAR Adaptive
f. ST CAR Localised

Deteksi Spasial
1. Spatial Dependence
• Uji Moran’s I
• Uji Modified Moran’s I (MMI)
• Uji Lagrange Multiplier (LM) : 𝐿𝑀𝑒𝑟𝑟𝑜𝑟 untuk uji dependensi spasial dalam error dan
𝐿𝑀𝑙𝑎𝑔 untuk uji dependensi spasial dalam lag

Masalah Data Spasial Terhadap Regresi Spasial


1. Spatial dependence
Adanya asumsi bahwa antar pengamatan satu dengan yang lain harus independen (error –
independen) :
• Positive spatial autocorrelation melanggar asumsi ini, karena amatan saling berkorelasi
menurut kedekatannya.
• Asumsi error independen terlanggar
2. Spatial heterogeneity
Asumsi ragam error harus homogen (identic) tidak terpenuhi.
Dampaknya :
• Taksiran parameter regresi bias
• Taksiran parameter overestimate

Hukum Tobler
Segala sesuatu memiliki lokasi geografis pasti membentuk pola spasial (Klippel et al., 2011).
• Hokum pertama Geografi dari Tobler merupakan salah satu asumsi dasar teori spasial:
“Everything is related to everything else but near things are more related than distant things”
(Tobler, 1970).

Autokorelasi spasial
Moran’s I :
𝑛 ∑𝑛𝑖=1 ∑𝑛𝑗=1 𝑊𝑖𝑗 (𝑋𝑖 − 𝑋̅)(𝑋𝑗 − 𝑋̅)
𝐼= 𝑛 ,
∑𝑖=1 ∑𝑛𝑗=1 𝑊𝑖𝑗 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
Dimana :
n : banyaknya area
𝑋𝑖 𝑑𝑎𝑛 𝑋𝑗 ∶ nilai observasi pada daerah i dan j
𝑋̅ ∶ rata rata nilai x pada n lokasi/area
𝑊𝑖𝑗 ∶ Matriks pembobot (mengukur jarak spasial antara daerah i dan j) (Oyana and Margai 2015
; Waller 2004)
Matriks Pembobot
• Definisi ketetanggaan yang paling sederhana adalah matriks konektivitas biner sebagai
berikut :
1 𝑗𝑖𝑘𝑎 𝑎𝑟𝑒𝑎 𝑖 𝑑𝑎𝑛 𝑗 𝑏𝑒𝑟𝑡𝑒𝑡𝑎𝑛𝑔𝑔𝑎
𝑊𝑖𝑗 = {
0 𝑙𝑎𝑖𝑛𝑛𝑦𝑎
• 𝑊𝑖𝑗 = 𝑊𝑗𝑖 𝑑𝑎𝑛 𝑊𝑖𝑖 = 0

Konsep matriks ketetanggaan spasial


• Konsep dari matriks ketetanggaan sangat penting dalam eksplorasi data area.
• Beberapa jenis matriks pembobot spasial :
1. Rook contiguity
2. Bishop contiguity
3. Queen contiguity

Konsep autokorelasi spasial


a) Autokorelasi spasial positif
Moran’s I mendekati +1 (pola bekelompok)
b) Tidak berkorelasi
Moran’s I mendekati 0 (Pola acak)
c) Autokorelasi spasial negative
Moran’s I mendekati -1 (Pola menyebar)

Permasalahan untuk jumlah area sedikit


1. Problem
Ketika jumlah area sedikit, statistic Moran’s I cenderung underestimate (Carrijo and da
silva, 2017).
2. One possible Solution
• Modifikasi Moran’s I yang diusulkan oleh Carrijo and da silva (2017) dapat mengukur
autokorelasi spasial bahkan untuk jumlah area yang sedikit.
• Moran’s I dapat “underestimate” ketika digunakan pada daerah yang jumlahnya kecil.
• Hal ini berpotensi mempengaruhi besarnya autokoralasi spasial dan bahkan tandanya
(negative/positif).
• MMI adalah pendekatan yang direkomendasikan untuk mendapatkan ukuran
autokorelasi spasial yang lebih akuran ketika ada sejumlah kecil area

Bukti Kehadiran

Anda mungkin juga menyukai