net/publication/358460661
CITATIONS READS
5 3,845
1 author:
SEE PROFILE
All content following this page was uploaded by Pardomuan Robinson Sihombing on 09 February 2022.
Ketentuan Pidana
Pasal 72:
1. Barang siapa dengan sengaja dan tanpa hak melakukkan perbuatan sebagaimana dimaksud dalam
pasal 2 ayat (1). Atau pasal 49 ayat (1). Dan ayat (2). Dipidana penjara masing-masing paling singkat
1 (satu) bulan dan/atau denda paling sedikit Rp. 1.000.000,- (satu juta rupiah) atau pidana penjara
paling lama 7 (tujuh) tahun dan/atau denda paling banyak Rp. 5.000.000.000,00- (lima miliar rupiah)
2. Barang siapa dengan sengaja menyiarkan, memamerkan, mengedarkan, atau menjual kepada umum
suatu ciptaan atau barang hasil pelanggaran Hak Cipta atau Hak Terkait sebagaimana dimaksud
dalam ayat (1)., dipidana dengan pidana penjara paling lama 5 (lima) tahun dan/atau denda paling
banyak Rp. 500.000.000,- (lima ratus juta rupiah).
Aplikasi Stata Untuk Statistisi Pemula
Jl. Raya Cilangkap No. 1 RT/RW 006/012 Kel. Cilangkap, Tapos, Depok, Jawa Barat 16458
Telp: 0811-3222-654 | Email: penerbitgemala@gmail.com
Facebook: Penerbit Gemala | Website: www.gemala.co
Penulis
Daftar Isi
Kata Pengantar _________________________________________ v
Daftar Isi_______________________________________________ vi
Pengenalan STATA_______________________________________ 1
Statistik Deskriptif_______________________________________ 3
1._ Untuk data kuantitatif/ metrik/ numerik_____________ 3
2._ Untuk data kualitatif/ nonmetric/ label/atribut_______ 4
3._ Kombinasi Data Kuantitatif dan Kualitatif____________ 5
4._ Kombinasi Data Kualitatif/ Kategorik dengan Tabulasi
Silang (CossTab)_________________________________ 6
5._ Analisis Cluster__________________________________ 7
6._Biplot __________________________________________ 10
Statistik Inferensia_______________________________________ 11
Uji Komparasi___________________________________________ 13
1._ Uji Varian/ Ragam________________________________ 13
2._ Uji Rata-rata/ Mean Aritmatic dan Uji Median________ 17
3._ Uji Proporsi_____________________________________ 28
Uji Pembeda/ Analisis Diskriminan_________________________ 31
Uji Korelasi_____________________________________________ 33
1._ Korelasi Pearson_________________________________ 33
2._ Korelasi Spearman________________________________ 35
3._ Korelasi Kendall__________________________________ 36
4._ Korelasi Poin Biserial_____________________________ 37
viii Aplikasi Stata Untuk Statistisi Pemula
menu: File > Open (Ctrl O) jika data yang kita gunakan sudah
disimpan dalam bentuk format .dta. Sedangkan untuk format
lainnya dapat menggunakan menu: File > Import > Pilih format
data yang akan dimasukkan dalam STATA misalkan data berasal
dari spss (.sav), dari excel (.xls), SAS dan lainnya.
Selain itu kita juga dapat memasukkan data yang sudah dicopi
dari excel lalu, mengetik sintaks “edit” dan enter untuk
membuka data editor, lalu paste data dengan “varaibel name”
Statistik Deskriptif
Menurut Walpole ( 2012), statistika deskriptif dapat diartikan
sebagai metode yang berkaitan dengan pengumpulan dan penyajian
suatu data sehingga memberikan informasi yang berguna.
Sedangkan menurut Sugiono (2017) statistik deskriptif berfungsi
untuk mendeskripsikan atau memberi gambaran terhadap objek
yang diteliti melalui data sampel atau populasi. Gambaran dapat
berupa ukuran pemusatan/ tendency (rata-rata, median, modus,
proporsi), ukuran letak/ posisi (kuartil, desil, persentil) maupun
ukuran dispersi/ keragaman data (jangkauan/ range, standar deviasi
dan varian/ ragam).
Output:
5. Analisis Cluster
Analisis cluster (klaster/ gerombol) adalah salah satu metode
dalam analysis multivariat. Analisis ini terkadang dimasukkan
ke dalam analisis deskriptif karena tidak
mengandung unsur hipotesis dan hasilnya tidak unik. Analisis
cluster bertujuan mengelompokkkan unit-unit/ subjek berdasarkan
kemiripan, baik kedekatan jarak maupun kemiripan
korelasi antar variabel. Ada berbagai teknik pengelompokan data
berdasarkan kedekatan jarak seperti jarak cartesian, jarak
mahalanobis, jarak Blok Mahakam,
blok chebychev dan lainnya. Pada umumnya analisis klaster
dibagi dua metode yaitu metode hierarki dan metode non hierarki
(Johnson & Wichern, 1998). Metode hierarki (metode single linkage,
average linkage, complete linkage dan lainnya) akan membentuk
klaster maksimal sebanyak jumlah objek sedangkan pada metode
non hierarki (k-means dan k-median) berdasarkan jumlah yang
diinginkan peneliti (dalam hal ini berdasarkan teori yang ada atau
lanjutan dari uji hierarki). Hal yang perlu diperhatikan dalam
analisis klaster adalah satuan, jika satuan satuan antar variabel terlalu
8 AplikAsi stAtA UntUk stAtistisi pemUlA
berbeda maka sebaiknya gunakan nilai standar dari data yang ada.
Dalam analisis klaster pada umumnya data yang digunakan adalah
data numerik/ kuantitatif, jika terdapat data kategorik/ kualitatif
maka sebaiknya menggunakan teknik two step klaster. Adapun
langkah pengujian, dengan menggunakan menu stata:
Statistics > Multivariate analysis > Cluster analysis > Cluster data
Untuk data contoh pada pengujian klaster dapat didownload
di link berikut:
shorturl.at/duIX1
Misalkan kita akan Output
mengelompokkan kabupaten 1. Cluster Hirarki
Dendrogram for kab_kot cluster analysis
kota di Bali dengan indiaktor
2
1
3
0
L2 dissimilarity measure
7
4
2
1
5
9
8
6
3
6. Biplot
Analisis biplot adalah salah satu metode dalam analysis
multivariat, yang digunakan untuk menyajikan secara simultan
n obyek pengamatan dan P variabel dalam ruang bidang datar,
sehingga ciri-ciri variabel dan obyek pengamatan serta posisi relatif
antar obyek pengamatan dengan variabel dapat dianalisis. Analisis
ini terkadang dimasukan ke dalam analisis deskriptif karena tidak
mengandung unsur hipotesis dan hasilnya tidak unik. Adapun
langkah pengujian, dengan menggunakan menu stata:
Statistics > Multivariate analysis > Biplot
Untuk data contoh pada pengujian biplot dapat didownload di
link berikut: shorturl.at/duIX1
Misalkan kita akan menyajikan data kabupaten kota di
Bali dengan indiaktor sosial ekonomi seperti ipm, gini,
kemiskinan, dan tpt.
Dengan
menggunakan
Sintaks:
* swilk varname Karena nilai sign.prob value=0.5896 > alpha
swilk gini2021 (0.05) maka tidak tolak Ho dan disimpulkan
bahwa variance data=0.0016 atau standar
* sdtest varname == deviasinya=0.04
value, level(value)
sdtest gini2021 ==
0.04, level (95)
Pardomuan Robinson Sihombing, SST, M.Stat 15
* using 2 variable in 2
coloum
* sdtest varname1 == Karena nilai sign.prob value=0.5935 > alpha
varname2 (0.05) maka tidak tolak Ho dan disimpulkan
bahwa varian/ ragam kedua populasi sama/
* using group homogen
* sdtest varname,
by(groupvar) level(value)
sdtest gini2021, by(kode)
16 AplikAsi stAtA UntUk stAtistisi pemUlA
*robvar varname,
by(groupvar)
robvar miskin2021, Karena nilai sign.prob value=0.116 > alpha (0.05)
by(type) maka tidak tolak Ho dan disimpulkan bahwa
varian/ ragam ketiga populasi sama/ homogen
Pardomuan Robinson Sihombing, SST, M.Stat 17
Dengan
menggunakan
Sintaks:
* swilk varname
swilk gini2021
* ttest varname Karena nilai sign.prob value=0.5631 > alpha (0.05)
== value, maka tidak tolak Ho dan disimpulkan bahwa rata-rata
level(value) data=0.35
ttest gini2021
== 0.35, level
(95)
Misalkan akan Output:
diteliti apakah 1. Uji Normalitas Data
median nilai
persentase
kemiskinan
34 Provinsi di
Indonesia tahun
2021 sama Karena nilai sign.prob value=0.001 < alpha (0.05) maka
dengan 10 persen tolak Ho dan disimpulkan bahwa bahwa data belum
berdistribusi normal
Pardomuan Robinson Sihombing, SST, M.Stat 19
* sdtest varname,
by(groupvar)
Karena nilai sign.prob value=0.4166 > alpha (0.05)
level(value)
maka tidak tolak Ho dan disimpulkan bahwa rata-rata
sdtest gini2021,
kedua populasi sama
by(kode)
* using 2 variable
in 2 coloum
* ttest varname1
== varname2
* using group
* ttest varname,
by(groupvar)
level(value)
ttest gini2021,
by(kode)
Pardomuan Robinson Sihombing, SST, M.Stat 21
* ranksum
varname,
by(groupvar) Karena nilai sign.prob value=0.0173 < alpha (0.05)
ranksum maka tolak Ho dan disimpulkan bahwa median ipm
ipm2021, by kedua populasi data berbeda
(kode)
22 AplikAsi stAtA UntUk stAtistisi pemUlA
* ttest varname1
== varname2 Karena nilai sign.prob value=0.000 < alpha (0.05) maka
ttest ipm2021 tolak Ho dan disimpulkan maka dikatakan bahwa rata-
== ipm2020 rata IPM tahun 2021 dan 2020 berbeda
Pardomuan Robinson Sihombing, SST, M.Stat 23
* kwallis varname
groupvar
kwallis
miskin2021,
by(type)
Pardomuan Robinson Sihombing, SST, M.Stat 27
Dengan
menggunakan
Sintaks:
*mvtest normality
varname1… Karena nilai sign.prob value=0.0010 < alpha
varnamek (0.05) maka tolak Ho dan disimpulkan bahwa
mvtest normality tingkat persentase ipm ketiga data dianggap
ipm2021 ipm2020 tahun 2021 dan 2020 ada yang beda.
*mvtest covariances
4. uji pos hoc selanjutnya menggunakan ANOVA
varname1…
varnamek
mvtest covariances
ipm2021 ipm2020
3. Uji Proporsi
Pengujian proporsi digunakan untuk membandingkan apakah
proporsi suatu kategori sama terhadap nilai yang dihipotiskan
(untuk uji 1 populasi) maupun apakah proporsi suatu kategori sama
terhadap dua populasi yang berbeda. Uji proporsi menggunakan ui
z (Walpole, 2012) .
Dengan menggunakan menu stata:
Statistics > Summaries, tables, and tests > Classical tests of
hypotheses > Proportion test
Pardomuan Robinson Sihombing, SST, M.Stat 29
Dengan
menggunakan
Sintaks: Karena nilai sign.prob value=0.7150 > alpha
* prtest varname == (0.05) maka tidak tolak Ho dan disimpulkan
value test bahwa proporsi pria =0.5
prtest gendera ==
0.5
Dengan menggunakan
Sintaks:
Karena nilai sign.prob value=0.2918 > alpha
# prtest varname ==
value test (0.05) maka tidak tolak Ho dan disimpulkan
prtest gendera == 0.5 bahwa proporsi pria di kota A sama dengan di
kota B.
30 AplikAsi stAtA UntUk stAtistisi pemUlA
Dengan menggunakan
Sintaks:
* chitesti n1 n2 n4 … nk
chitesti 25 20 15 40
Uji Pembeda/ Analisis Diskriminan
Analisis diskriminan merupakan salah satu jenis analisis
dalam statistic multivariat. Dalam analisis diskriminan bertujuan
mengetahui variabel apa saja yang mampu membedakan kategori
dua atau lebih populasi. Selain itu dalam analisis ini akan terbentuk
persamaan diskriminan yang dapat memprediksi klasifikasi dari
sampel yang ada maupun sampel yang baru. Dalam hal ini variabel
dependennya berupa data kategorik sedangkan variabel independen
berupa data numerik. Adapun syarat dalam analisis diskriminan
adalah variabel independent berdistribusi multivariat normal
(Johnson & Wichern, 1998). Dengan menggunakan menu stata:
Statistics > Multivariate analysis > Discriminant analysis > Linear
(LDA)
Untuk data contoh pada pengujian diskriminan dapat
didownload di link berikut: shorturl.at/muAEP
Misalkan akan diteliti Output:
apakah nilai IPM, Asumsi Multivariat Normal
gini dan kemiskinan
mampu membedakan
karakteristik daerah
Sumatera-Jawa dan
Karena nilai sign.prob value=0.0508 > alpha (0.05)
selain Sumatera-Jawa
maka tidak tolak Ho dan disimpulkan bahwa data
berdistribusi normal multivariat
32 AplikAsi stAtA UntUk stAtistisi pemUlA
Fungsi Diskiriman
1. Korelasi Pearson
Korelasi pearson adalah metode hubungan antar variabel
kuantitatif. Syarat data dalam korelasi pearson adalah data
berdistribusi normal dengan pola hubungan linier (Walpole, 2012).
34 AplikAsi stAtA UntUk stAtistisi pemUlA
2. Korelasi Spearman
Korelasi spearsman adalah metode hubungan antar
variabel kuantitatif, dimana datanya tidak harus berdistribusi
normal (Siegel, 1997).
Dengan menggunakan menu stata:
Statistics > Nonparametric analysis > Tests of hypotheses >
Spearman’s rank correlation
Untuk data contoh pada pengujian korelasi spearman dapat
didownload di link berikut: shorturl.at/muAEP
Misalkan akan 1. Uji Normalitas Data
diteliti apakah
ada hubungan
antara ipm dan
miskin tahun
2021
* spearman
varname1
varname2,
stats(p) Besarnya nilai koefisien korelasi sebesar -0.5458
spearman (negatif moderat). Karena nilai sign.prob value=0.000
ipm2021 < alpha (0.05) maka tolak Ho dan disimpulkan bahwa
miskin2021, hubungan ipm dan persentase kemiskinan yang
stats(p) signifikan
36 AplikAsi stAtA UntUk stAtistisi pemUlA
3. Korelasi Kendall
Korelasi kendall adalah metode hubungan antar variabel
kualitatif/ ordinal, dimana datanya tidak harus berdistribusi normal
(Siegel, 1997).
Dengan menggunakan menu stata:
Statistics > Nonparametric analysis > Tests of hypotheses >
Kendall’s rank correlation
Misalkan akan 1. Uji Normalitas Data
diteliti apakah ada
hubungan displin
dan kinerja yang
dikukur dengan
skala ordinal likert
* swilk varname1
varname2
swilk disiplin
kinerja
* ktau varname1
varname2
ktau disiplin
kinerja
Pardomuan Robinson Sihombing, SST, M.Stat 37
Dengan
menggunakan
Sintaks:
5. Korelasi Tetachoric
Korelasi Tetachoric adalah metode hubungan antar variabel
kategori (dikotomos/ binary) yang berskala ordinal (Edwards &
Edwards, 1984).
Misalkan akan Uji Tetracoric
diteliti apakah ada
hubungan antara
status pekerjaan
(karyawan dan
manajer/ direktur)
dengan status
perumahan yang
Nilai koefisien korelasi sebesar 0.3019 (positif
ditempati (kontrakan
lemah). Karena nilai sign.prob value=0.6084
dan perumahan)
> alpha (0.05) maka tidak tolak Ho dan
disimpulkan maka dikatakan bahwa belum
cukup bukti ada hubungan antara status
pekerjaan dengan status perumahan yang
ditempati.
Dengan menggunakan
Sintaks:
* tetrachoric bvar1
bvar2
ssc install
tetrachoric
tetrachoric status
perumahan
Pardomuan Robinson Sihombing, SST, M.Stat 39
6. Korelasi Polychoric
Korelasi Polikhoric adalah metode hubungan antar variabel
berskala ordinal yang berdistribusi normal (Garson, 2013).
Misalkan akan 1. Uji Normalitas Data
diteliti apakah ada
hubungan penilaian
rangking juri 1 dan
juri 2 terhadap 15
peserta audisi
Karena nilai sign.prob value=0.754 > alpha
(0.05) maka tidak tolak Ho dan disimpulkan
maka dikatakan bahwa data berdistribusi
normal
2. Uji Polychoric
Dengan menggunakan
Sintaks:
* polychoric varname1
Nilai koefisien korelasi sebesar 0.97 (positif
varname2
kuat). Karena nilai sign.prob value=0.00 < alpha
ssc install polychoric
(0.05) maka tolak Ho dan disimpulkan bahwa
polychoric juri1 juri2
ada hubungan antara penilaian peringkat juri1
dan juri2.
40 AplikAsi stAtA UntUk stAtistisi pemUlA
7. Korelasi Phi
Korelasi Phi adalah metode hubungan antar variabel berskala
nominal dikothomus/ binary (Garson, 2013).
Misalkan akan diteliti Korelasi Phi
apakah ada hubungan
antara gender
(perempuan dan
laki-laki) dengan jenis
tontonan (sinetron
dan berita)
* phi varname1
varname2
ssc install phi
phi gender tontonan
8. Korelasi Cramer V
Korelasi Cramer V adalah metode hubungan antar variabel
berskala nominal yang berukuran mxm (Garson, 2013).
Dengan menggunakan menu stata:
Statistics > Summaries, tables, and tests > Frequency tables >
Two-way table with measures of association
Pardomuan Robinson Sihombing, SST, M.Stat 41
Dengan menggunakan
Sintaks: Nilai koefisien korelasi sebesar 0.3846 (positif
lemah). Karena nilai sign.prob value=> alpha
* lamda varname1 (0.05) maka tidak tolak Ho dan disimpulkan
varname2, gamma belum cukup bukti ada hubungan antara gender
ssc install lambda dengan jenis tontonan
lamda gender
tontonan
Dengan menggunakan
Sintaks: Korelasi Kanonik
* mvtest normality
varname varname
mvtest normality y1
y2 x1 x2 x3 x4
*canon (setx) (sety)
canon (x1 x2 x3 x4)
(y1 y2)
Dengan menggunakan
Sintaks:
set more off
*deskriptive
* sum y x1 x2 ... xp
sum miskin2021
Karena nilai sign.prob value =0.3223 > alpha
gini2021 ipm2021
(0.05) maka tidak tolak Ho dan disimpulkan
bahwa datanya sudah berdistribusi normal
*run model ols
* regress y x1 x2 ... xp
regress miskin2021
gini2021 ipm2021
*uji hetero
hettest
*uji linearitas
estat ovtest
Karena nilai sign.prob value =0.5477 > alpha
(0.05) maka tidak tolak Ho dan disimpulkan
bahwa varian datanya homogen, bebas asumsi
heterokedastisitas
Pardomuan Robinson Sihombing, SST, M.Stat 47
Dengan menggunakan
Sintaks:
set more off
*deskriptif
tabulate
kelahirankembar
status, cell
tabulate jarakkelahiran Karena nilai sign.prob value =0.1242 > alpha (0.05)
status, cell maka tidak tolak Ho dan disimpulkan modelnya fit
*logistic y x1 x2 ... xp, ii. Uji Ketepan Model
coef
*logistic y x1 x2 ... xp
logistic status
kelahirankembar
jarakkelahiran
logistic status
kelahirankembar
jarakkelahiran, coef
Dengan menggunakan
Sintaks:
set more off
* mlogit y x1 x2 ... xp
* mlogit y x1 x2 ... xp,
err
Dengan menggunakan
Sintaks:
set more off
*poisson y x1 x2 ... xp
*estat gof
Karena nilai sign.prob value =0.3864 > alpha
poisson operasicesar (0.05) maka tidak tolak Ho dan disimpulkan
tipe_rumahsakit jumlah modelnya memenuhi asumsi equidispersi
pasien
estat gof
b. Uji Kebaikan Model
Dengan
menggunakan
Sintaks:
set more off
*intreg y1 y2 x1 x2
... xp • Nilai koefisien read signifikan negatif
intreg lgpa ugpa sedangkan nilai program menunjukkan belum
read prog cukup bukti mempengaruhi interval IPK
mahasiswa
Regresi Beta Pada Data Cross Section
Jika seorang peneliti melakukan pemodelan sebab akibat
dengan variabel dependen berupa data yang nilainya berupa data
rasio/ fraktional dan nilainya tersensor dari 0 hingga maka model
regresi yang tepat adalah model regresi beta (Cook, Kieschnick,
& McCullough, 2008). Adapun langkah pengujian, dengan
menggunakan menu stata:
Statistics > Fractional outcomes > Beta regression
Misalkan akan Uji Kebaikan Model
diteliti pengaruh
tekanan suhu
dan lokasi batch
terhadap proporsi
zat X pada tanah
(yield)
Dengan
menggunakan
Sintaks:
set more off
*betareg y x1 x2 ...
xp i. uji simultan/ uji chi2
betareg yield Ho: tidak ada variabel yang berpengaruh
pressure temp batch H1: minimal 1 variabel independen yang
berpengaruh
Pardomuan Robinson Sihombing, SST, M.Stat 65
Dengan
menggunakan
Sintaks: ii. Fixed Effect Model (FEM)
set more off
*model panel
normal
*set data sebagai
panel data
* xtset crosssection
time series
xtset no tahun
*deskriptive
* sum y x1 x2 ... xp
sum miskin ipm gini
xtsum miskin ipm
gini
*run model pooled/
commond/ols
* regress y x1 x2 ...
xp
regress miskin ipm
gini
68 AplikAsi stAtA UntUk stAtistisi pemUlA
*uji normalitas
sktest resid
*uji hetero
hettest iv. Generalized Estimating Equation (GEE)
*simpam model
estimate store
Karena nilai sign.prob value chi2 =0.000 <
random
alpha (0.05) maka tolak Ho dan disimpulkan
*uji lm bp test model REM lebih baik daripada model CEM
xttest0 ii. Uji Chow Likelihood Ratio Test
Ho: model PEM lebih baik dari FEM
*uji hausman H1: model FEM lebih baik dari CEM
hausman fixed
random
*model gee
*xtreg y x1 x2 ... xp, Karena nilai sign.prob value F =0.000 < alpha
pa (0.05) maka tolak Ho dan disimpulkan model
*simpam model FEM lebih baik daripada model CEM
xtreg miskin ipm
gini
estimate store gee
70 AplikAsi stAtA UntUk stAtistisi pemUlA
Dengan
menggunakan
Sintaks:
set more off Pada periode before (Fen 1992), terdapat
ssc install diff perbedaan jumlah FTE antara New Jersey dan
* diff y, t(treated) Pennsylvania karena prob value T=0.011 < alpa
p(time) (0.05) sehingga tolak Ho. Sedangkan pada periode
diff fte, t(treated) p(t) after belum cukup bukti terdapat perbedaan
jumlah FTE antara New Jersey dan Pennsylvania
karena prob value T=0.979 > alpa (0.05) sehingga
tidak tolak Ho. Interaksi antara treatment dan
periode (efek DiD) signifikan untuk 10 persen.
Analisis Survival
Analisis survival atau terkadang disebut analisis daya tahan
hidup, awalnya digunakan dalam ilmu biomedis di mana tujuannya
mengamati waktu kematian baik pasien atau hewan laboratorium
(Miller, 1997). Perkembangan lebih lanjut digunakan dalam ilmu
sosial untuk menganalisis waktu terjadi suatu peristiwa seperti
perubahan pekerjaan, pernikahan, kelahiran anak, dan sebagainya.
Dalam analisis survival terdapat istilah tersensor. Pengamatan
tersensor didefinisikan sebagai pengamatan dengan informasi
yang tidak lengkap. Ada empat jenis penyensoran yang mungkin:
right truncation, left truncation, right censoring dan left
censoring.
Sebaiknya penulis fokus secara eksklusif pada penyensoran yang
tepat karena sejumlah alasan. Apabila suatu pengamatan disensor
dengan benar berarti informasi tersebut tidak lengkap karena subjek
tidak memiliki suatu peristiwa selama subjek menjadi bagian dari
penelitian. Inti dari analisis kelangsungan hidup adalah mengikuti
subjek dari waktu ke waktu dan mengamati pada saat mana mereka
mengalami peristiwa yang menarik. Adapun langkah pengujian,
dengan menggunakan menu stata:
Statistics > Survival analysis > Regression models > Cox
proportional hazards (PH) model
Pardomuan Robinson Sihombing, SST, M.Stat 77
Dengan menggunakan
Sintaks:
set more off
* pengujian korelasi
Hasil uji KMO dengan nilai 0.787 > 0.7
corr sdm1 sdm2 sdm3 sdm4
menunjukkan bahwa sudah memenuhi
sdm5
* analisis factor kriteria kecukupan sampel dalam analisis
* factor var1 var2 … varp factor
factor sdm1 sdm2 sdm3
sdm4 sdm5 sdm6
scree
*uji kmo
estat kmo
*rotasi Uji
1
Number
3
0
Scree Plot
Scree plot of eigenvalues after factor
2
Eigenvalues
Uji reabilitas
Sintaks yang
digunakan:
set more off
*dea input = output,
Berdasarkan output di astas terdapat
rts(vrs) ort(out)
beberapa institusi yang belum efisien yaitu
stage(1)
yang masih irs
dea ltp ltk = lkelulusan
lpublikasi, rts(vrs)
ort(out) stage(1)
Analisis SEM-PLS (Partial Least Square)
SEM PLS merupakan suatu metode alternatif dalam SEM.
Model SEM PLS tidak memerlukan sampel besar dan tidak
memerlukan asumsi kenormalan data. Dalam SEM PLS digunakan
metode bootstrapping dalam mengestimasi parameter koefisien
regresinya (Hair, Hult, Ringle, & Sarstedt, 2016). Tiga hal yang diuji
dalam SEM-PLS adalah uji outer model (hubungan antara indikator
dna variabel laten), uji inner model (hubungan antara variabel
laten) dan pengujian hipotesis. Dalam uji outer model mencakup uji
validitas (konvergen validity dengan nilai loading dan diskriminan
validity) serta uji reability. Pada pembahasan ini menggunakan data
dan sintaks dari jurnal oleh Venturini dan Mehmetoglu (2019).
Untuk data contoh pada pengujian analisis faktor dapat
didownload di link berikut: shorturl.at/cqO14
84 AplikAsi stAtA UntUk stAtistisi pemUlA
*sem multigroup
plssem (Attractive >
face sexy) ///
(Appearance > body
appear attract) ///
(Muscle > muscle
strength endur) ///
exponensial smoothing
Dengan menggunakan
Sintaks:
set more off
*moving average
tset t
twoway (tsline sales)
tssmooth ma sales_ma111 =
sales, window(1 1 1)
twoway (tsline sales sales_
ma111) b.exponensil
Single
Time
1100
1080
1060
1040
1020
1000
smoothing
exponential forecast with optimal alpha
tssmooth ma sales_ma212 = 010
50
40
30
20
Sales
parms(0.7815) = sales
sales, window(2 1 2)
twoway (tsline sales sales_
ma111 sales_ma212)
*exponential smooting
tssmooth exponential sales_
es1 = sales, forecast(1)
line sales_es1 sales t,
title(“Single exponential
forecast with optimal alpha”)
ssmooth dexponential sales_
des = sales, forecast(2)
line sales_des sales_es1 sales
t, title(“Single dan Double
exponential forecast with
optimal alpha”)
ARIMA dan GARCH Model
Pemodelan dengan satu variabel data deret waktu adalah
metode Autoregressive Integrated Moving Average (ARIMA) dan
Generalized Autoregressive Conditional Heteroscedastic (Garch).
Dalam pemodelan data time series, syarat awal menggunakan model
ARIMA adalah datanya harus sudah stasioner baik dalam rata-rata
maupun dalam varian/ ragam (Wei, 1990). Hal ini dikarenakan
agar tidak menghasilkan model yang superious/lancung/palsu atau
model yang memiliki error yang nilainya besar. Data dan sintaks
digunakan dari Katchova (2013). Adapun langkah pengujian,
dengan menggunakan menu stata:
Statistics > Time series > ARIMA and ARMAX models
Statistics > Time series > ARCH/GARCH > ARCH/GARCH
models
Untuk data contoh pada pengujian ARIMA dan Garch dapat
didownload di link berikut:
shorturl.at/coyHM
90 AplikAsi stAtA UntUk stAtistisi pemUlA
dfuller $ylist, trend Karena nilai sign.prob value t =0.00 < alpha
regress lags(0) (0.05) maka tolak Ho dan disimpulkan data
* dfuller $ylist, regress sudahstationer pada difference 1
lags(2) 3. ACF
0.60
0.40
0.20
0.00
-0.20
Lag
dan PACF
Autocorrelations of D.ppi
Bartlett's formula for MA(q) 95% confidence bands
010
40
30
20
* pac d.$ylist,
xscale(range(0 $lags))
yscale(range(-1 1))
corrgram d.$ylist
ac d.$ylist
pac d.$ylist
* ARIMA models
* ARIMA(1,0,0) or
AR(1)
arima $ylist, arima(1,0,0)
92 AplikAsi stAtA UntUk stAtistisi pemUlA
* ARIMA(1,0,1) or
AR(1) MA(1)
arima $ylist, arima(1,0,1)
* ARIMA on differenced
variable
arima $ylist, arima(1,1,0)
arima $ylist, arima(0,1,1)
arima $ylist, arima(1,1,1)
arima $ylist, arima(1,1,3)
arima $ylist, arima(2,1,3)
Pardomuan Robinson Sihombing, SST, M.Stat 93
*asumsi
predict error, resid
summarize error
tsline error,
yline(0008469)
wntestq error
corrgram error
regress error
estat archlm, lag(1/10)
*forecast
tsappend, add(10)
predict fppi, y
dynamic(q(2002q3))
*arch garch
arch ppi, arch(1/1)
garch(1/1)
Dengan Output:
menggunakan 1. Uji kestationeran pada level
Sintaks: Ho: data tidak stationer pada level
set more off H1: data stationer pada level
*declare data time
series
tsset time
*uji stationeritas
dfuller y
dfuller x
*regresi
regress y x
*asumsi klasik
*uji normalitas
predict resid, r
sktest resid
*uji hetero
hettest
*uji autokol
estat dwatson
estat durbinalt
estat bgodfrey
3. Model ARDL
4. Asumsi Normalitas
*uji jangka
Panjang (ols)
regress roa ihk sbi
*pengujian
kointegrasi Hanya ihk yang signifikan dalam jangka panjang
predict resid, r
dfuller resid 4. Uji Cointegrasi
* model jangka
pendek (ECM)
regress droa dihk
dsbi l.resid
*cek kembbali lag yang Karena nilai sign.prob value t =0.00 < alpha
digunakan (0.05) maka tolak Ho dan disimpulkan data
varsoc sudah stationer
*uji autokol
varlmar 2. Uji Granger Causality
*uji kestabilan model Ho: tidak ada pengaruh dua arah
varstable H1: ada pengaruh dua arah
*impulse respon
quietly var
perumahan_lga
kesehatan, lags(1/2) dfk
small
irf set “VAR1”
irf create VAR1, replace
irf graph irf
Karena nilai sign.prob value chi2 =0.00 < alpha
*variance (0.05) maka tolak Ho dan disimpulkan ada
dekomposition hubungan kausalitas (bolak balik)
irf graph fevd 3. Uji Lag Optimumn
*forecasting
fcast compute m1_,
step(5)
fcast graph m1_
perumahan_lga m1_
kesehatan
4. Model VAR
5. Uji Asumsi
i. Uji autokorelasi
6.
Step
Impulse Response
Graphs by irfname,
kesehatan, impulse
kesehatan
VAR1, perumahan_lga, variable, and response variable
perumahan_lga
kesehatan
perumahan_lga
4 95%
8
6
05CI
.--.5
2
1.5
Impulse-response function
Pardomuan Robinson Sihombing, SST, M.Stat 111
7. Variance Decomposition
Step perumahan_lga,
Graphs
VAR1, by irfname,
kesehatan, impulse
kesehatan variable, and response variable
perumahan_lga
kesehatan
perumahan_lga
.95%
42
1
8
6
05 CI of MSE due to impulse
Fraction
Analisis Simultan
Model simultan adalah suatu model yang memiliki lebih dari
satu persamaan, di mana antar persamaan saling kait mengait.
Dalam persamaan simultan, variabel dependen pada suatu
persamaan dapat juga bertindak sebagai variabel independen
dalam persamaan lainnya. Persamaan struktural dapat diperoleh
ke dalam bentuk persamaan reduksi (reduce form) dan koefisien
bentuk reduksi yang berhubungan. Salah satu permasalahan dalam
model simultan adalah identifikasi untuk mengetahui apakah suatu
persamaan dalam persamaan simultan dapat diidentifikasi atau
tidak.
Pengujian identifikasi dapat ditinjau melalui metode pengujian
order condition yang merupakan syarat perlu(necessary condition)
dan rank condition yang merupakan syarat cukup (sufficient
condition). Contoh dalam analisis simultan misalkan peneliti ingin
mengetahui pengaruh pengeluaran rumah tangga dan pengeluaran
pemerintah terhadap nilai PDB. Dalam hal ini, pengeluaran rumah
tangga memiliki persamaan atau fungsi dari tabungan, di sisi lain
pengeluaran pemerintah terdapat persamaan lain yaitu fungsi dari
pajak dan lainnya. Data dan sintaks digunakan dari Katchova (2013).
Adapun langkah pengujian, dengan menggunakan menu stata:
Pardomuan Robinson Sihombing, SST, M.Stat 113
* 2SLS estimation
ivregress 2sls $y1list
($y2list = $x2list)
$x1list, first
* Test of
overidentifying
restrictions
quietly ivregress
gmm $y1list ($y2list
= $x2listalt) $x1list,
wmatrix(robust)
estat overid Karena nilai sign.prob value chi2 =0.1432 > alpha
(0.05) maka tidak tolak Ho dan disimpulkan tidak
* IV estimation with terjadi overidentifikasi dalam model
binary endogenous
regressor (first step is
probit model)
treatreg $y1list $x1list,
treat($y2list = $x2list
$x1list)
* Weak instruments
* Correlations of
endogenous regressors
with instruments
correlate $y2list
$x2listalt
116 AplikAsi stAtA UntUk stAtistisi pemUlA
* Weak instrument
tests - two or more
overidentifying
restrictions
quietly ivregress
gmm $y1list ($y2list
= $x2listalt) $x1list,
vce(robust)
estat firststage,
forcenonrobust
Daftar Pustaka
Agresti, A. ( 2002). Categorical Data Analysis. New York: nc. John
Wiley and Son.
Bierens, H. J. (1994). Topics in Advanced Econometrics : Estimation,
Testing, and Specification of Cross-section and Time Series
Models. : . pp.. New York: Cambridge University Press.
Breiman, L. (1973). Statistics: with a view towards applications.
Boston: Houghton Mifflin.
Brown, M. B., & Forsythe, A. B. (1974). Robust test for the equality
of variances. Journal of the American Statistical Association,
69, 364-367.
Card, D., & Krueger, A. (1994). Minimum Wages and Employment:
A Case Study of the Fast-Food Industry in New Jersey and
Pennsylvania. The American Economic Review, 84(4), 772-793.
Cook, D., Kieschnick, R., & McCullough, B. (2008). Regression
analysis of proportions in finance with self selection. Journal
of Empirical Finance, 15, 860–867.
Crocker, L. M., & Algina, J. (1986). Introduction to classical and
modern test theory. New York: Holt, Rinehart and Winston.
Edwards, J. H., & Edwards, A. W. (1984). Approximating the
tetrachoric correlation coefficient. Biometrics, 40, 563.
118 AplikAsi stAtA UntUk stAtistisi pemUlA
Akun Link
HP/WA 081271095616
Google Scholar https://scholar.google.com/
citations?user=TKeogYQAAAAJ&hl=en
Research Gate Pardomuan-Sihombing
Orchid https://orcid.org/0000-0002-1597-9077
Publon publons.com/researcher/4219441/pardomuan-
robinson-sihombing/
Research ID http://ResearchID.co/rid14715
Sinta ID 6754387/ https://sinta.ristekbrin.go.id/authors/
detail?id=6754387&view=overview
Scopus ID 57223216987/ https://www.scopus.com/authid/
detail.uri?authorId=57223216987
Academica https://independent.academia.edu/
pardomuansihombing
122 Aplikasi Stata Untuk Statistisi Pemula