STATA
Johan Harlan
Pengenalan Stata
Penulis : Johan Harlan
ISBN : 978-602-9438-79-6
Cetakan Pertama, Juni 2017
KATA PENGANTAR
Stata adalah program komputer untuk analisis statistik, pertama kali
dibuat oleh StataCorp pada tahun 1985. Stata tersedia untuk Windows, Unix,
dan Mac. Sampai versi 7, Stata masih menggunakan sistem operasi DOS,
tetapi sejak versi 8 ke atas telah berbasis Windows dengan pull-down menu.
Walaupun demikian, pengguna Stata sangat dianjurkan untuk menggunakan
perintah dalam mode interaktif, yang terutama akan dibahas dalam buku ini.
Pembaca buku ini diharapkan telah menguasai dasar-dasar metode dan
analisis statistik, yang tidak akan dibahas lagi secara mendetil dalam buku
ini. Saran dan kritik dari pembaca sangat diharapkan, demi perbaikan isi
buku pada penerbitan selanjutnya.
Penulis
v
Daftar Isi
DAFTAR ISI
Kata Pengantar v
Daftar Isi vi
Bab 1 Pendahuluan 1
Membuka dan Menutup Program & File Data 1
Membuat File Data Baru Stata 6
Mengimpor File Excel ke dalam Stata 10
Menyimpan Analisis Data Stata dalam File Log 12
vi
Daftar Isi
vii
Daftar Isi
Kepustakaan 119
viii
Bab 1. Pendahuluan
BAB 1
PENDAHULUAN
DAHULUAN
1
Bab 1. Pendahuluan
Gambar 1.1a.
1a. Jendela Stata secara terpisah.
Atas Kiri: Jendela Review; Atas Kanan: Jendela Stata Results;
Tengah (Kiri-Kanan):
Kanan): Jendela Variables;
Bawah: Jendela Stata Command
2
Bab 1. Pendahuluan
Gambar 1.2.
2. Menu Bar Stata
Gambar 1.2a.
2a. Tool Bar Stata
Selain menu bar,, di bawahnya terdapat tool bar (Gambar 1.2a)
dengan arti masing-masing icon adalah:
dalah:
: Open
: Save
: Print Results
: New Viewer
: Log (begin/close/suspend/resume)
: Bring graph window to front
: New Do-file Editor
: Data Editor (Edit)
: Data Editor (Browse)
: Variables Manager
: Clear “more” condition
: Break
3
Bab 1. Pendahuluan
Jika sebelumnya ada file data Stata lain yang masih terbuka, maka
ditambahkan opsi “[, clear]” menutup file terdahulu yang masih terbuka dan
menghapus variabel-variabelnya dari memori komputer:
. use "D:\Data\Stata\honolulu.dta", clear
Untuk membersihkan jendela Stata Results, perintahnya adalah “cls”:
. cls
Untuk mengeksekusi tiap baris perintah yang telah diketikkan, tekan
tombol Enter. Tiap perintah diketik pada jendela Stata Command yang
hanya memuat 1 baris perintah, dan setelah dieksekusi akan menggulung ke
atas, sehingga perintah itu tidak terlihat lagi, namun jika ingin dilihat,
perintah tersebut dapat diturunkan kembali dengan menekan tombol PgUp
pada papan ketik. Untuk mengetik perintah berikut, perintah lama tersebut
harus digulung kembali ke atas dengan menekan tombol PgDn. Tiap
perintah yang telah dieksekusi juga akan muncul secara otomatis pada
jendela Review, yang dapat memuat lebih banyak baris perintah.
Perhatikan bahwa jika file honolulu.dta dibuka melalui menu bar
File > Open > D:\Data\Stata\, maka pada jendela Stata Command secara
otomatis akan timbul ketikan use "D:\Data\Stata\honolulu.dta", clear,
walaupun pengguna tidak mengetiknya. Setelah file honolulu.dta terbuka,
semua variabelnya, baik nama maupun properties-nya secara otomatis akan
muncul pada jendela Variables (gambar 1.3).
4
Bab 1. Pendahuluan
5
Bab 1. Pendahuluan
Dalam sebuah program Stata hanya dapat dibuka 1 file data. Jika
diberi perintah untuk membuka file data kedua, file data pertama otomatis
akan ditutup. Tetapi program Stata yang dibuka dapat lebih daripada satu.
Dengan membuka program Stata kedua, file data kedua dapat dibuka pada
program Stata kedua tanpa mengakibatkan tertutupnya file data pertama pada
program Stata pertama. Setelah itu masih dapat dibuka program Stata ketiga
dengan file data ketiga, dan seterusnya.
6
Bab 1. Pendahuluan
Nama variabel baru dapat diberikan setelah paling sedikit satu nilai
data diisikan pada kolom tersebut. Stata secara otomatis akan memberi nama
awal variabel berupa var1, var2, dan seterusnya. Setelah ada nilai data yang
diisi pada kolom pertama, dengan klik kiri ganda pada nama var1, jendela
Variable Properties akan ditampilkan dan pengguna dapat mengganti nama
variabel sesuai dengan keinginannya. Nama variabel dalam Stata dianjurkan
diawali dengan huruf kecil, bukan huruf besar
besar, angka ataupun garis bawah.
Panjang nama variabel dianjurkan tidak melebihi 10 karakter, tanpa ruang
kosong (blank spaces)) di antaranya. Ruang kosong akan memisahkan suatu
nama tersebut menjadi 2 nama yang dianggap sebagai nama untuk 2 variabel.
Nama variabel juga dapat diganti dengan menutup jendela Edit dan
kembali ke jendela Stata Command dan gunakan sintaks:
rename varname_old varname_new
Tiap variabel dapat diberi label dengan perintah label variable, yaitu
istilah yang memiliki arti jelas dan akan ditampilkan pada hasil analisis
Stata,, misalnya label untuk variabel bb adalah Berat Badan. Pemberian
label dapat dilakukan
ukan melalui jendela Variable Properties ataupun
diketikkan perintahnya pada jendela Stata Command dengan sintaks:
label variable varname ["label"
"label"]
7
Bab 1. Pendahuluan
Gambar 1.5.
5. Icon Variables Manager pada Tool Bar
Contoh 1.1:
Buka program Stata,, lalu klik ikon Data Editor atau ketikkan
perintah edit. Masukkan nilai-nilai data mahasiswa berikut pada spreadsheet
Data Editor (5 baris pertama dan 6 kolom terkiri):
8
Bab 1. Pendahuluan
1 1 18 1 59 1
2 2 21 1 55 1
3 2 22 0 42 0
4 1 19 1 57 0
5 3 20 0 47 0
9
Bab 1. Pendahuluan
Untuk variabel kontinu hanya ada labelnya tanpa perlu nama nilai
label.
Simpan file data dengan nama file latihan1.dta. Penyimpanan dapat
dilakukan melalui menu bar dengan mengklik “File > Save >
D:\Data\Stata\“ atau ”File > Save as > D:\Data\Stata\“. Penyimpanan dapat
juga dilakukan dengan mengetikkan perintah:
. save "D:\Data\Stata\latihan1.dta"
file D:\Data\Stata\latihan1.dta saved
10
Bab 1. Pendahuluan
kolom jumlah ini akan diperlakukan sebagai salah satu variabel dalam
analisis data.
- Nama-nama variabel dituliskan pada baris teratas, semuanya diawali
dengan huruf kecil.
- Nilai-nilai data dituliskan pada baris kedua (untuk responden pertama),
baris ketiga (untuk responden kedua), dan seterusnya sampai seluruh
responden termuat datanya, tanpa ada baris kosong yang terselip di antara
baris-baris data.
Prosedur untuk meng-“impor” file Excel ke dalam program Stata
dapat dilakukan melalui menu bar ataupun dengan perintah pada Stata
Command.
Contoh 1.2:
Pada contoh ini akan diperlihatkan prosedur untuk meng-“impor” file
Excel “D:\Data\Stata\bankloan.xls” ke dalam program Stata.
Pada menu bar, klik File > Import > Excel spreadsheet (*.xls,
*xlsx), maka jendela Import Excel akan terbuka. Klik Browse pada jendela
Import Excel untuk mencari lokasi penyimpanan file Excel yang akan di-
“import”, yaitu “D:\Data\Stata\”. Jika file Excel memiliki lebih daripada 1
worksheet, maka Worksheet perlu diisi, jika tidak ataupun tak diisi, nilai
default-nya adalah worksheet pertama (Sheet1). Centang kotak kecil di
depan tulisan “Import first row as variable names”, lalu klik OK., maka
file Excel bankloan.xls tersebut telah terbuka dalam Stata.
Proses meng-“impor” bankloan.xls file di atas dapat juga dilakukan
dengan mengetikkan perintah:
. import excel "D:\Data\Stata\bankloan.xls", sheet("Sheet1") firstrow
File yang terbuka tersebut dapat diolah sebagai file data Stata tanpa
mengubah isi file Excel aslinya. Jika ingin disimpan sebagai file data Stata,
tetap harus melalui prosedur “save”:
. save "D:\Data\Stata\bankloan.dta"
file D:\Data\Stata\bankloan.dta saved
11
Bab 1. Pendahuluan
Contoh 1.3:
Buka file log exercise1.scml untuk disimpan dalam
“D:\Data\Stata\” dengan mengklik File > Log > Begin . . . , dan seterusnya.
Atau ketikkan perintah:
. log using "D:\Data\Stata\exercise1"
name: <unnamed>
log: D:\Data\Stata\exercise1.smcl
log type: smcl
opened on: 10 Jul 2015, 15:26:46
Selanjutnya akan diperlihatkan sejumlah pekerjaan berupa perintah
dan hasil dalam Stata untuk disimpan dalam file log exercise1.scml tanpa
penjelasan rinci mengenai perintah-perintah tersebut. Penjelasan mengenai
perintah-perintah akan diberikan dalam bab-bab berikut.
Misalkan hendak dibuka file data Arctic9.dta.
. use “D:\Data\Stata\Arctic9.dta”, clear
(Arctic September mean sea ice 1979-2011)
Atau klik File > Open > . . . > Arctic9.dta
Untuk melihat deskripsi singkat dataset yang ada dalam memori,
digunakan perintah describe.
. describe
12
Bab 1. Pendahuluan
---------------------------------------------------------------------
storage display value
variable name type format label variable label
---------------------------------------------------------------------
year int %ty Year
month byte %8.0g Month
extent float %9.0g Sea ice extent, million km^2
area float %9.0g Sea ice area, million km^2
volume float %8.0g Sea ice volume, 1000 km^3
volumehi float %9.0g Volume + 1.35 (uncertainty)
volumelo float %9.0g Volume - 1.35 (uncertainty)
tempN float %9.0g Annual air temp anomaly 64N-90N C
---------------------------------------------------------------------
Sorted by: year
13
Bab 1. Pendahuluan
. summarize
Variable | Obs Mean Std. Dev. Min Max
---------+--------------------------------------------
year | 33 1995 9.66954 1979 2011
month | 33 9 0 9 9
extent | 33 6.51697 .9691796 4.3 7.88
area | 33 4.850303 .8468452 3.09 6.02
volume | 33 12.04664 3.346079 4.210367 16.9095
---------+--------------------------------------------
volumehi | 33 13.39664 3.346079 5.560367 18.2595
volumelo | 33 10.69664 3.346079 2.860367 15.5595
tempN | 33 .790303 .7157928 -.57 2.22
14
Bab 1. Pendahuluan
8
Sea ice extent, million km^2
5 6 4 7
Jika pengolahan dan analisis data telah selesai, file log dapat ditutup
dan disimpan:
. log close
name: <unnamed>
log: D:\Data\Stata\exercise1.smcl
log type: smcl
closed on: 29 Jun 2014, 15:33:33
Perintah ini sama dengan melalui menu bar File > Log > Close.
Selama file log terbuka pada saat pengolahan dan analisis data, seandainya
program Stata akan ditutup untuk dihentikan sementara, sedangkan analisis
data belum selesai, perekaman dapat dihentikan sementara, kemudian
dilanjutkan dengan sintaks:
log off logname (perintah penghentian sementara)
log on logname (perintah melanjutkan kembali)
File log yang telah ditutup dapat dibuka kembali untuk dilihat dalam
program Stata dengan mengklik File > Log > View. File dalam format
*.scml dapat diubah menjadi format *.log yang dapat dibuka dengan
wordprocessor, misalnya untuk exercise1.scml pada menu bar dengan File
> Log > View yang akan membuka jendela “Translate file” atau dengan
mengetikkan perintah:
15
Bab 1. Pendahuluan
16
Bab 1. Pendahuluan
BAB 1
PENDAHULUAN
DAHULUAN
1
Bab 1. Pendahuluan
2
Bab 1. Pendahuluan
: Open
: Save
: Print Results
: New Viewer
: Log (begin/close/suspend/resume)
: Bring graph window to front
: New Do-file Editor
: Data Editor (Edit)
: Data Editor (Browse)
: Variables Manager
: Clear “more” condition
: Break
3
Bab 1. Pendahuluan
Jika sebelumnya ada file data Stata lain yang masih terbuka, maka
ditambahkan opsi “[, clear]” menutup file terdahulu yang masih terbuka dan
menghapus variabel-variabelnya dari memori komputer:
. use "D:\Data\Stata\honolulu.dta", clear
Untuk membersihkan jendela Stata Results, perintahnya adalah “cls”:
. cls
Untuk mengeksekusi tiap baris perintah yang telah diketikkan, tekan
tombol Enter. Tiap perintah diketik pada jendela Stata Command yang
hanya memuat 1 baris perintah, dan setelah dieksekusi akan menggulung ke
atas, sehingga perintah itu tidak terlihat lagi, namun jika ingin dilihat,
perintah tersebut dapat diturunkan kembali dengan menekan tombol PgUp
pada papan ketik. Untuk mengetik perintah berikut, perintah lama tersebut
harus digulung kembali ke atas dengan menekan tombol PgDn. Tiap
perintah yang telah dieksekusi juga akan muncul secara otomatis pada
jendela Review, yang dapat memuat lebih banyak baris perintah.
Perhatikan bahwa jika file honolulu.dta dibuka melalui menu bar
File > Open > D:\Data\Stata\, maka pada jendela Stata Command secara
otomatis akan timbul ketikan use "D:\Data\Stata\honolulu.dta", clear,
walaupun pengguna tidak mengetiknya. Setelah file honolulu.dta terbuka,
semua variabelnya, baik nama maupun properties-nya secara otomatis akan
muncul pada jendela Variables (gambar 3).
4
Bab 1. Pendahuluan
5
Bab 1. Pendahuluan
Dalam sebuah program Stata hanya dapat dibuka 1 file data. Jika
diberi perintah untuk membuka file data kedua, file data pertama otomatis
akan ditutup. Tetapi program Stata yang dibuka dapat lebih daripada satu.
Dengan membuka program Stata kedua, file data kedua dapat dibuka pada
program Stata kedua tanpa mengakibatkan tertutupnya file data pertama pada
program Stata pertama. Setelah itu masih dapat dibuka program Stata ketiga
dengan file data ketiga, dan seterusnya.
6
Bab 1. Pendahuluan
Nama variabel baru dapat diberikan setelah paling sedikit satu nilai
data diisikan pada kolom tersebut. Stata secara otomatis akan memberi nama
awal variabel berupa var1, var2, dan seterusnya. Setelah ada nilai data yang
diisi pada kolom pertama, dengan klik kiri ganda pada nama var1, jendela
Variable Properties akan ditampilkan dan pengguna dapat mengganti nama
variabel sesuai dengan keinginannya. Nama variabel dalam Stata dianjurkan
diawali dengan huruf kecil, bukan huruf besar
besar, angka ataupun garis bawah.
Panjang nama variabel dianjurkan tidak melebihi 10 karakter, tanpa ruang
kosong (blank spaces)) di antaranya. Ruang kosong akan memisahkan suatu
nama tersebut menjadi 2 nama yang dianggap sebagai nama untuk 2 variabel.
Nama variabel juga dapat diganti dengan menutup jendela Edit dan
kembali ke jendela Stata Command dan gunakan sintaks:
rename varname_old varname_new
Tiap variabel dapat diberi label dengan perintah label variable, yaitu
istilah yang memiliki arti jelas dan akan ditampilkan pada hasil analisis
Stata,, misalnya label untuk variabel bb adalah Berat Badan. Pemberian
label dapat dilakukan melalui jendela Variable Properties ataupun
diketikkan perintahnya pada jendela Stata Command dengan sintaks:
label variable varname ["label"
"label"]
7
Bab 1. Pendahuluan
Contoh 1.1:
Buka program Stata,, lalu klik ikon Data Editor atau ketikkan
perintah edit. Masukkan nilai-nilai data mahasiswa berikut pada spreadsheet
Data Editor (5 baris pertama dan 6 kolom terkiri):
8
Bab 1. Pendahuluan
1 1 18 1 59 1
2 2 21 1 55 1
3 2 22 0 42 0
4 1 19 1 57 0
5 3 20 0 47 0
9
Bab 1. Pendahuluan
Untuk variabel kontinu hanya ada labelnya tanpa perlu nama nilai
label.
Simpan file data dengan nama file latihan1.dta. Penyimpanan dapat
dilakukan melalui menu bar dengan mengklik “File > Save >
D:\Data\Stata\“ atau ”File > Save as > D:\Data\Stata\“. Penyimpanan dapat
juga dilakukan dengan mengetikkan perintah:
. save "D:\Data\Stata\latihan1.dta"
file D:\Data\Stata\latihan1.dta saved
10
Bab 1. Pendahuluan
kolom jumlah ini akan diperlakukan sebagai salah satu variabel dalam
analisis data.
- Nama-nama variabel dituliskan pada baris teratas, semuanya diawali
dengan huruf kecil.
- Nilai-nilai data dituliskan pada baris kedua (untuk responden pertama),
baris ketiga (untuk responden kedua), dan seterusnya sampai seluruh
responden termuat datanya, tanpa ada baris kosong yang terselip di antara
baris-baris data.
Prosedur untuk meng-“impor” file Excel ke dalam program Stata
dapat dilakukan melalui menu bar ataupun dengan perintah pada Stata
Command.
Contoh 1.2:
Pada contoh ini akan diperlihatkan prosedur untuk meng-“impor” file
Excel “D:\Data\Stata\bankloan.xls” ke dalam program Stata.
Pada menu bar, klik File > Import > Excel spreadsheet (*.xls,
*xlsx), maka jendela Import Excel akan terbuka. Klik Browse pada jendela
Import Excel untuk mencari lokasi penyimpanan file Excel yang akan di-
“import”, yaitu “D:\Data\Stata\”. Jika file Excel memiliki lebih daripada 1
worksheet, maka Worksheet perlu diisi, jika tidak ataupun tak diisi, nilai
default-nya adalah worksheet pertama (Sheet1). Centang kotak kecil di
depan tulisan “Import first row as variable names”, lalu klik OK., maka
file Excel bankloan.xls tersebut telah terbuka dalam Stata.
Proses meng-“impor” bankloan.xls file di atas dapat juga dilakukan
dengan mengetikkan perintah:
. import excel "D:\Data\Stata\bankloan.xls", sheet("Sheet1") firstrow
File yang terbuka tersebut dapat diolah sebagai file data Stata tanpa
mengubah isi file Excel aslinya. Jika ingin disimpan sebagai file data Stata,
tetap harus melalui prosedur “save”:
. save "D:\Data\Stata\bankloan.dta"
file D:\Data\Stata\bankloan.dta saved
11
Bab 1. Pendahuluan
Contoh 1.3:
Buka file log exercise1.scml untuk disimpan dalam
“D:\Data\Stata\” dengan mengklik File > Log > Begin . . . , dan seterusnya.
Atau ketikkan perintah:
. log using "D:\Data\Stata\exercise1", clear
name: <unnamed>
log: D:\Data\Stata\exercise1.smcl
log type: smcl
opened on: 10 Jul 2015, 15:26:46
Selanjutnya akan diperlihatkan sejumlah pekerjaan berupa perintah
dan hasil dalam Stata untuk disimpan dalam file log exercise1.scml tanpa
penjelasan rinci mengenai perintah-perintah tersebut. Penjelasan mengenai
perintah-perintah akan diberikan dalam bab-bab berikut.
Misalkan hendak dibuka file data Arctic9.dta.
. use “D:\Data\Stata\Arctic9”, clear
(Arctic September mean sea ice 1979-2011)
Atau klik File > Open > . . . > Arctic9.dta
Untuk melihat deskripsi singkat dataset yang ada dalam memori,
digunakan perintah describe.
. describe
12
Bab 1. Pendahuluan
---------------------------------------------------------------------
storage display value
variable name type format label variable label
---------------------------------------------------------------------
year int %ty Year
month byte %8.0g Month
extent float %9.0g Sea ice extent, million km^2
area float %9.0g Sea ice area, million km^2
volume float %8.0g Sea ice volume, 1000 km^3
volumehi float %9.0g Volume + 1.35 (uncertainty)
volumelo float %9.0g Volume - 1.35 (uncertainty)
tempN float %9.0g Annual air temp anomaly 64N-90N C
---------------------------------------------------------------------
Sorted by: year
13
Bab 1. Pendahuluan
. summarize
Variable | Obs Mean Std. Dev. Min Max
---------+--------------------------------------------
year | 33 1995 9.66954 1979 2011
month | 33 9 0 9 9
extent | 33 6.51697 .9691796 4.3 7.88
area | 33 4.850303 .8468452 3.09 6.02
volume | 33 12.04664 3.346079 4.210367 16.9095
---------+--------------------------------------------
volumehi | 33 13.39664 3.346079 5.560367 18.2595
volumelo | 33 10.69664 3.346079 2.860367 15.5595
tempN | 33 .790303 .7157928 -.57 2.22
14
Bab 1. Pendahuluan
8
Sea ice extent, million km^2
5 6 4 7
Jika pengolahan dan analisis data telah selesai, file log dapat ditutup
dan disimpan:
. log close
name: <unnamed>
log: D:\Data\Stata\exercise1.smcl
log type: smcl
closed on: 29 Jun 2014, 15:33:33
Perintah ini sama dengan melalui menu bar File > Log > Close.
Selama file log terbuka pada saat pengolahan dan analisis data, seandainya
program Stata akan ditutup untuk dihentikan sementara, sedangkan analisis
data belum selesai, perekaman dapat dihentikan sementara, kemudian
dilanjutkan dengan sintaks:
log off logname (perintah penghentian sementara)
log on logname (perintah melanjutkan kembali)
File log yang telah ditutup dapat dibuka kembali untuk dilihat dalam
program Stata dengan mengklik File > Log > View. File dalam format
*.scml dapat diubah menjadi format *.log yang dapat dibuka dengan
wordprocessor, misalnya untuk exercise1.scml pada menu bar dengan File
> Log > View yang akan membuka jendela “Translate file” atau dengan
mengetikkan perintah:
15
Bab 1. Pendahuluan
16
Bab 2. Manajemen Data
BAB 2
MANAJEMEN DATA
Dalam bab ini akan dibahas beberapa perintah terpenting Stata dalam
proses manajemen data.
17
Bab 2. Manajemen Data
Diagram 1. Icon Data Editor dan Data Browser pada Tool Bar
18
Bab 2. Manajemen Data
Dengan membuka jendela Data Editor, data dapat dilihat dan juga
dapat diedit, sedangkan jika yang dibuka jendela Data Browser, data hanya
dapat dilihat tanpa dapat diedit. Kedua jendela ini juga dapat dibuka dengan
sintaks:
edit varlist [if] [in]
dan: browse varlist [if] [in]
19
Bab 2. Manajemen Data
Contoh 2.1:
. use “D:\Data\Stata\honolulu.dta”, clear
. sum glukosa
Variable | Obs Mean Std. Dev. Min Max
---------+-----------------------------------
glukosa | 100 152.14 54.75584 58 442
. sum tb
Variable | Obs Mean Std. Dev. Min Max
---------+-----------------------------------
tb | 100 161.75 5.596491 150 175
. sum tb in 1/50
Variable | Obs Mean Std. Dev. Min Max
---------+-----------------------------------
tb | 50 162.26 5.609067 150 175
. sum kolest
Variable | Obs Mean Std. Dev. Min Max
---------+-----------------------------------
kolest | 100 216.96 38.85844 134 382
20
Bab 2. Manajemen Data
Contoh 2.2:
. use “D:\Data\Stata\honolulu.dta”, clear
. list no_id usia td_sist if merokok==1 in 51/70
+------------------------+
| no_id usia td_sist |
|------------------------|
53. | 53 50 116 |
55. | 55 50 108 |
61. | 61 54 114 |
63. | 63 50 98 |
65. | 65 53 130 |
|------------------------|
66. | 66 53 122 |
67. | 67 47 112 |
+------------------------+
21
Bab 2. Manajemen Data
22
Bab 2. Manajemen Data
Contoh 2.3:
. use “D:\Data\Stata\honolulu.dta”, clear
. desc usia glukosa kolest td_sist
storage display value
variable name type format label variable label
---------------------------------------------------------
usia byte %10.0g Usia
glukosa int %10.0g Kadar Glukosa Darah
kolest int %10.0g Kadar Kolesterol Darah
td_sist int %10.0g Tekanan Darah Sistolik
. describe
Contains data from D:\Data\Stata\honolulu.dta
obs: 100
vars: 11 18 Aug 2016 14:16
size: 2,200
---------------------------------------------------------
storage display value
variable name type format label variable label
---------------------------------------------------------
no_id byte %10.0g Nomor Identitas
tk_pend byte %10.0g Tingkat Pendidikan
bb byte %10.0g Berat Badan
tb int %10.0g Tinggi Badan
usia byte %10.0g Usia
merokok byte %10.0g Merokok
akt_fisik byte %10.0g Aktivitas Fisik
glukosa int %10.0g Kadar Glukosa Darah
kolest int %10.0g Kadar Kolesterol Darah
23
Bab 2. Manajemen Data
24
Bab 2. Manajemen Data
25
Bab 2. Manajemen Data
drop if exp
drop in range
keep if exp
keep in range
26
Bab 2. Manajemen Data
27
Bab 3. Statistika Deskriptif
BAB 3
STATISTIKA DESKRIPTIF
28
Bab 3. Statistika Deskriptif
Contoh 3.1:
. use "D:\Data\Stata\honolulu.dta", clear
. sum bb tb usia
Untuk menampilkan ringkasan yang lebih rinci, misalnya untuk variabel bmi
diketikkan perintah sum bmi, detail.
. sum bmi, det
29
Bab 3. Statistika Deskriptif
Contoh 3.2:
. use “D:\Data\Stata\Arctic9”, clear
(Arctic September mean sea ice 1979-2011)
. sum extent volume
30
Bab 3. Statistika Deskriptif
31
Bab 3. Statistika Deskriptif
Contoh 3.3:
. use "D:\Data\Stata\honolulu.dta", clear
. tab tk_pend
Tingkat |
Pendidikan | Freq. Percent Cum.
------------+---------------------------
1 | 25 25.00 25.00
2 | 32 32.00 57.00
3 | 24 24.00 81.00
4 | 9 9.00 90.00
5 | 10 10.00 100.00
------------+---------------------------
Total | 100 100.00
32
Bab 3. Statistika Deskriptif
Contoh 3.4:
. use “D:\Data\Stata\attract”, clear
(Perceived attractiveness and drinking -- DC Hamilton (2003))
. tab drinkfrq
Days |
drinking in |
previous |
week | Freq. Percent Cum.
------------+-----------------------------------
0 | 4 2.04 2.04
.5 | 4 2.04 4.08
1 | 24 12.24 16.33
2 | 52 26.53 42.86
2.5 | 4 2.04 44.90
3 | 40 20.41 65.31
33
Bab 3. Statistika Deskriptif
Tabel Silang
Untuk menampilkan tabel silang digunakan perintah tab2 sebagai
berikut:
tab2 varname1 varname2 [if] [in] [, options]
Contoh 3.5:
. use "D:\Data\Stata\honolulu.dta", clear
. tab2 tk_pend akt_fisik
34
Bab 3. Statistika Deskriptif
Contoh 3.6:
. use “D:\Data\Stata\attract”, clear
(Perceived attractiveness and drinking -- DC Hamilton (2003))
35
Bab 3. Statistika Deskriptif
36
Bab 3. Statistika Deskriptif
Days |
drinking |
in |
previous | Gender
week | Male Female | Total
-----------+----------------------+----------
0 | 4 0 | 4
| 3.13 0.00 | 2.04
-----------+----------------------+----------
.5 | 4 0 | 4
| 3.13 0.00 | 2.04
-----------+----------------------+----------
1 | 8 16 | 24
| 6.25 23.53 | 12.24
-----------+----------------------+----------
2 | 32 20 | 52
| 25.00 29.41 | 26.53
-----------+----------------------+----------
2.5 | 0 4 | 4
| 0.00 5.88 | 2.04
-----------+----------------------+----------
3 | 32 8 | 40
| 25.00 11.76 | 20.41
-----------+----------------------+----------
3.5 | 4 8 | 12
| 3.13 11.76 | 6.12
-----------+----------------------+----------
4 | 12 8 | 20
| 9.38 11.76 | 10.20
-----------+----------------------+----------
4.5 | 4 0 | 4
| 3.13 0.00 | 2.04
-----------+----------------------+----------
5 | 16 0 | 16
| 12.50 0.00 | 8.16
-----------+----------------------+----------
6 | 12 4 | 16
| 9.38 5.88 | 8.16
-----------+----------------------+----------
Total | 128 68 | 196
| 100.00 100.00 | 100.00
37
Bab 3. Statistika Deskriptif
Contoh 3.7:
. use “D:\Data\Stata\attract”, clear
(Perceived attractiveness and drinking -- DC Hamilton (2003))
. tab gender, sum(bac)
| Summary of Blood alchohol content
Gender | Mean Std. Dev. Freq.
------------+------------------------------------
Male | .09340909 .08052148 132
Female | .08111111 .06826947 72
------------+------------------------------------
Total | .08906863 .07647798 204
38
Bab 4. Grafik Statistik
BAB 4
GRAFIK STATISTIK
Histogram dan Densitas Kernel
Histogram adalah representasi grafikal untuk sehimpunan pengamatan
terkategorisasi oleh sejumlah batang, 1 batang untuk tiap kategori, masing-
masing memiliki luas yang sebanding dengan frekuensi kategorinya. Proses
kategorisasi (penentuan jumlah dan lebar batang) dapat dilakukan oleh
program komputer ataupun ditentukan oleh pengguna program. Sintaks untuk
histogram yaitu:
histogram varname [if] [in] [, options]
Densitas kernel (kernel density) adalah fungsi licin (smoothed
function), yang diperoleh dari “geseran” histogram (sliding histogram). Bentuk
histogram tidak konstan, tergantung pada titik awal dan lebar batang yang
dipilih, tetapi bentuk densitas kernel relatif konstan, semata-mata tergantung
pada metode estimasi yang dipilih. Sintaks untuk grafik densitas kernel yaitu:
kdensity varname [if] [in] [, options]
Contoh 4.1:
. use “D:\Data\Stata\auto”, clear
. histogram weight
(bin=8, start=1760, width=385)S
5.0e-04
4.0e-04
2.0e-04 3.0e-04
Density
1.0e-04
0
39
Bab 4. Grafik Statistik
. kdensity weight
Kernel density estimate
.0004
.0003
Density
.0002 .0001
0
.0003
2.0e-04 3.0e-04
Density
Density
.0002 .0001
1.0e-04
40
Bab 4. Grafik Statistik
2.0e-04 3.0e-045.0e-04
4.0e-04
Density
1.0e-04
0
41
Bab 4. Grafik Statistik
Domestic Foreign
.0015
.001
Density
5.0e-04
0
Contoh 4.2:
. use “D:\Data\Stata\attract”, clear
(Perceived attractiveness and drinking -- DC Hamilton (2003))
. histogram bac
(bin=14, start=0, width=.02571429)
10
8
Density
4
2
06
0 .1 .2 .3 .4
Blood alchohol content
42
Bab 4. Grafik Statistik
0 .1 .2 .3 .4
Blood alchohol content
0 .1 .2 .3 .4
Blood alchohol content
43
Bab 4. Grafik Statistik
Male Female
15
10
Density
5
0
0 .1 .2 .3 .4 0 .1 .2 .3 .4
Blood alchohol content
Graphs by Gender
Male Female
30
20
10
0
Percent
0 .1 .2 .3 .4
Total
30
20
10
0
0 .1 .2 .3 .4
Blood alchohol content
Graphs by Gender
44
Bab 4. Grafik Statistik
. kdensity bac
5
4
3
Density
2
1
0
0 .1 .2 .3 .4
Blood alchohol content
kernel = epanechnikov, bandwidth = 0.0238
0 .1 .2 .3 .4
Blood alchohol content
45
Bab 4. Grafik Statistik
Contoh 4.3:
. use “D:\Data\Stata\auto”, clear
. histogram rep78
.8
.6
Density
.4 .2
0
1 2 3 4 5
Repair Record 1978
46
Bab 4. Grafik Statistik
Contoh 4.4:
. use “D:\Data\Stata\student2”, clear
(Student survey (Ward 1990))
. histogram live, frequency
80
60
Frequency
40
20
0
1 2 3 4
Year in college
Diagram Batang
Pengertian diagram batang (bar diagram) dalam Stata adalah
penyajian nilai-nilai rerata (ataupun statistik lainnya) suatu variabel kontinu
menurut kategori variabel kategorik lainnya. Sintaks-nya adalah:
graph bar [(stat)] cont_var [if] [in], over(cat_var)
47
Bab 4. Grafik Statistik
Contoh 4.5:
. use “D:\Data\Stata\auto”, clear
. graph bar (mean) mpg, over(rep78)
30
20
mean of mpg
10
0
1 2 3 4 5
Contoh 4.6:
. use “D:\Data\Stata\student2”, clear
(Student survey (Ward 1990))
. graph bar (mean) aggress, over(gender)
2 1.5
mean of aggress
1 .5
0
Female Male
48
Bab 4. Grafik Statistik
Diagram Tebar
Diagram tebar (scatter diagram) adalah grafik dua dimensi untuk
pengamatan bivariat. Sintaks untuk diagram tebar adalah:
Contoh 4.7:
. use “D:\Data\Stata\auto”, clear
. graph twoway scatter weight length
5,0004,000
Weight (lbs.)
3,000 2,000
49
Bab 4. Grafik Statistik
50
Bab 4. Grafik Statistik
Contoh 4.8:
. use “D:\Data\Stata\student2”, clear
(Student survey (Ward 1990))
. graph twoway scatter gpa study
4
3.5
Grade Point Average
2.5 2
1.53
0 10 20 30 40 50
Avg. hours/week studying
0 10 20 30 40 50
Avg. hours/week studying
51
Bab 4. Grafik Statistik
4
3.5
3
2.5
2
1.5
0 10 20 30 40 50
Avg. hours/week studying
52
Bab 4. Grafik Statistik
Contoh 4.9:
. use “D:\Data\Stata\auto”, clear
. graph box mpg
40 30
Mileage (mpg)
20
10
Domestic Foreign
40
Mileage (mpg)
30
20
10
53
Bab 4. Grafik Statistik
Contoh 4.10:
. use “D:\Data\Stata\student2”, clear
(Student survey (Ward 1990))
Female Male
54
Bab 4. Grafik Statistik
Diagram Lingkar
Diagram lingkar (pie diagram) adalah penyajian grafikal untuk data
nominal (kategorik), menggunakan lingkaran yang terbagi sejumlah sektor,
masing-masing berukuran proporsional dengan frekuensi yang
direpresentasikannya. Sintaks-nya adalah:
graph pie [if] [in], over(varname) [options]
Contoh 4.11:
. use “D:\Data\Stata\auto”, clear
. graph pie, over(rep78)
1 2
3 4
5
55
Bab 4. Grafik Statistik
Contoh 4.12:
. use “D:\Data\Stata\student2”, clear
(Student survey (Ward 1990))
. graph pie, over(live)
Dorm Greek
Apartmnt w/Parent
other
Grafik Matriks
Grafik matriks adalah matriks yang tiap selnya memuat diagram tebar
untuk 2 variabel yang berpotongan pada sel itu. Sintaks-nya adalah:
graph matrix varlist [if] [in] [, options]
56
Bab 4. Grafik Statistik
Contoh 4.13:
. use “D:\Data\Stata\auto”, clear
. graph matrix price mpg weight length, half
Price
40
30
Mileage
20
(mpg)
10
5,000
4,000
Weight
3,000 (lbs.)
2,000
250
200 Length
(in.)
150
57
Bab 4. Grafik Statistik
Contoh 4.14:
. use “D:\Data\Stata\student2”, clear
(Student survey (Ward 1990))
Age at
last
birthday
40
33-point
20 drinking
scale
0
4
3 Grade
Point
2 Average
1
50
Avg.
hours/week
studying
0
20 30 40 0 20 401 2 3 4
58
Bab 5. Analisis Statistik Sederhana
BAB 5
ANALISIS STATISTIK SEDERHANA
Uji t
Contoh 5.1:
File data yang digunakan adalah auto.dta.
. use “D:\Data\Stata\auto.dta”, clear
(1978 Automobile Data)
9. | 16 |
10. | 19 |
+-----+
Untuk pengujian asumsi normalitas terhadap variabel mpg dilakukan
uji normalitas Shapiro-Wilk dengan H 0 : Data berdistribusi normal.
. swilk mpg
Shapiro-Wilk W test for normal data
Variable | Obs W V z Prob>z
---------+--------------------------------------------------
mpg | 74 0.94821 3.335 2.627 0.00430
34
30
Mileage (mpg)
20
20
14
10
10 15 20 25 30 35
Inverse Normal
Grid lines are 5, 10, 25, 50, 75, 90, and 95 percentiles
60
Bab 5. Analisis Statistik Sederhana
. ttest mpg==20
One-sample t test
-----------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+-------------------------------------------------------
mpg | 74 21.2973 .6725511 5.785503 19.9569 22.63769
-----------------------------------------------------------------
mean = mean(mpg) t = 1.9289
Ho: mean = 20 degrees of freedom = 73
Ha: mean < 20 Ha: mean != 20 Ha: mean > 20
Pr(T < t) = 0.9712 Pr(|T| > |t|) = 0.0576 Pr(T > t) = 0.0288
Diperoleh hasil:
untuk H1 : µ < 20 → p = 0.9712
H1 : µ ≠ 20 p = 0.0576
H1 : µ > 20 p = 0.0288
Contoh 5.2:
Pada contoh ini digunakan file data hsb2.dta.
. use "D:\Data\Stata\hsb2.dta", clear
(highschool and beyond (200 cases))
. list write in 1/10
+-------+
| write |
|-------|
1. | 52 |
2. | 59 |
3. | 33 |
4. | 44 |
5. | 52 |
|-------|
6. | 52 |
7. | 59 |
8. | 46 |
9. | 57 |
10. | 55 |
+-------+
61
Bab 5. Analisis Statistik Sederhana
. swilk write
Shapiro-Wilk W test for normal data
Variable | Obs W V z Prob>z
---------+--------------------------------------------------
write | 200 0.96286 5.540 3.939 0.00004
. ttest write=50
One-sample t test
------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------
write | 200 52.775 .6702372 9.478586 51.45332 54.09668
------------------------------------------------------------------
mean = mean(write) t = 4.1403
Ho: mean = 50 degrees of freedom = 199
Ha: mean < 50 Ha: mean != 50 Ha: mean > 50
Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0001 Pr(T > t) = 0.0000
Hipotesis H 0 : µ = 50 ditolak dengan p = 0.0001.
Contoh 5.3:
File data yang digunakan di sini adalah fuel3.dta.
. webuse fuel3, clear
| Summary of mpg
treated | Mean Std. Dev. Freq.
------------+------------------------------------
0 | 21 2.7303013 12
1 | 22.75 3.250874 12
------------+------------------------------------
Total | 21.875 3.0689539 24
W0 = 0.03414971 df(1, 22) Pr > F = 0.8550817
W50 = 0.01376721 df(1, 22) Pr > F = 0.9076602
W10 = 0.02949384 df(1, 22) Pr > F = 0.86521366
W0 : Levene’s F statistic
W50 : Brown and Forsythe’s F statistic (median)
W10 : Brown and Forsythe’s F statistic (trimmed mean)
64
Bab 5. Analisis Statistik Sederhana
Contoh 5.4:
Digunakan file data hsb2.dta.
. use “D\Data\Stata\hsb2.dta”, clear
. list write female in 1/5
+----------------+
| write female |
|----------------|
1. | 52 male |
2. | 59 female |
3. | 33 male |
4. | 44 male |
5. | 52 male |
+----------------+
65
Bab 5. Analisis Statistik Sederhana
66
Bab 5. Analisis Statistik Sederhana
Contoh 5.5:
File data untuk contoh ini adalah fuel.dta.
. webuse fuel, clear
. list in 1/5
+-------------+
| mpg1 mpg2 |
|-------------|
1. | 20 24 |
2. | 23 25 |
3. | 21 21 |
4. | 25 22 |
5. | 18 23 |
+-------------+
Paired t test
---------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+-----------------------------------------------------
mpg1 | 12 21 .7881701 2.730301 19.26525 22.73475
mpg2 | 12 22.75 .9384465 3.250874 20.68449 24.81551
---------+-----------------------------------------------------
diff | 12 -1.75 .7797144 2.70101 -3.46614 -.0338602
---------------------------------------------------------------
67
Bab 5. Analisis Statistik Sederhana
Contoh 5.6:
Digunakan file data hsb2.dta.
. use “D:\Data\Stata\hsb2”, clear
. list read write in 1/10
+--------------+
| read write |
|--------------|
1. | 57 52 |
2. | 68 59 |
3. | 44 33 |
4. | 63 44 |
5. | 47 52 |
|--------------|
6. | 44 52 |
7. | 50 59 |
8. | 34 46 |
9. | 63 57 |
10. | 57 55 |
+--------------+
68
Bab 5. Analisis Statistik Sederhana
. ttest read==write
Paired t test
------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------
read | 200 52.23 .7249921 10.25294 50.80035 53.65965
write | 200 52.775 .6702372 9.478586 51.45332 54.09668
---------+--------------------------------------------------------
diff | 200 -.545 .6283822 8.886666 -1.784142 .6941424
------------------------------------------------------------------
mean(diff) = mean(read - write) t = -0.8673
Ho: mean(diff) = 0 degrees of freedom = 199
Contoh 5.7:
. ttesti 24 62.6 15.8 75
(immediate form; n = 24, x = 62.6, SD = 15.8; test µ = 75)
One-sample t test
-----------------------------------------------------------
| Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
----+------------------------------------------------------
x | 24 62.6 3.225161 15.8 55.92825 69.27175
-----------------------------------------------------------
69
Bab 5. Analisis Statistik Sederhana
Contoh 5.8:
. ttesti 12 21.00 0.788 12 22.75 0.938
70
Bab 5. Analisis Statistik Sederhana
Uji khi-kuadrat
case
1 0
1 a b n1
exposed
0 c d n2
m1 m2 n
71
Bab 5. Analisis Statistik Sederhana
Salah satu opsi pada [, cc_options] ialah [, exact], yaitu opsi untuk
meminta uji eksak Fisher.
Contoh 5.9:
Digunakan file data tt_headache_part-1.dta.
. use “D:\Data\Stata\ tt_headache_part-1”, clear
Membuka file tt_headache_part-1.dta.
. list nktt tpa_kat in 1/5
Memperlihat isi sebagian dataset untuk variabel nktt (respons; variabel baris
pada tabel) dan tpa_kat (prediktor; variabel kolom pada tabel) pada record 1
s.d. 5
+----------------+
| nktt tpa_kat |
|----------------|
1. | 0 1 |
2. | 1 0 |
3. | 1 1 |
4. | 0 0 |
5. | 0 0 |
+----------------+
. tab2 nktt tpa_kat
Perintah untuk melakukan tabulasi silang variabel nktt dengan tpa_kat.
-> tabulation of nktt by tpa_kat
| TPA_kat
NKTT | 0 1 | Total
-----------+----------------------+----------
0 | 86 24 | 110
1 | 44 64 | 108
-----------+----------------------+----------
Total | 130 88 | 218
Selanjutnya dengan asumsi data berasal dari studi kasus-kontrol,
hendak dilakukan pengestimasian nilai rasio odds prediktor tpa_kat
(exposed) dengan respons nktt (case) serta uji hipotesis H 0 : OR = 1.
73
Bab 5. Analisis Statistik Sederhana
. cc nktt tpa_kat
Proportion
| Exposed Unexposed | Total Exposed
----------------+--------------------+--------------------
Cases | 64 44 | 108 0.5926
Controls | 24 86 | 110 0.2182
----------------+--------------------+--------------------
Total | 88 130 | 218 0.4037
| |
| Point estimate |[95% Conf. Interval]
|--------------------+--------------------
Odds ratio | 5.212121 | 2.770114 9.888089 (exact)
Attr. frac. ex. | .8081395 | .639004 .8988682 (exact)
Attr. frac. pop | .4788975 |
+-----------------------------------------
chi2(1) = 31.74 Pr>chi2 = 0.0000
| TPA_kat |
| Exposed Unexposed | Total
----------------+---------------------+----------
Cases | 64 44 | 108
Noncases | 24 86 | 110
----------------+---------------------+----------
Total | 88 130 | 218
| |
Risk | .7272727 .3384615 | .4954128
| |
74
Bab 5. Analisis Statistik Sederhana
75
Bab 5. Analisis Statistik Sederhana
Contoh 5.10:
Digunakan file data ccxmpl.dta.
. webuse ccxmpl
. list
+-----------------------+
| case exposed pop |
|-----------------------|
1. | 1 1 4 |
2. | 1 0 386 |
3. | 0 1 4 |
4. | 0 0 1250 |
+-----------------------+
Berbeda dengan contoh file data terdahulu, pada file ccxmpl ini
hanya ada 4 records, tiap record tidak menyatakan data untuk 1 orang
responden, melainkan nilai-nilai frekuensi pada tabel 2×2. Ada 4 responden
dengan nilai case = 1 dan exposed = 1; 386 responden dengan nilai case =
1 dan exposed = 0; dan seterusnya; sehingga jumlah responden seluruhnya
adalah 4 + 386 + 4 + 1250 = 1644 orang responden. Di sini tidak boleh
dilakukan perintah tabulate case exposed, chi2. Perintah yang dapat
digunakan di sini adalah cci.
Contoh 5.11:
. csi 7 12 9 2
| Exposed Unexposed | Total
-----------------+-------------------+----------
Cases | 7 12 | 19
Noncases | 9 2 | 11
-----------------+-------------------+----------
Total | 16 14 | 30
| |
Risk | .4375 .8571429 | .6333333
| |
| Point estimate | [95% Conf. Interval]
|-------------------+---------------------
Risk difference | -.4196429 | -.7240828 -.1152029
Risk ratio | .5104167 | .2814332 .9257086
Prev. frac. ex. | .4895833 | .0742914 .7185668
Prev. frac. pop | .2611111 |
+-----------------------------------------
chi2(1) = 5.66 Pr>chi2 = 0.0173
. csi 7 12 9 2, exact
| Exposed Unexposed | Total
-----------------+--------------------+----------
Cases | 7 12 | 19
Noncases | 9 2 | 11
-----------------+--------------------+----------
Total | 16 14 | 30
| |
Risk | .4375 .8571429 | .6333333
| |
| Point estimate | [95% Conf. Interval]
|--------------------+---------------------
Risk difference | -.4196429 | -.7240828 -.1152029
Risk ratio | .5104167 | .2814332 .9257086
Prev. frac. ex. | .4895833 | .0742914 .7185668
Prev. frac. pop | .2611111 |
77
Bab 5. Analisis Statistik Sederhana
+------------------------------------------
1-sided Fisher's exact P = 0.0212
2-sided Fisher's exact P = 0.0259
Contoh 5.12:
78
Bab 5. Analisis Statistik Sederhana
Census | agecat
Region | 19-29 30-34 35+ | Total
-----------+---------------------------------+----------
NE | 46 83 37 | 166
N Cntrl | 162 92 30 | 284
South | 139 68 43 | 250
West | 160 73 23 | 256
-----------+---------------------------------+----------
Total | 507 316 133 | 956
Census | agecat
Region | 19-29 30-34 35+ | Total
-----------+---------------------------------+----------
NE | 46 83 37 | 166
N Cntrl | 162 92 30 | 284
South | 139 68 43 | 250
West | 160 73 23 | 256
-----------+---------------------------------+----------
Total | 507 316 133 | 956
79
Bab 6. Analisis Variansi
BAB 6
ANALISIS VARIANSI
Analisis variansi (analysis of variance; ANOVA) adalah analisis
statistik untuk mengkaji perbedaan rerata antar lebih daripada 2 kategori,
seperti pada uji t, yang mengkaji perbedaan rerata antara 2 kategori.
80
Bab 6. Analisis Variansi
Contoh 6.1:
File data yang digunakan pada contoh ini adalah hsb2.dta, memuat
data tentang 200 siswa yang terbagi atas 3 tipe program (prog), yaitu
general, academic, dan vocation. Akan dikaji apakah ada perbedaan rerata
nilai write antar ketiga tipe program tersebut.
. use “D:\Data\Stata\hsb2”
(highschool and beyond (200 cases))
81
Bab 6. Analisis Variansi
82
Bab 6. Analisis Variansi
Contoh 6.2:
. use “D:\Data\Stata\apple”, clear
(Apple trees)
. oneway weight treatment
Analysis of Variance
Source SS df MS F Prob > F
----------------------------------------------------------
Between groups 5295.54433 3 1765.18144 21.46 0.0013
Within groups 493.591667 6 82.2652778
----------------------------------------------------------
Total 5789.136 9 643.237333
Bartlett's test for equal variances: chi2(3) = 1.3900
Prob>chi2 = 0.708
. oneway weight treatment, tabulate
| Summary of Average weight in grams
Fertilizer | Mean Std. Dev. Freq.
------------+------------------------------------
1 | 111.9 6.7535176 3
2 | 52.733333 5.3928966 3
3 | 78.65 11.667262 2
4 | 77.5 14.424978 2
------------+------------------------------------
Total | 80.62 25.362124 10
83
Bab 6. Analisis Variansi
0 50 100
mean of weight
84
Bab 6. Analisis Variansi
H 0 : β1 = β 2 = . . . = β q (6.2.b)
Contoh 6.3:
. use "D:\Data\Stata\systolic", clear
(Systolic Blood Pressure Data)
| Patient's Disease
Drug Used | 1 2 3 | Total
-----------+---------------------------------+----------
1 | 29.333333 28.25 20.4 | 26.066667
| 13.017936 5.85235 13.371612 | 11.677002
| 6 4 5 | 15
-----------+---------------------------------+----------
2 | 28 33.5 18.166667 | 25.533333
| 10.977249 2.081666 12.528634 | 11.61813
| 5 4 6 | 15
-----------+---------------------------------+----------
85
Bab 6. Analisis Variansi
86
Bab 6. Analisis Variansi
disease |
1 | 21.79871 2.43044 8.97 0.000 16.92168 26.67575
2 | 19.65957 2.436121 8.07 0.000 14.77113 24.548
3 | 15.36463 2.363042 6.50 0.000 10.62284 20.10642
---------------------------------------------------------------
. quietly: margins drug
. marginsplot
Variables that uniquely identify margins: drug
1 2 3 4
Drug Used
87
Bab 6. Analisis Variansi
Contoh 6.4:
. use "D:\Data\Stata\systolic", clear
(Systolic Blood Pressure Data)
. anova systolic drug disease drug#disease
Number of obs = 58 R-squared = 0.4560
Root MSE = 10.5096 Adj R-squared = 0.3259
Source | Partial SS df MS F Prob > F
-------------+--------------------------------------------
Model | 4259.33851 11 387.212591 3.51 0.0013
|
drug | 2997.47186 3 999.157287 9.05 0.0001
disease | 415.873046 2 207.936523 1.88 0.1637
drug#disease | 707.266259 6 117.87771 1.07 0.3958
|
Residual | 5080.81667 46 110.452536
-------------+--------------------------------------------
Total | 9340.15517 57 163.862371
Dengan p = 0.3958, berarti tidak ada interaksi antara antara efek drug
dan disease terhadap systolic.
. margins drug disease drug#disease
Predictive margins Number of obs = 58
Expression : Linear prediction, predict()
---------------------------------------------------------------------
| Delta-method
| Margin Std. Err. t P>|t| [95% Conf. Interval]
-------------+-------------------------------------------------------
drug |
1 | 25.89799 2.750533 9.42 0.000 20.36145 31.43452
2 | 26.41092 2.742762 9.63 0.000 20.89003 31.93181
3 | 9.722989 3.099185 3.14 0.003 3.484652 15.96132
4 | 13.55575 2.640602 5.13 0.000 8.24049 18.871
88
Bab 6. Analisis Variansi
|
disease |
1 | 21.95862 2.442515 8.99 0.000 17.04209 26.87515
2 | 20.4204 2.457703 8.31 0.000 15.4733 25.3675
3 | 15.65 2.360482 6.63 0.000 10.8986 20.4014
|
drug#disease |
1 1 | 29.33333 4.290543 6.84 0.000 20.69692 37.96975
12 | 28.25 5.25482 5.38 0.000 17.6726 38.8274
13 | 20.4 4.700054 4.34 0.000 10.93928 29.86072
21 | 28 4.700054 5.96 0.000 18.53928 37.46072
22 | 33.5 5.25482 6.38 0.000 22.9226 44.0774
2 3 | 18.16667 4.290543 4.23 0.000 9.530252 26.80308
3 1 | 16.33333 6.067744 2.69 0.010 4.119599 28.54707
32 | 4.4 4.700054 0.94 0.354 -5.060718 13.86072
33 | 8.5 5.25482 1.62 0.113 -2.077404 19.0774
41 | 13.6 4.700054 2.89 0.006 4.139282 23.06072
4 2 | 12.83333 4.290543 2.99 0.004 4.196919 21.46975
43 | 14.2 4.700054 3.02 0.004 4.739282 23.66072
----------------------------------------------------------------------
. quietly: margins drug#disease
. marginsplot
Variables that uniquely identify margins: drug disease
1 2 3 4
Drug Used
disease=1 disease=2
disease=3
89
Bab 7. Analisis Regresi Linear
BAB 7
ANALISIS REGRESI LINEAR
90
Bab 7. Analisis Regresi Linear
Contoh 7.1:
. use “D:\Data\Stata\elemapi”
. describe enroll api00
storage display value
variable name type format label variable label
------------------------------------------------------
enroll int %9.0g number of students
api00 int %6.0g api 2000
enroll : Jumlah siswa
api00 : Kinerja akademik sekolah pada tahun 2000
91
Bab 7. Analisis Regresi Linear
----------------------------------------------------------------
api00 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------+--------------------------------------------------------
enroll | -.1998674 .0298512 -6.70 0.000 -.2585532 -.1411817
_cons | 744.2514 15.93308 46.71 0.000 712.9279 775.5749
----------------------------------------------------------------
Hasil dan kesimpulannya yaitu:
- Uji F untuk menguji asumsi bahwa model benar bermakna secara
statistik (p = 0.0000)
- Koefisien determinasi R 2 = 0.1012, menyatakan bahwa prediktor enroll
“menjelaskan” 10.12% variansi respons api00.
- Uji t untuk prediktor enroll bermakna secara statistik (p = 0.000)
- Koefisien regresi adalah enroll −0.1998674 ≈ −0.2
- Konstante adalah 744.2514, yaitu nilai prediksi api00 jika enroll = 0. Ini
adalah kesimpulan statistik yang tidak realistik, karena jika tidak ada
siswa (enroll = 0), tidak akan ada kinerja akademik sekolah (api00).
Perintah berikut adalah untuk menyajikan grafik yang dapat menilai
kebenaran asumsi linearitas secara kasar.
. graph twoway scatter api00 enroll || lfit api00 enroll
1000
800
600
400
92
Bab 7. Analisis Regresi Linear
Uji asumsi linearitas yang lebih eksak ialah uji lack-of-fit, yang
menguji hipotesis H 0 : Tidak ada “lack of linear fit”
. regress api00 enroll
. maxr2
maximum R-square = 0.7917
relative R-square = 0.1279
actual adjusted R-square = 0.0990
relative adjusted R-square = 0.1257
93
Bab 7. Analisis Regresi Linear
chi2(1) = 1.91
Prob > chi2 = 0.1665
Tidak ditemukan heteroskedastisitas (p = 0.1665)
. estat imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(2) = 3.78
Prob > chi2 = 0.1514
---------------------------------------------------
Source | chi2 df p
---------------------+-----------------------------
Heteroskedasticity | 3.78 2 0.1514
Skewness | 34.11 1 0.0000
Kurtosis | 26.44 1 0.0000
---------------------+-----------------------------
Total | 64.32 4 0.0000
---------------------------------------------------
Tidak ditemukan heteroskedastisitas (glasshour) dengan p = 0.1514.
94
Bab 7. Analisis Regresi Linear
Contoh 7.2:
. use “D:\Data\Stata\elemapi.dta”, clear
. tabulate yr_rnd
year round |
school | Freq. Percent Cum.
-----------+-----------------------------------
No | 308 77.00 77.00
Yes | 92 23.00 100.00
-----------+-----------------------------------
Total | 400 100.00
95
Bab 7. Analisis Regresi Linear
Yi = β 0 + β 1 X1i + β 2 X 2i + . . . + β p X pi + ε i (7.3)
Sintaks-nya adalah:
regress depvar indepvars [if] [in] [, options]
Asumsi yang berlaku di sini adalah sama seperti pada regresi linear
sederhana, dengan tambahan asumsi tidak ada multikolinearitas. Perintah
untuk uji multikolinearitas adalah vif yang menampilkan hasil perhitungan
variance inflation factor.
Contoh 7.3:
. use “ D:\Data\Stata\elemapi”
Variabel-variabel dalam dataset adalah:
api00 : Kinerja akademik sekolah tahun 2000
acs_k3 : Rerata ukuran kelas dari TK s.d. kelas 3
meals : Persentase siswa yang mendapat makan gratis (indikator
kemiskinan)
96
Bab 7. Analisis Regresi Linear
+---------------------------------+
| api00 acs_k3 meals full |
|---------------------------------|
1. | 693 16 67 76.00 |
2. | 570 15 92 79.00 |
3. | 546 17 97 68.00 |
4. | 571 20 90 87.00 |
5. | 478 18 89 87.00 |
|---------------------------------|
6. | 858 20 . 100.00 |
7. | 918 19 . 100.00 |
+---------------------------------+
Perintah berikut menampilkan matriks grafik diagram tebar untuk
tiap pasangan variabel kontinu:
. graph matrix api00 acs_k3 meals full, half
api
2000
20
avg
class
0 size
k-3
-20
100
pct
50 free
meals
0
100.00
0.00
400 600 800 1000
-20 0 20 0 50 100
97
Bab 7. Analisis Regresi Linear
--------------------------------------------------------------------------
api00 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+----------------------------------------------------------------
acs_k3 | -2.681508 1.393991 -1.92 0.055 -5.424424 .0614073
meals | -3.702419 .1540256 -24.04 0.000 -4.005491 -3.399348
full | .1086104 .090719 1.20 0.232 -.0698947 .2871154
_cons | 906.7392 28.26505 32.08 0.000 851.1228 962.3555
--------------------------------------------------------------------------
Kesimpulan yang diperoleh yaitu:
- Rerata ukuran kelas (acs_k3, b = −2.68) tampak tak bermakna (p =
0.055). Koefisien negatif mengindikasikan bahwa ukuran kelas yang
lebih besar terkait dengan kinerja akademik yang lebih rendah.
- Efek meals (b = −3.70, p = 0.000) bermakna. Koefisien negatif
menunjukkan bahwa semakin besar proporsi siswa penerima makanan
gratis, semakin rendah kinerja akademik.
Ini tak berarti bahwa makanan gratis menyebabkan kinerja akademik
yang rendah. Variabel meals terkait erat dengan tingkat penghasilan dan
98
Bab 7. Analisis Regresi Linear
99
Bab 7. Analisis Regresi Linear
Z1 Z2
X=1 0 0
X=2 1 0
X=3 0 1
Misalnya, variabel ses dengan 3 taraf direpresentasikan oleh 2
variabel indikator yang dibentuk oleh i.ses (X = 1 menjadi baseline).
Contoh 7.4:
. use “D:\Data\Stata\hsb2”, clear
(highschool and beyond (200 cases))
. tabulate ses
100
Bab 7. Analisis Regresi Linear
--------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+-----------------------------------------------------
ses |
middle| 4.003135 1.702093 2.35 0.020 .6464741 7.359797
high | 7.746148 1.873189 4.14 0.000 4.052072 11.44022
|
_cons | 47.70213 1.392197 34.26 0.000 44.9566 50.44765
--------------------------------------------------------------
101
Bab 7. Analisis Regresi Linear
Contoh 7.5:
. use “D:\Data\Stata\honolulu”
. regress tek_darah usia kolesterol
-----------------------------------------------------------------
tek_darah | Coef. Std. Err. t P>|t| [95% Conf. Interval]
----------+------------------------------------------------------
usia | .8469443 .408067 2.08 0.041 .0370443 1.656844
kolesterol| .0906782 .0535687 1.69 0.094 -.0156407 .1969972
_cons | 64.97095 23.74061 2.74 0.007 17.85242 112.0895
-----------------------------------------------------------------
102
Bab 7. Analisis Regresi Linear
------------------------------------------------------------------------------
tek_darah | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------------------+---------------------------------------------------------
usia | 4.383427 2.729183 1.61 0.112 -1.033959 9.800813
kolesterol | .9399724 .6503 1.45 0.152 -.3508628 2.230808
|
c.usia#c.kolesterol | -.0158138 .0120677 -1.31 0.193 -.0397681 .0081404
|
_cons | -124.6174 146.5978 -0.85 0.397 -415.6118 166.377
------------------------------------------------------------------------------
-----------------------------------------------------------------
tek_darah | Coef. Std. Err. t P>|t| [95% Conf. Interval]
----------+------------------------------------------------------
usia | .9466804 .4112442 2.30 0.023 .1304745 1.762886
rokok | 3.566772 4.323255 0.83 0.411 -5.013693 12.14724
_cons | 77.97196 22.34209 3.49 0.001 33.6291 122.3148
-----------------------------------------------------------------
103
Bab 7. Analisis Regresi Linear
-----------------------------------------------------------------------
tek_darah | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+---------------------------------------------------------
usia | 1.040749 .5035781 2.07 0.041 .041154 2.040343
rokok | 18.94451 47.26727 0.40 0.689 -74.88028 112.7693
|
rokok#c.usia |
1 | -.2877643 .8807723 -0.33 0.745 -2.036083 1.460555
|
_cons | 72.89675 27.29671 2.67 0.009 18.7132 127.0803
-----------------------------------------------------------------------
-----------------------------------------------------------------
tek_darah | Coef. Std. Err. t P>|t| [95% Conf. Interval]
----------+------------------------------------------------------
usia | .8387384 .420814 1.99 0.049 .0032023 1.674275
|
pend |
2 | -1.292157 5.573684 -0.23 0.817 -12.35884 9.774523
3 | -.0548732 6.053667 -0.01 0.993 -12.07457 11.96482
4 | -12.39448 8.182403 -1.51 0.133 -28.64083 3.851877
5 | -7.623154 7.872033 -0.97 0.335 -23.25326 8.006951
|
_cons | 87.38939 23.51743 3.72 0.000 40.69497 134.0838
-----------------------------------------------------------------
104
Bab 7. Analisis Regresi Linear
---------------------------------------------------------------------
tek_darah | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+-------------------------------------------------------
usia | 1.328125 .7005981 1.90 0.061 -.0637355 2.719985
|
pend |
2 | 49.26815 52.90101 0.93 0.354 -55.82895 154.3652
3 | -11.77593 69.6128 -0.17 0.866 -150.0739 126.5221
4 | 17.71206 126.0571 0.14 0.889 -232.7224 268.1465
5 | 155.7896 116.6524 1.34 0.185 -75.96074 387.5399
|
pend#c.usia |
2 | -.9249705 .9623264 -0.96 0.339 -2.8368 .9868588
3 | .2471469 1.303531 0.19 0.850 -2.342544 2.836838
4 | -.5503472 2.392998 -0.23 0.819 -5.304456 4.203761
5 | -3.089319 2.206097 -1.40 0.165 -7.472116 1.293478
|
_cons | 60.47312 38.76049 1.56 0.122 -16.53136 137.4776
---------------------------------------------------------------------
105
Bab 8. Analisis Regresi Logistik
BAB 8
ANALISIS REGRESI LOGISTIK
Yˆ
dan: logit Yˆ = ln = β 0 + β1 X (8.2)
1 − Yˆ
dengan Y biner; Yi = 0, 1.
Estimasinya yang diperoleh dari data sampel adalah:
Yˆ
logit Yˆ = ln = b0 + b1 X (8.2.a)
1 − Yˆ
Perhatikan bahwa:
- Untuk model regresi logistik sederhana, ruas kanan persamaan (2)
hanya memiliki satu prediktor X.
- Pada ruas kanan persamaan (2) tidak didapatkan suku galat seperti
halnya pada model regresi linear dengan respons kontinu.
Prediktor X dapat berupa variabel kontinu ataupun kategorik. Jika
prediktor X kategorik, dalam persamaan (2) dinyatakan dengan satu atau
lebih variabel indikator seperti halnya pada model regresi linear.
Karena nilai Yˆ merupakan sebuah nilai probabilitas, nilai Yˆ dibagi
dengan komplemennya (= 1 − Yˆ ) adalah nilai odds Yˆ :
Yˆ
Odds Yˆ = (8.3)
1 − Yˆ
dan logit Yˆ dinamakan juga ln odds Yˆ :
logit Yˆ = log odds Yˆ
106
Bab 8. Analisis Regresi Logistik
1
dan Yˆ = P [ Y = 1 X ] = (8.4)
1 + exp− ( β0 + β1 X )
Estimasinya dari data sampel adalah:
1
Yˆ = P [ Y = 1 X ] = (8.4.a)
1 + exp− ( b0 +b1 X )
Yˆ
Dari persamaan ln = β 0 + β1 X , diperoleh:
1 − Yˆ
Yˆ
Odds Yˆ = = exp− ( β0 + β1 X )
1 − Yˆ
Jika X juga biner, maka:
untuk X = 1 → Odds Ŷ1 = exp− ( β 0 + β1 )
Y=1 Y=0
X=1 a b
X=0 c d
107
Bab 8. Analisis Regresi Logistik
- Respons ada (Y = 1) pada kolom kiri dan respons tidak ada (Y = 0) pada
kolom kanan.
Jika X kontinu, maka X = 0 pada tabel di atas diganti dengan X = x
dan X = 1 diganti dengan X = x + 1 (diasumsikan rasio odds konstan untuk
tiap pertambahan nilai X sebesar 1 satuan):
Y=1 Y=0
X=x+1 a b
X=x c d
Contoh 8.1:
. use "D:\Data\Stata\tension-type headache.dta", clear
. logit nktt hos
108
Bab 8. Analisis Regresi Logistik
-----------------------------------------------------------
nktt | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------+----------------------------------------------------
hos | .1537723 .0330478 4.65 0.000 .0889998 .2185448
_cons | -1.918308 .4331991 -4.43 0.000 -2.767363 -1.069253
-----------------------------------------------------------
109
Bab 8. Analisis Regresi Logistik
Contoh 8.2:
Dalam contoh ini digunakan file data binary.dta, yang memuat data
penerimaan mahasiswa program pascasarjana (admit) sebagai respons.
Prediktornya adalah nilai-nilai mahasiswa di program sarjana, yaitu gre
(skor Graduate Record Exam), gpa (Grade Point Average), dan rank
(prestise perguruan tinggi asal).
. use "D:\Data\Stata\binary.dta", clear
. summarize gre gpa
gre dan gpa adalah variabel kontinu.
110
Bab 8. Analisis Regresi Logistik
. tab admit
admit sebagai respons, merupakan variabel biner.
admit | Freq. Percent Cum.
-------+------------------------------
0 | 273 68.25 68.25
1 | 127 31.75 100.00
-------+------------------------------
Total | 400 100.00
111
Bab 8. Analisis Regresi Logistik
rank |
2 | -.6754429 .3164897 -2.13 0.033 -1.295751 -.0551346
3 | -1.340204 .3453064 -3.88 0.000 -2.016992 -.6634158
4 | -1.551464 .4178316 -3.71 0.000 -2.370399 -.7325287
|
_cons | -3.989979 1.139951 -3.50 0.000 -6.224242 -1.755717
-----------------------------------------------------------------
Perintah test menguji efek menyeluruh (overall effect) prediktor
rank.
. test 2.rank 3.rank 4.rank
( 1) [admit]2.rank = 0
( 2) [admit]3.rank = 0
( 3) [admit]4.rank = 0
chi2( 3) = 20.90
Prob > chi2 = 0.0001
Tampak bahwa efek menyeluruh rank bermakna secara statistik.
Dalam perintah berikut akan diuji kesamaan koefisien rank=2 dengan
koefisien rank=3.
( 1) [admit]2.rank - [admit]3.rank = 0
chi2( 1) = 5.51
Prob > chi2 = 0.0190
. logit , or
Perintah ini adalah untuk mendapatkan estimasi nilai-nilai rasio odds.
Logistic regression Number of obs = 400
LR chi2(5) = 41.46
Prob > chi2 = 0.0000
Log likelihood = -229.25875 Pseudo R2 = 0.0829
-----------------------------------------------------------------
admit | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
------+----------------------------------------------------------
gre | 1.002267 .0010965 2.07 0.038 1.00012 1.004418
gpa | 2.234545 .7414652 2.42 0.015 1.166122 4.281877
|
112
Bab 8. Analisis Regresi Logistik
rank |
2 | .5089309 .1610714 -2.13 0.033 .2736922 .9463578
3 | .2617923 .0903986 -3.88 0.000 .1330551 .5150889
4 | .2119375 .0885542 -3.71 0.000 .0934435 .4806919
|
_cons | .0185001 .0210892 -3.50 0.000 .0019808 .1727834
-----------------------------------------------------------------
Perintah “logit , or” dapat juga diberikan dalam bentuk “logistic
admit gre gpa i.rank”.
. margins rank, atmeans
Perintah margins adalah untuk menghitung probabilitas prediksi
respons untuk masing-masing prediktor.
Adjusted predictions Number of obs = 400
Model VCE : OIM
Expression : Pr(admit), predict()
at : gre = 587.7 (mean)
gpa = 3.3899 (mean)
1.rank = .1525 (mean)
2.rank = .3775 (mean)
3.rank = .3025 (mean)
4.rank = .1675 (mean)
---------------------------------------------------------------
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
-----+---------------------------------------------------------
rank |
1 | .5166016 .0663153 7.79 0.000 .3866261 .6465771
2 | .3522846 .0397848 8.85 0.000 .2743078 .4302614
3 | .218612 .0382506 5.72 0.000 .1436422 .2935819
4 | .1846684 .0486362 3.80 0.000 .0893432 .2799937
---------------------------------------------------------------
113
Bab 9. Statistika Nonparametrik
BAB 9
STATISTIKA NONPARAMETRIK
Contoh 9.1:
Hendak diuji efektivitas fuel additive baru dengan 24 mobil, 12
dengan fuel treatment dan 12 tanpa treatment. Dataset memuat variabel mpg
(mileage rating) untuk treat yang bernilai 0 (mobil tanpa treatment) serta
mpg untuk treat bernilai 1 (mobil dengan treatment).
114
Bab 9. Statistika Nonparametrik
Contoh 9.2:
Seperti pada contoh 9.1, tetapi di sini tiap mobil dengan treatment
dipasangkan dengan 1 mobil tanpa treatment. Data mileage rating untuk tiap
pasangan berada dalam variabel mpg1 dan mpg2.
. use "D:\Data\Stata\fuel.dta", clear
. signrank mpg1=mpg2
Wilcoxon signed-rank test
sign | obs sum ranks expected
-------------+---------------------------------
positive | 3 13.5 38.5
negative | 8 63.5 38.5
zero | 1 1 1
-------------+---------------------------------
all | 12 78 78
unadjusted variance 162.50
adjustment for ties -1.63
adjustment for zeros -0.25
115
Bab 9. Statistika Nonparametrik
----------
adjusted variance 160.63
Contoh 9.3:
. use “D:\Data\Stata\census”, clear
(1980 Census data by state)
. tab region
Census |
region | Freq. Percent Cum.
---------+---------------------------
NE | 9 18.00 18.00
N Cntrl | 12 24.00 42.00
South | 16 32.00 74.00
West | 13 26.00 100.00
---------+---------------------------
Total | 50 100.00
116
Bab 9. Statistika Nonparametrik
117
Bab 9. Statistika Nonparametrik
118
Kepustakaan
KEPUSTAKAAN
Acock AC. A Gentle Introduction to Stata, 4rd Ed. College Station: Stata
Press, 2014.
Hamilton LC. Statistics with Stata: Updated for Version 12. Boston, MA:
Brooks/Cole, Cenage Learning, 2013.
Kohler U, Kreuter F. Data Analysis Using Stata, 3rd Ed. College Station:
Stata Press, 2012.
119
Kepustakaan
StataCorp LP. Stata Base Reference Manual: Release 14. College Station,
Texas: Stata Press, 2015.
_______. Stata User’s Guide: Release 14. College Station, Texas: Stata
Press, 2015.
120