Anda di halaman 1dari 33

I. Modul Belajar Stata 8.0 & 9.

0
 
Modul ini disusun dengan tujuan sebagai materi pelengkap bagi mahasiswa /praktisi /peneliti 
agar  lebih  mudah  memanfaatkan  program  stata  diperkuliahan  /pekerjaan  sehari‐hari.  Berlatar 
belakang  pengalaman  penulis  sebagai  statistisi  diharapkan  materi  ini  lebih  ptaktis  sebagai  bahan 
belajar. Sangat diharapkan membaca sumber aslinya untuk memperkaya ilmu. 
 
Menu‐menu Help dalam Stata 8.0 
< help contents> 
 
Top 
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ 
Category listings 
    A. Basics 
        language syntax, expressions and functions, ... 
    B. Data management 
        inputting, editing, creating new variables, ... 
    C. Statistics 
        summary statistics, tables, estimation, ... 
    D. Graphics 
        scatter plots, bar charts, ... 
    E. Programming and matrices 
        do‐files, ado‐files, Mata, matrices 
 
Help file listings 
    Language syntax 
        advice on what to type 
    Manual datasets 
        download datasets from the Reference manuals 
    Copyrights 
 
Basics : berisikan syntax stata, fungsi operasi dan berbagai 
Basics  aturan dalam penulisan perintah  
Manejeman Data  Data Management: Berisi input data, Editing, Membuat 
Variabel, Labelling variabel dan data, dll. 
Statistics : berisi ringkasan statistik, pembuatan tabel , 
Statistik  estimasi statistik dll 
Grafik  : Scatter Plot, Batang, Pie, dll 
Grafik 
Pemrograman : File do stata, ado dan beberapa fasilitas 
Pemrograman   syntax dalam stata 
(do & ado files) 

 
Bagan 1. Kontens Stata 
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 1


Oleh : Ki Hariyadi 
Basic Course (Univariate – Analisis Satu Variabel) 
 
   1. Struktur Data  
   2. Pengantar Pemakaian Stata 8.0 
   3. Ukuran Statistik /Ringkasan Statistik 
   4. Penyajian Tabel (Basic Table and Custom Table) 
   5. Penyajian Grafik 
   6. Pengujian Distribusi Data 
   7. Uji T Test (Satu Sampel) 
   8. Penyajian hasil output Stata 
 
 

P engantar 
 
Kursus  ini  bertujuan  memberikan  materi  terkait  berbagai  teknik  komputasi  statistik.  Beberapa 
pengujian  yang  ada  akan  dikenalkan.  Metode  pembelajaran  berbasis  kasus  menjadikan  setiap 
peserta terampil menyelesaikan permasalahan kasus nyata. 
 
Munculnya program Stata, menjadikan proses komputasi menjadi lebih mudah. Berbagai teknik yang 
kompleks  dapat  secara  mudah  diselesaikan  dengan  program  ini.  Pengenalan  data  dengan  struktur 
data yang sesuai dengan type data akan menjadi dasar meringkas, menyajikan dan interpretasi hasil. 
Output  kursus  ini  adalah  dapat  menjadikan  praktisi  statistik  yang  memiliki  dasar  pengolahan  data 
yang baik, dengan pemrograman Stata. 
 
 
Bagaimana Belajar Stata secara Mudah? 
 
Banyak pertanyaan yang sering saya peroleh. Bagaimana cara belajar Stata mas? Bahkan beberapa di 
antaranya sudah memiliki dasar pengolahan data, artinya hanya tinggal “mengupdate” dengan 
bahasa pemrograman baru yaitu Stata (versi 8 atau 9). 
 
Stata dapat dipelajari secara sederhana. Beberapa cara yang ada dengan sumber‐sumber on line 
yang ada, yaitu bersumber dari: 
1. Help di Program Stata 
2. Web Stata (http://www.stata.com/) 
3. Belajar On Line di UCLA (http://http//www.ats.ucla.edu/stat) 
 
Ucla  adalah  salah  satu  sumber  belajar  online  yang  sangat  ..sangat  membantu  belajar.  Beberapa 
program  pengolahan  data,  antara  lain:  (1).  Stata,  (2).  SPSS  dan  (3).  SAS  secara  lengkap  …dapat 
diperoleh  sumber  ini  artinya  referensinya  sangat  terpercaya,  karena  updatenya  yang  selalu 
dilakukan.  
 
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 2


Oleh : Ki Hariyadi 
Dua hal berikut ini yang akan menjadi fokus kursus pada modul ini yaitu: 
 
I. Top > A. Basics 
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ 
Category listings 
    A1. Syntax 
        how‐to guide for commands, variables, expressions, functions, ... 
    A2. Memory considerations 
        Stata stores the dataset in RAM; you can change how much memory Stata 
        uses and compress your dataset 
    A3. Logging 
        making copies of your Stata session 
    A4. Using the Internet 
        finding and installing help, additions, and updates 
    A5. Using the windows and console 
        viewing files and logs, launching dialogs, setting the fonts, ... 
    A6. Utility commands and commands that everyone should know 
        change directory, copy files, type files, plus many more 
    A7. Customizing Stata 
        Stata executes profile.do when it is invoked 
 
Help file listings 
    Language syntax 
        advice on what to type 
 
II. Top > B. Data management 
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ 
Category listings 
    B1. Inputting data 
        inputting data from the keyboard, from a file, or from a spreadsheet 
    B2. Editing data 
        using the data editor 
    B3. Creating and changing variables 
        generate newvar = ...  and   replace oldvar = ... 
        also recoding, smoothing, renaming, dropping, ... variables 
    B4. Saving and reusing data 
        in both Stata and non‐Stata (export) format 
    B5. Data reorganization 
        sort, stack, reshape, make dataset of means or other summary 
        statistics, ... 
    B6. Merging and appending datasets 
        two datasets combined into one, either by tacking on new observations 
        (appending) or by tacking on new variables (merging) 
    B7. Utilities 
        describing, comparing, ... 
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐  

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 3


Oleh : Ki Hariyadi 
2. Pengoperasional Program Stata 
Beberapa  hal  yang  harus  diketahui  adalah  (1)  Menjalankan  Stata  di  lingkungan  Windows  (baik 
XP,  Vista,  dan  lainnya)  (2)  Pemanfaatan  menu  “help”  secara  efektif  dan  efisien  tanpa  harus 
membaca keseluruhan (3) Stata Console (4) Menu Bar dan Tools Bar (5) Membuat “log file” (6) 
Mengatur memory kerja (7) membaca isi data (8) Labelling variabel  

2.1. Menjalankan Stata di Windows 
Dari menu program (shortcut di desktop) jalankan program stata. 
Tampilan awal  

Review 
Aktivitas  Hasil  
Eksekusi command 

Variabel 
Aktif  Perintah  
Stata 
dijalankan 

2.2. Pemanfaatan Menu “Help” 
Dari menu bar pilih Help  
                                  Content’s 
Atau  
 
dari stata command ketik help <Enter> atau help contents <Enter> 
 
Fasilitas  help  ini  secara  mudah  akan  membawa  ke  manual  perintah  stata  yang  tidak  kita 
mengerti misal : help label , help save , help set, dll  
 
2.3. Stata Console 
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 4


Oleh : Ki Hariyadi 
2.4. Menu bar dan Tools bar 
 
Menu Bar 
Tools Bar 

 
 
Menu  Bar  membantu  pengguna  menjalankan  perintah‐perintah  aplikasi  stata,  mengingatkan 
pengguna apabila “command syntax” terlupa. 
Tools  Bar  membantu  pengguna  secara  cepat  untuk  beberapa  fungsi  kerja  seperti  Open,  Save, 
Printing, Begin Log, Do Editor, File Data Editor, Browsing Data  dan lain sebagainya.  
2.5. Log Files 
Untuk mengetahui riwayat proses pengolahan data yang dilakukan stata memberi fasilitas “Log 
Files”. Hal‐hal yang sudah dilakukan dapat di koreksi atau di chek kembali dengan melihat “Log 
Files”.  
Kursus pelatihan yang dilakukan juga dapat di simpan agar dapat di ulang kembali setelah selesai 
pelatihan.  

 
 

 
Simpan Log File anda dengan nama “kursus.smcl” 

Syntax  
log using latihan, replace 
 
log close 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 5


Oleh : Ki Hariyadi 
2.6. Memory Kerja 
 
Agar pemrosesan data dapat lebih efisien dan maksimal, dibutuhkan pengaturan memory kerja. 
Semakin  tepat  pengaturan  alokasi  memori  maka  akan  mendukung  jalannya  komputasi  lebih 
optimal. 

Tips : Pengolahan Data besar akan membutuhkan pengaturan memori,


namun untuk data secara umum dengan format/setting “default” program sudah
memberikan solusi secara umum.

Perintah umumnya  

set memory #[b|k|m|g] [, permanently ]


memory
query memory (see help SpecialEdition)
set virtual { on | off }
where # is specified in terms of bytes, kilobytes, megabytes, or
gigabytes, and b, k, m, and g may be typed in uppercase.

Contoh : set mem 10m <Enter> 
(men‐set memori kerja sebesar 10 mega byte) 
 
Melihat memory yang teralokasi  
   memory <Enter> 
bytes
--------------------------------------------------------------------
Details of set memory usage
overhead (pointers) 0 0.00%
data 0 0.00%
----------------------------
data + overhead 0 0.00%
free 1,048,568 100.00%
----------------------------
Total allocated 1,048,568 100.00%
--------------------------------------------------------------------
Other memory usage
system overhead 745,090
set matsize usage 16,320
programs, saved results, etc. 105
---------------
Total 761,515
-------------------------------------------------------
Grand total 1,810,083
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 6


Oleh : Ki Hariyadi 
2.7. Membaca Isi Data  
 
Dari tools bar dapat secara mudah di pilih /di klik yaitu  

Dengan  tools  bar  “Editor”  data  stata  dapat  dibaca  dan  diedit  secara  mudah.  Perintah  dari 
Command Syntax adalah “edit <Enter>”  

2.8. Labeling variable 
 
Bertujuan memberi informasi untuk variabel agar dapat diketahui maksudnya secara jelas. Misal 
variabel jk di label “jenis kelamin”, variabel umur di label “Umur (thn)”. 
 
Dari command stata di ketik perintah  
label var jk “Jenis Kelamin” 
label var umur “Umur (Thn)” 

3. Struktur Data  
Tipe Data 
Numerikal  Rasio  Tinggi Badan 
  (Tipe 4)  Berat Badan 
Pendapatan 
Pengeluaran Kesehatan,  
Interval  Kepuasan, IQ 
(Tipe 3)  Persepsi, Suhu 
Kategorikal  Ordinal  Tingkat Pendidikan,  
(Tipe 2)  Golongan PNS,  
Status Pernikahan 
Nominal  Jenis Kelamin,  
(Tipe 1)  Agama,  
Golongan Darah. 
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 7


Oleh : Ki Hariyadi 
Perintah Stata untuk dapat melihat strukutur data dengan command 
 
describe <Enter> atau F3 
Contains data
obs: 15
vars: 4
size: 270 (99.9% of memory free)
------------------------------------------------------------------
storage display value
variable name type format label variable label
------------------------------------------------------------------
No byte %8.0g
Nama str11 %11s
Umur byte %8.0g
Jenis_kelamin byte %9.0g Jenis_kelamin
------------------------------------------------------------------
Sorted by:
Note: dataset has changed since last saved
Pembagian data menurut (Machin & Campbell, 2005) 
 
1. Data Kualitatif atau Kategorik 
- Nominal :    Jenis Kelamin, Laki‐laki dan perempuan 
- Ordinal : Diagnosis Pasien, Suspect a; Keparahan Penyakit  (Stadium I, II,III) 
 
2. Data Kuantitatif atau Numerik 
- Diskret  : Jumlah kasus Influensa (0, 1, 2, dst) 
- Kontinu : Kehamilan (Bln), Tinggi (cm), Berat (Kg) 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 8


Oleh : Ki Hariyadi 
Kasus & Ringkasan Deskriptif

Input data berikut ke dalam program STATA 8.0.


No  Nama  Umur  Jenis_kelamin
1  Syarif                25  Laki‐laki 
2  Adi                   26  Laki‐laki 
3  Harwanto              28  Laki‐laki 
4  Suyatno               19  Laki‐laki 
5  Zulia                 22  Perempuan 
6  Paidi                 21  Laki‐laki 
7  Muhklas               19  Laki‐laki 
8  Ahmad                 25  Laki‐laki 
9  Ida Wahmuda           26  Perempuan 
10  Sutinah               22  Perempuan 
11  Surti                 23  Perempuan 
12  Widiatun              25  Perempuan 
13  Sularso               25  Laki‐laki 
14  Winarno               26  Laki‐laki 
15  Painah                25  Perempuan 

Langkah‐langkah  
1. Buka Stata 8.0 atau 9.0 
2. Ketik “edit”  
3. Entry kan data tersebut! 

 
Setelah selesai entry proses selanjutnya adalah  
 
4. Membuat nama varibel 
5. Labelling Variabel  
6. Labelling Value 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 9


Oleh : Ki Hariyadi 
TIPS : Jangan lupa mendefault folder kerja kita dengan perintah
cd “c:/Kursus Stata”

Simpan file kerja dengan perintah “saveold latihan.dta, replace”

4. Membuat Nama Variabel 
a. rename var1 No 
b. rename var2 Nama 
c. rename var3 Umur 
d. rename var4 Jenis_kelamin 
 
5. Labelling Variabel  
1. lab var No “Nomer Urut” 
2. lab var Nama “Nama Responden” 
3. lab var Umur “Umur Responden (Thn)” 
4. lab var Jenis_kelamin “Jenis Kelamin” 
 
6. Labeling Value 
Variabel yang memiliki jenis skala kategorikal misal: Jenis Kelamin 
 
Perintah memberi label untuk variable ini adalah dengan cara  
 
label def Jenis_kelamin 1 “Laki‐laki” 2 “Perempuan” 
label val Jenis_kelamin Jenis_kelamin 
 
Hasil akhir  

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 10


Oleh : Ki Hariyadi 
Melihat hasil kerja dengan ringkasan sederhana 
 
Dari command stata ketik  
 
tab Jenis_kelamin <Enter> 
 
Hasil  

. tab Jenis_kelamin

Jenis_kelam |
in | Freq. Percent Cum.
------------+-----------------------------------
Laki-laki | 9 60.00 60.00
Perempuan | 6 40.00 100.00
------------+-----------------------------------
Total | 15 100.00
 
 
Ringkasan Deskriptif sesuai dengan tipe skala data. 
 
Tipe Skala  Ukuran  Ringkasan 
Rasio  Ukuran Pusat  Mean  
Interval  (Central Tendency)  Median  
Modus 
Summary 
Ukuran Sebaran  Standar Deviasi 
(Dispersi)  Minimum 
Maksimum 
Range 
Variansi 
Distribusi  Skewness 
(Distribution)  Kurtosis 
Nominal  Ukuran Pusat  Jumlah (n) 
Ordinal  (Central Tendency)  % 
  Ukuran Sebaran  Minimum 
(Dispersion)  Maksimum 
Range 

Lakukan pengolahan data dengan ringkasan yang tepat untuk contoh data di atas!.

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 11


Oleh : Ki Hariyadi 
4. Penyajian Tabel (Basic Table dan Custom Table)
Setelah teknik meringkas anda kuasai, tahapan selanjutnya adalah menyajikan
ringkasan statistik dalam berbagai strata analisis. Misalkan rata-rata usia per Lokasi, per
jenis kelamin, dll. Rencana ringkasan data dapat direncanakan terlebih dahulu. Contoh:

Tabel Deskripsi umur per jenis kelamin.


Usia (Thn)
Standar
Mean Median Minimum Maksimum Deviasi
Jenis Kelamin Laki-laki
Perempuan

Tabel Deskripsi umur per lokasi wilayah.


Usia (Thn)
Standar
Mean Median Minimum Maksimum Deviasi
Lokasi Sleman
Luar Sleman

Fasilitas Stata sudah memberikan kemudahan perhitungan rancangan tabel tersebut


di atas.

Dari menu Stata

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 12


Oleh : Ki Hariyadi 
Dari ”Command Stata” ketik

table Jenis_kelamin, contents(mean Umur min Umur max Umur sd Umur )

Hasil ringkasan data umur adalah


----------------------------------------------------------
Jenis_kel |
amin | mean(Umur) min(Umur) max(Umur) sd(Umur)
----------+-----------------------------------------------
Laki-laki | 23.7778 19 28 3.270236
Perempuan | 23.8333 22 26 1.722401
----------------------------------------------------------

Interpretasi Tabel Output di atas


Laki-laki memiliki rata-rata umur 23,78 tahun dan perempuan memiliki rata-rata umur 23,83
tahun. Standar deviasi laki-laki lebih besar dari perempuan, artinya distribusi umur laki-laki
variansinya lebih lebar daripada jenis kelamin perempuan.

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 13


Oleh : Ki Hariyadi 
Data Kasus yang sudah di Entry

Ringkasan Statistik

Untuk melihat ringkasan /deskriptif data secara detail dapat kita lakukan dengan perintah :
1. Data Numerik (rasio dan interval) :
1. sum usia
2. sum usia, detail
2. Data Kategorik (Ordinal dan Nominal)
a. tab variabel_dipilih
b. tab1 variabel1 variabel2 variabeln

Kombinasi perintah antara data kategorik dan data numerikal


tabulate lokasi, sum(usia)
sum usia if lokasi==1 (kode 1 adalah untuk wilayah Sleman)

Hasilnya

Variable | Obs Mean Std. Dev. Min Max


-------------+--------------------------------------------------------
usia | 14 25 2.908872 19 29

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 14


Oleh : Ki Hariyadi 
Hasilnya :

. table lokasi, contents( mean usia sd usia min usia max usia )

------------------------------------------------------------
lokasi |
tinggal | mean(usia) sd(usia) min(usia) max(usia)
------------+-----------------------------------------------
sleman | 25 2.908872 19 29
luar sleman | 23.5455 2.621589 20 28
------------------------------------------------------------

1. Deskripsikan tabel tersebut!


2. Lakukan ringkasan usia untuk kategorik jenis kelamin!

Solusi ketik !
table jk, c( mean usia sd usia min usia max usia )

Merubah Skala Rasio menjadi Ordinal (Kategorikal) dengan perintah ”recode”

Tujuan merubah skala adalah menyesuaikan data untuk kebutuhan pengolahan lanjutan.
Kasus kali ini adalah ingin melihat kelompok per usia respoden dengan kriteria kelompoknya
didefinisikan sebagai berikut:
1. Kode 1 ==> usia <25 Thn
2. Kode 2 ==> usia >=25 Thn

Langkah-langkah membuat variabel baru


gen usia_k=1 if usia<25 Atau dengan syntax  
replace usia_k=2 if usia >= 25
    recode usia min/24=1 25/max=2, gen(usia_k) 
lab var usia_k ”Kategori Usia Responden”
lab def usia_k 1 ”Usia < 25 Thn” 2 ”Usia >= 25 Thn”, modify
lab val usia_k usia_k

tab usia_k

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 15


Oleh : Ki Hariyadi 
5. Inferensi Statistik
Misal dengan kasus: ”ingin diketahui apakah ada perbedaan rata-rata usia antar jenis
kelamin dan antar lokasi responden”.

Dengan Catatan Kesamaan Variansi (Homogenitas) di penuhi, Langkah-langkahnya adalah


1. ttest usia, by( jk)

Hasilnya
Two-sample t test with equal variances

------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
laki-lak | 15 24.6 .8607859 3.333809 22.7538 26.4462
perempua | 10 24 .6146363 1.943651 22.6096 25.3904
---------+--------------------------------------------------------------------
combined | 25 24.36 .5653318 2.826659 23.19321 25.52679
---------+--------------------------------------------------------------------
diff | .6 1.17214 -1.824757 3.024757
------------------------------------------------------------------------------
Degrees of freedom: 23

Ho: mean(laki-lak) - mean(perempua) = diff = 0

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


t = 0.5119 t = 0.5119 t = 0.5119
P < t = 0.6932 P > |t| = 0.6136 P > t = 0.3068

T test antara Usia dengan Lokasi

Perintah sederhana

2. ttest usia, by(lokasi)


Hasilnya
. ttest usia, by(lokasi)
Two-sample t test with equal variances

------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
sleman | 14 25 .7774288 2.908872 23.32047 26.67953
luar sle | 11 23.54545 .7904387 2.621589 21.78425 25.30666
---------+--------------------------------------------------------------------
combined | 25 24.36 .5653318 2.826659 23.19321 25.52679
---------+--------------------------------------------------------------------
diff | 1.454545 1.123159 -.8688854 3.777976
------------------------------------------------------------------------------
Degrees of freedom: 23

Ho: mean(sleman) - mean(luar sle) = diff = 0

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


t = 1.2950 t = 1.2950 t = 1.2950
P < t = 0.8959 P > |t| = 0.2082 P > t = 0.1041

Interpretasikan hasil tersebut!

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 16


Oleh : Ki Hariyadi 
Misal kasusnya adalah”ingin diketahui apakah ada perbedaan Proporsi kelompok usia
antar jenis kelamin dan lokasi responden”.

Perintah pengolahannya adalah


1. tabulate jk usia_k, row all
2. tabulate lokasi usia_k, row all

Hasilnya
. tab jk usia_k, row all

+----------------+
| Key |
|----------------|
| frequency |
| row percentage |
+----------------+

| Kategori Usia
jenis | Responden
kelamin | Usia < 25 Usia >= 2 | Total
-----------+----------------------+----------
laki-laki | 5 10 | 15
| 33.33 66.67 | 100.00
-----------+----------------------+----------
perempuan | 5 5 | 10
| 50.00 50.00 | 100.00
-----------+----------------------+----------
Total | 10 15 | 25
| 40.00 60.00 | 100.00

Pearson chi2(1) = 0.6944 Pr = 0.405


likelihood-ratio chi2(1) = 0.6922 Pr = 0.405
Cramer's V = -0.1667
gamma = -0.3333 ASE = 0.372
Kendall's tau-b = -0.1667 ASE = 0.199

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 17


Oleh : Ki Hariyadi 
Hasil 2

. tab lokasi usia_k, row all

+----------------+
| Key |
|----------------|
| frequency |
| row percentage |
+----------------+

| Kategori Usia
lokasi | Responden
tinggal | Usia < 25 Usia >= 2 | Total
------------+----------------------+----------
sleman | 4 10 | 14
| 28.57 71.43 | 100.00
------------+----------------------+----------
luar sleman | 6 5 | 11
| 54.55 45.45 | 100.00
------------+----------------------+----------
Total | 10 15 | 25
| 40.00 60.00 | 100.00

Pearson chi2(1) = 1.7316 Pr = 0.188


likelihood-ratio chi2(1) = 1.7408 Pr = 0.187
Cramer's V = -0.2632
gamma = -0.5000 ASE = 0.317
Kendall's tau-b = -0.2632 ASE = 0.195

Interpretasikan hasil tabulasi silang di atas !!

Menggunakan recode untuk membuat variabel baru


tab usia
usia (thn) | Freq. Percent Cum.
------------+-----------------------------------
19 | 2 8.00 8.00
20 | 1 4.00 12.00
21 | 2 8.00 20.00
22 | 2 8.00 28.00
23 | 1 4.00 32.00
24 | 2 8.00 40.00
25 | 6 24.00 64.00
26 | 3 12.00 76.00
27 | 3 12.00 88.00
28 | 2 8.00 96.00
29 | 1 4.00 100.00
------------+-----------------------------------
Total | 25 100.00

Nilai minimal adalah 19 tahun dan maksimal adalah 29 tahun


Ingin dikelompokkan menjadi
19-20 thn Î 1
21-24 thn Î 2
25-29 thn Î 3

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 18


Oleh : Ki Hariyadi 
Perintah recode

recode usia_k2 19/20=1 21/24=2 25/29=3, gen (usia_k2)

atau

recode usia_k2 min/20=1 21/24=2 25/max=3, gen (usia_k2)

labelling data dengan cara

lab var usia_k2 ”Kelompok usia”


lab def usia_k2 1 ”19-20 thn” 2 ”21-24 thn” 3 ”25-29 thn”, modify
lab val usia_k2 usia_k2

Melihat hasil

tab1 usia_k usia_k2

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 19


Oleh : Ki Hariyadi 
  
6. Penyajian Grafik. 
 
Stata memberikan fasilitas penyajian dalam bentuk grafik. Informasi dari menu help adalah:  
The graph command 
        graph ... 
    The commands that draw graphs are 
        command                   description 
        ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ 
        graph twoway             scatterplots, line plots, etc. 
        graph matrix                scatterplot matrices 
        graph bar                     bar charts 
        graph dot                     dot charts 
        graph box                    box and whisker plots 
        graph pie                     pie charts 
        other                             more commands to draw statistical graphs 
        ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ 
 
Fasilitas grafik di stata antara lain: 
1. Grafik dua arah : scatterplots, line plots, dll. 
2. Grafik berupa matrik‐matrik : matrik scatterplots 
3. Grafik Batang 
4. Grafik Titik 
5. Grafik Box : Box dan Whiskes Plots 
6. Grafik Pie 
7. Grafik lain: untuk menggambarkan grafik statistik.   

Exercise  
Dari data 2_data_kursus.dta yang ada lihat struktur datanya! 
Prosedur standar persiapan data kerja 
1. Pastikan folder kerja anda !  misal : cd “c:\Pelatihan Stata” 
2. Lihat isi data di folder kerja !  command syntax : dir <enter>  melihat seluruh file yang ada; 
dir *.dta <enter> melihat file stata (*.dta) di folder kerja 
3. Buka file kerja anda !  misal  ==> use 2_data_kursus.dta, clear 
4. Lihat isi data:  F3 <enter> mendescrib data; command ==> edit <enter> membuka dan 
mengedit data kerja; list <enter> menampilkan data kerja dalam output stata. 
 
Setelah mengetahui isi data, type data, value data, jumlah variabel maka langkah selanjutnya 
anda siap untuk melakukan pengolahan data sesui dengan tujuan peneliti. 
 Catatan  
Ringkasan deskriptif untuk variabel berskala numerik (usia dan tinggi badan) dengan
ringkasan tendensi pusat dan dispesi (Sebaran)
Ringkasan deskriptif untuk variabel berskala kategorik (Jenis Kelamin dan Lokasi) dengan
ringkasan distribusi frekuensi  
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 20


Oleh : Ki Hariyadi 
 
6.1. Grafik Dua Arah : Scatter dan Garis  
 
Menggambarkan sebaran data dan pola data. 
 
a. Grafik Scatter  
 
Kasus : Ingin diketahui sebaran data antara Usia (X) dan Berat Badan (Y) antar wilayah (Sleman dan 
Luar Sleman).  
 
Dari Menu Bar  

 
 

  
 

 
Result : di stata result “twoway (scatter tb usia), by(lokasi )” dan grafik 

sleman luar sleman


130
125
Tinggi Badan (Cm)
120
115

20 25 30 20 25 30
Umur (Thn)
Graphs by Lokasi Tinggal
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 21


Oleh : Ki Hariyadi 
b. Grafik Garis  
 
Kasus : Ingin diketahui pola sebaran data antara Usia (X) dan Berat Badan (Y) antar jenis Kelamin  
(Laki‐laki dan Perempuan).  
 
Dari Menu Bar  

 
 

 
 

 
Result : di stata result “twoway (line tb usia, sort), by(jk )” dan grafik 
  
laki-laki perempuan
130
125
Tinggi Badan (Cm)
120
115

20 25 30 20 25 30
Umur (Thn)
Graphs by Jenis Kelamin

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 22


Oleh : Ki Hariyadi 
Grafik 6.2., 6.3., dan 6.4 dapat di pelajari lebih lanjut. Untuk relevansi dengan inferensi grafik 6.5. 
Grafik Box Plot dilanjutkan sebagai latihan. 
 
6.5. Grafik Box Plot 
Petunjuk: Box Plot di pakai untuk melihat ukuran pemusatan dan ukuran penyebaran dari
data. Daerah yang berada di antara Q1 s/d Q3 merupakan inferensi data untuk populasi. Batas
bawah dan batas atas kelas interval menggambarkan sebaran data.
Kasus : Ingin diketahui estimasi untuk faktor usia responden antar wilayah (sleman dan luar 
sleman)? Secara matematik ingin diketahui apakah rata‐rata usia responden di Sleman > Usia di Luar 
Sleman? 
Menu Bar 

 
 

 
 

 
Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 23
Oleh : Ki Hariyadi 
Hasil di stata result “graph box usia, medtype(line) by(lokasi )” dan grafik 
sleman luar sleman
30
Umur (Thn)
25
20

Graphs by Lokasi Tinggal


 
Interpretasi grafik Box Plot di atas adalah  
 
Secara matematik : rata‐rata usia responden di Sleman lebih besar dari pada di luar  sleman. Variansi 
data usia lebih besar di luar Sleman (Catatan : interpretasi ini belum secara pengujian statistik, baru 
merupakan gambaran estimasinya).  
 
 
Sebagai penutup penyajian grafik pada sesi ini,   
1. Penyajian grafik digunakan untuk memeriksa data dan penyajian lanjutan untuk keperluan 
analisis.  
2. Teknik penyajian grafik dipakai untuk memeriksa data, melukiskan data,  dan evaluasi uji 
statistik (misal : plot residual).   
3. Visualisasi grafik memberi dampak lebih informatif, meningkatkan pemahaman terhadap data 
dan dapat memaksimalkan kemungkinan analisis yang ada,  
 
Sehingga bagi peneliti visualisasi dari hasil grafik akan memberikan informasi lanjutan untuk 
hipotesis yang akan di uji.  
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 24


Oleh : Ki Hariyadi 
Dasar untuk Inferensi Statistik. 
  
7. Pengujian T test  
 
Uji beda rata‐rata antara 2 kategorik atau beda rata‐rata dengan suatu konstanta pembanding. 
Dalam kasus ini ada variabel dependen dan variabel independen. Untuk kasus uji dengan suatu 
konstanta, maka nilai awal konstanta harus di definisikan dahulu di awal untuk pengujian 
statistiknya.  
 
Definisi Variabel
Dependen (tergantung) adalah variabel yang nilainya di pengaruhi oleh variabel lain.
Independen (bebas) adalah variabel yang nilainya tidak di pengaruhi oleh variabel lain.
Variabel dependen secara teori dipengaruhi oleh variabel independen
 
Matrik untuk belajar pemilihan pengujian statistik dapat bersumber tabel berikut:  
 
    Dependen 
    Numerik  Kategorik 
- Rasio   - Ordinal  
- Interval  - Nominal 
  Numerik  Korelasi Pearson  Regresi Logistik 
  - Rasio   Regresi Linier    
Independen  - Interval 
Kategorik  t‐test  Korelasi spearman 
- Ordinal   Anova  Chi‐square 
- Rasio  Regresi Linier (dummy)  Regresi Logistik  
 
Kasus. 
 
1. Satu sampel T test 
a. Apakah rata‐rata usia responden penelitian tersebut tidak jauh berbeda dari usia 25 
tahun? 
b. Apakah rata‐rata Tinggi Badan Responden penelitian tersebut tidak berbeda dari nilai 
120 Cm? 
c. Apakah rata‐rata Berat Badan Responden penelitian tersebut tidak berbeda dari nilai 55 
Cm? 
 
Penyelesaian  
 
Dari command stata  
help ttest <Enter> 
Pelajari contohnya secara cepat agar lebih mudah dalam mereplikasi contoh yang ada dengan kasus 
yang di hadapi.  
 
Solusi kasus ini  
1. ttest usia==25 
2. ttest tb==120 
3. ttest bb==55 
 
  

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 25


Oleh : Ki Hariyadi 
Hasil  
. ttest usia==25

One-sample t test

------------------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
usia | 25 24.36 .5653318 2.826659 23.19321 25.52679
------------------------------------------------------------------------------
Degrees of freedom: 24

Ho: mean(usia) = 25

Ha: mean < 25 Ha: mean != 25 Ha: mean > 25


t = -1.1321 t = -1.1321 t = -1.1321
P < t = 0.1344 P > |t| = 0.2688 P > t = 0.8656

. ttest tb==120

One-sample t test

------------------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
tb | 25 122.04 .7926327 3.963164 120.4041 123.6759
------------------------------------------------------------------------------
Degrees of freedom: 24

Ho: mean(tb) = 120

Ha: mean < 120 Ha: mean != 120 Ha: mean > 120
t = 2.5737 t = 2.5737 t = 2.5737
P < t = 0.9917 P > |t| = 0.0167 P > t = 0.0083

. ttest bb==55

One-sample t test

------------------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
bb | 25 54.88 1.229255 6.146273 52.34294 57.41706
------------------------------------------------------------------------------
Degrees of freedom: 24

Ho: mean(bb) = 55

Ha: mean < 55 Ha: mean != 55 Ha: mean > 55


t = -0.0976 t = -0.0976 t = -0.0976
P < t = 0.4615 P > |t| = 0.9230 P > t = 0.5385 
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 26


Oleh : Ki Hariyadi 
8. Manajemen Data (Lanjutan) 
 
8.1. Merge File (menggabung File /menambah Variabel) 
 
Description

merge joins corresponding observations from the dataset currently in memory


(called the master dataset) with those from the Stata-format dataset stored
as filename (called the using dataset)into single observations. If filename
is specified without an extension, .dta is assumed.

merge can perform both one-to-one and match merges. In either case, the
variable _merge (or the variable specified in _merge() if provided) is added
to the data containing
_merge==1 obs. from master data
_merge==2 obs. from using data
_merge==3 obs. from both master and using data  
 
“merge” adalah perintah untuk menggabungkan beberapa file (2 atau lebih) menjadi satu file 
gabungan. Tujuannya : (1) menyatukan variabel‐variabel penelitian menjadi 1 data set yang 
terstruktur; (2) menggabungkan berbagai file menjadi satu data set untuk kebutuhan pengolahan 
lanjutan. 
 
Langkah‐langkah “merge Files”  
1. Pastikan folder kerja anda ! Semua data yang akan digabung dimasukkan dalam 1 folder kerja.  
misal :     cd  “c:\kursus stata” <Enter> atau  
 cd  “c:\pelatihan stata” <Enter> 
2. buka file data ke‐2 (File Using), urutkan berdasar ”id key” /id kunci / nomor identitas 
responden, kemudian simpan ulang.  
misal : use ” 2_data_kursus2.dta” 
            sort id 
            save “2_data_kursus2.dta”, replace 
3. buka file data ke‐1 (file master), urutkan berdasar “id key” 
misal : use ” 2_data_kursus.dta” 
            sort id 
4. gabungkan data master (data ke 1/data yang sekarang aktif) dengan data using (data ke 2), 
kemudian urutkan berdasar “id key”. 
misal : merge id using ”2_data_kursus2” 
            sort id 
            tab _merge 
            drop _merge 
5. simpan file data set gabungan menjadi file dengan nama yang berbeda 
       misal : save gab_data_kursus.dta 
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 27


Oleh : Ki Hariyadi 
8.2. Append File (Menggabung File /menambah kasus) 
 
Append datasets
append using filename [, nolabel keep(varlist) ]
Note: You may enclose filename in double quotes and must do so if
filename contains blanks or other special characters.

Description

append appends a Stata-format dataset stored on disk to the end of the


dataset in memory.(Stata also has the capability to join observations from
two datasets into a single observation; see help merge. Also see [U] 25
Commands for combining data for a comparison of append, merge,and joinby.)
If filename is specified without an extension, .dta is assumed.

Examples
. append using newdata
. append using newemploy, keep(id salary status hiredate)
. append using mydata, keep(value pop*)
 
Perintah “append” berguna untuk menggabungkan data (dalam hal ini dari data yang berbeda untuk 
cases /responden yang berbeda).  
 
Langkah‐langkah “append Files”  
1. Pastikan folder kerja anda ! Semua data yang akan digabung dimasukkan dalam 1 folder kerja.  
misal :     cd  “c:\kursus stata” <Enter> atau  
 cd  “c:\pelatihan stata” <Enter> 
2. buka file data ke‐1 (file master) 
misal : use ” 2_data_kursus.dta” 
             
3. gabungkan data master (data ke 1/data yang sekarang aktif) dengan data using (data ke 2). 
Chek cases yang memiliki entry ganda! 
misal : append using ”2_data_kursus3” 
            tab id 

              
 
4. simpan file data set gabungan menjadi file dengan nama yang berbeda 
       misal : save gab_data_kursus2.dta 
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 28


Oleh : Ki Hariyadi 
8.3. Transfer Data File  
 
Proses komputasi dengan program stata mensyaratkan data tentu saja dalam format stata format 
(*.dta). Bagi kita yang sudah terbiasa dengan format data base lain tidak perlu ragu untuk 
memanfaatkannya. Karena stata transfer secara cepat akan dapat menyelesaian masalah tersebut. 
Artinya tidak perlu entry ulang dari data base yang sudah ada.  
 
Stata menurut pengembangnya adalah  

 
 
Menu input dan output file stata transfer 
 

Folder sumber file 
berada 

Folder lokasi hasil dan 
nama file 

 
 
Misal merubah dari dbase (Input) ke format stata  (Output) 
 
Catatan: stata transfer yang dipakai ini adalah stata transfer versi 7.0 sehingga bagi anda
pengguna Stata versi 8 atau versi 9 atau versi di atasnya agar dapat di transfer ke berbagai
format harus di turunkan versi simpannya dengan prosedur ”saveold”. File Stata versi bawah
(misal 7) pasti akan dapat di buka di Stata versi atas (misal 8), namun tidak berlaku sebaliknya.
 
 
 
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 29


Oleh : Ki Hariyadi 
8.4. Transfer Hasil komputasi 
 
Proses menyajikan hasil dalam format dokumentasi (Format MS Word, MS Excel dan lain‐lain) 
merupakan bagian penting dari pengolahan data. Bagi pengolah setelah berhasil mengeluarkan 
output dengan program pengola data tertentu diharapkan dapat menyajikannya menjadi format 
laporan umum yang dapat di analisis oleh team yang lain. 
 
Pada sesi ini akan disajikan berbagai fasilitas dan tip yang dimiliki program stata, bertujuan untuk 
mentransfer hasil /output stata menjadi dukumen.  
 

 
 
Langkah transfer tabel output ke MS Word 
1. setelah output di hasilkan, select dengan mouse tabel yang ingin disajikan (catatan : pastikan 
dari awal tabel sampai akhir tabel). 
2. Select “Copy Text” 
3. ke Program MS Word dan “Paste” ke dalam lembar kerja MS Word  
 
Hasilnya :  
Jenis |
Kelamin | Freq. Percent Cum.
------------+-----------------------------------
laki-laki | 15 60.00 60.00
perempuan | 10 40.00 100.00
------------+-----------------------------------
Total | 25 100.00 
 
4. Untuk merapikan output tersebut “select are table” pilih jenis font “courier new” dengan besar 
10  

 
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 30


Oleh : Ki Hariyadi 
Hasil akhir  
 
Jenis |
Kelamin | Freq. Percent Cum.
------------+-----------------------------------
laki-laki | 15 60.00 60.00
perempuan | 10 40.00 100.00
------------+-----------------------------------
Total | 25 100.00 
 
Penyajian lebih tepat adalah dengan mengetik kembai dan hanya menyajikan informasi yang 
diperlukan saja misal:  
 
Tabel karakteristik responden (Jenis Kelamin) 
Jenis Kelamin  Frekuensi  % 
Laki‐laki  15  60,0 
Perempuan  10  40,0 
Total  25  100,0 
   Sumber : Pengolahan Data Primer 
 
Langkah transfer tabel output ke MS Excel 
1. setelah output di hasilkan, select dengan mouse tabel yang ingin disajikan (catatan : pastikan 
dari awal tabel sampai akhir tabel). 
2. Select “Copy Table” 
3. ke Program MS Excel dan “Paste” ke dalam lembar kerja MS Word  
Hasilnya :  

 
 
4. Untuk merapikan hasil tersebut dengan fasilitas tabel yang di MS Excel 

 
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 31


Oleh : Ki Hariyadi 
8.5. Pemrograman stata dengan do‐files  
 
Seorang programmer pengeolah data (daam kasus ini adalah stata) tentu akan merasa sangat 
terbantu apabila setiap proses yang telah dikerjakan dapat di jalankan kembali dengan satu 
sentuhan /”Klik” dan semua proses yang sama dilakukan tanpa harus bersusah‐susah dengan 
berbagai langkah sudah runtin dilakukan. Sebagi solusi stata memberikan fasilitas “do files”. 
 

Contoh : Do file menggabung data


* ke Direktori Data
cd "c:\pelatihan stata"

* File Using
use "2_data_kursus2.dta"
sort id
save "2_data_kursus2.dta", replace

* File Master
use "2_data_kursus.dta"
sort id

* Menggabung
merge id using "2_data_kursus2"
sort id
tab _merge
drop _merge

* Menyimpan hasil
save gab_data_kursus.dta, replace

Seluruh perintah tersebut di atas dapat dipindahkan dalam menu editor do dan dapat dijalankan.  
 
 

 
   
Gambar Editor Do File 
 
Ketikan semua “command” yang sesuai dengan 
kebutuhan anda. Seluruh perintah tersebut akan 
sangat membantu untuk keperluan pengulangan 
dalam komputasi statistiknya.  

Menjalankan do file dengan cara “select” area command kemudian pilih “Tools Bar”  do curent files. 
 
Kontak 
 
Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 32
Oleh : Ki Hariyadi 
Ki Hariyadi 
PMPK Fakultas Kedokteran UGM 
FKM UAD Yogyakarta 
+62818267286 
kihariyadi@yahoo.com 
 
 
Judul Modul : “9 Jam terampil mengolah data dengan Program Stata”  
 
Gambaran Kursus 
Kursus Singkat dengan metode “QSS”  
Maksimal 5 peserta  (min 3 Org) 
Dengan masing‐masing memiliki komputer (rekomendasi laptop) 
Program stata dan stata transfer sudah di miliki. 
Fasilitas Modul dan komunikasi berbagai topik yang terkait. 
Memiliki Latar Belakang Pernah Kuliah...  
 

Modul Bantu Belajar Stata  9 Jam terampil mengolah data dengan Program Stata 33


Oleh : Ki Hariyadi 

Anda mungkin juga menyukai