Anda di halaman 1dari 22

Pengantar

Stata adalah software untuk keperluan statistik yang dibuat oleh StataCorp. Stata
digunakan oleh banyak perusahaan dan lembaga akademis di seluruh dunia,
termasuk di bidang kesehatan. Stata memiliki kemampuan yang lengkap meliputi
manajemen data, analisis statistik, grafis, simulasi dll.
Hal yang diperlukan sebelum memulai pelatihan ini adalah:
Laptop yang telah diinstall program stata dan Data yang akan diolah. Pada modul
ini kita akan menggunakan data penelitian tentang gizi dalam format excel.
Setelah semuanya siap, bukalah program stata denga n menklik icon stata
Setelah itu akan muncul jendela stata sebagai berikut:
Menu bar

Toolbar button

Jendela variabel:
menampilkan
semua variable yang
aktif (nama, label,
tipe dan format)
Jendela Command:
Tempat menuliskan
perintah stata

Jendela review:
menampilkan
perintah yang
terakhir dijalankan

Jendela result:
menampilkan perintah
dan hasil output yang
dilakukan

Jendela Properti:
menampilkan properti (tipe,
label, format, value label)
variabel

Keterangan :
Menu bar merupakan daftar menu di stata untuk dapat memilih apa yang akan
dilakukan di stata
1. File : membuka file baik file data, do-file maupun log-file, menyimpan data,
membuka jendela
penampil
(viewer),
menjalankan
do-file,
memberi/mengubah nama file, membuat/menghentikan/menambah log-file,
melakukan import data, melakukan export data, mencetak file (print)
2. Edit: melakukan copy, paste, melakukan pencarian (find), mengubah
tampilan Stata (preference)
3. Data: mendeskripsikan data, memunculkan dataset, mengedit dataset,
memunculkan variabel manager, mengubah utilitas data.
4. graphics: menu untuk membuat grafik
5. statistics: menu untuk melakukan analisis deksriptif dan analitik
6. user: menampilkan data, grafik dan statistik
7. window: menampilkan jendela-jendela kerja
8. help: mencari bantuan.
Toolbar menampilkan ikon jalan pintas untuk memilih menu yang sering
digunakan

1.
2.
3.
4.
5.
6.

open: membuka file, baik file data, do-file maupun log-file


save: menyimpan file data
print: mencetak output yang terdapat di jendela hasil
log-file: membuat, memulai, menghentikan, dan menambah log-file
viewer: jendela tampilan, menampilkan log-file dan bantuan (help)
graph: untuk menampilkan grafik, akan aktif bila kita telah membuat grafik
di Stata
7. do-file editor: untuk membuat, dan melakukan editing do-file
8. data editor : untuk menampilkan data, tanpa bisa melakukan editing data
9. data browser : untuk menampilkan data, ste melakukan editing data
10.variable manager: untuk menampilkan jendela variabel manager, berisi
daftar semua variabel dan sterisk dari setiap variabel yang ada (nama, tipe,
format, label, dll)
11.more: untuk melanjutkan tampilan output di jendela hasil
12.break: untuk memotong tampilan output di jendela hasil

PERINTAH STATA
Terdapat dua cara dalam menjalankan perintah stata, yaitu dengan syntaks dan
menu pull down. Cara yang akan kita bahas dalam modul ini sebagian besar
menggunakan syntaks.
1. Syntaks
Syntaks merupakan perintah/command yang dituliskan pada jendela command.
Cara ini akan lebih banyak kita gunakan dalam mengolah dan mengalisis data di
stata. Karena cara ini lebih mudah digunakan jika kita sudah terbiasa
menggunakan stata. Anda tidak perlu menghafalkan syntaks, secara
otomatis jika Anda sering menggunakan stata Anda akan hafal dengan
sendirinya, dan bila lupa Anda bisa mencarinya melalui help, yang penting
adalah paham format logika syntaks.
Format syntaks stata secara umum adalah:
(command) [namavariabel] [if kondisi] [in] [,] [opsi]
Command adalah input perintah yang harus ada pada setiap kali memberikan
perintah pada Stata, perintah pada stata selalu menggunakan huruf kecil
(lowercase), pada perintah tertentu, perintah dapat disingkat dengan hanya
memasukan 3 digit pertama dari perintah, misalnya perintah describe yang
dapat disingkat hanya memasukan perintah des, tetapi perlu diingat
bahwa tidak semua perintah pada Stata dapat disingkat.
Namavariabel adalah nilai yang diberikan untuk perintah yang dapat berupa
variable dari dataset yang aktif, variable lainnya yang bertipe string atau
numerik.
If kondisi adalah formula atau rumus yang dapat dikostumisasi sesuai
kebutuhan yang memberikan batasan pada perintah yang akan dijalankan,
if kondisi pada semuacommand bersifat opsional dan tidak semua
command dapat ditambahkan if kondisi.
in adalah kondisi yang mengacu pada observasi, misalnya in 1 artinya
pada obervasi 1, in 1/5 mengacu pada obervasi nomor 1 sampai nomor 5.
Opsi pada perintah stata selalu berada setelah tanda koma ,, sama seperti
command, beberapa opsi pada beberapa command juga dapat disingkat.
2. pull down menu
Cara pertama adalah memilih melalui menu bar (daftar menu) atau toolbar
(jika pilihan menu ada di dalam toolbar). Cara ini banyak digunakan apabila
kita adalah pengguna baru Stata dan belum mengenal cara melakukan
perintah dengan DOS.

MEMULAI STATA
Pada modul ini, kita akan menggunakan data yang sudah disiapakan untuk diolah
dan dianalisis. Data yang kita gunakan adalah salah satu penelitian dengan topik
stroke.
1. Membuka File Data Dari Ms.Excel
Pada modul ini akan di kenalkan cara membuka dataset yang tersimpan dalam
Ms.Excel.
Caranya :
File import Excel Spreadsheet Browse Pilih Direktori Tempat
Menyimpan File Pilih Nama File centang Import first row OK

Jangan lupa mencentang Import first row


as variable names, agar baris pertama
pada file excel diidentifikasi sebagai nama
variabel

Setelah terbuka, dan ingin memastikan data telah terimport silahkan ketik
Browse pada jendela command, setelah itu tutup kembali jendelanya.
2. Cara menyimpan Data Hasil Import ke Stata
File save tulis nama file save

3. Cara membuka file stata


Cara 1 (Pull Down)
File Open Pilih folder tempat menyimpan file Pilih file latihan stata.dta
Open

Cara 2 (syntaks)
use alamat file dan nama file yang akan dibuka, clear

contoh : use "D:\latihan Stata\Data Latihan stata.dta",clear


4. Membuat log file
Sebelum memulai mengolah dan menganalisis data. Kita akan memerintahkan
stata untuk merekam seluruh proses pekerjaan kita, baik output maupun
perintah (command) selama kita menganalisis data.
Cara 1
File log Begin cari folder tempat menyimpan tulis nama file Save

Cara 2 Dengan menuliskan syntaks


Log using alamat file dan nama file yang akan dibuka
Contoh : log using "D:\Data Latihan Stata\latihaan stata.smcl"

Beberapa perintah log lainnya:


memerintahkan rekaman sementara
memulai lagi rekaman
menghentikan rekaman keseluruhan
menambah rekaman baru di rekaman lama pada
satu file log
log using namafile,replace : mengganti rekaman lama dengan rekaman pada
suatu file data
log
log
log
log

off
on
close
using namafile, append

:
:
:
:

MELIHAT DATA
1. Melihat deskripsi data set
Setelah kita siap dengan direktori tempat kerja, data telah masuk ke program
Stata dan rekaman telah disiapkan, selanjutnya kita akan melihat deskripsi data
set yang akan digunakan. Kegunaan dari proses ini adalah untuk mengetahui
informasi lebih detail tentang data yang kita miliki (berapa jumlah observasi
yang ada, berapa jumlah variabel, apakah berbeda variabel jumlah variabel
yang ada di kuesioner dengan data, adakah missing data, dst). Perintah yang
dituliskan adalah:
describe
: deskripsi semua variabel
describe namavariabel
: deskripsi variabel yang dipilih
contoh syntak: describe
20 Pengamatan
13 Variabel

2. Mengurutkan data
Apabila kita ingin data yang dimiliki tersusun secara berurutan berdasarkan nilai
dari variabel, maka kita dapat menggunakan perintah: sort. Susunan dapat
diurutkan secara alfabetis A Z atau berdasarkan urutan angka dari terkecil
tertinggi tergantung dari jenis variabel yang dipilih.

Contoh:
sort nama
Urutan secara alfabetis

3. Melihat ringkasan data per variabel dengan codebook


Setelah melihat deskripsi keseluruhan, lalu kita akan melihat deskripsi data per
variabel sehingga akan diperoleh ringkasan data per variabel. Proses ini akan
menghasilkan informasi lebih detail tentang data dalam 1 variabel. Informasi
yang ada: nama variabel, label variabel, tipe data, range data, nilai unik, data
missing, frekuensi data dan value label. Perintah yang dituliskan:
codebook
: melihat informasi semua variabel per variabel
codebook namavariabel
: melihat informasi variabel yang dipilih
Contoh:
codebook bb
----------------------------------------------------------------------------------bb
(unlabeled)
----------------------------------------------------------------------------------type:
range:
unique values:
mean:
std. dev:
percentiles:

numeric (float)
[44,77.5]
16

units:
missing .:

.1
0/20

58.89
10.1706
10%
47.25

25%
49.85

50%
58.25

75%
66

90%
74.5

Interpretasi
Berdasarkan output di atas, informasi yang dapat diperoleh adalah variabel bb
bertipe numeric dengan isi data berkisar antara 44 sampai 77.5, terdapat angka
unik sebanyak 16, tidak ada data yang hilang dari 20 observasi yang dilakukan.
4. Melihat ringkasan data per variabel dengan inspect
Selain menggunakan codebook, perintah yang juga dapat dilakukan untuk
melihat data per variabel adalah inspect. Kita dapat melakukan inspeksi secara
cepat bagaimanakah data yang ingin kita analisis, apakah rentang jawabannya
sudah benar, apakah ada nilai 0, adakah nilai negatif. Command yang ditulis
adalah:
inspect
: melakukan inspeksi data per variabel untuk semua
variabel
inspect namavariabel : melakukan inspeksi data per variabel untuk variabel
terpilih saja
Contoh:
inspect bb
bb:
----| #
#
| #
#
| #
#
#
| #
#
#
#
#
| #
#
#
#
#
| #
#
#
#
#
+---------------------44
77.5
(16 unique values)

Negative
Zero
Positive
Total
Missing

Number of Observations
-----------------------------Total
Integers
Nonintegers
20
10
10
------------20
10
10
----20

5. Melihat data set


Setelah file terbuka dan stata telah diperintahkan untuk merekam hasil kerja
kita, kita akan melihat data set variable penelitian ini dengan cara menuliskan
syntaks:
browse
: melihat data set, tidak bisa mengubah data
edit
: melihat data set, bisa mengubah data
browse,namavariabel: melihat data set, variabel yang dipilih
browse,namavariabel: melihat data set, variabel yang dipilih
edit, nol
: melihat data set, dengan tampilan kode value variabel

contoh syntaks : browse

6. Melihat data per observasi


Jika browse dapat melihat data set sebagian atau keseluruhan, maka kali ini kita
akan melihat data satu per satu setiap observasi dengan cara menuliskan
syntak:
list
:melihat data per observasi untuk semua observasi
list namavariabel :melihat daftar data per observasi untuk variabel terpilih
contoh syntak: list

7. Meringkas data numerik


Data numerik yang berskala rasio dan interval akan diringkas agar kita
bisa mengetahui pemusatan (mean, median, modus) dan penyebaran data
kita (standar deviasi, variansi).
Syntaks :sum namavariabel

:tabstat namavariabel
Contoh:
Meringkas variabel sistolik
sum sistolik
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------sistolik |
20
114.75
9.930681
100
130

Interpretasi:
Rerata (mean) tekanan darah sistolik responden adalah 114.75 mmHg dimana
rentah sistolik berkisar antara 100 hingga 130 mmHg.
8. Meringkas data kategorik
Syntaks :
tab namavariabel
tab namavarA namavarB
tab namavarA namavarB,row
tab namavarA namavarB,col

: meringkas satu variabel


: meringkas dua variabel menjadi tabel 2 x 2
: meringkas dua variabel menjadi tabel 2 x 2
dan memunculkan persen dalam row
: meringkas dua variabel menjadi tabel 2 x 2
dan memunculkan persen dalam kolom

contoh:
tab sex
sex |
Freq.
Percent
Cum.
------------+----------------------------------laki-laki |
13
65.00
65.00
perempuan |
7
35.00
100.00
------------+----------------------------------Total |
20
100.00

FORMATING DATA
Pada tahap ini, kita akan membuat nama variable dan value label/kategori variable
dari data yang kita import dari excel.
Berikut adalah keterangan variable
No
1
2
3
4
5

Nama Variabel
No
id
nama
Tgl_lahir
sex

Label variabel
Nomor
Nomor responden
Nama responden
Tanggal lahir
Jenis Kelamin

Nama Value label


Kode_sex

lokasi

Lokasi

Kode_lokasi

7
8
9
10
11
12
13

bb
bb2
tb
pergelangan
pinggang
sistolik
diastolik

Berat Badan 1
Berat Badan 2
Tinggi Badan
Lingkar lengan
Lingkar pinggang
sistolik
diastolik

Value label
1=laki-laki
2=perempuan
1=Kota
2=Desa
-

1. Mengubah nama variable


Caranya:
Syntaks : rename variablelama variablebaru
Contoh: kita ingin mengubah nama variable sex menjadi jeniskelamin
Syntax : rename sex jeniskelamin
Maka pada jendela variable nama sex telah berubah menjadi jeniskelamin
Catatan: Nama variable tidak boleh ada spasi
2. Memberi label nama variable
Caranya:
Syntaks: lab var namavariabel label variable
Contoh : kita akan memberi/mengubah label variable id menjadi nomor
responden
Syntax : lab var id "nomor responden"
3. Memberi value label
Caranya:
Syntaks : lab define namavaluelabel nilailabel nilai label
: lab value namavariabel namavaluelabel
Contoh : kita akan memberikan value label variable jeniskelamin menjadi
1=laki-laki ; 2=perempuan
Syntaks : lab define kode_sex 1laki-laki 2perempuan
: lab value jeniskelamin kode_sex
Sebagai latihan : Berilah nama variable, value label sesuai keterangan tabel diatas.

TRANSFORMASI DATA
Transformasi data adalah teknik untuk mengubah atau mengelompokkan data,
biasanya data yang ditransformasi adalah data numerik menjadi data kategori.
Transformasi yang sering dilakukan adalah komputasi dan recode atau mengubah
kode.

Sebaiknya transformasi tidak


dilakukan di variabel asli

1. Komputasi
Komputasi adalah penghitungan misal menghitung usia dari tanggal lahir dan
tanggal wawancara, menghitung rerata dari 2 perhitungan.
Contoh: pada data latihan, kita memiliki 2 variabel bb dan bb2, dan kita ingin
membuat variabel baru yang akan berisi data hasil rata-rata bb dan bb2.
variabel baru ini akan kita namakan bb_ratarata.
Langkah yang dapat dilakukan adalah cara sederhana dan lanjut. Untuk cara
sederhana bisa kita lakukan dengan hitung-hitungan menggunakan fungsi
operator. bb_ratarata=(bb+bb2)/2
1.
Buat variabel baru dengan gen bb_ratarata=(bb+bb2)/2
nama bb_ratarata dengan isi
data hasil perhitungan bb dan
bb2

generate adalah command untuk


membuat variabel baru dan biasa
disingkat gen
Cek hasil hitungan kita dengan browse bb bb2 bb_ratarata
perintah browse atau list
Perhitungan dengan langkah manual diatas tidak selalu berhasil, yaitu ketika
ada data yang hilang (missing) maka perhitungannya menjadi hilang (dianggap
sebagai missing). Jika ada data yang missing maka kita bisa melakukan
perhitungan ini dengan perintah egen (extension to generate)

Kita lakukan hal yang sama dengan langkah diatas, tapi yang kita gunakan
adalah egen. Variabel bb_ratarata tetap, variabel baru yang akan dibuat adalah
bb_ratarata2.
INGAT: Stata tidak mau membuat variabel dengan 2 nama yang sama
persis !!!!
egen[type] newvar =fcn(arguments) [if][in] [,options]

1.

Buat variabel baru dengan egen bb_ratarata=rowmean(bb, bb2)


nama
bb_ratarata2
dengan isi data hasil
perhitungan bb dan bb2
Untuk egen ini selalu diikuti dengan
function/argumen jadi untuk membuat
rata-rata, function yang dipakai adalah
rowmean

Cek hasil hitungan kita browse


bb
dengan perintah browse bb_ratarata2
atau list

bb2

bb_ratarata

2. Mengubah kode (recode)


Aturan dasar recode
Aturan
Contoh
Arti
----------------+-------------+--------------------------#=#
3=1
##=#
2.=9
#/# = #
1/5 = 4
nonmissing = # nonmiss = 8
missing = #
miss = 9

3 diubah jadi 1
2 dan . diubah jadi 9
1 sampai 5 diubah jadi 4
semua yg tidak hilang diubah jadi 8
semua yang hilang diubah jadi 9

+----------------------------------------------------------+

Contoh: pada data latihan, terdapat varibel dengan nama sistolik yang berisi data
tekanan darah sistolik responden dalam skala data rasio, kemudian kita ingin
melihat berapa orang yang mempunyai tekanan darah sistolik rendah, berapa
orang yang normal dan berapa orang yang tinggi.
Dari literatur kita dapatkan ketentuan untuk pengelompokkan tekanan darah:

rendah
normal
tinggi

<90 mmHg
90-120 mmHg
>120 mmHg

Maka kita akan lakukan transformasi atau perubahan agar data kita terkelompok
seperti yang kita inginkan. Bila data kecil kita kelompokkan manual akan mudah,
tetapi bila data cukup besar maka cara manual akan sangat membuang waktu.

1
.

Buat variabel baru (variabel copy)

gen sistolik_2 = sistolik

Variabel baru berisi data yang sama dengan generate adalah command
data variabel sistoli
untuk membuat variabel
baru
2

Cek variabel sistolik2 dengan sistolik

browse sistolik sistolik_2


atau
list sistolik sistolik_2

recode varlist (rule) [(rule) ...]


3

4
5

Recode variabel sistolik2 dengan pedoman recode


sistolik2
diatas:
(min/90=3)
1=tinggi
(91/120=2)
2=normal
(121/max=1)
3=rendah
cek dengan browse
bro sistolik sistolik2
cek dengan tab atau codebook
tab sistolik2
codebook sistolik2
. tab sistolik2
sistolik2 |
Freq.
Percent
Cum.
------------+----------------------------------1|
4
20.00
20.00
2|
16
80.00
100.00
------------+----------------------------------Total |
20
100.00

sistolik2

type:

numeric (float)

range:
unique values:

[1,2]
2

tabulation:

Freq.
4
16

Value
1
2

Berilah label dan value label untuk variabel


ini

Fungsi recode ini bisa diperpendek menjadi :


recode sistolik (min/90=3) (91/120=2)
(sistolik3)

(121/max=1),

gen

Latihan
1. Hitung BMI berdasarkan rumus = berat badan/ (tb-100) 2
2. Kategorikan menjadi 6 kategori seperti dibawah ini:
a. Morbidity obese (bmi over 40)
b. Obese (bmi between 27.6-40)
c. Overweight (bmi between 23 27.5)
d. Healthy/normal (bmi between 18.5 22.9)
e. Underweight (bmi between 15 18.4)
f. Starving (bmi under 14.9)
3. Berapa persenkah mahasiswa yang mempunyai bmi normal
4. Hitunglah BFS berdasarkan rumus= tinggi badan/ pergelangan tangan
5. kategorikan BFS menjadi kecil, medium dan besar, berdasarkan kriteria dibawah ini:
Classification
Small

Males
over 10.4

Females
Over 11.0

Medium

9.6 10.4

10.1 11.0

Large

Under 9.6

Under 10.1

Untuk mengerjakan soal diatas maka gunakan perintah if


recode varlist (rule) [(rule) ...] if
contoh
recode bfs (min/.=1) (./.=2) (../max=3) if sex==1
recode bfs (min/.=1) (./.=2) (../max=3) if sex==2
Ketika melakukan analisis, kadangkala kita ingin membuang beberapa observasi. Misalnya
kita hanya ingin menganalisis data penderita stroke saja, maka data responden yang tidak
stroke (control) itu kita hapus atau kita hanya ingin menganalisis variable tertentu saja,
maka variable yang kita tidak butuhkan kita hapus.
Syntaks:
drop
keep
drop
keep

namavariabel
: membuang variabel yang terpilih
namavariabel
: menyimpan variabel yang terpilih
if namavariabel expression
if namavariabel expression

contoh:
drop a1
keep kode c2
drop if kode==2

: membuang variable a1 (nama kecamatan)


: menyimpan variable kode (kasus/control) dan c2
(hipertensi)saja, variable yang lain dihapus.
: membuang observasi/data responden yang kode=2
(control/tidak sakit stroke).

DO FILE
1. Membuat do-file
Do-file adalah suatu file teks yang berisi dokumentasi perintah-perintah yang
akan diinstruksikan ke program Stata untuk dieksekusi. Do-file sangat berguna
karena akan mempermudah kita untuk mengulang analisis/pekerjaan yang
pernah kita lakukan di Stata.
Tujuan
: Membuat do-file
Kegunaan
: Membuat dokumentasi perintah dalam bentuk file yang siap
dieksekusi oleh Stata.
Buka Do-file Editor Window Do-file Editor New Do-file Editor atau
CTRL+9 atau melalui toolbar

Kemudian akan muncul jendela do file

Select/pilih perintah yang ingin anda simpan, copy (Ctrl+C) perintah yang ada di
jendela review, kemudian Paste (Ctrl+V) di jendela do-file editor. Sebagai
contoh copy perintah yang digunakan untuk melakukan labeling.

Tanda * (asterik) menginstruksikan Stata untuk mengabaikan perintah yang ada


disamping kanan dari tanda bintang, sehingga memungkinkan kita melakukan
catatan pada do-file kita, seperti contoh diatas.

2. Menyimpan do-file
Simpan do-file dengan nama do_latihan
Pilih FileSavedo_latihanSave

3. Membuka do-file
Buka do-file editor dari toolbar kemudian FileOpenPilih nama file OK

4. Menjalankan do-file
Pilih beberapa perintah yang ada di do-file kemudian execute selection (do).
Maka secara otomatis stata akan menjalankan perintah yang telah kita simpan
dan panggil kembali ke do file.

5. Menutup file-do
Tutup do-file melalui menu bar FileClose atau File Exit

Anda mungkin juga menyukai