MANAJEMEN DATA
Pendahuluan (Slide-2)
Data memegang peranan penting dalam suatu penelitian. Bila jumlah data atau sampel
yang dikumpulkan kurang dari data atau sampel minimal yang harus dikumpulkan,
maka hasilnya akan mengurangi makna ‘representativeness’ dan penarikan kesimpulan
suatu penelitian. Begitu pula bila data yang dikumpulkan kualitasnya tidak baik atau
tidak memenuhi kualifikasi yang ditentukan, maka hasil yang didapat akan bias.
Analisis data dapat dilakukan jika data sudah dinyatakan bersih. Anjuran ini penting
karena data yang salah atau kurang baik bila dianalisis akan menghasilkan informasi
yang keliru, sehingga pengambilan kesimpulan dan rekomendasi yang diberikan dapat
menyesatkan. Untuk itu sebelum analisis perlu ditempuh pengelolaan atau manajemen
data yang baik.
Dalam persiapan data ada beberapa langkah utama yang harus dilakukan
yaitu:
1
- Mempersiapkan perlengkapan untuk proses data (komputer, ruangan dsb)
- Membuat program untuk mengentri data
- Pembukuan kuesioner
- Mengedit, mengkoding
- Mengentri data
- Membersihkan data
Bagan 1. Tahap persiapan data
jumlah sampel dalam penelitian, berapa jumlah jam kerja dari setiap operator per
minggu dan jadwal dari penelitian. Perkiraan berapa banyak jumlah komputer dan
2
operator yang dibutuhkan untuk menyelesaikan entri data, dapat dihitung dengan
contoh sebagai berikut: seandainya untuk menyelesaikan entri data satu kuesioner/RT
dibutuhkan 20 menit, jumlah sampel RT adalah 4500 RT, waktu yg dibutuhkan untuk
entri data adalah 90.000 menit atau 1500 jam. Jika setiap operator bekerja 40 jam/per
minggu, dan pekerjaan entri data harus selesai dalam 8 minggu maka dibutuhkan 5
komputer dan 5 orang operator. Jika memungkinkan untuk kegiatan proses data diatas
disediakan ruangan khusus untuk network dan untuk memudahkan pengecekan hasil
3
dimaksudkan untuk mengetahui kelengkapan dokumen data yang diperlukan sesuai
dengan rencana.
Kegiatan pembukuan kuesioner dengan menggunakan buku kontrol sebagai berikut:
- Mencatat asal kuesioner (Kecamatan, Desa)
- Memberi nomor urut kuesioner
- Mencatat tanggal kuesioner diterima
- Mencatat jumlah kuesioner yang diterima
- Mencocokkan kuesioner yang diterima apakah sesuai dengan sampel
- Memeriksa kelengkapan kuesioner yang diterima (misal kuesioner harus dilengkapi
buku hasil pemeriksaan laboratorium)
- Mendistribusikan kuesioner ke tim editing dan pengentri
- Menyimpan kembali kuesioner yang sudah selesai di entri
Tujuan editing ini adalah untuk melakukan pengecekan isian formulir atau
kuesioner atas hal-hal sebagai berikut:
jawaban, ada jawaban yang tidak relevan atau jawaban yang ada tidak konsisten
4
dengan jawaban lain, supervisor dapat menanyakan kembali kepada tenaga pengumpul
data atau pewawancara. Sebagai contoh bila dalam kuesioner terisi umur responden
adalah 6 tahun tapi mempunyai status kawin atau pendidikannya tamat SLTP, maka
Jika editing di lapangan dilakukan dengan baik dan benar maka peran editing di
pusat tidak terlalu berat. Editing di pusat difokuskan untuk mengedit kelengkapan
editing perlu dibuat pedoman editing agar editor dapat menindak lanjuti/mengambil
Koding (Slide-10)
Setelah tahap editing selesai maka kegiatan koding dapat segera dimulai.
ditetapkan. Ada 2 macam kode yang lazim dipakai yaitu a) kode berdasarkan angka,
lembar kode atau file komputer perlu dibuat buku kode. Buku kode juga digunakan
oleh pengguna untuk mengidentifikasikan variabel yang akan dipakai dalam proses
5
Nama variabel. Nama variabel dibuat singkat tetapi jelas tidak diperbolehkan
ada nama variabel yang sama.
Value adalah simbol berupa angka atau huruf yang mewakili jawaban
responden
Type adalah jenis data atau ukuran data numerik atau karakter
6
Entri data (Slide-12)
Yang dimaksud entri data yaitu memindahkan jawaban responden yang tertulis
dalam ke dalam file elektronik melalui program entri yang sudah disiapkan. Pada file
elektronik jawaban dari satu responden dimasukkan menjadi satu record. Satu record
terdiri dari beberapa field/ variabel, dimana satu field biasanya merupakan satu
jawaban pertanyaan. Field atau variabel inilah yang selanjutnya akan dianalisis.
Pengentri data sebaiknya tenaga yang sudah berpengalaman dalam entri data
dan sudah terbiasa dengan program yang digunakan, minimal mereka sudah biasa
menggunakan komputer. Sebelum mengentri data, kepada setiap operator harus di beri
pelatihan terlebih dahulu. Dalam pelatihan dijelaskan tentang tujuan dari survei dan
contoh kuesioner yang akan dientri termasuk penjelasan mengenai isi dan alur dari
kuesioner tersebut. Dalam mengentri data, operator tidak diperkenankan berhenti
sebelum satu kuesioner selesai di entri. Artinya mereka harus menyelesaikan entri data
secara runtut sampai tuntas dari pertanyaan nomor 1 sampai nomor terakhir pada
kuesioner tersebut.
7
Dalam pengentrian data, perlu pula dilakukan cross-check untuk meminimalkan
kesalahan. Jadi sebaiknya dilakukan double entri yaitu dientri kembali yang
dikerjakan oleh pengentri yang berbeda, kemudian dibandingkan hasil keduanya.
Penanggung jawab data harus selalu memonitor pekerjaan pengelolaan data
mulai dari kuesioner diterima dari lapangan, didistribusikan untuk diedit/dientri hingga
diarsipkan dan mempersiapkan data untuk dilakukan analisis lebih lanjut. Penanggung
jawab data juga berwenang memutuskan kuesioner /data yang tidak layak untuk
Penggabungan data
Seringkali file data mentah (row data) terdiri dari beberapa data set. Hal ini biasanya
disebabkan karena keterbatasan kemampuan database menampung jumlah variabel.
Sebagai contoh dalam file berekstention *.dbf, maksimal hanya menampung sekitar
255 field. Sehingga jika melebihi jumlah tersebut harus disimpan dalam beberapa file,
dan perlu dilakukan penggabungan data (merging). Penggabungan data demikian dapat
dilakukan melalui bantuan software komputer dengan cara melakukan ‘add variables’
Satu data set penelitian, juga dapat saja terpisah-pisah karena data dimasukkan (data
entry) dilakukan oleh beberapa orang, sehingga untuk mendapatkan satu kesatuan
sampel penelitian perlu dilakukan penggabungan. Cara ini dalam program SPSS
menggunakan cara ‘add cases’ atau dalam program dBase menggunakan ‘append’.
data (cleaning). Proses ini dilakukan sebelum analisis data sehingga pada saat analisis
Untuk variabel dengan skala nominal atau ordinal, proses pembersihan data
dapat dilakukan dengan menampilkan frekuensi distribusi dari semua variabel apakah
ada nomor kode yang berada diluar batas kategori kode yang telah ditetapkan. Jika ada
8
missing value dilakukan pemeriksaan apakah missing value tersebut diakibatkan dari
perintah skip ketika entri data atau kesalahan entri. Untuk variabel dengan skala rasio
atau interval, proses pembersihan data diprioritaskan pada data ekstrim yang biasa
disebut pencilan atau outlier yang dapat diketahui dari boxplot dan scaterplot. Data
outlier atau pencilan adalah data yang secara nyata berbeda dengan data-data yang lain
Data outlier terjadi karena beberapa sebab yaitu kesalahan dalam pemasukan
data, kesalahan dalam pengambilan sampel, memang ada data-data ekstrim yang tidak
679
274
100
552
267
411
566
694
485
181
587
530
519
119
737
299
379
57
451
124
37
536
325
359
297
30
80
60
20
40
20
P402A
10
0
N= 737
10 20 30 40
P403A
P403A
9
sesuai dengan yang tercatat dalam buku kode, atau ada nilai lain. Dengan
distribusi frekuensi juga dapat terlihat nilai-nilai pencilan/ekstrim.
c) Mengetahui konsistensi data
Untuk mengetahui konsistensi data dapat dilakukan dengan cara membandingkan
2 tabel atau membuat tabel silang. Misalnya untuk mengetahui variasi jenis
pemanfaatan sarana pelayanan kesehatan, peneliti dapat membuat distribusi
frekuesi dari 2 variabel, yaitu variabel pengalaman sakit dalam 1 bulan terakhir
dan variabel kemana responden berobat. Jumlah yang mencari pengobatan harus
sama dengan jumlah yang sakit
Jika missing data bukan disebabkan oleh perintah skip seperti responden tidak
memberikan jawaban pada suatu variabel atau adanya nilai outlier yang tidak melebihi
jumlah missing data mengganggu proses analisis selanjutnya. Sebagai contoh pada
data penghasilan responden, karena alasan pribadi bisa saja sebagian responden tidak
mau menjawab berapa penghasilannya setiap bulan. Hal ini berakibat ada data kosong
pada kolom penghasilan di beberapa record. Kalau jumlah record yang kosong relatif
banyak maka keadaan ini akan mengganggu proses analisis sehingga perlu dilakukan
imputasi. Yang dimaksud dengan imputasi yaitu mengisi sel (data) yang missing
tersebut dengan nilai tertentu yang dianggap bisa mendekati kenyataan sebenarnya.
Cara mengisi data yang missing bisa bermacam-macam, mengisi dengan nilai modus,
nilai median atau rata-rata. Selain itu variabel yang akan diimputasi harus
10
Pada analisis data seringkali diperlukan pembuatan variabel baru dengan
melakukan transformasi data. Variabel baru tersebut dapat berasal dari satu atau
beberapa variabel asli yang sudah digabung sesuai dengan kebutuhan. Sebaiknya
setelah membuat variabel baru tersebut langsung disimpan dengan tetap
mempertahankan variabel asli pada file subset data, sehingga memudahkan jika akan
digunakan kembali.
Untuk dapat melakukan analisis data sesuai dengan tujuan penelitian, sebaiknya
seorang peneliti membuat rencana analisis, baik secara bivariat maupun multivariat.
Buatlah ‘dummy table’ sehingga pada waktu menganalisis data lebih terarah. Untuk
dapat melakukan hal tersebut seorang peneliti harus memeriksa kembali variabel-
variabel apa yang tersedia dan variabel-variabel apa yang dibutuhkan. Apakah perlu
ada pengelompokkan atau manipulasi data.
a) Mengelompokkan data
Untuk keperl Pengelompokkan juga dapat berasal dari data kategorik ‘banyak’
menjadi data kategorik ‘sederhana’. Misalnya umur yang tadinya numerik atau
kontinyu menjadi kategorik berupa kelompok umur 4 kelompok umur (<20 tahun;
20-20 tahun; 30-39 tahun; >=40 tahun). Atau misalnya pendidikan yang pada data
awal terdiri dari 7 kategori akan dibuat menjadi 2 kategorik, yang pendidikan
tinggi (>=tamat SLTP) dan rendah (<=tamat SD).
b) Membuat variabel baru
Untuk analisis tertentu membuat ukuran tertentu, seringkali peneliti harus
menggabungkan 2 atau lebih variabel. Misalnya untuk membuat variabel indks
massa tubuh (IMT), peneliti membuat variabel baru yang menggabungkan variabel
berat badan dan tinggi badan. Pembuatan variabel baru ini dapat secara
menyeluruh (berlaku untuk seluruh responden atau semua kelompok umur) atau
hanya pada kondisi tertentu (misalnya hanya untuk usia >=15 tahun).
11
MANAJEMEN DATA MENGGUNAKAN SPSS
I. PENDAHULUAN
Saat ini sudah banyak program komputer yang dapat dipergunakan untuk mengolah
data, diantaranya Statistical Package for the Social Sciences (SPSS). Kelebihan dari SPSS
dibandingkan dengan program pengolah data lain yaitu dapat menampung variabel yang lebih
banyak serta mampu menganalisis multivariat.
Dahulu rancangan SPSS hanya dipergunakan untuk menganalisis data survei yang
diambil secara Simple Random Sampling (SRS), yaitu setiap observasi mempunyai peluang
yang sama untuk terwakili sebagai sampel. Desain tersebut sangat sulit dilakukan untuk survei
dengan jumlah sampel yang besar karena membutuhkan biaya yang besar. Keterbatasan ini
dapat diatasi dengan cara stratifikasi atau klaster untuk pengambilan sampel. Analisis data dari
hasil rancangan pengambilan sampel secara stratifikasi dan klaster berbeda dengan cara
analisis data dari hasil pengambilan sampel secara SRS. Program SPSS versi terbaru
mempunyai fasilitas menghitung weighting, Primary Sampling Unit (PSU) dan strata, dimana
hal tersebut digunakan pada saat pengambilan sampel non SRS. Program SPSS versi lama
dapat digunakan tetapi hanya mempunyai fasilitas pembobotan (weighting) untuk masing-
masing observasi dengan mempertimbangkan perkiraan/ estimasi jumlah populasi.
Dalam mempergunakan perangkat lunak analisis, selain keterampilan juga diperlukan
pemahaman terhadap data. Untuk menghasilkan analisis yang tajam, kelengkapan data menjadi
bagian yang sangat penting.
1.1. Sasaran
Panduan praktikum komputer dengan program SPSS versi 15 ini ditujukan bagi calon
peneliti yang sedang mempersiapkan analisis data berbasis survei.
1.2. Tujuan
Tujuan dari panduan ini yaitu sebagai pedoman aplikasi pengolahan data survei menjadi
analisis indikator kesehatan dengan menggunakan SPSS.
12
II. PENGENALAN SPSS
Saat memulai bekerja dengan mempergunakan SPSS, pada layar Menu Utama tampak
10 (sepuluh) menu bar seperti gambar 1. Menu Bar
File
Membuka file data/ perintah/ luaran yang telah ada dari hasil
SPSS atau membaca data dalam bentuk spreadsheet atau
database yang telah dibentuk dari perangkat lunak yang lain.
Pada menu bar File dapat juga membuat/ menyimpan file baru
dari hasil SPSS.
File yang sering ditemui dalam analisis data dengan SPSS
yaitu:
1. File data : *.sav, *.dbf, *.xls
2. File perintah (syntax): *.sps, *.do, *.txt
3. File luaran (output): *.spo
Edit
13
View
Melihat Status bar, Tool bars, Fonts, Grid Line, Value Labels
Data
Transform
14
Analyze
Graph
Pada bagian kiri bawah halaman muka tampilan SPSS ini, terdapat menu pilihan untuk
mengaktifkan data (data view) atau variabel (variabel view). Tampilan pada gambar 2
merupakan tampilan data view yang sedang diaktifkan, jika yang diinginkan tampilan variabel
maka dapat dipilih variabel view, maka akan diperoleh tampilan seperti gambar 3. Data view
15
untuk menampilkan isi dari data, sedangkan variabel view untuk menampilkan status dari
masing-masing variabel.
16
III. PERSIAPAN ANALISIS
Pada menu file, terdapat perintah open untuk membuka file yang akan diaktifkan
atau yang akan dianalisis. Lokasi penyimpanan file harus diketahui untuk memudahkan
pengaktifan, untuk itu diperlukan manajemen file yang baik yaitu dengan memberikan
nama direktori dan file dengan nama yang mudah diingat.
Untuk membuka file sebagai contoh pada gambar 5 ditampilkan lokasi serta nama
file yang akan dibuka, file yang terlihat hanya yang berekstension sav, karena file of type
yang diinginkan adalah SPSS (*.sav). Langkah-langkahnya dapat dilihat sebagai berikut.
17
Gambar 5. Tampilan ketika membuka file data
18
Memilih variabel yang diperlukan juga dapat melalui lembar syntax, yaitu pilih menu
File, kemudian pilih New, lalu Syntax.
Sebagai contoh, jika kita ingin menyimpan beberapa variabel dari file data yang kita
buka, dapat kita ketik pada lembar syntax sebagai berikut.
Save outfile=’c:namafilebaru.sav’
/keep= variabel1, variabel2, variabel3, variabel4, variabel5
/compressed.
Execute.
19
Catatan: b4k5 adalah variabel umur
20
Langkah-langkah: (lihat gambar 8)
1. Semua variabel yang akan dijumlahkan dan variabel baru sebagai tempat
penjumlahan harus dalam status string
2. Lebar variabel baru yang akan dibuat harus sama dengan penjumlahan lebar
semua variabel
3. Pilih menu Transform dan click dua kali pada perintah Compute
4. Isi kotak Target Variabel dengan Nama variabel baru
5. Pilih perintah Type & Label, pastikan variabel baru dalam String dan jumlah
digit sama dengan jumlah digit seluruh variabel yang akan dibuat variabel
kunci
6. Pilih Concat pada kotak Function, pindahkan ke kotak String Expression
7. Pindahkan seluruh variabel di kotak sebelah kiri yang akan dijumlahkan ke
kotak String Expression di kotak sebelah kanan
21
Gambar 9. Tampilan untuk menambah record
ii. Add variables, perintah ini untuk menambah variabel dari file lain. Hal penting
yang harus diperhatikan pada proses penggabungan ini adalah variabel kunci
sebagai penghubung 2 file yang akan digabung harus sama.
Terdapat 2 macam cara penggabungan file untuk menambah variabel:
1. One to One, menggabungkan 2 file data yang masing-masing recordnya
mempunyai variabel kunci yang unik, misalnya file “individu yang berisi data
penyakit” sebagai file I akan digabung dengan file “individu yang berisi data
perilaku” sebagai file II.
Langkah-langkahnya sebagai berikut (lihat gambar 10):
1. Buka file pertama, buat variabel kunci (id)
2. Sort variabel kunci secara ascending dengan perintah Sort cases di
bawah menu bar Data. File setelah di-sort kemudian disimpan dengan
perintah Save
22
6. Pilih Add variables
7. Pilih File yang akan digabungkan
8. Beri tanda pada Match cases on key variables in sorted files
9. Pilih Both files provide cases
10. Pindahkan variabel kunci yang terdapat pada kotak Excluded
Variables ke dalam kotak Key Variables, tekan OK
Variabel – variabel yang ada di kotak excluded variabels adalah
variabel yang ada di kedua file, maka variabel yang sama yang ada di
file kedua tidak akan diikutsertakan dalam penggabungan file.
11. Lakukan perintah Save as.
2. Many to One atau One to many, menggabungkan 2 file data yang salah
satunya mempunyai variabel kunci yang unik dan file lainnya dengan satu
variabel kunci dimiliki oleh beberapa record, misalnya file “rumah tangga
yang berisi pengeluaran” akan digabung dengan file “individu yang berisi data
pemanfaatan pelayanan kesehatan”.
Langkah-langkahnya sebagai berikut (lihat gambar 10):
1. Buka file pertama (misal: file rumah tangga), buat variabel kunci
(idrt)
2. Sort variabel kunci secara ascending dengan perintah Sort cases di
bawah menu bar Data. Setelah di-sort kemudian disimpan dengan
perintah Save.
3. Buka file kedua (misal: file individu), buat variabel kunci (idrt)
23
4. Sort variabel kunci secara ascending dengan perintah Sort cases di
bawah menu Data. File setelah di-sort kemudian disimpan dengan
perintah Save.
5. Pilih menu Data kemudian pilih merge file
6. Pilih Add variables
7. Pilih File yang akan digabungkan (file rumah tangga yang sudah di
sort)
8. Beri tanda pada Match cases on key variables in sorted files
9. Pilih Non-active dataset is keyed table
Catatan:
Jika file yang terakhir aktif adalah file yang mempunyai variabel
kunci unik dimiliki oleh beberapa record (misal: file individu)
maka pilih Non-active dataset is keyed table
Contoh:
Variabel kunci Individu Variabel kunci RT
1111 A 1111 I
1111 B 2222 II
1111 C 3333 III
2222 A 4444 IV
2222 B 5555 V
3333 A 6666 VI
3333 B 7777 VII
24
File aktif
Jika file yang terakhir aktif adalah file yang mempunyai variabel
kunci unik (misal: file RT) di masing-masing record, maka yang
dipilih adalah Active dataset is keyed table
25
IV. MANIPULASI DATA
26
8. Tekan Add pada kotak Old New, lanjutkan dengan
pengelompokkan yang lain.
9. Tekan Continue jika seluruh pengelompokkan yang
diinginkan sudah dilakukan.
10. Tekan OK.
27
Langkah-langkah:
1. Pilih menu Transform dan click dua kali pada perintah Compute
2. Isi kotak Target Variabel dengan Nama variabel baru
3. Pilih perintah Type & Label, untuk menentukan tipe dari variabel baru yang
dibuat
4. Isi kotak Numeric Expression dengan kode, misalnya 1
5. Pilih kotak If dan isikan kondisi yang diinginkan untuk kode “1” yang telah
diketikkan pada kotak Numeric Expression.
28
V. ANALISIS DATA
Keunggulan SPSS daripada program Epi Info dalam analisis, yaitu dapat digunakan
untuk menganalisis sampai dengan multivariat. Banyak pilihan uji statistik, namun pemakai
tetap harus menyesuaikan dengan jenis data yang digunakan. Seluruh pilihan uji statistik
terdapat di bawah menu bar Analyze.
Keunggulan lain dari SPSS adalah dapat melengkapi hasil analisis dengan berbagai macam
grafik. Grafik-grafik tersebut terdapat di bawah menu bar Graphs.
Gambar 16a. Tampilan menu analisa dan pilihan statistik univariat kategori
29
4.Akhiri dengan menekan perintah OK
Gambar 16b adalah contoh analisis univariat untuk data kontinyu yang bertujuan untuk
melihat satu nilai yang dapat mewakili sekelompok nilai. Nilai tersebut dapat berupa
mean (rata-rata), median (nilai tengah), modus (nilai yang paling sering keluar). Selain itu
ketiga nilai tersebut juga untuk menentukan pemilihan uji statistik selanjutnya.
Statistics
Berat Badan
N Valid 24997
Missing 533
Mean 44.003
Median 48.700
Mode 60.0
Skewness -.377
Std. Error of Skewness .015
Gambar 16b. Tampilan menu analisa dan pilihan statistik univariat kontinyu
30
Langkah pertama dari kegiatan analisis adalah sebagai berikut:
1. Pilih menu Analyze lalu pilih Descriptive Statistics, kemudian frequencies
2. Variabel yang ingin ditampilkan masukkan dalam kotak pilihan.
3. Perhatikan kotak pada Display frequency tables, tanda √ dapat dihilangkan jika
tidak dibutuhkan
4. Pilih icon statistics untuk memunculkan nilai mean, median, modus dan pilih icon
charts untuk memunculkan grafik histogram, akhiri dengan perintah OK
Cara lain untuk melihat suatu data normal atau tidak normal dapat dilakukan uji dengan
Kolmogorov smirnov. Uji ini menggunakan Ho nya adalah distribusi normal, jadi jika nilai uji
< 0,05 justru distribusi tersebut tidak normal. Langkah-langkah melakukan uji ini adalah
sebagai berikut:
1. Pilih menu Analyze lalu pilih Non parametric Test, kemudian sampel K-S
2. Variabel yang ingin diuji masukkan dalam kotak test variable list.
3. Perhatikan tanda √ kotak pada Test Distribution-Normal untuk mengeluarkan hasil
uji normalitas
4. Akhiri dengan menekan perintah OK
Berat Badan
N 72894 Ho: Data berdistribusi normal
Normal Parameters a,b Mean 42.606 Ha: Data tidak berdistribusi normal
Std. Deviation 17.9724
Most Extreme Absolute .109
Differences Positive .075 Hasil analisis p=0,000 atau p<0,05
Negative -.109 Kesimpulan Ho ditolak, data tidak
Kolmogorov-Smirnov Z 29.336 berdistribusi normal
Asymp. Sig. (2-tailed) .000
a. Test distribution is Normal.
b. Calculated from data.
31
Gambar 16c. Tampilan uji distribusi normal
32
Gambar 17. Tampilan jenis-jenis grafik
Perintah grafik tersedia dalam menu bar Graphs, kemudian pilih Chart Builder dan kemudian
Gallery. Pilih grafik yang akan ditampilkan (misalnya Bar) dengan cara klik pada kotak yang
berisi gambar grafik tersebut, pilih variabelnya lalu tekan Ok.
33