Saptawati Bardosono
Pendahuluan
Pada saat merancang usulan penelitian, maka pengolahan datanya sudah harus direncanakan pula:
1) 2)
Teknik pengolahan data meliputi: editing, coding, entry dan cleaning serta analisis Tabel, grafik atau ringkasan angka2 yang akan dihasilkan
Masalah yang sering timbul: Model analisis muncul setelah data terkumpul
Editing
Dilakukan pemeriksaan seluruh kuesioner atau seluruh formulir isian setelah data terkumpul, apakah:
1) 2) 3) 4)
Dapat dibaca Semua pertanyaan terisi (lengkap) Terdapat ketidakserasian antara jawaban yang satu dengan yang lainnya (konsisten) Terdapat kesalahan2 lain yang dapat mengganggu pengolahan data selanjutnya (akurat)
Editing
Kegiatan editing dapat dilakukan dengan cara:
1)
Editing lapangan, dimana supervisor mengadakan pengecekan ulang terhadap beberapa pertanyaan penting biasanya kepada 10% responden segera setelah data terkumpul semuanya Editing menyeluruh, dilakukan secara menyeluruh terhadap jawaban responden, sehingga dapat diperoleh konsistensi jawaban
2)
Editing
Yang sering terjadi misalnya
1) 2) 3) 4)
Jawaban tidak tepat dikolom yang tersedia Salah menulis jawaban pertanyaan, misalnya data kelamin diisi di kolom jawaban umur Umur diisi 25 tahun tetapi di jumlah anak diisi 10 Salah menggunakan unit ukuran
Koding
Memberi angka2 atau kode2 tertentu yang telah disepakati terhadap jawaban2 pertanyaan dalam kuesioner, sehingga memudahkan pada saat memasukkan data ke komputer Misalnya untuk variabel pendidikan:
1) 2) 3) 4) 5)
Koding
Persyaratan dalam koding:
1) 2)
Kesesuaian, variabel harus sesuai dengan tujuan Klasifikasi, perlu dibuat kategorisasi untuk pengelompokkan jawaban sesuai rujukan/ alasan tertentu, misal: pendapatan Jawaban tidak mendua, pilihan jawaban yang tersedia harus jelas definisi operasionalnya Harus tersedia buku definisi variabel
3) 4)
Data Entry
Menyiapkan lembar kerja yang berisi variabel2 dalam kuesioner secara lengkap (program SPSS, Stata, Epi-Info, dll) Masukkan data jawaban kuesioner sesuai kode yang telah ditentukan untuk masing-masing variable sehingga menjadi suatu data dasar Siapkan file khusus untuk menyimpan data dasar tersebut yang tidak boleh dianalisis. Untuk melakukan analisis data maka gunakan file khusus
Data Cleaning
Merupakan analisis data awal, dimana dilakukan penggolongan, pengurutan dan penyederhanaan data, sehingga mudah dibaca dan diinterpretasi Untuk data nominal dan ordinal, dibuat tabulasi distribusi frekuensi untuk setiap variabel Untuk data interval/rasio, dianalisis nilai tengah dan tes normalitas datanya
Data Cleaning
Tabel distribusi frekuensi untuk:
1) 2) 3)
Deskripsi ciri-ciri atau karakteristik dari suatu variabel Mempelajari distribusi dari variabel pokok Memilih klasifikasi2 pokok untuk tabulasi silang
Data Cleaning
Tabel silang, yaitu teknik untuk membandingkan atau melihat hubungan antara dua variabel atau lebih:
1) 2) 3)
Dihitung persentase responden untuk setiap kelompok Variabel bebas pada baris (faktor risiko) Variabel terikat pada kolom (penyakit)
Selanjutnya, data siap dianalisis untuk membuktikan hipotesis penelitian dengan analisis statistik bivariat dan multivariat
SPSS
(statistical program for social sciences)
Tampilan layar SPSS ada 2: Sebagai lembar kerja seperti Excel, dBase = data view Sebagai definisi operasional = variable view Dengan menu2 yang mudah dijalankan
Data view
Variabel Variabel Variabel dst 1 2 dst
Variabel view
Name Type Width Decimals Label Values dst
dst
Penggunaan SPSS
Menyiapkan sarana untuk data entry (penyusunan lembar kerja) Membantu data cleaning (analisis awal) Analisis statistik untuk membuktikan hipotesis Analisis statistik untuk penyajian data
Menyiapkan sarana untuk data entry (penyusunan lembar kerja) Membantu data cleaning (analisis awal) Analisis statistik untuk membuktikan hipotesis Analisis statistik untuk penyajian data
Lokasi penelitian Tanggal pengambilan data Nama ibu Tanggal lahir Berat badan Tinggi badan Tingkat pendidikan ibu Jenis pekerjaan ibu Pengetahuan ibu tentang gizi seimbang
Data nominal/ordinal distribusi frekuensi (proporsi): analyze pilih descriptive statistics pilih frequencies masukkan variabel kategorik dalam variable (agegroup) aktifkan display frequency table pilih OK.
age grouping Frequency 5 6 5 16 Percent 31.3 37.5 31.3 100.0 Valid Percent 31.3 37.5 31.3 100.0 Cumulative Percent 31.3 68.8 100.0
Valid
Data interval/rasio:
Distribusi
Distribusi normal?
1. 2. 3. 4.
Signifikansi KS >0,05 Signifikansi SW >0,05 Nilai kerampingan dan kemiringan Histogram dalam area kurva normal
Histogram
12 8
Count
Histogram:
Bentuk kurva simetris Mean = median = mode Kiri = kanan = 50%
analyze pilih descriptive statistics pilih explore masukkan variabel rasio dalam dependent list (wgt0) pada pilihan display pilih plots klik plots pilih normality plots with test (non-aktifkan yang lainnya) pilih continue pilih OK. Perhatikan tampilan tabel test of normality
.564 1.091
final cholesterol st
2
Count
Gender * final cholesterol status Crosstabulation final cholesterol status normal high 2 7 22.2% 77.8% 22.2% 12.5% 7 100.0% 77.8% 43.8% 9 56.3% 100.0% 56.3% 100.0% 43.8% 0 .0% .0% .0% 7 43.8% 100.0% 43.8%
Gender
Total 9 100.0% 56.3% 56.3% 7 100.0% 43.8% 43.8% 16 100.0% 100.0% 100.0%
Gender
Male
Female
Total
Count % within Gender % within final cholesterol status % of Total Count % within Gender % within final cholesterol status % of Total Count % within Gender % within final cholesterol status % of Total
Chi-Square Tests Value 9.679b 6.777 12.395 9.074 16 df 1 1 1 1 Asymp. Sig. (2-sided) .002 .009 .000 .003 Exact Sig. (2-sided) Exact Sig. (1-sided)
Pearson Chi-Square Continuity Correctiona Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases
.003
.003
a. Computed only for a 2x2 table b. 3 cells (75.0%) have expected count less than 5. The minimum expected count is 3.06.
age grouping * final cholesterol status Crosstabulation final cholesterol status normal high 4 1 80.0% 20.0% 44.4% 25.0% 2 33.3% 22.2% 12.5% 3 60.0% 33.3% 18.8% 9 56.3% 100.0% 56.3% 14.3% 6.3% 4 66.7% 57.1% 25.0% 2 40.0% 28.6% 12.5% 7 43.8% 100.0% 43.8%
Total 5 100.0% 31.3% 31.3% 6 100.0% 37.5% 37.5% 5 100.0% 31.3% 31.3% 16 100.0% 100.0% 100.0%
age grouping
<50
50-60
>60
Total
Count % within age grouping % within final cholesterol status % of Total Count % within age grouping % within final cholesterol status % of Total Count % within age grouping % within final cholesterol status % of Total Count % within age grouping % within final cholesterol status % of Total
Chi-Square Tests Value 2.455a 2.558 .381 16 df 2 2 1 Asymp. Sig. (2-sided) .293 .278 .537
a. 6 cells (100.0%) have expected count less than 5. The minimum expected count is 2.19.
Analyze non-parametric tests 2 independent samples aktifkan KS test variable: agegroup grouping: cholstat OK
Test Statisticsa Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Grouping Variable: cholesterol status Absolute Positive Negative age grouping .302 .302 -.048 .598 .866
Cholesterol
Final cholesterol
Spearman's rho
Cholesterol
Final cholesterol
Persamaan regresi:
Graph interactive scatter plot sumbu X = variabel bebas (wgt0) sumbu Y = variabel terikat (wgt3) fit regression include constant in equation fit lines for total - OK
250
Linear Regression
Final cholesterol
200
175
150
150
175
200
225
250
Cholesterol
Group Statistics Gender Male Female N 9 7 Mean 223.78 165.71 Std. Deviation 18.754 10.935 Std. Error Mean 6.251 4.133
Cholesterol
Independent Samples Test Cholesterol Equal variances Equal variances assumed not assumed 1.521 .238 7.255 7.748 14 13.168 .000 .000 58.06 8.003 Lower Upper 40.898 75.229 58.06 7.494 41.895 74.232
F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference
Analyze non-parametric tests 2 independent samples - pada test variable(s) pilih variabel numerik (wgt0) pada grouping variable masukkan variabel 2 kategorik (gender) pada define group masukkan 1 untuk group 0 dan 2 untuk group 1 pilih continue pada test type aktifkan Mann Whitney OK. Perhatikan hasilnya
Ranks Cholesterol Gender Male Female Total N 9 7 16 Mean Rank 12.00 4.00 Sum of Ranks 108.00 28.00
Test Statisticsb Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed) Exact Sig. [2*(1-tailed Sig.)] Cholesterol .000 28.000 -3.339 .001 .000
a
Paired Samples Statistics Mean 198.38 190.31 N 16 16 Std. Deviation 33.472 33.508 Std. Error Mean 8.368 8.377
Pair 1
Paired Samples Test Pair 1 Cholesterol Final cholesterol 8.06 2.886 .722 Lower Upper 6.52 9.60 11.175 15 .000
Paired Differences
Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference
t df Sig. (2-tailed)
Ranks N Final cholesterol - Cholesterol Negative Ranks Positive Ranks Ties Total 16a 0b 0c 16 Mean Rank 8.50 .00 Sum of Ranks 136.00 .00
a. Final cholesterol < Cholesterol b. Final cholesterol > Cholesterol c. Final cholesterol = Cholesterol
Descriptives Cholesterol 95% Confidence Interval for Mean Lower Bound Upper Bound 150.85 223.95 176.45 254.55 151.57 226.03 180.54 216.21
ANOVA Cholesterol Sum of Squares 2820.250 13985.500 16805.750 df 2 13 15 Mean Square 1410.125 1075.808 F 1.311 Sig. .303
Multiple Comparisons Dependent Variable: Cholesterol Bonferroni Mean Difference (I-J) -28.10 -1.40 28.10 26.70 1.40 -26.70
95% Confidence Interval Lower Bound Upper Bound -82.64 26.44 -58.36 55.56 -26.44 82.64 -27.84 81.24 -55.56 58.36 -81.24 27.84
Uji Kruskal-Wallis:
Analyze non-parametric tests k independent samples test variable: wgt0 grouping: agegroup define: minimum (1) dan maximum (3) continue - OK
N 5 6 5 16
REGRESI BERGANDA
Memprediksi besar variabel dependen dengan menggunakan data variabel bebas yang sudah diketahui besarnya
REGRESI BERGANDA
: WGT4 Independent(s): WGT0, TG0, AGE Case labels: gender Method: enter OK
REGRESI BERGANDA
b Variables Entered/Removed
Model 1
Variables Removed
Method
Enter
REGRESI BERGANDA
Model Summary Model 1 R .997a R Square .994 Adjusted R Square .992 Std. Error of the Estimate 2.953
REGRESI BERGANDA
ANOVAb Model 1 Sum of Squares 16736.790 104.648 16841.438 df 3 12 15 Mean Square 5578.930 8.721 F 639.737 Sig. .000a
a. Predictors: (Constant), Cholesterol, Age in years, Triglyceride b. Dependent Variable: Final cholesterol
REGRESI BERGANDA
a Coefficients
Model 1
Unstandardized Coefficients B Std. Error 3.375 8.574 -.164 .111 -.010 .027 .995 .024
Persamaan regresi: Kadar kolesterol akhir = 3,375 0,164 usia 0,10 kadar trigliserida awal + 0,995 kadar kolesterol awal
REGRESI BERGANDA
Residuals Statisticsa Predicted Value Residual Std. Predicted Value Std. Residual Minimum 142.66 -5.05 -1.426 -1.712 Maximum 249.33 4.88 1.767 1.652 Mean 190.31 .00 .000 .000 Std. Deviation 33.403 2.641 1.000 .894 N 16 16 16 16
REGRESI BERGANDA
b Variables Entered/Removed
Model 1
Variables Removed .
Method Enter
Model 1
R .996a
R Square .993
REGRESI BERGANDA
ANOVAb Model 1 Sum of Squares 16716.618 124.819 16841.438 df 1 14 15 Mean Square 16716.618 8.916 F 1874.976 Sig. .000a
REGRESI BERGANDA
a Coefficients
Model 1
(Constant) Cholesterol
t -1.628 43.301
Persamaan regresi: Kadar kolesterol akhir = -7,536 + 0,997 kadar kolesterol awal
Cholesterol
Final cholesterol
Linear Regression
Final cholesterol
200
175
150
150
175
200
225
250
Cholesterol
Ingin memprediksi variabel dependen yang berskala binari (ya=1 dan tidak=0) dengan menggunakan data variabel independen yang sudah diketahui besarnya
Dependent:
cholst0 (status kadar kolesterol awal, 1=tinggi, 0=normal) Covariates: age dan TG0 Options: Homer-Lemeshow goodness of fit OK
a. If weight is in effect, see classification table for the total number of cases.
Total 2 2 2 2 2 2 2 2
Step 1
1 2 3 4 5 6 7 8
Predicted cholesterol status normal high 5 4 4 3 Percentage Correct 55.6 42.9 50.0
Step 1
normal high
Penafsiran dan prediksi: Status kadar kolesterol = -5,970 + 0,42 usia + 0,025 kadar trigliserida
60
40
Count
20 0 Bekerja Tidak Bekerja/Ibu Rumah Tangga
working status
12
Count
11.00
12.00
13.00
14.00
Linear Regression
170.00
height
160.00
150.00
40.00
50.00
60.00
70.00
80.00
90.00
last education
SD SLTP SMU Akademi Perguruan Tinggi Pies show percents 20.00%
50.00%