( DESKTIPTIF)
1). Mean
Mean/average adalah ukuran rata-rata yang merupakan hasil dari jumlah semua
nilai pengukuran dibagioleh banyaknya pengukuran. Secara sederhana
perhitungan nilai mean dapat dituliskan dengan rumus :
X = Σ Xi / n
5
karena itu pada kelompok data yang ada nilai ekstrimnya (sering dikenal dengan
‘distribusi data yang menceng/miring’), Mean tidak dapat mewakili rata-rata
kumpulan nilai pengamatan. Sebagai contoh data yang ada nilai ekstrimnya adalah
data penghasilan. Apabila mean pendapatan perbulan adalah Rp 10.000.000,- ,
sebenarnya sebagian besar orang pendapatannya di bawah Rp 10.000.000,- . Mean
sebesar Rp 10.000.000,- diperoleh karena tarikan sekelompok kecil orang
(misalnya konglomerat) yang pendapatannya sangat tinggi. Dengan demikian
penggunaan mean untuk data yang ada nilai ekstrimnya (data yang distribusinya
menceng) kurang tepat.
Contoh; ada 5 pasien diukur lama hari rawatnya : 1 hr, 3 hr, 4 hr, 2 hr, 90 hr.
Mean = (1+3+4+2+90)/5 = 20 hr.
Dari hasil penghitungan didapatkan rata-rata lama hari rawat 20 hari, hasil ini
tentunya tidak dapat mewakili karena secara visual datanya sebagian besar kurang
dari 5 hari. Keadaan ini bisa terjadi karena kumpulan data di atas ada nilai
ekstrimnya.
2). Median
Median adalah nilai dimana setengah banyaknya pengamatan mempunyai nilai di
bawahnya dan setengahnya lagi mempunyai nilai di atasnya. Berbeda dengan nilai
mean, penghitungan median hanya mempertimbangkan urutan nilai dasil
pengukuran, besar beda antar nilai di abaikan. Karena mengabaikan besar beda,
maka median tidak dipengaruhi oleh nilai ekstrim. Prosedur penghitungan median
melalui langkah
a). Data diurutkan/di-array dari nilai kecil ke besar
b). Hitung posisi median dengan rumus (n+1)/2 c).
Hitung nilai mediannya
Contoh ada usia 6 mahasiswa 20 th, 26 th, 24 th, 30 th, 40 th, 36
th Data diurutkan: 20, 24, 26, 30, 36, 40 Posisi = (6+1)/2 = 3,5
6
3). Mode/Modus
Mode adalah nilai pengamatan yang mempunyai frekuensi/jumlah terbanyak.
Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20 th, 23th, 20 th.
Dari data tersebut berarti mode-nya adalah 20 tahun
b. Ukuran Variasi
Nilai-nilai hasil pengamatan akan cenderung saling berbeda satu sama lain atau
dengan kata lain hasil pengamatan akan bervariasi. Untuk mengetahui seberapa jauh
data bervariasi digunakan ukuran variasi antara lain range, jarak linier kuartil dan
standard deviasi.
1). Range
Range merupakan ukuran variasi yang paling dasar, dihitung dari selisih nilai
terbesar dengan nilai terkecil. Kelemahan range adalah dipengaruhi nilai ekstrim.
Keuntungan penghitungan dapat dilakukan dengan cepat.
2). Jarak Inter Quartil
Nilai observasi disusun berurutan dari nilai ke cil ke besar, kemudian ditentukan
kuartil bawah dan atas. Kuartil merupakan pembagian data menjadi 4 bagian yang
dibatasi oleh tiga ukuran kuartil, yaitu kuartil I, kuartil II dan kuartil III.
Kuartil I mencakup 25% data berada di bawahnya dan 75% data berada di atasnya.
Kuartil II (median) mencakup 50% data berada di bawahnya dan 50% data berada
di atasnya.
Kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di
atasnya.
7
Jarak inter kuartil adalah selisih anatar kuaril III dan kuaril I. Ukuran ini lebih
baik dari range, terutama kalau frekuensi pengamatan banyak dan distribusi
sangat menyebar.
Semakin besar nilai varian akan semakin bervariasi, karena satuan varian
(kuadrat) yang tidak sama dengan satuan nilai pengamatan, maka dikembangkan
suatu ukuran variasi yang mempunyai satuan yang sama dengan satuan
pengamatan, yaitu Standard Deviasi.
Standard Deviasi merupakan akar dari varian:
Seperti halnya varian, semakin besar SD semakin besar variasinya. Apabila tidak
ada variasi, maka SD=0
Dari uraian tersebut dapat disimpulkan, untuk data numerik digunakan nilai
mean (rata-rata), median, standard deviasi dan inter quartil range, minimal dan
maksimal. Bila data yang terkumpul tidak menunjukkan adanya nilai ekstrim
(distribusi normal), maka perhituungan nilai mean dan standard deviasi merupakan
cara analisis univariat yang tepat. Seddangkan bila dijumpai nilai ekstrim 9 distribusi
data tidak normal), maka nilai nedian dan inter quartil range (IQR) yang lebih tepat
dibandingkan nilai mean.
8
berjenis katagorik, tentunya informasi/peringkasan yang penting disampaikan tidak
mungkin/tidak lazim menggunakan ukuran mean atau median. melainkan informasi
jumlah dan persentase yang disajikan. Untuk ukuran variasi, pada data katagorik
variasi maksimal apabila jumlah antar katagori sama.
Contoh: Kelas A: mahasiswa 50 dan mahasiswi 50
Kelas B: mahasiswa 90 dan mahasiswi 10
Pada kelas A, jenis kelamin mahasiswa bervariasi (heterogen) karena 50% pria dan
50% wanita.
Pada kelas B, jenis kelamin mahasiswa tidak bervariasi (homogen pada pria) karena
pria 90% dan wanita hanya 10%.
a. Data numerik
Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun 1999
Variabel Mean SD Minimal- Maksimal
Median
1. Umur 30,3 10,1 17 – 60
31,1
2. Lama hari rawat 10,1 8,9 2 – 60
7,0
9
b. Data katagorik
Tabel 2
Distribusi Responden Menurut Tingkat Pendidikan Pasien Rumah sakit X
tahun 1999
Pendidikan Jumlah Persentase
SD 60 60,0
SMP 30 30,0
SMU 10 10,0
Total 100 100,0
10
KASUS :
ANALISIS DESKRIPTIF (UNIVARIAT)
Tujuan analisis ini adalah untuk mendeskripsikan karakteristik masing-masing
variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk data numerik
digunakan nialai mean (rata-rata), median, standard deviasi dll. Sedangkan untuk data
katagorik tentunya hanya dapat menjelaskan angka/nilai jumlah dan persentase
masing-masing kelompok. Berikut akan dipelajari cara mengeluarkan analisis
deskriptif di SPAA, dimulai untuk variabel katagorik (sebagai latihan digunakan
variabel ‘pendidikan’) dan kemudian dilanjutkan variabel numerik (variabel umur).
a. Data Katagorik
Untuk menampilkan tabulasi data katagorik digunakan tampilan frekuensi.
Sebagai contoh kita akan menampilkan tabel distribusi frekuensi untuk variabel
pendidikan dari file ‘ASI.SAV’.
1. Dari menu utama SPSS pilih ‘Analyze’, kemudian ‘Descriptive Statistic’ dan pilih
‘Frequencies’, sehingga muncul tampilan:
2. Sorot variabel ‘didik’. Klik tanda panah dan masukkan ke kotak “Variable (s)”
11
3. Klik ‘OK’, hasil dapat dilihat di jendela output, seperti sbb:
Frequencies
Statistics
pendidikan formal ibu menyusui
N Valid 50
Missing 0
Kolom ‘Frequency’ menunjukkan jumlah kasus dengan nilai yang sesuai. Pada contoh
di atas, total responden 50 orang, dari jumlah tersebut 10 ibu yang berpendidikan SD,
proporsi dapat dilihat pada kolom ‘Percent’, pada contoh di atas ada 20% ibu yang
berpendidikan SD. Kolom ‘Valid Percent’ memberi hasil yang sama karena pada data
ini tidak ada ’missing cases’. ‘Cumulative Percent’
12
menjelaskan tentang persent kumulatif. Pada contoh di atas ada 42,0% ibu yang
tingkat pendidikannya SD dan SMP. Dalam menginterpretasikan tabel katagorik
dapat dilihat dari variasi dan konsentrasi datanya.
Tabel …
Distribusi Responden Menurut Tingkat Pendidikan
Di ………… X tahun ….
Pendidikan Jumlah Persentase
SD 10 20,0
SMP 11 22,0
SMU 16 32,0
PT 13 26,0
Total 50 100,0
b. Data Numerik
13
histogram dan kurve normalnya. Berikut akan dicoba mengeluarkan analisis deskriptif
untuk variabel umur dengan menggunakan perintah frequencies.
1. Aktifkan data “susu.sav”
2. Pilih ‘Analyze’
3. Pilih ‘Descriptive Statistic’
4. Pilih ‘Frequencies’, terlihat kotak frequencies:
5. Sorot variabel yang akan dianalisis, sorot umur, dan klik tanda panah
sehingga umur masuk ke kotak variable (s).
6. Klik tombol option ‘Statistics…’, pilih ukuran yang anda minta misalnya
mean, median, standard seviasi, minimum, maximum, SE.
7. Klik ‘Continue’
8. Klik tombol option ‘Charts’ lalu muncul menu baru dan klik ‘Histogram’, lalu
klik ‘With Normal Curve’
14
9. Klik ‘Continue’
10. Klik ‘OK’, dan pada layar terlihat distribusi frekuensi disertai ukuran statistic
yang diminta dan dibawahnya tampak grafik histogram beserta curve
normalnya.
Frequencies
Statistics
Umur ibu menyusui
N Valid 50
Missing 0
Statistics
Umur ibu menyusui
N Valid 50
Missing 0
Mean 25.10
Std. Error of Mean .686
Median 24.00
Mode 19
Std. Deviation 4.850
Minimum 19
Maximum 35
15
Umur ibu menyusui
Cumulative
Frequency Percent Valid Percent
Percent
Valid19 7 14.0 14.0 14.0
20 3 6.0 6.0 20.0
21 3 6.0 6.0 26.0
22 5 10.0 10.0 36.0
23 5 10.0 10.0 46.0
24 4 8.0 8.0 54.0
25 2 4.0 4.0 58.0
26 5 10.0 10.0 68.0
27 3 6.0 6.0 74.0
30 3 6.0 6.0 80.0
31 3 6.0 6.0 86.0
32 3 6.0 6.0 92.0
34 2 4.0 4.0 96.0
35 2 4.0 4.0 100.0
Total 50 100.0 100.0
Dari hasil di atas, nilai rata-rata dapat dilihat pada baris mean, sedangkan nilai
standard deviasi dapat dilihat pada baris std. Seviation. Pada contoh di atas, rata-rata
16
umur ibu adalah 25,10 tahun, median 24,0 tahun dan standard deviasi 4,85 tahun
dengan umur termuda 19 tahun dan yang tertua 35 tahun. Distribusi frekuensi
ditampilkan menurut umur termuda sampai dengan umur tertua dengan informasi
tentang jumlah dan persentasenya. Bentuk distribusi data dapat diketahui dari grafik
histogram dan kurve normalnya. Dari tampilan grafik dapat dilihat bahwa distribusi
variabel umur berbentuk normal
Dari hasil di atas belum diperoleh informasi estimasi interval yang penting untuk
melakukan estimasi parameter populasi. Bila anda ingin memperoleh estimasi interval
lakukan analisis eksplorasi data dengan perintah ‘Explore’. Adapun caranya sbb:
1. Dari menu utama SPSS, pilih menu ‘Analyze’, kemudian pilih submenu
‘descriptive Statistics’, lalu pilih ‘Explore’
2. Isikan kotak ‘Dependent List’ dengan variabel ‘umur’, kotak ‘Factor List’ dan
‘Label Cases By’ biarkan kosong, sehingga tampilannya sbb:
17
4. Klik ‘Continue’
5. Klik ‘OK’, hasilnya dapat dilihat di layar:
Explore
Descriptives
Statistic Std. Error
18
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
umur ibu menyusui .130 50 .035 .920 50 .002
a
. Lilliefors Significance Correction
umur ibu menyusui
umur ibu menyusui Stem-and-Leaf Plot
Frequency Stem & Leaf
7.00 1 . 9999999
20.00 2 . 00011122222333334444
10.00 2 . 5566666777
11.00 3 . 00011122244
2.00 3 . 55
Stem width: 10
Each leaf: 1 case(s)
19
Dari hasil analisis ‘Explore’ terlihat juga nilai mean, median dan mode. Namun yang
paling penting dari tampilan explore munculnya angka estimasi interval. Dari hasil
tersebut kita dapat melakukan estimasi interval dari umur ibu. Kita dapat menghitung
95% confidence interval umur yaitu 23,72 s.d. 26,48. Jadi kita 95% yakin bahwa rata-
rata umur ibu di populasi berada pada selang 23,72 sampai 26,48 tahun.
20
Uji kenormalan data:
Untuk mengetahui suatu data berdistribusi normal, ada 3 cara untuk mengetahuinya yaitu:
1. Dilihat dari grafik histogram dan kurve normal, bila bentuknya menyerupai bel shape,
berarti distribusi normal
2. Menggunakan nilai Skewness dan standar errornya, bila nilai Skewness dibagi
standar errornya menghasilkan angka ≤ 2, maka distribusinya normal
3. Uji kolmogorov smirnov, bila hasil uji signifkan (p value > 0,05) maka distribusi
normal. Namun uji kolmogorov sangat sensitif dengan jumlah sampel, maksudnya :
untuk jumlah sampel yang besar uji kolmogorov cenderung menghasilkan uji yang
signifikan (yang artinya bentuk distribusinya tidak normal). Atas dasar kelemahan ini
dianjurkan untuk mengetahui kenormalan data lebih baik menggunakan angka
skewness atau melihat grafik histogram dan kurve
normal
Untuk variabel umur diatas, dilihat dari histogram dan kurve normal terlihat bentuk yang
normal, selain itu hasil dari perbandingan skwness dan standar error didapatkan:
0,547/0,337 =1,62 , hasilnya masih dibawah 2, berarti distribusi normal. Dari hasil
tersebut diatas dengan demikian variabel umur disimpulkan berdistribusi normal.
Hasil analisis didapatkan rata-rata umur ibu adalah 25,10 tahun (95% CI: 23,72 – 26,48),
dengan standar deviasi 4,85 tahun. Umujr termuda 19 tahun dan umur tertua 35 tahun.
Dari hasil estimasi interval dapat disimpulkan bahwa 95% diyakini bahwa rata-rata umur
ibu adalah diantara 23,72 sampai dengan 26,48 tahun.