Modul Statistika
Modul Statistika
Statistik deskriptif lebih berkenaan dengan pengumpulan dan peringkasan data, serta
penyajian hasil peringkasan tersebut. Data-data statistik, yang bisa diperoleh hasil
sensus, survei, jajak pendapat atau pengamatan lainnya umumnya masih bersifat acak,
mentah dan tidak terorganisir dengan baik (raw data). Data-data tersebut harus
diringkas dengan baik dan teratur, baik dalam bentuk tabel atau presentasi grafis yang
berguna sebagai dasar dalam proses pengambilan keputusan (statistik inferensi).
Penyajian tabel dan grafis yang digunakan dalam statistik deskriptif dapat berupa:
1. Distribusi frekuensi
2. Presentasi grafis seperti histogram, Pie chart dan sebagainya.
Selain tabel dan grafik, untuk mengetahui deskripsi data diperlukan ukuran yang lebih
eksak, yang biasa disebut summary statistics (ringkasan statistik).
Dua ukuran penting yang sering dipakai dalam pengambilan keputusan adalah:
1. Mencari central tendency (kecenderungan memusat), seperti Mean, Median,
dan Modus
2. mencari ukuran dispersion, seperti Standar Deviasi dan Varians
Selain central tendency dan dispersion, ukuran lain yang dipakai adalah Skewness
dan Kurtosis yang berfungsi untuk mengetahui kemiringan data (gradien data).
Kali ini akan dibahas menu dari SPSS yang berhubungan dengan statistik deskriptif,
yaitu Summarize. Dalam menu ini terdapat beberapa submenu sebagai berikut:
A. Frequencies
Menu ini membahas beberapa penjabaran ukuran statistik deskriptif seperti Mean,
Median, Kuartil, Persentil, Standar Deviasi dan lainnya.
B. Descriptives
Menu ini berfungsi untuk mengetahui skor-z dari suatu distribusi data dan
menguji apakah data berdistribusi normal atau tidak.
C. Explore
Menu ini berfungsi untuk memeriksa lebih teliti sekelompok data. Alat utama
yang dibahas adalah Box-Plot dan Steam & Leaf Plot, selain beberapa uji
tambahan untuk menguji apakah data berasal dari distribusi normal.
D. Crosstabs
Menu ini dugunakan untuk menyajaikan deskripsi data dalam bentuk tabel silang
(crosstab), yang terdiri aatas baris dan kolom. Selain itu menu ini juga dilengkapi
dengan analisis hubungan di antara baris dan kolom, seperti independensi diantara
mereka, besar hubungannya dan lainnya.
E. Case Summaries
Menu ini digunakan untuk melihat lebih jauh isis statistik deskriptif yang meliputi
subgrup dari sebuah kasus, seperti grup Pria dan grup Wanita, bisa dibuat
subgrup Pria Dewasa dan Pria Remaja, kemudian Wanita Dewasa dan
Wanita Remaja, serta dibagi lagi menjadi yang tinggal di kota dan di desa, dan
seterusnya.
Menu Frequencies
Contoh penggunaan Frequencies
Misalkan kita memiliki data tentang tinggi badan 25 orang mahasiswa (dalam
centimeter) yang diambil secara acak.
No
1
2
3
4
5
6
7
8
9
10
11
12
13
Tinggi
170.2
172.5
180.3
172.5
159.6
168.5
168.5
172.5
174.5
159.6
170.4
161.3
172.5
Gender
Pria
Pria
Pria
Pria
Wanita
Wanita
Pria
Pria
Pria
Wanita
Wanita
Wanita
Pria
No
14
15
16
17
18
19
20
21
22
23
24
25
Tinggi
170.4
168.9
168.9
177.5
174.5
186.6
164.8
170.4
168.9
164.8
167.2
167.2
Gender
Wanita
Wanita
Wanita
Wanita
Pria
Wanita
Wanita
Pria
Pria
Wanita
Wanita
Wanita
Yang pertama kita lakukan adalah ada memasukan data terebut ke dalam editor SPSS.
Pada bagian awal kita sudah mempelajari bagaimana membuat data baru dalam SPSS.
Langkah-langkahnya adalah sebagai berikut.
1. Mendefinisikan variabel.Ada banyak cara untuk mendefinisikan variabel,
diantaranya adalah sebagai berikut.
Karena pada contoh kita ada dua variabel (Tinggi Badan & Gender), maka kita
akan definisikan 2 variabel tersebut tipenya seperti apa. Pada bagian bawah
menu editor data, tekan tombol Variable View. Maka akan tampak tampilan
berikut:
ke-2. Kita ketikan Tinggi untuk variabel pertama dan Gender untuk
variabel kedua.
Untuk deklarasi Type variabel kita gunakan Numeric untuk variabel Tinggi
dan Gender. Nantinya untuk variabel Gender kita pilih angka 1 untuk
menandai gender Pria dan 2 untuk menandai gender Wanita.
Untuk Width, biasanya standar SPSS untuk numeric adalah 8, kita biarkan
saja angka 8 karena sudah mencukupi untuk keprluan kita.
Untuk Decimals, untuk variabel Tinggi, karena datanya mengandung 1 angka
di belakang koma, kita pilih 1. Sedangkan untuk gender karena bilangan bulat
kita pilih angka 0. Untuk itu kita perlu mengganti default yang ada pada editor
yaitu 2 dengan angka 1 dan 0 tersebut.
Untuk sementara biarkan submenu-submenu yang lain seperti Values, Label,
Missing dll. Seperti apa adanya. Tampilan akhir dapat dilihat seperti gambar
berikut ini.
Selanjutnya kita akan memasukan data yang kita punya dengan terlebih dahulu
menekan tombol Data View. Lalu ketiklah data yang ada, setelah itu simpan
dengan nama Deskriptif1.
2. Bila Anda sudah memiliki data tersebut dalam format Word atau Excel, Anda bisa
langsung meng-copy data tersebut dengan cara yang biasa Anda lakukan, yaitu
Copy-Paste. Setelah mengcopy dari data asal, maka lalu letakan pointer di baris1 kolom-1 SPSS kemudian klim menu Edit, dan pilih submenu Paste.
3. Setelah data ada, lalu kita olah, yaitu ingin menampilkan deskripsi statistik dari
data tersebut yaitu mengenai Mean, Standar Deviasi, Skewness, dll. Selain itu kita
ingin pula menampilkan Chart dari data yang sesuai dengan sata kuantitatif, yaitu
Histogram dan Bar Chart. Langkah-langkahnya sebagai berikut:
a. Dari baris menu, pilih menu Analyze, lalu pilih submenu Descriptive
Statistics, lalu pilih lagi sumenu Frequencies (untuk menampilkan tabel
frekuensi). Lalu akan tampil gambar berikut ini.
b. Kolom Variables(s) harus diisi dengan jenis-jenis variabel apa yang ingin kita
analisis. Karena ingin dibuat frekuensi dari variabel Tinggi, maka klik variabel
Tinggi, kemudia klik tanda , maka variabel Tinggi akan berpindah ke kolom
Vraible(s).
c. Klik pilihan Statistics, maka akan tampil di layar gambar berikut:
Menu Charts berkenaan dengan jenis grafik yang ingin kita pilih. Dari
Chart Type, untuk keseragaman kita pilih Histogram. Lalu menu With
normal curve-nya akan hidup, maka kita klik juga With normal curve.
Lalu klik Continue.
Sekarang editor akan kembali ke tampilan editor Frequencies seperti awal,
selanjutnya kita akan memilih menu Format.
Pada submenu Order by (data output akan disusun seperti apa ?) kita
seragamkan saja dengan memilih output akan disusun naik (dari data
terkecil ke data terbesar). Untuk itu pilih Ascending values. Selanjutnya
klik OK. Maka semua proses pengisian dan pengolahan data telah selesai,
dan kita akan lihat hasilnya (outputnya) pada editor Output.
Frequencies
Statistics
Tinggi
N
Mean
Std. Error of Mean
Median
Std. Deviation
Variance
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Percentiles
Valid
Missing
10
25
50
75
90
25
0
170.1200
1.20655
170.2000
6.03276
36.394
.572
.464
1.460
.902
27.00
159.60
186.60
160.6200
167.2000
170.2000
172.5000
178.6200
Ukuran Skewnes adalah 0,572 cm. Untuk penilaian, nilai tersebut diubah
ke angka rasio. Rasio kurtosis adalah = nilai kurtosis/standar error kurtosis
= 0,572/0,902 = 0,63. Sebagai pedoman, bila rasio kurtosis berada antara
-2 sampai dengan +2, maka distribusi data adalah normal.
Ukuran kurtosis adalah 1,460 cm
Data minimum adalah 159,60 cm sedangkan data maksimum adalah
186,60 cm
Range data = Data maksimum Data minimum adalah 27,00 cm
Angka Persentil:
o Rata-rata tinggi badan 10% responden di bawah 160,62 cm
o Rata-rata tinggi badan 25% responden di bawah 167,20 cm
o Rata-rata tinggi badan 50% responden di bawah 170,20 cm
o Rata-rata tinggi badan 75% responden di bawah 172,50 cm
o Rata-rata tinggi badan 90% responden di bawah 178,62 cm
Tinggi
Valid
159.60
161.30
164.80
167.20
168.50
168.90
170.20
170.40
172.50
174.50
177.50
180.30
186.60
Total
Frequency
2
1
2
2
2
3
1
3
4
2
1
1
1
25
Percent
8.0
4.0
8.0
8.0
8.0
12.0
4.0
12.0
16.0
8.0
4.0
4.0
4.0
100.0
Valid Percent
8.0
4.0
8.0
8.0
8.0
12.0
4.0
12.0
16.0
8.0
4.0
4.0
4.0
100.0
Cumulative
Percent
8.0
12.0
20.0
28.0
36.0
48.0
52.0
64.0
80.0
88.0
92.0
96.0
100.0
H
is
to
g
r
a
m
Frequncy
1
0
8
6
4
2
M
e
a
n
=
1
7
0
.
1
2
S
t
d
.
D
e
v
.
=
6
3
7
6
N
=
2
5
0
1
5
0
.01
6
0
.0T
1
7
0
.
0
1
8
0
.
0
1
9
0
.
0
in
g
i
Kolom Variables(s) harus diisi dengan jenis-jenis variabel apa yang ingin
kita analisis. Karena ingin dibuat frekuensi dari variabel Gender, maka klik
variabel Gender, kemudia klik tanda , maka variabel Gender akan
berpindah ke kolom Vraible(s).
Pilihan Chartsjuga diklik, maka akan tampil gambar berikut ini.
Menu Charts berkenaan dengan jenis grafik yang ingin kita pilih. Dari
Chart Type, untuk keseragaman kita pilih Pie Chart. Lalu klik Continue
Setelah itu menu Format diklik, maka akan tampil gambar berikut:
Pada submenu Order by (data output akan disusun seperti apa ?) kita
seragamkan saja dengan memilih output akan disusun naik (dari data
terkecil ke data terbesar). Untuk itu pilih Ascending values. Selanjutnya
klik OK. Maka semua proses pengisian dan pengolahan data telah selesai,
dan kita akan lihat hasilnya (outputnya) pada editor Output.
Output Gender
Statistics
Gender
N
Valid
Missing
25
0
Gender
Valid
1
2
Frequency
11
14
Percent
44.0
56.0
Valid Percent
44.0
56.0
Total
25
100.0
100.0
Cumulative
Percent
44.0
100.0
G
e
n
d
r 21
Penggunaan Menu Descriptive
Langkah-langkah penggunaan menu Desciptive:
Buka kembali file Deskriptif1.sav
Dari baris menu, pilih menu Analyze, lalu pilih submenu Descriptive
Statistics, lalu pilih lagi sumenu Descriptives (untuk menampilkan tabel
frekuensi). Lalu akan tampil gambar berikut ini.
Kolom Variables(s) harus diisi dengan jenis-jenis variabel apa yang ingin
kita analisis. Karena ingin dibuat frekuensi dari variabel Tinggi, maka klik
variabel Tinggi, kemudia klik tanda , maka variabel Tinggi akan
berpindah ke kolom Vraible(s).
Klik Options, maka akan tampak di layar
25
Minimum
159.60
Maximum
186.60
Mean
170.1200
Std. Deviation
6.03276
25
Jika dilihat pada Editor data SPSS selain variabel tinggi dan gender
sekarang muncul variabel baru, yaitu zTinggi seperti berikut
Analisisnya
Output bagian Pertama
Bagian ini membahas deskripsi statistik dari variabel tinggi yang
meliputi Mean dan yang lainnya.
xi x
s
170.2 170.12
= 0,013 (sama dengan output SPSS)
6.03
Pekerjaan
Karyawan
Petani
wiraswasta
Petani
Pendidikan
Akademi
Sarjana
Sma
Sma
Gender
Pria
Pria
Wanita
Wanita
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
wiraswasta
Karyawan
wiraswasta
wiraswasta
Petani
Petani
Karyawan
Karyawan
Petani
wiraswasta
wiraswasta
Karyawan
Petani
Karyawan
Karyawan
Petani
wiraswasta
Petani
Petani
Karyawan
Karyawan
Akademi
Sarjana
Sma
Sma
Akademi
Akademi
Sarjana
Sarjana
Sma
Sarjana
Akademi
Sarjana
Sma
Akademi
Sma
Akademi
Sarjana
Sarjana
Sarjana
Sma
Sma
Wanita
Pria
Wanita
Pria
Wanita
Wanita
Pria
Pria
Wanita
Pria
Wanita
Pria
Wanita
Pria
Wanita
Pria
Wanita
Wanita
Pria
Pria
Pria
Row(s) atau variabel yang akan ditempatkan pada baris (row) untuk
keseragaman, kita pilih Gender
Column(s) atau variabel yang akan ditempatkan pada Kolom) untuk
keseragaman, kita pilih Pekerjaan
Klik pilihan Statistics, akan tampak dilayar gambar berikut.
Karena kita akan melihat hubungan antara dua variabel, untuk keseragaman
pilih Chi-Square. Pilihan yang lainnya akan digunakan pada kasus yang
relevan di bagian lain. Lalu Klik Continue
Kemudian Klik pilihan Cells, akan tampak di layar
Row Order atau penempatan nama variabel dalam baris, apakah naik atau
turun. Pilih Ascending. Klik Continue.
Pilihan Displayclustered bar charts dan Suppers tables biarkan kosong.
Perhatikan variabel Pendidikan tidak dimasukkan, karena dalam proses ini kita
hanya memasukkan dua saja, tidak mesti semua, nanti kita akan gunakan
variabel pendidikan pada kasus yang lain.
Klik OK, maka akan tampak output berikut.
Output Crosstab
Case Processing Summary
Cases
Valid
N
gender * Pekerjaan
25
Missing
Percent
100.0%
N
0
Total
Percent
.0%
N
25
Percent
100.0%
1
2
Total
Total
8
1
2
5
3
6
13
12
25
Chi-Square Tests
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
Value
7.702(a)
8.505
df
2
2
Asymp. Sig.
(2-sided)
.021
.014
5.342
.021
N of Valid Cases
25
a 6 cells (100.0%) have expected count less than 5. The minimum expected count is
3.36.
Sekarang, tugas Anda adalah berlatih untuk mencari hubungan antara variabel
Pekerjaan dengan Tingkat Pendidikan, Jika sudah memasukkan datanya dalam
program SPSS simpan pada drive D dengan nama Crosstab2.sav dan outputnya
dengan Crosstab2out. Buatlah analisis Anda dalam file word lalu simpan pula pada
drive D.
Menguji Keeratan Hubungan Dua Variabel Berskala Nominal
Jika tadi kita contohkan bahwa berdasarkan analisis Crosstab ditemukan terdapat
hubungan antara dua variabel berskala nominal, yaitu antara gender dengan pekerjaan.
Sekarang kita akan cari tahu seberapa besar keeratan hubungan tersebut.
SPSS menyediakan dua cara untuk mengukur hubungan tersebut, yaitu:
1. Symetric Measures, yaitu hubungan yang setara dan berdasarkan perhitungan
Chi-square
2. Directional Measures, yaitu hubungan yang tidak setara dan berdasarkan pada
proportional Reduction In Error (PRE)
Kedua cara perhitungan di atas dapat digunakan pada kasus hubungan antara
Pekerjaan dengan Gender.
Langkah-langkahnya:
1. Buka lagi lembar kerja Crosstab1.sav
2. Darri baris menu, pilih menu Analyze, lalu pilih submenu Descriptive Statistics,
lalu pilih lagi sumenu Crosstab. Lalu akan tampil gambar seperti sebelumnya.
a. Pada menu Row(s) atau variabel yang akan ditempatkan pada baris (row)
untuk keseragaman, kita pilih Gender
b. Column(s) atau variabel yang akan ditempatkan pada Kolom) untuk
keseragaman, kita pilih Pekerjaan
3. Klik pilihan Statistics, akan tampak dilayar gambar berikut.
Karena sudah tahu bahwa antara kedua variabel tersebut terdapat hubungan, maka
sekarang tidak perlu lagi Chi-square, oleh karena itu sekarang Chi-square-nya
jangan dicentak (tidak diklik). Kalau diklik, hasilnya akan seperti terdahulu.
4. Klik pilihan Correlations untuk mengetahui koefisien korelasi kedua variabel
dengan cara Symetric Measures.
5. Pada kolol Nominal (yang berarti khusus untuk data yang berskala Nomonal), klik
semua pilihan yaitu Contingency Coefficient, Phi and Cramers V, lambda dan
Uncertainty coefficient. Pilihaan ini untuk mengetahui koefisien korelasi dengan
cara Directional Measures. Lalu klik Continue. Kemudian Klik pilihan Cells,
akan tampak di layar gambar sebelah kanan.
25
Missing
Percent
100.0%
N
0
Total
Percent
.0%
N
25
Percent
100.0%
Ada 25 data yang semuanya diproses (tidak ada data missing), sehingga tingkat
validitasnya 100%.
Output bagian Kedua
gender * kerja Crosstabulation
Count
kerja
1
gender
Total
1
2
Total
8
1
2
5
3
6
13
12
25
Tabel yang menggambarkan hubungan antara variabel, misalnya pada baris-2 kolom-1
ada angka 1, artinya ada 1 orang konsumen wanita bekerka sebagai karyawan.
Widya Setiabudi 2006
Nominal by
Nominal
Value
.555
.555
Phi
Cramer's V
Asymp.
Std.
Error(a)
Approx.
T(b)
Approx. Sig.
.021
.021
Contingency Coefficient
.485
Interval by Interval
Pearson's R
.472
.167
2.566
.017(c)
Ordinal by Ordinal
Spearman Correlation
.472
.173
2.566
.017(c)
.021
N of Valid Cases
25
a Not assuming the null hypothesis.
b Using the asymptotic standard error assuming the null hypothesis.
c Based on normal approximation.
Disi
Di sini hanya diperhatikan besar korelasi antara Nominal-Nominal. Hal ini karena
kedua variabel berskala nominal, karena itu besaran Pearson dan Spearman tidak
relevan untuk dibahas.
Ada 3 besaran untuk menghitung korelasi antara variabel pekerjaan dengan gender,
dan ketiganya mempunyai angka signifikan atau nilai Probabilitas 0,021. Karena nilai
Probabilitas di bawah 5%, maka bisa dikatakan ada hubungan antara kedua variabel
tersebut (seperti telah terbukti sebelumnya).
Besaran korelasi (Phi dan Cramer) menghasilkan angka sama yaitu 0,555. Sedangkan
koefisien kontingensi menghasilkan angka 0,485 (lebih kecil). Dari ketiga besaran itu
bisa disimpulkan adanya hubungan yang cukup erat antara (disebut erat jika
mendekati angka 1 dan tidak ada hubungan bila mendekati angka 0) antara variabel
pekerjaan dengan variabel jender.
Output bagian Keempat (Directional Measures)
Directional Measures
Nominal by
Nominal
Lambda
Goodman and
Kruskal tau
Uncertainty Coefficient
Symmetric
gender Dependent
kerja Dependent
gender Dependent
kerja Dependent
Symmetric
gender Dependent
kerja Dependent
Value
.393
.500
.313
.308
.160
.191
.246
.156
Asymp.
a
Std. Error
.163
.236
.137
.165
.095
.114
.147
.093
Approx. T
2.003
1.572
2.041
1.673
1.673
1.673
Approx. Sig.
.045
.116
.041
.025c
.021c
.014d
.014d
.014d
Disini juga ada 3 ukuran untuk mengukur hubungan antara kedua variabel tersebut.
Namun di sini ada pembedaan, yaitu satu variabel sebagai dependen sedangkan yang
lainnya sebagai variabel independen.
Untuk lebih jelasnya lihat besaran pada korelasi lambda.
Widya Setiabudi 2006
Symmetric atau kedua variabel setara (bebas), maka besar korelasinya adalah
0,393 atau cukup lemah (kurang dari 0,50). Angka signifikansinya adalah 0,045
atau di bawah 0,05 yang berarti kedua variabel memang berhubungan secara
nyata.
Jika ada perkataan Dependent, dipakai pedoman (berlaku untuk ketiga alat uji)
berikut:
o Jika angka korelasi 0, maka pengetahuan akan variabel independen tidak
menolong dalam usaha memprediksi variabel dependen
o Jika angka korelasi = 1, maka pengetahuan akan variabel independen
menolong dalam usaha memprediksi variabel dependen
Contoh analisis pada Lambda
o Gender Konsumen Dependen atau Gender sebagai variabel dependen
(tergantung), dimana Pekerjaan adalah variabel independennya. Karena
angka signifikansi 0,116 lebih besar daripada 0,05 (5%), maka variabel
Independen/bebas yaitu Pekerjaan tidak dapat memprediksi variabel
dependen yaitu Gender.
o Pekerjaan Konsumen Dependen atau Pekerjaan sebagai variabel
dependen (tergantung), dimana gender adalah variabel independennya.
Karena angka signifikansi 0,041 lebih besar daripada 0,05 (5%), maka
variabel Independen/bebas yaitu Pekerjaan dapat memprediksi variabel
dependen yaitu Gender. Tetapi Angka Korelasi lambdanya 0,313 < 0,50
ini artinya korelasinya lemah. Bisa dikatakan bahwa pengetahuan akan
gender seorang konsumen tidak begitu menolong dalam mupaya
memprediksi pekerjaan konsumen tersebut. Atau pekerjaan konseumen
sebagai karyawan atau petani atau wiraswasta tidak bisa diperkirakan
begitu saja karena ia seoraang pria atau wanita.