Oleh :
Abdullah M. Jaubah
Pendahuluan
Studi dan penghayatan atas buku-buku statistik dan buku-buku SPSS di Indonesia dan bahanbahan bacaan SPSS dari Institute For Digital Research and Education dalam University of
California mengungkap bahwa buku-buku tersebut adalah sangat tidak lengkap ditinjau dari
sudut ruang lingkup pembahasan. Kesenjangan ini dialami jika dibanding dengan ruang lingkup
pembahasan yang terkandung dalam Case Studies SPSS.
Ruang lingkup pembahasan dalam Case Studies SPSS mencakup pembahasan mengenai
Introduction, Statistics Base, Advanced Statistics Option, Bootstrapping Option, Categories
Option, Complex Samples Option, Conjoint Option, Data Preparation Option, Decision Trees
Option, Direct Marketing, Missing Values Option, Neural Networks Option, Regression Option,
dan Forecasting Option. Pembahasan dalam Introduction adalah sangat singkat dan hanya
menjelaskan bahwa Case Studies dalam SPSS ini menyediakan contoh-contoh tentang cara
mencipta berbagai jenis analisis statistik dan cara menginterpretasikan hasil-hasil. Contoh-contoh
ini tersedia untuk mereka yang telah biasa memakai operasi-operasi dasar dalam SPSS. Studi
kasus ini dicinci lebih lanjut dan rincian ini adalah sangat luas dan dalam. Studi kasus SPSS ini
dapat dipakai sebagai bahan studi dan penghayatan atas SPSS dan statistik.
SPSS dapat dipakai untuk mengolah data hasil penelitian bersifat kualitatif, data hasil penelitian
bersifat kuantitatif, dan data hasil penelitian kombinasi (mixed research). Data dan variabel
berjenis kualitatif mencakup data dan variabel nominal dan data dan variabel ordinal. Data dan
variabel berjenis kuantitatif mencakup data dan variabel scale. Data dan variabel berjenis
kualitatif sering disebut data dan variabel kategorikal.
Studi kasus SPSS ini dilaksanakan melalui pemakaian cara point and click berdasar atas menu
SPSS. Langkah ini akan menghasilkan dua kelompok informasi. Salah satu kelompok informasi
ini adalah perintah-perintah sintaksis SPSS. Perintah-perintah sintaksis yang dicipta melalui cara
2
point and click ini dalam dimanfaatkan sebagai arsip sintaksis yang dapat disimpan dan dapat
dipakai setiap saat diperlukan dengan cara membuka arsip sintaksis tersebut seperti membuka
arsip data. Arsip sintaksis ini akan disajikan dalam Syntax Editor dan melalui menu dalam
Syntax Editor arsip sintaksis itu dapat dilaksanakan dengan cara memakai perintah Run>All.
Rincian Statistics Base
Pembahasan dalam Statistics Base mencakup pembahasan mengenai Summary Statistics Using
Frequencies, Summary Statistics Using Descriptives, Exploratory Data Analysis, Analysis of
cross-classifications using Crosstabs, The Summarize Procedure, The Means Procedure. The
OLAP Cubes Procedure, T Tests, One-Way analysis of variance, GLM Univariate, Bivariate
Correlations, Partial Correlations, Linear models, Linear regression, Ordinal Regression, Curve
Estimation, Partial Least Squares Regression, Nearest Neighbor Analysis, Discriminant Analysis,
Factor Analysis, TwoStep Cluster Analysis, Hierarchical Cluster Analysis, K-Means Cluster
Analysis, Nonparametric Tests, Multiple Response Analysis, Measures of reliability in scale
problems, Ratio Statistics, ROC Curve, Control Charts, Select Predictors, dan pembahasan
mengenai Naive Bayes. Pembahasan mengenai Partial Least Square Regression dan
pembahasan mengenai Nave Bayer hanya dapat dilaksanakan jika modul-modul bersangkutan
diinstal. Perkembangan telah mencatat bahwa paket program khusus telah dikembangkan yaitu
Visual Partial Least Square, Smart Partial Least Square, atau Wrap Partial Least Square sebagai
tandingan atas paket program Lisrel dan paket program Amos yang biasa dipakai dalam
Pemodelan Persamaan Struktural sebagai bagian pengembangan lebih lanjut dari analisis
multivariat. Regresi Ordinal mencerminkan analisis regresi atas data berjenis kulitatif, atas data
berjenis ordinal.
Rincian Categories
Pembahasan mengenai Categories mencakup pembahasan mengenai Categorical Regression,
Categorical Principal Components Analysis, Nonlinear Canonical Correlation Analysis,
Correspondence analysis, Multiple Correspondence Analysis, Multidimensional Scaling, dan
pembahasan mengenai Multidimensional Unfolding.
Rincian Complex Samples
Pembahasan mengenai rincian dari Complex Samples mencakup pembahasan mengenai
Planning for Complex Samples, Complex Samples Sampling Wizard, Complex Samples
Analysis Preparation Wizard, Complex Samples Analysis Procedures: Tabulation, Complex
Samples Analysis Procedures: Descriptives, Complex Samples Frequencies, Complex Samples
Descriptives, Complex Samples Crosstabs, Complex Samples Ratios, Complex Samples General
Linear Model, Complex Samples Logistic Regression, Complex Samples Ordinal Regression,
dan pembahasan mengenai Complex Samples Cox Regression.
Rincian Conjoint
Rincian pembahasan mengenai Conjoint mencakup pembahasan mengenai Introduction and
Methodology dan pembahasan mengenai Using Conjoint Analysis to Model Carpet-Cleaner
Preference.
Rincian Data Preparation
Rincian pembahasan mengenai Data Preparation mencakup pembahasan mengenai Validate
Data, Automated Data Preparation, Identify Unusual Cases, dan pembahasan mengenai Optimal
Binning.
Rincian Decision Trees
Rincian pembahasan mengenai Decision Trees mencakup pembahasan mengenai Decision Trees,
Data assumptions and requirements, Using Decision Trees to Evaluate Credit Risk, Building a
Scoring Model, dan pembahasan mengenai Missing Values in Tree Models.
4
ditinjau dari sudut ruang lingkup pembahasan dapat dibuktikan bahwa pernyataan tersebut
mengandung kebenaran atau ketidakbenaran?
Apakah pernyataan bahwa kesenjangan ini dialami jika dibanding dengan ruang lingkup
pembahasan yang terkandung dalam Case Studies SPSS dapat dibuktikan bahwa pernyataan
tersebut mengandung kebenaran atau ketidakbenaran?
Beberapa buku statistik dan buku SPSS dapat dipakai untuk membandingkan ruang lingkup
pembahasan dalam buku-buku statistik dan buku-buku SPSS dengan ruang lingkup yang telah
disajikan secara rinci di atas.
Apakah terdapat buku statistik dan buku SPSS yang telah membahas Complex Samples dan
Neural Networks?
Kesenjangan-kesenjangan dalam buku-buku statistik dan buku-buku SPSS akan tercermin pula
dalam kurikulum dan silabus Statistik yang dikuliahkan dalam berbagai Perguruan Tinggi dan
kesenjangan ini akan berdampak pada kualitas dari hasil-hasil penelitian dan kualitas jurnal
ilmiah yang menerbitkan hasil-hasil penelitian tersebut.
Kumpulan Studi Kasus SPSS
Jumlah halaman jika informasi dalam studi kasus SPSS itu dikumpulkan akan mencakup lebih
daripada 2500 halaman. Hal ini mencerminkan bahwa studi kasus itu banyak mengandung
informasi yang bermanfaat untuk melakukan studi dan penghayatan atas statistik yang dapat
dimanfaatkan dalam penelitian kualitatif, penelitian kuantitatif, dan penelitian kombinasi.
Contoh Arsip Sintaksis
Contoh arsip sintaksis yang dikumpulkan dari studi kasus tersebut adalah sebagai berikut :
***************************************************
***** Abdullah M. Jaubah
***************************************************
GET
FILE='F:\SPSS\carpet.sav'.
***************************************************
***** Kategori
***************************************************
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT pref
/METHOD=ENTER package brand price seal money
/SCATTERPLOT=(*ZRESID ,*ZPRED)
/SAVE ZRESID.
* Chart Builder.
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=pref ZRE_1 MISSING=LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: pref=col(source(s), name("pref"), unit.category())
DATA: ZRE_1=col(source(s), name("ZRE_1"))
GUIDE: axis(dim(1), label("Preference"))
GUIDE: axis(dim(2), label("Standardized Residual"))
SCALE: linear(dim(2), include(0))
ELEMENT: point(position(pref*ZRE_1))
END GPL.
CATREG VARIABLES=pref package brand price seal money
/ANALYSIS=pref(LEVEL=NUME) WITH package(LEVEL=SPORD,DEGREE=2,INKNOT=2)
brand(LEVEL=SPORD,DEGREE=2,INKNOT=2) price(LEVEL=SPORD,DEGREE=2,INKNOT=2)
seal(LEVEL=SPORD,DEGREE=2,INKNOT=2) money(LEVEL=SPORD,DEGREE=2,INKNOT=2)
/MISSING=pref(LISTWISE) package(LISTWISE) brand(LISTWISE) price(LISTWISE) seal(LISTWISE) money(LISTWISE)
/MAXITER=100
/CRITITER=.00001
/PRINT=R COEFF HISTORY OCORR CORR QUANT(package price)
/INITIAL=NUMERICAL
/PLOT=TRANS(package price)(20)
/SAVE= RES
/REGULARIZATION=NONE
/RESAMPLE=NONE.
GET
FILE='F:\SPSS\ozone.sav'.
CATREG VARIABLES=ozon vh ibh dpg vis temp doy
/ANALYSIS=ozon(LEVEL=NUME) WITH vh(LEVEL=NOMI) ibh(LEVEL=NOMI) dpg(LEVEL=NOMI) vis(LEVEL=NOMI)
temp(LEVEL=NOMI) doy(LEVEL=NOMI)
/DISCRETIZATION=ibh(GROUPING,EQINTV=100) dpg(GROUPING,EQINTV=10) vis(GROUPING,EQINTV=10)
temp(GROUPING,EQINTV=1.8) doy(GROUPING,EQINTV=10)
/MISSING=ozon(LISTWISE) vh(LISTWISE) ibh(LISTWISE) dpg(LISTWISE) vis(LISTWISE) temp(LISTWISE) doy(LISTWISE)
/MAXITER=100
/CRITITER=.00001
/PRINT=R COEFF ANOVA
/INITIAL=NUMERICAL
/PLOT=TRANS(ozon vh ibh dpg vis temp doy)(20)
/REGULARIZATION=NONE
/RESAMPLE=NONE.
GET
FILE='F:\SPSS\guttman.sav'.
CATPCA VARIABLES=intnsity frquency blonging proxmity formlity cluster
/ANALYSIS=intnsity(WEIGHT=1,LEVEL=ORDI) frquency(WEIGHT=1,LEVEL=ORDI) blonging(WEIGHT=1,LEVEL=ORDI)
proxmity(WEIGHT=1,LEVEL=ORDI) formlity(WEIGHT=1,LEVEL=ORDI)
/MISSING=intnsity(PASSIVE,MODEIMPU) frquency(PASSIVE,MODEIMPU) blonging(PASSIVE,MODEIMPU)
proxmity(PASSIVE,MODEIMPU) formlity(PASSIVE,MODEIMPU)
/DIMENSION=2
/NORMALIZATION=VPRINCIPAL
/MAXITER=100
/CRITITER=.00001
/PRINT=LOADING OBJECT
/PLOT=BIPLOT(LOADING) (20) OBJECT (20) CATEGORY(intnsity frquency blonging proxmity formlity ) (20).
CATPCA VARIABLES=intnsity frquency blonging proxmity formlity cluster
Variables Entered
money, price, seal, brand, package
Variables Removed
Method
. Enter
Model Summaryb
Model
R Square
.841a
Adjusted R Square
.707
3.998
ANOVAa
Model
Sum of Squares
df
Mean Square
Regression
615.697
123.139
Residual
255.757
16
15.985
Total
871.455
21
Sig.
7.704
.001b
Coefficientsa
Model
Unstandardized
Coefficients
B
Std. Error
(Constant)
22.529
5.177
package
-4.159
1.036
brand
0.429
price
Standardized
Coefficients
Beta
Sig.
4.352
-0.56
-4.015
0.001
1.054
0.056
0.407
0.689
2.703
1.009
0.366
2.681
0.016
seal
-4.314
1.78
-0.33
-2.423
0.028
money
-2.779
1.921
-0.197
-1.447
0.167
Residuals Statisticsa
Minimum
Predicted Value
Maximum
Mean
Std. Deviation
-.14
20.25
11.45
5.415
22
Residual
-8.202
4.639
.000
3.490
22
-2.142
1.624
.000
1.000
22
Std. Residual
-2.052
1.160
.000
.873
22
Credit
Catreg
Version 3.0
by
Data Theory Scaling System Group (DTSS)
Faculty of Social and Behavioral Sciences
Leiden University, The Netherlands
22
0
0
Total
22
22
Iteration History
Multiple R Square
10
Iteration Number
0a
.000
.000
.916
.084
-.084
.917
.083
.001
3b
.917
.083
.000
a. The error of iteration 0 is the error of the solution with all variables treated as numerical (with error difference
0.0001 and maximum number of iterations 50).
b. The iteration process stopped because the convergence test value was reached.
brand
price
seal
money
package
1.000
-.189
-.126
.081
.066
brand
-.189
1.000
.065
-.042
-.034
price
-.126
.065
1.000
.000
.000
seal
.081
-.042
.000
1.000
-.039
money
.066
-.034
.000
-.039
1.000
Dimension
Eigenvalue
1.291
1.038
.980
.905
.785
brand
price
seal
money
package
1.000
-.171
-.110
.052
.094
brand
-.171
1.000
.115
-.092
-.020
price
-.110
.115
1.000
.001
-.001
seal
.052
-.092
.001
1.000
-.039
money
.094
-.020
-.001
-.039
1.000
Dimension
Eigenvalue
1.304
1.053
.979
.852
.812
Model Summary
Multiple R
R Square
Adjusted R Square
11
Standardized Data
.958
.917
.855
.083
Raw Data
Dependent Variable: pref
Predictors: package brand price seal money
Coefficients
Standardized Coefficients
Beta
package
df
Sig.
.108
44.773
.000
brand
.068
.116
.345
.568
price
.354
.100
12.570
.001
seal
-.332
.104
10.124
.003
money
-.165
.099
2.763
.103
Partial
Importance
Part
Tolerance
After Transformation
Before Transformation
-.807
-.926
-.705
.636
.952
.942
brand
.266
.225
.066
.020
.954
.961
price
.442
.773
.350
.171
.978
.982
seal
-.370
-.754
-.330
.134
.988
.991
money
-.223
-.497
-.164
.040
.989
.993
Frequency
Quantification
1 A*
-1.202
2 B*
.832
3 C*
.832
price Pricea
12
Category
Frequency
Quantification
1 $1.19
-1.162
2 $1.39
-.029
3 $1.59
1.183
13
Credit
Catreg
Version 3.0
by
Data Theory Scaling System Group (DTSS)
Faculty of Social and Behavioral Sciences
Leiden University, The Netherlands
330
Supplementary Cases
Total
330
330
14
Model Summary
Multiple R
Standardized Data
R Square
.955
Adjusted R Square
.912
.088
Raw Data
Dependent Variable: ozon
Predictors: vh ibh dpg vis temp doy
ANOVA
Sum of Squares
Regression
Residual
Total
df
Mean Square
300.995
198
1.520
29.005
131
.221
330.000
329
Sig.
6.866
.000
Coefficients
Standardized Coefficients
Beta
df
Sig.
vh
.330
.091
52
13.291
.000
ibh
.266
.079
42
11.356
.000
dpg
.375
.087
16
18.774
.000
vis
.230
.072
17
10.215
.000
temp
.501
.124
35
16.370
.000
doy
.447
.095
36
22.206
.000
Partial
Importance
Part
Tolerance
After Transformation
Before Transformation
vh
.459
.727
.314
.166
.905
.242
ibh
.256
.666
.264
.075
.989
.590
dpg
.181
.760
.347
.074
.856
.674
vis
.380
.604
.225
.096
.952
.748
temp
.716
.843
.464
.393
.857
.234
doy
.398
.806
.404
.195
.817
.775
15
16
17
18
Credit
CATPCA
Version 1.1
by
Data Theory Scaling System Group (DTSS)
Faculty of Social and Behavioral Sciences
Leiden University, The Netherlands
Supplementary Cases
Total
Iteration History
19
Model Summary
Dimension
Cronbach's Alpha
% of Variance
.881
3.389
67.774
.315
1.337
26.746
4.726
94.520
Total
.986
20
21
22
Object Scores
Case Number
Dimension
1
-1.266
1.816
.284
.444
-1.726
-1.201
.931
.229
1.089
.159
.188
-1.408
.500
-.039
Component Loadings
23
Component Loadings
Dimension
1
intnsity
.987
-.136
frquency
.968
-.169
blonging
.731
-.646
proxmity
.486
.825
formlity
.841
.438
Credit
CATPCA
Version 1.1
by
Data Theory Scaling System Group (DTSS)
Faculty of Social and Behavioral Sciences
Leiden University, The Netherlands
Values
Supplementary Cases
Total
Iteration History
Iteration Number
38
Increase
Loss
Total
Centroid
Restriction of Centroid to
Coordinates
Vector Coordinates
4.876515
.000007
10.123485
7.648772
2.474713
4.999966
.000008
10.000034
6.688049
3.311985
a. Iteration 0 displays the statistics of the solution with all variables, except variables with optimal scaling level
Multiple Nominal, treated as numerical.
b. The iteration process stopped because the convergence test value was reached.
24
Model Summary
Dimension
Cronbach's Alpha
% of Variance
.885
3.424
68.480
-.232
.844
16.871
-.459
.732
14.649
5.000
99.999
Total
1.000
Category Points
25
26
27
Object Scores
Case Number
Dimension
1
-.646
1.477
-.002
-.489
.695
.784
-.992
-.244
-1.652
1.414
.682
-.998
1.684
-.672
.364
-.648
-1.830
-.083
-.323
-.108
1.587
Component Loadings
28
Component Loadings
Dimension
1
intnsity
.980
-.005
-.201
frquency
.521
-.643
.561
blonging
.980
-.002
-.197
proxmity
.519
.656
.549
formlity
.981
.004
-.193
Hasil di atas belum diinterpretasikan dan disajikan hanya untuk mengungkap ketangguhan dari
perintah-perintah sintaksis SPSS yang belum terjamah dalam buku-buku SPSS yang telah
diterbitkan di Indonesia. Interpretasi atas hasil-hasil di atas terkandung dalam studi kasus SPSS.
Data yang dipakai juga tersedia dalam paket program IBM SPSS Statistics Versi 20. Sintaksis di
29
atas dapat dijalankan dalam IBM SPSS Statistics Versi 21 dan IBM SPSS Versi 22 walau
sintaksis itu dicipta dalam IBM SPSS Statistics versi 20.
Rangkuman
Bahan studi dan penghayatan statistik terkandung dalam Case Studies SPSS. Case Studies ini
mencakup ruang lingkup pembahasan yang sangat luas, lengkap, dan dalam. Pembahasan seperti
ini tidak ditemukan dalam buku-buku statistik dan buku-buku SPSS. Pemakaian cara point and
click melalui menu SPSS dapat mencipta perintah-perintah sintaksis. Perintah-perintah sintaksis
ini membutuhkan pengolahan sedikit agar dapat disimpan ke dalam arsip sintaksis dan arsip
sintaksis ini dapat dibuka, dimuat, dan dijalankan melalui Syntax Editor dengan perintah
Run>All.
Penulis mengharap kritik dari para pembaca dan kritik tersebut mungkin dapat dipakai untuk
memperbaiki isi tulisan ini.
Daftar Kepustakaan
IBM Incorporation (2011). Case Studies.
30