Anda di halaman 1dari 3

BAB 3

Data Screening dan transformasi data

3.1 Normalitas

Screening terhadap normalisasi data merupakan langkah awal yang harus dilakukan untuk setiap
analisis multivariate, khususnya jika tujuannya inferensi.secara statistic ada dua komponen
normalitas yaitu skewness dan kurtosis , skewness berhubungan dengan simetri distribusi.
Skewness variable (variable menceng) iayalah variable yang nilai meannya tidak di tengah-
tengah distribusi.jika vriabel terdistribusi secara normal maka nilai skewness dan kurtosis sama
dengan nol. Terdapat uji signifikan skewness dan kurtosis dengan cara sebagai berikut:

s−0 k −0
Zskew = dan Zkurt =
√6 / N √24 / N
Dimana

S = nilai skewness

N = jumlah kasus

K = nilai kurtosis

Nilai z ini kita bandingkan dengan nilai kritisinya yaitu alpha 0.0 nilai kritisinya ± 2.58
sedangkan untuk alpha 0.05 nilai kritisinya ± 1.96.

Uji normalitas dengan grafik

Normal tidaknya suatu data dapat dideteksi juga lewat plot grafik histogram, hanya gambar
grafik kadang kadan g dapat menyesatkan karena distribusinya normal, tetapi secara sistematis
sebenarnya tidak normal. Berikut cara menampilkan grafik histogram untuk variabek EARNS
dan WEALTH.

Langkah analisis:

a. Buka file dengan perintah file, open, data


b. Dari menu utama spss, pilih menu graph, kemudian pilih legacy dialogs dan histogram.
c. Tampak dilayar tampilan windows histogram
d. Isikan variable WEALTH dan pilih display normal curve
e. Setelah itu pilih ok

3.2 transformasi data


Merupakan suatu proses untuk merubah bentuk data sehingga data siap untuk dianalisis.
Perubahan bentuk data yang paling sederhana adalah pengkategorian data numerikmenjadi data
kategorik atau dapat juga dilakukan pengelompokan data ketegorik menjadi beberapa kelompok
yang lebih kecil, missal DIDIK dikelompokkan menjadi 2 kategori yaitu rendah (SD/SMP) dan
tinggi (SMU/PT). proses pengelompokan atau pengkategorian ulang tersebut lebih dikenal
dengan istilah RECODE.

Perubahan bentuk data lainnya adalah penggunaan fungsi materik dan algoritma.

Langkah analisis:

a. Buka file crosssec 1.sav dengan perintah file, open, data.


b. Dari menu utama spss, pilih menu transform kemudian subme computer.
c. Tampak di layar windows compute variable.
d. Pada target variable isikan nama baru variable hasil transformasi dalamhal ini diberi
nama SQEARNS (maksimum 8 karakter)
e. Pada function group All dan pada finctions special variabels pilih SORT dan masukkan
ke kotak numeric expression dengan panah.
f. Pada type dan lebel pilih variable EARNS yang akan di transformasi.
g. Lakukan hal yang sama untuk variable WEALTH.
h. Pilih Ok
i. Pada SPSS data editor akan tampak variable baru SQEARNS dan SQWEALTH

3.3 Outlier

Setelah melakukan transformasi untuk mendapatkan normalitas data, langkah screening


berikutnya yang harus dilakukan ialah mendeteksi adanya data outlier. Outlier adalah kasus atau
data atau mewakili karakter unik yang terlihat sangat berbeda jauh dari observasi lainnya. Dan
muncul dalam bentuk nilai ekstrim baik untuk sebuah variable tanggal atau variable kombinasi.

Ada empat penyebab timbulnya data outler:

a. Kesalahan dalam mengenty data


b. Gagal mengspesifikasi adanya missing value dalam program computer
c. Outlier bukan merupakan anggota populasi yang kita ambil sebagai sampel
d. Outlie berasal dari anggota populasi yang kita ambil, tetapi distribusi dari variable dlam
populasi trsbt memiliki nilai ekstrem dan tidak terdistribusi secara normal.

Deteksi terhadap univariat outline dapat dilakukan denganmenentukan nilai batas yang
akan dikategorikan sebagai data outlier yaitu dengan cara mengkonversi nilai data ke
dalam skor standardized atau yang biasa disebut z-score, yang memiliki nilai means sama
dengan nol dan standar deviasi sama dengan satu. Untuk sampel besar standar skor
dinyatakn outlier jika nilainya pada kisaran 3 sampai 4. Jika standar deviasi tidak
digunakan, maka kita dapat menentukan data outlier jika data tersebut nilainya lebih
besar dari 2.5 standar deviasi atau antara 3 sampai 4 standar deviasi tergantung besarnya
sampel.

Data yang akan kita deteksi outliernya iyalah data yang sudah kita serceeninh
nominalnya. Jika dalam hal ini ialah variable SQREARNS dan SQRWEALT.

Berikut ini cara mendeteksi outlier

Langkah analisis:

a. Dari menu utama SPSS, pilih analyze lalu descriptive statistic kemudian descriptive.
b. Tampak dilayar window descriptive.
c. Isikan variable yang akan dianalisis yaitu SQREARNS dan SQRWEALT. Kemudian
pilih (timark) save standardized value as variable.
d. Klik Ok

Untuk variable ZSQWEALT terdapat 4 observasi yang outlier dan variable ZSQRWEALT
terdapat 2 observasi yang dinyatakan outlier. Setelah outlier teridentifikasi, langkah berikutnya
ialah tetap mempertahankan data outlier atau membuang data outlier. Secara filosofi seharusnya
outlier tetapdipertahankaan jika data outlier itu memang terpresentasi dari populasi yang kita
teliti. Namun demikian outlier harus kita buang jika data outlier tersebut memang tidak
menggambarkan observasi dalam populasi.

Anda mungkin juga menyukai