Anda di halaman 1dari 6

Analisis Missing Value

Statistics
jumlah
jumlah pendapatan
jumlah pendapatan luas lahan sektor
penduduk daerah pertanian perdagangan
N Valid 12 13 8 11
Missing 3 2 7 4
Mean 2.250 7.900 5.288 2.900
Sum 27.0 102.7 42.3 31.9

a. Dari tabel di atas dapat diketahui berapa missing value yang terdapat pada masing-
masing variable data.
 Variabel Jumlah penduduk terdapat 3 missing value dari 15 objek pengamatan,
sehingga 12 objek yang dianggap valid.
 Variable jumlah pendapatan daerah terdapat 2 missing value dari 15 objek
pengamatan, sehingga 13 objek yang dianggap valid.
 Variable luas lahan pertanian terdapat 7 missing value dari 15 objek pengamatan,
sehingga 8 objek yang dianggap valid.
 Variable jumlah pendapatan sector perdagangan terdapat 4 missing value dari 15
objek pengamatan, sehingga 11 objek yang dianggap valid.

Dengan demikian dapat diketahui berapa presentase validitas data masing-masing


variable.

b. Langkah yang di lakukan sebelumnya dilakukan dengan cara memasukkan niai mean dari
masing-masing variable tersebut pada cell yang mengandung missing value, namun
dapat juga digunakan cara lain yaitu dengan cara:
- Menghilangkan/membuang kasus atau objek yang mengandung missing value.
- Menghapus variable (kolom) yang mengandung missing value.
Analisis Outlier

Descriptive Statistics
Std.
N Minimum Maximum Mean Deviation
jumlah penduduk (juta
15 .2 7.9 2.767 2.0038
jiwa)
jumlah pendapatan
15 5.5 14.9 8.653 2.3970
daerah (trilyun rupiah)
luas lahan pertanian
15 3.0 12.6 5.533 2.2601
(ratusan Ha)
jumlah pendapatan
sektor perdagangan 15 1.2 9.5 3.580 1.8092
(milyar rupiah)
Valid N (listwise) 15

c. Melihat kolom Mean dan Std.Deviation dari hasil output untuk setiap variable dengan
hasil:
- Rata-rata jumlah penduduk adalah 2.767 juta jiwa dengan standar deviasi 2.0038 juta
jiwa.
- Rata-rata jumalah jumlah pendapat daerah adalah 8.653 trilliun rupiah dengan
standar deviasi 2.3970 trilliun rupiah.
- Rata-rata luas lahan pertanian adalah 5.533 Ha dengan standar deviasi sebesar 2.2601
Ha.
- Rata-rata jumlah pendapatan sector perdagangan adalah 3.580 milyah rupiah dengan
standar deviasi sebesar 1.8092 milyar rupiah.
Setelah itu dilakukan proses standarisasi dengan nilai z, selanjutnya mendeteksi
ada atau tidaknya data yang ekstrim (outlier) pengujian tersebut dapat dilakukan dengan
melihat kurva distribusi normal. Dengan hasil:

 Pada variable jumlah penduduk terlihat bahwa untuk region C memiliki nilai z = 2.56179.
hal ini berarti bahwa region C adalah data outlier, yang jika dilihat jumlah penduduk di
region C sebesar 7,9 juta jiwa, sedangkan rata-rata jumlah penduduk di ke-15 region
tersebut adalah 2.767 juta jiwa. Dengan kata lain region C memliki jumlah penduduk
jauh melebihi rata-rata jumlah penduduk.
 Pada variable jumlah pendapatan daerah terlihat bahwa untuk region M memiliki nilai z =
2.60605. hal ini berarti bahwa region M adalah data outlier, yang jika dilihat jumlah
pendapatan daerah di region M sebesar 14,9 trilliun rupiah, sedangkan rata-rata jumlah
pendapatan daerah 15 region tersebut adalah 8.8653 trilliun rupiah. Dengan kata lain
region M memliki jumlah pendapatan daerah jauh melebihi rata-rata jumlah pendapatan
daerah.
 Pada variable luas lahan pertanian terlihat bahwa untuk region J memiliki nilai z =
3.12669 hal ini berarti bahwa region j adalah data outlier, yang jika dilihat luas lahan di
region J sebesar 12,6 Ha , sedangkan rata-rata luas lahan di 15 region tersebut adalah
5.533 Ha. Dengan kata lain region J memliki luas lahan pertanian melebihi rata-rata luas
lahan petanian.
 Pada variable jumlah pendapatan sector perdaganan terlihat bahwa untuk region B
memiliki nilai z = 3.27220 hal ini berarti bahwa region B adalah data outlier, yang jika
dilihat jumlah pendapatan sector perdagangan di region B sebesar 9,5 milyar rupiah,
sedangkan rata-rata pendapatan sector perdagangan di ke-15 region tersebut adalah 3.580
milyar rupiah. Dengan kata lain region B memliki jumlah jumlah pendapatan sector
perdagangan melebihi rata-rata jumlah sector perdagangan.

d. Dari analisis sebelumnya dilakukan standarisasi pada variable z, cara lainnya yaitu
- Data outlier dapat dihilangkan, karena dianggap tidak mencerminkan sebaran data
yang sesungguhnya atau didapat karena kesalahan pengambilan data, kesalahan
inputing, dan lain sebagainya
- Data outlier juga bisa tetap dipertahankan jika dianggap memang terdapat data yang
seperti itu, atau tidak terdapat kesalahan pada proses sampling maupun inputing data.
Namun pada saat melakukan analisis hendaknya data outlier tersebut dipisahkan dari
data yang lain, karena akan mempengaruhi hasil analisis, selanjutnya data tersebut
perlu dilakukan analisis tersendiri.

Anda mungkin juga menyukai