Anda di halaman 1dari 26

Latihan Praktikum Analisis Data

Ru’yatul Hilal

G1D018072

1. Diketahui empat kelompok data sebagai berikut

M1 M2 M3 M4
2045 3981 6340 19964
3141 5547 8450 9916
1479 48741 5969 1621
2476 4321 16550 14389
2344 4019 150862 76791
2812 6453 11826 56722
2331 4387 5605 18829
1352 9650 12760 26348
1223 5116 7062 4629
1329 7438 2295 16312
1590 5859 4355 25680
1740 5310 3753 19230
3078 4950 4028 52582
3561 3742 10778 66058
5878 7477 1840 52670
4826 7703 4936 65334
3737 8070 7200 9344
Lakukan pembandingan pada keempat kelompok data tersebut

Penyelesaian:
Akan dilakukan pembandingan data pada keempat kelompok data tersebut,
sebelum dilakukan pembandingan data akan dicari terlebih dahulu jarak antar
quartil dari keempat data diatas untuk dapat mengetahui apakah perlu
dilakukan transformasi data atau tidak. berikut langkah-langkah dalam
mencari jarak antar quartil dari data dengan bantuan SPSS:

1) Masukkan data ke SPSS


2) Klik Analyze Descriptive statistic Explore

3) Masukkan kelompok data M1, M2, M3, dan M4 secara bergantian atau
dapat juga dimasukkan semua kelompok data pada waktu bersamaan
pada kotak dialog Explore (karena jumlah data dari keempat kelompok
sama yaitu 17 data).
4) Klik Statistics kemudian centang Descriptives dan klik Continue,
pada Display pilih Statistics, kemudian klik Ok.

Dihasilkan output sebagai berikut

Descriptives
Statistic Std. Error
Mean 2643.65 315.046
95% Confidence Interval for Lower Bound 1975.78
M1
Mean Upper Bound 3311.51
5% Trimmed Mean 2542.89
Median 2344.00
Variance 1687317.868
Std. Deviation 1298.968
Minimum 1223
Maximum 5878
Range 4655
Interquartile Range 1817
Skewness 1.146 .550
Kurtosis 1.080 1.063
Mean 8397.88 2554.633
95% Confidence Interval for Lower Bound 2982.30
Mean Upper Bound 13813.46
5% Trimmed Mean 6415.26
Median 5547.00
Variance 110944577.360
M2 Std. Deviation 10533.023
Minimum 3742
Maximum 48741
Range 44999
Interquartile Range 3236
Skewness 3.946 .550
Kurtosis 15.959 1.063
Mean 15565.24 8509.516
95% Confidence Interval for Lower Bound -2474.13
Mean Upper Bound 33604.60
5% Trimmed Mean 8811.26
Median 6340.00
1231001801.69
Variance
M3 1
Std. Deviation 35085.635
Minimum 1840
Maximum 150862
Range 149022
Interquartile Range 7111
Skewness 4.037 .550
Kurtosis 16.491 1.063
Mean 31554.06 5915.649
95% Confidence Interval for Lower Bound 19013.44
Mean Upper Bound 44094.68
5% Trimmed Mean 30703.84
Median 19964.00
Variance 594913444.309
M4 Std. Deviation 24390.848
Minimum 1621
Maximum 76791
Range 75170
Interquartile Range 42544
Skewness .610 .550
Kurtosis -1.160 1.063
Dari output di atas didapatkan nilai jarak antar quartil dari keempat kelompok
data yaitu sebagai berikut

M1 M2 M3 M4
1817 3236 7111 42544
Dari tabel di atas dapat dilihat bahwa nilai jarak antar quartil keempat data
memiliki perbedaan yang cukup besar, nilai tersebut menunjukkan varian
keempat kelompok data relative tidak sama. Oleh karena itu untuk dapat
melakukan pembandingan data, akan dilakukan transformasi data agar nilai
varian dari keempat data tidak berbeda atau relative sama.
Berikut langkah-langkah dalam transformasi data dengan bantuan SPSS
1) Masukkan data ke SPSS
2) Klik menu Transform kemudian pilih Compute variable…
3) Kemudian akan muncul kotak dialog Compute Variable, pada Target
Variable ketik nama data yang baru, misal akan dilakukan transformasi
log pada data, untuk transformasi ln pada data M1 akan dinamakan
LOG_M1, maka ketik nama data tersebut pada Target Variabel,
begitu juga untuk data yang lainnya. Untuk melakukan transformasi
Log dapat dipilih fungsi pada Function group, kemudian pilih
Arithmetic dan klik Lg10, kemudian masukkan ke kotak Numeric
Expression dan ketik nama data yang akan ditransformasi, lalu klik
Ok.
4) Maka data yang telah ditransform akan otomatis ada pada SPSS

Dilakukan pencarian nilai jarak antar kuartil dari data hasil transformasi di
atas dengan langkah-langkah sebelumnya, dan dihasilkan data sebagai berikut.

Descriptives
Statistic Std. Error
Mean 3.3769 .04905
95% Confidence Interval for Lower Bound 3.2729
Mean Upper Bound 3.4809
5% Trimmed Mean 3.3712
Median 3.3700
Variance .041
LOG_M1 Std. Deviation .20222
Minimum 3.09
Maximum 3.77
Range .68
Interquartile Range .34
Skewness .283 .550
Kurtosis -.756 1.063
Mean 3.8068 .06249
95% Confidence Interval for Lower Bound 3.6744
LOG_M2
Mean Upper Bound 3.9393
5% Trimmed Mean 3.7709
Median 3.7441
Variance .066
Std. Deviation .25765
Minimum 3.57
Maximum 4.69
Range 1.11
Interquartile Range .24
Skewness 2.687 .550
Kurtosis 8.993 1.063
Mean 3.8650 .10248
95% Confidence Interval for Lower Bound 3.6478
Mean Upper Bound 4.0823
5% Trimmed Mean 3.8254
Median 3.8021
Variance .179
LOG_M3 Std. Deviation .42253
Minimum 3.26
Maximum 5.18
Range 1.91
Interquartile Range .43
Skewness 1.815 .550
Kurtosis 5.510 1.063
Mean 4.3305 .10965
95% Confidence Interval for Lower Bound 4.0981
Mean Upper Bound 4.5630
5% Trimmed Mean 4.3619
Median 4.3002
Variance .204
LOG_M4 Std. Deviation .45211
Minimum 3.21
Maximum 4.89
Range 1.68
Interquartile Range .66
Skewness -.916 .550
Kurtosis .898 1.063
Dari output di atas didapatkan nilai jarak antar quartil dari keempat kelompok
data yaitu sebagai berikut

M1 M2 M3 M4
0.34 0.24 0.43 0.66
Dari tabel di atas dapat dilihat bahwa nilai jara antar quartil keempat data
memiliki jarak yang tidak terlalu besar, nilai tersebut menunjukkan varian
keempat kelompok data relative sama, sehingga dapat dilakukan
pembandingan data.
Berikut langkah-langkah dalam melakukan pembandingan data menggunakan
Box-plot dengan bantuan SPSS:
1) Devinisikan variabel DATA untuk keempat kelompok data
transformasi
2) Definisikan variabel KELOMPOK untuk kelompok data LOG_M1,
LOG_M2, LOG_M3, dan LOG_M4. Definisikan pula value label
dimana 1 untuk LOG_M1, 2 untuk LOG_M2, 3 untuk LOG_M3, dan
4 untuk LOG_M4.
3) Masukkan seluruh keempat kelompok data pada variabel DATA dan
nama kelompok data untuk variabel KELOMPOK, dimana
ssebelumnya diaktifkan terlebih dahulu Value Label pada menu view.
4) Gunakan menu Graphs Legacy Dialogs Boxplot , sehingga akan
muncul kotak dialog sebagai berikut.
5) Pilih Simple, Summaries for groups of cases, kemudian klik Define,
sehingga muncul kotak dialog berikut.

Pengisian:
- Variabel : diisi dengan variabel DATA
- Category Axis : diisi dengan variabel KELOMPOK
Kemudian klik Ok. Dan didapatkan hasil sebagai berikut.
Interpretasi :
 Dari Boxplot di atas dapat dilihat jarak antar quartil dari keempat
kelompok data relatife sama yaitu M1 = 0.34, M2 = 0.24, M3 = 0.43,
dan M4 = 0.57, dari nilai jarak antar quartil tersebut dapat disimpulkan
bahwa varian data relative sama dan data relative homogen.
 Terdapat kelompok data yang memiliki data pencilan dan nilai
ekstrem yaitu kelompok data M2 memiliki nilai ekstrem 20, sedangkan
data M3 dan M4 berturut-turut memiliki pencilan 39 dan 54.
 Data M1 memiliki ekor maksimum yang lebih menjulur dibandingkan
data M2, M3, dan M4.
 Jika pencilan belum dipisahkan data M3 memiliki ekor maksimum
yang lebih panjang, dan data M4 memiliki ekor minimum paling
menjulur jika pencilan belum dipisahkan.
 Median M1 lebih kecil dibandingkan dengan median M2, M3, dan M4
begitu juga dengan Q1 dan Q3nya.
 Data M2 memiliki nilai yang lebih kecil dibandingkan dengan nilai
minimum data M4.
 Median data M3 dan M4 hampir sama, begitu juga dengan Q1, namun
Q3 dari kedua data memiliki jarak yg sedikit jauh, karena median data
M3 tidak membagi kotak sama besar, jarak median dengan Q3 lebih
besar dibandingkan dengan jarak median ke Q1.
 Nilai maksimum paling besar terdapat pada data kelompok M4.
 25% data M3 lebih kecil dari data M4.
2. Pada data world95.sav (sampel data SPSS), lakukan pembandingan harapan
hidup wanita pada region 3 dan 4.
Penyelesaian:
Berikut data Harapan Hidup Wanita pada region 3 dan 4, berdasarkan data
world95.
No Harapan Hidup Region
Wanita
1 44 3
2 53 3
3 52 3
4 69 3
5 80 3
6 59 3
7 65 3
8 82 3
9 72 3
10 73 3
11 58 3
12 68 3
13 74 3
14 79 3
15 78 3
16 72 3
17 68 3
18 66 4
19 50 4
20 50 4
21 58 4
22 44 4
23 54 4
24 58 4
25 52 4
26 55 4
27 57 4
28 70 4
29 57 4
30 46 4
31 58 4
32 55 4
33 68 4
34 45 4
35 43 4
36 45 4

Akan dilakukan pembandingan data dari data di atas dengan bantuan SPSS.
Dicari terlebih dahulu nilai jarak antar quartil dari data Harapan Hidup Wanita
pada Region 3 (Pasific/Asia) dan 4 (Africa) dengan langkah-langkah yang
sama pada Latihan no. 1 di atas, sehingga didapatkan output sebagai berikut.
Descriptives
Statistic Std. Error

Mean 67.41 2.640

Lower Bound 61.81


95% Confidence Interval for
Mean Upper Bound 73.01

5% Trimmed Mean 67.90

Median 69.00

Variance 118.507

region3 Std. Deviation 10.886

Minimum 44

Maximum 82

Range 38

Interquartile Range 18

Skewness -.682 .550


Kurtosis -.300 1.063

Descriptives
Statistic Std. Error

Mean 54.26 1.830

Lower Bound 50.42


95% Confidence Interval for
Mean Upper Bound 58.11
region4

5% Trimmed Mean 54.01

Median 55.00
Variance 63.649

Std. Deviation 7.978

Minimum 43

Maximum 70

Range 27

Interquartile Range 12

Skewness .425 .524


Kurtosis -.434 1.014

Dari output di atas dapat diketahui nilai jarak antar quartil dari variabel
region3 sebesar 18 dan variabel region4 sebesar 12. Nilai tersebut
menunjukkan varian dari kedua data relative sama, sehingga dapat dilakukan
pembandingan data. Dengan langkah yang sama pula dengan Latihan no.1
didapatkan output sebagai berikut.

Interpretasi :
 Jarak antar kuartil data harapan hidup wanita pada wilayah 3(Asia) dan
4 (Afrika) relatif sama yaitu 18 dan 12, sehingga dapat disimpulkan
bahwa varian data relative sama dan data relative homogen.
 Data pada wilayah 4 (Afrika) memiliki ekor data maksimum yang
lebih menjulur, namun nilai maksimum data wilayah 3 (Asia) lebih
besar.
 Tidak terdapat data pencilan pada kedua kelompok data.
 Median data pada wilayah 3(Asia) lebih besar dibandingkan dengan
median data pada wilayah 4 (afrika), begitu juga dengan nilai Q1 dan
Q3.
 25 % harapan hidup wanita di Afrika lebih kecil dibandingkan dengan
harapan hidup wanita di Asia.
3. Pada data world95.sav, lakukan pembandingan pendapatan perkapita pada
keenam region.
Penyelesaian :
Berikut data pendapatan pada 6 wilayah yaitu, 1 OECD, 2 Eropa Timur, 3
Asia, 4 Afrika, 5 timur Tengah, 6 Amerika Latin.
No Region1 Region2 Region3 Region4 Region5 Region6
1 16848 6500 205 2677 5000 3408
2 18396 3098 202 357 3000 6950
3 17912 3831 260 208 7875 730
4 19904 5487 377 993 748 2354
5 18277 7311 14641 457 1500 2591
6 15877 6000 275 122 1955 1538
7 18944 4500 681 4283 13066 2031
8 17539 5249 19860 351 1157 1382
9 8060 7400 2995 323 6818 1034
10 17241 6710 1000 409 1429 1085
11 12170 4429 406 1062 5910 1078
12 17500 2702 867 282 7467 1342
13 17245 6680 6627 292 6651 383
14 14381 2340 14990 744 2436 1030
15 17755 7055 2126 3721 3604
16 9000 1800 3128 14193 447
17 13047 230 263 1350 2397
18 16900 325 1500
19 22384 573 1107
20 15974 3131
21 23474 2829

Untuk mengetahui varian data, akan dicari terlebih dahulu nilai jarak antar
quartil dari masing-masing data dengan bantuan SPSS dan dengan langkah-
langkah yang sama seperti Latihan no.1 sehingga dihasilkan output sebagai
berikut.

Descriptives
Statistic Std. Error
Mean 16610.86 813.073
Lower Bound 14914.82
95% Confidence Interval for Mean
Upper Bound 18306.90
5% Trimmed Mean 16705.02
Median 17245.00
Variance 13882856.429
REGION1
Std. Deviation 3725.971
Minimum 8060
Maximum 23474
Range 15414
Interquartile Range 3208
Skewness -.674 .501
Kurtosis .969 .972

Descriptives
Statistic Std. Error
Mean 5159.79 456.670
Lower Bound 4173.21
95% Confidence Interval for Mean
Upper Bound 6146.36
5% Trimmed Mean 5191.98
Median 5368.00
Variance 2919658.489
REGION2 Std. Deviation 1708.701
Minimum 2340
Maximum 7400
Range 5060
Interquartile Range 3040
Skewness -.316 .597
Kurtosis -1.216 1.154

Descriptives
Statistic Std. Error
Mean 4263.00 1525.803
Lower Bound 1028.44
95% Confidence Interval for Mean
Upper Bound 7497.56
5% Trimmed Mean 3622.11
Median 867.00
Variance 39577266.000
REGION3 Std. Deviation 6291.046
Minimum 202
Maximum 19860
Range 19658
Interquartile Range 6574
Skewness 1.594 .550
Kurtosis 1.362 1.063
Descriptives
Statistic Std. Error
Mean 998.68 270.311
Lower Bound 430.78
95% Confidence Interval for Mean
Upper Bound 1566.59
5% Trimmed Mean 864.93
Median 409.00
Variance 1388291.228
REGION4 Std. Deviation 1178.258
Minimum 122
Maximum 4283
Range 4161
Interquartile Range 770
Skewness 1.797 .524
Kurtosis 2.437 1.014

Descriptives
Statistic Std. Error
Mean 4957.41 984.076
Lower Bound 2871.26
95% Confidence Interval for Mean
Upper Bound 7043.56
5% Trimmed Mean 4678.18
Median 3721.00
Variance 16462885.382
REGION5 Std. Deviation 4057.448
Minimum 748
Maximum 14193
Range 13445
Interquartile Range 5678
Skewness 1.124 .550
Kurtosis .664 1.063
Descriptives
Statistic Std. Error
Mean 1997.67 323.426
Lower Bound 1323.01
95% Confidence Interval for Mean
Upper Bound 2672.32
5% Trimmed Mean 1820.92
Median 1500.00
Variance 2196688.933
REGION6 Std. Deviation 1482.123
Minimum 383
Maximum 6950
Range 6567
Interquartile Range 1654
Skewness 1.969 .501
Kurtosis 5.363 .972

Dari output di atas, diketahui nilai jarak antar quartil data sebagai berikut.
Region1 Region2 Region3 Region4 Region5 Region6
3208 3040 6574 770 5678 1654
Dari tabel di atas dapat dilihat varian dari data-data tersebut belum bias
dikatakan relative sama, karena perbedaan antar nilai yg masih besar,
sehingga perlu dilakukan transformasi data. Data-data di atas ditransformasi
menggunakan Log 10, sehingga didapatkan nilai jarak antar quartil dari data-
data yang telah ditransformasi pada output berikut.

Descriptives
Statistic Std. Error
Mean 4.2078 .02469
95% Confidence Interval for Lower Bound 4.1563
LOG_REGION1
Mean Upper Bound 4.2593
5% Trimmed Mean 4.2154
Median 4.2367
Variance .013
Std. Deviation .11315
Minimum 3.91
Maximum 4.37
Range .46
Interquartile Range .08
Skewness -1.431 .501
Kurtosis 2.233 .972

Descriptives
Statistic Std. Error
Mean 3.6864 .04380
95% Confidence Interval for Lower Bound 3.5918
Mean Upper Bound 3.7810
5% Trimmed Mean 3.6939
Median 3.7297
Variance .027
LOG_REGION2 Std. Deviation .16388
Minimum 3.37
Maximum 3.87
Range .50
Interquartile Range .27
Skewness -.755 .597
Kurtosis -.599 1.154

Descriptives
Statistic Std. Error
Mean 3.1076 .17469
95% Confidence Interval for Lower Bound 2.7373
LOG_REGION3 Mean Upper Bound 3.4780
5% Trimmed Mean 3.0861
Median 2.9380
Variance .519
Std. Deviation .72025
Minimum 2.31
Maximum 4.30
Range 1.99
Interquartile Range 1.41
Skewness .483 .550
Kurtosis -1.341 1.063

Descriptives
Statistic Std. Error
Mean 2.7719 .09968
95% Confidence Interval for Lower Bound 2.5625
Mean Upper Bound 2.9813
5% Trimmed Mean 2.7622
Median 2.6117
Variance .189
LOG_REGION4 Std. Deviation .43450
Minimum 2.09
Maximum 3.63
Range 1.55
Interquartile Range .56
Skewness .690 .524
Kurtosis -.479 1.014

Descriptives
Statistic Std. Error
Mean 3.5464 .09391
95% Confidence Interval for Lower Bound 3.3473
Mean Upper Bound 3.7455
LOG_REGION5
5% Trimmed Mean 3.5501
Median 3.5707
Variance .150
Std. Deviation .38719
Minimum 2.87
Maximum 4.15
Range 1.28
Interquartile Range .69
Skewness -.093 .550
Kurtosis -1.152 1.063

Descriptives
Statistic Std. Error
Mean 3.2009 .06680
95% Confidence Interval for Lower Bound 3.0616
Mean Upper Bound 3.3402
5% Trimmed Mean 3.2002
Median 3.1761
Variance .094
LOG_REGION6 Std. Deviation .30610
Minimum 2.58
Maximum 3.84
Range 1.26
Interquartile Range .41
Skewness -.116 .501
Kurtosis .090 .972

Dari output-output di atas nilai jarak antar quartil data ditampilkan pada tabel
berikut.
Region1 Region2 Region3 Region4 Region5 Region6
0.08 0.27 1.41 0.56 0.69 0.41

Setelah ditransformasi, dapat dilihat nilai jarak antar quartil dari data-data
tersebut tidak terlalu besar, sehingga dapat dikatakan bahwa varian data-data
tersebut relative sama, sehingga selanjutnya dapat dilakukan pembandingan
data.
Pembandingan data kali ini juga menggunakan Box-plot dengan bantuan
SPSS melalui langkah-langkah yang tertera pada Latihan nomor 1, sehingga
didapatkan Box-plot sebagai berikut.

Sebelum Ditransformasi
Setelah Ditransformasi

Perbedaan data setelah ditransformasi dan sebelum di transformasi dapat


dilihat pada Box-plot di atas, dimana penyebaran data terlihat relatife lebih
homogen setelah di transformasi.
Interpretasi:
 Penyebaran data pada keenam kelompok data relative sama atau
homogen.
 Terdapat pencilan dan nilai ekstreme pada kelompok data wilayah
OECD.
 Ekor data maksimum di wilayah Asia lebih menjulur dibandingkan
dengan lima kelompok data lainnya.
 75% pendapatan per kapita di wilayah Amerika Latin lebih tinggi
dibandingkan dengan wilayah Afrika.
 Pendapatan perkapita di wilayah Afrika paling rendah jika
dibandingkan dengan lima wilayah lainnya.
 Hampir 50 % pendapatan perkapita di afrika lebih kecil dibandingkan
dengan pendapatan perkapita di Asia.
 Median data pada wilayah OECD paling tinggi dibandingkan dengan
lima wilayah lainnya, begitu juga dengan Q1 dan Q3.

Anda mungkin juga menyukai