Anda di halaman 1dari 10

Soal Nomor 2: Data Crime Rates

Jawab:
Data berikut ini memberikan tingkat kejahatan per 100.000 orang di tujuh kategori
untuk masing-masing dari 50 negara pada tahun 1977. Karena ada tujuh variabel numerik,
adalah mustahil untuk merencanakan semua variabel secara bersamaan. komponen utama
dapat digunakan untuk meringkas data dalam dua atau tiga dimensi, dan mereka membantu
untuk memvisualisasikan data. Pernyataan berikut menghasilkan Gambar 70.1 melalui
Gambar 70.5
data Crime;
input State $1-15 Murder Rape Robbery Assault
Burglary Larceny Auto_Theft;
datalines;
Alabama
14.2 25.2 96.8 278.3 1135.5 1881.9
Alaska
10.8 51.6 96.8 284.0 1331.7 3369.8
Arizona
9.5 34.2 138.2 312.3 2346.1 4467.4
Arkansas
8.8 27.6 83.2 203.4 972.6 1862.1
California
11.5 49.4 287.0 358.0 2139.4 3499.8
Colorado
6.3 42.0 170.7 292.9 1935.2 3903.2
Connecticut
4.2 16.8 129.5 131.8 1346.0 2620.7
Delaware
6.0 24.9 157.0 194.2 1682.6 3678.4
Florida
10.2 39.6 187.9 449.1 1859.9 3840.5
Georgia
11.7 31.1 140.5 256.5 1351.1 2170.2
Hawaii
7.2 25.5 128.0 64.1 1911.5 3920.4
Idaho
5.5 19.4 39.6 172.5 1050.8 2599.6
Illinois
9.9 21.8 211.3 209.0 1085.0 2828.5
Indiana
7.4 26.5 123.2 153.5 1086.2 2498.7
Iowa
2.3 10.6 41.2 89.8 812.5 2685.1
Kansas
6.6 22.0 100.7 180.5 1270.4 2739.3
Kentucky
10.1 19.1 81.1 123.3 872.2 1662.1
Louisiana
15.5 30.9 142.9 335.5 1165.5 2469.9
Maine
2.4 13.5 38.7 170.0 1253.1 2350.7
Maryland
8.0 34.8 292.1 358.9 1400.0 3177.7
Massachusetts
3.1 20.8 169.1 231.6 1532.2 2311.3
Michigan
9.3 38.9 261.9 274.6 1522.7 3159.0
Minnesota
2.7 19.5 85.9 85.8 1134.7 2559.3
Mississippi
14.3 19.6 65.7 189.1 915.6 1239.9
Missouri
9.6 28.3 189.0 233.5 1318.3 2424.2
Montana
5.4 16.7 39.2 156.8 804.9 2773.2
Nebraska
3.9 18.1 64.7 112.7 760.0 2316.1
Nevada
15.8 49.1 323.1 355.0 2453.1 4212.6
New Hampshire
3.2 10.7 23.2 76.0 1041.7 2343.9
New Jersey
5.6 21.0 180.4 185.1 1435.8 2774.5
New Mexico
8.8 39.1 109.6 343.4 1418.7 3008.6
New York
10.7 29.4 472.6 319.1 1728.0 2782.0
North Carolina 10.6 17.0 61.3 318.3 1154.1 2037.8
North Dakota
0.9 9.0 13.3 43.8 446.1 1843.0
Ohio
7.8 27.3 190.5 181.1 1216.0 2696.8
Oklahoma
8.6 29.2 73.8 205.0 1288.2 2228.1
Oregon
4.9 39.9 124.1 286.9 1636.4 3506.1
Pennsylvania
5.6 19.0 130.3 128.0 877.5 1624.1
Rhode Island
3.6 10.5 86.5 201.0 1489.5 2844.1
South Carolina 11.9 33.0 105.9 485.3 1613.6 2342.4
South Dakota
2.0 13.5 17.9 155.7 570.5 1704.4

280.7
753.3
439.5
183.4
663.5
477.1
593.2
467.0
351.4
297.9
489.4
237.6
528.6
377.4
219.9
244.3
245.4
337.7
246.9
428.5
1140.1
545.5
343.1
144.4
378.4
309.2
249.1
559.2
293.4
511.5
259.5
745.8
192.1
144.7
400.4
326.8
388.9
333.2
791.4
245.1
147.5

Tennessee
10.1 29.7 145.8 203.9 1259.7 1776.5 314.0
Texas
13.3 33.8 152.4 208.2 1603.1 2988.7 397.6
Utah
3.5 20.3 68.8 147.3 1171.6 3004.6 334.5
Vermont
1.4 15.9 30.8 101.2 1348.2 2201.0 265.2
Virginia
9.0 23.3 92.1 165.7 986.2 2521.2 226.7
Washington
4.3 39.6 106.2 224.8 1605.6 3386.9 360.3
West Virginia
6.0 13.2 42.2 90.9 597.4 1341.7 163.3
Wisconsin
2.8 12.9 52.2 63.7 846.9 2614.2 220.7
Wyoming
5.4 21.9 39.7 173.9 811.6 2772.2 282.0
;
ods graphics on;
title 'Crime Rates per 100,000 Population by State';
proc princomp out=Crime_Components plots= score(ellipse ncomp=3);
id State;
run;
ods graphics off;

Outputnya adalah:

Soal Nomor 3: Tulislah Reportnya!


Jawab:
Gambar 70.1 menampilkan yang PROC PRINCOMP output, dimulai dengan
statistik sederhana diikuti dengan matriks korelasi. The PROC PRINCOMP permintaan
pernyataan komponen utama bawaan dihitung dari matriks korelasi, sehingga total varians
adalah sama dengan jumlah variabel, 7.
Gambar 70.1 Jumlah Pengamatan dan Statistik Sederhana dari Prosedur PRINCOMP

Gambar 70.2 menampilkan nilai-nilai eigen. Komponen utama pertama menjelaskan sekitar
58,8% dari total varians, komponen utama kedua menjelaskan tentang 17,7%, dan komponen
utama ketiga menjelaskan sekitar 10,4%. Perhatikan bahwa nilai eigen jumlah total varians.
Nilai eigen menunjukkan bahwa dua atau tiga komponen memberikan ringkasan yang baik
dari data, dua komponen akuntansi untuk 76% dari total varians dan tiga komponen
menjelaskan 87%. komponen berikutnya kontribusi masing-masing kurang dari 5%.
Gambar 70.2 Hasil dari Principal Component Analysis: PROC PRINCOMP

Gambar 70.3 menampilkan vektor eigen. Dari matriks vektor eigen, Anda dapat mewakili
komponen utama pertama Prin1 sebagai kombinasi linear dari variabel asli:

Demikian pula,komponen utama kedua Prin2 adalah:

dimana variabel dibakukan.

Gambar 70.3 Hasil dari Principal Component Analysis: PROC PRINCOMP

Komponen pertama adalah ukuran dari tingkat kejahatan secara keseluruhan sejak
eigenvector pertama menunjukkan beban kira-kira sama pada semua variabel. Eigenvector
kedua memiliki beban positif yang tinggi pada variabel Auto_Theft dan pencurian dan beban
negatif yang tinggi pada variabel Pembunuhan dan Assault. Ada juga memuat positif kecil di
Pencurian dan loading negatif kecil di Pemerkosaan. Komponen ini tampaknya untuk
mengukur dominan kejahatan properti lebih kejahatan kekerasan. Interpretasi dari komponen
ketiga adalah tidak jelas.

Soal Nomor 4: Buatlah Scree Plot pada data tersebut.


Jawab:

PROC PRINCOMP menghasilkan plot scree seperti yang ditunjukkan pada Gambar diatas
secara default ketika ODS Graphics adalah diaktifkan. Anda dapat memperoleh lebih banyak
plot dengan menentukan KAVLING = pilihan dalam pernyataan PROC PRINCOMP.
Scree plot pada sebelah kiri menunjukkan bahwa nilai eigen dari komponen pertama adalah
sekitar 6,5 dan eigen dari komponen kedua sebagian besar menurun ke bawah 2,0. varians

menjelaskan rencana pada benar menunjukkan bahwa akun empat komponen utama pertama
selama hampir 80% dari total varians.
Kavling = score (ellipse ncomp = 3) dalam laporan PROC PRINCOMP meminta
berpasangan plot skor komponen untuk tiga komponen pertama dengan prediksi elips 95%
overlay pada masing-masing plot pencar. Gambar 70.4 menunjukkan plot dari dua komponen
pertama. Hal ini dimungkinkan untuk mengidentifikasi tren daerah pada plot dari dua
komponen pertama. Nevada dan California berada di ekstrim kanan, dengan tingkat kejahatan
secara keseluruhan tinggi tetapi rasio rata-rata kejahatan properti untuk kejahatan kekerasan.
Utara dan South Dakota berada di kiri ekstrim, dengan tingkat kejahatan yang rendah secara
keseluruhan. Negara bagian Tenggara cenderung di bawah plot, dengan rasio yang lebih
tinggi dari rata-rata kejahatan kekerasan untuk kejahatan properti. negara bagian New
England cenderung berada di bagian atas dari plot, dengan rasio-higherr-dari rata-rata
kejahatan properti untuk kejahatan kekerasan. Dengan asumsi dua komponen pertama adalah
dari distribusi normal bivariat, elips mengidentifikasi Nevada sebagai outlier mungkin.
Gambar 70.4 Plot Pertama Skor Dua Komponen

Gambar 70.5 menunjukkan plot dari komponen pertama dan ketiga. Dengan asumsi
pertama dan komponen ketiga adalah dari distribusi normal bivariat, elips mengidentifikasi
Nevada, Massachusetts, dan New York mungkin outlier.
Gambar 70.5 Plot Skor Pertama dan Ketiga Komponen

Inputnya:
data Crime;
title 'Crime Rates per 100,000 Population by State';
input State $1-15 Murder Rape Robbery Assault
Burglary Larceny Auto_Theft;
datalines;
Alabama
14.2 25.2 96.8 278.3 1135.5 1881.9 280.7
Alaska
10.8 51.6 96.8 284.0 1331.7 3369.8 753.3
Arizona
9.5 34.2 138.2 312.3 2346.1 4467.4 439.5
Arkansas
8.8 27.6 83.2 203.4 972.6 1862.1 183.4
California
11.5 49.4 287.0 358.0 2139.4 3499.8 663.5
Colorado
6.3 42.0 170.7 292.9 1935.2 3903.2 477.1
Connecticut
4.2 16.8 129.5 131.8 1346.0 2620.7 593.2
Delaware
6.0 24.9 157.0 194.2 1682.6 3678.4 467.0
Florida
10.2 39.6 187.9 449.1 1859.9 3840.5 351.4
Georgia
11.7 31.1 140.5 256.5 1351.1 2170.2 297.9
Hawaii
7.2 25.5 128.0 64.1 1911.5 3920.4 489.4
Idaho
5.5 19.4 39.6 172.5 1050.8 2599.6 237.6
Illinois
9.9 21.8 211.3 209.0 1085.0 2828.5 528.6
Indiana
7.4 26.5 123.2 153.5 1086.2 2498.7 377.4
Iowa
2.3 10.6 41.2 89.8 812.5 2685.1 219.9
Kansas
6.6 22.0 100.7 180.5 1270.4 2739.3 244.3
Kentucky
10.1 19.1 81.1 123.3 872.2 1662.1 245.4
Louisiana
15.5 30.9 142.9 335.5 1165.5 2469.9 337.7
Maine
2.4 13.5 38.7 170.0 1253.1 2350.7 246.9
Maryland
8.0 34.8 292.1 358.9 1400.0 3177.7 428.5
Massachusetts
3.1 20.8 169.1 231.6 1532.2 2311.3 1140.1
Michigan
9.3 38.9 261.9 274.6 1522.7 3159.0 545.5
Minnesota
2.7 19.5 85.9 85.8 1134.7 2559.3 343.1
Mississippi
14.3 19.6 65.7 189.1 915.6 1239.9 144.4
Missouri
9.6 28.3 189.0 233.5 1318.3 2424.2 378.4
Montana
5.4 16.7 39.2 156.8 804.9 2773.2 309.2
Nebraska
3.9 18.1 64.7 112.7 760.0 2316.1 249.1
Nevada
15.8 49.1 323.1 355.0 2453.1 4212.6 559.2
New Hampshire
3.2 10.7 23.2 76.0 1041.7 2343.9 293.4

New Jersey
New Mexico
New York
North Carolina
North Dakota
Ohio
Oklahoma
Oregon
Pennsylvania
Rhode Island
South Carolina
South Dakota
Tennessee
Texas
Utah
Vermont
Virginia
Washington
West Virginia
Wisconsin
Wyoming
;

5.6
8.8
10.7
10.6
0.9
7.8
8.6
4.9
5.6
3.6
11.9
2.0
10.1
13.3
3.5
1.4
9.0
4.3
6.0
2.8
5.4

21.0
39.1
29.4
17.0
9.0
27.3
29.2
39.9
19.0
10.5
33.0
13.5
29.7
33.8
20.3
15.9
23.3
39.6
13.2
12.9
21.9

180.4
109.6
472.6
61.3
13.3
190.5
73.8
124.1
130.3
86.5
105.9
17.9
145.8
152.4
68.8
30.8
92.1
106.2
42.2
52.2
39.7

185.1
343.4
319.1
318.3
43.8
181.1
205.0
286.9
128.0
201.0
485.3
155.7
203.9
208.2
147.3
101.2
165.7
224.8
90.9
63.7
173.9

1435.8
1418.7
1728.0
1154.1
446.1
1216.0
1288.2
1636.4
877.5
1489.5
1613.6
570.5
1259.7
1603.1
1171.6
1348.2
986.2
1605.6
597.4
846.9
811.6

2774.5
3008.6
2782.0
2037.8
1843.0
2696.8
2228.1
3506.1
1624.1
2844.1
2342.4
1704.4
1776.5
2988.7
3004.6
2201.0
2521.2
3386.9
1341.7
2614.2
2772.2

511.5
259.5
745.8
192.1
144.7
400.4
326.8
388.9
333.2
791.4
245.1
147.5
314.0
397.6
334.5
265.2
226.7
360.3
163.3
220.7
282.0

proc princomp out=Crime_Components;


run;
title2 'Plot of the First Two Principal Components';
%plotit(data=Crime_Components, labelvar=State,
plotvars=Prin2 Prin1, color=black, colors=blue);
run;
title2 'Plot of the First and Third Principal Components';
%plotit(data=Crime_Components, labelvar=State,
plotvars=Prin3 Prin1, color=black, colors=blue);
plots=none;
plots=(scatter pattern);
plots(unpack)=scree;
plots(ncomp=3 flip)=(pattern(circles=0.5 1.0) score);
run;
ods graphics on;
proc princomp plots=all;
var x1--x10;
run;
ods graphics off;
Outputnya:

Anda mungkin juga menyukai