Modul Lengkap Multivariat Revisi (Praktikumnya)

PRAKTIKUM 1
UJI DATA MULTIVARIAT
1.1 Indikator Praktikum

Setelah melakukan praktikum ini , mahasiswa diharapkan dapat:
a) Menjelaskan konsep uji data dalam analisis multivariate.
b) Melakukan uji Missing Value Analysis dan penanganan Missing Value
c) Melakukan uji data outlier
1.2 Uji Data Multivariat
Uji data pada prinsipnya bertujuan untuk memastikan bahwa berbagai metode
multivariat (analisis gerombol, analisis faktor, dan analisis lainnya) dapat digunakan pada
data tertentu. Dengan demikian, hasil proses multivariat dapat diinterpretasikan dengan
tepat. Pengabaian uji data dapat berakibat biasnya kesimpulan yang diambil, atau bahkan
metode multivariat tidak dapat diproses. Seperti jika data (yang terdiri atas banyak variabel)
mempunyai banyak missing value (data yang hilang). Jika data tersebut dipaksa untuk tetap
diproses, output yang dihasilkan dapat sangat berbeda dibandingkan jika tidak terdapat
missing value. Pada beberapa jenis data yang sangat banyak mengandung missing value,
proses multivariat bahkan tidak dapat dilakukan.
Uji data dapat dilakukan dengan empat cara:

Pengujian dengan menggunakan grafik, seperti untuk menguji bentuk kenormalan
sebuah distribusi data, menguji sebaran dua variabel untuk korelasi dan sebagainya.
Pengujian adanya missing data, yakni menguji apakah data yang tidak lengkap atau
ada data yang hilang akan mempengaruhi data secara keseluruhan.
Pengujian adanya Outlier (data yang sangat ekstriem), yang mungkin keberadaan
data ini akan mengganggu keseluruhan data.
Pengujian beberapa asumsi metode-metode Multivariat, seperti Uji Normalitas, Uji
Linieritas dan sebagainya.
1.3 Contoh Kasus Missing Value
Terdapat data yang berisi 30 konsumen yang digolongkan berdasarkan banyaknya air
minum mineral yang dikonsumsinya, yakni:
SEDIKIT: konsumen termasuk sedikit mengkonsumsi air mineral dan diberi kode 0.
BANYAK: konsumen termasuk banyak mengkonsumsi air mineral dan diberikode 1.
Penuntun Praktikum Analisis Data Multivariat

Laboratorium Komputasi Vokasi 1
Program Pendidikan Vokasi
Sedangkan data variabel lain adalah data rasio, yakni Usia konsumen, Berat dan Tinggi
badan konsumen, Income konsumen, Jam Kerja Konsumen dalam sehari, serta kegiatan
Olahraga konsumen (jam) dalam sehari. Jika diperhatikan isi seluruh data, terlihat terdapat
beberapa sel yang tidak terisi.
Jam
Nama Minum Usia Berat Tinggi Income Olahraga
Kerja
LITA Sedikit 40 154 680 5.33 3
NINA Sedikit 30 70 157 700 5.3 3.6
LISNA Sedikit 25 60 580 5.27 3.5
DINI Sedikit 26 75 160 600 5.33 3
IVANT Sedikit 50 159 700 5.5 3.5
ANIN Banyak 28 62 158 440 5 2.2
RUDI Sedikit 29 160 580 5.07 2.9
LILI Sedikit 40 52 165 5.13 4
RISMAN Banyak 35 68 150 700 5.17 3.5
ADI Sedikit 36 70 152 720 5.23 3.6
INTAN Sedikit 50 780 5.33 3.9
WISDU Sedikit 30 62 155 600 5.3 3
JAJA Sedikit 34 60 157 680 5.27 2.9
JIMY Banyak 35 160 700 5.33 4
ROS Banyak 62 165 580 5.5 3.5
PIANK Banyak 30 51 162 600 5 3.6
MAJID Sedikit 35 80 157 700 5.33 3.9
ICAL Banyak 22 52 154 440 5.3
INDRY Sedikit 40 72 155 800 5.27 3.4
KIKI Banyak 41 45 164 820 5.33
PARLIN Sedikit 32 42 640 5.5 2.9
RAHMAT Sedikit 29 54 157 580 5.3 3
SANJU Banyak 21 35 150 420 5.27 3.5
DEWI Banyak 25 50 154 500 5.07 2.5
RISWAN Sedikit 30 60 158 600 5.2 3
ZUL Sedikit 45 40 159 900 5.13 4.5
WILDA Banyak 158 700 5.17 3.5
EMY Sedikit 35 42 152 700 5.23 3.5
LENI Banyak 30 51 156 600 5.3 3
VIA Sedikit 24 75 154 480 5.13 2.4
Dari kasus tersebut, apakah missing value yang terjadi bersifat acak (random) atau tidak?
Terkait dengan permasalahan pertama, bagaimana seharusnya perlakuan terhadap data yang
mengandung missing value tersebut?
Langkah-langkah:

Tahap pada Missing Value.
1. Menguji Keacakan Missing Value
Buka file Missing Value
Dari menu Analyze, pilih submenu Missing Value Analysis, tampak dilayar
Gambar 1.1 Kotak dialog Missing Value Analysis

Masukkan variabel usia, berat, tinggi, Income, jam kerja dan Olahraga ke bagian
Quantitative Variables.
Masukkan variabel minum ke bagian Categorical Variables. Bagian ini bersifat
optional.
Masukkan variable nama ke bagian Case Label (optional).
Pada bagian ESTIMATION (kanan tengah), aktifkan kotak listwise, pairwise dan
EM.
NB. Listwise berarti hanya kasus yang semua datanya ada yang ditampilkan. Jika ada kasus dengan salah
satu data missing, maka tidak akan disertakan. Ciri pilihan ini adalah jumlah data yang diproses sama.
Pairwise berarti data yang lengkap dan berpasangan (pair) yang ditampilkan. Dengan demikian, pada
pilihan ini jumlah data akan bervariasi, tergantung lengkap tidaknya data dua variable yang dihubungkan.
EM adalah metode untuk menghasilkan angka MCAR.
Klik icon PATTERNS sehingga tampak di layar:
Gambar 1.2 Kotak dialog Missing Value Analysis-Patterns

Pada bagian DISPLAY, aktifkan dua pilihan pertama, yakni Tabulated cases dan
Cases with missing values
Abaikan bagian lain, dan tekan CONTINUE untuk kembali ke kotak dialig utama.
Klik icon DESCRIPTIVES, sehingga tampak dilayar
Gambar 1.3 Kotak dialog Missing Value Analysis - Descriptives

Pada bagian INDICATOR VARIABEL STATISTICS, aktifkan dua pilihan, yakni
Percent mismatch dan Crosstabilations of
Abaikan bagian lain, dan tekan CONTINUE , selanjutnya OK, sehingga muncul
output sebagai berikut:
Deskripsi variabel dengan adanya Missing value
Univariate Statistics
a
Missing No. of Extremes
N Mean Std. Deviation Count Percent Low High
Usia 26 31.8077 6.22909 4 13.3 0 0
Berat 26 57.3077 12.00923 4 13.3 0 0
Tinggi 27 157.1111 4.07934 3 10.0 0 0
Income 29 638.6207 115.87321 1 3.3 0 1
jam_krj 30 5.2530 .12983 0 .0 0 0
Olahraga 28 3.3143 .52261 2 6.7 0 1
Minum 30 0 .0
a. Number of cases outside the range (Q1 - 1.5*IQR, Q3 + 1.5*IQR).
Jika diperhatikan pada kolom N, terlihat angka bervariasi pada setiap variabel , tergantung
data yang hilang pada setiap variabel. Pada variabel USIA, dari 30 konsumen yang didata,
ada 26 data Usia Konsumen yang terisi, sehingga ada 4 (dari 30-26) data yang missing.
Demikian seterusnya untuk variabel yang lain. Hal ini dapat juga dilihat pada kolom
MISSING, pada bagian Count untuk jumlah nyata, dan percent untuk menghitung persentase
(dimana untuk variabel USIA, persentase adalah 4/30*100% atau 13,3%).
Kolom Mean dan Standard Deviation menunjukkan nilai statistik dasar, yakni rata-rata dan
standar deviasi untuk setiap variabel, yang dihitung dari jumlah data yang valid (tidak
missing).

Summary of Estimated Means
Olahraga
Income
jam_krj
Tinggi
Berat
Usia
Listwise 31.2778 59.8333 155.7222 628.8889 5.2128 3.2278
All Values 31.8077 57.3077 157.1111 638.6207 5.2530 3.3143
EM 31.9908 56.8385 157.1787 643.8727 5.2530 3.3161
Tabel ini merupakan perluasan dari perhitungan rata-rata dari tabel diatas, dimana terdapat
tiga ukuran:
Jika digunakan metode Listwise , rata-rata Usia menjadi 31,2 tahun, berat badan
menjadi 59,83 Kg, dan seterusnya.
Jika digunakan ALL VALUE, nilai sama dengan tabel sebelumnya. Perhatikan pada
ALL VALUE jumlah data dapat bervariasi, sedang pada Listwise (lihat penjelasan
dibawah) jumlah data akan tetap sama untuk semua variabel sehingga ada perbedaan
rata-rata.
Jika digunakan metode EM, rata-rata USIA menjadi 31,99 tahun, berat badan
menjadi 56.84 Kg, dan seterusnya.
Tabel Silang untuk Data Kategorik.
Minum
B any ak
S e d ik it
Tota l
Usia Present Count 26 9 17

Percent 86.7 81.8 89.5
Missing % SysMis 13.3 18.2 10.5
Berat Present Count 26 9 17
Percent 86.7 81.8 89.5
Missing % SysMis 13.3 18.2 10.5
Tinggi Present Count 27 11 16
Percent 90.0 100.0 84.2
Missing % SysMis 10.0 .0 15.8
Olahraga Present Count 28 9 19
Percent 93.3 81.8 100.0
Missing % SysMis 6.7 18.2 .0
Indicator variables with less than 5% missing are not
displayed.
Untuk variabel USIA, dari 26 data yang valid, 9 data ada pada kategori minum Banyak,
dan sisanya (17 data) ada pada kategori minum Sedikit. Sedangkan dari komposisi data
missing, 18,2% data yang missing ada pada usia konsumen yang termasuk peminum air
mineral kategori BANYAK, sedangkan 10,5% berasal dari mereka yang termasuk
peminum air mineral kategori SEDIKIT. Perhatikan angka 13,3% merupakan rata-rata
dari 18,2% dengan 10,5%.
Demikian seterusnya untuk variabel lainnya. Perhatikan hanya ada empat variabel yang
ditampilkan dari enam variabel yang diuji. Hal ini disebabkan variabel (MINUM,
INCOME, dan JAM KERJA) hanya mempunyai sedikit data missing (kurang dari 5%
dari total 30 data) sehingga tidak ditampilkan pada output.

Dari keempat variabel yang ditampilkan , terlihat penyebaran data yang missing pada
kedua tipe konsumen, dalam arti ada persentase data hilang pada setiap kategori dan
variabel. Hal ini sebenarnya telah menggambarkan keacakan data yang hilang.
Penyebaran Missing Data.
Missing Patterns (cases with missing values)
Missing and Extreme Value

% Missing
# Missing
a
Patterns
Olahraga
Income
jam_krj
Minum
Tinggi
Berat
Usia
Case
LITA 1 14.3 S
RUDI 1 14.3 S
JIMY 1 14.3 S
WILDA 2 28.6 S S
IVANT 1 14.3 S
ROS 1 14.3 S
INTAN 2 28.6 S S
PARLIN 1 14.3 S
LISNA 1 14.3 S
KIKI 1 14.3 S
ICAL 1 14.3 S
LILI 1 14.3 S
- indicates an extreme low value, while + indicates an extreme
high value. The range used is (Q1 - 1.5*IQR, Q3 + 1.5*IQR).
a. Cases and variables are sorted on missing patterns.
Tabel di atas menggambarkan penyebaran data yang hilang hanya untuk konsumen yang
memang datanya tidak lengkap (Ada data yang Missing) , dan bukannya seluruh
konsumen.
Tabulated Patterns
b
Complete if ...
a
Missing Patterns
Olahraga
Income
jam_krj
Minum
Tinggi
Berat
Usia
Number of Cases
18 18
3 X 21
1 X X 24
2 X 20
1 X X 23
2 X 20
2 X 20
1 X 19
a. Variables are sorted on missing patterns.
b. Number of complete cases if variables missing in
that pattern (marked with X) are not used.
Tabel di atas menunjukkan sisi lain dari missing value, dimana missing value dinyatakan
per variabel. Pada baris pertama, angka 18 menyatakan terdapat 18 data (konsumen)

yang valid, dalam arti tidak terdapat missing value pada semua variabelnya. Hal inilah
yang dimaksudkan jika pengukuran dilakukan secara listwise.
Sedangkan angka 3 pada baris kedua berarti adanya tiga data yang missing hanya pada
variabel BERAT. Demikian seterusnya.
Analisis Listwise
Listwise Correlations
Olahraga
jam_krj
Income
Tinggi
Berat
Usia
Usia 1
Berat .047 1
Tinggi .095 .113 1
Income .939 .116 .119 1
jam_krj .064 .250 -.179 .255 1
Olahraga .662 -.184 .014 .751 .235 1
Metode ini akan menyebabkan dihilangkannya semua kasus (konsumen) yang tidak
lengkap datanya. Selanjutnya dapat diketahui korelasi antar variabel. Angka 0,047
menyatakan besar korelasi antara variabel BERAT dan USIA. Demikian seterusnya.
Sebagai contoh, angka korelasi antara variabel INCOME dan USIA sebesar 0,939.
Angka yang besar ini menyatakan bahwa terjadinya missing value dari variabel
INCOME berpengaruh kuat pada terjadinya missing value pada variabel USIA. Hal ini
menunjukkan rendahnya keacakan missing value. Sebaliknya angka korelasi yang rendah
(di bawah 0,5) menunjukkan tinggkat keacakan yang tinggi pada missing value, karena
pengaruh antar variabel lemah.
Analisis Metode Pairwise
Pairwise Frequencies
Olahraga
jam _k rj
Inc om e
M inum
Tinggi
B erat
Us ia
Usia 26
Berat 23 26
Tinggi 24 23 27
Income 25 25 26 29
jam_krj 26 26 27 29 30
Olahraga 24 24 25 27 28 28
Minum 26 26 27 29 30 28 30
Metode ini akan memasangkan (pair) variabel yang mempunyai data lengkap, dan tidak
menghilangkan sebuah baris begitu saja. Dengan demikian, jumlah data dapat berbeda-
beda tergantungan kelengkapan data dua variabel yang dipasangkan. Sebagai contoh, jika
dipasangkan variabel USIA dengan BERAT, akan ada 23 data yang valid, sedangkan
sisanya tidak valid. Namun jika dipasangkan USIA dengan TINGGI, akan ada 24 data
yang valid. Demikian seterusnya.

Pairwise Correlations
Olahraga
Income
jam_krj
Tinggi
Berat
Usia
Usia 1
Berat -.049 1
Tinggi .315 -.055 1
Income .927 -.010 .219 1
jam_krj .089 -.035 .085 .222 1
Olahraga .585 -.189 .231 .718 .184 1
Tabel ini mempunyai tafsiran yang sama dengan analisis korelasi pada analisis Listwise.
Analisis Metode EM
EM Correlationsa
Olahraga
Income
jam_krj
Tinggi
Berat
Usia
Usia 1
Berat -.143 1
Tinggi .190 -.035 1
Income .924 -.057 .282 1
jam_krj .033 -.079 .074 .167 1
Olahraga .623 -.204 .314 .762 .181 1
a. Little's MCAR test: Chi-Square = 33.225, DF =
33, Sig. = .456
Angka korelasi diatas mempunyai pola yang mirip dengan dua metode korelasi yakni
Listwise dan Pairwise.
Selain besar angka korelasi, kelebihan metode ini adalah tersedianya alat uji MCAR
(lihat bagian bawah tabel), dengan ketentuan:
Angka signifikansi MCAR (Prob) > 0,05 , missing value adalah Random.
Angka signifikansi MCAR (Prob) < 0,05 , missing value tidak Random.
Terlihat bahwa angka MCAR yang ditampilkan dengan alat analisis Chi-Square
adalah 33.225 dengan sig. = 0,456. Oleh karena angka sig. (0,456) > 0,05 maka
missing value dari data diatas adalah random.
Kesimpulan.
Dengan demikian, karena missing value yang terjadi bersifat acak (random), maka perlu
dilakukan berbagai perlakuan lanjutan.
1.4 Penanganan Missing Value

1. Proses Pengisian Missing Value dengan Rata-rata data:
Buka File Missing Value.

Dari menu Transform, Pilih submenu Replace Missing Values, sehingga
tampak layar:
Gambar 1.4 Kotak dialog Replace Missing Value

Masukkan variabel USIA, BERAT, , dan OLAHRAGA ke bagian NEW
Variable(s). Disebut variabel baru (new) karena nantinya akan ada enam
variabel baru atau enam kolom tambahan.
Bagian NAME and METHOD
Perhatikan bagian NAME secara otomatis menampilkan nama variabel baru seperti
USIA_1 sedangkan bagian METHOD, menampilkan berbagai metode pelakuan terhadap
missing value. Pilih Series Mean. Selanjutnya OK.
Ouput dan Analisis:
Missing
Result Values First Last Valid Creating
Variable Replaced Non-Miss Non-Miss Cases Function
Usia_1 4 1 30 30 SMEAN(Usia)
Berat_1 4 1 30 30 SMEAN(Berat)
Tinggi_1 3 1 30 30 SMEAN(Tinggi)
Income_1 1 1 30 30 SMEAN(Income)
Jam_krj_1 0 1 30 30 SMEAN(Jam_krj)
Olahraga_1 2 1 30 30 SMEAN(Olahraga)


Kesimpulan:
Dengan demikian, dengan adanya proses pengujian dari missing value kemudian dilanjutkan
dengan penanganan missing value maka proses multivariat ( seperti diskriminan, faktor, dan
lainnya) dapat diselesaikan.
1.5 Tugas Praktikum 1
Data penelitian pengaruh perubahan lingkungan terhadap tekanan darah. Objek
penelitian adalah 35 pria. Ada 6 variabel yang diteliti, yaitu Usia (dalam tahun), Berat badan
(dalam Kg), tinggi badan (dalam cm) , detak nadi per menit, tekanan darah sistolik dan
diastolik.
No. USIA Berat Tinggi Nadi Sistolik Diastolik No. USIA Berat Tinggi Nadi Sistolik Diastolik
Obs. Badan Badan Obs. Badan Badan
1 21 71 162 88 170 76 19 57 147 72 114 80
2 22 56.5 156 64 120 60 20 38 58 153 64 124 64
3 24 56 68 125 75 21 151 80 114
4 24 67 161 148 22 61 165 78
5 25 65 156 72 78 23 38 57 156 126 72
6 27 62 72 106 72 24 39 55 64 124 64
7 53 149 64 120 25 74 164 64 128 75
8 28 156 77 108 26 39 72 162 92
9 31 65 154 76 70 27 41 163 76 112
10 57 60 134 64 28 68 152 60 128 82
11 33 162 68 76 29 41 164 76 92
12 33 59.1 148 114 74 30 42 68 160 88 128
13 34 64 157 88 130 80 31 69 60 140 72
14 40 164 60 118 32 43 73 161 74 138 74
15 35 64 138 78 33 43 164 72 66
16 36 152 72 134 86 34 65 161 110
17 36 57 154 84 120 70 35 71 157 64 142 84
18 37 55 64 76

Dari kasus tersebut, apakah missing value yang terjadi bersifat acak (random) atau tidak?
Terkait dengan permasalahan pertama, bagaimana seharusnya perlakuan terhadap data yang
mengandung missing value tersebut?
PRAKTIKUM 2
ANALISIS KOMPONEN UTAMA (AKU)

a) Menjelaskan konsep Analisis Komponen Utama (AKU)
b) Menjelaskan langkah-langkah Analisis Komponen Utama pada Minitab 14.12
c) Menginterpretasikan output Analisis Komponen Utama
2.2 Analisis Komponen Utama (AKU)

Analisis komponen utama adalah suatu teknik analisis statistik, untuk
mentransformasikan p peubah asal yang masih saling berkorelasi satu dengan yang lain
menjadi satu bagian komponen k peubah baru yang tidak berkorelasi. Peubah-peubah baru
ini saling ortogonal dan merupakan kombinasi linier dari peubah asal tanpa menghilangkan
sebagian besar informasi yang terkandung dalam peubah asal. Analisis komponen utama
akan cukup efektif jika antar p peubah asal memiliki korelasi yang cukup besar.
Komponen utama tergantung pada matriks ragam-peragam dan matriks korelasi
dari X1 , X 2 ,L , X p . Melalui matriks ragam-peragam dapat diturunkan akar ciri (eigen
value) yaitu 1 2 L p 0 dan vektor ciri (eigen vector) yaitu a1 , a 2 , a3 ,L , a p .
Misalkan X ' (X1 , X 2 ,L , X p ) merupakan p peubah yang menjadi perhatian memiliki

sebaran peubah ganda dengan vektor rataan dan matriks ragam-peragam dengan
1 2 L p 0 .
Komponen utama pertama ( Y1 ) dapat dituliskan dengan persamaan:

Y1 a11X1 a12 X 2 L a1 p X p
= a1' X
Komponen utama kedua ( Y2 ) dapat dituliskan:

Y2 a21X1 a22 X 2 L a2 p X p
a '2 X
Selanjutnya untuk komponen utama ke-i ( i 3, 4, L , p ) diperoleh dari kombinasi linier p
peubah asal yang memaksimumkan var( ai X ) dengan kendala ai ai 1 dan cov( ai X, a k X ) =

' ' ' '
0 untuk k < i, dengan k 1, 2, L , p . Secara umum ragam dapat dituliskan: var(Yi ) ai ai

'
dengan i 1, 2, L , p .
Proporsi keragaman yang dapat diterangkan oleh komponen utama ke-i sebesar:
i
P p

i 1
i
Banyaknya komponen utama yang digunakan untuk analisis selanjutnya dapat diperoleh
dengan menggunakan kriteria persentase keragaman kumulatif, dan dituliskan:
k
Keragaman kumulatif 100% untuk k 1, 2, L , p .
1 2 L p
Banyaknya komponen utama dianggap cukup mewakili jika telah dapat menerangkan
keragaman kumulatif 80% atau lebih dari total keragaman data (Johnson & Wichern,
1982).
2.3 Contoh Kasus Analisis Komponen Utama
Data lima peubah sosioekonomi hasil sensus dari 14 blok sensus yang tergabung dalam
satu wilayah di daerah Madisun, Winconsin sebagai berikut:
Health Median
Median Total Services Value
Total Population School Employments Employments Home
(thousands) years (thousands) (hundreds) ($10.000s)
5.935 14.2 2.265 2.27 2.91
1.523 13.1 0.597 0.75 2.62
2.599 12.7 1.237 1.11 1.72
4.009 15.2 1.649 0.81 3.02
4.687 14.7 2.312 2.5 2.22
8.044 15.6 3.641 4.51 2.36
2.766 13.3 1.244 1.03 1.97
6.538 17 2.618 2.39 1.85

6.451 12.9 3.147 5.52 2.01
3.314 12.2 1.606 2.18 1.82
3.777 13 2.119 2.83 1.80
1.53 13.8 0.798 0.84 4.25
2.768 13.6 1.336 1.75 2.64
6.585 14.9 2.763 1.91 3.17
Ada 5 variabel yang diambil, yakni jumlah populasi di suatu daerah (X1), median lama
pendidikan (X2), jumlah tenaga kerja (X3), jumlah pekerja yang mendapat pelayanan
kesehatan (X4), dan median harga rumah penduduk di daerah tersebut (X5). Kelima variabel
tersebut akan dibuat variabel dengan jumlah lebih kecil dan menggunakan metode
komponen utama.
Sebelum dilakukan analisis, terlebih dahulu dilihat deskripsi dari masing-masing
peubah.
Langkah-langkah:
Tahap analisis komponen utama (AKU)
Dari menu Stat, pilih submenu Multivariate Principant Component, sehingga
tampak dilayar
Gambar 2.1 Kotak dialog Principal Components Analysis

Masukkan variabel yang akan dianalisis kedalam variables.
Number of components to compute adalah memasukkan berapa jumlah komponen
yang akan dihitung. Bersifat optional. Default jumlah komponen utama yang
dihitung adalah banyaknya peubah -1.
Type of Matrix merupakan pilihan matriks yang digunakan untuk mencari akar ciri
dan vektor ciri. Matriks korelasi digunakan jika datanya mempunyai skala yang tidak
sama. Sedangkan matriks kovarians digunakan apabila datanya mempunyai skala
yang relatif sama. Untuk analisis ini pilih Covariance.

Pilihan pada Graph jika ingin menampilkan screeplot (plot dari akar ciri) serta plot
dari dua skor komponen utama. Kotak dialog yang muncul jika dilik Graph.
Gambar 2.2 Kotak dialog Principal Components Analysis - Graphs

Beri tanda ceklist dengan pilihan Scree plot dan Score plot for, kemudian klik
OK.
Pilihan Storange memberikan pilihan untuk menyimpan koefisien-koefisien
komponen utama serta skor-skor komponen utamanya dalam bentuk kolom. Kotak
dialog yang muncul jika diklik Storange sebagai berikut:
Gambar 2.3 Kotak dialog Principal Components Analysis - Storage

Pada Coefficients masukkan kolom sebanyak jumlah peubah untuk menyimpan
koefisien masing-masing komponen utama. Dan pada Score, masukkan kolom
sebanyak jumlah peubah pula untuk menyimpan skor masing-masing komponen
utama. Selanjutnya klik OK.
Selanjutnya OK , sehingga muncul output sebagai berikut:
Principal Component Analysis: Total popula, Median Schoo, Total employ,

Health
Eigenanalysis of the Covariance Matrix
Eigenvalue 6.9311 1.7851 0.3896 0.2295 0.0142 Akar ciri dari matriks
Proportion 0.741 0.191 0.042 0.025 0.002 covariance serta besarnya
Cumulative 0.741 0.932 0.974 0.998 1.000
keragaman yang dapat
diterangkan oleh masing-
Variable Penuntun
PC1 Praktikum
PC2 Analisis
PC3 PC4DataPC5 masing akar ciri. Dua
Multivariat
Total population -0.781 -0.071 0.004 0.542 -0.302 akar ciri pertama mampu
Median School years -0.306 -0.764 -0.162 -0.545 -0.009 menerangkan keragaman
Total employments -0.334 0.083 Program
0.015 Pendidikan
0.051 0.937 Vokasi
sebesar 93,2%
Health Services -0.426 0.579 0.220 -0.636 -0.172
Median Value Home 0.054 -0.262 0.962 0.051 0.025
Koefisien dari masing-masing peubah
pada komponen utama pertama
Lima kolom pertama merupakan koefisien dari masing-masing komponen utama.

Selanjutnya lima kolom berikutnya merupakan nilai skor masing-masing komponen
utama. Untuk analisis selanjutnya nilai skor komponen utama ini yang digunakan.
Plot dari akar cirinya, digunakan untuk menentukan berapa komponen yang akan digunakan.
2.4 Interpretasi:
Pada output diatas, dapat diketahui bahwa analisis untuk memperoleh akar ciri pada
komponen utama dengan menggunakan matriks kovarians. Selanjutnya, pada bagian awal
output menunjukkan hasil analisis eigen yang meliputi eigenvalue (nilai eigen/ akar ciri),
persentase, dan persentase kumulatif setiap komponen utama. Eigenvalue merupakan nilai
varian komponen utama. Terlihat bahwa akar ciri untuk komponen utama pertama (PC1) dan
komponen utama kedua (PC2) adalah 6,9311 dan 1,7851. Akar ciri kedua komponen tersebut
mewakili 74,1% dan 19,1% dari seluruh variabilitas sehingga bila diakumulasikan kedua
komponen utama tersebut menyatakan 93,2% dari total variabilitas. Hal ini berarti, apabila
kelima variabel (populasi, pendidikan, tenaga kerja, kesehatan, dan tempat tinggal) direduksi
menjadi 2 variabel, maka kedua variabel baru tersebut dapat menjelaskan 93,2% dari total
variabilitas kelima variabel.
Analisis komponen utama menunjukkan apabila 5 variabel dipadatkan menjadi 2
komponen, maka 93,2% variabilitas kelima variabel akan dijelaskan 2 variabel baru. Apabila

kelima variabel dipadatkan 3 variabel, maka ketiga variabel sudah dapat menjelaskan
variabilitas dalam 5 variabel sebesar 97,4%.
1. Data berikut ini merupakan data rataan persentase jenis berita dari 20 Surat Kabar
Harian di Jakarta tahun 1995. Dengan menggunakan analisis komponen utama akan
dilakukan pereduksian variabel dengan jumlah variabel yang lebih kecil. Adapun
variabel yang diteliti meliputi 6 jenis berita yakni POLKAM (X1), EKBANG (X2),
KESRA (X3), Olahraga (X4), Opini (X5), dan Luar Negeri (X6). Datanya disajikan
sebagai berikut:
Jenis Berita
Surat Kabar Harian Kode
X1 X2 X3 X4 X5 X6
Angkata Bersenjata AB 29.40 32.43 9.09 9.09 9.09 10.91
Berita Buana BB 20.33 28.31 25.59 7.97 7.97 9.83
Berita Yuda BY 24.50 24.50 26.76 15.90 9.54 9.94
Bisnis Indonesia BI 3.82 68.53 4.92 7.65 7.65 7.42
Harian Indonesia HI 5.23 10.44 12.18 15.66 1.71 56.52
Harian Ekonomi Neraca HEN 8.87 30.30 21.82 4.55 9.09 6.82
Harian Terbit HT 9.37 23.08 35.54 9.37 9.37 13.27
Indonesia Observer IO 10.00 33.33 10.00 13.33 13.33 20.00
The Indonesia Times IT 8.15 22.96 14.81 33.21 14.81 28.15
The Jakarta Post TJP 9.19 28.10 18.22 10.48 8.10 10.00
Jayakarta JYKT 14.26 40.33 18.58 18.58 8.57 8.57
Kompas KMPS 12.14 38.99 19.51 9.88 10.17 9.31
Media Indonesia MI 11.34 44.19 13.86 11.28 6.20 5.96
Merdeka MDK 19.05 24.62 24.03 15.15 7.45 9.32
Pelita PLT 13.85 29.65 24.76 13.19 7.89 11.09
Pos Kota PK 20.29 18.97 46.38 8.69 2.18 2.18
Republika RPBK 8.49 25.99 41.14 9.56 7.00 7.81
Sinar Pagi SP 13.33 34.08 17.03 17.78 8.89 8.89
Suara Karya SK 10.10 19.28 33.93 10.36 10.36 8.22
Suara Pembaruan SPMB 9.32 30.30 27.94 16.32 6.45 9.68
2. Carilah satu kasus yang berhubungan dengan analisis komponen utama dan lakukan
pengujian dengan menggunakan analisis komponen utama. Berikan kesimpulan!
(Sumber data atau rujukan disertakan dalam soal)

PRAKTIKUM 3
ANALISIS FAKTOR

a. Menjelaskan konsep Analisis Faktor
b. Menjelaskan langkah-langkah Analisis Faktor pada Minitab 14.12
c. Menginterpretasikan output Analisis Faktor
3.2 Analisis Faktor

Analisis faktor digunakan untuk memperpadat variabel data menjadi variabel
berjumlah lebih sedikit. Seperti halnya AKU, analisis faktor merupakan perluasan dari AKU
yang bertujuan untuk mendapatkan sejumlah kecil faktor yang memiliki sifat sebagai
berikut: (1) mampu menjelaskan semaksimal mungkin keragaman data, (2) antar faktor
saling bebas, dan (3) setiap faktor dapat diinterpretasikan dengan lebih jelas. Proses analisis
faktor mencoba untuk menemukan hubungan (interrelationship) antar sejumlah variabel-
variabel yang saling independen satu dengan yang lain sehingga dapat dibuat satu atau
beberapa kumpulan variabel yang lebih sedikit dari jumlah variabel awal.
3.3 Contoh Kasus Analisis Faktor

Data lima peubah sosioekonomi hasil sensus dari 14 blok sensus yang tergabung dalam
satu wilayah di daerah Madisun, Winconsin sebagai berikut:
Median Median
Lama Pelayanan Harga
Pendidika Jumlah tenaga kesehatan tempat
Populasi total n kerja pekerja tinggal
5.935 14.2 2.265 2.27 2.91
1.523 13.1 0.597 0.75 2.62
2.599 12.7 1.237 1.11 1.72
4.009 15.2 1.649 0.81 3.02
4.687 14.7 2.312 2.5 2.22
8.044 15.6 3.641 4.51 2.36
2.766 13.3 1.244 1.03 1.97
6.538 17 2.618 2.39 1.85

6.451 12.9 3.147 5.52 2.01
3.314 12.2 1.606 2.18 1.82
3.777 13 2.119 2.83 1.80
1.53 13.8 0.798 0.84 4.25
2.768 13.6 1.336 1.75 2.64
6.585 14.9 2.763 1.91 3.17
Langkah-langkah:
1. Analisis faktor tahap awal.
Dari menu Stat, pilih submenu Multivariate Factor Analysis, sehingga tampak
dilayar :
Gambar. 3.1 Kotak dialog Factor Analysis

Masukkan semua variabel dalam daftar variabel.
Klik OK, sehingga muncul output sebagai berikut:
Factor Analysis: Populasi tot, Median lama , Jumlah tenag, Pelayanan ke,
Median
Principal Component Factor Analysis of the Correlation Matrix
Unrotated Factor Loadings and Communalities
Variable Factor1 Factor2 Factor3 Factor4 Factor5 Communality

Populasi total -0.972 -0.149 0.006 0.170 -0.067 1.000
Median lama pendidikan -0.545 -0.715 -0.415 -0.140 0.001 1.000
Jumlah tenaga kerja -0.989 -0.005 0.089 0.083 0.085 1.000
Pelayanan kesehatan pekerja -0.847 0.352 0.344 -0.200 -0.022 1.000
Median harga tempat tinggal 0.303 -0.797 0.523 0.005 0.002 1.000
Variance 3.0289 1.2911 0.5725 0.0954 0.0121 5.000

% Var 0.606 0.258 0.114 0.019 0.002 1.000
Factor Score Coefficients
Variable Factor1 Factor2 Factor3 Factor4 Factor5

Populasi total -0.321 -0.116 0.011 1.782 -5.511
Penuntun
Median lama pendidikan Praktikum
-0.180 -0.553Analisis
-0.726Data Multivariat
-1.466 0.060
Jumlah tenaga kerja -0.327Laboratorium
-0.004 0.155 0.868 Vokasi
Komputasi 6.988
Pelayanan kesehatan pekerja -0.280 0.272 0.601 -2.098 -1.829 18
Median harga tempat tinggal 0.100 Program
-0.617 Pendidikan
0.914 0.049 Vokasi
0.129
Interpretasi:
Hasil output diatas menampilkan 5 faktor. Terlihat pada varian untuk faktor 1 sampai 5
adalah 3.0289, 1.2911, 0,5725, 0.0954, dan 0.0121. Di bawah varian tiap faktor terdapat
persentase varian. Pada output, variabilitas yang ditunjukkan oleh faktor 1 adalah 60,6%,
faktor 2 adalah 25,8%, dan seterusnya. Output menunjukkan persentase 2 faktor pertama
sebesar 86,4% yang merupakan variabiltas kumulatif dari faktor 1 dan faktor 2 (60,6% dan
25,8%). Hal ini menunjukkan apabila 5 variabel dijadikan 2 variabel, kedua variabel dapat
menjelaskan 86,4% variabilitas data. Apabila 5 variabel dipadatkan menjadi 3 atau 4
variabel, maka variabel tersebut dapat menjelaskan 97,8% atau 99,8% variabilitas data.
2. Analisis faktor lanjutan.

Tahap-tahap analisis :
1) Mencari faktor loading dengan menggunakan PC, yaitu PC ke-m yang menjadi
faktor m. Dalam hal ini, m adalah banyaknya eigenvalue yang nilainya lebih dari 1.
2) Membuat rotasi faktor. Faktor-faktor yang telah didapat ditransformasikan untuk
mendaftarkan faktor baru.
3) Mencari nilai faktor 1 sampai factor m
Analisis melalui MINITAB:
Dari menu Stat, pilih submenu Multivariate Factor Analysis, sehingga tampak
seperti Gambar 3.1.
Masukkan semua variabel Populasi sampai Tempat Tinggal ke dalam daftar
variabel.
Dalam kotak Number of factor to extract, isikan 2. Dimana dari hasil analisis
factor yang dilakukan sebelumnya, hanya 2 faktor pertama yag eigenvalue-nya
lebih dari 1.
Di bawah Type of Rotation, pilih Varimax.
Selanjutnya, pilih Graphs, seperti di layar:

Gambar. 3.2 Kotak dialog Factor Analysis- Graphs
Dalam kotak dialog Factor Analysis Graphs, beri tanda ceklist pada Loading plot
for first 2 factors.
Kemudian, klik OK . Layar monitor memperlihatkan kembali kotak dialog Factor
Analysis seperti Gambar 3.1
Pilih Results, sehingga terlihat layar:
Gambar. 3.3 Kotak dialog Factor Analysis- Results

Dalam kotak dialog gambar 3.3, beri tanda ceklist pada Sort loadings, kemudian
OK.
Selanjutnya OK , sehingga muncul output sebagai berikut:

Factor Analysis: Populasi tot, Median lama , Jumlah tenag, Pelayanan ke, Median
Gambar.
Principal Component Factor Analysis of3.4
thePlot loading Matrix
Correlation
Pada gambar 3.4 menggambarkan hubungan faktor 1 dengan faktor 2. Grafik

Unrotated Factor Loadings and Communalities
memperlihatkan bahwa variabel pendidikan, populasi, tenaga kerja, dan kesehatan bernilai
Variable Factor1 Factor2 Communality
positif, sedangkan
Populasi totalvariabel tempat tinggal
-0.972bernilai negatif. Nilai
-0.149 positif menunjukkan bahwa
0.967
Median lama pendidikan -0.545 -0.715 0.808
antara faktor
Jumlah 1 dan
tenaga faktor 2 memiliki
kerja hubungan
-0.989 -0.005yang positif.
0.978 Sebaliknya, nilai negatif
Pelayanan kesehatan pekerja -0.847 0.352 0.841
menyatakan hubungan
Median harga negatif
tempat antara kedua
tinggal 0.303 faktor. Grafik tersebut
-0.797 berguna hanya membantu
0.726
menjelaskan
Variance hasil rotasi yang dilakukan dengan
3.0289 loading varimax.
1.2911 4.3200Melalui loading varimax
% Var 0.606 0.258 0.864
(rotasi), dapat mengelompokkan kelima variabel menjadi 2 variabel. Pada faktor 1, variabel
tenaga kerja,Factor
Rotated populasi, dan kesehatan
Loadings memiliki korelasi sangat besar, sedangkan pada faktor
and Communalities
Varimax Rotation
2, variabel tempat tinggal dan pendidikan berkorelasi kuat.
Populasi total 0.979 0.085 0.967
Median lama pendidikan 0.591 0.677 0.808
Jumlah tenaga kerja 0.987 -0.060 0.978
Pelayanan kesehatan pekerja 0.822 -0.406 0.841
Median harga tempat tinggal -0.251 0.815 0.726
Variance 3.0215 1.2986 4.3200

% Var 0.604 0.260 0.864
Sorted Rotated Factor Loadings and Communalities

Jumlah tenaga kerja 0.987 -0.060 0.978
Populasi total 0.979 0.085 0.967
Pelayanan kesehatan pekerja 0.822 -0.406 0.841
Median harga tempat tinggal -0.251 0.815 0.726
Median lama pendidikan 0.591 0.677 0.808
Variance 3.0215 1.2986 4.3200

% Var 0.604 0.260 0.864
Factor Score Coefficients
Variable Factor1 Factor2

Populasi total 0.328 0.094
Median lama pendidikan Laboratorium
0.216 0.541 Komputasi Vokasi 21
Jumlah tenaga kerja 0.326 Program
-0.018 Pendidikan Vokasi
Pelayanan kesehatan pekerja 0.261 -0.290
Median harga tempat tinggal -0.060 0.622
Interpretasi:
Hasil pengolahan data menunjukkan 2 faktor yang tidak dirotasi dapat menjelaskan 86,4%
dari variabilitas data dan setelah dilakukan rotasi (dengan loading varimax), variabilitas
untuk 2 faktor tetap menunjukkan nilai yang sama yaitu sebesar 86,4%. Variabilitas untuk
faktor 1 dan faktor 2 setelah dilakukan rotasi berubah menjadi 60,4% dan 26%. Selanjutnya
terlihat hasil rotasi diurutkan dari yang bernilai loading tertinggi hingga terendah. Output
menunjukkan, untuk faktor 1, urutan variable adalah tenaga kerja (0.987), ukuran populasi
(0.979), kesehatan (0.822), tempat tinggal (-0.251), dan pendidikan (0.591).

1) Sebuah perusahaan sedang melakukan evaluasi terhadap kualitas penjualan stafnya.
Disamping itu perusahaan tersebut mencoba menemukan sebuah metode atau
serangkaian tes yang dapat mengungkapkan potensi hasil yang bagus dalam penjualan.
Dengan kata lain ingin diketahui peubah-peubah apa saja yang dapat menunjukkan
bahwa sales tersebut mempunyai potensi yang bagus. Perusahaan memilih secara acak 50
orang sales dan masing-masing dievaluasi tiga variabel indeks hasil penjualannya yaitu
perkembangan penjualan (X1), keuntungan penjualan (X2), serta catatan penjualan

terbaru (X3). Ketiga indeks tersebut telah dikalikan 100. Kemudian 50 sales tersebut
mengikuti 4 test yang dapat mengukur kreativitas (X4), keuletan (X5), komunikasi (X6),
serta logika matematika (X7). Berikut datanya:
Sales X1 X2 X3 X4 X5 X6 X7 Sales X1 X2 X3 X4 X5 X6 X7
1 93 96 97.8 9 12 9 20 26 93.3 102 97.8 10 15 7 23
2 88.8 91.8 96.8 7 10 10 15 27 106.8 118 107.3 14 16 12 39
3 95 100.3 99 8 12 9 26 28 106.8 120 104.8 10 16 11 49
4 101.3 103.8 106.8 13 14 12 29 29 92.3 90.8 99.8 8 10 13 17
5 102 107.8 103 10 15 12 32 30 106.3 121 104.5 9 17 11 44
6 95.8 97.5 99.3 10 14 11 21 31 106 119.5 110.5 18 15 10 43
7 95.5 99.5 99 9 12 9 25 32 88.3 92.8 96.8 13 11 8 10
8 110.8 122 115.3 18 20 15 51 33 96 103.3 100.5 7 15 11 27
9 102.8 108.3 103.8 10 17 13 31 34 94.3 94.5 99 15 12 9 32
10 106.8 120.5 102 14 18 11 39 35 106.5 121.5 110.5 18 17 10 42
11 103.3 109.8 104 12 17 12 32 36 106.5 115.5 107 8 13 14 47
12 99.5 111.8 100.3 10 18 8 31 37 92 99.5 103.5 18 16 8 18
13 103.5 112.5 107 16 17 11 34 38 102 99.8 103.3 13 12 14 28
14 99.5 105.5 102.3 8 10 11 34 39 108.3 122.3 108.5 15 19 12 41
15 100 107 102.8 13 10 8 34 40 106.8 119 106.8 14 20 12 37
16 81.5 93.5 95 7 9 5 16 41 102.5 109.3 103.8 9 17 13 32
17 101.3 105.3 98 11 12 11 32 42 92.5 102.5 99.3 13 15 6 23
18 103.3 110.8 89 11 14 11 35 43 102.8 113.8 106.8 17 20 10 32
19 95.3 104.3 103 5 14 13 30 44 83.3 87.3 96.3 1 5 9 15
20 99.5 105.3 106.3 17 17 11 27 45 94.8 101.8 99.8 7 16 11 24
21 88.5 95.3 95.8 10 12 7 15 46 103.5 112 110.8 18 13 12 37
22 99.3 115 104.3 5 11 11 42 47 89.5 96 97.3 7 15 11 14
23 87.5 92.5 100 8 9 9 16 48 84.3 89.8 99 8 8 8 9
24 105.3 114 105.3 12 15 12 37 49 104.3 109.5 106.5 14 12 12 36
25 107 121 109 16 19 12 39 50 106 118.5 105 12 16 11 39
2) Carilah satu kasus yang berhubungan dengan analisis faktor dan lakukan pengujian
dengan menggunakan analisis faktor. Berikan kesimpulan! (Sumber data atau rujukan
disertakan dalam soal)

PRAKTIKUM 4
ANALISIS GEROMBOL (1)

a. Menjelaskan konsep Analisis Gerombol Berhierarki
b. Menjelaskan langkah-langkah Analisis Gerombol Berhierarki pada Minitab 14.12
dan SPSS 13
c. Menginterpretasikan output Analisis Gerombol Berhierarki
4.2 Analisis Gerombol Berhierarki

Analisis gerombol merupakan suatu metode dalam analisis peubah ganda yang
bertujuan untuk mengelompokkan n satuan pengamatan ke dalam k gerombol dengan (k<n)
berdasar p peubah, sehingga unit-unit pengamatan dalam satu gerombol mempunyai ciri-ciri
yang lebih homogen dibandingkan unit pengamatan dalam gerombol lain (Mattjik, 2004).
Secara umum metode penggerombolan berhierarki terdiri dari dua cara yakni penggabungan
(agglomerative) dan pemisahan (divise).
Metode penggerombolan berhierarki dengan penggabungan, setiap objek
merupakan suatu gerombol tersendiri, lalu dua objek atau gerombol yang terdekat

digabungkan sehingga menjadi satu gerombol. Setelah itu, jarak antara gerombol baru
dengan gerombol lainnya dihitung kembali disebut dengan perbaikan matriks jarak. Prosedur
ini diulang terus sampai terbentuk satu gerombol yang berunsurkan semua objek. Sedangkan
pada metode penggerombolan berhierarki dengan pemisahan bekerja dengan arah
sebaliknya. Langkah awal dimulai dengan membentuk satu gerombol besar beranggotakan
seluruh pengamatan. Setelah itu, gerombol besar yang terbentuk dipisah menjadi gerombol
yang lebih kecil, hingga satu gerombol hanya beranggotakan satu pengamatan saja. Kedua
cara dalam metode ini tidak berbeda dalam pembentukan gerombol yang terjadi tetapi hanya
berbeda dalam tahapan pembentukan gerombol saja.
Misalkan n Dn dik merupakan matriks jarak antara gerombol ke-i dengan
gerombol ke-k, maka d k i , j merupakan ukuran ketakmiripan antara gerombol ke-k dengan
gerombol (i,j). Jika gerombol (i,j) merupakan penggabungan antara gerombol ke-i dengan
gerombol ke-j, maka ada beberapa metode yang sudah umum dikenal dan digunakan untuk
memperbaharui jarak antar gerombol, yaitu:
No Metode Rumus yang digunakan

1 Pautan tunggal (single linkage) d k ( i , j ) minimum {dki,dkj}
2 Pautan lengkap (complete linkage) d k ( i , j ) maksimum {dki,dkj}
ni d ki n j k kj
3 Pautan rataan (average linkage) d k (i , j )
ni n j
n k ni nk n j nk
4 Metode Ward (Wards method) d k (i , j ) d ki d kj d ij
n k n(i , j ) n k n(i , j ) n k n( i , j )
Metode terpusat (centroid method) ni nj ni n j
5 d k (i , j ) d ki d kj d ij
ni n j ni n j ( ni n j ) 2
dengan ni adalah jumlah objek gerombol-i; nj adalah jumlah objek gerombol-j; nk adalah
jumlah objek gerombol-k; n(i,j) = ni + nj.
4.3 Contoh Kasus Analisis Gerombol Berhierarki

Sebuah perusahan Susu Bubuk melakukan identifikasi terhadap 18 merk susu bubuk
atau minuman berenergi yang selama ini dijual dengan spesifikasi tiap variabel:
SUSU, yakni nama susu bubuk.
LEMAK, yakni Kandungan Lemak (gr) per 100 gram Susu.
KARBOHID, yakni Karbohidrat (gr) per 100 gram Susu
MINERAL, yakni Mineral (gr) per 100 gram Susu
ENERGI, yakni Energi (KiloKalori) per 100 gram Susu

Merk Susu Lemak Karbohid Mineral Energi
OAT Quaker 11.00 57.00 0.96 370.00
Nestle Carnation 6.00 9.70 1.60 119.00
LIGO havemount 9.16 67.33 0.00 386.67
Ovaltine 8.40 75.00 1.28 416.00
Milo 10.00 66.00 4.50 400.00
Dancow Balita 23.67 44.67 4.67 476.67
Frisian Flag Instan 26.00 40.00 5.80 496.00
Frisian Flag Full Cream 28.00 38.40 5.60 506.00
Frisian Flag Cokelat 13.00 69.70 3.00 444.00
Frisian Flag Madu 18.00 52.80 5.00 459.00
Dancow Cokelat 110.00 65.25 4.50 425.00
Dancow Full Cream 25.90 40.33 5.92 495.80
Indomilk Full Cream 28.00 36.90 5.60 505.60
Indomilk Coklat 14.00 62.50 5.00 446.50
Prosteo rendah lemak 1.00 50.00 8.00 357.00
Anlene Kalsium Tinggi 0.80 48.80 5.70 340.00
Tropicana Slim 0.00 50.50 1.92 347.00
Protifar 1.00 27.80 7.20 366.00
Dari kasus tersebut, lakukan analisis gerombol dengan metode gerombol berhierarki dalam
mengelompokkan/ mengidentifikasi 18 merek tersebut berdasarkan kandungan dalam susu.
Langkah-langkah:
Tahap pada analisis gerombol.
1. Menilai perlunya melakukan transformasi data.
2. Analisis gerombol
Dari menu Analyze, pilih submenu Classify, lalu pilih hierarchical Cluster
seperti tampak dilayar
Gambar 4.1 Kotak dialog Hierarchical Cluster Analysis

Masukkan variabel lemak, karbohid, mineral, dan energi ke bagian VARIABLES.
Masukkan variabel susu ke bagian LABEL CASES BY.

Pada bagian CLUSTER akan dilakukan pengelompokkan untuk kasus (baris) atau
variabel (kolom). Oleh karena akan dilakukan pengelompokkan berdasarkan kasus
(merk susu), maka pilih cases.
Pada bagian DISPLAY atau tampilan yang akan ditampilkan pada output, meliputi
pilihan Statistik yang relevan dan Plot (grafik), pilih (aktifkan) keduanya.
Klik icon STATISTICS.. sehingga tampak di layar:
Gambar 4.2 Kotak dialog Hierarchical Cluster Analysis-Statistics
Pada kotak dialog diatas, klik Agglomeration., selanjutnya aktifkan pula:

o Kotak Proximity matrix. Pilihan ini berfungsi untuk menampilkan jarak
antar variabel.
o Pada bagian Cluster Membership, klik Range of solution, dan ketik 2 pada
Minimum number of cluster dan ketik 4 pada Maximum number of cluster.
Hal ini berarti output yang akan ditampilkan dalam pengelompokkan dengan
dalm bentuk susunan 2, 3, dan 4 cluster.
o Tekan CONTINUE.
Pada bagian PLOTS, aktifkan Dendogram dan pada bagian ICICLE pilih None:
Gambar 4.3 Kotak dialog Hierarchical Cluster Analysis-Plots

Abaikan bagian lain, dan tekan CONTINUE untuk kembali ke kotak dialog utama.

Klik icon METHOD , sehingga tampak dilayar
Gambar 4.4 Kotak dialog Hierarchical Cluster Analysis-Method

Pada bagian Cluster Method, pilih Between-groups linkage. Perintah ini menjukkan
metode yang dipakai dalam mengelompokkan sebuah objek/kasus.
Pada bagian Measure, pilih Square Euclidean distance.
Pada Transform Value, pilih Z Score.
NB: Transformasi dilakukan karena adanya perbedan besar pada satuan data. Transformasi tidak perlu
dilakukan jika data tidak ada perbedaan yang besar sehingga dalam hal ini, pilih None.
Abaikan bagian lain, dan tekan CONTINUE, selanjutnya OK.
Output:
Case Processing Summarya
Cases
Valid Missing Total
N Percent N Percent N Percent
18 100.0% 0 .0% 18 100.0%
a. Squared Euclidean Distance used
Tabel pada output pertama menjelaskan bahwa data yang ada (valid) sebanyak 18 yang telah
diproses tanpa ada data yang hilang.

Tabel tersebut menyatakan matrix promity yang menerangkan jarak (distance) antara dua
buah variabel. Langkah awal dalam pengelompokkan adalah melakukan pengukuran
terhadap kesamaan (similarity) antar variabel, sesuai cluster untuk mengelompokkan
variabel yang sama (similar). Ukuran jarak yang digunakan adalah jarak Euclidean. Pada
kasus merk susu OAT Quaker dan susu Nestle Carnation, besarnya jarak keduanya adalah
15,758, sedangkan jarak susu OAT Quaker dengan susu LIGO Havermout adalah 0,608. Hal
ini berarti susu OAT Quaker lebih mirip (similar) dalam karakteristiknya (lemak, energi,
karbohidrat dan energi) dengan susu LIGO, namun berbeda jauh dengan susu Nestle.
Demikian seterusnya, untuk penafsiran data yang lain, dengan acuan semakin kecil angka
antar dua kasus, makin mirip satu sama lain.
Agglomeration Schedule
Stage Cluster First

Cluster Combined Appears
Stage Cluster 1 Cluster 2 Coefficients Cluster 1 Cluster 2 Next Stage
1 7 12 .003 0 0 3
2 8 13 .008 0 0 3
3 7 8 .058 1 2 8
4 6 10 .352 0 0 8
5 5 14 .376 0 0 9
6 1 17 .593 0 0 11
7 3 4 .638 0 0 11
8 6 7 .803 4 3 14
9 5 9 .855 5 0 13
10 15 16 1.075 0 0 12
11 1 3 1.775 6 7 13
12 15 18 2.031 10 0 14
13 1 5 3.057 11 9 15
14 6 15 4.340 8 12 15
15 1 6 6.611 13 14 16
16 1 11 17.896 15 0 17
17 1 2 22.575 16 0 0

Tabel diatas menujukkan hasil proses/ tahap-tahap pengelompokkan dengan metode
Between group linkage.
Pada tahap 1 (baris 1), terbentuk satu kelompok dengan anggota susu 7 (Frisian Flag
Instan) dengan susu 12 (Dancow Full Cream) dengan nilai koefisien 0,003237 yang
menyatakan jarak antara susu Frisian Plag Instan dengan susu Dancow Full Cream (lihat
matrix proximity). Karena proses agglomerasi dimulai dengan dua variabel terdekat,
maka jarak kedua variabel tersebut adalah yang terdekat dari sekian banyak kombinasi
jarak dari 18 merk susu yang ada.
Jika dilihat pada kolom 7 (Next Stage) terdapat angka 3 yang menjelaskan langkah
pengelompokkan selanjutnya dilakukan dengan melihat stage 3 atau baris 3. Pada baris 3,
terdapat merk susu 7 (Frisian Flag Instan) yang membentuk kelompok dengan merk susu
8 ( Frisian Flag Full Cream). Dengan demikian, terdapat Satu kelompok yang terdiri dari
3 merk susu, yakni Frisian Flag Instan, Dancow Full Cream, dan Frisian Flag Full
Cream. Demikian seterusnya dari stage 3 proses dilanjutkan ke stage 8, dari stege 8 ke
stage 14 dan selanjutnya sampai ke stage terakhir yakni stage 17. Jika angka pada Next
Stage menunjukkan angka 0, berarti proses cluster untuk jalur tersebut telah selesai, dan
cluster dilanjutkan ke tahapan awal pada stage yang belum dikelompokkan.
Cluster Membership
Case 4 Clusters 3 Clusters 2 Clusters

1:OAT Quak 1 1 1
2:Nestle C 2 2 2
3:LIGO hav 1 1 1
4:Ovaltine 1 1 1
5:Milo 1 1 1
6:Dancow B 3 1 1
7:Frisian 3 1 1
8:Frisian 3 1 1
9:Frisian 1 1 1
10:Frisian 3 1 1
11:Dancow C 4 3 1
12:Dancow F 3 1 1
13:Indomilk 3 1 1
14:Indomilk 1 1 1
15:Prosteo 3 1 1
16:Anlene K 3 1 1
17:Tropican 1 1 1
18:Protifar 3 1 1
Tabel di atas adalah perincian anggota tergantung jumlah cluster yang terbentuk:
Jika ditentukan 4 kelompok yang akan dibentuk, maka diperoleh:
o Anggota kelompok 1 adalah merk susu dengan tanda 1, yakni OAT, LIGO, Ovaltine,
Milo, Frisian Flag Cokelat, Indomilk Cokelat, dan Tropicana Slim.
o Anggota kelompok 2 adalah merk susu dengan tanda 2, yakni susu Nestle Carnation.

o Anggota kelompok 3 adalah merk susu dengan tanda 3, yakni susu Dancow Balita,
Frisian Flag Instan, Frisian Flag Instan, Frisian Flag Full Cream, Frisian Flag Madu,
Dancow Full Cream, Indomilk Fuul Cream, Prosteo, Anlene, dan Protifar.
o Anggota kelompok 4 adalah merk susu dengan tanda 4, yakni susu Dancow Cokelat.
o Anggota kelompok 3 adalah susu Dancow Cokelat.
o Anggota kelompok 2 adalah Nestle Carnation.
o Anggota kelompok 1 adalah 16 merk susu di luar merk susu di atas.
o Anggota kelompok 2 adalah susu Nestle Carnation
o Anggota kelompok 1 adalah 17 merk susu di luar merk susu nestle.
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * *
* * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
Frisian 7
Dancow F 12
Frisian 8
Indomilk 13
Dancow B 6
Frisian 10
Prosteo 15
Anlene K 16
Protifar 18
Milo 5
Indomilk 14
Frisian 9
OAT Quak 1
Tropican 17
LIGO hav 3
Ovaltine 4
Dancow C 11
Nestle C 2

Berdasarkan pada dendogram diatas, dapat diketahui untuk merk susu 7, 12, 8, 13, 6, dan 10
membentuk kelompok tersendiri, karena masing-masing memiliki panjang garis yang sama
dan tergabung menjadi satu kesatuan. Demikian hal, dengan merk susu 5, 14, dan 9 juga
membentuk kelompok tersendiri. Juga merk susu 1 dan 17, serta merk susu 3 dan 4.
Sebaliknya, merk susu 15, 16, 18, 11, dan 2 tidak bergabung dengan variabel lain, karena
memiliki garis yang lebih panjang dari merk susu sebelumnya diatas. Dengan demikian,
pada proses pertama pada skala 0 telah terbentuk 9 kelompok yakni 4 kelompok yang
mempunyai anggota lebih dari satu merk susu dan 5 kelompok yang memiliki kelompok
tersendiri. Demikian untuk skala berikutnya.
Dendogram berguna untuk menunjukkan anggota kelompok yang ada jika akan ditentukan
berapa kelompok yang seharusnya terbentuk.
Kesimpulan:
Dalam pengelompokkan, anggota sebuah kelompok memiliki kemiripan satu dengan yang
lain, dan antara kelompok satu dan lainnya memiliki perbedaan.
4.4 Tugas Praktikum
1. Lakukan analisis gerombol berhierarki dengan berbagai metode (stambuk ganjil:

metode pautan tunggal dan pautan lengkap; stambuk genap metode pautan rataan dan
metode Ward) untuk mengelompokkan kecamatan yang berada di Kab. Lampung
Selatan berdasarkan pendapatan dari beberapa sektor ekonomi. Bandingkan hasil yang
diperoleh melalui berbagai metode tersebut kemudian berikan Kesimpulan.
Sektor Ekonomi
Kecamatan Kode Pertanian Industri Perbankan Jasa
(X1) (X2) (X3) (X4)
Katibung KTB 82.5 2.7 9.1 5.7
Tanjung Bintang TJB 63.3 2.7 54.5 6.5
Kota Agung KAG 73.4 6.7 4.4 15.5
Wonosobo WSB 85.3 1.1 7.2 6.4
Cukuh Balak CBK 75.8 8.3 6.0 9.9
Pardasuka PDK 76.3 2.9 9.5 11.3
Pagelaran PLN 84.5 3.3 6.9 5.3
Pringsewu PGU 11.3 4.0 4.2 80.5
Kalianda KIA 42.8 2.2 20.1 34.9
Sidomulyo SMO 52.0 2.7 19.2 26.1
Sukoarjo SKO 76.0 2.6 8.5 10.9
Gadingrejo GRJ 68.1 5.1 11.9 14.9
Kedondong KDD 88.0 2.7 3.3 6.0
Padangcermin PDC 89.2 5.8 2.0 3.0
Panengahan PNN 77.9 5.5 7.1 9.5
Palas PLS 81.1 3.8 4.3 10.8

Talang Padang TLP 67.8 2.8 16.3 13.1
Pulau Panggung PPG 89.3 0.9 4.6 5.2
Natar NTR 51.6 7.6 10.6 30.2
Gedong Tataan GDT 66.3 4.3 17.1 12.3
2. Berdasarkan hasil analisis komponen utama pada soal tugas praktikum 2 no. 2, lakukan
analisis gerombol untuk mengelompokkan data variabel yang ada.
PRAKTIKUM 5
ANALISIS GEROMBOL (2)

a. Menjelaskan konsep Analisis Gerombol non-Berhierarki
b. Menjelaskan langkah-langkah Analisis Gerombol non-Berhierarki pada Minitab
14.12 dan SPSS 13
c. Menginterpretasikan output Analisis Gerombol non-Berhierarki
5.2 Analisis Gerombol non-Berhierarki

Seperti halnya dalam analisis gerombol berhierarki, analisis gerombol non-
berhierarki ini bertujuan untuk mengelompokkan objek (kasus/elemen) dalam kelompok-
kelompok yang relatif homogen yang didasarkan pada suatu set / beberapa variabel yang
dipertimbangkan dalam penelitian. Namun dalam metode ini sedikit berbeda dalam
pengelompokkannya, dimana analisis gerombol non-berhierarki ini jumlah gerombol telah
ditentukan terlebih dahulu berdasarkan penelitian-penelitian sebelumnya atau pertimbangan-
pertimbangan peneliti. Metode penggerombolan takberhierarki, misalnya dengan cara
penyekatan (partitioning) dan penggunaan grafik. Sebagai contoh untuk metode
penggerombolan nonhierarki adalah metode K-Rataan Macqueen.
5.3 Contoh Kasus Analisis Gerombol non-Berhiearki

Terdapat 22 perusahaan yang bergerak di bidang jasa penyewaan di Amerika tahun
1975. Tujuannya adalah ingin memperoleh pengelompokkan perusahan-perusahan tersebut
berdasarkan 8 variabel, yakni: Fixed change coverage ratio (income/debt) (X1), Rate of
return on capital (X2), Cost per KW capacity in place (X3), Annual load factor (X4), Peak
kWh demand growth from 1974-1975 (X5), Sales (kWh use per year) (X6), Percent nuclear
(X7), dan Total fuel costs (X8). Berdasarkan penelitian sebelumnya, peneliti menentapkan
jumlah gerombol yang akan dibentuk sebanyak 2 gerombol. Berikut ini datanya:
No. Perusahaan X1 X2 X3 X4 X5 X6 X7 X8
1 A 1.1 9.2 151 54.4 1.6 9077 0 0.628
2 B 0.9 10.3 202 57.9 2.2 5088 25.3 1.555
3 C 1.4 15.4 113 53 3.4 9212 0 1.058
4 D 1 11.2 168 56 0.3 6423 34.3 0.7
5 E 4.5 8.8 192 51.2 1 3300 15.6 2.044
6 F 1.3 13.5 111 60 2.2 11127 22.5 1.241
7 G 1.2 12.2 175 67.6 2.2 7642 0 1.652
8 H 1.1 9.2 245 57 3.3 13082 0 0.309
9 I 1.3 13 168 60.4 7.2 8406 0 0.862
10 J 1.1 12.4 197 53 2.7 6455 39.2 0.623
11 K 0.8 7.5 173 51.5 6.5 17441 0 0.768
12 L 1.1 10.9 178 62 3.7 6154 0 1.897
13 M 1.2 12.7 199 53.7 6.4 7179 50.2 0.527
14 N 1.1 12 96 49.8 1.4 9683 0 0.588
15 O 1 7.6 164 62.2 -0.1 6468 0.9 1.4
16 P 1.2 9.9 252 56 9.2 15991 0 0.62
17 Q 0.8 6.4 136 61.9 9 5714 8.3 1.92
18 R 1.1 12.6 150 56.7 2.7 10140 0 1.108
19 S 1.2 11.7 104 54 -2.1 13507 0 0.636
20 T 1.2 11.8 148 59.9 3.5 7287 41.1 0.702

21 U 1 8.6 204 61 3.5 6650 0 2.116
22 V 1.1 9.3 174 54.3 5.9 10093 26.6 1.306
Langkah-langkah:
Tahapan pada analisis gerombol non-berhierarki:
Dari menu Stat, pilih submenu Multivariat, lalu pilih Cluster K-Means seperti
tampak dilayar
Gambar 5.1 Kotak dialog Cluster K- Means

Masukkan semua variabel pada bagian VARIABLES yng akan dianalisis.
Pada bagian Specify Partition by, ketik 2 pada Number of cluster yang
menunjukkan berapa jumlah kelompok yang akan dibentuk dan pilih ceklist pada
Standardize variables yang menunjukkan dilakukan standarisasi pada data.
Klik icon STORAGE.. sehingga tampak di layar:
Gambar 5.2 Kotak dialog Cluster K-Means-Storage

Pada kotak dialog diatas ketik C9 pada Cluster membership column untuk
menyimpan hasil pengelompokkan.
Abaikan bagian lain, dan tekan OK, selanjutnya OK.
Output:

K-means Cluster Analysis: X1, X2, X3, X4, X5, X6, X7, X8
Standardized Variables
Final Partition
Number of clusters: 2
Within Average Maximum
cluster distance distance
Number of sum of from from
observations squares centroid centroid
Cluster1 10 55.036 2.264 3.353
Cluster2 12 82.711 2.455 4.939
Cluster Centroids
Grand
Variable Cluster1 Cluster2 centroid
X1 -0.1341 0.1117 -0.0000
X2 0.2957 -0.2464 0.0000
X3 -0.2885 0.2404 -0.0000
X4 -0.3805 0.3170 0.0000
X5 0.0343 -0.0286 0.0000
X6 0.8034 -0.6695 -0.0000
X7 -0.5806 0.4839 0.0000
X8 -0.5771 0.4809 0.0000
Distances Between Cluster Centroids
Cluster1 Cluster2
Cluster1 0.0000 2.3551
Cluster2 2.3551 0.0000

Interpretasi:
Pada output diatas, dapat diketahui bahwa analisis dilakukan dengan melakukan standarisasi
variabel dengan jumlah kelompok yang dibentuk sebanyak 2 kelompok. Banyaknya objek
untuk kelompok 1 adalah 10 dengan jumlah kuadrat 55,036, rata-rata jarak masing-masing
anggota kelompok terhadap titik pusat sebesar 2,264 serta jarak maksimum objek dengan
titik pusatnya sebesar 3,353. Demikian halnya untuk kelompok 2, banyaknya objek adalah
12 dengan jumlah kuadrat 82,711, rata-rata jarak masing-masing anggota kelompok terhadap
titik pusat sebesar 2,455 serta jarak maksimum objek dengan titik pusatnya sebesar 4,939.
Selanjutnya, pada output terlihat titik tengah masing-masing kelompok dan matriks jarak
antar titik pust kelompok. Titik tengah kelompok 1 untuk variabel X1 adalah -0,1341 dan
kelompok 2 adalah 0,1117, demikian seterusnya. Sedangkan matriks jarak antar titik pusat
kelompok 1 dan kelompok 2 sebesar 2,3551. Pada output yang menampilkan Worksheet,
terlihat pada kolom C9 menunjukkan pengelompokkan perusahaan-perusahan berdasarkan 8
variabel tersebut. Adapun hasil pengelompokkan:
o Kelompok 1 terdiri dari 10 perusahaan yakni perusahaan A, C, F, H, I K, N, P, R, dan
S.
o Kelompok 2 terdiri dari 12 perusahaan yakni perusahaan B, D, E, G, J, L, M, O, Q, T,
U, dan V.
5.4 Tugas Praktikum
1. Berdasarkan soal praktikum 2 pada soal no.1, Lakukan pengelompokkan 20 Surat
Kabar Harian di Jakarta tahun 1995 kedalam 2 kelompok berdasarkan rataan
persentase jenis berita yang dimuat oleh Surat Kabar Harian tersebut.
Interpretasikan dan berikan Kesimpulan.
2. Berdasarkan data contoh kasus pada praktikum 6 yakni data hasil penelitian
pengaruh perubahan lingkungan terhadap tekanan darah dengan 10 variabel yang
diteliti, lakukan pengelompokkan 35 pria tersebut dengan metode K-Means ke
dalam 2 kelompok berdasarkan variabel-variabel tersebut. Interpretasikan dan
berikan Kesimpulan.

PRAKTIKUM 6
ANALISIS DISKRIMINAN

a. Menjelaskan konsep Analisis Diskriminan
b. Menjelaskan langkah-langkah Analisis Diskriminan pada Minitab 14.12 dan SPSS 13
c. Menginterpretasikan output Analisis Diskriminan
6.2 Analisis Diskriminan
Analisis diskriminan merupakan suatu analisis dengan tujuan membentuk sejumlah

fungsi melalui kombinasi linier peubah-peubah asal yang dapat digunakan sebagai cara
terbaik untuk memisahkan kelompok-kelompok atau individu. Fungsi yang terbentuk
melalui analisis ini disebut sebagai fungsi diskriminan. Fungsi diskriminan ini dapat
digunakan untuk menerangkan perbedaan antar kelompok atau menerjemahkan ciri atau
karakteristik kelompok dan dapat pula digunakan dalam masalah klasifikasi. Pada awal
proses, pembentukan fungsi diskriminan dilakukan dengan anggapan bahwa terdapat
beberapa kelompok yang telah dikelompokkan terlebih dahulu (minimal dua), kemudian
memperhatikan kriteria yang digunakan yakni memberikan nilai sedekat mungkin pada suatu
individu dalam kelompok dan memberikan sejauh mungkin antar kelompok.
6.3 Contoh Kasus Analisis Diskriminan
Dari hasil penelitian pengaruh perubahan lingkungan terhadap tekanan darah dengan
10 variabel yang diteliti diperoleh hasil pengelompokkan sebagaimana tertera pada kolom 12
data di bawah ini. Selanjutnya akan dilakukan analisis diskriminan untuk mengetahui apakah
ada kesalahan dalam penempatan kelompok pengamatan. Kelompok yang dibentuk sebanyak
2 kelompok dan datanya disajikan sebagai berikut:
No. USIA Umur Berat Tinggi Dagu Lengan Betis Nadi Sistolik Diastolik K

Obs
Migrasi Badan Badan Bawah
1 21 1 71 1629 8 7 12.7 88 170 76 1
2 22 6 56.5 1569 3.3 5 8 64 120 60 2
3 24 5 56 1561 3.3 1.3 4.3 68 125 75 2
4 24 1 61 1619 3.7 3 4.3 52 148 120 1
5 25 1 65 1566 9 12.7 20.7 72 140 78 2
6 27 19 62 1639 3 3.3 5.7 72 106 72 1
7 28 5 53 1494 7.3 4.7 8 64 120 76 2
8 28 25 53 1568 3.7 4.3 0 80 108 62 1
9 31 6 65 1540 10.3 9 10 76 124 70 2
10 32 13 57 1530 5.7 4 6 60 134 64 2
11 33 13 66.5 1622 6 5.7 8.3 68 116 76 2
12 33 10 59.1 1486 6.7 5.3 10.3 72 114 74 2
13 34 15 64 1578 3.3 5.3 7 88 130 80 1
14 35 18 69.5 1645 9.3 5 7 60 118 68 1
15 35 2 64 1648 3 3.7 6.7 60 138 78 1
16 36 12 56.5 1521 3.3 5 11.7 72 134 86 2
17 36 15 57 1547 3 3 6 84 120 70 2
18 37 16 55 1505 4.3 5 7 64 120 76 2
19 37 17 57 1473 6 5.3 11.7 72 114 80 2
20 38 10 58 1538 8.7 6 13 64 124 64 2
21 38 18 59.5 1513 5.3 4 7.7 80 114 66 2
22 38 11 61 1653 4 3.3 4 76 136 78 1
23 38 11 57 1566 3 3 3 60 126 72 2
24 39 21 57.5 1580 4 3 5 64 124 62 1
25 39 24 74 1647 7.3 6.3 15.7 64 128 74 1
26 39 14 72 1620 6.3 7.7 13.3 68 134 92 1
27 41 25 62.5 1637 6 5.3 8 76 112 80 1
28 41 32 68 1528 10 5 11.3 60 128 82 1
29 41 5 63.4 1647 5.3 4.3 13.7 76 134 92 1
30 42 12 68 1605 11 7 10.7 88 128 90 1
31 43 25 69 1625 5 3 6 72 140 72 1
32 43 26 73 1615 12 4 5.7 68 138 74 1
33 43 10 64 1640 5.7 3 7 60 118 66 2
34 44 19 65 1610 8 6.7 7.7 74 110 70 2
35 44 18 71 1572 3 4.7 4.3 72 142 84 2
Langkah-langkah:
Tahapan pada analisis diskriminan:
Dari menu Stat, pilih submenu Multivariat, lalu pilih Discriminant Analysis
seperti tampak dilayar

Gambar 6.1 Kotak dialog Discriminant Analysis
Masukkan variable Kelompok dalam Groups
Masukkan semua variable pada bagian Predictors.
Discriminant Analysis: Kelompok versus Usia, Umur Migrasi, ...
Pada bagian Discriminant Function pilih Linear. .
Linear Method for Response: Kelompok
Predictors: Usia, Umur Migrasi, Berat Badan, Tinggi Badan, Dagu, Lengan Bawah,
Abaikan bagian lain, selanjutnya OK.
Betis, Nadi, Sistolik, Diastolik
Output:
Group 1 2
Count 17 18
Summary of classification
True Group
Put into Group 1 2
1 16 1
2 1 17
Total N 17 18
N correct 16 17
Proportion 0.941 0.944
N = 35 N Correct = 33 Proportion Correct = 0.943
Squared Distance Between Groups
1 2
1 0.0000 11.2013
2 11.2013 0.0000
Linear Discriminant Function for Groups
1 2
Constant -2044.1 -1852.0
Usia -3.5 -3.2
Umur Migrasi 11.2 10.5
Berat Badan -14.8 -14.3
Tinggi Badan 2.4 2.3
Dagu 14.3 13.6
Lengan Bawah -2.3 -1.7
Betis 4.8 4.5
Nadi 2.5 2.4
Sistolik 3.9 3.7
Diastolik 3.2 3.0
Summary of Misclassified Observations
True Pred Squared

Observation Group Group Group Distance Probability
11** 2 1 1 6.915 0.502
Laboratorium
2 6.933 Komputasi
0.498 Vokasi 40
15** 1 2 1 Program
12.163 Pendidikan
0.130 Vokasi
2 8.360 0.870
Interpretasi:
Pada output diatas, dapat diketahui pada bagian pertama output memberikan informasi
metode analisis yang digunakan yakni metode linier dengan variabel responnya adalah
kelompok dan variabel prediktornya adalah usia, lama migrasi, berat, tinggi badan, dagu,

lengan bawah, betis, nadi, sistolik, dan diastolik. Selanjutnya output bagian kedua
menunjukkan jumlah kelompok pengamatan yakni kelompok 1 berjumlah 17 pengamatan
dan kelompok 2 berjumlah 18 pengamatan. Output bagian ketiga adalah tabel Summary of
Classification yang menampilkan informasi penempatan data. Terlihat bahwa pada kelompok
1, pengamatan yang telah dikelompokkan dengan benar ada 16 pengamatan dengan
persentase sebesar 94,1%. Hal ini berarti terdapat 1 pengamatan yang kurang tepat dari total
data 17 pengamatan. Sedangkan pada kelompok 2, pengamatan yang telah dikelompokkan
dengan benar ada 17 pengamatan dengan persentase sebesar 94,4%. Hal ini juga
menunjukkan terdapat 1 pengamatan yang kurang tepat dari total data 18 pengamatan.
Selanjutnya, pada output bagian keempat menerangkan jarak kuadrat antar kelompok.
Terlihat jarak kuadrat kelompok 1 dan kelompok 2 adalah 11.2013.
Dari hasil analisis dapat diketahui fungsi disriminan linier yang terbentuk untuk tiap
kelompok yakni:
o d1= -2044,1 3,5 usia + 11,2 umur migrasi 14,8 berat badan + 2,4 tinggi badan + 14,3
dagu 2,3 lengan bawah + 4,8 betis + 2,5 nadi + 3,9 sistolik + 3,2 diastolik.
o d2= -1852,0 3,2 usia + 10,5 umur migrasi 14,3 berat badan + 2,3 tinggi badan + 13,6
dagu 1,7 lengan bawah + 4,5 betis + 2,4 nadi + 3,7 sistolik + 3,0 diastolik.
Output pada bagian terakhir menujukkan pengamatan yang penempatannya salah. Terlihat
terdapat pengamatan 11 dan pengamatan 15 yang kurang tepat. Penempatan yang benar
terlihat untuk pengamatan 11 berada pada kelompok 1 dengan probability sebesar 0,502
sedangkan untuk pengamatan 15, penempatan yang benar berada pada kelompok 2 dengan
probability sebesar 0,870.
6.4 Tugas Praktikum
1. Dari hasil contoh kasus analisis gerombol non-berhierarki pada praktikum 5, lakukan
analisis diskriminan untuk mengetahui apakah ada kesalahan dalam penempatan
kelompok pengamatan pada kasus 22 perusahaan yang bergerak di bidang jasa
penyewaan di Amerika tahun 1975. Interpretasikan!
2. Dari hasil tugas praktikum 5, lakukan analisis diskriminan untuk mengetahui apakah
ada kesalahan dalam penempatan kelompok pengamatan pada kasus 20 Surat Kabar
Harian di Jakarta tahun 1995 (soal no. 1 untuk stambuk ganjil; catatan: variabel X6
tidak dimasukkan) dan data hasil penelitian pengaruh perubahan lingkungan terhadap

tekanan darah dengan 10 variabel yang diteliti (soal no. 2 untuk stambuk genap).
Interpretasikan!
PRAKTIKUM 8
ANALISIS KORESPONDENSI (1)

a. Menjelaskan konsep Analisis Korespondensi Sederhana
b. Menjelaskan langkah-langkah Analisis Korespondensi Sederhana pada Minitab 14.12
dan SPSS 13
c. Menginterpretasikan output Analisis Korespondensi Sederhana
8.2 Analisis Korespondensi Sederhana
Dalam penelitian bidang sosial seperti penelitian pemasaran, data yang telah
dikumpulkan sering ditampilkan dalam bentuk tabel kontingensi dwi arah (cross
tabulation) yang berisi informasi tentang frekuensi atau persentase dari kategori-kategori
penyusunnya. Dari tabel tersebut, salah satu informasi yang ingin diketahui pada umumnya
adalah ada tidaknya keterkaitan antar kategori. Untuk menguji kebebasan ini statistik uji
yang sering digunakan adalah Khi-Kuadrat (Chi-Square). Bila antar kategori tersebut tidak
saling terkait (bebas), dapat diartikan besarnya frekuensi (nilai) profit pada satu kategori
tidak dipengaruhi oleh profil pada kategori lainnya. Akan tetapi bila kebebasan antar
kategori tersebut tak dapat dibuktikan, maka hal yang selalu ingin diketahui adalah profil-
profil mana yang saling terkait tersebut. Untuk mengetahui hal ini diperlukan analisis
lanjutan guna membandingkan antar profil.
Analisis koespondensi yang tergolong dalam analisis eksplorasi data peubah ganda
(exploratory multivariate data analysis), di samping dapat digunakan untuk melihat secara
visual ada tidaknya ketergantungan antar kategori tersebut, juga sekaligus dapat membantu
melihat kedekatan (keterkaitan) suatu profil dari satu kategori terhadap profil dari kategori
lainnya. Dalam prosesnya, analisis korespondensi akan menguraikan struktur data tabel
kontingensi, menjadi komponen baris dan kolom. Hasil dari analisis ini kemudian akan

ditampilkan dalam bentuk gambar dua dimensi dengan menumpangtindihkan (overlay)
antara profil-profil baris dan kolom.
8.3 Contoh Kasus Analisis Korespondensi Sederhana

Sebuah survei ingin melihat hubungan antara tingkat pendapatan dengan kepuasan
kerja. Tabulasi silang antara tiga kategori pendapatan dan empat kategori kepuasan kerja,
sebagai berikut:
Kepuasan Kerja
Pendapatan
Sangat Tidak Puas Tidak Puas Puas Sangat Puas
<$25,000 42 62 184 207
$25,000-$50,000 13 28 81 113
>$50,000 7 18 54 92
Pengolahan data:
1. Data disiapkan dalam workshet sebagai berikut:
Gambar 8.1 Data yang disajikan dalam worksheet

Data disiapkan dalam sebuah tabel kontingensi, ditambah satu kolom yang berisi
keterangan dan kategori peubah yang menjadi kolom.
2. Pilih stat tables Simple coorespondence analysis, akan muncul kotak dialog:
Gambar 8.2 Kotak dialog Simple Correspondence Analysis

Input data: pilihan tipe data yang akan dimasukan

- Categorical variables: data yang dimasukkan berupa data kategori. Kemudian
ditambah dua kolom lagi untuk mendefinisikan nama kategori pada masing-
masing peubah. MINITAB akan membentuk tabel kontingensi dari input data.
Data yang dimasukkan bisa berupa teks atau numerik.
- Columns of a contingency table: masukkan data sebagai kolom dari suatu
tabel kontingensi. Setiap kolom worksheet mewakili satu kolom dari tabel
kontingensi. Nilai yang dimasukkan 0 .
Row Names: Masukan kolom yang berisi nama kategori baris dari tabel
kontingensi.
Columns Names : Masukkan kolom yang berisi nama kategori kolom dari tabel
kontingensi.
Number of components : Masukkan banyaknya komponen yang dihitung.
Banyaknya komponen maksimal sama dengan derajat bebas dari tabel kontingensi
((jumlah kolom1) x (jumlah baris-1)).
Combine : menu ini akan aktif jika data yang dimasukkan berupa data mentahnya.
Digunakan untuk mendefinisikan bentuk dari tabel kontingensi.
Supp Data : digunakan untuk mendefinisikan peubah tambahan disamping peubah
utama yang akan dianalisis.
Results : merupakan pilihan untuk menentukan output analisis korespondensi. Beri
tanda pada pilihan yang sesuai. Kotak dialognya sebagai berikut :
Gambar 8.3 Kotak dialog Simple Correspondence Analysis - Results

Graph : merupakan pilihan untuk menampilkan secara visual hubungan antar
kategorik dalam grafik. Kotak dialognya sebagai berikut :

Gambar 8.4 Kotak dialog Simple Correspondence Analysis - Graph
-Axis pairs for all plots (Y then X) : definisikan dua komponen yang akan dibuat
plot datanya.
-Show supplementary points in all plots : merupakan pilihan untuk menampilkan
peubah tambahan (jika ada) dalam grafik.
-Plots : pilihan untuk menampilkan hasil plot. Beri pada pilihan yang sesuai.
Kemudian klik OK
Storage : merupakan pilihan untuk menyimpan hasil analisis ke dalam kolom-
kolom worksheet.
Selanjutnya klik OK.Outputnya sebagai berikut :
Simple Correspondence Analysis: Sangat Tidak Puas; Tidak Pas; Puas; Sangat Puas
Contingency Table
Sangat T Tidak Pu Puas Sangat P Total

<$25,000 42 62 184 207 495
$25,000- 13 28 81 113 235 Tabel kontingensi
>$50,000 7 18 54 92 171
Total 62 108 319 412 901
Row Profiles
Sangat T Tidak Pu Puas Sangat P Mass

<$25,000 0,085 0,125 0,372 0,418 0,549
$25,000- 0,055 0,119 0,345 0,481 0,261 Profil baris dan
>$50,000 0,041 0,105 0,316 0,538 0,190
Mass 0,069 0,120 0,354 0,457 Profil kolom
Column Profiles
Sangat T Tidak Pu Puas Sangat P Mass

<$25,000 0,677 0,574 0,577 0,502 0,549
$25,000- 0,210 0,259 0,254 0,274 0,261
>$50,000 0,113 0,167 0,169 0,223 0,190
Mass 0,069 0,120 0,354 0,457

Expected Frequencies
Sangat T Tidak Pu Puas Sangat P Tabel frekuensi
<$25,000 34,06 59,33 175,26 226,35 harapan
$25,000- 16,17 28,17 83,20 107,46
>$50,000 11,77 20,50 60,54 78,19
Observed - Expected Frequencies

Selisih nilai
Sangat T Tidak Pu Puas Sangat P pengamatan
<$25,000 7,94 2,67 8,74 -19,35
$25,000- -3,17 -0,17 -2,20 5,54 dengan nilai harapan
>$50,000 -4,77 -2,50 -6,54 13,81
Chi-Square Distances

<$25,000 1,850 0,120 0,436 1,654 4,060 Jarak khi
$25,000- 0,622 0,001 0,058 0,286 0,967 kuadrat
>$50,000 1,931 0,304 0,707 2,438 5,380
Total 4,403 0,425 1,202 4,378 10,407
Relative Inertias

<$25,000 0,178 0,012 0,042 0,159 0,390 Nilai inersia
$25,000- 0,060 0,000 0,006 0,027 0,093 relatif
>$50,000 0,186 0,029 0,068 0,234 0,517
Total 0,423 0,041 0,115 0,421 1,000
Analysis of Contingency Table

Besarnya keragaman yang
Axis Inertia Proportion Cumulative Histogram
1 0,0114 0,9902 0,9902 diterangkan oleh
****************************** masing2
2 0,0001 0,0098 1,0000 komponen
Total 0,0116
Row Contributions
----Component 1---- ----Component 2----

ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr
1 <$25,000 1,000 0,549 0,390 -0,090 0,999 0,393 0,003 0,001 0,057
2 $25,000- 1,000 0,261 0,093 0,062 0,932 0,087 -0,017 0,068 0,652
3 >$50,000 1,000 0,190 0,517 0,177 0,995 0,519 0,013 0,005 0,291
Column Contributions
----Component 1---- ----Component 2----

ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr
1 Sangat T 1,000 0,069 0,423 -0,265 0,990 0,423 0,027 0,010 0,444
2 Tidak Pu 1,000 0,120 0,041 -0,060 0,916 0,038 -0,018 0,084 0,352
3 Puas 1,000 0,354 0,115 -0,061 0,992 0,116 -0,006 0,008 0,100
4 Sangat P 1,000 0,457 0,421 0,103 0,998 0,424 0,005 0,002 0,105
Kontribusi keragaman
masing-masing baris dan
kolom terhadap masing-
masing komponen

Gambar 8.5 Plot data komponen pertama dan komponen kedua analisis korespondensi
Berdasarkan gambar diatas, dapat diketahui ada tidaknya keterikatan antar kategori
secara visual, serta kedekatan antar profil dari masing-masing kategori yang dapat
menunjukkan ada tidaknya ciri khas (dominasi) suatu profil dari satu kategori terhadap profil
lain (kategori lain) dapat diketahui. Jika dua kategori peubah yang sama terletak berdekatan,
maka dikatakan memiliki profil yang sama dan jika sebuah kategori peubah terletak
berdekatan dengan kategori peubah lain, maka ada asosiasi (kecenderungan).
8.4 Tugas Praktikum
1. Tabel kontingensi berikut ini memperlihatkan keterkaitan antara bidang pekerjaan dan
jenjang pendidikan seseorang:
Bidang Jenjang Pendidikan
Total
Pekerjaan SD SMP SMA PT
Pertanian 1200 500 400 200 2300
Industri 400 400 700 400 1900
Jasa 600 300 600 1000 2500
Properti 400 400 300 700 1800
Listrik 300 400 350 450 1500
Total 2900 2000 2350 2750 10000

Dari tabel tersebut ingin diketahui bagaimana hubungan atau asosiasi antara bidang
pekerjaan dengan pendidikan seseorang. Lakukan analisis korespondensi sederhana pada
data tersebut! Interpretasikan!
2. Carilah satu contoh kasus yang berkaitan dengan analisis korespondensi sederhana
kemudian lakukan analisis terhadap kasus tersebut dan interpretasikan! (Sumber data
atau rujukan disertakan dalam soal)

PRAKTIKUM 9
ANALISIS KORESPONDENSI (2)

a. Menjelaskan konsep Analisis Korespondensi Berganda
b. Menjelaskan langkah-langkah Analisis Korespondensi Berganda pada Minitab 14.12 dan
SPSS 13
c. Menginterpretasikan output Analisis Korespondensi Berganda
9.2 Contoh Kasus Analisis Korespondensi Berganda

Data kecelakaan dikategorikan ke dalam jenis kecelakaan (collision/rellover), tingkat
kerusakannya (nosevere/severe), tabrak lari/tidak (ejct/ no eject), serta ukuran mobil
(small/standard). Data sebagai latihan dapat di ambil dari contoh yang terdapat dalam
MINITAB (Exh_tabl.MTW). Langkah analisisnya sebagai berikut:
Gambar 9.1 Langkah-langkah analisis korespondensi berganda.

Muncul kotak dialog sebagai berikut
Gambar 9.2 Kotak dialog Multyple Correspondence Analysis

Input Data:
Categorical variables: data yang dimasukkan berupa data kategorik.
Data yang dimasukkan berupa data koding (dalam bentuk numerik)
Indicator variables: data yang dimasukkan berupa 0 atau 1 untuk masing-masing
kategori.
Categori names: masukkan kolom yang berisi nama kategori dan urutannya
disesuaikan dengan urutan kategorik pada masing-masing peubah.
Number of components: Masukkan banyaknya komponen yang dihitung. Banyaknya
komponen maksimal sama dengan derajat bebas dari tabel kontingensi ((jumlah kolom-
1) x (jumlah baris-1)).
Supp Data : digunakan untuk mendefinisikan peubah tambahan disamping peubah
utama yang akan dianalisis.
Results: merupakan pilihan untuk menentukan apakah outputnya berupa matriks burt
atau matriks indikator. Beri tanda pada pilihan yang sesuai.
Graph: merupakan pilihan untuk menyimpan hasil koordinat dari masing-masing
komponen ke dalam kolom-kolom worksheet.
Setelah itu klik OK. Hasil outputnya sebagai berikut:

Gambar 9.3 Plot data komponen pertama dan komponen kedua analisis korespondensi
Berdasarkan gambar diatas, dapat diketahui ada tidaknya keterikatan antar kategori
secara visual, serta kedekatan antar profil dari masing-masing kategori yang dapat
menunjukkan ada tidaknya ciri khas (dominasi) suatu profil dari satu kategori terhadap profil
lain (kategori lain) dapat diketahui. Jika dua kategori peubah yang sama terletak berdekatan,
maka dikatakan memiliki profil yang sama dan jika sebuah kategori peubah terletak
berdekatan dengan kategori peubah lain, maka ada asosiasi (kecenderungan).
9.3 Tugas Praktikum

1. Berikut ini adalah sebagian hasil dari Sakernas 2000 (Statistical Year Book of Indonesia
2000 ) tentang tingkat pendidikan angkatan kerja di Indonesia.
Tingkat
Total
Pendidikan 1 2 3 4 5
Tidak pernah 1795875 2332315 99283 1160724 1712085 7100282
Tidak tamat SD 4328393 4553937 202695 2716353 3441590 15242968
SD 6938308 9192883 722334 8087096 8245387 33186008
SMP 3164258 2643773 409433 4923883 2853874 13995221
SMA 2211196 1510223 373657 6321111 1419259 11835446
SMK 543897 308828 83668 2954016 2998433 6888842
Diploma 105014 90540 44521 1683181 36043 1959299
S1/S2/S3 112063 91565 85274 1644967 84754 2018623
Total 19199004 20724064 2020865 29491331 20791425 92226689
Keterangan:
1 = Berusaha sebdiri tanpa bantuan orang lain.
2 = Berusaha dengan dibantu anggota rumah tangga.
3 = Employer
4 = Buruh / Karyawan / Employee
5 = Pekerja keluarga / family worker

Lakukan analisis korespondensi berganda pada data tersebut! Interpretasikan!
2. Carilah satu contoh kasus yang berkaitan dengan analisis korespondensi berganda
kemudian lakukan analisis terhadap kasus tersebut dan interpretasikan! (Sumber data
atau rujukan disertakan dalam soal)
PRAKTIKUM 10
ANALISIS MULTIVARIAT ANOVA (MANOVA)

a) Menjelaskan konsep Analisis Multivariat ANOVA (MANOVA)
b) Menjelaskan langkah-langkah Analisis Multivariat ANOVA pada Minitab 14.12
c) Menginterpretasikan output Analisis Multivariat ANOVA
10.2 Analisis Multivariat ANOVA (MANOVA)
Multivariat ANOVA atau sering disebut MANOVA digunakan apabila ada lebih dari
1 variabel respons. Tujuan MANOVA adalah menyelidiki kesamaan rata-rata suatu populasi
atau ingin mengetahui apakah ada perbedaan yang nyata pada variabel-variabel dependen
antar anggota variabel independen. Analisis ini bermanfaat untuk menganalisis variabel-
variabel tergantung lebih dari dua yang berskala interval atau rasio.

10.3 Contoh Kasus Analisis Multivariat ANOVA (MANOVA)
Berikut ini data mengenai hubungan lokasi tempat tinggal dengan gaji kepala keluarga
dan pendapatan anggota keluarga:
Lokasi Gaji kepala keluarga ($) Pendapatan anggota keluarga ($)
12403 12403
1 6500 6500
1500 15363
7000 7005
2 6200 6254
6217 6217
1920 1920
3 6990 6990
2600 26007
5926 6396
4 700 10600
4558 7832
Dari ketiga variable yaitu lokasi, gaji kepala keluarga, dan pendapatan keluarga, kita
ingin mengetahui apakah ada hubungan antara lokasi tempat tinggal dengan gaji kepala
keluarga dan pendapatan anggota keluarga.
Langkah-langkah:
1. Tahap input data.
1) Beri nama kolom C1 dengan Lokasi, kolom C2 Replikasi, kolom C3 Gaji KK
dan kolom C4 Pendapatn Keluarga.
2) Masukkan data dalam kolom C1, caranya ketikkan:
MTB > set C1 [enter]
DATA> (1:4)3 [enter]
DATA> end. [enter]
3) Masukkan data dalam kolom C2, caranya ketikkan:

MTB > set C2 [enter]
DATA> 3 1:4) [enter]
DATA> end. [enter]
4) Masukkan data dalam kolom C3 dan kolom C4 secara langsung melalui window
data.
2. Tahap analisis MANOVA

Dari menu Stat, pilih submenu ANOVA General MANOVA, sehingga tampak
dilayar
Gambar 10.1 Kotak dialog General MANOVA

Masukkan variable Gaji KK dan Pendapatan Keluarga ke dalam Responses.
Masukkan variable Lokasi, pada Model.
Pilihan pada Result digunakan untuk menampilkan hasil analisis MANOVA. Kotak
dialog yang muncul jika diklik Result.
Gambar
General Linear 10.2Gaji
Model: KotakKK,
dialog General MANOVA-
Pendapatan Results
Keluarga versus Lokasi
Beri tandaType
Factor ceklistLevels
di bawah Display of Results pada Univariate analysis of
Values
Lokasi fixed 4 1, 2, 3, 4
variance, kemudian klik OK.
Layar monitor
Analysis of akan memperlihatkan
Variance kembali
for Gaji KK, using kotak dialog
Adjusted SSGeneral MANOVA.
for Tests
Selanjutnya
Source DFOK Seq
, sehingga
SS muncul
Adj SS output
Adj sebagai
MS berikut:
F P
Lokasi 3 24621402 24621402 8207134 0.73 0.562
Error 8 89826753 89826753 11228344
Total 11 114448155
S = 3350.87 R-Sq = 21.51% R-Sq(adj) = 0.00%

Unusual Observations for Gaji KK
Obs Gaji KK Program
Fit SE Fit Residual Pendidikan Vokasi
St Resid
1 12403.0 6801.0 1934.6 5602.0 2.05 R
Gambar diatas menunjukkan output MANOVA dalam format teks pada window
Session. Dalam gambar diatas minitab menampilkan hasil analisis yang dibagi menjadi
beberapa bagian. Bagian pertama memberikan informasi factor yang digunakan dalam
analisis. Kita mengetahui ada 1 faktor yang dianalisis bernama lokasi dan memiliki 4 level
factor.
Bagian kedua memperlihatkan ANOVA untuk variable respons. Output
menampilkan ANOVA untuk tiap-tiap respons. Output adalah hasil permintaan pada tahap 5
agar menampilkan ANOVA untuk tiap respons. Interpretasi kedua ANOVA menunjukkan
bahwa factor lokasi tidak berpengaruh terhadap jumlah gaji kepala keluarga maupun
pendapatan keluarga. Analisis berdasarkan pada analisis univariat,yaitu ANOVA 1 variabel.
Output untuk MANOVA ditunjukkan dibagian bawah output. Beberapa criteria
digunakan untuk menguji apakah pengaruh lokasi keluarga cukup signifikan, yaitu Wilks
R denotes an observation with a large standardized residual.
lamda, Lawley-Hotelling,Pillais, dan Roys. Keempat criteria menunjukkan p-value
melebihi =0.05.
Analysis of Variance for Pendapatan
Oleh karena Keluarga,
itu, berdasarkan using Adjusted
hasil analisis SS for Tests
data,kesimpulan adalah lokasi
Source DF Seq SS Adj SS Adj MS F P
tempat tinggal3 tidak
Lokasi
berpengaruh
56425004
terhadap gaji kepala keluarga
56425004 18808335 0.40 0.754
dan pendapatan keluarga.
Error 8 372759462 372759462 46594933
Total 11 429184466
S = 6826.05 R-Sq = 13.15% R-Sq(adj) = 0.00%
Unusual Observations for Pendapatan Keluarga
Pendapatan
Obs Keluarga Fit SE Fit Residual St Resid
9 26007.0 11639.0 3941.0 14368.0 2.58 R
R denotes an observation with a large standardized residual.
MANOVA for Lokasi

s = 2 m = 0.0 n = 2.5
Test DF
Criterion Penuntun
Statistic Praktikum Analisis Data
F Num Denom P Multivariat
Wilks' Laboratorium
0.67822 0.500 6 Komputasi
14 0.798 Vokasi 56
Lawley-Hotelling 0.43197 0.432 Program Pendidikan Vokasi
6 12 0.844
Pillai's 0.35058 0.567 6 16 0.751
Roy's 0.28062
10.4 Tugas Praktikum
1. Suatu perusahaan sedang menganalisa media iklan yang digunakan untuk promosi
produk perusahaan-perusahaan pesaingnya. Ada tiga media yang digunakan yaitu
media 1, media 2, serta media 3. Ada tiga respon yang diamati yaitu tingkat
pengetahuan yang diperoleh, ketertarikan akan iklan tersebut, serta harga iklan. Data
yang diperoleh sebagai berikut:
Median Pengetahuan Ketertarikan Harga

6 8 97
5 1 60
3 5 75
1
6 1 71
7 13 83
4 13 84
14 1 53
14 4 73
10 3 83
2
7 1 97
5 13 99
12 3 97
14 5 65
4 5 62
3 7 84
3
5 12 62
6 5 67
7 13 69

Lakukan analisis MANOVA untuk menduga rataan ketiga peubah respon utuk setiap media
iklan yang diwakili oleh contoh serta menguji kesamaan rataan ketiga median pada ketiga
respon yang diamati secara simultan.
PRAKTIKUM 11
ANALISIS KONJOINT

a) Menjelaskan konsep Analisis Konjoint
b) Menjelaskan langkah-langkah Analisis Konjoint pada SPSS 13
c) Menginterpretasikan output Analisis Konjoint
Pada dasarnya analisis konjoint digunakan untuk mengetahui bagaimana persepsi seseorang
terhadap suatu obyek yang terdiri atas satu atau banyak bagian. Hasil utama konjoint adalah
suatu bentuk (desain) produk barang atau jasa atau obyek tertentu yang diinginkan oleh
sebagian besar responden.
Hal penting yang harus dilakukan dalam analisis ini adalah menentukan faktor, dan level
serta mendesain stimuli (kombinasi antara faktor dan level). Namun demikian akan timbul
pertanyaan, bagaimana jika jumlah faktor dan level banyak, bukankah jumlah stimuli juga
menjadi sangat banyak?

Secara teoritis tentu saja jumlah stimuli akan menjadi sangat banyak jika jumlah faktor dan
level bervariasi. Sebagai contoh, jika ada 4 faktor dengan masing-masing faktor terdapat 5
level, maka jumlah stimuli secara teoritis adalah: 5 5 5 5 625 stimuli. Hal ini berari
setiap responden secara teoritis harus memberi pendapat terhadap 625 stimuli.
Oleh karena itu, SPSS memberi kemudahan terhadap masalah di atas. Untuk stimuli
yang terlalu banyak, bisa dilakukan pengurangan dengan ketentuan stimuli minimal adalah:
Minimum Stimuli = Jumlah level jumlah faktor + 1
Terkait dengan pertanyaan sebelumnya, karena tiap faktor ada 4 level, maka untuk lima
faktor ada 5 4 20 level. Dengan demikian:
Minimum stimuli = 20 5 + 1 =16 stimuli.
Jadi, daripada seorang responden mengisi seluruh 625 stimuli (sama dengan 625
pertanyaan!), ia cukup mengisi minimal 16 stimuli yang didesain oleh SPSS dari 625 stimuli
tersebut.
Contoh Kasus
PT HARUM ingin mengetahui keinginan konsumen akan sebuah produk Sabun Mandi.
Untuk itu, kepada dua orang responden diberikan pertanyaan tentang:
BENTUK SABUN MANDI, apakah:
- Berbenuk Padat
- Berbentuk Cair
MANFAAT SABUN MANDI, apakah:

- Untuk kulit Kering
- Untuk kulit Normal
WARNA SABUN MANDI
- Berwarna Putih
- Berwarna Hijau Muda
Setiap responden akan menilai kombinasi produk yang ada dengan angka 1 sampai 8,
sesuai jumlah kombinasi di atas.
Langkah:
Tahapan pada Conjoint Analysis:
1. MEMBUAT KOMBINASI PRODUK (STIMULI)

Kombinasi di dasarkan pada atribut produk yang sudah didefinisikan di atas, dengan
melakukan perkalian setiap atribut yang ada. Oleh karena ada tiga atribut (BENTUK,
MANFAAT, dan WARNA) dan enam subatribut ( dua untuk bentuk, dua untuk manfaat,
dua untuk warna), maka kemungkinan kombinasi adalah:
2 2 2 8 stimuli.
Kedelapan stimuli tersebut adalah:
No. Stimuli BENTUK MANFAAT WARNA
1 Cair Kulit Kering Putih
2 Cair Kulit Kering Hijau
3 Cair Kulit Normal Putih
4 Cair Kulit Normal Hijau
5 Padat Kulit Kering Putih
6 Padat Kulit Kering Hijau
7 Padat Kulit Normal Putih
8 Padat Kulit Normal Hijau
Arti:
Pada stimuli 1, produk yang diinginkan konsumen adalah Sabun Mandi Cair, untuk kulit
kering, serta berwarna putih, dst.
2. MENGISI SKALA ANGKA (PENDAPAT RESPONDEN)

Oleh karena ada 8 stimuli, maka setiap responden, maka setiap responden akan mengisi
setiap stimuli tersebut dengan angka 1 sampai 8, dengan angka 1 untuk stimuli produk
yang paling tidak disukai, sampai angka 8 untuk stimuli produk yang paling disukai
Hasil
No. Stimuli BENTUK MANFAAT WARNA RESP.1 RESP.2
1 Cair Kulit Kering Putih 3 2
2 Cair Kulit Kering Hijau 4 4
3 Cair Kulit Normal Putih 2 5
4 Cair Kulit Normal Hijau 5 3
5 Padat Kulit Kering Putih 6 1
6 Padat Kulit Kering Hijau 7 7
7 Padat Kulit Normal Putih 1 8
8 Padat Kulit Normal Hijau 8 6
Arti:
Untuk responden 1, produk yang paling tidak disukai terdapat pada baris 7, karena kolom
RESP.1 untuk angka 1 terletak pada baris tersebut. Hal ini berarti Responden paling tidak
suka Sabun Mandi yang berbentuk padat, untuk kulit normal dan berwarna putih. Sedangkan
produk paling disukai ada pada baris 8. hal ini berarti Responden 1 paling suka Sabun Mandi

yang berbentuk padat, untuk kulit normal dan berwarna hijau. Sedang produk paling disukai
kedua adalah stimuli yang terdapat pada baris 6.
Untuk responden 2 produk yang paling tidak disukai terdapat pada baris 5, dan produk yang
paling disukai trdapat pada baris 7.
Dari tabel tersebut di atas, yakni gabungan antara stimuli dan pendapat responden atas
stimuli, akan dilakukan proses konjoint oleh SPSS. Proses Analisis konjoint oleh SPSS pada
dasarnya terbagi dua:
Membuat stimuli dengan prosedur ORTHOGONAL
Proses konjoint dengan prosedur CONJOINT
3. MEMBUAT STIMULI DENGAN SPSS

Langkah pembuatan stimuli tidak dilakukan lewat Menu atau Kotak Dialog, namun
lewat penulisan dan eksekusi di SYNTAX EDITOR. Dan berbeda dengan kasus lannya, pada
Conjoint Anlysis tidak ada data yang ditulis terlebih dahulu di DATA EDITOR sehingga
proses langsung dilakukan lewat syntax.
Langkah penulisan syntax:
Buka progam SPSS, dan biarkan SPSS DATA EDITOR dalam keadaan kosong, dalam
arti tidak ada file apapun yang dibuka.
Dari menu File, pilih submenu Open, lalu pilihan Syntax...
Tampak di layar Menu Syntax Editor:
Kemudian ketik :

File Syntax di atas bias dilihat pada disket kerja dengan nama
CONJOINT_1_STIMULI.sps
Logika PenulisanSyntax:
Command Syntax untuk Pembuatan Stimuli adalah:
ORTHOPLAN, yang merupakan command pembuatan stimuli.
FAKTORS, untuk mendeskripsikan faktor-faktor yang akan dibuat stimuli. Dalam kasus ini,
faktor adalah atribut, yang berjumlah tiga. Penulisan selanjutnya adalah nama ketiga faktor
secara berurutan, dengan tiap faktor disertai subfaktor (subatribut). Beberapa hal yang perlu
diperhatikan :
Nama faktor bersifat bebas (boleh bernama BENTUK atau FORM atau yang lain), asal
tidak melebihi delapan karakter.
Penulisan label untuk faktor (seperti BENTUK Sabun Mandi ) bersifat bebas, asal
dimulai dan diakhiri dengan tanda kutip ().
Penulisan label untuk setiap subfaktor juga bersifat bebas, asal dimulai dan diakhiri
dengan tanda kutip ().
HOLDOUT. Holdout stimuli atau biasa disebut validation stimuli adalah stimuli yang dibuat
SPSS sebagai penguji hasil yang didapat nanati (validasi), apakah proses conjoint yang
menggunakan sampel tersebut bisa selaras jika digunakan pada populasi. Pada kasus ini,
Holdout diberi angka 0, yang berarti tidak ada stimuli untuk penguji. Sebagai contoh, jika
penulisan adalah /HOLDOUT =2, maka nanti akan tampak 10 baris di SPSS DATA
EDITOR, yakni 8 dari kombinasi atribut, serta 2 dari holdout.
SAVE OUTFILE. Perintah ini akan menyimpan hasil pembuatan stimuli pada file tertentu ,
dalam kasus ini diberi nama CONJOINTI.
Langkah eksekusi Syntax:
Dari tampilan SPSS SYNTAX EDITOR di atas, buka menu Run, lalu klik mouse
pada submenu All.
Setelah beberapa saat, tampak Output seperti yang tersimpan pada file
CONJOINTI.sav, ditampilkan sebagian.

Output dan Analisis:
Output yang terlihat pada SPSS DATA EDITOR:
PERHATIKAN! Tidak harus setiap kali proses stimuli, hasil harus sama persis
dengan output di atas. Susunan kedelapan stimuli bias saja berbeda-beda, namun isi stimuli
tetap sama.
Analisis:
Telihat kombinasi atribut pada tiga kolom pertama, yang sebenarnya telah dibahas pada tabel
pertama kasus ini, hanya ada perbedaan pada susunan stimuli.
Dari proses Orthogonal, dihasilkan delapan cards (stimuli), yang bias dilihat dari nomor
Card 1 sampai 8. Isi stimuli sama dengan kasus di atas (lihat tabel kedua), hanya cara
pengurutan yang berbeda, seperti setelah BENTUK cair, lalu ke padat, bukannya 4 baris
cair semua. Namun perbedaan ini tidak berpengaruh pada proses Conjoint, karena hanya
masalah penempatan data stimuli saja.
Untuk tampilan kolom STATUS, yang berisi angka 0, hal ini disebabkan tidak adanya
pembuatan (generating) Holdout Sample sehingga kode untuk Holdout, yakni kode 1, tidak
ditampilkan. Yang ditampilkan adalah kedelapan kombinasi, yang oleh SPSS secara otomatis
diberi kode 0 pada kolom STATUS.
Secara otomatis, SPSS akan menampilkan dua variabel (kolom) tambahan, yakni:
STATUS. Jika dilihat pada VARIABLE VIEW (dengan menekan CTRL+T dan buka
kolom VALUES pada variable Status tersebut), maka ada tiga kode yang secara otomatis

juga dikeluarkan SPSS, yakni kode 0 untuk Design (seperti yang tampak), kode 1 untuk
Holdout (untuk pengujian hasil sample) dan kode 2 untuk simulasi data.
CARD. Variabel ini menunjukan kartu simuli yang akan diisi responden, yang sama
dengan kolom NO. STIMULI dari tabel kedua pada kasus di atas. Oleh karena ada
delapan stimuli, maka akan ada delapan kartu (Card).
Kegunaan File Stimuli:

Setelah SPS membuat delapan stimuli, urutan stimuli tersebut akan menjadi petunjuk
pengisian ranking yang telah dilakukan responden. Sebagai contoh, jika CARD 1 dari file
di atas adalah:
CAIR, KULIT KERING, PUTIH
Maka sesuai kriteria di atas, dan dengan melihat ranking responden pada tabel kedua, angka
ranking untuk stimuli tersebut adalah 3 untuk Responden 1 dan 2 untuk Responden 2.
Sedang stimuli 2 menurut Card 2 dari SPSS adalah:

PADAT, KULIT KERING, HIJAU MUDA
Sesuai kriteria di tas, dan dengan melihat ranking responden pada table kedua, angka
rankinguntuk stimuli tersebut adalah 7 untuk responden 1 dan 7 untuk Responden 2.
Demikian seterusnya pengisian angka pada proses conjoint (dibahas dibawah) harus
mengikuti urutan CARD dari SPSS. Hal ini perlu diperhatikan karena hasil pembuatan
CARD SPSS mempunyai urutan logika stimuli yang telah dibuat secara manual seperti yang
ada di tabel partama pada kasus ini. Hal ini perlu diperhatikan, karena setiap kali proses
pembuatan (pembangkitan) stimuli, hasil yang didapat TIDAK SELALU SAMA dengan
hasil semula. Ada kemungkinan terjadi perubahan susunan pada isian card-card.
4. MEMBUAT CONJOINT DENGAN SPSS

Sama dengan pembuatan stimuli, proses Conjoint tidak dilakukan lewat Menu atau kotak
Dialog, namun lewat penulidsan dan eksekusi di SYNTAX EDIROR.
Langkah penulisan Syntax:
Buka program SPSS, dan biarkan SPSS DATA EDITOR dalam keadaan kosong, dalam
arti tidak ada file apapun yang dibuka.

NB: Jika file masih terisi data, untuk menghilangkan data, dari menu FILE, pilih
submenu NEW, lalu pilihan DATA. Beberapa saat akan terlihat DATA EDITOR bersih
dari data.
Dari menu File, pilih submenu Open, lalu pilihan Syntax...
Tampak dilayar Menu Syntax Editor. Untuk proses Conjoint pada kasus di atas, ketik:
File Syntax diatas bias dilihat pada disket kerja dengan nama CONJOINT_1_PROSES.sps.
Logika Penulisan Syntax:

Command Syntax untuk Proses Conjoint adalah:
DATA LIST. . .PROD8. Menjelaskan pembuatan data untuk produk 1 sampai produk 8
(karena jumlah Card ada delapan).
BEGIN DATA, Manjalaskan awal data ditulis. Perhatikan adanya tanda titik (.) pada akhir
tulisan DATA.
Angka 101. Menjelaskan KODE RESPONDEN. Oleh karena Syntax tidak bisa menerima
karakter (tipe string) huruf, maka jika responden bernama Ali, ia akan diberi kode
katekanlah - 101.
Angka input 3.00 lalu 7.00 dan seterusnya pada kode 101. Menjelaskan pemasukan pendapat
responden, yang sebelumnya telah ada pada kolom RESP 1 pada tabel kedua kasus di atas.
PERHATIKAN! Urutan pengisian harus disesuaikan dengan urutan CARD yang telah
dibuat SPSS pada file CONJOINT1.sav, baik untuk Responden 1 maupun Responden 2.
Urutan ranking berasal dari file CONJOINT1.sav mempunyai format menurun ke bawah,
yang pada pengisian di Syntax diubah menjadi menyamping ke kanan.
Angka 102 dan input datanya. Penjelasan sama dengan sebelumnya, hanya hal ini berlaku
untuk kode responden kedua dan pendapat responden tersebut, yang tertulis pada kolom
RESP2 di tabel kedua kasus di atas, dengan urutan disesuaikan isian file CONJOINT1.sav.
END DATA. Menjelaskan akhir penulisan data untuk proses Conjoint. Perhatikan adanya
tanda titik (.) di akhir tulisan END.

CONJOINT PLAN. Menjelaskan command SPSS untuk proses
Conjoint.=CONJOINT1.SAV. Menjelaskan data file stimuli yang sebelumnya telah dibuat,
yang akan digabung dengan pendapat respoden pada penulisan data antara BEGIN DATA
dan END DATA.
FAKTORS Menjelaskan Faktor yang ada, yang telah dijelaskan pada syntax pertama.
SUBJECT=QN. Menjelaskan pembuatan variabel QN, yang berisi kode responden

(Quesioner Number), yakni 101 dan 102.
SCORE=PRODIPROD8. Menjelaskan pembuatan variabel Score1 sampai Score8, yang

berisi data seperti tertulis di antara BEGIN DATA dan END DATA. Hasil score ini akan
terlihat pada file UTILITY di bawah ini.
UTILITY. Menjelaskan pembuatan file baru sebagai pelengkap file hasil proses conjoint,
yang berisi perhitungan utility dari masing-masing responden, namun dalam bentuk data
bertipe sav.
Langkah eksekusi Syntax:

Dari tampilan SPSS SYNTAX EDITOR di atas, buka menu Run, lalu klik mouse pada
submenu All.
Setelah beberapa saat, dihasilkan TIGA bentuk Output Conjoint:
a) Output Teks (lihat file CONJOINT_1_OUTPUT.spo)
b) Output hasil Conjoint (lihat file CONJOINT_1_HASIL.sav)
c) Output pelengkap/utility Conjoint (lihat file CONJOINT_1_UTILITY.sav)
Output yang berupa teks, agar lebih jelas akan diubah ke bentuk Word dengan proses
copy-paste biasa, yang hasilnya bisa dilihat di file
CONJOINT_1_OUTPUT_WORD.
NB: Untuk penjelasan lengkap proses pemindahan format Output teks dengan
ekstensi spo ke file Doc dari Word, lihat modul CANONICAL CORRELATION.
Output dan Analisis:

OUTPUT TEKS
Lihat file CONJOINT_1_OUTPUT-WORD.
1. Tampilan untuk responden 1 dengan kode responden adalah 101:

CONSTANT:
Angka Constant sebesar 4,5000 berasal dari:
Responden 1 mengisi angka 1 sampai 8, maka rata-rata adalah:
(1+2+3+4+5+6+7+8)/8=4,5
Angka ini menjadi dasaruntuk mencari besaran Utility dari faktor BENTUK, MANFAAT
dan WARNA. Pada dasarnya Utility adalah selisih antara rata-rata faktor tertentu dengan
konstant-nya. Jika selisih adalah negatif, responden kurang suka dengan stimuli produk
tersebut. Sebaliknya, jika selisih adalah positif, responden suka dengan stimuli produk
tersebut. Hal ini disebabkan urutan angka dari 1 (tidak disukai) ke 8 (sangat disukai). Jika
urutan angka terbalik (dari 1 yang adalah disukai ke 8 yang adalah tidak disukai), penafsiran
tanda negatif dan positif juga harus diubah.
Gambar penafsiran pada kasus ini:
Negatif 4,5 positif

NB: Tentu saja jika misal- ranking adalah dari angka 1 sampai 10, maka perhitungan
konstant akan menjadi lain.
Penafsiran factor BENTUK

Untuk faktor BENTUK, karena ada dua bentuk, yakni CAIR dan PADAT akan dihitung
setiap bentuk yang ada:
Bentuk CAIR. Jika dilihat pada tabel kedua yang berisi ranking responden 1, untuk
bentuk cair ada 4 stimuli yang terletak pada empat baris pertama. Angka ranking bisa
juga dilihat dari pemasukan di syntax SPSS yang terkait dengan file CONJOINT1.sav.
Prinsip adalah mencari penilaian Responden dari kedelapan stimuli tersebut yang
mengandung nama (faktor) CAIR pada variabel BENTUK. Dari tabel didapat angka 3, 4,
2 dan5.
Dengan demikian, rata-rata adalah:
(3+4+2+5)/4=3,5
Dengan demikian, deviasi adalah:
Rata-rata Constant, atau:

3,5-4,5=-1
Karena tanda negatif, berarti responden kurang suka dengan Sabun mandi berbentuk
Cair.
Bentuk PADAT, Jika dilihat pada tabel kedua yang berisi ranking responden 1, untuk
bentuk padat ada 4 stimuli yang terletak pada empat baris kedua. Dengan demikian, rata-
rata adalah:
(7+1+8+6)/4=5,5
Dengan demikian, deviasi adalah:
5,5-4,5=1
Karena tanda positif, berarti responden suka dengan Sabun mandi berbentuk padat.
Dari dua hasil di atas, untuk Bentuk Sabun Mandi bisa disimpulkan bahwa responden 1
lebih menyukai Sabun Mandi berbentuk padat daripada berbentuk cair.
Perhatikan bahwa secara otomatis angka deviasi yang didapat selalu sama, hanya
tandanya yang berbeda. Dalam perhitungan faktor BENTUK angka sama adalah 1, dengan
tanda yang pasti berlawanan. Hal ini menjadi pedoman untuk penghitungan utility pada
output Conjoint.
Penafsiran faktor MANFAAT

Untuk faktor MANFAAT, ada dua Manfaat, yakni KULIT KERING dan KULIT NORMAL:
Manfaat untuk KULIT KERING. Jika dilihat pada tabel atau stimuli yang ada, yang
mencari penilaian Responden dari kedelapan stimuli tersebut yang mengandung nama
KULIT KERING pada variabel MANFAAT. Dari tabel didapat angka 3, 7, 4 dan 6.
Dengan demikian, rata-rata adalah :
(3+7+4+6)/4=5
Deviasi adalah:
5-4,5=0,5
Karena tanda positif, berarti responden suka dengan Sabun mandi untuk Kulit Kering.
Manfaat untuk KULIT NORMAL. Secara otomatis (perhatikan penjelasan pada
penafsiran faktor BENTUK sebelumnya), angka deviasi pasti sama, yakni 0,5, dengan
tanda berlawanan, yakni negatif. Oleh karena tanda negatif, berarti responden kurang
suka dengan Sabun mandi untuk Kulit Normal.
Namun jika Utility untuk faktor MANFAAT (0,5) dibandingkan dengan Utility untuk
faktor BENTUK (1), terlihat Utility BENTUK lebih besar daripada Utility MANFAAT.
Semakin kecil deviasi (Utility), secara logika menunjukan semakin sempitnya perbedaan

penilaian responden terhadap atribut tertentu. Dengan demikian, di persepsi responden,
faktor BENTUK lebih dibedakan daripada faktor MANFAAT atau bentuk sebuah Sabun
Mandi lebih dipentingkan konsumen daripada Manfaatnya.
Perbedaan besar deviasi juga ditampilkan pada grafik yang ada di tengah output, dimana
makin besar deviasi, makin panjang tanda __ yang ditampilkan. Penyajian grafik
sebenarmya lebih memudahkan penafsiran dan perbandingan antar faktor, tanpa melihat
sebesar deviasi yang riil.
Penafsiran faktor WARNA

Untuk faktor WARNA, ada dua Warna Sabun Mandi, yakni PUTIH dan HIJAU (MUDA):
Warna PUTIH. Dengan mencari penilaian Responden dari kedelapan stimuli tersebut
yang mengandung nama PUTIH pada variable WARNA. Dari tabel didapat angka 3, 1, 2
dan 6.
Dengan demikian, rata-rata adalah:
(3+1+2+6)/4=3
Deviasi adalah :
3-4,5=-1,5
Karena tanda negatif, berarti responden suka dengan Sabun mandi dengan warna Putih.
Warna HIJAU atau HIJAU MUDA. Secara otomatis angka deviasi past sama, yakni 1,5,
dengan tanda berlawanan, yakni positif. Oleh karena tanda positif,berarti responden suka
dengan Sabun mandi dengan warna Hijau Muda.
Perhatikan grafik ditengah Output, di mana untuk faktor WARNA, garis _ pada faktor
tersebut adalah yang paling panjang dibanding kedua faktor lainnya. Hal ini selaras
dengan besar deviasinya, yang menyatakan bahwa faktor WARNA adalah faktor yang
paling penting bagi responden dalam menilai sebuah Sabun Mandi.
PERHITUNGAN IMPORTANCE
Untuk menghitung Importance, dilakukan proses perhitungan sebagai berikut :
Proses Perhitungan :
Kolom DEVIASI adalah besar deviasi yang telah dihitung atau didapat dari proses
Conjoint.
Kolom DEV^ adalah hasil dari kuadrat besar deviasi. Misal intuk bentuk
CAIR, angka 1 berasal dari -1 x -1. Demikian seterusnya untuk data yang lain. Kemudian

semua hasil pengkuardratan tersebut dijumlah, yakni 1+1+0,25+0,25+2,25+2,25=7 (lihat
baris TOTAL).
Baris STANDARDISASI adalah JUMLAH subfaktor dibagi dengan TOTAL (7).
Perhatikan subfaktor adalah bagian dari faktor, yakni CAIR-PADAT, KULIT KERING-
NORMAL, dan PUTIH-HIJAU. Oleh karena semua subfaktor berjumlah 6, maka
Standardisasi adalah 6/7=0,857 (pembulatan).
Kolom DEVIASI STANDAR adalah perkalian isi baris kolom DEV^ dengan
angka standardisasi (0,857). Sebagai contoh, untuk CAIR, angka Deviasi standar adalah
1 x 0,857 = 0,857. Demikian seterusnya untuk baris yang lain.
Kolom ESTIMATED PART-WORTH adalah penghitungan akar dari isi
kolom DEVIASI STANDAR. Sebagai contoh, untuk faktor CAIR, Estimated adalah
0,857=0,926. Demikian seterusnya, dan perhatikan kesamaan angka-angka untuk setiap
faktor.
Kolom RANGE OF PARTH WORTH adalah penjumlahan total hasil ESTIMATED
PARTH-WORTH. Untuk faktor BENTUK, maka 0,926+0,926=1,852. Demikian untuk
yang lain sehingga didapat hanya tiga angka FAKTOR. Kemudian ketiga angka tersebut
dijumlah sebagai basis penghitungan persentase, yakni 1,852+0,926+2,777=5,555.
Kolom FACTOR-IMPORTANCE adalah distribusi secara persentase dari perhitungan
kolom RANGE OF PARTH-WORTH:
- BENTUK= 1,852/5,555 * 100% = 33,33%
- MANFAAT= 0,962/5,555 * 100% = 16,67%
- WARNA= 2,777/5,555 * 100% = 50%
Perhatikan komposisi tingkat kepentingan (Importance) yang sama dengan tampilkan
Output. Hal ini berarti responden 1 menganggap faktor Warna Sabun Mandi sebagai faktor
terpenting dalam membeli sabun mandi, sedangkan faktor paling tidak penting adalah
Manfaat Sabun Mandi tersebut.
2. Tampilan untuk responden 2 dengan kode responden adalah 102:

Analisis:
CONSTANT. Perhatikan angka constant yang sama dengan perhitungan sebelumnya
untuk responden 1, karena ranking juga untuk delapan stimuli.
BENTUK. Oleh karena Utility untuk Cair negatif, maka responden 2 kurang suka
dengan bentuk cair, dan cenderung senang Sabun Mandi berbentuk padat.

MANFAAT. Oleh karena Utility untuk Kulit Kering negatif, maka responden 2
kurang suka dengan Sabun Mandi untuk Kulit Kering, namun suka Sabun Mandi
untuk kulit normal.
WARNA. Oleh karena Utility untuk Putih negatif, maka responden 2 kurang suka
dengan sabun mandi berwarna Putih, dan cenderung senang Sabun Mandi berwarna
hijau.
Dari FACTOR IMPORTANCE, terlihat responden 2 menganggap BENTUK dan
MANFAAT sabun mandi adalah sama pentingnya (40% dan 40%), sedang WARNA
sabun mandi justru dianggap paling tidak penting (20%). Hal ini berbeda dengan
responden 1 yang justru menganggap warna adalah faktor yang paling penting dalam
memilih sabun mandi.
3. Tampilan untuk SUBFILE SUMMARY (penilaian umum):

Analisis:
CONSTANT. Perhatikan angka constant yang sama dengan perhitungan sebelumnya
untuk responden 1 maupun 2. karena SubFile bersifat meringkas dengan dasar yang
sama.
BENTUK. Oleh karena Utility untuk Cair negatif, maka secara umum responden
kurang suka dengan bentuk cair , dan cenderung senang Sabun Mandi berbentuk
padat.
MANFAAT. Oleh karena Utility untuk Kulit Kering negatif, maka secara umum
responden kurang suka dengan sabun mandi untuk Kulit kering, namun cenderung
menyukai Sabun Mandi untuk Kulit normal.
WARNA. Oleh karena Utility untuk Putih negatif, maka secara umum responden
kurang suka dengan sabun mandi berwarna Putih, dan cenderung senang Sabun
Mandi berwarna hijau.
Dari FAKTOR IMPORTANCE, secara umum, responden menganggap BENTUK
sabun mandi adalah faktor terpenting dalam menilai atau mungkin membeli sebuah
sabun mandi (36,67%). Kemudian faktor WARNA (35%) dan paling dianggap tidak
penting adalah faktor MANFAAT (28,33%).
4. PENGHITUNGAN PREDICTIVE ACCURACY (KETETAPAN PREDIKSI)

Analisis Conjoint pada prinsipnya brtujuan untuk memperkirakan pola pendapat responden,
yang disebut Estimates Part-Worth, kemudian membandingkan dengan pendapat responden

yang sebenarnya (Actual), yang ada pada proses stimuli. Seharusnya hasil conjoint tidak
berbeda jauh dengan pendapat responden yang sebenarnya, yang dicerminkan dengan
tingginya angka korelasi antara hasil Estimates dengan hasil Actual. Inilah yang disebut
dengan Predictive Accuracy, yakni mengukur Tingkat Ketepatan Prediksi, yang dicerminkan
dengan adanya korelasi yang tinggi dan signifikan antara hasil Estimates dengan hasil
Actual.
Menghitung Total Estimates Part-Worth

Total Estimates Part-Worth pada dasarnya menjumlah Estimates Part-Worth yang telah
dihitung pada tabel sebelumnya, kemudian dilakukan ranking dari terkecil ke terbesar seperti
terlihat pada tabel berikut ini.
Keterangan:
Pada kolom Estimates Part-Worth, penggunaan tanda negatif dan positif dilakukan,
dengan mengacu pada perhitungan Utility dan tampilan Output sebelumnya. Sebagai
contoh, jika bentuk CAIR bertanda negatif, maka Estimates Part-Worth-nya juga
menggunakan tanda negatif.
Kolom TOTAL ESTIMATES PART-WORTH merupakan penjumlahan ketiga kolom
yang memuat stimuli-stimuli. Sebagai contoh, Total Estimates untuk stimuli CAIR-
KULIT KERING-PUTIH adalah:
-0,926+0,463-1,389=-1,852
Kolom RANK ESTIMATES PART-WORTH merupakan proses pengurutandari
angka terkecil ke angka terbesar. Hal ini dilakukan karena pengisian ranking semula
(lihat kasus awal) adalah dari paling tidak disukai (nomor1) ke paling disukai nomor
8).
Kolom RESP.1 (Actual) adalah data pendapat responden awal (lihat kasus awal).
Dari tabel diatas terlihat bahwa urutan Estimates dengan Actual tidak berbeda jauh, dengan
catatan angka 0 dan 0 pada Estimates bisa diurutkan sebagai 4 dan 5, atau bisa di antaranya,
yakni 4,5 dan 4,5. Kemudian antara kedua variabel dilakukan pengukuran korelasi dan
signifikan hasil korelasi tersebut, dengan hasil terdapat pada bagian bawah dari Output untuk
responden 1 (lihat tampilan di file CONJOINT_1_OUTPUT_WORD.doc):
Pengukuran korelasi, baik secara Pearson ataupun Kendall, menghasilkan angka korelasi
yang relatif kuat, yakni di atas 0,5. Hal ini membuktikan adanya hubungan yang kuat antara
Estimates dengan Actual, atau ada Predictive Accuracy yang tinggi pada proses Conjoint.

Pedoman untuk uji Signifikansi:
Hipotesis:
Ho= Tidak ada korelasi yang kuat antara variabel ESTIMATES dengan RESP.I (RANK)
Hi= Ada korelasi yang kuat antara variabel ESTIMATES dengan RESP.I (RANK)
Pedoman:
Jika probabilitas (Signifikan) >0,05, maka Ho diterima.
Jika probabilitas (Signifikan) <0,05, maka Ho ditolak.
Keputusan:
Oleh karena pada perhitungan Pearson maupun Kendall, angka Signifikansi keduanya jauh
di bawah 0,05 (0,0067 dan 0,01), maka Ho ditolak. Hal ini berarti memang ada korelasi yang
nyata antara hasil conjoint dengan pendapat responden 1 semula.
Uji korelasi untuk Responden 2 dan SUBFILE SUMMARY.

Jika dilihat korelasi antara hasil Conjoint dengan pendapat Responden 2:
Dan korelasi antara hasil Conjoint dengan Summary (Agregate):
Terlihat bahwa kedua tabel di atas mempunyai korelasi yang tinggi (di atas 0,5), dan kedua
korelasi tersebut adalah signifikan, karena angka Signifikansi keduanya jauh dibawah 0,005.
Dengan demikian bisa disimpulkan bahwa (lihat hasil utility SUBFILE SUMMARY):
Responden benar-benar menghendaki Sabun Mandi yang berbentuk padat, digunakan untuk
Kulit Normal dan berwarna Hijau Muda.

PRAKTIKUM 13
ANALISIS BIPLOT

a) Menjelaskan konsep Analisis Biplot
b) Menjelaskan langkah-langkah Analisis Biplot pada Minitab 14.12 dan SPSS 13
c) Menginterpretasikan output Analisis Biplot
13.2 Analisis Biplot

13.3 Contoh Kasus Analisis Biplot
Manager Surat Kabar Harian (SKH) Angkatan Bersenjata menemukan fakta, bahwa
beberapa bulan terakhir volume penjualannya semakin menurun. Manager tersebut
menyadari terdapat faktor-faktor yang menjadi penyebabnya, namun belum mengetahui
faktor mana yang paling dominan. Manager ingin mengetahui posisi SKH tersebut berkaitan
dengan persentase jenis berita yang dimuat, melalui positioning ini beliau berharap dapat
memperoleh informasi penting berkaitan dengan upaya guna meningkatkan kembali volume
penjualan SKH-nya. Dalam positioning tersebut manager ingin mengetahui:
Jenis Berita
Surat Kabar Harian Kode
X1 X2 X3 X4 X5 X6
Angkata Bersenjata AB 29.40 32.43 9.09 9.09 9.09 10.91
Berita Buana BB 20.33 28.31 25.59 7.97 7.97 9.83

Berita Yuda BY 24.50 24.50 22.97 9.68 8.41 9.94
Bisnis Indonesia BI 3.82 68.53 4.92 7.65 7.65 7.42
Harian Ekonomi Neraca HEN 8.87 48.86 21.82 4.55 9.09 6.82
Harian Terbit HT 9.37 23.08 35.54 9.37 9.37 13.27
Indonesia Observer IO 10.00 33.33 10.00 13.33 13.33 20.00
The Indonesia Times IT 8.15 22.96 14.81 11.11 14.81 28.15
The Jakarta Post TJP 9.19 28.10 34.12 10.48 8.10 10.00
Jayakarta JYKT 14.26 31.45 18.58 18.58 8.57 8.57
Kompas KMPS 12.14 38.99 19.51 9.88 10.17 9.31
Media Indonesia MI 18.51 44.19 13.86 11.28 6.20 5.96
Merdeka MDK 19.05 24.62 24.03 15.15 7.45 9.32
Pelita PLT 13.85 29.65 24.34 13.19 7.89 11.09
Pos Kota PK 20.29 20.29 46.38 8.69 2.18 2.18
Republika RPBK 8.49 25.99 41.14 9.56 7.00 7.81
Sinar Pagi SP 13.33 34.08 17.03 17.78 8.89 8.89
Suara Karya SK 17.86 19.28 33.93 10.36 10.36 8.22
Suara Pembaruan SPMB 9.32 30.30 27.94 16.32 6.45 9.68
Keterangan:
X1 : POLKAM X4 : Olahraga
X2 : EKBANG X5 : Opini
X3 : KESRA X6 : Luar Negeri
a) Posisi relatif Harian Angkatan Bersenjata terhadap SKH lainnya
b) Ciri kelompok masyarakat pembaca (segmen) pembaca SKH.
c) Segmen mana yang dominan atau loyal dalam membaca atau berlangganan SKH.
Langkah-Langkah:
Pada dasarnya dalam SPSS 13 tidak terdapat suatu fasilitas yang secara khusus dapat
digunakan untuk melakukan analisis biplot. Namun, untuk melakukan analisis ini dapat
dilakukan dengan melalui kombinasi beberapa fasilits yang ada. Adapun tahapan yang akan
dilakukan dalam analisis ini adalah:
Penguraian Nilai Singular Pembangkitan matriks

Data ( Analisis Faktor) baris dan kolom
Plot
Gambar 13.1 Tahapan Analisis Biplot

1. Data diinput.
2. Penguraian Nilai Singular (PNS) melalui analisis faktor dengan SPSS 13 sebagai berikut:
Pilih Analyze Data Reduction Factor , selanjutnya akan muncul kotak dialog
sebagai berikut:

Gambar 13.2 Kotak dialog Factor Analysis
Masukkan semua variabel POLKAM, EKBANG, KESRA, Olahraga, Opini, dan Luar
Negeri yang akan dianalisis ke dalam kotak Variables..
Pilih Descriptives, kemudian tandai pada kotak Statistics-UNIVARIATE
DESCRIPTIVES dan Correlation Matrix-COEFICIENTS,SIGNIFICANCE LEVELS,
dan DETERMINANT, terlihat pada gambar 13.3: selanjutnya CONTINUE untuk
kembali pada kotak dialog utama gambar 13.2.
Gambar 13.3 Kotak Dialog Factor Analysis- Descriptives

Pilih Extraction pada kotak dialog utama, selanjutnya pilih metode PRINCIPAL
COMPONENTS dan tandai CORRELATION MATRIX pada kotak Analyze,
UNROTATED FACTOR SOLUTION dan SCREE PLOT pada kotak Display serta
ketik angka 6 yang menunjukkan banyaknya faktor pada NUMBER OF FACTORS dan
ketikkan angka 60 pada MAXIMUM ITERATIONS FOR CONVERGENCE yang
menunjukkan jumlah maksimum iterasi konverge yang diinginkan, seperti terlihat pada
gambar 13.4, selanjutnya CONTINUE untuk kembali pada kotak dialog utama gambar
13.2.

Gambar 13.4 Kotak dialog Factor Analysis - Extraction
Pada factor Analysis- Rotation, Pilih NONE pada Method.
Pilih Scores...., tandai pada kotak Method REGRESSION dan beri ceklist pada SAVE
AS VARIABLES dan DISPLAY FACTOR SCORE COEFFICIENT MATRIKS, seperti
pada gambar 13.5, kemudian klik CONTINUE untuk kembali pada kotak dialog utama
gambar 13.2.
Gambar 13.5 Kotak dialog Factor Analysis Factor Scores

Selanjutnya OK, maka output yang dihasilkan sebagai berikut:
OUTPUT:
Descriptive Statistics
Mean Std. Deviation Analysis N

POLKAM 14.2489 6.53033 19
EKBANG 32.0495 11.70702 19
KESRA 23.4526 11.09272 19
Olanhrga 11.2642 3.63116 19
Opini 8.5779 2.63754 19
Luar_ngeri 10.3879 5.50672 19
Berdasarkan pada Tabel Descriptive Statistics, dapat diketahui nilai rata-rata (Mean), Standar
deviasi dn jumlah data yang dianalisis pada setiap variable yang digunakan.

Correlation Matrixa
POLKAM EKBANG KESRA Olanhrga Opini Luar_ngeri

Correlation POLKAM 1.000 -.381 .013 -.021 -.264 -.264
EKBANG -.381 1.000 -.634 -.246 -.034 -.217
KESRA .013 -.634 1.000 -.137 -.489 -.359
Olanhrga -.021 -.246 -.137 1.000 .056 .132
Opini -.264 -.034 -.489 .056 1.000 .856
Luar_ngeri -.264 -.217 -.359 .132 .856 1.000
Sig. (1-tailed) POLKAM .054 .478 .466 .137 .137
EKBANG .054 .002 .155 .446 .186
KESRA .478 .002 .289 .017 .066
Olanhrga .466 .155 .289 .410 .295
Opini .137 .446 .017 .410 .000
Luar_ngeri .137 .186 .066 .295 .000
a. Determinant = 8.84E-006
Pada Tabel Correlation Matrix menunjukkan korelasi antar jenis berita. Terlihat bahwa jenis
berita OPINI dan Luar Negeri memiliki korelasi yang paling tinggi, sementara itu KESRA
dan POLKAM memiliki korelasi yang paling rendah, demikian juga EKBANG dan OPINI,
dan seterusnya.
Total Variance Explained
Extraction Sums of Squared Loadings

Component Total % of Variance Cumulative %
Raw 1 216.193 61.207 61.207
2 74.527 21.100 82.307
3 47.252 13.378 95.685
4 13.802 3.908 99.593
5 1.438 .407 100.000
6 .001 .000 100.000
Rescaled 1 1.790 29.839 29.839
2 1.637 27.282 57.121
3 1.449 24.145 81.266
4 .962 16.041 97.306
5 .162 2.693 99.999
6 5.67E-005 .001 100.000
Extraction Method: Principal Component Analysis.
Selanjutnya pada Tabel Total Variance Explained diatas, memberikan informasi mengenai
akar ciri dari matriks covariance (koragam) serta kumulatif persentasenya. Terlihat bahwa
dua akar cirri dari matriks tersebut secara kumulatif bernilai sebesar 82.307%. Hal ini berarti
pengambilan dua komponen utama pertama dapat menjelaskan sebesar 82.307% dari total
keragaman data. Berarti hasil ini dikatakan sangat memadai.

Component Matrixa
Raw Rescaled
Component Component
1 2 3 4 5 6 1 2 3 4 5 6
POLKAM -1.911 2.480 -5.681 -.749 -.120 .014 -.293 .380 -.870 -.115 -.018 .002
EKBANG 10.795 -4.498 -.421 -.304 -.135 .014 .922 -.384 -.036 -.026 -.012 .001
KESRA -9.759 -5.181 .903 -.390 -.082 .014 -.880 -.467 .081 -.035 -.007 .001
Olanhrga -.278 1.399 .356 3.320 -.075 .014 -.077 .385 .098 .914 -.021 .004
Opini .683 1.753 1.401 -.648 1.017 .014 .259 .665 .531 -.245 .386 .005
215500 S
c
r
eP
l
ot
Luar_ngeri .476 4.035 3.450 -1.248 -.598 .014 .087 .733 .626 -.227 -.109 .003
Extraction Method: Principal Component Analysis.
a. 6 components extracted.
Pada Tabel tersebut diatas, dapat diketahui informasi tentang vector cirri dari matriks
koragam, yang menunjukkan koefisien masing-masing komponen utama. Dalam analisis
Biplot akan diambil dua vector cirri pertama yaitu component 1 dan component 2, yang
Elu
a
v
ige
akan mewakili koordinat atribut (segmen pembaca).
n
5012C
e
o
m
p
3n
etN
u
4m
b
er56
Gambar 13.6 Output dari Skor analisis faktor
Pada gambar diatas, terlihat skor komponen yang merupakan informasi mengenai koordinat
objek (SKH) ditampilkan dalam DATA EDITOR. Data ini selanjunya akan dilakukan

analisis lanjutan, yang kemudian dari 6 faktor yang terbentuk akan diambil dua skor
komponen utama pertama yaitu fact1_3 dan fact2_3 , yang akan mewakili koordinat SKH.
3. Pembuatan Plot.
Dengan menggunakan SPSS, untuk membuat plot dua dimensi yang merupakan
penumpangtindihan (overlay) dari matriks G dan matriks H ada beberapa hal yang perlu
diperhatikan yaitu matriks G akan diplot dengan menggunakan titik dan matriks H akan
diplot menggunakan vektor yang berpusat pada pusat koordinat.
Untuk membuat plot, matriks G dan H pada DATA EDITOR disusun dalam format
berikut:
1) Matriks G terdiri dari skor komponen utama pertama.
2) Matriks H terdiri dari vektor ciri.


Modul Lengkap Multivariat Revisi (Praktikumnya)

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Modul Lengkap Multivariat Revisi (Praktikumnya)

Diunggah oleh

Hak Cipta:

Format Tersedia

PRAKTIKUM 1

UJI DATA MULTIVARIAT

1.1 Indikator Praktikum

1.2 Uji Data Multivariat

Uji data dapat dilakukan dengan empat cara:

Penuntun Praktikum Analisis Data Multivariat

Penuntun Praktikum Analisis Data Multivariat

Gambar 1.1 Kotak dialog Missing Value Analysis

Klik icon PATTERNS sehingga tampak di layar:

Gambar 1.2 Kotak dialog Missing Value Analysis-Patterns

Penuntun Praktikum Analisis Data Multivariat

Gambar 1.3 Kotak dialog Missing Value Analysis - Descriptives

Penuntun Praktikum Analisis Data Multivariat

Usia Present Count 26 9 17

Penuntun Praktikum Analisis Data Multivariat

Missing and Extreme Value

Penuntun Praktikum Analisis Data Multivariat

Penuntun Praktikum Analisis Data Multivariat

1.4 Penanganan Missing Value

Penuntun Praktikum Analisis Data Multivariat

Gambar 1.4 Kotak dialog Replace Missing Value

Penuntun Praktikum Analisis Data Multivariat

Penuntun Praktikum Analisis Data Multivariat

2.1 Indikator Praktikum

2.2 Analisis Komponen Utama (AKU)

dari X1 , X 2 ,L , X p . Melalui matriks ragam-peragam dapat diturunkan akar ciri (eigen

value) yaitu 1 2 L p 0 dan vektor ciri (eigen vector) yaitu a1 , a 2 , a3 ,L , a p .

Misalkan X ' (X1 , X 2 ,L , X p ) merupakan p peubah yang menjadi perhatian memiliki

Komponen utama pertama ( Y1 ) dapat dituliskan dengan persamaan:

Penuntun Praktikum Analisis Data Multivariat

Komponen utama kedua ( Y2 ) dapat dituliskan:

peubah asal yang memaksimumkan var( ai X ) dengan kendala ai ai 1 dan cov( ai X, a k X ) =

0 untuk k < i, dengan k 1, 2, L , p . Secara umum ragam dapat dituliskan: var(Yi ) ai ai

2.3 Contoh Kasus Analisis Komponen Utama

Penuntun Praktikum Analisis Data Multivariat

Gambar 2.1 Kotak dialog Principal Components Analysis

Penuntun Praktikum Analisis Data Multivariat

Gambar 2.2 Kotak dialog Principal Components Analysis - Graphs

Gambar 2.3 Kotak dialog Principal Components Analysis - Storage

Principal Component Analysis: Total popula, Median Schoo, Total employ,

Lima kolom pertama merupakan koefisien dari masing-masing komponen utama.

Penuntun Praktikum Analisis Data Multivariat

2.5 Tugas Praktikum 2

Penuntun Praktikum Analisis Data Multivariat

3.1 Indikator Praktikum

3.2 Analisis Faktor

3.3 Contoh Kasus Analisis Faktor

Penuntun Praktikum Analisis Data Multivariat

Gambar. 3.1 Kotak dialog Factor Analysis

Unrotated Factor Loadings and Communalities

Variable Factor1 Factor2 Factor3 Factor4 Factor5 Communality

Variance 3.0289 1.2911 0.5725 0.0954 0.0121 5.000

Factor Score Coefficients

Variable Factor1 Factor2 Factor3 Factor4 Factor5

2. Analisis faktor lanjutan.

Penuntun Praktikum Analisis Data Multivariat

Gambar. 3.3 Kotak dialog Factor Analysis- Results

Penuntun Praktikum Analisis Data Multivariat

Pada gambar 3.4 menggambarkan hubungan faktor 1 dengan faktor 2. Grafik

Variance 3.0215 1.2986 4.3200

Sorted Rotated Factor Loadings and Communalities

Variable Factor1 Factor2 Communality

Variance 3.0215 1.2986 4.3200