Anda di halaman 1dari 33

ITB/SAPPK/AR5152 Analisis Kuantitatif/Catatan Kuliah

Alia Widyarini H./25210004

Kuliah 16 Agustus 2010

TERMINOLOGI
1. PENELITIAN (RISET)
Menurut Creswell adalah rangkaian kegiatan mengumpulkan data, analisis data, dan interpretasi
hasil analisis untuk mendapatkan pengetahuan baru. Menurut Snyder (1984), research as
systematic inquiries directed towards the creation of knowledge.
2. METODOLOGI PENELITIAN
Pengetahuan tentang metode pengumpulan data dan analisis data, sedangkan menurut Creswell
adalah strategies of inquiries
3. METODE
Menurut Creswell metode adalah prosedur yang mendetail mengenai pengumpulan data,
analisis, dan penulisan (pada riset)
4. ANALISIS
Kegiatan untuk menemukan pattern atau ciri khas dalam data (kolektif)

5. CIRI KHAS PERSPEKTIF POST-POSITIVISM


- Ada kausalitas (sebab-akibat)
- Reduksionisme, yaitu hanya variabel-variabel tertentu yang dilihat, tidak semuanya
- Observasi empirik
- Kuantitatif

6. CIRI KHAS PERSPEKTIF SOCIAL CONSTRUCTIVISM


- Subjektif
- Kompleks, yaitu variabel-variabelnya tidak ditentukan
- Tidak reduksionis, tapi keutuhan (holistik)
- Interaksi penting
- Hasil dari penelitian berupa story telling (berupa kata-kata)

7. CIRI KHAS PERSPEKTIF ADVOCACY/PARTICIPATORY


- Political
- Empowerment issue-oriented
- Collaborative
- Change oriented

1
8. CIRI KHAS PERSPEKTIF PRAGMATISM
- Consequences of actions
- Problem-centered
- Pluralistic
- Real-world practice oriented

9. PERBEDAAN RISET KUALITATIF DAN KUANTITATIF


Riset Kuantitatif Riset Kualitatif
P ost-positivism Social Constructivist
Objektif Subjektif
Reduksionis Kompleks atau keutuhan
Hasil riset berupa numerik (angka/nilai) Hasil riset berupa teori atau story
Variabel ditentukan di depan, sebelum Variabel tidak ditentukan, peneliti tidak tahu apa
pengumpulan data, yang dicari hubungan antar yang akan dijawab responded
variabel
Variabelnya diketahui, hanya hubungan antar Sebelumnya tidak tahu menjadi tahu
variabel yang belum diketahui
Terdapat hipotesis Tanpa hipotesis
Verifikasi teori Membuat teori baru
Intervensi dari peneliti sedikit, biasnya sedikit Intervensi dari banyak tempat, biasnya banyak
Interpretasi setelah hasil statistiknya jadi Interpretasi dari awal
Konfirmatif, menstrukturkan faktor Eksploratif, mencari dan menggali segala macam
kemungkinan yang dapat menjelaskan fenomena
Close ended Open ended

Kuliah 30 Agustus 2010

1. CIRI KHAS METODE PENGUMPULAN DATA OBSERVASI


- Langsung berada pada lokasi/objek yang diamati
- Sebagai outsider (unnoticed) atau insider (living in) atau untuk mencari jejak
- Terstruktur
- Pengumpulan informasi primer

2. CIRI KHAS METODE PENGUMPULAN DATA SURVEI


- Pengumpulan informasi primer
- Terstruktur, semi terstruktur, tidak terstruktur
- Dilakukan kepada penghuni, pengguna, dan konsumen

3. CIRI KHAS METODE PENGUMPULAN DATA MAPPING


- Pengumpulan informasi primer
- Termasuk ke dalam observasi
- Terstruktur
- Peneliti merupakan outsider (unnoticed)
- Untuk tracking berupa track path dan traces
- Hasilnya berupa map sketch, pattern kegiatan, clues of behaviour pattern, dan identifikasi
gerakan dan sirkulasi

2
4. CIRI KHAS METODE PENGUMPULAN DATA SORTING
- Pengumpulan informasi primer
- Peneliti merupakan insider
- Memberikan urutan berdasarkan suatu kategori tertentu, misalnya preferensi
- Terdiri atas directed sort dan free sort. Directed sort, kategori pengurutan telah ditentukan
sebelum melakukan sorting oleh peneliti, sedangkan free sort kategori pengurutan tidak
ditentukan oleh peneliti tetapi berdasarkan responden.

5. CIRI KHAS METODE PENGUMPULAN DATA ARSIP


- Pengumpulan informasi sekunder

6. TIGA LANGKAH CONTENT ANALYSIS


1) Mencari kata kunci atau ciri khas
2) Mengelompokkan menjadi kategori, yaitu kata kunci yang mirip dijadikan satu kategori
diwakili oleh kata kunci sendiri
3) Menghitung kata kunci atau ciri khas yang paling sering muncul
Menurut Neuman (2006), content analysis adalah suatu teknik untuk meneliti isi atau informasi
dan simbol yang terkandung di dalam dokumen tulisan atau media komunikasi, seperti foto, film,
lirik musik, dan iklan. Dalam melakukan content analysis, peneliti mengidentifikasi materi yang
dianalisis dan kemudian membuat sistem tertentu untuk merekam aspek spesifik dari isinya,
seperti tiga langkah yang telah disebutkan di atas. Pada umumnya pada saat analisis
menggunakan grafik atau chart. Content analysis merupakan metode nonreactive karena yang
membuat data untuk dianalisis tidak mengetahui bahwa hal tersebut diteliti.
Kuliah 20 September 2010

PEMAHAMAN TUGAS
Tugas tersebut merupakan salah satu metode dalam pengumpulan data, yaitu yang berupa open
ended. Metode tersebut biasa digunakan untuk pengumpulan data secara kualitatif. Responden
bebas untuk menuliskan apapun tanpa ada batasan-batasan atau variabel-variabel tertentu dari
peneliti. Dengan demikian, peneliti mendapatkan banyak hal, bahkan di luar yang diasumsikan oleh
peneliti sendiri. Metode pengumpulan data seperti ini memiliki ciri khas subjektif dan menyeluruh,
serta digunakan pada tugas: deskripsi alasan masuk S2; deskripsi rumah impian; evaluasi rumah
bagus, biasa, dan jelek; serta tempat favorit.
Pada tugas terakhir, analisis data teks yang berupa analisis data open ended menjadi sebuah
histogram berisikan data-data numerik. Metode analisis yang digunakan adalah content analysis. Dari
data yang dikumpulkan, pertama dicari dulu kata-kata kuncinya, kemudian langkah kedua kata-kata
kunci yang sama dijadikan satu kategori, setelah itu langkah ketiga frekuensi dari kata kunci yang
telah dikategorikan tersebut dihitung. Hasil dari analisis data ini berupa histogram (distribusi),
mempermudah dalam melihat kategori yang memiliki frekuensi paling banyak dan yang paling
sedikit, sehingga dari hasil histogram ini peneliti dapat mengintepretasikannya.

3
ANOVA
(Analysis of variance)

Fungsi
Untuk mengetahui perbedaan parameter (indikator numerik yang digunakan untuk memberikan
ukuran, selalu data continous) antar data nominal dengan melihat nilai rata-rata parameter dari
setiap kategori dalam data nominal tersebut.
Menurut buku Pengolahan Data Statistik dengan SPSS 16.0, One-way Anova digunakan untuk
menganalisis varians variabel independen. Analisis varians digunakan untuk hipotesis beberapa mean
yang sama. Selain itu, teknik ini juga digunakan untuk mengetahui selisih di antara mean atau untuk
mengetahui mean yang mana yang menyebabkan berbeda.
Anova paling mudah dipahami jika ditampilkan dalam bentuk diagram dua dimensi. Pada Anova data
angka diubah menjadi grafik, sehingga dapat dianalisis, diintepretasikan dan menghasilkan temuan.
Kriteria  standard yang digunakan untuk menilai parameter (= sesuatu yang menunjukkan
nilai/angka)
Kriteria data Anova menurut buku Pengolahan Data Statistik dengan SPSS 16.0 adalah sebagai
berikut:
1. Sebelum menguji dengan Anova, data harus berdistribusi normal dan mempunyai varians
yang sama.
2. Data yang digunakan pada Anova untuk nilai variabel pada faktor harus integer, sedangkan
variabel dependen harus berupa data kuantitatif (tingkat pengukuran interval).
3. Asumsi yang digunakan pada Anova, yaitu setiap kelompok pada sampel acak independen
dari populasi yang normal dan bervarian homogen.
4. Dari output uji Anova akan diperoleh F hitung. Jika nilai F hitung tidak signifikan, berarti rata-
rata variabel pada tingkat faktor yang ditentukan identik. Jika F hitung signifikan berarti
terdapat perbedaan rata-rata variabel dependen pada tingkat faktor yang telah ditentukan.

Ciri-khas, sumbu x, sumbu y


Terdapat dua sumbu, yaitu sumbu x dan sumbu y, dimana
Sumbu x  data nominal (kategori) atau ordinal (ranking)
Sumbu y  data continous (interval atau rasio)

Jenis data
Hasil pengukuran suatu variabel dinyatakan dengan data. Jenis data sangat mempengaruhi jenis
analisis yang dapat digunakan, berikut adalah tiga jenis data:
1. Data nominal merupakan data yang berupa kategori, seperi jenis pekerjaan, kota tempat
tinggal, dan sebagainya, data ini tidak selalu berupa angka/numerik.
Menurut buku Pengolahan Data Statistik dengan SPSS 16.0, data nominal dalam level
pengukuran merupakan data yang paling rendah levelnya karena data nominal hanya
menghasilkan satu kategori saja, dan data dianggap setara. Data nominal termasuk data

4
kualitatif, yaitu data yang hasilnya tidak berupa angka dan tidak bisa dilakukan operasi
matematika.
2. Data ordinal merupakan data yang berupa urutan atau rangking, data ini selalu berupa
angka tapi intervalnya tidak terlalu sama.
Data ordinal mempunyai level yang lebih tinggi dibanding data nominal, pada data ordinal
terdapat tingkatan data. Data ordinal termasuk data kualitatif, jika data berupa data ordinal
maka data diubah menjadi bilangan. Bilangan yang digunakan bulat dan sudah mengenal
urutan tinggi rendah, besar kecil, contohnya banyaknya siswa, jumlah penduduk, sikap
konsumen terhadap suatu produk, dan sebagainya.
3. Data continous adalah data yang berupa interval atau rasio. Data interval adalah data yang
memiliki peringkat, seperti data hasil likert, sequential differential method, sedangkan data
rasio adalah data yang memiliki nilai kuantitatif yang sebanding dengan besaran angkanya
dan antar angka dapat dibandingkan secara langsung.
Menurut buku Pengolahan Data Statistik dengan SPSS 16.0, data interval mempunyai level
pengukuran yang lebih tinggi dibanding data ordinal. Data interval termasuk data kuantitatif,
yaitu data yang hasilnya berupa angka dalam arti yang sebenarnya dan bisa dilakukan
operasi matematika. Data interval merupakam data hasil pengukuran yang bisa berbentuk
bilangan numerik bulat dan pecahan. Pada data interval tidak mempunyai nilai nol mutlak.
Data rasio merupakan data yang paling tinggi levelnya diantara data-data yang lain. Data
rasio termasuk data kuantitatif, data yang berupa angka yang sebenarnya. Data rasio
merupakan data hasil pengukuran yang bisa berbentuk bilangan numerik bulat dan pecahan
dan mempunyai nilai nol mutlak. Data rasio dapat dilakukan operasi matematika dan yang
membedakannya dengan data interval adalah nilai nol mutlak.

Tabel 1. Perbedaan Jenis Data berdasarkan buku Pengolahan Data Statistik dengan SPSS
16.0
Data Nominal Data Ordinal Data Interval Data Rasio
Data kualitatif Data kualitatif Data kuantitatif Data kuantitatif
Tidak dapat dilakukan Tidak dapat Dapat dilakukan Dapat dilakukan
operasi matematika dilakukan operasi operasi matematika operasi matematika
matematika
Data dianggap setara Data mempunyai Data mempunyai Data mempunyai
tingkatan tingkatan tingkatan
Nilai nol sebagai Nilai nol sebagai Tidak mempunyai Mempunyai nilai nol
simbol simbol nilai nol mutlak mutlak
Contoh: Kategori Contoh: Motivasi Contoh: Pengukuran Contoh: Data berat
rumah tinggal kerja suhu badan

5
Contoh diagram Anova

5
suka

1 2 3 4 5 6 7 8 9 10 11 12
Objek

Diagram 1. Perbedaan tingkat preferensi antar objek. Sumbu x, nomer objek dari 1 s/d 12. Sumbu
y data interval evaluasi suka-tidak suka.

Oneway Anova
Summary of Fit

Rsquare 0.445692
Adj Rsquare 0.420287
Root Mean Square Error 1.543676
Mean of Response 3.253968
Observations (or Sum Wgts) 252

Analysis of Variance
Source DF Sum of Mean Square F Ratio Prob > F
Squares
Objek 11 459.8413 41.8038 17.5430 <.0001
Error 240 571.9048 2.3829
C. Total 251 1031.7460

6
Tabel 2. Nilai rata-rata preferensi dan standar deviasi 12 rumah tinggal. Nilai rata-rata (mean)
semakin tinggi tingkat preferensi semakin tinggi. Standar deviasi (std dev) semakin tinggi,
kesepakatan evaluasi semakin rendah.

Means for Oneway Anova


Level Number Mean Std Error Lower 95% Upper 95%
1 21 2.23810 0.33686 1.5745 2.9017
2 21 4.90476 0.33686 4.2412 5.5683
3 21 4.14286 0.33686 3.4793 4.8064
4 21 2.09524 0.33686 1.4317 2.7588
5 21 6.23810 0.33686 5.5745 6.9017
6 21 2.90476 0.33686 2.2412 3.5683
7 21 1.52381 0.33686 0.8602 2.1874
8 21 4.38095 0.33686 3.7174 5.0445
9 21 2.85714 0.33686 2.1936 3.5207
10 21 2.28571 0.33686 1.6221 2.9493
11 21 2.00000 0.33686 1.3364 2.6636
12 21 3.47619 0.33686 2.8126 4.1398

Std Error uses a pooled estimate of error variance

Means and Std Deviations


Level Number Mean Std Dev Std Err Mean Lower 95% Upper 95%
1 21 2.23810 1.26114 0.27520 1.6640 2.8122
2 21 4.90476 1.75798 0.38362 4.1045 5.7050
3 21 4.14286 1.27615 0.27848 3.5620 4.7238
4 21 2.09524 1.13599 0.24789 1.5781 2.6123
5 21 6.23810 1.04426 0.22788 5.7628 6.7134
6 21 2.90476 1.48003 0.32297 2.2311 3.5785
7 21 1.52381 0.74960 0.16358 1.1826 1.8650
8 21 4.38095 2.10894 0.46021 3.4210 5.3409
9 21 2.85714 1.93095 0.42137 1.9782 3.7361
10 21 2.28571 1.52128 0.33197 1.5932 2.9782
11 21 2.00000 1.54919 0.33806 1.2948 2.7052
12 21 3.47619 2.06444 0.45050 2.5365 4.4159

Temuan dari diagram


Data interval evaluasi suka-tidak suka didapat dengan menggunakan semantic differential method,
berskala 1 (sangat tidak suka) sampai dengan 7 (sangat suka). Garis tengah setiap mean diamond
merupakan rata-rata evaluasi setiap objek. Titik-titik pada bidang diagram merupakan skor evaluasi
dari setiap objek yang saling tumpang tindih.
Dari diagram dapat diketahui perbedaan tingkat preferensi mahasiswa S2 alur riset terhadap 12
rumah tinggal yang dievaluasi. Dapat disimpulkan bahwa objek yang paling disukai adalah objek 5,
yang kedua adalah objek 2, selanjutnya objek 8 dan 3, sedangkan yang paling tidak disukai adalah
objek 7.

7
Mean Diamond

Rata-rata dari nilai Ujung atas dan bawah


Std. merupakan batas
Deviasi interval 95%

Pada sebelah kanan terdapat diagram yang menunjukkan each pair student’s t atau mean
comparison, yaitu untuk mengetahui signifikansi suatu nilai rata-rata yang ada dalam Anova yang
ditunjukkan oleh lingkaran. Titik pusat lingkaran segaris-lurus dengan garis tengah mean diamond.
Diameter lingkaran mewakili interval 95%, segaris dengan titik teratas dan terbawah mean diamond.
Ukuran lingkaran tersebut menunjukkan masing-masing objek (pada sumbu x) dan besar kecilnya
tergantung jumlah datanya. Lingkaran semakin besar apabila datanya semakin kecil dan
signifikansinya dilihat dari overlap atau tidaknya lingkaran tersebut.
Pada diagram Anova tersebut mean diamond memiliki ukuran yang berbeda antara Studio AR2100,
AR3100, dan AR4000. Hal ini disebabkan adanya perbedaan jumlah data antara ketiganya. Data
Studio AR2100 jauh lebih banyak bila dibandingkan dengan AR3100 dan AR4000, serta data AR3100
juga lebih banyak dari AR4000, yaitu sebagai berikut:
- AR2100 : 189 data
- AR3100 : 84 data
- AR4000 : 47 data
Jumlah data Studio AR2100 sangat banyak bila dibandingkan dengan kedua data lainnya, sehingga
pada diagram mean diamond sangat lebar dan standard deviasinya menjadi lebih kecil bila
dibandingkan dengan mean diamond data yang lain. Hal ini berarti dengan data yang banyak maka
standard deviasi akan semakin kecil.

4
KM Programming

AR2100 AR3100 AR4000 Each Pair


Student's t
Studio
0.05

Diagram 2. Perbedaan tingkat KM (kemampuan mahasiswa) Programming antar studio. Sumbu x,


studio perancangan. Sumbu y data interval evaluasi kemampuan mahasiswa dalam programming

8
Dari diagram 2 dapat diketahui bahwa kemampuan mahasiswa programming, semakin lanjut
studionya, maka semakin rendah kemampuannya. Hal ini dapat disimpulkan bahwa pada studio awal
(AR2100) programming lebih diprioritaskan, namun pada studio selanjutnya tidak begitu
diperhatikan, sehingga kemampuan mahasiswa menurun. Namun, berdasarkan mean comparison,
dari ketiga data tersebut tidak terlalu signifikan, karena masing-masing saling overlap, terutama
antara studio AR2100 dan AR3100.

4.5

4
KM Desain

3.5

2.5

AR2100 AR3100 AR4000 Each Pair


Student's t
Studio
0.05

Diagram 3. Perbedaan tingkat KM (kemampuan mahasiswa) Desain antar studio. Sumbu x, studio
perancangan. Sumbu y data interval evaluasi kemampuan mahasiswa dalam desain.
Dari diagram 3, kemampuan desain mahasiswa dari studio AR2100, AR3100, maupun AR4000
perbedaannya tidak terlalu signifikan. Pada studio AR3100 terjadi penurunan, tetapi AR4000
kemampuan desainnya meningkat kurang lebih sama dengan AR2100. Dilihat dari mean
comparison, ketiganya overlap.

4
KM Strukkon

AR2100 AR3100 AR4000 Each Pair


Student's t
Studio
0.05

Diagram 4. Perbedaan tingkat KM (kemampuan mahasiswa) Strukkon antar studio. Sumbu x,


studio perancangan. Sumbu y data interval evaluasi kemampuan mahasiswa dalam strukkon.

9
Dari diagram 4, dapat diketahui bahwa semakin lanjut studionya, maka kemampuan struktur
konstruksi mahasiswa semakin rendah. Kemampuan stuktur dan konstruksi mahasiswa AR2100
paling tinggi dan AR4000 paling rendah. Hal ini disebabkan karena pengetahuan struktur konstruksi
lebih banyak diajarkan pada studio awal yaitu AR2100 dan pada studio lanjut kurang diprioritaskan.
Dari mean comparison terlihat bahwa perbedaan ini cukup signifikan karena data-data pada diagram
tidak saling overlap.

4
KM Rantap

AR2100 AR3100 AR4000 Each Pair


Student's t
Studio
0.05

Diagram 5. Perbedaan tingkat KM (kemampuan mahasiswa) Perancangan Tapak antar Studio.


Sumbu x, studio perancangan. Sumbu y data interval evaluasi kemampuan mahasiswa dalam rantap.

Kemampuan perancangan tapak mahasiswa dari diagram dapat dilihat bahwa pada studio AR3100
kemampuannya lebih tinggi dibandingkan dengan dua studio lainnya. Namun, perbedaan AR3100
dengan AR4000 tidak terlalu signifikan, dapat dilihat dari mean comparison yang overlap. Hal ini
disebabkan karena pada studio AR2100, desain hanya terbatas pada bangunan saja, perancangan
tapak belum diikutsertakan, sedangkan pada kedua studio lanjut, perancangan difokuskan pada
bangunan dan tapaknya juga.

ANALISIS KORELASI
Fungsi
Untuk mengetahui kedekatan hubungan antara variabel-variabel yang ditunjukkan dengan koefisien
korelasi (r) yang umumnya dipahami sbb:
0<r<0.2 korelasi sangat rendah
0.2<r<0.4 korelasi rendah
0.4<r<0.6 korelasi sedang
0.6<r<0.8 korelasi tinggi
0.8<r<1 korelasi sangat tinggi

10
Menurut buku Pengolahan Data Statistik dengan SPSS 16.0, Analisis korelasi digunakan untuk
mengetahui tentang derajat hubungan antara variabel, sehingga analisis korelasi berhubungan
berkaitan dengan derajat hubungan (seberapa kuat hubungan antara variabel-variabel itu terjadi).
Ukuran yang dipakai untuk mengetahui derajat hubungan, terutama untuk data kuantitatif disebut
koefesien korelasi.
Menurut Santoso (2009), ada dua hal dalam penafsiran korelasi yang berkaitan dengan arti angka
korelasi:
- Berkenaan dengan besaran angka, dengan rentang nilai korelasi:

-1 0 1
Korelasi Tidak ada Korelasi
Sempurna Korelasi Sempurna

Sebenarnya tidak ada ketentuan yang tepat mengenai apakah angka korelasi tertentu
menunjukkan tingkat korelasi yang tinggi atau lemah. Namun bisa dijadikan pedoman
sederhana bahwa angka korelasi di atas 0.5 menunjukkan korelasi yang cukup kuat,
sedangkan di bawah 0.5 korelasi lemah.
- Selain besar korelasi, tanda korelasi juga berpengaruh pada penafsiran hasil. Tanda –
(negatif) pada output menunjukkan arah hubungan yang berlawanan, sedangkan tanda +
(positif) menunjukkan arah hubungan yang sama. Dari gambar di atas, terlihat ada korelasi
yang negatif sempurna (-1) dan korelasi positif sempurna (+1)

Ciri-khas, sumbu x, sumbu y


Terdapat dua sumbu, yaitu sumbu x dan sumbu y, dimana dua-duanya merupakan data continous
(interval atau rasio).

Analisis korelasi dapat dibagi menjadi:


1. Bivariate yaitu analisis yang terdiri atas dua variabel saja.
2. Multivariate yaitu analisis yang terdiri atas banyak variabel, hasil dari analisis multivariat
berupa matriks korelasional.

ANALISIS KORELASI BIVARIAT


Analisis korelasi bivariat digunakan untuk mengetahui kedekatan hubungan dua variabel continous
(interval atau rasio).

11
Contoh diagram korelasi (bivariat)

4
KD Desain

1 2 3 4 5
SD Waktu

Diagram 6. Korelasi antara SD (Sikap Dosen) Waktu dan KD (Kontribusi Dosen) Desain. Sumbu x.
data continous atau interval berskala 1 sedikit s/d 5 banyak. Sumbu y, data continous atau interval
berskala 1 sedikit s/d 5 banyak.

Correlation
Variable Mean Std Dev Correlation Signif. Prob Number
SD Waktu 3.665625 1.170727 0.26826 <.0001 320
KD Desain 3.75625 0.987361
Significance
Nilai Probability
atau
korelasi
Significance
Value

12
Temuan dari Diagram 6
Titik pada diagram merupakan skor evaluasi yang saling tumpang tindih skor pada satu titik semakin
banyak. Ellips pada diagram melingkupi 50% dan 90% penyebaran data. Koefesien korelasi 0.27
rendah berarti sikap dosen yang meluangkan waktunya banyak belum tentu memiliki kontribusi pada
desain. Hubungan antara SD Waktu terhadap KD Desain rendah, sedangkan significance value
kurang dari 0.01% lebih kecil dari 0.05 sehingga hasilnya signifikan.

5
bagus

1 2 3 4 5 6 7
suka

.1 .2 .3 .4 .5 .6 .7 .8 .9 Quantile Density Contours


Biv ariate Normal Ellipse P=0.900

Diagram 7. Korelasi antara preferensi dan bagus. Sumbu x. data continous atau interval berskala 1
tidak suka s/d 7 suka. Sumbu y, data continous atau interval berskala 1 bagus s/d 5 jelek.

Correlation
Variable Mean Std Dev Correlation Signif. Prob Number
suka 3.371032 2.065343 0.825668 <.0001 504
bagus 3.65873 1.874439

13
Diagram 7 tersebut memiliki koefesien korelasi 0.83 (sangat tinggi), berarti jika bangunan semakin
bagus maka cenderung semakin disukai.
Secara visual, besar-kecil koefesien korelasi dapat diketahui dari penyebaran data pada scatter-plot
yang disusun dari sumbu x dan y dua variabel yang dikorelasikan. Jika density ellips yang melingkupi
penyebaran data semakin ramping dan diagonal maka koefesien korelasi akan semakin besar
(Gambar), sebaliknya jika density ellips semakin gemuk/bulat maka koefesien korelasi akan semakin
kecil (Gambar).
Significance Value
Menurut Santoso (2009), setelah angka korelasi didapat, maka bagian kedua dari output analisis
adalah menguji apakah angka korelasi yang didapat benar-benar signifikan atau dapat digunakan
untuk menjelaskan hubungan antara dua variabel.
Oleh karena itu, pada analisis JMP terdapat suatu nilai Signif. Prob yaitu Significance Probability
sama dengan Significance Value. Nilai significance value dari suatu nilai korelasi berdasarkan
kesepakatan umum harus memiliki nilai lebih kecil dari 0.05. Hal ini agar nilai korelasi tersebut
kemungkinan prediksinya meleset di bawah 5%.
Menurut buku Pengolahan Data Statistik dengan SPSS 16.0, signifikansi data ditandai dengan Flag
Significant Correlations, yaitu menunjukkan koefesien korelasi pada level signifikan 0.05 atau 5%.
Jika teridentifikasi akan diberi simbol asterisk tunggal (*), sedangkan jika pada level signifikan 0.01
atau 1% teridentifikasi maka akan diberi simbol dua asterisk (**).

ANALISIS KORELASI BIVARIAT

Korelasi multivariat melibatkan lebih dari dua variabel Jika sejumlah variabel dikorelasikan satu sama
lain, maka akan diperoleh sejumlah koefisien korelasi, yang disusun dalam matriks koefisien korelasi
yang berisikan nilai korelasional antar variabel seperti contoh di atas hasil dari evaluasi 23 rumah
tinggal yang terdiri atas delapan.

Matriks tersebut dapat dimanfaatkan untuk dengan cepat membandingkan besaran koefisien korelasi
antar variabel dan mengidentifikasi variabel-variabel yang memiliki korelasi sangat tinggi, tinggi,
sedang, rendah dan sangat rendah. Gambaran tinggi-rendah koefisien korelasi antar variabel
tersebut juga merupakan gambaran hubungan antar faktor yang menyusun fenomena yang diambil
datanya. Meskipun belum definitif, gambaran hubungan antar faktor tersebut dapat digunakan untuk
mereka-reka pola temuan analisis yang akan diperoleh jika data dianalisis lebih lanjut dengan analisis
multivariat yang lain.

14
Contoh matriks korelasi (multivariat)
Tabel 2. Matriks koefesien korelasi 8 variabel evaluasi rumah tinggal.

asli warna
sederhana modern proporsional suka terbuka unik
alami bagus
asli alami 1.00 0.11 -0.41 0.28 0.42 0.32 0.19 0.37
sederhana 0.11 1.00 -0.19 0.25 0.13 0.11 -0.25 0.08
modern -0.41 -0.19 1.00 -0.16 -0.08 0.01 0.10 -0.04
proporsional 0.28 0.25 -0.16 1.00 0.51 0.19 0.17 0.33
suka 0.42 0.13 -0.08 0.51 1.00 0.28 0.36 0.55
terbuka 0.32 0.11 0.01 0.19 0.28 1.00 0.22 0.27
unik 0.19 -0.25 0.10 0.17 0.36 0.22 1.00 0.34
warna bagus 0.37 0.08 -0.04 0.33 0.55 0.27 0.34 1.00

Hasil dari Tabel 3 (Matriks Koef. Korelasi)


Dari tabel dapat kita lihat hubungan antara kedelapan variabel tersebut masing-masing. Berdasarkan
variabel suka (preferensi) dengan variabel lainnya dapat disimpulkan bahwa yang memiliki koefesien
korelasi paling tinggi adalah warna bagus, kemudian selanjutnya proporsional, asri alami, unik,
terbuka dan sederhana. Koefesien korelasi modern adalah negatif, seperti telah disebutkan di atas
maka arah hubungannya yang berlawanan, yaitu tradisional. Apabila dilihat dari penjelasan
mengenai nilai koefesien korelasi di atas maka nilai suka dengan variabel lainnya cenderung memiliki
nilai sedang sampai ke rendah.

ANALISIS KORESPONDEN
“Correspondence analysis is a graphical technique to show which rows or columns of a frequency
table have similar patterns of counts. In the correspondence analysis plot there is a point for each
row and for each column.”
Fungsi
Untuk mengetahui hubungan antara variabel ordinal dengan variabel ordinal lainnya. Apabila dalam
analisis korelasi yang dicari adalah pengaruh antar variabel, maka dalam analisis koresponden yang
dicari adalah koinsiden, tidak saling mempengaruhi, tetapi terjadi bersamaan atau concurrent.
Analisis koresponden sering juga disebut multi dimension scaling (MDS). Hasil dari analisis
koresponden berupa scatter-plot atau special map. Kedekatan variabel ditunjukkan oleh distance
pada special map.
Ciri-khas, sumbu x, sumbu y
Sumbu x dapat berupa data nominal atau ordinal dan sumbu y berupa data nominal dan ordinal
juga, namun pada umumnya yang sering digunakan adalah sumbu x berupa data ordinal dan sumbu
y juga berupa data ordinal.

15
Analisis koresponden menampilkan koinsiden berdasarkan spesial map yang ditujukan dengan
distance.
1.00
9

0.75
7
Response

6
0.50

0.25 4

2
0.00
A B C D
Cheese

Gambar 1. Mosaic Plot, Analisis Kontigensi Respon terhadap Keju. Sumbu x keju dan sumbu y data
ordinal level respon, 1 s/d 9 dimana 9 adalah yang paling enak, count adalah frekuensi dari variabel.
1.5

1 2

1.0 3 B

4
0.5
C
5

0.0
c1

A
-0.5
7

8D
-1.0

-1.5
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5
c2

Gambar 2. Analisis koresponden level respon terhadap keju

16
Cheese

Response

Details
Singular Inertia Portion Cumulative
Value
0.73609 0.54183 0.6936 0.6936 Kemampuan menjelaskan
0.42010 0.17649 0.2259 0.9195 data 92%, mengetahui
0.25070 0.06285 0.0805 1.0000 valid atau tidaknya data

Cheese c1 c2 c3
A -0.3763 -0.2528 -0.3865 Persentase dalam
B 0.9553 0.4728 -0.0554 menjelaskan data
C 0.3981 -0.5540 0.2467
D -0.9771 0.3340 0.1952

Response c1 c2 c3
1 1.190 0.7764 -0.0490
2 1.222 0.8811 -0.1006
3 0.964 0.2628 0.0900
4 0.507 -0.0588 -0.1693
5 0.328 -0.6068 0.2705
6 -0.065 -0.0617 -0.0472
7 -0.623 -0.1480 -0.3510
8 -0.991 0.2634 0.0443
9 -1.259 0.6786 0.5852

Dari mosaic plot di atas kita dapat mengetahui bahwa keju yang memiliki row profiles mirip secara
berurutan adalah keju D, A, C, B, dengan demikian titik di dalam analisis koresponden akan
berdekatan letaknya, seperti terlihat pada diagram 9.
Dengan demikian, dari analisis koresponden dapat diketahui bahwa keju yang memiliki rasa paling
enak adalah keju D karena memiliki koinsiden paling banyak dengan level respon 8, kemudian yang
kedua adalah A yang berdekatan jaraknya pada special map dengan 7, setelah itu C dengan 5 dan B
dengan 3.

Contoh diagram analisis koresponden (variable ordinal – ordinal)


Pada umumnya analisis koresponden memiliki berupa data ordinal dan data ordinal juga. Untuk itu
dapat dilihat pada diagram 10, analisis korespondensi luas rumah per penghuni dan pendidikan. Dari
diagram dapat diketahui kedekatan antar variabel tersebut yang memiliki koinsiden paling banyak.
Hasil temuan dari diagram atau special map adalah sbb:
- Penghuni yang tidak sekolah dan pendidikan terakhirnya SD, SLTP memiliki luas rumah per
penghuni, luas < 9 m2.
- Penghuni yang pendidikan terakhirnya SLTA, D2 memiliki luas rumah per penghuni,
9 m2 < luas <18 m2

17
- Penghuni yang pendidikan terakhirnya D3 memiliki luas rumah per penghuni
18 m2 < luas <27 m2
- Penghuni yang pendidikan terakhirnya S1 dan S2 memiliki luas rumah per penghuni
luas >36 m2
Dengan demikian dapat disimpulkan, semakin tinggi pendidikan terakhirnya maka semakin luas
pula rumahnya.

2.0

1.5 S2

E. 36m2 ≤ luas
1.0 S1
D3

0.5
C. 18m2 ≤ luas < 27m2

D2 B. 9m2 ≤ luas < 18m2


c1

0.0 SLTA
SD
SLTP
-0.5 A. luas < 9m2

-1.0 Tidak Sekolah

-1.5

-2.0
-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
c2

Gambar 3. Analisis korespondensi luas rumah per penghuni dan pendidikan

Pendidikan

Luas Rumah _per Penghuni

18
Tabel 3. Kontigensi Penghasilan dan Luas Rumah _per Penghuni
Count A. luas B. 9m2 C. E.
< 9m2 ≤ luas 18m2 ≤ 36m2 ≤
Total %
< 18m2 luas < luas
Col % 27m2
Row %
A. PBK ≤ 400rb 6 3 2 0 11
6.25 3.13 2.08 0.00 11.46
17.65 9.68 9.52 0.00
54.55 27.27 18.18 0.00
B. 400rb < PBK ≤ 800rb 16 7 8 3 34
16.67 7.29 8.33 3.13 35.42
47.06 22.58 38.10 30.00
47.06 20.59 23.53 8.82
C. 800rb < PBK ≤ 1200rb 8 10 4 3 25
8.33 10.42 4.17 3.13 26.04
23.53 32.26 19.05 30.00
32.00 40.00 16.00 12.00
D. 1200rb < PBK ≤ 1600rb 4 6 3 2 15
4.17 6.25 3.13 2.08 15.63
11.76 19.35 14.29 20.00
26.67 40.00 20.00 13.33
E. 1600rb < PBK 0 5 4 2 11
0.00 5.21 4.17 2.08 11.46
0.00 16.13 19.05 20.00
0.00 45.45 36.36 18.18
34 31 21 10 96
35.42 32.29 21.88 10.42

19
1.0

E. 1600rb < PBK

0.5
E. 36m2 ≤ luas

B. 9m2 ≤ luas < 18m2


D. 1200rb < PBK ≤ 1600rb
C. 18m2 ≤ luas < 27m2
C. 800rb < PBK ≤ 1200rb
c1

0.0

B. 400rb < PBK ≤ 800rb

A. PBK ≤ 400rb
A. luas < 9m2
-0.5

-1.0
-1.0 -0.5 0.0 0.5 1.0
c2

Gambar 4. Analisis koresponden luas rumah per penghuni dan penghasilan

Penghasilan

Luas Rumah _per Penghuni

Gambar 4 yang berupa special map adalah analisis koresponden luas rumah per penghuni dan
penghasilan penghuni. Dari diagram dapat diketahui bahwa semakin tinggi penghasilan penghuni,
maka luas rumah per penghuni pun lebih luas.

ANALISIS KOMPONEN UTAMA


Fungsi
Untuk mencari faktor yang paling dominan, dengan cara pengelompokkan beberapa variabel yang
terukur menjadi latent variable berdasarkan kemiripan variabel, dilihat dari matriks koefesien
korelasinya.
Analisis komponen utama adalah teknik mereduksi data dengan mengubah (transform) kelompok
variabel awal (original) menjadi kelompok faktor atau komponen utama yang lebih kecil (lebih
sedikit) yang mencakup bagian terbesar dari seluruh variansi kelompok awal. Jumlah komponen
utama sesedikit mungkin. Seluruh komponen utama mencakup sebanyak mungkin dari seluruh

20
variasi awal (original total variation). Komponen utama merupakan kombinasi linier dari variabel-
variabel awal. Berbagai kombinasi linier (komponen utama) yang dihasilkan (extracted) tidak saling
berkorelasi.
Analisis komponen utama secara prinsip hampir sama dengan content analysis yaitu
mengelompokkan variabel, beberapa variabel yang memiliki kemiripan dikelompokkan sehingga
menjadi latent variable, seperti dapat dilihat di bawah ini.

Fenomena yang kecil-kecil Faktor dominan yang ada di fenomena-


fenomenanya

Measured Variable
Measured Variable
Measured Variable Latent Variable
Measured Variable
Measured Variable

Cara untuk menentukan komponen utama antara lain dengan:


- Kaiser (1958) menyarankan kriteria komponen utama dengan eigenvalue > 1. Alasan kriteria
ini adalah komponen utama harus lebih variance daripada variabel awal.
- Cattel (1966) menyarankan uji scree (puncak) yaitu dengan memplot kurva grafik eigenvalue
secara successive (urut besar) sehingga terbentu kurva tebing terjal (terbentuk dari
eigenvalue terpilih) dan patah mendekati garis lurus (terbentuk dari komponen-komponen
dengan eigenvalue rendah).
- Horn (1965) menyarankan penggunaan kurva referensi p/2 memotong kurva eigenvalue
sebagai batas komponen terpilih.
- Dillon (1984) menyarankan dengan membatasi nilai variansi kumulatif, misalnya dibatasi
sampai jumlah variansi mencapai 75% dari variansi keseluruhan.
Eigenvalue adalah kemampuan dari variabel untuk menjelaskan data. Cara mencari eigenvalue
adalah dengan memutar sumbu dan data tetap tidak diubah posisinya, sehingga nilainya akan
berubah. Misalnya ada 25 variabel maka ada 25 dimensi yang akan memposisikan titik-titik tersebut ,
sehingga akan didapat dimensi yang paling powerful untuk menjelaskan data.
Untuk mempermudah interpretasi, bisa dilakukan rotasi faktor. Faktor atau komponen utama bisa
dirotasi (diputar), sehingga loading berubah, demikian pula interpretasi berubah. Hal ini
dimaksudkan untuk mencari faktor utama yang paling berpengaruh. Cara rotasi antara lain varimax,
quartimax, oblimin, dan sebagainya. Varimax dan quartimax termasuk jenis rotasi ortogonal yang
mempertahankan sifat ortogonal. Rotasi varimax mencari kumpulan loading, sehingga sebagian
mendekati 0 (nol) dan lainnya mendekati +1 atau -1. Loading mendekati +1 atau -1 menunjukkan
hubungan yang kuat antara variabel dengan faktor. Sebaliknya loading mendekati 0 menunjukkan
hubungan yang lemah. Dengan demikian rotasi varimax mempermudah interpretasi faktor atau
komponen utama (Dillon, 1984). Rotasi ini sering digunakan untuk komponen utama dan
menghasilkan loading yang lebih besar.

21
Berikut adalah analisis komponen utama evaluasi terhadap 5 rumah tinggal:

Multivariate
Principal Components / Factor Analysis
Principal Components: on Correlations
Number Eigenvalue Percent Percent Cum Percent
1 2.8889 36.111 36.111
2 1.5338 19.173 55.284
3 0.9924 12.405 67.689
4 0.7716 9.645 77.334
5 0.5983 7.478 84.812
6 0.5661 7.076 91.888
7 0.4723 5.904 97.792
8 0.1766 2.208 100.000

Factor Rotation: Varimax


Prior Communality Estimates:1

Unrotated 0.669047 -0.162108 0.043247 -0.490793


Factor
Patternasri
alami
sederhana 0.545628 -0.450355 0.252213 0.413203
modern 0.042847 0.770708 0.156507 0.469894
proporsional 0.729897 -0.169787 0.077680 0.153865
suka 0.862738 0.158508 -0.249104 0.077492
terbuka 0.296953 0.253903 0.853345 -0.220409
unik 0.221952 0.766089 -0.188512 -0.245210
warna bagus 0.852773 0.073766 -0.265727 0.027546

Rotated Factor
Pattern
asri alami 0.599765 0.092038 -0.484610 0.337069
sederhana 0.449470 -0.716614 0.008694 0.138722
modern 0.060431 0.203564 0.879281 0.151318
proporsional 0.677170 -0.320772 -0.019023 0.171670
suka 0.907688 0.057470 0.101285 0.006249
terbuka 0.056216 -0.018103 0.106878 0.956303
unik 0.294099 0.732166 0.306845 0.122900
warna bagus 0.895919 0.034426 0.006117 -0.011775

Rotation -0.11034 -0.03574 0.25601


Matrix0.95969
0.05313 0.70876 0.67429 0.20044
-0.27235 -0.34940 0.12482 0.88778
0.04466 -0.60283 0.72696 -0.32576

Final 0.71665
Communality
Estimatesasri
alami
sederhana 0.73488

22
modern 0.84112
proporsional 0.59129
suka 0.83750
terbuka 0.92943
unik 0.73182
warna bagus 0.80403

Std Score 0.176361 0.267778 -0.536525 0.284014


Coefsasri
alami
sederhana 0.120360 -0.640580 0.216311 0.040665
modern 0.025181 -0.067747 0.800697 0.046122
proporsional 0.224179 -0.253899 0.071071 0.047022
suka 0.364941 0.067448 0.100689 -0.158392
terbuka -0.139507 -0.022253 0.007606 0.915936
unik 0.137809 0.603472 0.079287 0.054673
warna bagus 0.360366 0.073548 0.014409 -0.164131

Variance Percent Cum Percent


2.7402 34.252 34.252
1.2072 15.090 49.342
1.1243 14.054 63.396
1.1150 13.938 77.334

Tabel 4. Hasil faktor analisis evaluasi rumah tinggal


Unik
Preferensi Kompleksitas Modern Keterbukaan
asri alami 0.60 0.09 -0.48 0.34
sederhana 0.45 -0.72 0.01 0.14
modern 0.06 0.20 0.88 0.15
proporsional 0.68 -0.32 -0.02 0.17
suka 0.91 0.06 0.10 0.01
terbuka 0.06 -0.02 0.11 0.96
unik 0.29 0.73 0.31 0.12
warna bagus 0.90 0.03 0.01 -0.01

Dari faktor analisis maka didapatkan empat latent variabel: Preferensi, Unik kompleksitas,
Modern, dan keterbukaan. Pada diagram 11 dan 12 dapat dilihat scatter-plot evaluasi rumah
berdasarkan objek dan kategori objek, serta dua variabel paling dominan hasil dari analisis
komponen utama yaitu preferensi dan unik kompleksitas.

23
alami kontras
0.2
alami hangat

alami dingin
0.1
Unik Kompleksitas

-0.1

non alami kontras


non alami hangat

-0.2

non alami dingin

-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
Preferensi

Gambar 5. Scatter-plot kategori objek evaluasi rumah berdasarkan variabel paling dominan hasil
analisis komponen utama yaitu preferensi dan unik kompleksitas.

Pada gambar 5, sumbu x, angka semakin besar atau semakin ke kanan maka preferensi terhadap
rumah semakin besar. Sumbu y, angka semakin besar atau semakin ke atas maka unik kompleksitas
rumah semakin rumit. Dengan demikian, berdasarkan kategori objek, yang memiliki preferensi tinggi
secara berurutan adalah alami hangat, alami dingin, dan alami kontras, sedangkan yang memiliki
preferensi rendah secara berurutan adalah non alami kontras, non alami hangat, dan non alami
dingin. Apabila dilihat dari unik kompleksitas, kategori objek yang memiliki unik kompleksitas
cenderung memiliki preferensi tinggi, sedangkan yang tidak memiliki unik kompleksitas atau
sederhana biasa memiliki preferensi rendah.

24
1.5
9

14
1 4

24
19

29
0.5
Unik Kompleksitas

15
13 10
30 3 8
20
0
25
11

6
23
28
12
-0.5 1
27 22 18 7 2
26
21
17 16

-1
-1 -0.5 0 0.5 1
Preferensi

Diagram 6. Scatter-plot evaluasi rumah berdasarkan objek dan variabel paling dominan hasil
analisis komponen utama yaitu preferensi dan unik kompleksitas.

Seperti halnya pada gambar 5, pada gambar 6 ini, sumbu x, angka semakin besar atau semakin ke
kanan maka preferensi terhadap rumah semakin besar. Sumbu y, angka semakin besar atau semakin
ke atas maka unik kompleksitas rumah semakin rumit. Dengan demikian, berdasarkan objeknya
yang memiliki preferensi tinggi secara berurutan adalah objek dengan no. 10, 1, 8, 11, 3, sedangkan
yang memiliki preferensi rendah secara berurutan adalah objek dengan no. 27, 12, 29, 19, 24 dan
22. Apabila dilihat dari unik kompleksitasnya objek yang cukup rumit bentuknya adalah objek no. 9
dan 14, sedangkan yang cukup sederhana bentuknya adalah objek no. 17, 16. Dari diagram ini
dapat diketahui bahwa tinggi rendah preferensi tidak berhubungan dengan unik kompleksitas,
namun objek yang sangat rumit (seperti objek no 9, 14, 4, 24, dsb) cenderung memiliki preferensi
rendah. Objek yang memiliki preferensi tinggi cenderung tidak terlalu sederhana dan tidak terlalu
kompleks (letak pada scatter-plot di tengah).

25
ANALISIS KLASTER
Fungsi
Untuk mengelompokkan kategori berdasarkan kemiripan skor dari setiap kategori. Dari gambar di
bawah mahasiswa S2 Arsitektur ITB angkatan 2010 dikelompokkan evaluasinya terhadap 23 rumah
tinggal berdasarkan variabel preferensi dan proporsional. Posisi mahasiswa yang mengevaluasi
rumah hampir sama akan berdekatan.

ANS
MMPL
ARS
RK
RTS
YP
IS
MK
LR
AW
SHF
GAP
DHD
PD
JAR
L
FFAR
WY
IW
WI
HK

Gambar 7. Dendogram klaster mahasiswa S2 Arsitektur ITB angkatan 2010 berdasarkan evaluasi
terhadap rumah tinggal dilihat dari variabel preferensi dan proporsional. Huruf capital merupakan
kode inisial mahasiswa.

Dari dendogram klaster di atas dapat diketahui bahwa cabang dendogram menunjukkan
pengelompokkan mahasiswa yang mengevaluasi rumah tinggal cenderung mirip. Cabang semakin
pendek dan dekat menunjukkan kemiripan evaluasi oleh mahasiswa yang bersangkutan semakin
tinggi.

26
HK

0.5 ANS
MMPL
Proporsional

DHD
0 LR
PD
FFAR ARS YP RTS MK
IS
WY WI AW
SHF GAP
RK
IW

-0.5 JAR L

-1 -0.5 0 0.5

Preferensi

Gambar 8. Scatter-plot klaster mahasiswa S2 Arsitektur ITB angkatan 2010 berdasarkan evaluasi
terhadap rumah tinggal dilihat dari variabel preferensi dan proporsional.

Dari scatter-plot dapat dilihat bahwa sumbu x, angka semakin besar atau semakin ke kanan maka
evaluasi mahasiswa terhadap rumah tinggal berdasarkan preferensi semakin tinggi. Sumbu y, angka
semakin besar atau semakin ke atas maka evaluasi mahasiswa terhadap rumah tinggal berdasarkan
variabel proporsional semakin tinggi. Mahasiswa yang dikelompokkan berarti memiliki kemiripan
dalam mengevaluasi rumah tinggal.

ANALISIS REGRESI
Tujuan
Untuk melihat hubungan kausal (sebab-akibat)
Variabel Sebab Variabel Akibat
Variabel Bebas Variabel Terikat
Variabel Independen Variabel Dependen
Variabel Mempengaruhi Variabel Dipengaruhi
Variabel Criterion Variabel Predictor

27
Yang menentukan mana variabel sebab atau akibat adalah peneliti sendiri sebagai bagian dari
hipotesisi yang disusun oleh peneliti, bukan oleh formula statistik atau software analisis data,
kemudian pada analisis akan ditentukan hubungannya
BIVARIAT
Digunakan untuk mengetahu pola hubungan sebab akibat atau kausal antara dua variabel continous,
berupa kekuatan pengaruh (besar kecil), bentuk pengaruh (linear atau polinomial).
Seperti telah disebutkan di atas, pada analisis regresi digunakan istilah variabel yang mempengaruhi
(disebut juga variabel bebas, sebab

MULTIVARIAT
Analisis multivariat melibatkan lebih dari satu variabel sebab, dan digunakan untuk membandingkan
kekuatan pengaruh antara beberapa variabel sebab terhadap variabel akibat. Dengan demikian akan
diketahui variabel sebab yang dominan, kurang dominan atau tidak dominan mempengaruhi variabel
akibat. Semakin besar koefesien regresi (umumnya disebut bobot regresi atau regression weight)
semakin besar pengaruh terhadap variabel akibat.
Cara menentukan variabel sebab salah satunya adalah yang menjadi sebab, yang pertama terjadi
terlebih dahulu.
Yang harus diperhatikan dalam analisis regresi adalah sebagai berikut:
- Rsquare (Coef of Determination) 0-1
- RSME (Root Mean Square Error)
Rsquare adalah seberapa besar kemampuan regresi tersebut mewakili data, proporsi varians
yang dijelaskan oleh model semakin mendekati 1 semakin besar ‘porsi dari fenomena’ yang
dijelaskan oleh model. RSME adalah diskrepansi antara predicted value dan actual value,
semakin kecil semakin baik.
- Significant Value <0.05
- Regression Weight (Estimate)
- Fit line – Garis regresi, yaitu prediksi berdasarkan regresi secara linier, nilai-nilai pada garis
tersebut disebut sebagai prediction value
- Fit Polynomial – Kurva regresi
Suatu regresi lebih tepat linier atau kurva (polinomial) ditentukan oleh nilai Rsquare
Pada gambar 9 di bawah, regresi linier dan polinomial antara kelahiran dan kematian, satu titik
mewakili satu negara. Rsquare 0.5 dapat diinterpretasikan kemungkinan 50% dari fenomena dapat
dijelaskan dengan model regresi yang dibuat, kemungkinan 40% tidak dapat dijelaskan. Rsquare
regresi polinomial lebih besar daripada regresi linier dan RSME regresi polinomial lebih kecil daripada
regresi linier, karena itu hubungan antara kelahiran dan kematian lebih tepat menggunakan regresi
polinomial atau kurva lengkung. Kelahiran tinggi maupun rendah, kematian akan selalu tinggi.
Kematian paling rendah jika kelahiran sedang.
Dari diagram tersebut dapat disimpulkan sebagai berikut:
- Untuk negara-negara maju, tingkat kelahiran rendah dan tingkat kematian rendah
- Untuk negara-negara berkembang, tingkat kelahiran tinggi dan tingkat kematian tinggi
- Untuk negara-negara yang terkena perang, tingkat kelahiran rendah dan tingkat kematian
tinggi

28
CONTOH REGRESI BIVARIAT

30 AFGHANISTAN

UPPER VOLTA

25

ANGOLA
ETHIOPIA
IVORY COAST
CAMEROONMADAGASCAR
NIGERIA

20 NEPAL
SAUDI ARABIA
BANGLADESH
MOZAMBIQUE
ZAIRE
death

SUDAN
VIETNAM TANZANIA
UGANDA
INDONESIA ALGERIA
MOROCCO
15 BURMA
INDIA
GERMANY, DEM REP GUATEMALA GHANA
PAKISTANIRAQ
SYRIA KENYA
RHODESIA
AUSTRIA EGYPT
PERU
BELGIUM
GERMANY,
UNITEDFED REP
HUNGARY
OF
KINGDOM TURKEY IRAN
SOUTH AFRICA KOREA, DEM PEO REP
FRANCE
SWEDEN CZECHOSLOVAKIA CHINA ECUADOR
10 ITALY BULGARIA ARGENTINA
PORTUGAL
ROMANIA BRAZIL
COLOMBIA
PHILIPPINES
THAILAND
GREECE
SWITZERLAND
UNITED
USSRPOLAND
STATES SRI_LANKA
AUSTRALIA
NETHERLANDS
SPAIN
YUGOSLAVIA
CANADA CHILE MEXICO
JAPAN CUBA KOREA, REPUBLIC
MALAYSIAOF VENEZUELA
5 TAIWAN

10 20 30 40 50
birth

Linear Fit
Polynomial Fit Degree=2

Gambar 9. Regresi linier dan polinomial antara kelahiran dan kematian.

29
Linear Fit
death = 4.5709585 + 0.2626354*birth
Summary of Fit
RSquare 0.468562
RSquare Adj 0.461181
Root Mean Square Error 3.896204
Mean of Response 13.06757
Observations (or Sum
Wgts) 74

Parameter Estimates
Term Estimate Std Error t Ratio Prob>|t|
Intercept 4.5709585 1.158603 3.95 0.0002
birth 0.2626354 0.032963 7.97 <.0001

Polynomial Fit, degree=2


death = -0.904668 + 0.3181063*birth + 0.0194976*(birth-32.3514)^2
Summary of Fit
RSquare 0.674653
RSquare Adj 0.665488
Root Mean Square Error 3.069911
Mean of Response 13.06757
Observations (or Sum
Wgts) 74

Parameter Estimates
Term Estimate Std Error t Ratio Prob>|t|
Intercept -0.904668 1.224752 -0.74 0.4626
birth 0.3181063 0.027258 11.67 <.0001
(birth-32.3514)^2 0.0194976 0.002907 6.71 <.0001

Koef. Regresi/Bobot Regresi Significant Value

30
CONTOH REGRESI MULTIVARIAT

5
suka Actual

1 2 3 4 5 6 7
suka Predicted P<.0001
RSq=0.71 RMSE=0.8674

Gambar 10. Scatter-plot predicted value dan actual value variabel akibat, dengan variabel akibat
preferensi (tdk suka-suka) dan variabel sebab asri alami (tdk asri alami-asri alami), sederhana
(sederhana-kompleks), modern (tradisional-modern), proporsional (tdk proporsional-proporsional),
terbuka, unik, dan warna bagus (jelek-bagus).

Pada gambar 10, jika titik menyebar semakin mendekati garis diagonal, maka Rsquare akan semakin
besar/semakin mendekati angka 1 dan RSME semakin kecil/semakin mendekati angka 0.
Berdasarkan diagram regresi di atas yang memiliki koefesien regresi paling tinggi adalah warna
bagus, sehingga warna bagus memiliki pengaruh yang paling besar terhadap suka (preferensi)

31
Fit Least Squares
Summary of Fit

RSquare 0.705801
RSquare Adj 0.702781
Root Mean Square Error 0.867353
Mean of Response 3.581159
Observations (or Sum 690
Wgts)
Analysis of Variance
Source DF Sum of Mean Square F Ratio
Squares
Model 7 1230.8852 175.841 233.7369
Error 682 513.0699 0.752 Prob > F
C. Total 689 1743.9551 <.0001

Lack Of Fit
Source DF Sum of Mean Square F Ratio
Squares
Lack Of Fit 633 484.81992 0.765908 1.3285
Pure Error 49 28.25000 0.576531 Prob > F
Total Error 682 513.06992 0.1076
Max RSq
0.9838
Parameter Estimates
Term Estimate Std Error t Ratio Prob>|t|
Intercept -0.602476 0.20583 -2.93 0.0035
asri alami 0.0474428 0.02691 1.76 0.0783
sederhana 0.04037 0.026019 1.55 0.1212
modern 0.0665983 0.021985 3.03 0.0025
proporsional 0.2018467 0.030977 6.52 <.0001
terbuka -0.015168 0.030641 -0.50 0.6207
unik 0.1066447 0.024085 4.43 <.0001
warna 0.649158 0.024754 26.22 <.0001
bagus

Koef./Bobot Regresi Significant Value

32
Parameter estimates adalah bobot regresi dan significant value regresi multivariat. Bobot regresi
masing-masing variabel sebab tertulis di kolom estimate. Significant value untuk semua variabel
sebab tidak semuanya kurang dari 0.00 (lihat kolom paling kanan Prob>|t|)

1
suka Residual

-1

-2

-3

-4
1 2 3 4 5 6 7
suka Predicted

Fit Stepwise
Variabel-variabel yang tidak signifikan dikeluarkan, kemudian variabel-variabel yang dipakai adalah
yang signifikan

33

Anda mungkin juga menyukai