Anda di halaman 1dari 50

Statistic Multivariate

Pengertian
Analisis statistik multivariat merupakan metode
statistik yang memungkinkan kita melakukan
penelitian terhadap lebih dari dua variable secara
bersamaan.

Statistika multivariat saat ini diterapkan di hampir


semua cabang ilmu, baik ilmu pengetahuan alam
maupun sosial. Teknik-tekniknya disukai karena
dianggap mampu memodelkan kerumitan sistem yang
nyata, meskipun sulit untuk diterapkan. Komputer
dengan kapasitas memori yang besar tidak
terhindarkan dalam analisis data yang menggunakan
statistika multivariat.
Beberapa Teknik Multivariat

Teknik analisis multivariat secara dasar diklasifikasi


menjadi dua, yaitu analisis dependensi dan analisis
interdependensi.
Analisis dependensi berfungsi untuk menerangkan atau
memprediksi variable (variable) tergantung dengan
menggunakan dua atau lebih variable bebas. Yang
termasuk dalam klasifikasi ini ialah Multiple Regression
Analysis, Discriminant analysis, Analisis Variansi
Multivariate (MANOVA), dan Canonical correlation
analysis.
Klasifikasi untuk metode dependensi oleh Zikmund (1997: 635)
digambarkan sebagai berikut:
Metode Dependensi

Jumlah Variabel
Tergantung

Satu Variabel Beberapa Variabel Beberapa Variabel Bebas


Tergantung Tergantung dan Tergantung

Metrik Non Metrik Metrik Non Metrik Metrik atau Non


Metrik

Analisis Analisis Analisis Analisis Analisis


Regresi Diskriminan Varian Conjoint Korelasi
Berganda Multivariat Kanonikal
1. Multiple Regression Analysis
2. Discriminant analysis

Discriminant analisis adalah teknik untuk


mengklasifikasi sekumpulan pengamatan ke dalam kelas
standar. Tujuannya adalah untuk menentukan kelas yang
berdasarkan pengamatan sejumlah variabel yang dikenal
sebagai predictors atau input variabel. Model yang
dibangun berdasarkan satu set observasi kelas yang
dikenal. Dan juga berguna untuk memprediksi
probabilitas suatu obyek-obyek atau individu-individu
yang dimiliki oleh beberapa kategori yang berbeda
didasarkan pada beberapa variable bebas
3. Analisis Variansi Multivariate (MANOVA)
Analisis Variansi Multivariate mempunyai pengertian
sebagai suatu teknik statistik yang digunakan untuk
menghitung pengujian signifikansi perbedaan rata-rata
secara bersamaan antara kelompok untuk dua atau
lebih variable tergantung. Teknik ini bermanfaat untuk
menganalisis variable-variabel tergantung lebih dari
dua yang berskala interval atau rasio, Untuk
menentukan apakah terdapat perbedaan signifikan
secara statistik pada beberapa variable yang terjadi
secara serentak antara dua tingkatan dalam satu
variabel
4. Conjoint Analysis

Conjoint Analysis, yang disebut juga multi-atribut


compositional model atau dinyatakan analisis
preferensi, adalah teknik statistik yang berasal dari
matematika psikologi. Hari ini digunakan dalam
banyak ilmu sosial dan menerapkan ilmu termasuk
pemasaran, manajemen produk, dan riset operasi. Hal
ini tidak akan bingung dengan teori umum pengukuran
5. Canonical correlation analysis
Analisis korelasi kanonik adalah salah satu cara untuk
mengukur panjang hubungan antara dua variabel
multidimensi. Ia menemukan dua basis, satu untuk
setiap variabel, yang optimal sehubungan dengan
correlations, dan pada saat yang sama, ia menemukan
yang sesuai correlations. Dengan kata lain, ia
menemukan dua basis dimana matriks korelasi antara
variabel-variabel tersebut dan diagonal correlations pada
diagonal yang maksimal. Kematraan yang baru ini
berbasis sama dengan atau kurang dari kematraan
terkecil dari dua variabel.
Analisis interdependensi berfungsi
untuk memberikan makna
terhadap seperangkat variable
atau membuat kelompok-
kelompok secara bersama-sama.
Yang termasuk dalam klasifikasi
ini ialah analsis faktor, analisis
kluster, dan multidimensional
scaling.
Klasifikasi untuk metode interdependensi oleh Zikmund (1997: 635)
digambarkan sebagai berikut:

Metode Interdependensi

Jenis
Masukan

Metrik Non
Metrik

Analisis Analisis Multidimensional Multidimensional


Faktor Kluster Scaling Metrik Scaling Non Metrik
1. Factor Analysis (FA)

Kegunaan utama analisis faktor ialah untuk melakukan


pengurangan data atau dengan kata lain melakukan
peringkasan sejumlah variabel menjadi lebih kecil
jumlahnya. Pengurangan dilakukan dengan melihat
interdependensi beberapa variabel yang dapat dijadikan
satu yang disebut dengan faktor, sehingga ditemukan
variabel-variabel atau faktor-faktor yang dominan atau
penting untuk dianalisa lebih lanjut.
Analisis faktor juga berguna untuk membuat ringkasan
informasi yang berisi jumlah variable yang banyak
menjadi sejumlah factor yang lebih sedikit
2. Cluster Analysis
Cluster analisis, juga disebut segmentasi atau analisis
analisis taxonomy, berusaha untuk mengidentifikasi
homogen subgroups kasus dalam populasi. Artinya, analisis
cluster digunakan apabila peneliti tidak mengetahui jumlah
kelompok di muka, tetapi keinginan untuk membentuk
kelompok dan kemudian menganalisa anggota grup.
Berguna membuat klasifikasi individu-individu atau
obyek-obyek ke dalam jumlah yang lebih kecil kelompok
yang berbeda dengan tujuan untuk meyakinkan bahwa akan
terdapat kesamaan yang besar dalam kelompok-kelompok
tersebut dan perbedaan antar kelompok-kelompok tersebut
Cluster analisis adalah suatu alat analisis
penyelidikan data untuk memecahkan klasifikasi
masalah. Obyeknya adalah untuk mengurutkan kasus
(orang, hal, kejadian, dll) ke dalam kelompok, atau
kelompok, sehingga sudut ikatan yang kuat antara
anggota cluster yang sama dan lemah di antara anggota
kelompok yang berbeda. Setiap klaster sehingga
menjelaskan, dari segi data yang dikumpulkan, kelas
yang dimiliki para anggotanya, dan penjelasan ini
dapat digunakan melalui abstracted dari khusus ke
umum kelas atau jenis.
3. Multidimensional Scaling

Multidimensional scaling (MDS) adalah kumpulan


teknik statistik terkait yang sering digunakan dalam
visualisasi untuk menjelajahi informasi atau kesamaan
dissimilarities dalam data. MDS adalah hal khusus dari
pentahbisan. MDS algoritma yang dimulai dengan
matriks barang-barang kesamaan, kemudian memberikan
lokasi untuk setiap item dalam ruang N-dimensi, dimana
N adalah sebuah priori yang ditentukan. Cukup kecil
untuk N, lokasi yang dihasilkan dapat ditampilkan dalam
grafik atau visualisasi 3D.
4. Principal component analysis
Principal component analysis bertujuan untuk
menyederhanakan variabel yang diamati dengan cara menyusutkan
(mereduksi) dimensinya. Hal ini dilakukan dengan cara
menghilangkan korelasi diantara variabel bebas melalui transformasi
variabel bebas asal ke variabel baru yang tidak berkorelasi sama
sekali atau yang biasa disebut dengan principal component. Setelah
beberapa komponen hasil PCA yang bebas multikolinearitas
diperoleh, maka komponen-komponen tersebut menjadi variabel
bebas baru yang akan diregresikan atau dianalisa pengaruhnya
terhadap variabel tak bebas (Y) dengan menggunakan analisis
regresi.
Walaupun metode Regresi dengan PCA ini memiliki tingkat
kesulitan yang tinggi akan tetapi kesimpulan yang diberikan lebih
akurat dibandingkan dengan pengunaan metode lain.
Keuntungan penggunaan Principal Component
Analysis dibandingkan metode lain :

1.Dapat menghilangkan korelasi secara bersih


(korelasi=0) sehingga masalah multikolinearitas dapat
benar-benar teratasi secara bersih.

2.Dapat digunakan untuk segala kondisi data /


penelitian.

3.Dapat dipergunakan tanpa mengurangi jumlah


variabel asal.
5. Structural Equation Modelling

Struktural equation modeling (SEM) merupakan


teknik statistik untuk pengujian dan memperkirakan
hubungan kausal menggunakan kombinasi data statistik
dan kualitatif asumsi kausal. Pandangan ini telah
disampaikan oleh genetika Sewall Wright (1921), ekonom
yang Trygve Haavelmo (1943) dan Herbert Simon (1953),
dan secara resmi ditetapkan oleh JUDEA Pearl (2000)
menggunakan kalkulus dari counterfactuals.
Univariate Statistik

statistik univariat dapat diklasifikasikan


ke dalam
statistik parametrik dan nonparametrik.
1. Statistik parametrik digunakan bila outcome
yang diamati bersifat kontinu.

2. Statistik nonparametrik tidak membuat asumsi


tentang bagaimana data terdistribusi dan, oleh
karena itu, sering digunakan bila asumsi suatu uji
parametrik tidak terpenuhi.
Univariate Statistik

Statistik univariat lebih sering digunakan dan


lebih mudah dihitung daripada statistik
multivariat. Statistik univariat biasanya
membandingkan nilai mean dan median pada
dua kelompok atau lebih atau membandingkan
proporsi subjek-subjek yang memiliki suatu
ciri tertentu atau yang tergolong dalam
berbagai kategori..
STATISTIKA ALAT UTAMA METODE ILMIAH

1. Metode Ilmiah

Metode ilmiah adalah prosedur yang dipergunakan oleh ilmuwan


dalam pencarian sistematis terhadap pengetahuan baru dan
peninjauan kembali pengetahuan yang telah ada (The Liang Gie,
1999).  Dalam  Dictionary of Behavior dikemukakan bahwa, metode
ilmiah adalah teknik dan prosedur-prosedur pengamatan dan
percobaan yang menyelidiki ilmu dan dipergunakan oleh ilmuwan-
ilmuwan untuk mengolah fakta-fakta, data, dan penafsirannya sesuai
dengan asas-asas dan aturan tertentu.
STATISTIKA ALAT UTAMA METODE ILMIAH

2. Peran Statistika dalam Pengembangan Ilmu dan Teknologi

Setiap jenis pengetahuan  mempunyai ciri-ciri yang spesifik


mengenai apa (ontologi), bagaimana (epistemologi), dan untuk apa
(aksiologi) pengetahuan tersebut disusun.  Ketiga landasan ini saling
berkaitan. Ontologi ilmu terkait dengan epistemologi ilmu, dan
epistemologi ilmu terkait dengan aksiologi ilmu, dan seterusnya. 
Jadi, kalau kita ingin membicarakan epistemologi ilmu, maka hal ini
harus dikaitkan dengan ontologi dan aksiologi ilmu (Suriasumantri, 
2003). Metode ilmiah sebagai metode utama dalam mendapatkan
ilmu, melalui proses logico-hipotetico-verifikasi menempatkan
statistika sebagai alat utamanya.
ANALISIS REGRESI DAN KORELASI
BERGANDA
Bentuk persamaan regresi dengan dua variabel indenpenden adalah:

Y = a + b1 X1 + b2 X2
Bentuk persaman regresi dengan 3 veriabel independen adalah :

Y = a + b X1 + b2 X2 + b3 X3

Bentuk umum persamaan regresi untuk k variabel indenden dapat


dirumuskan sebagai berikut:

Y = a + b1 X1 + b2 X2 + b3X3 + … + bk Xk
23
Persamaan untuk mendapatkan
koefisien regresi
Prinsip metode ordinary least square(OLS) adalah
meminimumkan jumlah kuadrat deviasi di sekitar
garis regresi. Nilai koefisien regresi a, b1, dan b2
dapat dipecahkan secara simultan.

Y = na + b1X1 + b2X2 (1)


X1Y = aX1 + b1X12 + b2X1 X2 (2)
X2Y = aX2 + b1X1 X2 + b2X22 (3)

24
CONTOH: PERMINTAAN DIPENGARUHI HARGA DAN PENDAPATAN

Nomor Permintaan (Y) Harga Pendapatan


Sampel Minyak ( minyak (X1) (Rp (X2)

1 3 8 10
2 4 7 10
3 5 7 8
4 6 7 5
5 6 6 4
6 7 6 3
7 8 6 2
8 9 6 2
9 10 5 1
10 10 5 1
25
Untuk mendapatkan koefisien regresi, perlu dihitung : Y,
X1, X2, X1Y, X12, X1 X2, X2Y, X22

Y X1 X2 YX1 YX2 X12 X2 2 X1X2


3 8 10 24 30 64 100 80
4 7 10 28 40 49 100 70
5 7 8 35 40 49 64 56
6 7 5 42 30 49 25 35
6 6 4 36 24 36 16 24
7 6 3 42 21 36 9 18
8 6 2 48 16 36 4 12
9 6 2 54 18 36 4 12
10 5 1 50 10 25 1 5
10 5 1 50 10 25 1 5
X1Y= X2Y= X12= X22= X1X2 =
Y=68 X1 = 63 X2 =46 409 239 405 324 317

26
Dengan metode eliminasi
68 = 10a + 63b1+ 46b2 …(1)
409 = 63a + 405b1+ 317b2 …(2)
239 = 46a + 317b1+ 324b2 …(3)
Untuk mendapatkan nilai koefisien regresi a, b1, dan b2 dapat
dilakukan dengan Subtitusi antar persamaan
-428,4 = -63a –396,9 b1-289,8b2
…persamaan 1 dikalikan – 6,3
409 = 63a + 405b1 + 317b2 …..…………………. (2)
-19,4 = 0 + 8,1b1 + 27,2b2 ……………………. (4)

-312,8 = -46a –289,8 b1 - 211,6b2 Persamaan 1 dikalikan –4,6


239 = 46a + 317b1 + 324b2 ………………………..... (3)
-73,8 = 0 + 27,2b1 + 112,4b2 ………………………. (5)
27
Dari persamaan diatas, nilai b2 adalah = -8,65/21,06 = -0,41.
Setelah menemukan nilai b2, nilai b1 dapat dicari dengan
mempergunakan persamaan 4 atau 5.
-19,4 = 0 + 8,1b1 + 27,2(-0,41) ……… (4)
19,4 = 8,1b1 - 11,18
8,1b1 = -19,4 + 11,18
8,1 b1 = - 8,22
b1 = -8,22/8,1 = -1,015

68 = 10a + 63 (-1,015) + 46(-0,41)……………………….. (1)


68 = 10a - 63,96 – 18,90
10a = 63 + 92,86
a = 150,86/10 = 15,086

Dengan menemukan nilai koefisien regresi a, b1, dan b2 maka persamaan


regresinya dapat dinyatakan sebagai berikut:

Y = 15,086 – 1,015X1 – 0,41 X2

28
RUMUS KOEFISIEN DETERMINASI (R2)
Koefisien Determinasi menunjukkan suatu proporsi dari
varian yang dapat diterangkan oleh persamaan regresi
(regression of sum squares, RSS). Besarnya koefisien
determinasi dirumuskan sebagai berikut:

( Ŷ  Y ) 2

R 
2
atau
(Y  Y ) 2

n (a. Y  b1 . YX1  b 2 YX 2 )  ( Y) 2


R2 
n. Y  ( Y)
2 2

29
n (a. Y  b1 . YX1  b 2 YX 2 )  ( Y) 2

R 
2

n. Y  ( Y)
2 2

R2 
10 (15,086)( 68)  1, 015( 409)  ( 0, 41)( 239)   ( 68) 2

(10)(516)  (68) 2

R 2  0,939

30
Korelasi sederhana
n  YX1   Y  X1
rYX1 
n Y    Y .n X    X  
2 2 2
1 1
2

n  YX 2   Y X 2
rYX 2 
n Y   Y .n X    X  
2 2 2
2 2
2

n  X1X 2   X1  X 2
rX1X 2 
n  X2
1
2

  X 1  . n  X    X 2 
2
2
2

31
Coba hitung masing-masing nilai
korelasi tersebut.

ryx1 

ryx 2 

rx1x 2 

32
KORELASI PARSIAL: Hubungan variabel
dengan asumsi variabel lain tetap

rYX1  rYX 2 rX1X 2


rYX1 .X 2 
(1  r 2
YX 2 )(1  r 2
X1X 2 )
ryX1.X2= korelasi Y dengan X1,
dimana X2 tetap

33
rYX 2  rYX1 rX1X 2
rYX 2 .X1 
(1  r 2
YX1 )(1  r 2
X1X 2 )
rX1X 2  rYX1 rYX 2
rX1X 2 .Y 
(1  r 2
YX1 )(1  r 2
YX 2 )

34
Coba hitung masing-masing nilai
korelasi parsial tersebut

ryx1 .x 2 

ryx 2 . x1 

rx1x 2 . y 
35
Kesalahan Baku (standar error pendugaan)

( Ŷ  Y )

2

S 
n  ( k  1)
Y . X 1X 2

SY.X1.X2: Kesalahan baku atau standar error pendugaan


Variabel Y
berdasarkan variabel X1 dan X2
Ŷ : Nilai dugaan dari Y di mana X1 dan X2 diketahui
Y : Nilai pengamatan dari Y
N : Jumlah sampel atau data
K : Jumlah variabel bebas
36
Persamaan Ŷ=15,086 – 1,015 X1 – 0,41 X2
Y X1 X2 Ŷ =15,086 – 1,015 X1 – 0,41 X2 (Ŷ–Y) (Ŷ–Y)2

3 8 10 2,86=15,086 – 1,015 (8) – 0,41(10)


0,14 0,02
4 7 10 3,87=15,086 – 1,015 (7) – 0,41(10)
0,13 0,02
5 7 8 4,69=15,086 – 1,015 (7) – 0,41 (8)
0,31 0,09
6 7 5 5,92=15,086 – 1,015 (7) – 0,41 (5)
0,08 0,01
6 6 4 7,35=15,086 – 1,015 (6) – 0,41 (4)
-1,35 1,83
7 6 3 7,76=15,086 – 1,015 (6) – 0,41 (3)
-0,76 0,58
8 6 2 8,17=15,086 – 1,015 (6) – 0,41 (2)
-0,17 0,03
9 6 2 8,17=15,086 – 1,015 (6) – 0,41 (2)
0,83 0,68
10 5 1 9,60=15,086 – 1,015 (5) – 0,41 (1)
0,40 0,16
10 5 1 9,60=15,086 – 1,015 (5) – 0,41 (1)
0,40 0,16
 (Ŷ – Y)2
3,58 37
15
15
10
10

55

00
11 22 33 44 55 66 77 88 99 10
10
n – (k+1) 10 – (2+1)

YY Y'
Y'

S Y . X1 X 2 
 ( Ŷ  Y ) 2


3.58
 0,72
n  (1  k ) 10  (2  1)

38
Atau dapat juga dicari dengan rumus sbb:

SY . X 1 X 2 
Y 2
 a  Y  b1  X 1Y  b2  X 2Y
n3
516  (15,086 x 68)  (1,01524  409)  (0,41 x 239)
SY.X1X 2 
10  3
SY.X1X 2  0,72

39
Kesalahan baku penduga (standar error
estimation Sb)
• Yaitu seberapa nilai penduga yaitu b1 dan b2 dari
nilai sebenarnya (parameter populasi)

S y . x1x 2
Sb1   0,580
 2
2
(X  n X1 )(1  rX1X 2 )
2
1

40
S y . x1x 2
Sb 2 
 2
2
(X  n X 2 )(1  rX1X 2 )
2
2

Sb 2  0,156

41
Uji Signifikansi parsial atau individu

b1  B1  1,015  0
t hit .b1    1,75
Sb1 0,58

b 2  B2  0,410  0
t hit .b 2    2,673
Sb 2 0,1558

42
Uji Parsial
• Dalam uji pasial, masing-masing koefisien thit
untuk masing-masing koefisien tersebut diuji,
apakah signifikan atau tidak
• Bentuk pengujian sama seperti sebelumnya
dua arah atau satu arah
• Hipothesis yang diuji:
• Ho: b1=0 dan
• Ha: b2  0
43
UJI GLOBAL ATAU UJI SIGNIFIKANSI SERENTAK (UJI F)

Hipotesa yang ingin diuji adalah kemampuan


variabel bebas menjelaskan tingkah laku variabel
tidak bebas, apabila variabel bebas tidak dapat
mempengaruhi variabel bebas dapat dianggap nilai
koefisien regresinya sama dengan nol, sehingga
berapa pun nilai variabel bebas tidak akan
berpengaruh terhadap variabel bebas. Terhadap
persamaan pada contoh satu yaitu Y = 15,086 –
1,015X1 – 0,41 X2, variabel bebas X1, dan X2
dikatakan mampu mempengaruhi Y apabila nilai
koefisien b1 dan b2 tidak sama dengan nol, apabila
sama dengan nol, maka dikatakan tidak mampu
mempengaruhi variabel bebas Y. 44
Tabel F
Untuk uji ini digunakan tabel F. Nilai F-tabel perlu
diketahui derajat bebas pembilang pada kolom,
derajat bebas penyebut pada baris dan taraf nyata
Diketahui ada tiga variabel yaitu Y, X1, dan X2, jadi
k=3, sedangkan jumlah n=10.
Jadi derajat pembilang k - 1=3 - 1=2, sedangkan
derajat penyebut n - k=10 - 3=7 dengan taraf nyata
5%. Nilai F-tabel dengan derajat pembilang 2 dan
penyebut 7 pada taraf nyata 5% adalah 4,74

45
Nilai F-hitung ditentukan dengan
rumus sebagai berikut:
:

R 2 /( k  1)
F
(1  R 2 ) /( n  3)

0 ,933 /( 3  1)
F  0 ,4665 / 0 ,0096  48 ,73881
( 1  0 ,933 ) /( 10  3 )

46
UJI GLOBAL ATAU UJI SIGNIFIKANSI
SERENTAK (UJI F)

Tolak Ho

Terima
Ho

F-Tabel=4,74
F-Hitung=
48,74

47
Tampilan printout Regresi Berganda
Model R R Square Adjusted R Sts. Eror of
Square the Estimate
1 .647a .419 .379 537549.548

Berdasarkan data Tabel diatas menunjukkan hasil uji


regresi berganda :
( 1 ) Nilai R square = 0,419.
( 2 ) Nilai Ry12 = 0,647.
( 3 ) Nilai SEE = 537.549,547.

48
Model Unstandardized Standardized t Sig.
Coefficients Coefficeient

B Std.Error Beta

1 ( Constant ) 100004 1059097 .752 .944 .353


Harga 792852.6 186021.7 .214 4.262 .000
Biaya promosi 3.378 2.785 1.213 .235

49
Dari data diatas,

• a = 1.000.044.
• b1= 792.852,6.
• b2= 3,378.
• Persamaan regresi yang didapat adalah
sebagai berikut :
• Y = 1.000.044 + 792.852,6 X1 + 3,378 X2
• Dimana, Y = Penjualan, X1 = Harga dan X2 =
Biaya Promosi
50

Anda mungkin juga menyukai