Anda di halaman 1dari 60

ANALISIS MULTIVARIAT

Nama : Hendra Perdana, M.Sc


No. HP : 0852-6984-2424
Email : hendra.perdana@math.untan.ac.id
KONTRAK KULIAH
SISTEM PENILAIAN
Absensi 20%
Latihan/Quiz/ Tugas 20%
Ujian Tengah Semester (UTS) 30%
Ujian Akhir Semester (UAS) 30%

4 SKS  32 pertemuan
Syarat UTS atau UAS  75% absensi
(16 x pertemuan) (Jatah bolos
kuliah 4 kali)
KETENTUAN TUGAS
1. Tugas dikerjakan pada kertas folio bergaris.
2. Beri nama, NIM dan tanda tangan mahasiswa.
3. Beri nomor pada bagian atas tugas sesuai no urut absensi
4. Diserahkan/dikumpulkan ketika awal jam perkuliahan
dimulai.
Melanggar poin 1-3, nilai tugas dikurangi 10/ poin.
Melanggar poin 4, nilai tugas dikurangi 20.

Penilaian Tugas
A : 95 C : 75 E: 50 tanda “+” = +5
B : 85 D : 65 tanda “-” = -5
KETENTUAN UJIAN
Mahasiswa memenuhi aturan 75% kehadiran.
Mahasiswa memahami sifat ujian.
(open books/open rumus/tertutup)
Remidial, mengerjakan kembali soal UTS/UAS
dengan batas waktu 1x24 jam setelah jadwal
UTS/UAS.
ketentuan dan penilaian remidial, lihat ketentuan
tugas.
Nilai akhir adalah 75% UTS/UAS + 25% remidial.
BUKU TEKS/HANDOUT/SILABUS
Johnson, R.A, dan Winchern, D.W., 2002,
Applied Multivariate Statistical Analysis, ed
4th, Prentice Hall.
Hardle, W., Simar, L., 2003, Applied
Multivariate, Springer
KETENTUAN PENILAIAN
 0.2  Nilai. Absensi   0.2  Nilai.Tugas   
   100, Jumlah. Absensi  75%
Nilai. Akhir   0.3  Nilai.UTS   0.3  Nilai.UAS  

 0, Jumlah. Absensi  75%

KRITERIA NILAI RELATIF


80 < Nilai Akhir ≤ 100 A
75 < Nilai Akhir ≤ 80 B+
70 < Nilai Akhir ≤ 75 B
65 < Nilai Akhir ≤ 70 C+
60 < Nilai Akhir ≤ 65 C
55 < Nilai Akhir ≤ 60 D+
50 < Nilai Akhir ≤ 55 D
0 < Nilai Akhir ≤ 50 E
TERIMA KASIH
1. TERMINOLOGI
DEFINISI
DEFINISI 1
Data yang diperoleh dengan mengukur lebih dari
satu variabel kriteria pada setiap individu anggota
sampel disebut Data Multivariat.
DEFINISI 2
Teknik-teknik analisis yang memperlakukan
sekelompok variabel kriteria yang saling berkorelasi
sebagai suatu sistem dengan memperhitungkan
korelasi antar variabel-variabel itu disebut Metode
Statistika Multivariat.
DEFINISI DAN TUJUAN
Analisis Statistika Multivariat adalah analisis statistika yang
melibatkan data dengan banyak variabel yang saling
berkorelasi.
Tujuan:
Reduksi data atau penyederhanaan struktural. Fenomena
yang dipelajari direpresentasikan sesederhana mungkin tanpa
mengorbankan informasi yang berharga, dan dapat
diinterpretasikan dengan lebih mudah
Pengelompokan. Kelompok objek "serupa" berdasarkan
karakteristik yang diukur.
Investigasi ketergantungan antar variabel.
Prediksi. Hubungan antara variabel harus ditentukan
untuk tujuan memprediksi nilai-nilai dari satu atau
lebih variabel atas dasar pengamatan pada variabel
lain.
Konstruksi dan pengujian hipotesis. Hipotesis
statistik tertentu , dirumuskan dalam hal parameter
populasi multivariat, selanjtnya diuji. Ini mungkin
dilakukan untuk memvalidasi asumsi atau untuk
memperkuat keyakinan sebelumnya.
Analisis multivariat merupakan pengembangan dari
analisis univariat.
Untuk mendapatkan hasil analisis yang tepat akan
diperlukan asumsi-asumsi distribusional.
Analisis ini telah dan sering digunakan di dunia
nyata.
Distribusi Multivariat
Distribusi Normal Multivariat
pengembangan dari distribusi Normal
Distribusi Wishart
pengembangan dari distribusi chi-square
Statistik Distribusi Hotelling’s T2
pengembangan dari statistik dan distribusi
student’s t kuadrat
Statistik Wilk’s Lambda
pengembangan rasio dari dua statistik chi-square
UKURAN MULTIVARIAT
Vektor rata-rata
koleksi rata-rata dari variabel-variabel yang dikaji
Matriks Kovarians
koleksi varians dan kovarians dari variabel-variabel
yang dikaji
Matriks Korelasi
koleksi koefisien korelasi dari variabel-variabel
yang dikaji
The Generalized Variance
determinan dari matriks varians
TES SIGNIFIKANSI MULTIVARIAT
Tes Signifikansi vektor rata-rata tunggal
Tes kesamaan dari dua vektor rata-rata
Tes kesamaan dari beberapa vektor rata-rata
Tes Signifikansi matriks kovarians tunggal
Tes kesamaan dari dua matriks kovarians
Tes kesamaan dari beberapa matriks kovarians
Tes independensi dari beberapa set variat
Tes independensi dari variat
TEKNIK MULTIVARIAT
The Hotelling’s – T2 Statistic
The Multivariate Analysis of Variance and
Covariance
The Multivariate Experimental Designs
The Multivariate Profile Analysis
The Multivariate Regression Analysis
The Generalized Multivariate Analysis of Variance
The Principal Component Analysis
The Factor Analysis
The Canonical Correlation Analysis
The Discriminatory Analysis
The Cluster Analysis
The Multidimensional Scaling
The Correspondence Analysis
The Classification Trees
The Path Analysis
The Structural Equations Models
The Seemingly Unrelated Regression Models
Jenis Data Dasar
Non-Metric (Qualitative)
o Data non-metric bisa berupa atribut, atau sifat kategorik
yang menunjukkan atau menggambarkan suatu obyek.
o Variabel yang diukur mengunakan skala nominal dan
ordinal umumnya merupakan variabel non-metric
Metric (Quantitative)
o Pengukuran dilakukan sehingga suatu obyek dapat
diketahui perbedaannya dalam jumlah atau derajat.
o Variabel yang diukur menggunakan skala interval dan ratio
merupakan variabel metric.
KLASIFIKASI METODE DATA
1. Dependence Method
Suatu metode di mana suatu variabel atau
kumpulan variabel yang diketahui sebagai variabel
dependen diprediksi atau dijelaskan oleh variabel-
variabel lain yang disebut sebagai variabel
independen.
2. Interdependence Method
Suatu metode dimana tidak ada satu atau
sekelompok variabel yang didefinisikan sebagai
variabel independen ataupun variabel dependen
TEKNIK ANALISIS
Metode Ketergantungan (Dependensi):
Jika persoalan pokok tentang hubungan antara dua
kelompok
variabel, satu kelompok variabel bebas dan yang
kedua variabel terikat maka teknik yang digunakan
antara lain:
1. Analisis regresi
2. Analisis variansi
3. Analisis korelasi kanonik
4. Analisis Diskriminan
5. Analisis Logit.
Metode Kesalingtergantungan (Interdependensi)
Jika diantara variabel diukur tidak dibedakan antara
variabel bebas dan terikatnya, sehingga persoalan
pokok adalah kesalingtergantungan atau hubungan
yang bersifat simetris maka teknik yang digunakan
antara lain:
1. Analisis Komponen Utama
2. Analisis Faktor
3. Analisis Cluster
4. Analisis Log-Linear
KLASIFIKASI (Dependence)
Dependent variable(s)

one More than one

Independent Metric Non-Metric Metric Non-Metric


Variabel(s)
•One
Metric •Simple regression •Disciriminant •Canonical •Multiple group
analysis correlation discriminan anaylsis
•Logistic regression (MDA)

Non-Metric •T test •Discrete •Manova


Disciriminant analysis

•More than One


•Metric •Multiple Regression •Disciriminant •Canonical Multiple group
analysis correlation discriminan anaylsis
•Logistic regression (MDA)

•Non-Metric •Anova •Discrete •Manova


Disciriminant analysis
•Conjoint analysis
KLASIFIKASI (Interdependence)
Number of Variable Type of Data
Metric Non-Metric
Two Simple Correlation Two Way Contingency
Table
More than two Principal Component Multiway Contingency
Analysis table
Factor Analysis Loglinear model
Correspondence Analisis
METODE-METODE (1)
Analisis Komponen Utama (Principal Component Analysis).
Mereduksi dimensi data dengan cara membangkitkan variabel
baru (komponen utama) yang merupakan kombinasi linear
dari variabel asal sedemikan hingga varians komponen utama
menjadi maksimum dan antar komponen utama bersifaT
saling bebas
Analisis Faktor
Mereduksi dimensi data dengan cara menyatakan variabel
asal sebagai kombinasi linear sejumlah faktor, sedemikian
hingga sejumlah faktor tersebut mampu menjelaskan sebesar
mungkin keragaman data yang dijelaskan oleh variabel asal.
METODE-METODE (2)
MANOVA
Menganalisis hubungan antara vektor variabel respon (Y)
yang diduga dipengaruhi oleh beberapa perlakuan
(treatment).
Analisis Diskriminan
Membentuk fungsi yang memisahkan antar kelompok
berdasarkan variabel pembeda, fungsi tsb disusun sedemikian
nisbah keragaman data antar dan kelompok maksimum.
Multivariate Regression
Memodelkan hubungan antara kelompok variabel respon (Y)
dengan kelompok variabel (X) yang diduga mempengaruhi
variabel respon
METODE-METODE (3)
Cannonical Correlation
Menganalisis hubungan antar dua kelompok variabel dengan
cara membangkitkan vari-abel baru pada setiap kelompok.
Variabel baru tersebut merupakan kombinasi linear dari
variabel asal. Kombinasi linearnya ditentukan sedemikian
hingga korelasi antar variabel baru yang berasal dari dua ke-
lompok menjadi maksimum
Analisis Kluster
Mengelompokkan data ke dalam beberapa kelompok
sedemikian hingga data yang berada di dalam kelompok yang
sama cenderung mempunyai sifat yang lebih homogen
daripada data yang berada di kelompok yang berbeda
CONTOH KASUS
Data pada beberapa variabel yang berhubungan dengan
respon pasien kanker terhadap radioterapi, ukuran
sederhana dari respon pasien terhadap radioterapi
dibangun.
Catatan rekam-jejak dari berbagai negara yang digunakan
untuk mengembangkan indeks kinerja untuk kedua atlet
laki-laki dan perempuan.
Data pada beberapa variabel yang berhubungan dengan
penggunaan komputer untuk mengelompokkan kategori
pekerjaan komputer sehingga bisa direncanakan
pemanfaatan komputer yang lebih baik.
PENELITIAN

Tujuan
menjawab pertanyaan-pertanyaan yg menarik
terhadap obyek yg menjadi perhatian

pertanyaan tentang ?? alat yg digunakan??

variabel data
Masalah :
Apakah ruang lingkup terbatas pada obyek penelitian itu
saja atau pada obyek yg lebih luas ( artinya : obyek
penelitian hanya merupakan sampel dari populasi obyek )

data
populasi populasi

peng./
perhit./
pert. penguk.
sampel oby. pen variabel data sampel
jawab jawab

jawaban
Variabel :

satu Lebih dari satu

univariat multivariat

Data : ( jika sampel berukuran n )

X1,X2,…,Xn X1, X2,…, Xn


X11,X12,…,X1n
X21,X22,…,X2n



Xp1,Xp2,…,Xpn
p = banyaknya variabel  2
Variabel :
Menurut banyaknya
univariat vs multivariat
(satu) (lbh dari satu)
Menurut data yang dihasilkan
kualitatif vs kuantitatif
(hsl bkn angka) (hsl angka)
Menurut peranannya
dependen vs independen

Contoh :
berat, umur, tekanan darah, jenis kelamin, jenis
penyakit, klasifikasi penyakit, macam obat, golongan
darah
Data :
Hasilnya :
kualitatif, kuantitatif
Skalanya :
nominal, ordinal, interval, rasio
Kuantitatif :
diskrit, kontinu
Metode Statistika :
Deskriptif vs Induktif

Univariat vs Multivariat

Satu populasi vs Lebih dr satu populasi


(perbandingan)
X X,Y X1,X2,…,XP

X1 (X1,Y1) (X11,X12,…,X1p)
X2 (X2,Y2) (X21,X22,…,X2p)
• • •
• • •
• • •
Xn (Xn,Yn) (Xn1,Xn2,…,Xnp)
Masalah umum yg diselesaikan
dengan Statistika (=ilmu Statistik)
adalah :
Menjawab populasi menggunakan sampel

Menjawab distribusi peubah acak (populasi) menggunakan


estimasi distribusi yang “sesuai” yang ditentukan dari
sampel

Menjawab parameter populasi menggunakan statistik


sampel
Ctt :
Sampel yang digunakan harus yang mewakili/representatif untuk
populasinya
Contoh :

parameter statistik

Mean
Median
Modus
Variansi
populasi sampel
Deviasi standar
Proporsi
Populasi dan Sampel

Populasi Sampel

Gunakan statistik sebagai


gambaran

Gunakan parameter sebagai


gambaran

Kesimpulan untuk populasi menggunakan sampel


METODE STATISTIKA YG AKAN DIGUNAKAN SANGAT
BERGANTUNG KEPADA

YANG BIASANYA ADALAH

SAMPEL : RANDOM SEDERHANA

VARIABEL : - KONTINU
- SATU ATAU LEBIH

DATA : - KONTINU
- INTERVAL ATAU RASIO

???
DISTRIBUSI KEMUDIAN DISEDERHANAKAN DENGAN
MENENTUKAN PARAMETER YANG MENARIK

UKURAN KECENDERUNGAN : - MEAN


- MEDIAN
- MODUS
UKURAN LOKASI : - MEDIAN
- KUARTIL
- DESIL
UKURAN SEBARAN :
- RANGE
- PENYIMP. RATA-RATA
- STD. DEV / VAR
UKURAN KEMENCENGAN

UKURAN KERUNCINGAN
• UKURAN KORELASI : - SEDERHANA
- PARSIAL
- SEMI PARSIAL
- GANDA

• PERSAMAAN REGRESI : - SEDERHANA


- GANDA
mengapa penelitian menggunakan sampel adalah
satu-satunya pilihan terbaik atau yang paling
mungkin untuk dilakukan ?

Mungkin dilakukan, ttp


Tdk efisien dari waktu,
Tenaga, biaya

Penelitian populasi Mungkin dilakukan, ttp tdk


Akan pernah dilakukan

Tidak mungkin dilakukan


Jawaban untuk distribusi/sebaran data populasi
sebenarnya adalah yang paling umum/paling
dikehendaki, sebab dengan tertentunya distribusi
tersebut semua pertanyaan tentang populasi dapat
dijawab
Contoh : nilai ujian suatu matakuliah berdistribusi
normal dengan mean (=µ)=60 dan deviasi standar (=
)=10

µ x
Populasi = mahasiswa / siswa
x = (data) variabel = nilai ujian
Beberapa variabel / distribusi terkenal atau yang
banyak digunakan dalam metode statistika
DISKRIT

UNIFORM DISKRIT
BINOMIAL
MULTINOMIAL
GEOMETRIK
HIPERGEOMETRIK
Variabel/Distribusi POISSON
BINOMIAL NEGATIF

KONTINU
NORMAL
UNIFORM KONTINU
BETA
GAMMA
EXPONENTIAL
WEIBULL
LOGISTIK
CAUCHY
DOUBLE EXPONENTIAL
INFERENSI STATISTIKA

Adalah cara pengambilan kesimpulan tentang populasi


berdasarkan sampel random ( yang diambil dari populasi
tersebut )

Inferensi Statistika yang akan dilakukan bergantung


kepada bentuk distribusi atau fungsi probabilitas
populasi
Inferensi Statistika

Estimasi Uji Hipotesis


menentukan apakah
hipotesis parameter
didukung oleh informasi
sampel atau tidak

Titik Interval
statistik yg digunakan interval yang dengan
sebagai estimasi parameter kemungkinan tertentu
memuat parameter
yang diestimasi
Jika N adalah ukuran populasi, maka

 N N!
k    
 n  n!(N  n)!
adalah banyaknya semua sampel yang mungkin dapat diambil dari
populasi

satu yang diambil adalah salah satu diantara k

• θ̂adalah suatu vektor variabel yang distribusinya


bergantung pada distribusi populasi (pada umumnya)

• salah satu diantara digunakan untuk menyimpulkan


θ̂ θ
sampel / data sampel θ̂
( berukuran n )

1. θ̂1
Populasi/
data populasi
2. θ̂ 2
3.
θ̂ 3
θ

k.
θ̂ k
Sementara hanya akan dibahas mengenai inferensi
statistika untuk parameter populasi

Inferensi statistika untuk populasi dengan bentuk


distribusi tidak diketahui dipelajari dalam metode non
parametrik

Parameter adalah
setiap karakteristik distribusi populasi
Statistik adalah
kuantitas yang dihitung dari observasi sampel

variabel random yang harganya bergantung pada harga-


harga observasi sampel
keluarga (kelas) fungsi probabilitas

parametrik Non parametrik


jika ada sejumlah parameter jika berapapun parameter
yang menentukan dg tunggal ditentukan, tidak
suatu anggota keluarga tersebut menentukan dengan
tunggal suatu anggota
keluarga

Contoh :

N (µ,2), Bin (n,p)

bentuk distribusi diketahui, bentuk distribusinya


yang tidak diketahui hanya tidak diketahui
parameternya saja
Untuk menyimpulkan θ, yang menentukan adalah
θ̂ atau
transformasinya dan distribusinya.

Jika distribusi diketahui Metode stat


( biasanya normal ) parametrik

- jika distibusi tdk diketahui Metode stat


- n tidak cukup besar Non parametrik
- data nominal atau ordinal

Univariat vs Multivariat
variabel hanya satu variabel lebih dari satu
Metode analisis korelasi : ada tidaknya hub. antar variabel

Metode analisis regresi : bentuk hubungan antar variabel

Metode analisis variansi membandingkan lebih dari dua populasi

Metode dua tahap, tiga tahap atau sekuensial menjawab


pertanyaan yang tidak mungkin terjawab oleh metode sampel
tetap
SKALA DATA
N O I R

UKURAN MODUS X X X X
MEDIAN X X X
KECENDERUNGAN MEAN X X

UKURAN RANGE X X X
VARIABILITAS DEV. STD X X

Keterangan :
N = nominal
O = ordinal
I = interval
R = rasio
Langkah – langkah pokok dalam melakukan uji hipotesis
• identifikasi model populasi

• tentukan Ho dan H1, ada 3 keadaan yang mungkin, yaitu :

A. Ho :  = o vs H1 :   o
B. Ho :   o vs H1 :   o
C. Ho :   o vs H1 :   o

• tentukan tingkat signifikansi  (  0)

• tentukan kriteria uji hipotesis (daerah yang menentukan H o


ditolak atau Ho diterima / gagal ditolak)

• Hitung statistik uji dari data sampel

• Ambil kesimpulan
(bandingkan statistik uji vs kriteria uji)
BENTUK MATRIKS DATA
MATRIKS DATA
MEAN, VARIANSI DAN
KOVARIANSI
KOEFISIEN KORELASI
KOVARIANSI DAN KORELASI
LATIHAN SOAL
Percobaan dilakukan untuk memilih toko buku yang terbaik. Setiap
toko menjual berbagai jenis buku. Penyelidikan dilakukan dengan
melihat sifat penjualan buku. Kesamaan jumlah buku terjual belum
tentu menunjukkan kesamaan total pemasukan toko karena jenis buku
yang terjual belum tentu sama.
Oleh karena itu jumlah buku yang terjual dan jumlah total
penjualan perminggu di amati pada setiap toko. Sehingga variabel
pertama adalah total penjualan dolar dan variabel kedua banyaknya
buku terjual.
Pengamatan dilakukan sebanyak 4 minggu, dan data disajikan
dalam bentuk tabel, sbb
variabel 1 (penjualan dalam dollar) 42 52 48 58
variabel 2 (banyak buku terjual) 4543

Anda mungkin juga menyukai