Anda di halaman 1dari 7

Nama : Ervione Mahala Zulfitri

NIM : 211910972
Kelas : 3SE2
Kode : 02ADU65

Aspek dari Analisis Multivariat


1.1 Pengantar
Dalam proses pembelajaran yang berulang, jumlah variabel sering ditambahkan atau
dikurangi dari penelitian. Karena data mencakup pengukuran simultan pada banyak
variabel, digunakan metode yang disebut analisis multivariat. Penelitian ilmiah yang
menggunakan metode multivariat mengikutsertakan:
1. Reduksi data atau penyederhanaan struktural
2. Menyortir dan mengelompokkan
3. Investigasi ketergantungan antar variabel
4. Prediksi
5. Konstruksi dan pengujian hipotesis

1.2 Aplikasi dari Teknik Multivariat


1. Reduksi data atau penyederhanaan struktural
Menggunakan data beberapa variabel yang berhubungan dengan respon pasien kanker
terhadap radioterapi.
2. Menyortir dan mengelompokkan
Pengukuran beberapa variabel fisiologis yang digunakan untuk mengembangkan
prosedur penyaringan yang membedakan pecandu alkohol dari non-alkohol.
3. Investigasi ketergantungan antar variabel
Data tentang variabel yang mewakili hasil dari 10 acara dasalomba di olimpiade
digunakan untuk menentukan faktor-faktor fisik yang bertanggung jawab atas
keberhasilan dalam dasalomba
4. Prediksi
Hubungan antara nilai ujian dan beberapa variabel kinerja sekolah menengah dan
beberapa variabel kinerja perguruan tinggi yang digunakan untuk mengembangkan
prediktor keberhasilan di perguruan tinggi.
5. Konstruksi dan pengujian hipotesis
Beberapa variabel terkait polusi diukur untuk menentukan apakah tingkat untuk area
metropolitan besar konstan sepanjang minggu, atau apakah ada perbedaan mencolok
antara hari kerja dan akhir pekan.

1.3 Organisasi Data


Organisasi data membahas tentang analisis hasil pengukuran (measurements) yang dibuat
dengan beberapa variabel atau karakteristik. Hasil pengukuran ini (biasa disebut data) dapat
ditampilkan dalam berbagai cara sebagai berikut:
Arrays
Dipilih sebanyak 𝑝 ≥ 1 dari variabel untuk dicatat nilai observasinya. Nilai dari variabel-
variabel ini semuanya dicatat untuk setiap item yang berbeda, individu, atau satuan percobaan.
Digunakan notasi 𝑥𝑗𝑘 untuk menyatakan nilai observasi dari variabel ke-𝑘 dan item ke-𝑗.
Jika terdapat 𝑛 hasil pengukuran pada 𝑝 variabel dapat dinyatakan dalam bentuk berikut:
Varibel 1 Varibel 2 … Varibel 𝑘 … Variabel 𝑝
Item 1 𝑥11 𝑥12 … 𝑥1𝑘 … 𝑥1𝑝
Item 2 𝑥21 𝑥22 … 𝑥2𝑘 … 𝑥2𝑝
: : : : :
Item 𝑗 𝑥𝑗1 𝑥𝑗2 … 𝑥𝑗𝑘 … 𝑥𝑗𝑝
: : : : :
Item 𝑛 𝑥𝑛1 𝑥𝑛2 … 𝑥𝑛𝑘 … 𝑥𝑛𝑝
Atau dapat ditampilkan sebagai array persegi 𝑋 dari 𝑛 baris dan 𝑝 kolom berisi data yang
terdiri dari semua pengamatan pada semua variabel berikut:
𝑥11 ⋯ 𝑥1𝑝
𝑋=[ ⋮ ⋱ ⋮ ]
𝑥𝑛1 ⋯ 𝑥𝑛𝑝
Array memungkinkan perhitungan numerik dilakukan secara teratur dan efisien.
Statistik Deskriptif
Banyak informasi yang terkandung dalam data yang dapat diketahui dengan menghitung
summary numbers tertentu, yang dikenal sebagai deskriptif statistik. Jika 𝑛 menggambarkan subset
dari hasil pengukuran seluruhnya, maka rumus sampel mean dari 𝑝 variabel adalah sebagai berikut:
𝑛
1
𝑥̅𝑘 = 𝑛 ∑ 𝑥𝑗𝑘 𝑘 = 1, 2, . . , 𝑝 (1-1)
𝑗=1

Sedangkan rumus sampel varians adalah sebagai berikut:


𝑛 2
1
𝑠𝑘2 = 𝑠𝑘𝑘 = 𝑛 ∑ (𝑥𝑗𝑘 − 𝑥̅𝑘 ) 𝑘 = 1, 2, . . , 𝑝 (1-2)
𝑗=1

Banyak ilmuan menggunakan pembagi 𝑛 − 1 daripada 𝑛. Selanjutnya akan mempertimbangkan


array jumlah di mana varians sampel terletak di sepanjang diagonal utama sehingga digunakan
double subskrip pada varians untuk menunjukkan posisi mereka dalam array. Standar deviasi
sampel adalah ukuran dari variasi tiap unit dalam pengamatan yang diperoleh dari √𝑠𝑘𝑘 .
Sampel kovarians adalah ukuran hubungan linier antara pengukuran variabel ke-𝑖 dan ke-𝑘
atau average product dari penyimpangan dari masing-masing mean. Kovarians dapat berkurang
menjadi varians sampel ketika i = k atau saat 𝑠𝑖𝑘 = 𝑠𝑘𝑖 untuk semua 𝑖 dan 𝑘.
𝑛
1
𝑠𝑖𝑘 = ∑ (𝑥𝑗𝑖 − 𝑥̅ 𝑖 )(𝑥𝑗𝑘 − 𝑥̅𝑘 ) 𝑖 = 1, 2, . . , 𝑝, 𝑘 = 1, 2, . . , 𝑝 (1-3)
𝑛 𝑗=1

Sampel kovarian akan bernilai:


Positif → jika kedua variabel besar atau jika keduanya bernilai kecil.
Negatif → jika salah satu variabel bernilai besar dan variabel lainnya kecil
Mendekati 0 → jika tidak ada hubungan khusus antara nilai untuk kedua variabel
Sample correlation coefficient atau koefisien korelasi sampel adalah ukuran hubungan linear
antara dua variabel yang tidak bergantung pada unit pengukuran.
𝑛
∑ (𝑥𝑗𝑖 −𝑥̅ 𝑖 )(𝑥𝑗𝑘 −𝑥̅ 𝑘 )
𝑠𝑖𝑘 𝑗=1
𝑟𝑖𝑘 = = (1-4)
√𝑠𝑖𝑖 √𝑠𝑘𝑘 𝑛 2 𝑛 2
√∑ (𝑥𝑗𝑖 −𝑥̅ 𝑖 ) √∑ (𝑥𝑗𝑘 −𝑥̅ 𝑘 )
𝑗=1 𝑗=1

Koefisien korelasi sampel adalah kovarian sampel yang distandardisasi. Nilai 𝑟𝑖𝑘 akan sama saat
pembaginya 𝑛 maupun 𝑛 − 1. Koefisien korelasi sampel juga dapat dilihat sebagai sampel
kovarian. Nilai korelasi sampel 𝑟 adalah sebagai berikut:
1. Nilai 𝑟 harus diantara -1 dan +1
2. Jika 𝑟 = 0 berarti kurangnya hubungan linier antara komponen. Jika 𝑟 < 0 menyiratkan
kecenderungan untuk satu nilai dalam pasangan menjadi lebih besar dari rata-rata ketika
yang lain lebih kecil dari usia rata-rata dan 𝑟 > 0 menyiratkan kecenderungan satu nilai
pasangan menjadi besar ketika nilai lainnya besar begitupun sebaliknya.
3. Nilai 𝑟𝑖𝑘 tetap tidak berubah jika pengukuran variabel ke-i berubah menjadi 𝑦𝑗𝑙 = 𝑎𝑥𝑗𝑖 +
𝑏, 𝑗 = 1, 2, . . . , 𝑛, dan nilai-nilai variabel ke-k berubah menjadi 𝑦𝑗𝑘 = 𝑐𝑥𝑗𝑘 + 𝑑, 𝑗 =
1, 2, . . . , 𝑛, asalkan konstanta a dan c memiliki tanda yang sama.
Asosiasi nonlinier dapat tidak terungkap oleh statistik deskriptif ini. Kovarians dan korelasi
memberikan ukuran asosiasi linier, atau asosiasi sepanjang garis. Nilai ini sensitif terhadap
pencilan dan dapat menunjukkan asosiasi ketika asosiasi sangat kecil. Sum squares of the
deviations dari mean dan sum of cross product ditunjukkan pada rumus berikut ini.
𝑛 2
𝑤𝑘𝑘 = ∑ (𝑥𝑗𝑘 − 𝑥̅ 𝑘 ) 𝑘 = 1, 2, . . , 𝑝 (1-5)
𝑗=1
𝑛
𝑤𝑖𝑘 = ∑ (𝑥𝑗𝑖 − 𝑥̅ 𝑖 )(𝑥𝑗𝑘 − 𝑥̅𝑘 ) 𝑖 = 1, 2, . . , 𝑝, 𝑘 = 1, 2, . . , 𝑝 (1-6)
𝑗=1

Teknik Grafis
Scatter plot atau scatter diagram adalah plot dua dimensi yang memetakan data dengan tiap
sumbu merepresentasikan variabel. Plot terpisah dari nilai amatan dari variabel ke-1 dan ke-2
disebut (marginal) dot diagram. Dot diagram memperlihatkan pengamatan asli (original
observation) dengan memproyeksikan titik pada scatter diagram ke setiap sumbu koordinat.
Informasi di dalam single-variable dot diagram dapat digunakan untuk menghitung sampel
mean 𝑥̅1 dan 𝑥̅2 dan sampel varians 𝑠11 dan 𝑠22 . Informasi dalam marginal dot tidak cukup untuk
membangun scatter plot.
1. 𝑛 Titik di 𝑝 Dimensi (p-Dimensional Scatter Plot)
Mempertimbangkan scatter plot menjadi 𝑝 dimensi dimana pengukuran 𝑝 pada item ke-j
mewakili koordinat suatu titik dalam dimensi 𝑝.
(𝑥𝑗1 , 𝑥𝑗2 , … , 𝑥𝑗𝑝 )
Plot yang dihasilkan dengan 𝑛 titik tidak hanya menunjukkan pola variabilitas secara
keseluruhan, tetapi juga menunjukkan persamaan (dan perbedaan) diantara 𝑛 item.
2. 𝑝 Titik di 𝑛 Dimensi
Sebanyak 𝑛 observasi dari 𝑝 variabel juga dapat dianggap sebagai 𝑝 titik di 𝑛 dimensi.
Tiap kolom X menentukan satu dari beberapa titik. Kolom ke-i terdiri dari semua 𝑛
pengukuran pada variabel ke-i , menentukan titik ke-i.
𝑥1𝑖
𝑥2𝑖
[ : ]
𝑥𝑛𝑖

1.4 Tampilan Data dan Representasi Gambar


Jika pengamatan multidimensi dapat direpresentasikan dalam dua dimensi, maka outlier,
hubungan, dan pengelompokkan dapat terlihat. Berikut ini metode untuk menampilkan data
multivariat dalam dua dimensi.
Menghubungkan Beberapa Scatter Plot Dua Dimensi
1. Menghubungkan Scatter Plot dan Brushing
Menghapus outlier dapat memodifikasi scatter plot karena menyesuaikan rentang dari
observasi yang tersisa. Pengoperasian highlighting titik yang sesauai dengan rentang yang
terpilih dari salah satu variabel disebut brushing.
2. Memutar Plot dalam Tiga Dimensi
Memutar sumbu koordinat memungkinkan untuk mendapatkan pemahaman lebih baik
tentang aspek tiga dimensi data. Aspek dinamis juga dapat diperoleh dengan memutar data
secara perlahan.
Grafik dari Kurva Pertumbuhan
Pengukuran yang berulang terhadap karakteristik yang sama dalam unit atau sinjek yang
sama dapat membentuk kurva pertumbuhan yang meningkat atau menurun atau peningkatan yang
diikuti dengan penurunan pola terjadi.

Stars
Misal tiap unit data terdiri dari observasi nonnegatif pada 𝑝 ≥ 2 variabel. Dalam 2 dimensi
dapat membuat lingkaran dengan radius tetap dengan 𝑝 sinar berjarak sama. Panjang sinar
mewakili nilai variabel. Ujung sinar dapat dihubungkan dengan garis lurus untuk membentuk
bintang. Setiap bintang mewakili pengamatan multivariat dan bintang dapat dikelompokkan
menurut kesamaan subjektifnya.

Chernoff Faces
Merepresentasikan 𝑝 dimensi sebagai wajah dua dimensi yang karakteristiknya (wajah,
lengkungan mulut, panjang hidung, ukuran mata, posisi pupil) ditentukan oleh pengukuran pada 𝑝
variabel. Metode ini digunakan untuk menunjukkan perbedaan observasi dalam dua dimensi.

1.5 Jarak
Jarak antara dua titik sembarang 𝑃 dan 𝑄 dengan koordinat 𝑃 = (𝑥1 , 𝑥2 , … , 𝑥𝑝 ) dan 𝑄 =
(𝑦1 , 𝑦2 , … , 𝑦𝑝 ) adalah

2
𝑑(𝑃, 𝑄) = √(𝑥1 − 𝑦1 )2 + (𝑥2 − 𝑦2 )2 + ⋯ + (𝑥𝑝 − 𝑦𝑝 ) (1-7)

Jarak statistik titik 𝑃 = (𝑥1 , 𝑥2 ) dari origin 𝑂 = (0,0) dapat dihitung dari koordinat
standarnya 𝑥1∗ = 𝑥1 /√𝑠11 dan 𝑥2∗ = 𝑥2 /√𝑠22 sebagai

𝑥1 2 𝑥2 2
𝑥2 𝑥2
𝑑(𝑂, 𝑃) = √(𝑥1∗ )2 + (𝑥2∗ )2 − √(√𝑠11) + (√𝑠22) = √𝑠 1 + 𝑠 2 (1-8)
11 22

Perhitungan jarak statistik dari sembarang titik 𝑃 = (𝑥1 , 𝑥2 , . . , 𝑥𝑝 ) terhadap berapapun titik
𝑄 = (𝑦1 , 𝑦2 , … , 𝑦𝑝 ) yang telah ditentukan [bisa juga titik origin] dengan sumsi koordinat bervariasi
secara independen adalah sebagai berikut
2
(𝑥1 −𝑦1 )2 (𝑥2 −𝑦2 )2 (𝑥𝑝 −𝑦𝑝 )
𝑑(𝑃, 𝑄) = √ + + ⋯+ (1-9)
𝑠11 𝑠22 𝑠𝑝𝑝

Jika kita merotasi koordinat asli dengan sudut 𝜃 dengan tetap mempertahankan sebarannya
dan sumbu menjadi 𝑥̃1 dan 𝑥̃2 , maka jarak titik 𝑃 = (𝑥̃1 ,𝑥̃2 ) ke origin menjadi
𝑥̃ 2 𝑥̃ 2
𝑑(𝑂, 𝑃) = √𝑠̃ 1 + 𝑠̃ 2 (1-10)
11 22

Hubungan antara original koordinat (𝑥1 , 𝑥2 ) dengan koordinat yang telah dirotasi adalah
𝑥̃1 = 𝑥1 cos(𝜃) + 𝑥2 sin(𝜃)
𝑥̃2 = −𝑥1 sin(𝜃) + 𝑥2 cos(𝜃)
Persamaan (1-10) juga dapat ditulis dengan
𝑑(𝑂, 𝑃) = √𝑎11 𝑥12 + 2𝑎12 𝑥1 𝑥2 + 𝑎22 𝑥22 (1-11)
Cross product dari 2𝑎12 𝑥1 𝑥2 yang diperlukan adalah korelasi 𝑟12 tidak nol. Persamaan (1-8)
dapat diubah menjadi (1-11) dengan 𝑎11 = 1/𝑠11 , 𝑎22 = 1/𝑠22 dan 𝑎12 = 0.
Secara umum jarak titik 𝑃 = (𝑥̃1,𝑥̃2 ) ke titik yang ditetapkan 𝑄 = (𝑦1 , 𝑦2 ) dengan variabel
yang saling berhubungan adalah
𝑑(𝑂, 𝑃) = √𝑎11 (𝑥1 − 𝑦1 )2 + 2𝑎12 (𝑥1 − 𝑦1 )(𝑥2 − 𝑦2 ) + 𝑎22 (𝑥2 − 𝑦2 ) (1-12)
𝑎11 (𝑥1 − 𝑦1 )2 + 2𝑎12 (𝑥1 − 𝑦1 )(𝑥2 − 𝑦2 ) + 𝑎22 (𝑥2 − 𝑦2 ) = 𝑐 2

Anda mungkin juga menyukai