NIM : 211910972
Kelas : 3SE2
Kode : 02ADU65
Koefisien korelasi sampel adalah kovarian sampel yang distandardisasi. Nilai 𝑟𝑖𝑘 akan sama saat
pembaginya 𝑛 maupun 𝑛 − 1. Koefisien korelasi sampel juga dapat dilihat sebagai sampel
kovarian. Nilai korelasi sampel 𝑟 adalah sebagai berikut:
1. Nilai 𝑟 harus diantara -1 dan +1
2. Jika 𝑟 = 0 berarti kurangnya hubungan linier antara komponen. Jika 𝑟 < 0 menyiratkan
kecenderungan untuk satu nilai dalam pasangan menjadi lebih besar dari rata-rata ketika
yang lain lebih kecil dari usia rata-rata dan 𝑟 > 0 menyiratkan kecenderungan satu nilai
pasangan menjadi besar ketika nilai lainnya besar begitupun sebaliknya.
3. Nilai 𝑟𝑖𝑘 tetap tidak berubah jika pengukuran variabel ke-i berubah menjadi 𝑦𝑗𝑙 = 𝑎𝑥𝑗𝑖 +
𝑏, 𝑗 = 1, 2, . . . , 𝑛, dan nilai-nilai variabel ke-k berubah menjadi 𝑦𝑗𝑘 = 𝑐𝑥𝑗𝑘 + 𝑑, 𝑗 =
1, 2, . . . , 𝑛, asalkan konstanta a dan c memiliki tanda yang sama.
Asosiasi nonlinier dapat tidak terungkap oleh statistik deskriptif ini. Kovarians dan korelasi
memberikan ukuran asosiasi linier, atau asosiasi sepanjang garis. Nilai ini sensitif terhadap
pencilan dan dapat menunjukkan asosiasi ketika asosiasi sangat kecil. Sum squares of the
deviations dari mean dan sum of cross product ditunjukkan pada rumus berikut ini.
𝑛 2
𝑤𝑘𝑘 = ∑ (𝑥𝑗𝑘 − 𝑥̅ 𝑘 ) 𝑘 = 1, 2, . . , 𝑝 (1-5)
𝑗=1
𝑛
𝑤𝑖𝑘 = ∑ (𝑥𝑗𝑖 − 𝑥̅ 𝑖 )(𝑥𝑗𝑘 − 𝑥̅𝑘 ) 𝑖 = 1, 2, . . , 𝑝, 𝑘 = 1, 2, . . , 𝑝 (1-6)
𝑗=1
Teknik Grafis
Scatter plot atau scatter diagram adalah plot dua dimensi yang memetakan data dengan tiap
sumbu merepresentasikan variabel. Plot terpisah dari nilai amatan dari variabel ke-1 dan ke-2
disebut (marginal) dot diagram. Dot diagram memperlihatkan pengamatan asli (original
observation) dengan memproyeksikan titik pada scatter diagram ke setiap sumbu koordinat.
Informasi di dalam single-variable dot diagram dapat digunakan untuk menghitung sampel
mean 𝑥̅1 dan 𝑥̅2 dan sampel varians 𝑠11 dan 𝑠22 . Informasi dalam marginal dot tidak cukup untuk
membangun scatter plot.
1. 𝑛 Titik di 𝑝 Dimensi (p-Dimensional Scatter Plot)
Mempertimbangkan scatter plot menjadi 𝑝 dimensi dimana pengukuran 𝑝 pada item ke-j
mewakili koordinat suatu titik dalam dimensi 𝑝.
(𝑥𝑗1 , 𝑥𝑗2 , … , 𝑥𝑗𝑝 )
Plot yang dihasilkan dengan 𝑛 titik tidak hanya menunjukkan pola variabilitas secara
keseluruhan, tetapi juga menunjukkan persamaan (dan perbedaan) diantara 𝑛 item.
2. 𝑝 Titik di 𝑛 Dimensi
Sebanyak 𝑛 observasi dari 𝑝 variabel juga dapat dianggap sebagai 𝑝 titik di 𝑛 dimensi.
Tiap kolom X menentukan satu dari beberapa titik. Kolom ke-i terdiri dari semua 𝑛
pengukuran pada variabel ke-i , menentukan titik ke-i.
𝑥1𝑖
𝑥2𝑖
[ : ]
𝑥𝑛𝑖
Stars
Misal tiap unit data terdiri dari observasi nonnegatif pada 𝑝 ≥ 2 variabel. Dalam 2 dimensi
dapat membuat lingkaran dengan radius tetap dengan 𝑝 sinar berjarak sama. Panjang sinar
mewakili nilai variabel. Ujung sinar dapat dihubungkan dengan garis lurus untuk membentuk
bintang. Setiap bintang mewakili pengamatan multivariat dan bintang dapat dikelompokkan
menurut kesamaan subjektifnya.
Chernoff Faces
Merepresentasikan 𝑝 dimensi sebagai wajah dua dimensi yang karakteristiknya (wajah,
lengkungan mulut, panjang hidung, ukuran mata, posisi pupil) ditentukan oleh pengukuran pada 𝑝
variabel. Metode ini digunakan untuk menunjukkan perbedaan observasi dalam dua dimensi.
1.5 Jarak
Jarak antara dua titik sembarang 𝑃 dan 𝑄 dengan koordinat 𝑃 = (𝑥1 , 𝑥2 , … , 𝑥𝑝 ) dan 𝑄 =
(𝑦1 , 𝑦2 , … , 𝑦𝑝 ) adalah
2
𝑑(𝑃, 𝑄) = √(𝑥1 − 𝑦1 )2 + (𝑥2 − 𝑦2 )2 + ⋯ + (𝑥𝑝 − 𝑦𝑝 ) (1-7)
Jarak statistik titik 𝑃 = (𝑥1 , 𝑥2 ) dari origin 𝑂 = (0,0) dapat dihitung dari koordinat
standarnya 𝑥1∗ = 𝑥1 /√𝑠11 dan 𝑥2∗ = 𝑥2 /√𝑠22 sebagai
𝑥1 2 𝑥2 2
𝑥2 𝑥2
𝑑(𝑂, 𝑃) = √(𝑥1∗ )2 + (𝑥2∗ )2 − √(√𝑠11) + (√𝑠22) = √𝑠 1 + 𝑠 2 (1-8)
11 22
Perhitungan jarak statistik dari sembarang titik 𝑃 = (𝑥1 , 𝑥2 , . . , 𝑥𝑝 ) terhadap berapapun titik
𝑄 = (𝑦1 , 𝑦2 , … , 𝑦𝑝 ) yang telah ditentukan [bisa juga titik origin] dengan sumsi koordinat bervariasi
secara independen adalah sebagai berikut
2
(𝑥1 −𝑦1 )2 (𝑥2 −𝑦2 )2 (𝑥𝑝 −𝑦𝑝 )
𝑑(𝑃, 𝑄) = √ + + ⋯+ (1-9)
𝑠11 𝑠22 𝑠𝑝𝑝
Jika kita merotasi koordinat asli dengan sudut 𝜃 dengan tetap mempertahankan sebarannya
dan sumbu menjadi 𝑥̃1 dan 𝑥̃2 , maka jarak titik 𝑃 = (𝑥̃1 ,𝑥̃2 ) ke origin menjadi
𝑥̃ 2 𝑥̃ 2
𝑑(𝑂, 𝑃) = √𝑠̃ 1 + 𝑠̃ 2 (1-10)
11 22
Hubungan antara original koordinat (𝑥1 , 𝑥2 ) dengan koordinat yang telah dirotasi adalah
𝑥̃1 = 𝑥1 cos(𝜃) + 𝑥2 sin(𝜃)
𝑥̃2 = −𝑥1 sin(𝜃) + 𝑥2 cos(𝜃)
Persamaan (1-10) juga dapat ditulis dengan
𝑑(𝑂, 𝑃) = √𝑎11 𝑥12 + 2𝑎12 𝑥1 𝑥2 + 𝑎22 𝑥22 (1-11)
Cross product dari 2𝑎12 𝑥1 𝑥2 yang diperlukan adalah korelasi 𝑟12 tidak nol. Persamaan (1-8)
dapat diubah menjadi (1-11) dengan 𝑎11 = 1/𝑠11 , 𝑎22 = 1/𝑠22 dan 𝑎12 = 0.
Secara umum jarak titik 𝑃 = (𝑥̃1,𝑥̃2 ) ke titik yang ditetapkan 𝑄 = (𝑦1 , 𝑦2 ) dengan variabel
yang saling berhubungan adalah
𝑑(𝑂, 𝑃) = √𝑎11 (𝑥1 − 𝑦1 )2 + 2𝑎12 (𝑥1 − 𝑦1 )(𝑥2 − 𝑦2 ) + 𝑎22 (𝑥2 − 𝑦2 ) (1-12)
𝑎11 (𝑥1 − 𝑦1 )2 + 2𝑎12 (𝑥1 − 𝑦1 )(𝑥2 − 𝑦2 ) + 𝑎22 (𝑥2 − 𝑦2 ) = 𝑐 2