TINJAUAN PUSTAKA
A. Analisis Multivariat
Analisis multivariat adalah analisis statistika yang digunakan pada data yang terdiri dari banyak variabel dan
antar variabel saling berkorelasi. Data multivariat tidak hanya terdiri atas satu variabel saja melainkan dapat terdiri
atas lebih dari satu variabel. Model regresi multivariat adalah model regresi dengan lebih dari satu variabel respon
yang saling berkorelasi dan satu atau lebih variabel prediktor (Johnson dan Wichern, 2007).
1 1 𝑇
𝑓(𝑥) = 1 𝑒𝑥𝑝 {− (𝑥 − 𝜇) Σ −1 (𝑥 − 𝜇)}
2
2𝜋 2 |Σ|1\2
Secara sederhana ditulis 𝑋~𝑁𝑝 (𝜇, Σ), p=2 disebut bivariate normal dengan:
Uji Saphiro-Wilk
Metode Shapiro-Wilk adalah sebuah metode atau rumus perhitungan sebaran data yang dibuat oleh Shapiro dan
Wilk. Metode Shapiro-Wilk adalah metode uji normalitas yang efektif dan valid digunakan untuk sampel
berjumlah kecil. Terdapat beberapa syarat yang harus dipenuhi oleh data yang akan diuji kenormalannya
menggunakan metode ini, yaitu data berskala interval atau rasio (kuantitatif), data merupakan data tunggal yang
belum dikelompokkan pada tabel distribusi frekuensi, dan data sampel diambil secara random. Tahapan pengujian
kenormalan menggunakan Shapiro Wilk:
1. Penentuan hipotesis
𝐻0 : Data berdistribusi normal p-variat
𝐻1 : Data tidak berdistribusi normal p-variat
2. Data diurutkan dari yang terkecil sampai terbesar dan kemudian dibagi menjadi dua untuk dikonversi dalam
Shapiro Wilk.
3. Menghitung statistik uji
1 2
𝑇3 = [∑𝑘𝑖=1 𝑎𝑖 (𝑥𝑛−1+1 − 𝑥𝑖 )]
𝐷
𝐷 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
dengan
𝑎𝑖 : koefisien Saphiro Wilk
𝑥𝑛−𝑖+1 : data ke 𝑛 − 𝑖 + 1
𝑥𝑖 : 𝑑𝑎𝑡𝑎 𝑘𝑒 − 𝑖
𝑥̅ : rata − rata
4. Menghitung signifikansi uji dengan membandingkan signifikansi uji dan nilai tabel Shapiro Wilk untuk dilihat
nilai peluangnya (𝑝). Jika 𝑝 < 𝛼 maka tolak 𝐻0 .
A. Sumber Data
Data yang digunakan dalam penelitian ini adalah data sekunder yang diambil dari website UCI
(archive.ics.uci.edu/ ml/datasets) sebanyak 249 data. Merupakan data jumlah review tempat tujuan yang terdiri
dari beberapa kategori, dari suatu website di India Selatan yang terdiri dari beberapa kategori tempat tujuan.
B. Variabel Penelitian
Variabel yang digunakan dalam penelitian ini adalah sebagai berikut:
1. Variabel X1 adalah jumlah review tujuan perjalanan kategori religi atau tempat-tempat religi yang ada di India
Selatan.
2. Variabel X2 adalah tujuan perjalanan kategori tempat belanja yang ada di India selatan.
C. Langkah-Langkah Analisis Data
1. Melakukan pengujian korelasi antar variabel X1 dan X2 menggunakan Uji Bartlett.
2. Melakukan pengujian distribusi normal multivariat dengan beberapa metode :
2
a. Menghitung proporsi nilai square distance d j yang nilainya kurang dari 2,0.5
2
D. Variabel Penelitian
Variabel yang digunakan dalam penelitian ini adalah sebagai berikut:
1. Variabel 𝑋1 adalah jumlah kandungan NO2 di udara yang terekam oleh perangkat sensor dengan satuan
𝜇𝑔/𝑚3
2. Variabel 𝑋2 adalah jumlah kandungan CO di udara yang terekam oleh perangkat sensor dengan satuan
𝜇𝑔/𝑚3
E. Langkah-Langkah Analisis Data
1. Melakukan pengujian korelasi antar variabel X1 dan X2 menggunakan Uji Bartlett.
4. Melakukan pengujian distribusi normal multivariat dengan beberapa metode :
2
c. Menghitung proporsi nilai square distance d j yang nilainya kurang dari 2,0.5
2