Anda di halaman 1dari 13

Lihat diskusi, statistik, dan profil penulis untuk publikasi ini di: https://www.researchgate.

net/publication/319808256

Analisis Statistik Multivariat

Artikel · Juli 2012

CITATIONS BACA

16 9,850

1 penulis:

Mushtak AK Shiker

Universitas Babel

9 PUBLIKASI     39 CITATIONS    

LIHAT PROFIL

Beberapa penulis publikasi ini juga mengerjakan proyek-proyek terkait ini:

Sistem Keandalan, Teori Grafik, Teori Probabilitas Lihat proyek

Metode Pencarian Baris Lihat proyek

Semua konten yang mengikuti halaman ini diunggah oleh Mushtak AK Shiker pada 16 September 2017.

Pengguna telah meminta peningkatan file yang diunduh.


British Journal of Science 55
Juli 2012, Vol. 6 (1)

Analisis Statistik Multivariat

Mushtak AK Shiker
Departemen Matematika
Perguruan Tinggi Pendidikan untuk Ilmu Pengetahuan Murni - Universitas Babylon

Abstrak
Analisis Multivariat mengandung banyak Teknik yang dapat digunakan untuk menganalisis sekumpulan data. Dalam makalah ini kami membahas
teknik-teknik ini dengan yang bermanfaat dan sulit. Dan kami memberikan pemahaman eksekutif tentang teknik analisis multivariat ini, menghasilkan
pemahaman tentang penggunaan yang tepat untuk masing-masing, yang membantu peneliti untuk memahami jenis pertanyaan penelitian yang dapat
dirumuskan dan kemampuan dan keterbatasan masing-masing teknik dalam menjawab pertanyaan tersebut. pertanyaan. Kemudian kami memberikan
aplikasi salah satu dari teknik ini.

Pandangan Sejarah

Pada tahun 1889 Galton memberi kami distribusi normal, metode statistik ini digunakan secara tradisional, menetapkan
koefisien korelasi dan regresi linier. Pada abad ke-20 dari 20 Fisher mengusulkan analisis varians dan analisis diskriminan, SS
Wilkes mengembangkan analisis varians multivariat, dan H. Hotelling menentukan analisis komponen utama dan korelasi kanonik.
Secara umum, pada paruh pertama abad ke-20, sebagian besar teori analisis multivariat telah ditetapkan. 60 tahun kemudian,
dengan perkembangan ilmu komputer, psikologi, dan metode analisis multivariat dalam studi banyak disiplin ilmu lain telah banyak
digunakan. Program-program seperti SAS dan SPSS, yang dulu terbatas pada pemanfaatan mainframe, sekarang sudah tersedia
di Windows. Analis riset pemasaran sekarang memiliki akses ke jajaran teknik canggih yang jauh lebih luas untuk mengeksplorasi
data. Tantangannya adalah mengetahui teknik mana yang harus dipilih, dan memahami dengan jelas kekuatan dan kelemahannya.

Pengantar :
Analisis statistik multivariat adalah penggunaan metode statistik matematika untuk mempelajari dan memecahkan masalah teori dan
metode multi-indeks. 20 tahun terakhir, dengan teknologi aplikasi komputer dan kebutuhan mendesak untuk penelitian dan produksi, teknik
analisis statistik multivariat banyak digunakan dalam geologi, meteorologi, hidrologi, kedokteran, industri, pertanian dan ekonomi dan banyak
bidang lainnya, telah menjadi solusi praktis. masalah dengan cara yang efektif. Arsitektur sistem yang disederhanakan untuk mengeksplorasi
kernel sistem, dapat menggunakan analisis komponen utama, analisis faktor, analisis korespondensi, dan metode lain, sejumlah faktor dalam
setiap variabel untuk menemukan subset informasi terbaik dari subset deskripsi yang terdapat dalam hasil multivariabel sistem dan dampak
berbagai faktor pada sistem.

Dalam analisis multivariat, mengendalikan prediksi model memiliki dua kategori. Salah satunya adalah model prediksi, sering
menggunakan regresi linier berganda, analisis regresi bertahap, analisis diskriminan atau analisis regresi bertahap pemodelan skrining
ganda. Yang lainnya adalah model deskriptif, teknik pemodelan analisis cluster yang umum digunakan.

Dalam sistem analisis multivariat, sistem membutuhkan sifat yang serupa dari hal-hal atau fenomena yang dikelompokkan bersama, untuk
mengidentifikasi hubungan antara mereka dan keteraturan yang melekat, banyak penelitian sebelumnya sebagian besar pengobatan kualitatif oleh
faktor tunggal, sehingga hasilnya tidak mencerminkan karakteristik umum dari sistem. Misalnya klasifikasi numerik, model klasifikasi umum dibangun
menggunakan analisis cluster dan teknik analisis diskriminan.

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 56
Juli 2012, Vol. 6 (1)

Di bidang mana kita dapat menggunakan analisis multivarian?

Teknik multivariat digunakan untuk mempelajari dataset dalam riset konsumen dan pasar, kontrol kualitas dan jaminan kualitas, optimisasi
proses dan kontrol proses, serta penelitian dan pengembangan. Teknik-teknik ini sangat penting dalam penelitian ilmu sosial karena peneliti
sosial umumnya tidak dapat menggunakan percobaan laboratorium secara acak, seperti yang digunakan dalam ilmu kedokteran dan ilmu alam.
Di sini teknik multivariat dapat secara statistik memperkirakan hubungan antara variabel yang berbeda, dan menghubungkan seberapa penting
masing-masing dengan hasil akhir dan di mana ada ketergantungan di antara mereka.

Mengapa kami menggunakan teknik multivarian?

Karena sebagian besar analisis data mencoba menjawab pertanyaan kompleks yang melibatkan lebih dari dua variabel,
pertanyaan ini paling baik ditangani oleh teknik statistik multivariat. Ada beberapa teknik multivariat yang berbeda untuk dipilih,
berdasarkan asumsi tentang sifat data dan jenis asosiasi yang dianalisis. Setiap teknik menguji model teoritis dari pertanyaan
penelitian tentang asosiasi terhadap data yang diamati. Model teoritis didasarkan pada fakta plus hipotesis baru tentang hubungan
yang masuk akal antara variabel. Teknik multivariat memungkinkan peneliti untuk melihat hubungan antar variabel secara
menyeluruh dan untuk mengukur hubungan antar variabel. Mereka dapat mengontrol hubungan antara variabel dengan
menggunakan tabulasi silang, korelasi parsial dan regresi berganda, dan memperkenalkan variabel lain untuk menentukan
hubungan antara variabel independen dan dependen atau untuk menentukan kondisi di mana asosiasi berlangsung. Ini
memberikan gambaran yang jauh lebih kaya dan realistis daripada melihat variabel tunggal dan memberikan tes signifikansi yang
kuat dibandingkan dengan teknik univariat.

Apa kesulitan menggunakan teknik multivariat?

Teknik multivariat rumit dan melibatkan matematika tingkat tinggi yang memerlukan program statistik untuk menganalisis data.
Program statistik ini umumnya mahal. Hasil analisis multivariat tidak selalu mudah untuk ditafsirkan dan cenderung didasarkan pada
asumsi yang mungkin sulit untuk dinilai. Untuk teknik multivariat untuk memberikan hasil yang bermakna, mereka membutuhkan sampel
data yang besar; jika tidak, hasilnya tidak berarti karena kesalahan standar yang tinggi. Kesalahan standar menentukan seberapa percaya
diri Anda dalam hasil, dan Anda bisa lebih percaya diri dalam hasil dari sampel besar daripada yang kecil. Menjalankan program statistik
cukup mudah tetapi memang membutuhkan ahli statistik untuk memahami output.

Bagaimana memilih metode yang tepat untuk menyelesaikan masalah praktis?

1. Masalahnya perlu diperhitungkan. Masalah dapat diintegrasikan pada berbagai metode statistik yang digunakan untuk
analisis. Misalnya, model prediksi dapat didasarkan pada prinsip biologis, ekologis, untuk menentukan model teoretis dan
desain eksperimental; berdasarkan hasil tes, pengumpulan data tes; ekstraksi data awal; dan kemudian menerapkan metode
analisis statistik (seperti analisis korelasi, dan analisis regresi bertahap, analisis komponen utama) untuk mempelajari korelasi
antara variabel, pilih subset variabel terbaik; atas dasar ini membangun model peramalan, diagnosis akhir model dan

optimasi, dan terapan untuk sebenarnya produksi.


Analisis multivariat, dengan mempertimbangkan variabel respon berganda dari metode analisis statistik.

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 57
Juli 2012, Vol. 6 (1)

Isi utamanya meliputi dua vektor rata-rata pengujian hipotesis, analisis varians multivariat, analisis komponen utama, analisis
faktor, analisis kluster, dan analisis terkait model.
2. Jadi, Selama beberapa metode analisis multivariat mereka memiliki kelebihan dan keterbatasan, masing-masing metode memiliki asumsi spesifik,

kondisi dan persyaratan data, seperti normalitas, linieritas, dan varian yang sama dan seterusnya. Oleh karena itu, dalam penerapan metode analisis

multivariat, harus diperiksa dalam tahap perencanaan untuk menentukan kerangka kerja teoritis untuk menentukan data apa yang akan dikumpulkan,

cara mengumpulkan, dan bagaimana menganalisis data.

Pendekatan model linier


Analisis multivariat dari metode yang umum digunakan meliputi tiga kategori:
1. Analisis varians multivariat, analisis regresi berganda dan analisis kovarians, yang dikenal sebagai pendekatan model linear
untuk penelitian untuk menentukan variabel independen dan hubungan antara variabel dependen.

2. Analisis fungsi diskriminatif dan analisis tipe-poli untuk mempelajari klasifikasi berbagai hal.
3. Analisis komponen utama, korelasi kanonik dan analisis faktor untuk mempelajari bagaimana kombinasi faktor
dengan kurang sebagai gantinya dari lebih dari itu asli jumlah dari variabel.
Analisis multivarian varians dalam total varians sesuai dengan sumbernya (atau desain eksperimental) dibagi menjadi beberapa
bagian, yang menguji berbagai faktor pada variabel dependen dan interaksi antara faktor-faktor metode statistik. Sebagai contoh,
dalam analisis data desain faktorial 2 × 2, total varians dapat dibagi menjadi dua faktor termasuk dua variasi kelompok, interaksi
antara dua faktor, dan kesalahan (yaitu, variasi dalam kelompok) dan empat bagian, kemudian interaksi antara variasi kelompok dan
signifikansi
F uji .
Keuntungan dari analisis varians multivariat dapat diuji secara bersamaan dalam satu studi, sejumlah faktor dengan berbagai
tingkatan masing-masing variabel dependen dan interaksi antara berbagai faktor. Batasan penerapannya adalah sampel dari
setiap level setiap faktor harus sampel acak independen, pengamatan berulang data mengikuti distribusi normal, dan varians
populasi sama.

Beberapa Jenis Teknik Analisis Multivariat:

1. Analisis regresi berganda:

Analisis regresi berganda digunakan untuk menilai dan menganalisis sejumlah variabel independen dengan fungsi linear
variabel dependen dari hubungan antara metode statistik. Variabel dependen y dan variabel independen x 1, x 2, ... x m adalah
hubungan regresi linier:
• • • • 1 1
... • •
•xxy mm
• • .......... 1 )(

Dimana α, β 1, ... , β m adalah parameter yang harus diperkirakan, ε adalah variabel acak yang salah. Diperoleh melalui eksperimen x 1, x 2 , ... , x m dar
beberapa set data dan nilai y yang sesuai.
Analisis regresi berganda memiliki keunggulan dari suatu fenomena yang dapat digambarkan secara kuantitatif antara faktor-faktor tertentu
dan fungsi linier. Nilai-nilai yang diketahui dari setiap variabel ke dalam persamaan regresi dapat diperoleh estimasi dari variabel dependen
(prediktor), yang secara efektif dapat memprediksi kejadian dan perkembangan suatu fenomena. Dapat digunakan untuk variabel kontinu, juga
dapat digunakan untuk variabel dikotomis.

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 58
Juli 2012, Vol. 6 (1)

Dalam teknik ini, kami mempertimbangkan hubungan linier antara satu atau lebih y (variabel dependen atau respons) dan satu atau lebih x
(variabel independen atau prediktor). Kami akan menggunakan model linier untuk menghubungkan y ke x dan akan diperhatikan dengan
estimasi dan pengujian parameter dalam model. Salah satu aspek yang menarik adalah memilih variabel mana yang akan dimasukkan
dalam model jika ini belum diketahui. Kita dapat membedakan tiga kasus berdasarkan jumlah variabel:

1. Regresi linier sederhana: satu y dan satu x. Sebagai contoh, misalkan kita ingin memprediksi nilai rata-rata tingkat perguruan tinggi (IPK)
berdasarkan IPK SMA pelamar.
2. Regresi linier berganda: satu y dan beberapa x. Misalnya, kami dapat berupaya meningkatkan prediksi IPK perguruan tinggi dengan
menggunakan lebih dari satu variabel independen, seperti IPK sekolah menengah, skor tes standar (seperti ACT atau SAT), atau peringkat
sekolah menengah.
3. Regresi linier berganda multivariat: beberapa y dan beberapa x. Dalam ilustrasi sebelumnya, kita dapat memprediksi beberapa y
(seperti jumlah tahun kuliah seseorang akan menyelesaikan IPK dalam sains, seni, dan humaniora).

2. Analisis Regresi Logistik:

Kadang-kadang disebut sebagai "model pilihan," teknik ini adalah variasi dari regresi berganda yang memungkinkan prediksi suatu
peristiwa. Dimungkinkan untuk menggunakan variabel dependen nonmetrik (biasanya biner), karena tujuannya adalah untuk sampai
pada penilaian probabilistik dari pilihan biner. Variabel independen dapat berupa diskrit atau kontinu. Tabel kontingensi dihasilkan,
yang menunjukkan klasifikasi pengamatan, apakah peristiwa yang diamati dan diprediksi cocok. Jumlah peristiwa yang diperkirakan
terjadi yang benar-benar terjadi dan peristiwa yang diprediksi tidak terjadi yang sebenarnya tidak terjadi, dibagi dengan jumlah total
peristiwa, adalah ukuran efektivitas model. Alat ini membantu memprediksi pilihan yang mungkin dibuat konsumen ketika disajikan
dengan alternatif.

3. Analisis Varians Multivarian (MANOVA):

Teknik ini menguji hubungan antara beberapa variabel independen kategori dan dua atau lebih variabel dependen metrik. Sedangkan
analisis varian (ANOVA) menilai perbedaan antara kelompok (dengan menggunakan uji T untuk 2 rata-rata dan uji F antara 3 atau
lebih rata-rata), MANOVA
meneliti hubungan ketergantungan antara serangkaian tindakan dependen di seluruh kelompok. Biasanya analisis ini digunakan
dalam desain eksperimental, dan biasanya hubungan hipotesis antara tindakan dependen digunakan. Teknik ini sedikit berbeda
dengan yang independen
variabel bersifat kategorikal dan variabel dependen adalah metrik. Ukuran sampel adalah masalah, dengan 15-20 pengamatan yang
dibutuhkan per sel. Namun, terlalu banyak pengamatan per sel (lebih dari 30) dan teknik ini kehilangan signifikansi praktisnya. Ukuran
sel harus kira-kira sama, dengan sel terbesar memiliki kurang dari 1,5 kali pengamatan sel terkecil. Itu karena, dalam teknik ini,
normalitas variabel dependen adalah penting. Kesesuaian model ditentukan dengan memeriksa ekivalen vektor rata-rata antar
kelompok. Jika ada perbedaan yang signifikan dalam rata-rata, hipotesis nol dapat ditolak dan perbedaan pengobatan dapat
ditentukan.

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 59
Juli 2012, Vol. 6 (1)

4. Analisis faktor :

Ketika ada banyak variabel dalam desain penelitian, sering membantu untuk mengurangi variabel ke set faktor yang lebih kecil. Ini
adalah teknik independensi, di mana tidak ada variabel dependen. Sebaliknya, peneliti mencari struktur yang mendasari matriks
data. Idealnya, variabel independen normal dan kontinu, dengan setidaknya 3 hingga 5 variabel memuat ke faktor. Ukuran sampel
harus lebih dari 50 pengamatan, dengan lebih dari 5 pengamatan per variabel.

Ada dua metode analisis faktor utama: analisis faktor umum, yang mengekstraksi faktor berdasarkan varians bersama oleh faktor, dan analisis
komponen utama, yang mengekstraksi faktor berdasarkan total varians faktor. Analisis faktor umum digunakan untuk mencari faktor laten
(mendasar), di mana sebagai analisis komponen utama digunakan untuk menemukan jumlah variabel paling sedikit yang menjelaskan varian
terbanyak. Faktor pertama yang diekstraksi menjelaskan perbedaan paling banyak. Biasanya, faktor diekstraksi selama nilai eigen lebih besar
dari 1,0 atau tes sekrup secara visual menunjukkan berapa banyak faktor yang diekstraksi. Dalam analisis faktor, kami mewakili variabel y 1, y 2, . . .
, y hal sebagai kombinasi linear dari beberapa variabel acak

f 1, f 2, . . . , f m ( m <p) disebut faktor. Faktor-faktor yang mendasari konstruksi atau laten variabel yang "menghasilkan" y. Seperti variabel asli,
faktor-faktor bervariasi dari individu ke individu; tetapi tidak seperti variabel, faktor-faktor tidak dapat diukur atau diamati.

Tujuan dari analisis faktor adalah untuk mengurangi redundansi antar variabel dengan menggunakan jumlah faktor yang lebih kecil.

5. Analisis fungsi diskriminan (deskripsi pemisahan kelompok):

Analisis fungsi diskriminan digunakan untuk menentukan klasifikasi metode statistik individu. Prinsip dasarnya adalah: Menurut dua atau
lebih sampel dari kelas yang diketahui dari data pengamatan untuk mengidentifikasi satu atau beberapa fungsi diskriminan linier dan indeks
diskriminan, kemudian tentukan fungsi diskriminan
berdasarkan indikator lain untuk menentukan kategori mana yang dimiliki individu.
Ada dua tujuan utama dalam pemisahan kelompok:
1. Deskripsi pemisahan kelompok, di mana fungsi linear dari variabel (fungsi diskriminan) digunakan untuk menggambarkan atau
menjelaskan perbedaan antara dua atau lebih kelompok. Tujuan analisis deskriptif diskriminan meliputi mengidentifikasi kontribusi relatif dari
variabel p terhadap pemisahan kelompok-kelompok dan menemukan bidang yang optimal di mana titik-titik dapat diproyeksikan untuk
mengilustrasikan konfigurasi kelompok.

2. Prediksi atau alokasi pengamatan untuk kelompok, di mana fungsi linear atau kuadrat dari variabel (fungsi klasifikasi) digunakan untuk
menetapkan unit pengambilan sampel individu ke salah satu kelompok. Nilai-nilai yang diukur dalam vektor pengamatan untuk individu atau
objek dievaluasi oleh fungsi klasifikasi untuk menemukan kelompok yang kemungkinan besar dimiliki oleh individu tersebut.

Analisis diskriminan tidak hanya digunakan untuk variabel kontinu dan dengan menggunakan teori bilangan dapat digunakan untuk data kualitatif,
ini membantu untuk secara objektif menentukan kriteria klasifikasi. Namun, analisis diskriminan hanya dapat menjadi kasus untuk kategori yang telah
diidentifikasi. Ketika kelas itu sendiri tidak pasti, kami menggunakan pra-pemisahan kategori pertama dengan analisis diskriminan atau dengan analisis
cluster.

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 60
Juli 2012, Vol. 6 (1)

6. Analisis cluster:

Dalam analisis klaster kami mencari pola dalam kumpulan data dengan mengelompokkan pengamatan (multivarian) ke dalam kelompok. Tujuannya adalah
untuk menemukan pengelompokan yang optimal di mana pengamatan atau objek dalam masing-masing cluster adalah serupa, tetapi cluster berbeda satu sama
lain. Kami berharap dapat menemukan pengelompokan alami dalam data, pengelompokan yang masuk akal bagi peneliti.

Jadi, analisis cluster digunakan untuk memecahkan masalah metode klasifikasi statistik. Jika pengamatan yang diberikan terhadap n objek, setiap
objek memiliki karakteristik yang diamati p (variabel), bagaimana mereka dikelompokkan menjadi beberapa kelas didefinisikan? Jika objek pada
clustering yang diamati, dikenal sebagai analisis tipe-Q; jika variabel bersama-sama kelas, yang disebut analisis tipe-R, prinsip dasar
pengelompokan adalah membuat perbedaan internal yang sama kecil, tetapi perbedaan besar antara kategori. Salah satu analisis klaster adalah
metode hierarkis pengelompokan, misalnya, untuk n objek ke kelas k, yang pertama n objek ke kelas mereka sendiri, total n kelas, kemudian
menghitung jenis berpasangan "jarak" untuk menemukan terdekat dua kelas, ke dalam kelas baru, lalu ulangi proses ini langkah demi langkah,
sampai tanggal untuk kelas k.

Analisis cluster berbeda secara fundamental dari analisis klasifikasi. Dalam analisis klasifikasi, kami mengalokasikan pengamatan ke sejumlah
kelompok atau populasi yang telah ditentukan. Dalam analisis cluster, baik jumlah kelompok maupun kelompok itu sendiri tidak diketahui sebelumnya.
Untuk mengelompokkan pengamatan menjadi beberapa kelompok, banyak teknik dimulai dengan kesamaan antara semua pasangan pengamatan.
Dalam banyak kasus, kesamaan didasarkan pada beberapa ukuran jarak. Metode cluster lainnya menggunakan pilihan awal untuk pusat-pusat
cluster atau perbandingan variabilitas dalam dan antar-cluster. Dimungkinkan juga untuk mengelompokkan variabel-variabel, dalam hal ini
kesamaannya bisa berupa korelasi.

Kita dapat mencari kelompok secara grafis dengan merencanakan pengamatan. Jika hanya ada dua variabel (p = 2), kita bisa melakukan ini di sebar
plot. Untuk p> 2, kita dapat memplot data dalam dua dimensi menggunakan komponen utama atau biplots.

Analisis kluster juga telah disebut sebagai klasifikasi, pengenalan pola (khususnya, pembelajaran tanpa pengawasan), dan
taksonomi numerik. Teknik-teknik analisis kluster telah banyak diterapkan pada data di banyak bidang, seperti kedokteran,
psikiatri, sosiologi, kriminologi, antropologi, arkeologi, geologi, geografi, penginderaan jauh, riset pasar, ekonomi, dan teknik.

Ketika ukuran sampel besar, n sampel pertama dapat dibagi menjadi kelas k, dan kemudian secara bertahap dimodifikasi
sesuai dengan prinsip-prinsip yang terbaik sampai klasifikasi masuk akal sejauh ini.
Analisis cluster didasarkan pada hubungan antara individu atau jumlah variabel untuk mengklasifikasikan, objektivitas yang
kuat, tetapi berbagai metode clustering hanya dapat dicapai dalam kondisi tertentu, optimum lokal, hasil clustering akhir ditetapkan,
para ahli masih perlu identifikasi. Diperlukan untuk membandingkan beberapa metode berbeda untuk memilih yang lebih sesuai
dengan persyaratan profesional dari hasil klasifikasi.

Misalnya, kabin data matriks ditulis sebagai:


• 1• •
• •
• 2• •
y • • • • • 1 )(
, 2 ()
, . . ., yyy
( hal)
• . . . . . . . . .... . . . . . . .... . . • 2 •

• •
• yyy•
• n• •
dimana • adalah baris (vektor observasi) dan
y saya y (j )
adalah kolom (sesuai dengan variabel).
7. Multidimensional Scaling (MDS)

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 61
Juli 2012, Vol. 6 (1)

MDS mengubah penilaian konsumen terhadap kesamaan menjadi jarak yang direpresentasikan dalam ruang multidimensi. Ini adalah
pendekatan dekomposisi yang menggunakan pemetaan persepsi untuk menyajikan dimensi. Sebagai teknik eksplorasi, ini berguna dalam
memeriksa dimensi yang tidak dikenali
tentang produk dan dalam mengungkap evaluasi komparatif produk ketika dasar untuk perbandingan tidak diketahui.

Penskalaan multidimensi disebut teknik reduksi dimensi. Dalam skala ini kita mulai dengan jarak δ aku j antara masing-masing
pasangan item. Kami ingin mewakili n item dalam sistem koordinat dimensi rendah, di mana jarak d aku j antar item sangat cocok
~ δ aku j
dengan jarak aslinya δ aku j, itu adalah, d aku j •
untuk semua saya, j.
Jarak akhir d aku j biasanya Euclidean. Jarak aslinya δ aku j mungkin jarak yang diukur sebenarnya antara pengamatan y saya dan y j dalam
dimensi p, seperti:
1/2
δ ij = [(y - y ) • jiji(y - y)] …………… .. (3)
Di sisi lain, jarak δ aku j mungkin hanya kedekatan atau kesamaan berdasarkan penilaian manusia, misalnya, tingkat kesamaan yang dirasakan antara
semua pasangan merek dari jenis alat tertentu. Tujuan dari penskalaan multidimensi adalah plot yang menunjukkan informasi tentang bagaimana
item-item tersebut berhubungan satu sama lain atau menyediakan beberapa interpretasi data bermakna lainnya. Misalnya, tujuannya mungkin
seriasi atau peringkat; jika titik terletak dekat dengan kurva dalam dua dimensi, maka urutan poin di sepanjang kurva digunakan untuk menentukan
peringkat poin.

8. Analisis komponen utama:

Dalam analisis komponen utama, kami berusaha untuk memaksimalkan varians dari kombinasi linear dari variabel. Sebagai contoh, kita mungkin
ingin membuat peringkat siswa berdasarkan skor mereka pada tes prestasi dalam bahasa Inggris, matematika, membaca, dan sebagainya. Skor
rata-rata akan memberikan skala tunggal untuk membandingkan siswa, tetapi dengan bobot yang tidak sama dari mata pelajaran ini kami dapat
menyebarkan siswa lebih jauh pada skala dan mendapatkan peringkat yang lebih baik.

Pada dasarnya, analisis komponen utama adalah teknik satu sampel yang diterapkan pada data tanpa pengelompokan di
antara pengamatan dan tidak ada pembagian variabel ke dalam subset y dan x. Semua kombinasi linear yang telah kami
pertimbangkan sebelumnya terkait dengan variabel lain atau dengan struktur data. Dalam regresi, kami memiliki kombinasi
linear dari variabel independen yang paling baik memprediksi variabel dependen, dalam korelasi kanonik, kami memiliki
kombinasi linear dari subset variabel yang berkorelasi maksimal dengan kombinasi linear dari subset variabel lain, dan
analisis diskriminan melibatkan kombinasi linear yang secara maksimal memisahkan kelompok pengamatan. Komponen
utama, di sisi lain, hanya memperhatikan struktur inti dari satu sampel pengamatan pada variabel p.

Analisis komponen utama dapat membantu mengidentifikasi faktor-faktor utama yang mempengaruhi variabel dependen, dan juga dapat
diterapkan pada metode analisis multivariat lainnya dalam penyelesaian komponen utama ini setelah analisis regresi. Analisis komponen utama
juga dapat berfungsi sebagai langkah pertama dalam analisis faktor. Kerugiannya adalah hanya melibatkan satu set saling ketergantungan antar
variabel, untuk membahas
hubungan antara dua variabel yang diperlukan untuk menggunakan korelasi kanonik.

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 62
Juli 2012, Vol. 6 (1)

9. Analisis Korespondensi:

Teknik ini memberikan pengurangan dimensi peringkat objek pada satu set atribut, menghasilkan peta persepsi peringkat.
Namun, seperti MDS, variabel independen dan variabel dependen diperiksa secara bersamaan. Teknik ini lebih mirip dengan
analisis faktor. Ini adalah teknik komposisi, dan berguna ketika ada banyak atribut dan banyak perusahaan. Ini paling sering
digunakan dalam menilai efektivitas kampanye iklan. Ini juga digunakan ketika atribut terlalu mirip untuk analisis faktor
menjadi bermakna. Pendekatan struktural utama adalah

pengembangan tabel kontingensi. Ini berarti bahwa model dapat dinilai dengan memeriksa nilai Chi-square untuk model.
Analisis korespondensi sulit ditafsirkan, karena dimensi adalah kombinasi dari variabel independen dan dependen.

Ini adalah teknik grafis untuk mewakili informasi dalam tabel kontingensi dua arah, yang berisi jumlah (frekuensi) item untuk
klasifikasi silang dari dua variabel kategori. Dengan analisis korespondensi, kami membangun plot yang menunjukkan
interaksi dua variabel kategori bersama dengan hubungan baris satu sama lain dan kolom satu sama lain.

10. Analisis korelasi kanonik:

Korelasi kanonik adalah perpanjangan dari korelasi ganda, yang merupakan korelasi antara satu y dan beberapa x, ini sering
merupakan pelengkap yang berguna untuk analisis regresi multivariat. Ini sedang bekerja melalui deskripsi komprehensif
intervensi dari koefisien korelasi khas antara dua set metode statistik variabel multivariat acak.

Biarkan x menjadi variabel acak, dan biarkan y menjadi variabel acak, bagaimana cara menggambarkan tingkat korelasi di antara mereka? Ini
membosankan tidak mencerminkan sifat hal. Jika kita menggunakan analisis korelasi kanonik, prosedur dasarnya adalah, dari fungsi linier dari dua variabel
yang masing-masing mengambil satu dari setiap bentuk pasangan, mereka harus menjadi koefisien korelasi maksimum dari suatu pasangan, yang dikenal
sebagai pasangan pertama dari variabel kanonik, sama seperti kita juga dapat menemukan dua pasangan pertama, 3 pasangan, ..., antara pasangan variabel
yang tidak terkait, koefisien korelasi untuk variabel tipikal yang disebut koefisien korelasi kanonik.

Koefisien korelasi kanonik yang dihasilkan lebih dari set variabel asli dalam sejumlah variabel.
.
Analisis korelasi kanonik dari dua set variabel berkontribusi terhadap deskripsi komprehensif tentang hubungan khas antara
mereka. Syaratnya adalah bahwa kedua variabel tersebut adalah variabel kontinu, informasi tersebut harus mematuhi distribusi
normal multivariat.

11. Analisis gabungan:

Analisis konjoin sering disebut "analisis trade-off," karena memungkinkan untuk mengevaluasi objek dan berbagai tingkat atribut
yang akan diperiksa. Ini adalah teknik komposisi dan teknik ketergantungan, di mana tingkat preferensi untuk kombinasi atribut dan
level dikembangkan. Nilai-bagian, atau utilitas, dihitung untuk setiap level dari setiap atribut, dan kombinasi atribut pada level
tertentu dijumlahkan untuk mengembangkan preferensi keseluruhan untuk atribut di setiap level. Model dapat dibangun yang
mengidentifikasi tingkat ideal dan kombinasi atribut untuk produk dan layanan.

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 63
Juli 2012, Vol. 6 (1)

12.Structural Equation Modeling (SEM):

Berbeda dengan teknik multivariat lainnya yang dibahas, pemodelan persamaan struktural (SEM) meneliti beberapa hubungan antara set
variabel secara bersamaan. Ini mewakili keluarga teknik .EM dapat memasukkan variabel laten, yang baik tidak atau tidak dapat diukur
langsung ke dalam analisis. Sebagai contoh, tingkat kecerdasan hanya dapat disimpulkan, dengan pengukuran langsung variabel seperti
nilai ujian, tingkat pendidikan, rata-rata titik kelas, dan langkah-langkah terkait lainnya. Alat-alat ini sering digunakan untuk mengevaluasi
banyak atribut berskala atau membangun skala terangkum.

13.Log - model linear:

Teknik ini berkaitan dengan data klasifikasi. Dimana ada variabel dependen dan satu atau lebih dari satu variabel independen. Data yang
diamati diklasifikasikan dalam tabel kontingensi, Kemudian kami membuat model log linier tergantung pada data ini, dan kami menemukan nilai
yang diharapkan untuk masing-masing model ini. , di
masing-masing
mana

Model memiliki rumus untuk menemukan data yang diharapkan ini, setelah itu kami menghitung (Pearson • 2 ) dan (Kemungkinan - Statistik Jatah G 2 ) , untuk

membandingkannya dengan tabel • 2 untuk mengetahui apakah model pemilihan yang baik mewakili data atau tidak, yaitu jika nilai yang dihitung dari ( •

2 dan G 2 ) kurang dari tabel • 2 , itu berarti nilai yang dihitung adalah semangat kerja, dan model membuat yang baik mewakili data

, dan jika tidak (itu adalah nilai yang dihitung dari ( • 2 dan G 2 ) tidak kurang dari tabel • 2 ) maka kita harus memilih model lain.

Contoh aplikasi:

Kami mengambil data dari Rumah Sakit Ibn al-Haytham yang merupakan rumah sakit terbesar di Irak untuk penyakit mata, ukuran sampel N =

1285 pasien, di sini kami menggunakan teknik model Log - linear. Pasien diklasifikasikan menurut:

1. Jenis penyakit (yang mengandung dua kategori: yang dianggap di sini sebagai variabel dependen: A - ablasi retina
B - radang batang optik
2. Umur dalam tahun: Ini telah dibagi menjadi tiga kategori: A - 15-44
B - 44- 64 C - lebih dari 64
Peneliti mengabaikan kelompok usia di bawah 15 tahun, karena cedera pada kedua penyakit ini pada periode usia ini tidak ada,
menurut rumah sakit. Data diklasifikasikan dalam tabel kontingensi dua arah:
Tabel 1)
Kontingen dua arah y tabel untuk opser v ed data hal sabar
Penyakit
15 - 44 45-64 Lebih dari 64
Usia

ablasi retina 91 350 162

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 64
Juli 2012, Vol. 6 (1)

peradangan pada
90 387 205
tongkat optik

Sekarang, kami menemukan nilai yang diharapkan di bawah model independen yang rumusnya adalah:

(xi mij
. ) • ( . jx)
.......... 4 )(
N
Kami menempatkan nilai yang diharapkan ini dalam tabel berikut:

Meja 2)
Tabel kontingensi dua arah untuk data yang diharapkan dari pasien

(model independen) Log mij = u + u 1 i + u 2 j

nilai matriks yang diharapkan

85.93 345.84 172.23

96,06 391.15 194.79

Sekarang - kami menghitung ( • 2 dan G 2 ) tempat formula mereka:

•• •
2
2 ( )
• xij . . . . . . . . .... . . . . . . .... . 5 ()
, Ji mij mij

• 2•
2
.......... ....... 6 ()
xij Log xijmij
G
, Ji

2= 1.9171
Hasilnya adalah: • dan G 2 = 0,001

Tingkat kebebasan untuk model independen adalah 2 sesuai dengan tabel derajat kebebasan:

Tabel (3)

Derajat kebebasan untuk (model jenuh dan tidak jenuh) untuk tabel kontingensi dua arah

Ketentuan Anda Derajat kebebasan

U 1

kamu 1 r -1

kamu 2 c -1

kamu 12 (r - 1) (c - 1)

Jumlah rc

Jadi, dengan 2 derajat kebebasan, di bawah moral = 0,05, nilai tabel • 2 = 5.99

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 65
Juli 2012, Vol. 6 (1)

Kemudian dengan membandingkan nilai yang dihitung dari • 2 dan G 2 dengan nilai tabel • 2 , kita melihat bahwa nilai yang dihitung kurang dari nilai
tabel, yang berarti bahwa nilai moral yang dihitung dan model independen membuat representasi yang baik untuk data.

Kesimpulan
Setiap teknik di atas memiliki poin kekuatan dan kelemahan, yang berarti bahwa analis harus berhati-hati ketika
menggunakan teknik ini, di mana ia harus memahami kekuatan dan kelemahan masing-masing teknik ini. Setiap teknik
multivariat menggambarkan beberapa tipe data yang berbeda dari teknik lainnya. Program statistik seperti (spss, sas, dan
lainnya) memudahkan untuk menjalankan prosedur.

Referensi :

1. Alvin C. Rencher.2002: "Metode Analisis Multivariat", A. John Wiley & sons, inc.

publikasi, Edisi Kedua.

2. Bryant dan Yarnold. 1994: "Analisis komponen utama dan faktor eksplorasi dan onfirmatori

analisis ". American Psychological Association Books. ISBN 978-1-55798-273-5.

3. Ding Shi-Sheng. 1981: "Metode analisis berganda dan penerapannya", Penerbitan Jilin People

Rumah, Changchun.

4. Feinstein, AR 1996: "Analisis Multivariabel". New Haven, CT Yale University Press.

5. Garson David. 2009: "Analisis Faktor". dari Statnotes, Topik dalam Analisis Multivariat. Diperoleh kembali

13 April dari http://www2.chass.ncsu.edu/garson/pa765/statnote.htm.

6. Raubenheimer, JE 2004: "Prosedur pemilihan item untuk memaksimalkan reliabilitas dan validitas skala".

Jurnal Psikologi Industri Afrika Selatan, 30 (4), halaman 59-64.

7. Satish Chandra & Dennis Menezes. 2001: "Aplikasi Analisis Multivariat di Internasional

Penelitian Pariwisata: Perspektif Strategi Pemasaran NTO "Jurnal Ekonomi dan Sosial

Penelitian 3 (1), halaman 77-98.

8. Yoshimasa Tsuruoka, Junichi Tsujii dan Sophia Ananiadou tochastic. 2009: "Keturunan Gradien

Pelatihan untuk Model Log-linear 1-teregulasi dengan Prosiding Penalti Kumulatif ke-47

Pertemuan Tahunan ACL dan IJCNLP ke 4 dari AFNLP ", halaman 477–485,

Suntec, Singapura.

© 2012 Jurnal Inggris ISSN 2047-3745


British Journal of Science 66
Juli 2012, Vol. 6 (1)

9. Zhang Yao Ting, dengan Fang Kaitai. 1982: "Pendahuluan Analisis Statistik Multivariat", Sains
Pers, Beijing.

© 2012 Jurnal Inggris ISSN 2047-3745

Lihat statistik
statistik publikasi
publikasi Lihat

Anda mungkin juga menyukai