Anda di halaman 1dari 7

NAMA : LAURA ARIFAH HANUM

NIM : 20081023
MATA KULIAH : STATISTIK MULTIVARIAT
TUGAS : PERTANYAAN BUKU HAL 41

1. In your own words, define multivariate analysis. (Dengan kata-kata Anda sendiri, tentukan
analisis multivariasi.)
Jawab:
Analisis multivariate merupakan suatu metode statistik yang dapat menganalisis banyak
pengukuran pada waktu yang bersamaan kemudian dapat membantu organisasi dalam
mengoptimalkan keputusannya.

2. Name the most important factors contributing to the increased application of techniques for
multivariate data analysis in the last decade. (Sebutkan faktor terpenting yang berkontribusi
pada peningkatan penerapan teknik untuk analisis data multivariat dalam dekade terakhir.)
Jawab:
Faktor: 
a. Memungkinkan organisasi untuk menciptakan pengetahuan  
b. Meningkatkan pengambilan keputusan.

3. What implications does the emergence of Big Data have for researchers? (Apa implikasi
kemunculan Big Data bagi para peneliti?)
Jawab:
Memberikan manfaat bagi peneliti untuk melakukan riset ilmiah, termasuk riset
komunikasi tentang agenda-setting.

4. What are the differences between data models and algorithmic models? How do they impact
the type of analysis performed? (Apa perbedaan antara model data dan model algoritmik?
Bagaimana pengaruhnya terhadap jenis analisis yang dilakukan?) 
Jawab:
Model Statistik atau Data Konsep model data adalah salah satu yang sangat sejalan
dengan pandangan klasik kita tentang model statistik dan analisis. Di sini analis biasanya
mendefinisikan beberapa jenis model data stokastik (misalnya, model regresi berganda atau
logistik), seperti variabel prediktor dan bentuk fungsionalnya. Jadi, model data adalah
model khusus peneliti yang kemudian diestimasi dengan menggunakan data yang tersedia
untuk menilai kecocokan model dan akhirnya dapat diterima.
Sedangkan Model algoritmik, juga dikenal sebagai data mining dan bahkan istilah
kontemporer pembelajaran mesin dan kecerdasan buatan, mengambil pendekatan berbeda
untuk memahami proses dengan mengalihkan fokus dari penjelasan proses prediksi. Premis
dasarnya adalah bahwa proses yang dipelajari secara inheren begitu kompleks sehingga
spesifikasi model yang tepat tidak mungkin. Sebaliknya, penekanannya ada pada algoritme,
bagaimana algoritme tersebut dapat mewakili proses kompleks apa pun, dan seberapa baik
algoritme tersebut pada akhirnya memprediksi hasilnya.

5. What is meant by causal inference? How does it supplement the randomized controlled
experiment? (Apa yang dimaksud dengan inferensi kausal? Bagaimana cara melengkapi
eksperimen terkontrol secara acak?)
Jawab:
Inferensi kausal adalah pergerakan di luar inferensi statistik ke pernyataan yang lebih
kuat tentang "sebab dan akibat" dalam situasi non-eksperimental. Sementara pernyataan
kausal terutama dipahami sebagai domain eksperimen terkontrol secara acak, perkembangan
terbaru telah memberikan peneliti dengan (a) kerangka teoritis untuk memahami persyaratan
untuk kesimpulan kausal dalam pengaturan non-eksperimental, dan (b) beberapa teknik yang
berlaku untuk data tidak berkumpul dalam pengaturan eksperimental yang masih
memungkinkan beberapa kesimpulan kausal ditarik.

6. What are the two facets of managing the variate? What role does each play in a typical
multivariate analysis? (Apa dua aspek mengelola variate? Peran apa yang dimainkan masing-
masing dalam analisis multivariat yang khas?)
Jawab:
Keputusan peneliti dalam mengelola variate terbagi dalam dua area utama:
menentukan variabel independen yang akan dimasukkan dalam analisis dan kemudian
pemilihan variabel selama estimasi model.
Menentukan Variabel Variabel Keputusan utama di sini adalah apakah akan
menggunakan variabel individu atau melakukan beberapa bentuk reduksi dimensi, seperti
analisis faktor eksplorasi. Menggunakan variabel asli mungkin tampak seperti pilihan yang
jelas karena mempertahankan karakteristik variabel dan dapat membuat hasil lebih dapat
ditafsirkan dan dipercaya. Namun ada juga kendala dalam pendekatan ini. Pertama dan
terpenting adalah efek memasukkan ratusan dan bahkan ribuan variabel dan kemudian
mencoba menafsirkan dampak dari setiap variabel, dengan demikian mengidentifikasi
variabel yang paling berdampak dari kumpulan besar. Selain itu, dengan meningkatnya
jumlah variabel, begitu pula peluang untuk multikolinearitas yang membuat perbedaan
dampak variabel individu menjadi lebih sulit.
Pemilihan Variabel Keputusan kedua yang harus diambil mengenai variate adalah
jika peneliti ingin mengontrol variabel tertentu untuk dimasukkan dalam analisis tau
membiarkan perangkat lunak menentukan kumpulan variabel "terbaik" untuk membentuk
variate. Seperti keputusan sebelumnya, ini pada dasarnya berkisar pada tingkat kendali
peneliti. Dengan simultan (semua variabel dimasukkan secara bersamaan) atau konfirmatori
(hanya satu set variabel atau sekuensial yang diuji), peneliti dapat mengontrol variabel yang
tepat dalam model. Pendekatan kombinatorial adalah varian dari pendekatan konfirmatori
dimana semua kemungkinan kombinasi dari himpunan variabel independen diestimasi dan
kemudian dibandingkan pada berbagai kriteria kecocokan model. Dengan kontrol perangkat
lunak, perangkat lunak menggunakan algoritma untuk memutuskan variabel mana yang akan
disimpulkan. Metode yang paling banyak digunakan adalah pendekatan sekuensial, di mana
variabel dimasukkan (biasanya yang paling berdampak pertama) hingga tidak ada variabel
yang berdampak lain yang dapat ditemukan. Pendekatan terbatas mengidentifikasi variabel
yang paling berdampak dan membatasi semua variabel yang lebih kecil ke parameter yang
diperkirakan lebih kecil atau bahkan nol.

7. What types of research questions can the generalized linear model (GLZ) address more
directly than the more traditional general linear model (GLM)? (Jenis pertanyaan penelitian
apa yang dapat ditangani oleh model linier umum (GLZ) lebih langsung daripada model
linier umum (GLM) yang lebih tradisional?)
Jawab:
Landasan untuk hampir semua teknik persamaan tunggal yang dibahas dalam buku
ini adalah model linier umum (GLM), yang dapat memperkirakan korelasi kanonik, regresi
berganda, ANOVA, dan analisis diskriminan, serta semua perbandingan kelompok
univariat - uji t dan semacamnya. Mungkin tidak ada satu bentuk model yang lebih
mendasar untuk statistik inferensial daripada model linier umum. Tetapi satu karakteristik
pembatas dari GLM adalah asumsinya tentang distribusi kesalahan setelah istribusi normal.
Dengan demikian, banyak kali kita harus mengubah variabel dependen ketika diketahui tidak
mengikuti distribusi normal (misalnya, cacah, variabel biner, proporsi atau probabilitas).
Model linier umum (GLZ atau GLIM), model ini memberi peneliti alternatif dari
model linier umum yang didasarkan pada variabel dependen yang menunjukkan distribusi
normal. Sementara GLM memerlukan transformasi variabel dependen non-normal seperti
yang dibahas di atas, GLZ dapat memodelkannya secara langsung tanpa transformasi. Model
GLZ menggunakan estimasi kemungkinan maksimum dan dengan demikian memiliki
serangkaian ukuran kecocokan model yang berbeda, termasuk pengujian dan deviasi rasio
Wald dan Likelihood. GLZ terkadang disebut sebagai GLM yang menyebabkan kebingungan
dengan model linier umum. Kami membuat perbedaan untuk tujuan klarifikasi.
Sementara model linier umum telah menjadi pokok statistik inferensial, model linier
umum memperluas model linier ke variabel hasil yang lebih luas. Di luar ukuran kecocokan
model yang berbeda, kedua jenis model diestimasi dan dievaluasi dengan cara yang sama.
Peneliti yang menghadapi situasi di mana variabel dependen memiliki distribusi tidak normal
didorong untuk mempertimbangkan penggunaan model GLZ sebagai alternatif untuk
mengubah ukuran dependen untuk mencapai normalitas.

8. Why is validation so important? (Mengapa validasi sangat penting?)


Jawab:
Validitas dipandang sebagai konsep yang paling penting dalam penelitian. alam tiap
penelitian selalu dipertanyakan validitas alat yang digunakan. Validitas adalah suatu ukuran
yang menunjukkan bahwa variabel yang diukur memang benar-benar variabel yang hendak
diteliti oleh peneliti (Cooper dan Schindler, dalam Zulganef, 2006). Suatu tes dapat
dikatakan memiliki validitas yang tinggi jika tes tersebut menjalankan fungsi ukurnya, atau
memberikan hasil ukur yang  tepat dan akurat sesuai dengan maksud dikenakannya tes
tersebut. Suatu tes menghasilkan data yang tidak relevan dengan tujuan diadakannya
pengukuran dikatakan sebagai tes yang memiliki validitas rendah.

9. How does cross-validation work? What are some of the more popular types? (Bagaimana
cara kerja validasi silang? Apa sajakah jenis yang lebih populer?) 
Jawab:
Validasi silang meskipun mungkin tampak sederhana untuk hanya membagi sampel
menjadi dua sub-sampel, seringkali ukuran sampel yang terbatas atau pertimbangan lain
membuat hal ini tidak mungkin dilakukan. Untuk situasi ini, pendekatan validasi silang telah
dikembangkan. Prinsip dasar validasi silang adalah bahwa sampel asli dibagi menjadi
sejumlah sub-sampel yang lebih kecil dan kesesuaian validasinya adalah kecocokan "rata-
rata" di semua sub-sampel. Tiga dari pendekatan validasi silang yang lebih populer adalah k-
fold, repeated random/resampling or leave-one-out/jackknife.

10. List and describe the multivariate data analysis techniques described in this chapter. Cite
examples for which each technique is appropriate. (Sebutkan dan jelaskan teknik analisis
data multivariat yang dijelaskan dalam bab ini. Sebutkan contoh-contoh yang cocok untuk
setiap teknik.)
Jawab:
a. Komponen utama dan analisis faktor umum.
Analisis  faktor, termasuk analisis komponen utama dan analisis faktor umum, adalah
pendekatan statistik yang dapat digunakan untuk menganalisis hubungan timbal balik di
antara sejumlah besar variabel dan untuk menjelaskan variabel-variabel ini dalam istilah
dimensi yang mendasarinya. (faktor). 
Misalnya Memahami hubungan antara peringkat pelanggan sebuah restoran cepat saji. 
b. Regresi berganda dan korelasi  ganda.
Regresi berganda adalah metode analisis yang tepat jika masalah penelitian melibatkan
satu variabel dependen metrik yang dianggap terkait dengan dua atau lebih variabel
independen metrik.
Misalnya pengeluaran bulanan untuk makan di luar (variabel dependen) dapat diprediksi
dari informasi mengenai pendapatan keluarga, besarnya, dan umur kepala rumah tangga
(variabel bebas). 
c. Beberapa Analisis Diskriminan dan Regresi Logistik 
Analisis Diskriminan Ganda (MDA) adalahmultivariat yang sesuai teknik jika variabel
dependen tunggal dikotomis atau multikotom dan oleh karena itu nonmetrik.  
Misalnya, membedakan pengguna produk kelas kakap dari pengguna ringan, laki-laki
dari perempuan, pembeli merek nasional dari pembeli label pribadi, dan kredit yang baik
kredit risiko dari risiko yang buruk. 
d. Analisis korelasi Canonical  
Analisis korelasi Canonical dapat dilihat sebagai perpanjangan logis dari analisis regresi
berganda. 
Misalnya penelitian pendapatan dan hasil residensial. Kita dapat membuat semua faktor
menjadi dua kelompok Kemudian melalui studi tentang hubungan antara dua variabel
untuk menganalisis dampak faktor konsumen.  
e. Analisis multivariat varians dan kovarian 
Analisis multivariat varians (MANOVA) adalah teknik statistik yang dapat digunakan
untuk secara bersamaan mengeksplorasi hubungan antara beberapa variabel independen
kategori dan dua atau lebihdependen metrik variabel. 
Misalnya, asumsikan sebuah perusahaan ingin tahu apakah iklan yang lucu akan
lebih efektif dengan pelanggannya daripada iklan yang tidak lucu. Ini dapat meminta
iklannya biro untuk mengembangkan dua iklan — satu lucu dan satu tidak lucu — dan
kemudian menampilkan dua iklan tersebut kepada sekelompok pelanggan. Setelah
melihat iklan tersebut, pelanggan akan diminta untuk menilai perusahaan dan produknya
dalam beberapa dimensi. 
f. Conjoint analysis  
Conjoint analysis adalah teknik ketergantungan yang muncul yang membawa baru 
kecanggihan evaluasi objek, seperti produk, layanan, atau ide baru. 
Misalnya kita dapat mensimulasikan realitas produk, dan kemudian memungkinkan
konsumen untuk mengevaluasi produk virtual tersebut sesuai dengan preferensi mereka
sendiri, dan menggunakan metode statistik matematis untuk memisahkan dari kegunaan 
karakteristik dan tingkat fitur tersebut, untuk membuat metode evaluasi kuantitatif
untuk setiap fitur dan pentingnya tingkat fitur. 
g. Analisis Cluster  
Analisis Cluster adalah teknik analitis untuk mengembangkanyang berarti sub
kelompokindividu atau objek. 
Misalnya Analisis cluster dapat digunakan untuk mengkategorikan dokumen secara
online untuk memperbaiki informasi 
h. Pemetaan persepsi, juga dikenal sebagai skala multidimensi 
Dalam pemetaan perseptual (juga dikenal sebagai skala multidimensi),  tujuannya adalah
untuk mengubah penilaian konsumen tentang kesamaan atau preferensi (misalnya,
preferensi untuk toko atau merek) ke dalam jarak yang direpresentasikan dalam ruang
multidimensi.  
Misalnya, untuk model baru untuk memasuki pasar, perusahaan biasanya memilih tempat
di peta persepsi yang belum dimasuki pesaing lain. 
i. Analisis korespondensi
Analisis korespondensi adalah teknik saling ketergantungan yang dikembangkan baru-
baru ini yang memfasilitasi pemetaan persepsi objek (misalnya, produk, orang) pada satu
set atribut nonmetric. 
Misalnya, sebuah perusahaan mobil dapat membuat daftar variabel (jenis kelamin,
kategori pendapatan, pekerjaan)  dengan menunjukkan berapa banyak orang yang
memilih setiap merek masuk ke dalam setiap kategori. 
j. Struktural pemodelan persamaan dan analisis faktor konfirmatori.
Pemodelan persamaan struktural (SEM) adalah teknik yang memungkinkan terpisah
hubungan untuk setiap himpunan variabel dependen.
Misalnya, menurut situasi spesifik bisnis perusahaan, model kepuasan pelanggan
dirancang.

11. Explain why and how the various multivariate methods can be viewed as a family of
techniques. (Jelaskan mengapa dan bagaimana berbagai metode multivariat dapat dipandang
sebagai satu kesatuan teknik.)
Jawab:
Karena kami menggunakan metode multivariat untuk memecahkan masalah yang lebih
kompleks dan mengkonversi data ini menjadi pengetahuan. Ini membantu organisasi
meningkatkan pengambilan keputusan dan menghemat waktu dan uang sehingga dapat
dipandang sebagai teknik.

12. Why is knowledge of measurement scales important to an understanding of multivariate data


analysis? (Mengapa pengetahuan tentang skala pengukuran penting untuk memahami
analisis data multivariat?)
Jawab:
Karena pengukuran sangat berperan dalam pemilihan metode analisis multivariat yang
sesuai.

13. What are the differences between statistical and practical significance? Is one a prerequisite
for the other? (Apa perbedaan antara signifikansi statistik dan praktis? Apakah yang satu
merupakan prasyarat untuk yang lain?)
Jawab:
Perbedaan: Signifikansi statistik menunjukkan probabilitas matematis bahwa ada hubungan
antara dua atau lebih variabel, sedangkan signifikansi praktis mengacu pada hubungan antara
variabel dengan aplikasi dunia nyata. Dua atau lebih variabel tidak memerlukan signifikansi
statistik untuk memiliki signifikansi praktis, dan sebaliknya. Signifikansi statistik tidak
menjamin signifikansi praktis, tetapi untuk menjadi signifikan secara praktis, data harus
signifikan secara statistik.

14. What are the implications of low statistical power? How can the power be improved if it is
deemed too low? (Apa implikasi dari kekuatan statistik yang rendah? Bagaimana daya dapat
ditingkatkan jika dianggap terlalu rendah?)
Jawab:
Kekuatan statistik rendah berarti kemungkinan menolak hipotesis nol yang salah rendah.
Kita dapat meningkatkan ukuran efek, Alpha dan ukuran sampel.

15. Detail the model-building approach to multivariate analysis, focusing on the major issues at
each step. (Detail pendekatan pembangunan model untuk analisis multivariat, dengan fokus
pada masalah utama di setiap langkah.)
Jawab:
a. Tentukan masalah penelitian, tujuan, dan teknik multivariat yang akan digunakan.
Peneliti pertama-tama harus melihat masalah dalam istilah konseptual dengan
mendefinisikan konsep dan mengidentifikasi hubungan fundamental yang akan diselidiki.
b. Menyusun rencana analisis.
Masalahnya mencakup pertimbangan umum seperti ukuran sampel minimum atau yang
diinginkan dan jenis variabel yang diperbolehkan atau diperlukan (metrik versus
nonmetrik) dan metode estimasi.
c. Evaluasi asumsi.
Sebelum estimasi model dilakukan, peneliti harus memastikan bahwa asumsi statistik dan
konseptual terpenuhi.
d. Memperkirakan model multivariat dan mengevaluasi kesesuaian.
Peneliti harus menentukan apakah hasil terlalu dipengaruhi oleh satu atau beberapa
pengamatan kecil yang menunjukkan hasil mungkin tidak stabil atau tidak dapat
digeneralisasikan.
e. Menafsirkan variasinya.
Tujuannya adalah untuk mengidentifikasi bukti empiris hubungan multivariat dalam data
sampel yang dapat digeneralisasikan untuk total populasi.
f. Validasi model multivariat.
Upaya untuk memvalidasi model diarahkan untuk menunjukkan generalisasi hasil
terhadap total populasi.

Anda mungkin juga menyukai