Anda di halaman 1dari 4

Hafid Gisen Parastra (22081019)

Statistik Multivariat

1. Explain how graphical methods can complement the empirical measures when
examining data.
Jawab:
Metode penggunaan metode grafis seperti grafik, bagan, diagram, dll dipandang:
a. Lebih menarik bagi pembacanya,
b. Menghemat banyak waktu dalam memahami data,
c. Membantu dalam menyajikan fakta kuantitatif dalam bentuk gambar yang
sederhana, jelas, dan efektif.
d. Selain itu metode penggunaan grafik dapat digunakan untuk menemukan ukuran
statistik seperti median, Kuartil, dll
e. Dan dapat digunakan untuk tujuan perbandingan.

2. List potential underlying causes of outliers. Be sure to include attributions to both


the respondent and the researcher.
Jawab:
a. Outlier dari kesalahan prosedural seperti kesalahan dalam memasukkan data.
Outlier harus diidentifikasi di tahap pembersihan data.
b. Outlier dari observasi yang terjadi peristiwa luar biasa, yang menjelaskan
keunikan dari observasi itu. Seorang peneliti memutuskan apakah kejadian
tersebut sesuai dengan tujuan analisis atau tidak. Jika sesuai maka data tersebut
harus dimasukkan dalam analisis.
c. Outlier dari hasil observasi yang penjelasannya tidak diketahui oleh peneliti
sehingga data ini paling mungkin untuk dihilangkan. Namun, data ini tetap dapat
dipertahankan jika menurut peneliti data outlier tersebut mewakili populasi.
d. Outlier yang nilainya termasuk dalam kisaran nilai biasa yang mana nilanya tidak
terlalu tinggi atau terlalu rendah. Maka, data ini harus dipertahankan kecuali
peneliti memiliki bukti apabila data tersebut tidak mewakili populasi.
3. Discuss why outliers might be classified as beneficial and as problematic.
Jawab:
Outliers seharusnya bukan dikategorikan bermanfaat atau bermasalah tapi
sebaiknya peneliti dapat menilai/mengidentifikasi apakah data tersebut masih
mewakili populasi dan sesuai dengan tujuan penelitian atau tidak serta perlu
dianalisis/dievaluasi sesuai dengan informasi yang dibutuhkan.
Apabila bermanfaat, outlier meskipun berbeda dari sebagian besar sampel mungkin
merupakan indikasi karakteristik populasi yang tidak akan ditemukan dalam analisis
normal.
Namun, jika outlier bermasalah tidak mewakili populasi, ini mengalahkan tujuan
analisis dan dapat sangat membiaskan statistik uji. Oleh karena itu, mereka tetap
berada di luar ruang lingkup analisis yang dilakukan.
Sementara mereka dapat memberikan umpan balik tentang perubahan yang
diperlukan dalam analisis, mereka juga menawarkan kesempatan kepada peneliti
untuk menargetkan analisis dan hasil ke populasi yang dituju, daripada hasil yang
mempengaruhi mereka yang seharusnya tidak disertakan. 

4. Distinguish between data that are missing at random (MAR) and missing completely
at random (MCAR).
Jawab:
a. Missing at Random (MAR), yaitu terjadi hilangnya data yang berkaitan dengan
pengamatan sehingga, missing value dapat diprediksi dengan memanfaatkan
atribut lain yang saling berhubungan. Di dalam MAR, jika nilai yang hilang dari Y
bergantung pada X, tapi tidak Y. Dengan kata lain, yang diamati nilai Y mewakili
sampel acak dari yang sebenarnya nilai Y untuk setiap nilai X, tetapi data yang
diamati untuk Y tidak selalu mewakili semua sampel yang benar-benar acak nilai-
nilai Y.
b. Missing Completely at Random (MCAR), yaitu sebuah hilangnya data secara acak.
Data yang hilang pada suatu atribut tidak tergantung pada data pengamatan.
Dengan kata lain Missing Completely Random (MCAR), artinya terjadinya data
yang hilang tidak berhubungan dengan nilai semua variabel, baik itu variabel yang
hilang nilainya maupun variabel observasi. Artinya data yang hilang terjadi secara
acak. Dalam hal ini, nilai Y yang diamati adalah sampel acak sebenarnya dari
semua nilai Y tanpa hubungan mendasar dengan variabel lain yang diamati dan
dikatakan secara murni hilang.

5. Describe the conditions under which a researcher would delete a case with missing
data versus the conditions under which a researcher would use an imputation
method.
Jawab:
a. Jika data yang hilang di bawah 10%, salah satu metode imputasi dapat
diterapkan meskipun metode kasus sudah lengkap dan telah terbukti paling
tidak disukai.
b. Jika data yang hilang sebesar 10% s.d. 20%, maka menggunakan metode
substitusi dan imputasi hot deck
c. Jika data yang hilang lebih dari 20% maka menggunakan metode:
 Metode regresi untuk situasi MCAR.
 Metode berbasis model ketika MAR kehilangan data terjadi.

6. Evaluate the following statement: In order to run most multivariate analyses, it is not
necessary to meet all the assumptions of normality, linearity, homoscedasticity, and
independence.
Jawab:
Karena bagi seorang peneliti dalam melakukan analisis multivariat perlu untuk dapat
memenuhi asumsi normalitas, linearitas, homoskedastisitas, dan independensi
adalah tugas yang mustahil untuk diwujudkan bahkan pada saat menganalisis sampel
kecil. Yang lebih penting bagi peneliti adalah dapat memahami implikasi dari setiap
asumsi yang berkaitan dengan teknik yang menarik, mencapai keseimbangan antara
kebutuhan untuk memenuhi asumsi disandingkan dengan kekokohan teknik dan
konteks penelitian.

7. Discuss the following statement: Multivariate analyses can be run on any data set, as
long as the sample size is adequate.
Jawab:
Analisis multivariat berarti semua metode statistik yang menganalisis beberapa nilai
pengukuran (variabel) yang tersedia untuk setiap orang uji dalam satu atau lebih
sampel acak dalam waktu yang sama.
Berdasarkan hal ini, dapat ditarik kesimpulan bahwa setiap teknik analisis yang
melibatkan lebih dari dua variabel secara bersamaan dapat dianggap sebagai analisis
multivariat. Adapun analisis multivariat dapat digunakan pada kumpulan data apa
pun selama ukuran sampel cukup sesuai dengan perkiraan ukuran sampel dan
interval yang dihitung. 

Anda mungkin juga menyukai