Anda di halaman 1dari 3

Gusti Putu Ngurah Arya Pertama

042111233143

Statistik Bisnis II Kelas I

Examining Your Data

Missing data merupakan gangguan bagi peneliti dan terutama disebabkan oleh kesalahan
dalam pengumpulan data atau entri data atau dari kelalaian jawaban oleh responden.
Mengklasifikasikan data yang hilang dan alasan yang mendasari keberadaannya ditangani
melalui serangkaian langkah yang tidak hanya mengidentifikasi dampak dari data yang hilang,
tetapi juga memberikan solusi untuk menghadapinya dalam analisis. Outlier, atau respons
ekstrem, dapat terlalu memengaruhi hasil analisis multivariat. Untuk alasan ini, metode untuk
menilai dampaknya dibahas. Akhirnya, asumsi statistik yang mendasari sebagian besar analisis
multivariat ditinjau. Sebelum menerapkan teknik multivariat, peneliti harus menilai kesesuaian
data sampel dengan asumsi statistik yang mendasari teknik multivariat tersebut.

GRAPHICAL EXAMINATION OF THE DATA


Seperti yang telah dibahas sebelumnya, penggunaan teknik multivariat menempatkan beban
yang meningkat pada peneliti untuk memahami, mengevaluasi, dan menafsirkan hasil yang
kompleks. Kompleksitas ini membutuhkan pemahaman menyeluruh tentang karakteristik dasar
dari data dan hubungan yang mendasarinya.

Univariate Profiling: Examining the Shape of Distribution


Titik awal untuk memahami sifat variabel apa pun adalah mengkarakterisasi bentuk
distribusinya. Histogram adalah representasi grafis dari satu variabel yang mewakili frekuensi
kemunculan (nilai data) dalam kategori data. Frekuensi diplot untuk memeriksa bentuk
distribusi nilai. Histogram dapat digunakan untuk memeriksa semua jenis variabel metrik.

Bivariate Profiling: Examining the Relationship Between Variables


Meneliti distribusi suatu variabel sangat penting, sering kali peneliti juga tertarik untuk
memeriksa hubungan antara dua atau lebih variabel. Metode yang paling populer untuk
memeriksa hubungan bivariat adalah scatterplot, grafik titik data berdasarkan dua variabel
metrik. Satu variabel mendefinisikan sumbu horizontal dan variabel lainnya mendefinisikan
sumbu vertikal. Variabel dapat berupa nilai metrik apa pun. Titik-titik dalam grafik mewakili
nilai gabungan yang sesuai dari variabel untuk setiap kasus tertentu. Pola titik mewakili
hubungan antara variabel. Organisasi titik yang kuat di sepanjang garis lurus mencirikan
hubungan linier atau korelasi. Serangkaian titik melengkung dapat menunjukkan hubungan
nonlinier, yang dapat diakomodasi dalam banyak cara (lihat diskusi selanjutnya tentang
linearitas). Atau pola poin yang tampaknya acak mungkin menunjukkan tidak ada hubungan.
Dari sekian banyak jenis scatterplot, satu format yang sangat cocok untuk teknik multivariat
adalah matriks scatterplot, di mana scatterplot diwakili untuk semua kombinasi variabel di
bagian bawah matriks. Diagonal berisi histogram variabel.

Bivariate Profiling: Examining Group Differences


Peneliti juga dihadapkan pada pemahaman luas dan karakter perbedaan satu atau lebih variabel
metrik pada dua atau lebih kelompok yang terbentuk dari kategori variabel nonmetrik.
Penilaian perbedaan kelompok dilakukan melalui analisis univariat seperti uji-t dan analisis
varians dan teknik multivariat analisis diskriminan dan analisis varians multivariat. Aspek
penting lainnya adalah mengidentifikasi outlier (dijelaskan secara lebih rinci di bagian
selanjutnya) yang mungkin menjadi jelas hanya ketika nilai data dipisahkan menjadi beberapa
kelompok. Metode grafis yang digunakan untuk tugas ini adalah boxplot, representasi
bergambar dari distribusi data variabel metrik untuk setiap kelompok (kategori) dari variabel
nonmetrik.

Multivariate Profiles
Sampai saat ini metode grafis telah dibatasi pada penggambaran univariat atau bivariat.
Namun, dalam banyak kasus, peneliti mungkin ingin membandingkan pengamatan yang
dicirikan pada profil multivariat, apakah itu untuk tujuan deskriptif atau sebagai pelengkap
prosedur analitis. Untuk mengatasi kebutuhan ini, sejumlah tampilan grafis multivariat
berpusat di sekitar salah satu dari tiga jenis grafik.

MISSING DATA
Data yang hilang, di mana nilai yang valid pada satu atau lebih variabel tidak tersedia untuk
analisis, adalah fakta kehidupan dalam analisis multivariat. Bahkan, jarang peneliti
menghindari beberapa bentuk masalah data yang hilang. Tantangan peneliti adalah untuk
mengatasi masalah yang diangkat oleh data yang hilang yang mempengaruhi generalisasi hasil

The Impact of Missing Data


Efek dari beberapa proses data yang hilang diketahui dan diakomodasi langsung dalam rencana
penelitian seperti yang akan dibahas nanti di bagian ini. Lebih sering, proses data yang hilang,
terutama yang didasarkan pada tindakan oleh responden (misalnya, tidak menanggapi
pertanyaan atau serangkaian pertanyaan), jarang diketahui sebelumnya.

A Simple Example of a Missing Data Analysis

Dari sudut pandang praktis, data yang hilang dalam contoh ini dapat menjadi sangat bermasalah
dalam hal mengurangi ukuran sampel. Misalnya, jika analisis multivariat dilakukan yang
membutuhkan data lengkap pada kelima variabel, sampel akan dikurangi menjadi hanya lima
kasus tanpa data yang hilang (kasus 1, 7, 8, 12, dan 20). Ukuran sampel ini terlalu sedikit untuk
semua jenis analisis.
A Four-Step Process for Identifying Missing Data and Applying Remedies
Step 1: Determine the Type of Missing Data
Langkah pertama dalam setiap pemeriksaan data yang hilang adalah menentukan jenis data
yang hilang yang terlibat.

Step 2: Determine the Extent of Missing Data


Mengingat bahwa beberapa data yang hilang tidak dapat diabaikan, peneliti selanjutnya harus
memeriksa pola data yang hilang dan menentukan sejauh mana data yang hilang untuk variabel
individu, kasus individu, dan bahkan secara keseluruhan.

Step 3: Diagnose the Randomness of the Missing Data Processes


Setelah menentukan bahwa tingkat data yang hilang cukup substansial untuk menjamin
tindakan, langkah selanjutnya adalah memastikan tingkat keacakan yang ada dalam data yang
hilang, yang kemudian menentukan solusi yang tepat yang tersedia.

Step 4: Select the Imputation Method


Pada langkah proses ini, peneliti harus memilih pendekatan yang digunakan untuk
mengakomodasi data yang hilang dalam analisis.

OUTLIERS
Outlier adalah pengamatan dengan kombinasi karakteristik unik yang dapat diidentifikasi
sebagai sangat berbeda dari pengamatan lainnya. Dalam menilai dampak outlier, kita harus
mempertimbangkan pertimbangan praktis dan substantif

Detecting and Handling Outliers

Methods Of Detecting Outlers


Univariate Detection
Identifikasi outlier univariat memeriksa distribusi pengamatan untuk setiap variabel dalam
analisis dan memilih sebagai outlier kasus-kasus yang jatuh pada rentang luar (tinggi atau
rendah) dari distribusi data.

Bivariate Detection
Selain penilaian univariat, pasangan variabel dapat dinilai bersama melalui scatterplot.

Multivariate Detection
Karena sebagian besar analisis multivariat melibatkan lebih dari dua variabel, metode bivariat
dengan cepat menjadi tidak memadai karena beberapa alasan.

Anda mungkin juga menyukai