Anda di halaman 1dari 18

Examining Your Data

Diah Wahyuni
Siska Aprilia Oktaviani
01 Introduction

Preview 02 Graphical Examination of The Data

03 Missing Data

04 Outliers

Testing The Assumptions of


05 Multivariate Analysis

Incorporating Nonmetric Data with


06 Dummy Variables
Introduction

A B C
Menguji data merupakan Dengan menguji data Peneliti perlu melihat teknik
kegiatan yang terlihat sebelum mengaplikasikannya ini sebagai investasi atas
sederhana dan remeh, pada teknik multivariat, pertanggungan multivariat
namun kegiatan tersebut peneliti bisa memperoleh yang memastikan hasil yang
merupakan bagian yang masukan kritis mengenai diperoleh dari analisis
penting dari analisis karakteristik data yang multivariat adalah valid dan
multivariat. digunakan akurat
Graphical Examination of the Data
Univariate Profiling: Examining the Shape of the Distribution
Titik awal untuk memahami sifat variabel adalah dengan mengkarakteristik
bentuk dari distribusinya. Peneliti biasanya menggunakan histogram yang
merupakan representasi grafis dari variabel tunggal yang melambangkan
frekukensi terjadinya (nilai data) dakam kategori data.
Bivariate Profiling: Examining the Relationship Between
Variables
Metode popular untuk menguji hubungan bivariat adalah scatterplot, grafik
dari titik data berdasarkan dua matriks variabel. Satu variabel menjelaskan
aksis horizontal dan yang lainnya menjelaskan aksis vertikal. Variabel-
variabel tersebut bisa memiliki berbagai nilai matriks.

Bivariate Profiling: Examining Group Differences


Peneliti juga dihadapkan pada memahami jangkauan dan karakter dari
perbedaan satu atau lebih matriks variabel dari dua atu lebih grup yang
dibentuk dari kategori variabel non metrik. Metode grafis yang digunakan
untuk ini adalah boxplot, gambaran representasi distribusi data dari variabel
metrik setiap grup dari variabel non metrik
Multivariate Profiles
Peneliti bisa menggunakan salah satu dari ketiga metode ketika menguji data
multivariat untuk menyediakan format yang beberapakali lebih berguna
dibandingkan hanya review dari nilai data sesungguhnya.
Missing The Impact of Missing Data

Data
Meskipun mungkin tidak masalah untuk melanjutkan
hanya dengan nilai-nilai yang valid, namun
pertimbangan substantif dan praktis memerlukan
pemeriksaan proses data yang hilang

- Missing Data di mana nilai valid dari satu atau lebih variabel Practical Impact
tidak tersedia untuk analisis merupakan fakta kehidupan analisis Merupakan pengurangan dari ukuran sampel
multivariat. yang tersedia untuk analisis

- Tantangan Peneliti adalah untuk menangani masalah yang


ditimbulkan oleh missing data yang mempengaruhi generalisasi
hasil.
Substantive Perspective
- Kekhawatiran Utama Peneliti adalah untuk mengidentifikasi Setiap hasil statistik dari data yang memiliki
missing data proses tidak acak akan menjadi
pola dan hubungan dari missing data untuk menjaga bias. Bias terjadi ketika data proses
keoriginalitasan distribusi nilai sedekat mungkin ketika tindakan menyebabkan suatu data hilang, dan missing
perbaikan diaplikasikan. data ini menjurus pada hasil yang eror.

- Fokus pada alasan dari missing data muncul dari fakta bahwa
peneliti harus mengerti proses yang menjurus pada terjadinya Meskipun mungkin tidak masalah untuk melanjutkan
missing data supaya bisa memilih tindakan yang tepat hanya dengan nilai-nilai yang valid, namun
pertimbangan substantif dan praktis memerlukan
pemeriksaan proses data yang hilang
A Simple Example of a
Missing Data Analysis
From a Practical Standpoint

Missing data dalam contoh tersebut dapat menjadi cukup


bermasalah dalam hal mengurangi ukuran sampel data. Jika
analisis multivariat dijalankan dengan syarat semua variabel
memiliki data lengkap, maka sampel akan berkurang menjadi
hanya lima kasus yang tidak memiliki missing data.

The Substantive Impact

Dapat terlihat pada lima kasus yang missing data, semuanya


terjadi pada V4. Dengan membandingkan nilai V2 untuk 5 kasus
dengan missing data untuk V4 melawan kasus yang memiliki nilai
valid V4, maka akan muncul pola yang jelas. Kelima kasus
dengan missing nilai dari V4 memiliki 5 nilai terendah atau V2,
menunjukkan bahwa Missing data untuk V4 berasosiasi sangat
kuat dengan nilai rendah pada V2.
Place Your Picture Here Send To Back
 Step 1: Determine the Type of  Step 3: Diagnose the Randomness
Missing Data of The Missing Data Process
Pada tahap ini peneliti mengkhawatirkan apakah Tahapan selanjutnya adalah untuk mengukur derajat
missing data merupakan bagian dari desain acak dalam missing data yang kemudian
penelitian dan di bawah kontrol peneliti atau apakah menentukan perbaikan yang tepat untuk digunakan.
penyebabnya benar-benar tidak diketahui. Berikut - Levels of randomness of the missing data process
merupakan missing data yang merupakan bagian - Diagnostic tests for level of randomness
dari desain penelitian dan bisa ditangani langsung
oleh peneliti.
- Ignorable missing data  Step 4: Select the Imputation
- Missing data process that are not ignorable Method
Pada tahapan ini peneliti harus memilih pendekatan
 Step 2: Determine the Extend yang digunakan untuk mengakomodasi missing data
of Missing Data dalam analisis. Keputusan ini berdasarkan apakah
Masalah utama pada tahap ini adalah menentukan missing data merupakan MAR atau MCAR
apakah jumlah missing data cukup rendah untuk - Imputation of a MAR missing data process
tidak mempengaruhi hasil. - Imputation of a MCAR missing data process
- Assessing the extend and patterns of missing data - Imputation by using replacement values
- Deleting individual cases and/or variables

A Four-Step For Identifying


Missing Data and
Process Applying Remedies
A Recap of The Missing
Value Analysis

01 The missing data process is MCAR

Imputation is the most logical


02 course of action

Imputed correlations differ across


03 techniques
Multiple methods for replacing the
04 missing data are available and
appropriate.
OUTLIERS
Pengamatan dengan kombinasi unik dari karakteristik yang dapat diidentifikasi
berbeda dari pengamatan lainnya

Mengapa terjadi? Dihapus atau Metode Deteksi Desain


tidak?
1. kesalahan dipertahankan 1. Deteksi Univariat Dengan metode
prosedural kecuali bukti yang diagnostik univariat,
2. Deteksi Bivariat bivariat, dan
dapat dibuktikan
2. hasil dari multivariat.
menunjukkan
peristiwa luar bahwa mereka 3. Deteksi
biasa benar-benar Multivariat
menyimpang dan
3. pengamatan luar tidak mewakili Cara
biasa yang tidak pengamatan apa Menangani?
dijelaskan oleh pun dalam populasi.
peneliti
Menguji Asumsi Analisis
Menilai Variabel Individu versus Variasi
Multivariat
Kebutuhan untuk menguji asumsi statistik meningkat dalam Analisis multivariat mensyaratkan bahwa
aplikasi multivariat karena dua karakteristik analisis multivariat. asumsi yang mendasari teknik statistik diuji dua
Pertama, kompleksitas hubungan kali: pertama untuk variabel yang terpisah,
Kedua, kompleksitas analisis dan hasil dapat menutupi indikator mirip dengan tes untuk analisis univariat, dan
pelanggaran asumsi yang terlihat dalam analisis univariat yang
kedua untuk varian model multivariat, yang
lebih sederhana.
Dengan demikian, peneliti harus mengetahui adanya pelanggaran
bertindak secara kolektif untuk variabel dalam
asumsi dan implikasinya terhadap proses estimasi atau analisis dan harus memenuhi asumsi yang
interpretasi hasil. sama dengan variabel individual.
Your Picture Here
Empat Asumsi Statistik Penting

NORMALITAS HOMOSKEDASTISIDAS LINEARITAS ABSENSI KESALAHAN


TERKAIT
Asumsi paling mendasar Homoscedasticity diinginkan Asumsi implisit dari semua
Jika variasi dari distribusi karena varians dari variabel teknik multivariat yang jarang
normal cukup besar, semua dependen yang dijelaskan didasarkan pada ukuran Namun berupaya
tes statistik yang dihasilkan dalam hubungan hubungan korelasional, memastikan bahwa setiap
tidak valid, karena dependensi tidak boleh termasuk regresi berganda, kesalahan prediksi tidak
normalitas diperlukan untuk terkonsentrasi hanya dalam regresi logistik, analisis berkorelasi satu sama lain.
menggunakan statistik F kisaran terbatas dari nilai- faktor, dan pemodelan
dan t. nilai independen. persamaan struktural
jika suatu variabel adalah
multivariat normal, itu juga
univariat normal. Namun,
kebalikannya
Your Picture Here And Send To Back

Menilai Dampak Melanggar


Asumsi Normalitas
NORMALITAS

Dampak karena Dampak karena


Bentuk Distribusi Ukuran Sampel
Bentuk distribusi apa pun
ukuran sampel yang lebih
dapat dijelaskan dengan
besar mengurangi efek
dua ukuran: kurtosis dan
merugikan dari
skewness.
ketidaknormalan.
Kurtosis mengacu pada
jika ukuran sampel kurang
"puncaknya" atau "kerataan"
dari 30 atau lebih,
kurtosis mengacu pada
penyimpangan yang
ketinggian distribusi,
signifikan dari normalitas
skewness digunakan untuk
dapat memiliki dampak
menggambarkan
besar pada hasil.
keseimbangan distribusi
untuk ukuran sampel 200
kemiringan dan kurtosis dari
atau lebih
distribusi normal diberi nilai
dapat diabaikan
nol. Kemudian, nilai di atas
atau di bawah nol
menunjukkan penyimpangan
dari normalitas.
HOMOSKEDASTISITAS

Distribusi miring dari satu atau kedua variabel. Pada


Gambar 7a, plot sebaran poin data untuk dua variabel (V1
dan V2) dengan distribusi normal menunjukkan dispersi
yang sama di semua nilai data (mis., Homoscedasticity).
Namun, pada Gambar 7b kita melihat dispersi yang tidak
sama (heteroskedastisitas) yang disebabkan oleh
kemiringan salah satu variabel (V3). Untuk nilai V3 yang
berbeda, ada pola dispersi yang berbeda untuk V1.

SOLUSI?
LINEARITAS

Dampak karena
Ukuran Sampel
Mengidentifikasi Hubungan
Nonlinier
Cara yang paling umum untuk menilai linieritas adalah dengan
memeriksa scatterplots variabel dan untuk mengidentifikasi
pola nonlinier dalam data.

Pendekatan alternatif adalah dengan menjalankan analisis


regresi sederhana dan untuk memeriksa residu.

SOLUSI?
ABSENSI
KESALAHAN
TERKAIT
Dampak karena
Ukuran Sampel
Mengidentifikasi Kesalahan
yang Berhubungan

Salah satu pelanggaran paling umum adalah karena proses


pengumpulan data.
Jika kelompok dianalisis secara terpisah, efeknya konstan dalam
setiap kelompok dan tidak memengaruhi estimasi hubungan.
Tetapi jika pengamatan dari kedua kelompok digabungkan, maka
hubungan akhir yang diperkirakan harus menjadi kompromi
antara dua hubungan yang sebenarnya.
Untuk mengidentifikasi kesalahan yang berkorelasi, peneliti
pertama-tama harus mengidentifikasi kemungkinan
penyebabnya. Nilai untuk variabel harus diperiksa untuk setiap
pola. SOLUSI?
Transformasi
Data

Transformasi data menyediakan sarana untuk


memodifikasi variabel karena salah satu dari dua
alasan: (1) untuk memperbaiki pelanggaran asumsi
statistik yang mendasari teknik multivariat atau (2)
untuk meningkatkan hubungan (korelasi) antara
variabel. Serangkaian tes grafis dan statistik yang
diarahkan untuk menilai asumsi yang mendasari
teknik multivariat mengungkapkan relatif sedikit
dalam hal pelanggaran asumsi. Di mana
pelanggaran ditunjukkan, mereka relatif kecil dan
tidak boleh menimbulkan masalah serius selama
analisis data. Peneliti didorong untuk selalu
melakukan pemeriksaan data yang sederhana
namun mengungkap ini untuk memastikan bahwa
potensi masalah dapat diidentifikasi dan
diselesaikan sebelum analisis dimulai.

Portfolio Presentation
Menggabungkan Data Nonmetrik dengan Variabel Dummy

Content You can simply impress your audience and add a unique zing and appeal to your
Reports and Presentations with our Templates. You can simply impress your audience
and add a unique zing and appeal to your Reports and Presentations with our
60%
60% Templates. Easy to change colors, photos and Text.

Content You can simply impress your audience and add a unique zing and appeal to your
Reports and Presentations with our Templates. You can simply impress your audience
and add a unique zing and appeal to your Reports and Presentations with our 80%
80% Templates. Easy to change colors, photos and Text.
THANK YOU

Anda mungkin juga menyukai