Anda di halaman 1dari 11

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/336311791

Panduan Pemilihan Analisis Data

Preprint · October 2017


DOI: 10.13140/RG.2.2.16930.99522

CITATIONS READS

0 9,124

1 author:

Ezra Putranda Setiawan


Universitas Negeri Yogyakarta
32 PUBLICATIONS   23 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

LEARNER MOTIVATION IN ESL LEARNING STRATEGIES AND GENDER ROLE View project

Financial Mathematics View project

All content following this page was uploaded by Ezra Putranda Setiawan on 07 October 2019.

The user has requested enhancement of the downloaded file.


EZRA PUTRANDA SETIAWAN, S.Si.
Makalah disampaikan pada Training Olah Data, Himpunan Mahasiswa Statistika (HIMASTA)
Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Gadjah Mada, Yogyakarta

“Statistika: tongkat pembimbing ke daerah ketidaktahuan.”


(Prof. Andi Hakim Nasution, 1932 - 2002)

Analisis data merupakan salah satu tahap terpenting dalam proses penelitian. Pada tahap ini,
data yang telah terkumpul akan diolah dan dianalisis sedemikian rupa sehingga dapat membantu
peneliti menjawab pertanyaan penelitian. Di sisi lain, ilmu statistika menyediakan metode analisis
data yang sangat banyak macamnya. Oleh karena itu, pemilihan teknik analisis data menjadi hal
penting untuk menjamin bahwa analisis data yang kita lakukan adalah tepat. Penggunaan teknik
analisis data yang tidak tepat dapat mengakibatkan pengambilan keputusan yang salah maupun
tertundanya proses penelitian.
Pembahasan dalam makalah ini dibatasi pada teknik analisis data kuantitatif. Secara umum,
analisis data kuantitatif dapat dibedakan menjadi dua kelompok berikut.
 Analisis deskriptif, umumnya digunakan untuk memberikan gambaran awal mengenai data
yang tersedia. Analisis ini dapat dilakukan dengan bantuan tabel-tabel maupun grafik seder-
hana, misalnya menggambarkan persebaran usia dan tingkat pendidikan responden dalam
suatu survei.
 Analisis inferensi, yakni pengambilan kesimpulan terhadap populasi berdasarkan informasi
dari statistik sampel. Inferensi dapat berupa pembentukan selang kepercayaan (interval konfi-
densi) maupun pengujian hipotesis. Sebagian besar analisis data yang dibahas pada makalah
ini merupakan teknik inferensi statistika.

Hampir semua teknik analisis data yang disebutkan dalam tulisan ini dapat dilakukan dengan bantu-
an perangkat lunak pengolahan data, misalnya SPSS, Minitab, R, SAS, LISREL, Eviews, dan lain
sebagainya. Karena keterbatasan tempat, teknik pengolahan data dengan perangkat-perangkat terse-
but tidak dibahas dalam tulisan ini.

A. PENDAHULUAN

Pemilihan teknik analisis data bergantung pada dua hal utama, yakni tujuan penelitian dan
sifat data yang tersedia. Tujuan penelitian berkaitan erat dengan masalah yang hendak diteliti
apakah membandingkan, mengkategorikan/mengelompokkan, menguji adanya hubungan, dan lain
sebagainya. Sifat data berkaitan erat dengan skala yang digunakan, sifat dari distribusi atau sebaran
data, cara pengambilan data, maupun keberadaan data pencilan (ekstrim). Berdasarkan hal-hal itulah
teknik analisis data dapat dipilih dan dilaksanakan, sehingga diperoleh kesimpulan yang valid.

Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 1
Mengenal Tujuan Pengolahan Data
Terdapat berbagai tujuan penelitian, misalnya menemukan produk baru, menguji kualitas
produksi suatu produk, mengembangkan teori baru, melakukan prediksi, membuat profil konsumen
suatu produk, menguji efektivitas suatu terapi, membandingkan kemampuan sejumlah responden,
dan lain sebagainya. Di sisi lain, ditinjau dari teknik pengolahan data yang digunakan, tujuan-tujuan
penelitian di atas dapat dibedakan menjadi beberapa hal berikut.
1. Tujuan membandingkan. Peneliti dapat membandingkan mutu beberapa macam produk,
kondisi sebelum dan sesudah suatu perlakuan tertentu, kondisi saat ini dengan kondisi masa
lalu (saat riset sebelumnya dilakukan), dan lain sebagainya. Dari perbandingan ini dapat
dihasilkan pula informasi mengenai hubungan satu variabel dengan variabel-variabel lain
secara lebih jelas.
2. Tujuan menguji hubungan. Peneliti dapat mencari ada tidaknya hubungan antara dua variabel
atau lebih. Sebagai catatan, adanya hubungan antara variabel A dan B tidak selalu berarti
bahwa variabel A menjadi penyebab variabel B, atau sebaliknya. Pada umumnya pengujian
hubungan juga dapat dijelaskan dengan membuat pembandingan (lihat poin 1 di atas).
3. Tujuan membentuk model prediksi. Pembentukan model prediksi suatu variabel dapat dilaku-
kan menggunakan data variabel-variabel lain maupun variabel itu sendiri pada masa lalu.
Sebagai contoh prediksi inflasi dapat dilakukan menggunakan data inflasi-inflasi sebelumnya
maupun data harga-harga bahan pokok. Dapat pula dibentuk model yang lebih kompleks,
berhubungan dengan beberapa variabel sekaligus.
4. Tujuan melakukan klasifikasi. Peneliti kadangkala perlu melakukan klasifikasi baik untuk
variabel maupun untuk subjek penelitian. Sebagai contoh, seorang guru dapat mengklasifika-
sikan mata pelajaran apa saja yang masih sulit dikuasai oleh para peserta didik (klasifikasi
terhadap variabel) maupun klasifikasi nama-nama siswa berdasarkan kemampuannya dalam
memahami pelajaran (klasifikasi terhadap subjek).

Memahami Proses Pengumpulan Data


Pengumpulan data penelitian dapat dilakukan melalui berbagai cara, misalnya observasi,
wawancara, tes, pemberian kuesioner/angket, eksperimen, dan sebagainya. Berkaitan dengan proses
pengumpulan data, beberapa hal berikut perlu menjadi perhatian.
1. Desain eksperimen/survey. Apabila suatu penelitian dilakukan menggunakan metode survey/
eksperimen, desain eksperimen harus diketahui secara pasti sebelum analisis data dilakukan.
Sebagai contoh walaupun susunan datanya sama, statistik uji untuk desain tersarang (nested
design), desain faktorial (factorial design), dan desain petak terbagi (split plot) harus dihitung
dengan cara yang berbeda.
2. Banyaknya pengamatan/observasi terhadap masing-masing subjek. Dalam beberapa peneliti-
an, umumnya beberapa variabel diamati sekaligus pada subjek yang sama; tidak jarang pula
ada variabel yang diamati lebih dari satu kali (misalnya tinggi suatu tanaman diamati setiap
hari selama dua minggu, dan sebagainya). Oleh karena itu muncul istilah data cross sectional
(diambil satu kali dari masing-masing subjek), data time series (diambil berkali-kali dari satu
atau beberapa subjek), dan data longitudinal (beberapa variabel yang diamati pada beberapa
subjek sebanyak lebih dari satu kali). Terdapat perbedaan teknik analisis untuk masing-
masing tipe data tersebut.

Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 2
3. Ada tidaknya data hilang (missing data). Adanya data yang hilang, misalnya karena keti-
daklengkakpan pengisian kuesioner atau mortalitas eksperimental, akan mempengaruhi hasil
analisis data. Peneliti harus memastikan langkah yang akan diambil terhadap subjek dengan
data tak lengkap.

Mengenal Skala Data


Berdasarkan sifat-sifatnya, data kuantitatif dapat dibedakan menjadi empat macam skala
data, yakni sebagai berikut.
1. Skala nominal. Angka sebagai alat identifikasi kategori saja. Contoh: 0 = tidak terkena kanker,
1 = terkena kanker; 0 = belum menikah, 1 = memiliki suami/istri, 2 = janda/duda.
2. Skala ordinal. Angka sebagai penunjuk urutan atau tingkatan; tidak memperhatikan jarak
atau selisih antara tingkatan-tingkatan. Contoh: urutan dalam menyelesaikan tugas.
3. Skala interval. Skala ordinal dengan selisih yang selalu sama, tidak memiliki nol mutlak dan
tidak berlaku kelipatan. Contoh: skor tes IQ.
4. Skala rasio. Skala interval dengan nilai nol mutlak; berlaku kelipatan. Contoh: penghasilan,
massa, lama pengerjaan, dan sebagainya.
Dalam riset, tidak jarang suatu data mengalami perubahan dari satu bentuk skala ke bentuk skala
yang lain. Perhatikan contoh berikut:
0 = berat badan rendah (underweight)
1 = berat badan normal
berat badan pasien (kg)
 2 = berat badan berlebih (overweight)
3 = kegemukan (obesitas)
skala rasio skala ordinal

Mengenal Sebaran Data


Berbagai analisis inferensi statistika untuk data
berskala interval/rasio (misal analisis variansi /ANOVA)
mensyaratkan data mengikuti sebaran normal.
Sebaran normal umumnya dilukiskan berupa
kurva simetris yang menyerupai lonceng. Persamaan
matematis untuk kurva sebaran normal ditemukan oleh
Carl Friederich Gauss (1777-1855), yakni
 x   2
1 
f  x  e 2 2
,  x 
 2
dengan μ (baca: miu) dan σ (baca: sigma) merupakan parameter distribusi normal, berturut-turut
disebut rata-rata dan simpangan baku (standar deviasi). Nilai kedua parameter inilah yang akan
menentukan bentuk kurva sebaran normal. Bila digunakan transformasi Z = (x - μ)/σ, akan diperoleh
sebaran normal dengan μ = 0 dan σ = 1, yang disebut sebaran normal standard.
Apabila analisis data yang hendak dilakukan memerlukan asumsi data berdistribusi normal,
diperlukan pemeriksaan kesesuaian distribusi untuk memastikan bahwa data yang ada memiliki
distribusi normal. Beberapa cara pemeriksaan distribusi normal:
1. Uji hipotesis distribusi normal, dengan H0 menyatakan bahwa data berasal dari populasi
berdistribusi normal. Statistik untuk pengujian ini dapat dihitung dengan cara Anderson-
Darling, Shapiro-Wilk, Kolmogorov-Smirnov, Jarque-Bera, Lilliefors, dan sebagainya.

Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 3
2. Pembuatan diagram kuantil distribusi normal teoritis terhadap kuantil distribusi empiris data,
dikenal sebagai QQ-plot. Bila data berdistribusi normal, titik-titik pada QQ-plot menunjukkan
garis lurus.

Contoh data
berdistribusi normal

Contoh data
tidak berdistribusi normal

Bila analisis yang hendak dilakukan memerlukan asumsi distribusi normal namun asumsi ini tidak
dapat dipenuhi, terdapat beberapa cara yang dapat dilakukan:
1. Hapus atau buang data yang berupa pencilan (bila ada). Tentu saja metode ini hanya dapat
dilakukan bila jumlah data yang dimiliki cukup besar, serta keberadaan pencilan dalam data
dapat diabaikan.
2. Lakukan transformasi yang sesuai, misal ubah data x menjadi y = x2, y = 1/x. Metode ini harus
dilakukan dengan hati-hati, terlebih bila analisis bertujuan untuk membentuk suatu model
prediksi.
3. Gunakan teknik analisis statistika nonparametrik, yang tidak memerlukan syarat distribusi
normal. Sebagai contoh, untuk menggantikan analisis variansi (anava) satu arah, dapat digu-
nakan uji Kruskall-Wallis.

B. ANALISIS DATA UNTUK PEMBANDINGAN (KOMPARASI)

Analisis data untuk pembandingan (komparasi) umumnya dilakukan untuk menemukan ada
tidaknya perbedaan yang signifikan antar kelompok (antar populasi) atau antar pengukuran pada
kelompok yang sama. Terdapat tiga ukuran yang umum dibandingkan, yakni
1. Proporsi (p). Misalkan dari n sampel yang tersedia, terdapat sejumlah x sampel yang memiliki
sifat A. Proporsi sampel dengan sifat A didefinisikan sebagai p = x/n.
2. Ukuran pemusatan data. Ukuran pemusatan atau ukuran kecenderungan sentral yang lazim
digunakan adalah rata-rata dan median. Modus cenderung kurang populer, mengingat nilai-
nya tidak selalu tunggal (ada data yang memiliki lebih dari satu modus).
3. Ukuran penyebaran atau variabilitas, yang paling sering dipakai adalah ragam (variance) dan
simpangan baku (standard deviation).
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 4
Pembandingan satu variabel, satu kali pengukuran
Banyak kelompok dan
Skala data Syarat lain Analisis
ukuran
Satu kelompok
Proporsi
Nominal, Ordinal - Uji Z untuk proporsi
H0: p = p0
Nilai pusat (rata-rata) sebaran normal Uji t
Interval, Rasio
H0: μ = μ0 Jumlah sampel besar Uji Z
Dua kelompok
Proporsi Nominal - Uji Z untuk proporsi
H0: p1 - p2 = 0 (p1 = p2) atau Uji Chi-Kuadrat
Nilai pusat (median) - Uji Mann-Whitney
Ordinal
H0: E(x1) = E(x2) Uji Wilcoxon
Nilai pusat (rata-rata) sebaran normal Uji t dua pop indep.
Interval, Rasio
H0: μ1 - μ2 = μ0 jumlah sampel besar Uji Z dua pop indep.
Variansi Interval, Rasio sebaran normal Uji F
H0: 12   22 Ordinal, interval, rasio - Uji Cochran
Lebih dari dua kelompok atau satu faktor dengan lebih dari dua level
Proporsi
Nominal - Uji Chi-Kuadrat
H0: p1 = p2 = ... = pk
Nilai pusat (median)
H0: semua kelompok Ordinal - Uji Kruskal-Wallis
berdistribusi identik
Nilai pusat (rata-rata) Analisis variansi
Interval, Rasio sebaran normal
H0: μ1 = μ2 = ... = μk (anava) satu arah*
Variansi Uji Bartlett
Interval, Rasio sebaran normal
H0: 12   22  ...  k2 Uji Levene

*Analisis variansi (anava) satu arah (one-way anova) dapat diperluas pula pada pembagian kelompok
berdasarkan kombinasi dua faktor atau lebih, berturut-turut dinamakan anava dwiarah (two way
anova) dan anava multi arah (multi way anova). Pada penelitian eksperimental, anava dilakukan sesuai
dengan desain percobaan yang digunakan (contoh: desain faktorial, desain petak terbagi / split plot,
desain tersarang / nested, dan sebagainya).

Perbandingan lebih dari satu variabel, satu kali pengukuran


Untuk pembandingan lebih dari satu variabel berskala nominal/ordinal, dapat dilakukan
pengujian secara terpisah pada masing-masing variabel. Adapun untuk variabel berskala interval/
rasio dan berdistribusi normal, pengujian rata-rata dapat dilakukan sebagai berikut.

Banyak kelompok Skala data Sebaran data Analisis


Satu
Uji T hotelling
H0: μ = μ0
Dua Interval, Normal
Uji T hotelling
H0: μ1 - μ2 = μ0 Rasio (multivariat)
Lebih dari dua Multivariate ANOVA
H0: μ1 = μ2 = ... = μk (Manova)

Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 5
Perbandingan satu variabel, dua kali pengukuran atau lebih
Pengukuran satu variabel pada masing-masing objek/sampel dapat dilakukan sebanyak dua
kali atau lebih, sehingga terbentuk data berpasangan (paired) maupun data panel. Pembandingan ini
umumnya dilakukan untuk mengevaluasi proses, misalnya perubahan respon beberapa waktu sete-
lah pemberian suatu perlakuan.

Banyak kelompok Banyak pengukuran Skala data Sebaran data Analisis


Satu dua kali nominal - Uji chi kuadrat,
uji Fisher
Satu dua kali ordinal - Uji tanda (sign test), uji
Wilcoxon
Satu dua kali Interval, Normal Uji t berpasangan
rasio (paired t-test)
Analisis Variansi
interval,
Satu atau lebih lebih dari dua kali Normal pengamatan berulang
rasio
(repeated measure)

C. ANALISIS DATA UNTUK KEERATAN HUBUNGAN ANTARVARIABEL (KORELASI)

Analisis data yang dibahas pada subbab ini bertujuan untuk menemukan hubungan antara
sejumlah variabel. Lebih lanjut, keeratan hubungan antara variabel-variabel tersebut dapat dinyatakan
sebagai suatu bilangan yang dinamakan koefisien korelasi. Pada umumnya koefisien korelasi bernilai
di antara -1 hingga 1. Korelasi yang dekat dengan nol menunjukkan tidak adanya hubungan (linear),
sedangkan nilai mutlak korelasi yang dekat dengan 1 menunjukkan hubungan linear yang erat.
Tersedia pula uji hipotesis untuk menentukan apakah koefisien korelasi (yang dihitung berdasarkan
data sampel) bersifat signifikan.

Korelasi antara dua variabel


Analisis korelasi antara dua variabel bergantung pada skala yang digunakan untuk masing-
masing variabel.
Skala variabel 1 Skala variabel 2 Korelasi Keterangan
inferensi hanya bila data
Interval, rasio Interval, rasio Produk momen (Pearson)
berdistribusi normal
Ordinal, Korelasi Rho (Spearman)
Ordinal Bersifat ekuivalen
interval, rasio Korelasi Tau (Kendall)
data nominal dapat terdiri
Nominal Interval, rasio Point biserial
dari beberapa kategori
Nominal Nominal Koefisien kontingensi Pearson -

Korelasi pada sekumpulan variabel


Data berskala ordinal, interval, dan rasio seringkali terdiri dari beberapa variabel sekaligus.
Keberadaan variabel-variabel lain tidak jarang mempengaruhi hubungan variabel tertentu. Sebagai
contoh, tak jarang terdapat variabel penekan (suppressor), variabel pengganggu (confounding), dan
variabel fasilitator. Oleh karena itu, dikenal beberapa macam korelasi sebagai berikut.

Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 6
1. Koefisien korelasi ganda (multiple correlation), yakni korelasi antara satu variabel dengan
beberapa variabel sekaligus.
2. Koefisien korelasi parsial (partial correlation), yakni korelasi antara dua variabel yang dihitung
dengan pengontrolan (peniadaan pengaruh) variabel-variabel lain.
3. Koefisien korelasi semi parsial (semi-partial correlation), yakni korelasi antara dua variabel
yang dihitung dengan pengontrolan (peniadaan pengaruh) variabel-variabel lain terhadap
salah satu variabel yang dihitung korelasinya saja.
Nilai koefisien korelasi parsial maupun korelasi semi parsial dapat diperoleh dari koefisien korelasi
(Pearson) pada masing-masing variabel, sedangkan nilai koefisien korelasi ganda umumnya dipero-
leh melalui analisis regresi linear ganda, yakni akar kuadrat dari koefisien determinasi.

Korelasi Kanonik
Korelasi kanonik (canonical correlation) melihat hubungan antara dua kumpulan variabel yang
berskala interval/rasio.

D. ANALISIS DATA UNTUK PEMBENTUKAN MODEL DAN PREDIKSI

All models are wrong, but some models are useful. (Anonim)

Di samping inferensi terhadap data sampel, statistika juga digunakan untuk melakukan pera-
malan atau prediksi nilai suatu variabel berdasar data yang tersedia. Berdasarkan sifat data yang
digunakan, dikenal beberapa macam model peramalan, yakni:
 Analisis regresi, yakni peramalan nilai-nilai suatu variabel berdasarkan nilai variabel-variabel
lain yang berkaitan. Pada umumnya data untuk analisis regresi diambil secara cross sectional,
yakni pada satu waktu atau satu kali observasi pada sejumlah subjek.
 Analisis runtun waktu, yakni peramalan nilai-nilai suatu variabel di masa yang akan datang
berdasarkan nilai-nilai variabel tersebut di masa lampau. Untuk itu, digunakan data runtun
waktu atau time series, yang diambil berulang-ulang selama jangka waktu tertentu pada sub-
jek yang sama. Analisis runtun waktu juga dapat melibatkan variabel-variabel eksogen atau
variabel-variabel lain di samping variabel yang hendak diprediksi nilainya.
 Analisis data longitudinal, yakni analisis terhadap data yang terdiri dari beberapa variabel
dan diambil berulang selama jangka waktu tertentu. Pada umumnya frekuensi pengamatan
data longitudinal jauh lebih kecil dibandingkan data runtun waktu. Data longitudinal yang
diambil pada waktu-waktu tertentu secara teratur dikenal sebagai data panel.

Analisis Regresi
Analisis regresi umumnya digunakan untuk meramalkan nilai-nilai suatu variabel (disebut
variabel dependen, variabel terikat/takbebas, variabel respon) berdasarkan nilai-nilai variabel lain
yang terkait (disebut variabel independen, variabel bebas, atau variabel prediktor). Di samping itu,
analisis regresi juga dapat digunakan untuk mengamati hubungan antara satu variabel dependen
dengan sekumpulan variabel independen. Persamaan atau model regresi dikatakan sederhana
(simple regression) bila hanya memuat satu prediktor, dan berganda (multiple regression) bila memuat
lebih dari satu prediktor.

Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 7
1. Regresi linear. Bentuk regresi ini paling umum dijumpai, dengan Y berskala interval/rasio dan
X dapat berskala apapun (termasuk nominal/ordinal, dengan membuat variabel boneka).
Dalam pengertian statistika, regresi linear berarti regresi yang bersifat linear dalam parameter.
Bentuk umum regresi linear dengan p variabel prediktor adalah:
Y = β0 + β1X1 + β2X2 + ... + βpXp + ε
Model regresi berikut memiliki komponen non-linear, namun linear dalam parameter:
Y = β0 + β1X1 + β2 log(X2) + ... + βp(Xp)2 + ε
Model regresi di bawah ini sepintas nampak non-linear, namun dapat ditransformasi menjadi
model regresi linear:
Y  1 X12 X 23 e  ln Y    2 ln X 2  3 ln X 3  
Pendugaan parameter regresi linear umumnya dilakukan dengan metode kuadrat terkecil
(least square estimator). Inferensi dapat dilakukan dengan baik bila dipenuhi asumsi-asumsi
regresi klasik, yakni asumsi normalitas residual, tidak adanya autokorelasi, tidak adanya mul-
tikolinearitas, dan homoskedastisitas. Pada umumnya inferensi yang dilakukan meliputi uji
signifikansi model secara keseluruhan (overall test) dan uji signifikansi masing-masing variabel
(partial test). Untuk menemukan model regresi terbaik, dapat digunakan beberapa ukuran,
misalnya koefisien determinasi (R2), koefisien determinasi disesuaikan (adjusted R2), nilai
Akaike Information Criterion (AIC), dan nilai Schwarz Bayesian Criterion (SBC).
2. Regresi logistik. Regresi logistik digunakan bila variabel dependennya bertipe kategorik atau
kualitatif. Bentuk paling sederhana dari regresi logistik adalah bila variabel dependennya
hanya memiliki dua hasil yang mungkin (dichotomus), misal sukses/gagal, lolos/tidak lolos,
dan sebagainya. Variabel dependen diubah ke dalam bentuk logit, yakni
    X ...  p X p 
  x   P Y  1 x  
e 0 1 1
    X ...  p X p 
1 e 0 1 1
Pada analisis regresi logistik, uji signifikansi parameter juga dapat dilakukan. Di samping itu,
dapat dihitung nilai peluang objek masuk ke dalam kategori respon tertentu serta nilai odds
ratio. Regresi logistik juga dapat diperluas untuk variabel dependen dengan banyak kategori
hasil yang mungkin (polychotomus), misal tingkat kepuasan (tidak puas, kurang puas, puas,
sangat puas), dan sebagainya.

Analisis Runtun Waktu


Secara umum, tujuan analisis data runtun waktu adalah memprediksi nilai-nilai suatu varia-
bel (di masa yang akan datang) berdasarkan nilai-nilai variabel tersebut di masa lampau. Untuk itu,
diperlukan pengetahuan mengenai pola atau variasi yang ada dari waktu ke waktu. Beberapa model
analisis runtun waktu adalah sebagai berikut.
1. Metode dekomposisi. Pada metode ini, data runtun waktu dipisahkan atau didekomposisi men-
jadi empat komponen, yakni tren (kecenderungan naik/turun), musiman (seasonal), siklis
(cyclical) yang lebih panjang dibandingkan musiman, dan komponen tak teratur. Dengan
mengetahui nilai indeks setiap musim dan memprediksi tren (misal dengan regresi), dapat
diramalkan data pada periode yang akan datang.
2. Metode penghalusan eksponensial (exponential smoothing), yakni dengan menghilangkan kom-
ponen tak teratur dalam data. Prediksi data di masa mendatang dilakukan dengan melihat
rata-rata terbobot data masa lampau. Terdapat beberapa variasi metode penghalusan ini.
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 8
3. Metode ARIMA/SARIMA, yakni metode peramalan yang diperkenalkan oleh Box dan Jenkins
(1976). Metode ini didasarkan pada dua pola dasar, yakni pola autoregresif (autoregressive)/AR
dan pola rata-rata bergerak (moving average)/MA.
4. Metode Autoregressive Distributed Lag, yakni model peramalan data runtun waktu dengan satu
variabel dependen Y dan satu atau lebih variabel independen X serta nilai-nilai kedua varia-
bel tersebut pada masa lampau. Dengan kata lain, model ini dapat dipandang sebagai model
regresi berganda namun melibatkan data masa lampau.

Model-model analisis data runtun waktu di atas banyak digunakan dalam riset di bidang ekonomi
atau ekonometri.

E. ANALISIS DATA UNTUK PENGELOMPOKAN (KLASIFIKASI)

Analisis data pada bagian ini bertujuan untuk melakukan pengelompokan, baik pengelom-
pokan variabel maupun pengelompokan subjek/individu.

Analisis Diskriminan
Mirip dengan analisis regresi (logistik), analisis diskriminan digunakan untuk mengidentifi-
kasi variabel-variabel independen (berskala interval/rasio) yang berpengaruh terhadap satu variabel
dependen (berskala kategorik). Hasil akhir analisis diskriminan adalah suatu fungsi diskriminan
(umumnya berupa fungsi linear) yang memuat variabel-variabel independen tertentu, dan dapat
digunakan untuk melakukan klasifikasi apakah suatu objek masuk ke dalam kelompok tertentu pada
variabel dependen.

Analisis Gerombol (cluster analysis)


Analisis gerombol atau analisis klaster (cluster analysis) digunakan untuk melakukan penge-
lompokan objek (individu/data) berdasarkan kemiripan atau kesamaan objek-objek tersebut. Dengan
demikian, objek-objek yang tergolong pada satu klaster akan bersifat homogen (memiliki kemiripan
yang tinggi), sedangkan antara satu klaster dengan klaster lainnya akan bersifat heterogen (memiliki
perbedaan yang tinggi). Terdapat dua macam analisis klaster:
1. Analisis klaster dengan hierarkhi (hierarchial cluster analysis), yakni
pengelompokan objek secara bertahap, dapat dilakukan mulai dari
masing-masing objek bergabung (agglomerative) maupun dari
keseluruhan objek yang memisah (divisive). Hasil analisis klaster
dengan hierar-khi dapat disajikan dalam bentuk dendogram,
yakni diagram pohon yang menunjukkan kemiripan antara satu
klaster dengan klaster yang lain (lihat gambar di samping).
2. Analisis klaster tanpa hierarkhi (non-hierarchial cluster analysis), dimulai dengan menentukan
jumlah cluster yang diinginkan, kemudian mengelompokkan objek-objek sesuai dengan kemi-
ripannya ke dalam klaster-klaster tersebut. Dapat pula dilakukan secara sekuensial, yakni de-
ngan menentukan satu pusat klaster, mengelompokkan objek ke dalam klaster tersebut, lalu
membentuk klaster berikutnya dengan subjek yang tersisa.

Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 9
Analisis Faktor (Eksploratori)
Analisis faktor bertujuan untuk menemukan hubungan (interdependence) antara sejumlah
variabel. Berdasarkan hubungan tersebut, dapat dilakukan reduksi variabel, yakni membentuk bebe-
rapa variabel baru yang tidak saling berkorelasi, disebut faktor. Banyaknya faktor selalu lebih kecil
dibandingkan banyaknya variabel mula-mula. Sebagai contoh, dari 11 variabel, dapat dibentuk 3-4
buah faktor tanpa kehilangan cukup banyak informasi. Banyaknya faktor yang digunakan dapat di-
tentukan sendiri oleh peneliti berdasarkan nilai Eigen, persentase variansi, diagram (scree plot), mau-
pun ditentukan lebih awal berdasarkan teori.
Pada umumnya, faktor-faktor yang terbentuk kemudian diidentifikasi dan diberi nama. Nilai
faktor-faktor tersebut juga dapat dipergunakan dalam prosedur analisis data yang lain.

Pemodelan Persamaan Struktural (SEM)


Pemodelan persamaan struktural (structural equations modeling, SEM), merupakan gabungan
dari teknik analisis faktor dan regresi linear ganda yang telah dibahas di muka. Dibandingkan de-
ngan analisis-analisis yang lain, pemodelan persamaan struktural cenderung lebih kompleks dan
memerlukan dasar teori yang kuat. Variabel-variabel dalam pemodelan persamaan struktural
dibedakan menjadi beberapa kelompok, yakni:
1. Variabel teramati (observed variable atau manifest
variable), yakni variabel yang dapat diukur secara
empiris.
2. Variabel laten (latent variable), yakni variabel
yang tidak dapat diukur secara langsung, namun
direpresentasikan oleh variabel teramati.
Variabel laten atau konstruk ini dapat dibedakan
menjadi dua, yakni konstruk endogen dan
konstruk eksogen.
Dengan demikian, menggunakan SEM peneliti dapat
melihat hubungan antara variabel teramati dan kons-
truk, maupun hubungan antara satu konstruk dengan (sumber: Hair et al., 2010)
konstruk yang lain.

DAFTAR PUSTAKA

Conover, W.J., 1999, Practical Nonparametric Statistics, 3rd edition., John Wiley and Sons, New York.
Hair, J.F., Black, C.W., Babin, B.J., Anderson, R.E., 2010, Multivariate Data Analysis, 7th ed., Pearson
Prentice Hall, San Fransisco.
Malhotra, N.K., Birks, D.F., 2006, Marketing Research: An Applied Approach, Pearson Education
Limited., Essex.
Nazir, M., 2005, Metode Penelitian, Ghalia Indonesia, Jakarta.
Nurgiyantoro, B., Gunawan, Marzuki., 2012, Statistik Terapan untuk Penelitian Ilmu-ilmu Sosial, Gadjah
Mada University Press, Yogyakarta.
Rosadi, D., 2011, Analisis Ekonometrika & Runtun Waktu Terapan dengan R., Penerbit Andi, Yogyakarta.
Santoso, S., 2002, Buku Latihan SPSS Statistik Multivariat, Elex Media Komputindo, Jakarta.
Sudjana, 1992, Metoda Statistika, Edisi kelima, Tarsito, Bandung.

Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 10

View publication stats

Anda mungkin juga menyukai