net/publication/336311791
CITATIONS READS
0 9,124
1 author:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
LEARNER MOTIVATION IN ESL LEARNING STRATEGIES AND GENDER ROLE View project
All content following this page was uploaded by Ezra Putranda Setiawan on 07 October 2019.
Analisis data merupakan salah satu tahap terpenting dalam proses penelitian. Pada tahap ini,
data yang telah terkumpul akan diolah dan dianalisis sedemikian rupa sehingga dapat membantu
peneliti menjawab pertanyaan penelitian. Di sisi lain, ilmu statistika menyediakan metode analisis
data yang sangat banyak macamnya. Oleh karena itu, pemilihan teknik analisis data menjadi hal
penting untuk menjamin bahwa analisis data yang kita lakukan adalah tepat. Penggunaan teknik
analisis data yang tidak tepat dapat mengakibatkan pengambilan keputusan yang salah maupun
tertundanya proses penelitian.
Pembahasan dalam makalah ini dibatasi pada teknik analisis data kuantitatif. Secara umum,
analisis data kuantitatif dapat dibedakan menjadi dua kelompok berikut.
Analisis deskriptif, umumnya digunakan untuk memberikan gambaran awal mengenai data
yang tersedia. Analisis ini dapat dilakukan dengan bantuan tabel-tabel maupun grafik seder-
hana, misalnya menggambarkan persebaran usia dan tingkat pendidikan responden dalam
suatu survei.
Analisis inferensi, yakni pengambilan kesimpulan terhadap populasi berdasarkan informasi
dari statistik sampel. Inferensi dapat berupa pembentukan selang kepercayaan (interval konfi-
densi) maupun pengujian hipotesis. Sebagian besar analisis data yang dibahas pada makalah
ini merupakan teknik inferensi statistika.
Hampir semua teknik analisis data yang disebutkan dalam tulisan ini dapat dilakukan dengan bantu-
an perangkat lunak pengolahan data, misalnya SPSS, Minitab, R, SAS, LISREL, Eviews, dan lain
sebagainya. Karena keterbatasan tempat, teknik pengolahan data dengan perangkat-perangkat terse-
but tidak dibahas dalam tulisan ini.
A. PENDAHULUAN
Pemilihan teknik analisis data bergantung pada dua hal utama, yakni tujuan penelitian dan
sifat data yang tersedia. Tujuan penelitian berkaitan erat dengan masalah yang hendak diteliti
apakah membandingkan, mengkategorikan/mengelompokkan, menguji adanya hubungan, dan lain
sebagainya. Sifat data berkaitan erat dengan skala yang digunakan, sifat dari distribusi atau sebaran
data, cara pengambilan data, maupun keberadaan data pencilan (ekstrim). Berdasarkan hal-hal itulah
teknik analisis data dapat dipilih dan dilaksanakan, sehingga diperoleh kesimpulan yang valid.
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 1
Mengenal Tujuan Pengolahan Data
Terdapat berbagai tujuan penelitian, misalnya menemukan produk baru, menguji kualitas
produksi suatu produk, mengembangkan teori baru, melakukan prediksi, membuat profil konsumen
suatu produk, menguji efektivitas suatu terapi, membandingkan kemampuan sejumlah responden,
dan lain sebagainya. Di sisi lain, ditinjau dari teknik pengolahan data yang digunakan, tujuan-tujuan
penelitian di atas dapat dibedakan menjadi beberapa hal berikut.
1. Tujuan membandingkan. Peneliti dapat membandingkan mutu beberapa macam produk,
kondisi sebelum dan sesudah suatu perlakuan tertentu, kondisi saat ini dengan kondisi masa
lalu (saat riset sebelumnya dilakukan), dan lain sebagainya. Dari perbandingan ini dapat
dihasilkan pula informasi mengenai hubungan satu variabel dengan variabel-variabel lain
secara lebih jelas.
2. Tujuan menguji hubungan. Peneliti dapat mencari ada tidaknya hubungan antara dua variabel
atau lebih. Sebagai catatan, adanya hubungan antara variabel A dan B tidak selalu berarti
bahwa variabel A menjadi penyebab variabel B, atau sebaliknya. Pada umumnya pengujian
hubungan juga dapat dijelaskan dengan membuat pembandingan (lihat poin 1 di atas).
3. Tujuan membentuk model prediksi. Pembentukan model prediksi suatu variabel dapat dilaku-
kan menggunakan data variabel-variabel lain maupun variabel itu sendiri pada masa lalu.
Sebagai contoh prediksi inflasi dapat dilakukan menggunakan data inflasi-inflasi sebelumnya
maupun data harga-harga bahan pokok. Dapat pula dibentuk model yang lebih kompleks,
berhubungan dengan beberapa variabel sekaligus.
4. Tujuan melakukan klasifikasi. Peneliti kadangkala perlu melakukan klasifikasi baik untuk
variabel maupun untuk subjek penelitian. Sebagai contoh, seorang guru dapat mengklasifika-
sikan mata pelajaran apa saja yang masih sulit dikuasai oleh para peserta didik (klasifikasi
terhadap variabel) maupun klasifikasi nama-nama siswa berdasarkan kemampuannya dalam
memahami pelajaran (klasifikasi terhadap subjek).
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 2
3. Ada tidaknya data hilang (missing data). Adanya data yang hilang, misalnya karena keti-
daklengkakpan pengisian kuesioner atau mortalitas eksperimental, akan mempengaruhi hasil
analisis data. Peneliti harus memastikan langkah yang akan diambil terhadap subjek dengan
data tak lengkap.
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 3
2. Pembuatan diagram kuantil distribusi normal teoritis terhadap kuantil distribusi empiris data,
dikenal sebagai QQ-plot. Bila data berdistribusi normal, titik-titik pada QQ-plot menunjukkan
garis lurus.
Contoh data
berdistribusi normal
Contoh data
tidak berdistribusi normal
Bila analisis yang hendak dilakukan memerlukan asumsi distribusi normal namun asumsi ini tidak
dapat dipenuhi, terdapat beberapa cara yang dapat dilakukan:
1. Hapus atau buang data yang berupa pencilan (bila ada). Tentu saja metode ini hanya dapat
dilakukan bila jumlah data yang dimiliki cukup besar, serta keberadaan pencilan dalam data
dapat diabaikan.
2. Lakukan transformasi yang sesuai, misal ubah data x menjadi y = x2, y = 1/x. Metode ini harus
dilakukan dengan hati-hati, terlebih bila analisis bertujuan untuk membentuk suatu model
prediksi.
3. Gunakan teknik analisis statistika nonparametrik, yang tidak memerlukan syarat distribusi
normal. Sebagai contoh, untuk menggantikan analisis variansi (anava) satu arah, dapat digu-
nakan uji Kruskall-Wallis.
Analisis data untuk pembandingan (komparasi) umumnya dilakukan untuk menemukan ada
tidaknya perbedaan yang signifikan antar kelompok (antar populasi) atau antar pengukuran pada
kelompok yang sama. Terdapat tiga ukuran yang umum dibandingkan, yakni
1. Proporsi (p). Misalkan dari n sampel yang tersedia, terdapat sejumlah x sampel yang memiliki
sifat A. Proporsi sampel dengan sifat A didefinisikan sebagai p = x/n.
2. Ukuran pemusatan data. Ukuran pemusatan atau ukuran kecenderungan sentral yang lazim
digunakan adalah rata-rata dan median. Modus cenderung kurang populer, mengingat nilai-
nya tidak selalu tunggal (ada data yang memiliki lebih dari satu modus).
3. Ukuran penyebaran atau variabilitas, yang paling sering dipakai adalah ragam (variance) dan
simpangan baku (standard deviation).
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 4
Pembandingan satu variabel, satu kali pengukuran
Banyak kelompok dan
Skala data Syarat lain Analisis
ukuran
Satu kelompok
Proporsi
Nominal, Ordinal - Uji Z untuk proporsi
H0: p = p0
Nilai pusat (rata-rata) sebaran normal Uji t
Interval, Rasio
H0: μ = μ0 Jumlah sampel besar Uji Z
Dua kelompok
Proporsi Nominal - Uji Z untuk proporsi
H0: p1 - p2 = 0 (p1 = p2) atau Uji Chi-Kuadrat
Nilai pusat (median) - Uji Mann-Whitney
Ordinal
H0: E(x1) = E(x2) Uji Wilcoxon
Nilai pusat (rata-rata) sebaran normal Uji t dua pop indep.
Interval, Rasio
H0: μ1 - μ2 = μ0 jumlah sampel besar Uji Z dua pop indep.
Variansi Interval, Rasio sebaran normal Uji F
H0: 12 22 Ordinal, interval, rasio - Uji Cochran
Lebih dari dua kelompok atau satu faktor dengan lebih dari dua level
Proporsi
Nominal - Uji Chi-Kuadrat
H0: p1 = p2 = ... = pk
Nilai pusat (median)
H0: semua kelompok Ordinal - Uji Kruskal-Wallis
berdistribusi identik
Nilai pusat (rata-rata) Analisis variansi
Interval, Rasio sebaran normal
H0: μ1 = μ2 = ... = μk (anava) satu arah*
Variansi Uji Bartlett
Interval, Rasio sebaran normal
H0: 12 22 ... k2 Uji Levene
*Analisis variansi (anava) satu arah (one-way anova) dapat diperluas pula pada pembagian kelompok
berdasarkan kombinasi dua faktor atau lebih, berturut-turut dinamakan anava dwiarah (two way
anova) dan anava multi arah (multi way anova). Pada penelitian eksperimental, anava dilakukan sesuai
dengan desain percobaan yang digunakan (contoh: desain faktorial, desain petak terbagi / split plot,
desain tersarang / nested, dan sebagainya).
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 5
Perbandingan satu variabel, dua kali pengukuran atau lebih
Pengukuran satu variabel pada masing-masing objek/sampel dapat dilakukan sebanyak dua
kali atau lebih, sehingga terbentuk data berpasangan (paired) maupun data panel. Pembandingan ini
umumnya dilakukan untuk mengevaluasi proses, misalnya perubahan respon beberapa waktu sete-
lah pemberian suatu perlakuan.
Analisis data yang dibahas pada subbab ini bertujuan untuk menemukan hubungan antara
sejumlah variabel. Lebih lanjut, keeratan hubungan antara variabel-variabel tersebut dapat dinyatakan
sebagai suatu bilangan yang dinamakan koefisien korelasi. Pada umumnya koefisien korelasi bernilai
di antara -1 hingga 1. Korelasi yang dekat dengan nol menunjukkan tidak adanya hubungan (linear),
sedangkan nilai mutlak korelasi yang dekat dengan 1 menunjukkan hubungan linear yang erat.
Tersedia pula uji hipotesis untuk menentukan apakah koefisien korelasi (yang dihitung berdasarkan
data sampel) bersifat signifikan.
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 6
1. Koefisien korelasi ganda (multiple correlation), yakni korelasi antara satu variabel dengan
beberapa variabel sekaligus.
2. Koefisien korelasi parsial (partial correlation), yakni korelasi antara dua variabel yang dihitung
dengan pengontrolan (peniadaan pengaruh) variabel-variabel lain.
3. Koefisien korelasi semi parsial (semi-partial correlation), yakni korelasi antara dua variabel
yang dihitung dengan pengontrolan (peniadaan pengaruh) variabel-variabel lain terhadap
salah satu variabel yang dihitung korelasinya saja.
Nilai koefisien korelasi parsial maupun korelasi semi parsial dapat diperoleh dari koefisien korelasi
(Pearson) pada masing-masing variabel, sedangkan nilai koefisien korelasi ganda umumnya dipero-
leh melalui analisis regresi linear ganda, yakni akar kuadrat dari koefisien determinasi.
Korelasi Kanonik
Korelasi kanonik (canonical correlation) melihat hubungan antara dua kumpulan variabel yang
berskala interval/rasio.
All models are wrong, but some models are useful. (Anonim)
Di samping inferensi terhadap data sampel, statistika juga digunakan untuk melakukan pera-
malan atau prediksi nilai suatu variabel berdasar data yang tersedia. Berdasarkan sifat data yang
digunakan, dikenal beberapa macam model peramalan, yakni:
Analisis regresi, yakni peramalan nilai-nilai suatu variabel berdasarkan nilai variabel-variabel
lain yang berkaitan. Pada umumnya data untuk analisis regresi diambil secara cross sectional,
yakni pada satu waktu atau satu kali observasi pada sejumlah subjek.
Analisis runtun waktu, yakni peramalan nilai-nilai suatu variabel di masa yang akan datang
berdasarkan nilai-nilai variabel tersebut di masa lampau. Untuk itu, digunakan data runtun
waktu atau time series, yang diambil berulang-ulang selama jangka waktu tertentu pada sub-
jek yang sama. Analisis runtun waktu juga dapat melibatkan variabel-variabel eksogen atau
variabel-variabel lain di samping variabel yang hendak diprediksi nilainya.
Analisis data longitudinal, yakni analisis terhadap data yang terdiri dari beberapa variabel
dan diambil berulang selama jangka waktu tertentu. Pada umumnya frekuensi pengamatan
data longitudinal jauh lebih kecil dibandingkan data runtun waktu. Data longitudinal yang
diambil pada waktu-waktu tertentu secara teratur dikenal sebagai data panel.
Analisis Regresi
Analisis regresi umumnya digunakan untuk meramalkan nilai-nilai suatu variabel (disebut
variabel dependen, variabel terikat/takbebas, variabel respon) berdasarkan nilai-nilai variabel lain
yang terkait (disebut variabel independen, variabel bebas, atau variabel prediktor). Di samping itu,
analisis regresi juga dapat digunakan untuk mengamati hubungan antara satu variabel dependen
dengan sekumpulan variabel independen. Persamaan atau model regresi dikatakan sederhana
(simple regression) bila hanya memuat satu prediktor, dan berganda (multiple regression) bila memuat
lebih dari satu prediktor.
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 7
1. Regresi linear. Bentuk regresi ini paling umum dijumpai, dengan Y berskala interval/rasio dan
X dapat berskala apapun (termasuk nominal/ordinal, dengan membuat variabel boneka).
Dalam pengertian statistika, regresi linear berarti regresi yang bersifat linear dalam parameter.
Bentuk umum regresi linear dengan p variabel prediktor adalah:
Y = β0 + β1X1 + β2X2 + ... + βpXp + ε
Model regresi berikut memiliki komponen non-linear, namun linear dalam parameter:
Y = β0 + β1X1 + β2 log(X2) + ... + βp(Xp)2 + ε
Model regresi di bawah ini sepintas nampak non-linear, namun dapat ditransformasi menjadi
model regresi linear:
Y 1 X12 X 23 e ln Y 2 ln X 2 3 ln X 3
Pendugaan parameter regresi linear umumnya dilakukan dengan metode kuadrat terkecil
(least square estimator). Inferensi dapat dilakukan dengan baik bila dipenuhi asumsi-asumsi
regresi klasik, yakni asumsi normalitas residual, tidak adanya autokorelasi, tidak adanya mul-
tikolinearitas, dan homoskedastisitas. Pada umumnya inferensi yang dilakukan meliputi uji
signifikansi model secara keseluruhan (overall test) dan uji signifikansi masing-masing variabel
(partial test). Untuk menemukan model regresi terbaik, dapat digunakan beberapa ukuran,
misalnya koefisien determinasi (R2), koefisien determinasi disesuaikan (adjusted R2), nilai
Akaike Information Criterion (AIC), dan nilai Schwarz Bayesian Criterion (SBC).
2. Regresi logistik. Regresi logistik digunakan bila variabel dependennya bertipe kategorik atau
kualitatif. Bentuk paling sederhana dari regresi logistik adalah bila variabel dependennya
hanya memiliki dua hasil yang mungkin (dichotomus), misal sukses/gagal, lolos/tidak lolos,
dan sebagainya. Variabel dependen diubah ke dalam bentuk logit, yakni
X ... p X p
x P Y 1 x
e 0 1 1
X ... p X p
1 e 0 1 1
Pada analisis regresi logistik, uji signifikansi parameter juga dapat dilakukan. Di samping itu,
dapat dihitung nilai peluang objek masuk ke dalam kategori respon tertentu serta nilai odds
ratio. Regresi logistik juga dapat diperluas untuk variabel dependen dengan banyak kategori
hasil yang mungkin (polychotomus), misal tingkat kepuasan (tidak puas, kurang puas, puas,
sangat puas), dan sebagainya.
Model-model analisis data runtun waktu di atas banyak digunakan dalam riset di bidang ekonomi
atau ekonometri.
Analisis data pada bagian ini bertujuan untuk melakukan pengelompokan, baik pengelom-
pokan variabel maupun pengelompokan subjek/individu.
Analisis Diskriminan
Mirip dengan analisis regresi (logistik), analisis diskriminan digunakan untuk mengidentifi-
kasi variabel-variabel independen (berskala interval/rasio) yang berpengaruh terhadap satu variabel
dependen (berskala kategorik). Hasil akhir analisis diskriminan adalah suatu fungsi diskriminan
(umumnya berupa fungsi linear) yang memuat variabel-variabel independen tertentu, dan dapat
digunakan untuk melakukan klasifikasi apakah suatu objek masuk ke dalam kelompok tertentu pada
variabel dependen.
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 9
Analisis Faktor (Eksploratori)
Analisis faktor bertujuan untuk menemukan hubungan (interdependence) antara sejumlah
variabel. Berdasarkan hubungan tersebut, dapat dilakukan reduksi variabel, yakni membentuk bebe-
rapa variabel baru yang tidak saling berkorelasi, disebut faktor. Banyaknya faktor selalu lebih kecil
dibandingkan banyaknya variabel mula-mula. Sebagai contoh, dari 11 variabel, dapat dibentuk 3-4
buah faktor tanpa kehilangan cukup banyak informasi. Banyaknya faktor yang digunakan dapat di-
tentukan sendiri oleh peneliti berdasarkan nilai Eigen, persentase variansi, diagram (scree plot), mau-
pun ditentukan lebih awal berdasarkan teori.
Pada umumnya, faktor-faktor yang terbentuk kemudian diidentifikasi dan diberi nama. Nilai
faktor-faktor tersebut juga dapat dipergunakan dalam prosedur analisis data yang lain.
DAFTAR PUSTAKA
Conover, W.J., 1999, Practical Nonparametric Statistics, 3rd edition., John Wiley and Sons, New York.
Hair, J.F., Black, C.W., Babin, B.J., Anderson, R.E., 2010, Multivariate Data Analysis, 7th ed., Pearson
Prentice Hall, San Fransisco.
Malhotra, N.K., Birks, D.F., 2006, Marketing Research: An Applied Approach, Pearson Education
Limited., Essex.
Nazir, M., 2005, Metode Penelitian, Ghalia Indonesia, Jakarta.
Nurgiyantoro, B., Gunawan, Marzuki., 2012, Statistik Terapan untuk Penelitian Ilmu-ilmu Sosial, Gadjah
Mada University Press, Yogyakarta.
Rosadi, D., 2011, Analisis Ekonometrika & Runtun Waktu Terapan dengan R., Penerbit Andi, Yogyakarta.
Santoso, S., 2002, Buku Latihan SPSS Statistik Multivariat, Elex Media Komputindo, Jakarta.
Sudjana, 1992, Metoda Statistika, Edisi kelima, Tarsito, Bandung.
Pemilihan Analisis Data - Training Olah Data HIMASTA UGM - 14 Oktober 2017 10