Jelaskan hubungan antara statistika deskriptif dan statistika inferensi. Gunakan contoh kasus
yang konkrit untuk menjelaskannya.
Statistik dibedakan menjadi dua macam tipe aplikasi yakni statistik deskriptif dan statistik
inferensial.
1. Statistik deskriptif
Statistik deskriptif merupakan tipe analisis yang meliputi pengumpulan data, penyajian data,
dan peringkasan data. Tipe analisis ini hanya sebatas mengolah data dan menyajikannya saja
sehingga tidak dapat digunakan untuk mengambil suatu kesimpulan dari apa yang telah
diteliti.
2. Statistik inferensial/ induktif
Statistik inferensial merupakan tipe analisis yang digunakan utnuk mengkaji, menaksir dan
menarik kesimpulan dari apa yang telah diteliti sehingga dapat digunakan sebagai pedoman
dalam pengambilan keputusan.
Dalam statistik induktif/ inferensial terdapat beberapa langkah yakni:
Menentukan hipotesis nihil (Ho) dan menentukan hipotesis alternatif (Ha atau H1).
Menentukan statistik tabel
Menghitung kriteria pengujian atau statistik hitung
Menarik kesimpulan dan mengambil keputusan sesuai dengan hasil perbandingan antara
statistik hitung dengan statistik tabel yang ada atau dengan melihat tingkat signifikansinya
yakni apakah Ho ditolak atau diterima.
Pembagian metode statistik induktif:
1. Berdasarkan tipe data
Data bersifat kualitatif (nominal dan ordinal), analisis dapat dikelompokkan pada bagian
statistik non parametrik. Seperti Uji Wilcoxon, Kruskal-Wallis, Friedman dan sebagainya.
Data bersifat kuantitatif (interval dan rasio), analisis dapat dikelompokkan pada bagian
statistik parametrik. Seperti Uji T, Uji F (Anova) dan sebagainya.
2. Berdasarkan jumlah variabel
Analisis univariat, digunakan untuk menganalisis satu variable. Misalnya Uji T.
Analisis bivariat, digunakan untuk menganalisis dua variabel. Misalnya analisis korelasi
sederhana dan analisis regresi sederhana.
Analisis ganda/ faktorial, digunakan bila hanya satu variabel dependen tetapi lebih dari
satu variabel independen yang dianalisis. Misalnya analisis korelasi ganda dan analisis
regresi ganda.
Analisis multivariate, digunakan untuk menganalisis dua atau lebih variabel dependen
dan dua atau lebih variable independen. Misalnya cluster analysis, factor analysis,
discriminant analysis dan sebagainya.
Untuk keperluan analisis data pada bidang riset, metode statistik induktif yang ada dapat
dibagi sesuai dengan kegunaannya, antara lain:
1. Analisis statistik komparatif (perbandingan dan perbedaan), misalnya : independen
sample t test, paired sample t test, one way anova.
2. Analisis statistik korelasional (uji asosiasi), misalnya crosstab untuk korelasi dua variabel
data berskala nominal (kategori), korelasi dua variabel data berskala interval/ rasio
(korelasi Pearson), korelasi parsial data berskala interval/ rasio.
3. Analisis prediktif, misalnya analisis regresi sederhana dan regresi ganda.
4. Analisis multivariat, misalnya cluster analysis, factor analysis, discriminant analysis dan
sebagainya.
Terkadang dalam suatu penelitian hanya digunakan salah satu dari kedua tipe aplikasi
tersebut. Tetapi dapat juga digunakan keduanya, yakni penelitian yang menggunakan data
deskriptif terlebih dahulu kemudian dilanjutkan dengan menggunakan tipe aplikasi
inferensial/ induktif yang dapat digunakan untuk mengambil keputusan dari penelitian
tersebut.
contohnya, peneliti ingin mengetahui kecepatan internet dalam suatu laboratorium yang ingin
membuktikan semakin banyak pengguna internet akan memperlambat kecepatan internet.
Maka penelitian dilakukan dengan memperoleh data kecepatan internet bila digunakan oleh 1
orang, 2 orang, 3 orang dan seterusnya. Data-data tersebut disajikan dalam bentuk data
deskriptif. Berangkat dari data deskriptif maka untuk mengetahui besarnya pengaruh
pengguna internet terhadap kecepatan internet, maka data-data tersebut perlu dianalisis
menggunakan tipe inferensial yang dapat menghasilkan kesimpulan sehingga dapat digunakan
untuk mengambil keputusan atas kasus tersebut nantinya.
Deskripsi atau penggambaran sekumpulan data secara visual dapat dilakukan dengan dengan
dua cara yakni deskripsi dalam bentuk tulisan dan deskripsi dalam bentuk gambar.
1. Deskripsi dalam bentuk tulisan,
Bisa kita dapatkan dari output SPSS yang secara otomatis muncul. Dalam program SPSS,
statistik deskriptif dapat dilakukan dengan menu deskriptive statistics yang terdiri dari:
- Frequencies,
Digunakan untuk menampilkan dan menggambarkan data yang terdiri atas satu variabel
saja. Jika terdapat lebih dari satu variabel maka variabel-variabel tersebut akan
ditampilkan secara terpisah.
- Descriptives
Digunakan untuk menyajikan data statistik deskriptif pada sebuah variabel seperti rata-
rata (mean), deviasi standar, variasi dan sebagainya.
- Explore
Memiliki fungsi yang sama dengan menu “Descriptives”. Perbedaannya adalah dalam
menu Explore ini akan diolah semakin kompleks dan dilengkapi dengan cara menguji
apakah data yang outlier serta uji kenormalan sebuah data, yang dapat dukur dengan
uji tertentu atau ditampilkan dalam bentuk box-plot, steam, and leaf dan normal
probability plot.
- Crosstab
Digunakan untuk menyajikan data dalam bentuk tabulasi, yang meliputi baris dan
kolom. Ciri crosstab adalah adanya dua variable atau lebih yang mempunyai hubungan
secara deskriptif serta data penyajiannya berupa data kualitatif, khususnya data yang
berskala nominal.
- Ratio
Digunakan untuk menyediakan ringkasan statistik yang berupa perbandingan-
perbandingan. Rasio ini sering juga disebut sebagai rasio statistik, yakni hasil pembagian
dua variabel yaitu semua data yang bertipe rasio yang mempunyai nilai positif.
2. Descriptive dalam bentuk gambar/ grafik
Data yang disajikan dengan grafik digunakan untuk melengkapi deskripsi yang beripa teks,
supaya data tersebut tampak lebih impresif dan komunikatif dengan para penggunanya.
Berikut ini disajikan salah satu contoh analisa yang menggunakan tipe statistik deskriptif
Tabel di bawah ini adalah data-data perolehan nilai dari 10 siswa untuk mata pelajaran
Matematika dan Bahasa Indonesia. Yang nantinya akan dianalisis menggunakan tipe analisa
deskriptif.
No Matematika (variable X) B. Ind (variable Y)
1 90 87
2 67 75
3 78 67
4 85 80
5 75 70
6 60 56
7 87 76
8 87 54
9 90 87
10 60 65
Jika kita akan meneliti karyawan sebuah perusahaan yang banyaknya 1.000 orang, maka seluruh
karyawan yang seribu orang itu disebut sebagai populasi penelitian kita. Tiap-tiap karyawan dari
seluruh karyawan yang seribu orang itu disebut sebagai subjek penelitian, sekaligus kita sebut
sebagai anggota populasi penelitian kita. Jadi, dengan demikian, dapat disimpulkan pula bahwa
populasi penelitian itu adalah keseluruhan subjek penelitian.
Ada kalanya, karena berbagai keterbatasan, kita tidak mungkin meneliti (“menanyai” atau
mengumpulkan data — bisa dengan wawancara, observasi, angket, tes dsb. — dari) seluruh
anggota populasi. Jadi, kita tidak bisa melakukan studi populasi. Kita mau tidak mau harus
mengambil sebagian daripada seluruh anggota populasi tersebut. Sebagian subjek penelitian
yang kita teliti (“tanyai”) langsung itu kita sebut sebagai sampel. Cara-cara bagaimana mengambil
sampel dari populasi penelitian disebut dengan sampling.
Pertanyaan yang sering muncul berkaitan dengan pengambilan sampel (sampling) itu adalah
mengenai seberapa besar (banyak) jumlah sampel (“sample size”) yang patut diambil agar hasil
penelitian yang dilakukan bisa diyakini benar. Apa makna bisa diyakini benar itu?
Pertama, karena tidak semua anggota populasi diteliti, diyakini benar itu artinya seberapa tinggi
hasil penelitian dari sampel itu taraf “kebisadipercayaannya” akan mencerminkan seluruh
anggota populasi. Maksudnya, data yang dihasilkan dari sampel itu benar-benar akan
relatif sama dengan data yang diperoleh jika penelitian dilakukan terhadap seluruh anggota
populasi. “Nyicipi” rasa sayur setengah sendok dari sepanci itu yakinkah akan sama persis
dengan jika “makan” seluruh sayur itu? Tentu tidak. Sebab ada kalanya tidak “galoh” (merata
rasanya di seluruh bagian).
Terjadinya hasil penelitian yang tidak bisa diyakini bahwa betul-betul benar itu akan diperbesar
apabila sampel yang diambil “terlampau kecil” berbanding jumlah keseluruhan anggota populasi.
Kedua, walau bagaimanapun, hasil penelitian itu tidak selalu bisa diharapkan betul-betul benar
(yakin 100% benar). Karena berbagai faktor, hasil penelitian itu dapat mengandung kesalahan
(error, galat/”ghalat”). Salah satu kesalahan itu terjadi karena ada yang “secara kebetulan benar.”
Murid yang sebenarnya “tidak tahu” bisa saja menjawab soal ujian “cekpoin” benar, karena
kebetulan memilih pilihan jawaban yang merupakan jawaban yang benar.
Kesalahan (error/galat) yang terjadi karena kebetulan itu lazim dilambangkan (direpresentasikan)
dengan “taraf signifikansi.” Jelasnya, taraf seberapa besar kemungkinan terjadinya kebenaran
karena kebetulan saja benar. Dalam bahasa lain seberapa besar taraf “toleransi” akan terjadinya
kesalahan karena faktor kebetulan benar.
Untuk ilmu kealaman taraf signifikansi itu disepakati para ahli (dalam berbagai literatur umumnya
menyatakan sama) yang “terbaik” sebesar 0,01. Maksudnya hanya ada 0,01 atau 1% saja
kesalahan karena kebetulan itu terjadi. Jadi, dengan kata lain, yakin sebesar 99% bahwa hasil
penelitian itu benar. Itu artinya, karena tetap berhati-hati, tidak ada yang “patut” diyakini 100%
benar.
Untuk ilmu-ilmu sosial disepakati yang “terbaik” itu sebesar 0,05 . Maksudnya hanya ada
0,05 atau 5% saja kesalahan karena kebetulan itu terjadi. Jadi, yakin 95% bahwa hasil penelitian
itu benar. Ini karena tingkat kepastian (keajegan) “orang-orang” (sosial) itu relatif tidak seajeg
seperti gejala kealaman. Dalam pengambilan sampel, kedua aspek tersebut di atas menjadi salah
satu perhatian utama. Jika hasil penelitian diharapkan mencapai taraf signifikansi tinggi (taraf
kesalahan karena faktor kebetulan kecil), maka jumlah sampel dituntut lebih banyak
dibandingkan harapan taraf signifikansi lebih rendah (banyak kesalahan yang disebabkan ada
yang “karena kebetulan benar” lebih besar).
Salah satu cara menentukan besaran sampel yang memenuhi hitungan itu adalah yang dirumuskan
oleh Slovin (Steph Ellen, eHow Blog, 2010; dengan rujukan Principles and Methods of Research;
Ariola et al. (eds.); 2006) sebagai berikut.
n = N/(1 + Ne^2)
n = Number of samples (jumlah sampel)
N = Total population (jumlah seluruh anggota populasi)
e = Error tolerance (toleransi terjadinya galat; taraf signifikansi; untuk sosial dan pendidikan
lazimnya 0,05) –> (^2 = pangkat dua)
Untuk menggunakan rumus tersebut, pertama-tama tetapkan terlebih dahulu taraf keyakinan atau
confidence level (…%) akan kebenaran hasil penelitian (yakin berapa persen?), atau taraf
signifikansi toleransi kesalahan (0,..) terjadi.
Misalnya kita ambil taraf keyakinan 95%, yaitu yakin bahwa 95% hasil penelitian benar, atau taraf
signifikansi 0,05 (hanya akan ada 5% saja kesalahan karena “kebetulan benar” terjadi).
Jika yang akan kita teliti itu sebanyak 1.000 orang karyawan, seperti dicontohkan di muka, dan
taraf signifikansinya 0,05, maka besarnya sampel menurut rumus Slovin ini akan menjadi:
n = N/(1 + Ne^2) = 1000/(1 + 1000 x 0,05 x 0,05) = 286 orang.
menggunakan rumus tersebut jika taraf keyakinan (kepercayaan) hanya 90% (taraf
signifikansi 0,10)
Berapa banyak sampel harus diambil? Jawabnya:
n = N/(1 + Ne^2) = 1000/(1 + 1000 x 0,10 x 0,10) = . . . orang.
Jumlah sampel yang terambil lebih kecil daripada taraf signifikansi 0,05 (taraf keyakinan 95%),
atau lebih besar?
Nah coba pula, agar tidak keliru t.s. 0,10 (taraf kepercayaan 90%) dengan t.s. 0,01 (taraf
kepercayaan 99%), hitung juga dengan populasi 1000 orang. Jadinya: