Anda di halaman 1dari 4

DATA KATEGORIK

Data Kategorik adalah semua data dengan bentuk akhir (Final Data) berupa data non-
numerik, tetapi berupa kategori, level, pernyataan, symbol, penamaan, dll. Contoh jenis
kelamin (L atau P), tempaty tinggal/region (Urban, Rural), tingkat pendidikan (SD, SMP,
SLTA, PT), respon konsumen pada produk (Puas, Cukup, Kurang puas), dll.

Analisis data kategorik dapat dilakukan, bilamana kita mencoba membuat analisa, ada
keterkaiatan satu faktor/variabel kategorik dengan faktor lain. Seperti adanya keterkaitan
antara perbedaan jenis kelamin dengan tingkat pendidikan, atau tempat tinggal, atau
kesenangan berpolitik, atau mengkonsumsi bakso, dll.

Pada saat sudah akan ditetapkan faktor/variabel yang diteliti dan dicoba akan dianalisis, maka
deskripsikan data faktor/variabel itu dalam tabel kontingensi (Crosstab) sehingga tampak
persilangan natar kategori/level dari semua faktor yang dilibatkan untuk dianalisis.

Analisis Data Kategorik

Ada beberapa pendekatan atau metode analisis yang dimaksud disini. Yaitu :

1. Analisis Asosiasi

Yaitu untuk melihat adanya perbedaan, sehingga dikatakan adanya hubungan antar
faktor/variabel yang diteliti). Untuk analisis ini digunakan ukuran selisih proporsi pada faktor
utama untuk perbedaan level/kategori. Seperti perbedaan proporsi atau persentase dari laki-
laki dan perempuan, yang menyenangi punya banyak anak.

2. Analisis Perbandingan (Ratio Prevalensi)

Yaitu ukuran yang dapat dipakai dalam analisisata kategorik untuk melihat perbandingan dari
adanya perbedaan dalam level/kategori faktor utama. Seperti, kita ingin tahu berapa kali lebih
banyak/lebih sedikit antara mahasiswa dan mahasiswi yang bolos kuliah. Atau berapa
perbandingan mahasiswa yang lulus Statistika Non-parametrik dibandingkan mahasiswi.

3. Analisis Kecenderungan (Odds Value)

Yaitu ukuran yang dipakai untuk ,elihat kecenderungan dari setiap kategori/level pada faktor
utama, dengan perbedaan kategori faktor lain (Faktor kedua, ketiga, atau ke-k ; yang Unt
kemudian disebut faktor/variabel Tujuan) Untuk itu juga diperbandingkan milai proporsi
katgori tertentpada faktor utama, untuk perbedaan level/kategori faktor tujuan.
Analisis data kategorik untuk peubah ganda (Multivariate) diawali dengan tabel kontingensi.
Perhitungan persentase kolom, baris, atau persentase total akan mempermudah interpretasi
hasil analisis. Persentase kategorik menunujukkan kecenderungan masing-masing kategori
dalam satu peubah/variabel. Semakin tinggi persentase suatu kategori maka semakin tinggi
pula kecenderungan kategori tersebut sebagai ciri peubah yang bersangkutan. Dalam peubah
ganda, persentasi sel-sel dalam tabel kontingensi dapat secara langsung menunjukkan asosiasi
peubah-peubah yang menyusun tabel tersebut. Peubah-peubah dalam suatu tabel kontingensi
dikatakan tidak berasosiasi atau saling bebas jika sebaran persentasenya sama atau mendekati
sama di masing-masing kolom (pada persentase kolom). Sebaliknya jika sebaran persentase
tidak sama maka peubah-peubah berasosiasi dengan tingkat asosiasi tertentu (Agung, 2001).

Tabel Kontingensi merupakan tabel yang digunakan untuk mengukur hubungan (asosiasi)
antara dua variabel kategorik dimana tabel tersebut merangkum frekuensi bersama dari
observasi pada setiap kategori variabel. Misalkan n sampel diklasifikasikan secara silang
berdasarkan dua atribut dalam suatu tabel berukuran I x J, I merupakan kategori dari variabel
X dan J merupakan kategori dari variabel Y. Sell pada tabel mewakili kemungkinan IJ
muncul.

Bentuk sederhana dari tabel kontongensi adalah tabel kontingesi 2 x 2 dengan format:

Hipotesis yang diajukan adalah

H0 : Tidak ada hubungan antara variabel 1 dan variabel 2 atau variabel 1 dan variabel 2 saling
bebas (independen)
H1: Ada hubungan antara variabel 1 dan variabel 2 atau variabel 1 dan variabel 2 saling
berasosiasi
Tolak hipotesis nol(H0) jika nilai statistik uji diatas lebih besar dari nilai kritis distribusi chi-square
dengan derajat bebas (2-1)(2-1)=1 pada tingkat signifikansi alpha () tertentu yang berarti
terdapat hubungan antara variabel 1 dengan variabel 2.

Hipotesis nol(H0) ditolak jika nilai statistik uji diatas lebih besar dari nilai kritis distribusi chi-square
dengan derajat bebas (I-1)(J-1) pada tingkat signifikansi alpha () tertentu yang berarti terdapat
hubungan antara variabel 1 dengan variabel 2.

Kruskal-Wallis Test: C1 versus C2

2369 cases were used


1169 cases contained missing values
Kruskal-Wallis Test on C1

C2 N Median Ave Rank Z


1 497 5,000 1160,7 -0,89
2 209 5,000 1142,5 -0,94
3 216 5,000 1216,6 0,71
4 104 5,000 1163,4 -0,33
5 1199 5,000 1177,1 -0,57
6 144 6,000 1364,5 3,25
Overall 2369 1185,0

H = 12,08 DF = 5 P = 0,034
H = 12,29 DF = 5 P = 0,031 (adjusted for ties)

Kruskal-Wallis Test: C1 versus C3

2369 cases were used


1169 cases contained missing values

Kruskal-Wallis Test on C1

C3 N Median Ave Rank Z


1 372 5,000 1087,8 -2,99
2 1829 5,000 1209,4 3,20
3 139 5,000 1095,7 -1,59
4 27 7,000 1329,1 1,10
95 2 5,500 1196,0 0,02
Overall 2369 1185,0

H = 13,41 DF = 4 P = 0,009
H = 13,66 DF = 4 P = 0,008 (adjusted for ties)

* NOTE * One or more small samples

Anda mungkin juga menyukai