Seringkali kita meringkas atau menyajikan data dalam bentuk frekuensi. Lazimnya
hal ini dilakukan karena skala (pengukuran) data variabel yang diamati bersifat
kategorik, misalnya warna, agama, suku, bidang usaha, tingkat pendidikan, ukuran
(size) pakaian, peringkat kinerja/kualitas, dan sebagainya. Data frekuensi variabel
tunggal dianalisis dengan Tabel Frekuensi. Tabel ini meliputi jumlah (frekuensi) dan
distribusi frekuensi (persen) untuk setiap kategorinya.
Misalkan Y menyatakan respons setuju (1) atau tidak setuju (0) terhadap suatu
kebijakan ekonomi yang diajukan. Misalkan prediktor x menyatakan usia
dikelompokkan dalam dua kelompok usia: (0): 50-59, dan (1): 60-69. Diberikan data
tersebut pada Tabel 1 berikut:
Tabel 1
Data respons Y biner, X biner
Respon X Y Responden X Y
den
1 0 0 18 1 0
2 0 1 19 1 1
3 0 1 20 1 1
4 0 1 21 1 1
5 0 1 22 1 1
6 0 1 23 1 1
7 0 0 24 1 0
8 0 0 25 1 1
9 0 1 26 1 1
10 0 1 27 1 1
11 0 1
12 0 1
13 0 0
14 0 1
15 0 1
16 0 1
17 0 1
Tabel frekuensi untuk variabel X dan Y masing-masing adalah pada Tabel 2 dan
Tabel 3 di bawah ini. Tabel tersebut dapat diperoleh secara komputasi (misalnya
melalui program SPSS) atau dapat juga dihitung manual. Pada Tabel 2 terlihat
responden didominasi usia 50-59 (63%). Sementara itu pada Tabel 3 terlihat hanya
77% responden setuju kebijakan ekonomi yang diajukan. Tabel 2 dan 3 adalah contoh
output tabel frekuensi dari program SPSS.
Tabel 2: Tabel frekuensi X (usia responden)
Cumulative
X Frequency Percent Percent
Valid 0 17 63,0 63,0
1 10 37,0 100,0
Total 27 100,0
Cumulative
Y Frequency Percent Percent
Valid 0 6 22,2 22,2
1 21 77,8 100,0
Total 27 100,0
Penyajian data untuk dua variabel yang berpasangan juga dapat disajikan melalui
tabel frekuensi yang disebut Tabulasi Silang (crosstabulation). Tabel ini tetap
mengandung tabel-tabel frekuensi masing-masing variabel yaitu pada bagian kolom
total dan baris total. Hanya saja, analisis untuk crosstab ini lebih kompleks karena
kita ingin menguji apakah dua variabel tersebut menunjukkan adanya
hubungan/asosiasi atau tidak.
Perhatikan kembali kasus pada Contoh 1 dan data pada Tabel 1. Cosstab yang
dihasilkan disajikan pada Tabel 4, dan lebih detil pada Tabel 5. Perhatikan bahwa
kolom terkahir dan baris terakhir merupakan tabel-tabel frekuensi masing-masing
variabel Y dan X. Sedangkan pada sel-sel yang ditengah merupakan frekuensi
(distribusi) Y untuk suatu kategori X atau sebaliknya frekuensi (distribusi) X untuk
suatu kategori Y.
X
0 1 Total
Y 0 Count 4 2 6
% within Y 66,7% 33,3% 100,0%
% within X 23,5% 20,0% 22,2%
% of Total 14,8% 7,4% 22,2%
1 Count 13 8 21
% within Y 61,9% 38,1% 100,0%
% within X 76,5% 80,0% 77,8%
% of Total 48,1% 29,6% 77,8%
Total Count 17 10 27
% within Y 63,0% 37,0% 100,0%
% within X 100,0% 100,0% 100,0%
% of Total 63,0% 37,0% 100,0%
Jadi, distribusi (proporsi) usia tua-muda relatif sama antara mereka yang setuju
dengan yang tidak. Atau, juga, kelompok tua atau muda mempunyai perbandingan
sikap yang sama terhadap isu kebijakan ekonomi yang diajukan. Artinya, tidak ada
indikasi bagi mereka usia kelompok tua atau muda untuk cenderung progresif atau
apatis terhadap kebijakan ekonomi yang diajukan, tidak ada indikasi hubungan X
dengan Y.
Seandainya X dan Y tidak ada hubungan, bebas, maka frekuensi pada sel-sel tabulasi
silangnya dapat disusun sesuai dengan frekuensi masing-masing variabel (Tabel 2 dan
3). Frekuensi ini disebut frekuensi yang diharapkan. Frekuensi harapan untuk data
pada Tabel 4 adalah
X Total
0 1 0
Y 0 Count 4 2 6
Expected Count 3,8 2,2
1 Count 13 8 21
Expected Count 13,2 7,8
Total Count 17 10 27
Untuk data tabulasi silang (variabel I dan II yang bersifat kategorik), salah satu
metode yang digunakan untuk uji hipotesis ini adalah uji khi-kuadrat ( 2 ). Statistik
ujinya adalah:
f Eij
2
k
2 ij
[2]
i, j Eij
fij = frekuensi data pada sel-ij (baris ke-i dan kolom ke-j), i = 1, 2, ..., r., j = 1, 2, ..., c.
Eij = frekuensi yang diharapkan (seandainya tidak ada hubungan) pada sel-ij.
k = banyaknya sel = (r-1)(c-1).
Nilai 2 ini dibandingkan dengan nilan 2 tabel pada tingkat signifikansi α dan
derajat bebas k. Jika tabel maka tolak H0 dan dinyatakan bahwa ada hubungan
2 2
tabel
2
untuk α = 5% dan derajat bebas k=1 adalah 3.84. Jadi 2 tidak lebih besar dari
tabel
2
(tidak signifikan), maka kesimpulan: tidak cukup fakta untuk menyatakan X
berhubungan dengan Y.
Contoh 5: Koefisien kontingensi
2
C [3]
2 N
Nilai koefisien tersebut kecil, hal ini bisa dipahami karena memang hubungan X dan
Y tidak signifikan.
LATIHAN
Y x=1 x=0
Y=1 21 22 43
Y=0 6 51 57
27 73 100
2. Berikut ini adalah output SPSS untuk pasangan data frekuensi kategori tingkat
pendidikan dengan daya adaptasi dalam perkawinan dari 400 orang yang sudah
menikah. Berdasarkan output tersebut tentukan:
Cumulative
Frequency Percent Valid Percent Percent
Valid ST 232 58,0 58,0 58,0
SM 116 29,0 29,0 87,0
SD 52 13,0 13,0 100,0
Total 400 100,0 100,0
Daya adaptasi
Cumulative
Frequency Percent Valid Percent Percent
Valid Sangat Rendah 46 11,5 11,5 11,5
Rendah 67 16,8 16,8 28,3
Tinggi 111 27,8 27,8 56,0
Sangat Tinggi 176 44,0 44,0 100,0
Total 400 100,0 100,0
Crosstabs
Pendidikan * Daya adaptasi Crosstabulation
Count
Daya adaptasi
Sangat
Rendah Rendah Tinggi Sangat Tinggi Total
Pendidikan ST 18 29 70 115 232
SM 17 28 30 41 116
SD 11 10 11 20 52
Total 46 67 111 176 400
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 19,943a 6 ,003
Likelihood Ratio 19,319 6 ,004
Linear-by-Linear
13,620 1 ,000
Association
N of Valid Cases 400
a. 0 cells (,0%) have expected count less than 5. The
minimum expected count is 5,98.
Symmetric Measures
***