07-Analisis Frekuensi Kategori

Materi-7:
ANALISIS FREKUENSI KATEGORI
A. Analisis untuk Variabel Tunggal
Seringkali kita meringkas atau menyajikan data dalam bentuk frekuensi. Lazimnya
hal ini dilakukan karena skala (pengukuran) data variabel yang diamati bersifat
kategorik, misalnya warna, agama, suku, bidang usaha, tingkat pendidikan, ukuran
(size) pakaian, peringkat kinerja/kualitas, dan sebagainya. Data frekuensi variabel
tunggal dianalisis dengan Tabel Frekuensi. Tabel ini meliputi jumlah (frekuensi) dan
distribusi frekuensi (persen) untuk setiap kategorinya.
Contoh 1: Tabel Frekuensi
Misalkan Y menyatakan respons setuju (1) atau tidak setuju (0) terhadap suatu
kebijakan ekonomi yang diajukan. Misalkan prediktor x menyatakan usia
dikelompokkan dalam dua kelompok usia: (0): 50-59, dan (1): 60-69. Diberikan data
tersebut pada Tabel 1 berikut:
Tabel 1
Data respons Y biner, X biner
Respon X Y Responden X Y
den
1 0 0 18 1 0
2 0 1 19 1 1
3 0 1 20 1 1
4 0 1 21 1 1
5 0 1 22 1 1
6 0 1 23 1 1
7 0 0 24 1 0
8 0 0 25 1 1
9 0 1 26 1 1
10 0 1 27 1 1
11 0 1
12 0 1
13 0 0
14 0 1
15 0 1
16 0 1
17 0 1
Tabel frekuensi untuk variabel X dan Y masing-masing adalah pada Tabel 2 dan
Tabel 3 di bawah ini. Tabel tersebut dapat diperoleh secara komputasi (misalnya
melalui program SPSS) atau dapat juga dihitung manual. Pada Tabel 2 terlihat
responden didominasi usia 50-59 (63%). Sementara itu pada Tabel 3 terlihat hanya
77% responden setuju kebijakan ekonomi yang diajukan. Tabel 2 dan 3 adalah contoh
output tabel frekuensi dari program SPSS.
Tabel 2: Tabel frekuensi X (usia responden)
Cumulative
X Frequency Percent Percent
Valid 0 17 63,0 63,0
1 10 37,0 100,0
Total 27 100,0
Tabel 3: Tabel frekuensi Y (respon terhadap kebijakan ekonomi)
Cumulative
Y Frequency Percent Percent
Valid 0 6 22,2 22,2
1 21 77,8 100,0
Total 27 100,0
B. Tabel Frekuensi untuk Dua Variabel Berpasangan
Penyajian data untuk dua variabel yang berpasangan juga dapat disajikan melalui
tabel frekuensi yang disebut Tabulasi Silang (crosstabulation). Tabel ini tetap
mengandung tabel-tabel frekuensi masing-masing variabel yaitu pada bagian kolom
total dan baris total. Hanya saja, analisis untuk crosstab ini lebih kompleks karena
kita ingin menguji apakah dua variabel tersebut menunjukkan adanya
hubungan/asosiasi atau tidak.
Contoh 2: Tabel frekuensi tabulasi silang
Perhatikan kembali kasus pada Contoh 1 dan data pada Tabel 1. Cosstab yang
dihasilkan disajikan pada Tabel 4, dan lebih detil pada Tabel 5. Perhatikan bahwa
kolom terkahir dan baris terakhir merupakan tabel-tabel frekuensi masing-masing
variabel Y dan X. Sedangkan pada sel-sel yang ditengah merupakan frekuensi
(distribusi) Y untuk suatu kategori X atau sebaliknya frekuensi (distribusi) X untuk
suatu kategori Y.
Tabel 4 : Tabulasi-silang respons Y terhadap X

Y X=0 X=1 
Y=0 4 2 6
Y=1 13 8 21
 17 10 27
Tabel 5 : Distribusi Y * X Crosstabulation
X
0 1 Total
Y 0 Count 4 2 6
% within Y 66,7% 33,3% 100,0%
% within X 23,5% 20,0% 22,2%
% of Total 14,8% 7,4% 22,2%
1 Count 13 8 21
% within Y 61,9% 38,1% 100,0%
% within X 76,5% 80,0% 77,8%
% of Total 48,1% 29,6% 77,8%
Total Count 17 10 27
% within Y 63,0% 37,0% 100,0%
% within X 100,0% 100,0% 100,0%
% of Total 63,0% 37,0% 100,0%
Bisa diamati bahwa:

Pada Y=0 perbandingan usia muda: tua, X(0) : X(1), adalah 67 : 33 persen, sementara
pada Y=1 perbandingannya 62 : 38 persen. Atau, pada X=0 perbandingan Y(0) : Y(1)
adalah 24 : 76 persen, sementara pada X=1 perbandingannya 20 : 80 persen.
Jadi, distribusi (proporsi) usia tua-muda relatif sama antara mereka yang setuju
dengan yang tidak. Atau, juga, kelompok tua atau muda mempunyai perbandingan
sikap yang sama terhadap isu kebijakan ekonomi yang diajukan. Artinya, tidak ada
indikasi bagi mereka usia kelompok tua atau muda untuk cenderung progresif atau
apatis terhadap kebijakan ekonomi yang diajukan, tidak ada indikasi hubungan X
dengan Y.
Contoh 3. Frekuensi yang diharapkan
Seandainya X dan Y tidak ada hubungan, bebas, maka frekuensi pada sel-sel tabulasi
silangnya dapat disusun sesuai dengan frekuensi masing-masing variabel (Tabel 2 dan
3). Frekuensi ini disebut frekuensi yang diharapkan. Frekuensi harapan untuk data
pada Tabel 4 adalah
Tabel 6: Frekuensi Observasi dan Frekuensi Diharapkan
X Total
0 1 0
Y 0 Count 4 2 6
Expected Count 3,8 2,2
1 Count 13 8 21
Expected Count 13,2 7,8
Total Count 17 10 27
Terlihat nilai-nilai frekuensi observasi dengan frekuensi yang diharapkan tidak

berbeda jauh, menunjukkan tidak ada indikasi hubungan X dengan Y.
Frekuensi yang diharapkan untuk sel-ij dihitung sebagai
total kolom ke-i x total baris ke-j

Eij  [1]
N
17 x 6
Misalnya untuk sel Y=0, X=0,  E00   3.8 . Dst.
27
C. Analisis Hubungan dan Uji statistik data Tabulasi Silang
Apakah X dan Y berhubungan? Signifikansi hubungan dua variabel berpasangan

dalam analisis cosstab dapat diuji secara statistik. Hipotesis hubungan tersebut dapat
disusun sebagai berikut:
H0 : Tidak ada hubungan antara variabel I dengan variabel II

H1 : Ada hubungan
Untuk data tabulasi silang (variabel I dan II yang bersifat kategorik), salah satu
metode yang digunakan untuk uji hipotesis ini adalah uji khi-kuadrat (  2 ). Statistik
ujinya adalah:
f  Eij 
2
k
 
2 ij
[2]
i, j Eij
fij = frekuensi data pada sel-ij (baris ke-i dan kolom ke-j), i = 1, 2, ..., r., j = 1, 2, ..., c.
Eij = frekuensi yang diharapkan (seandainya tidak ada hubungan) pada sel-ij.
k = banyaknya sel = (r-1)(c-1).
Nilai  2 ini dibandingkan dengan nilan  2 tabel pada tingkat signifikansi α dan
derajat bebas k. Jika    tabel maka tolak H0 dan dinyatakan bahwa ada hubungan
2 2
variabel I dengan variabel II.
Contoh 4: Uji  2 cosstabulation 2x2

Untuk data pada Tabel 4, dihitung
(4  3.8) 2 (2  2.2) 2 (13  13.2) 2 (8  7.8) 2

2      0.045
3.8 2.2 13.2 7.8
 tabel
2
untuk α = 5% dan derajat bebas k=1 adalah 3.84. Jadi  2 tidak lebih besar dari
 tabel
2
(tidak signifikan), maka kesimpulan: tidak cukup fakta untuk menyatakan X
berhubungan dengan Y.
Contoh 5: Koefisien kontingensi
Derajat hubungan X dan Y disebut koefisien kontingensi yang dihitung sebagai

berikut
2
C [3]
2  N
Untuk kasus ini adalah

0.045
C  0.041
0.045  27
Nilai koefisien tersebut kecil, hal ini bisa dipahami karena memang hubungan X dan
Y tidak signifikan.
LATIHAN
1. Misal respons Y = 1 menyatakan menderita kanker paru-paru dan Y = 0

menyatakan tidak menderita kanker paru-paru, dan X = 1 menyatakan merokok, dan
X = 0 menyatakan tidak merokok. Tabel 7 memperlihatkan tabulasi silang antara
respons Y dengan prediktor X.
Tabel 7
Tabulasi silang antara respons Y dan dengan prediktor X
Y x=1 x=0 
Y=1 21 22 43
Y=0 6 51 57
 27 73 100
Analisis apakah ada hubungan antara X dan Y, hitung koefisien kontingensi!
2. Berikut ini adalah output SPSS untuk pasangan data frekuensi kategori tingkat
pendidikan dengan daya adaptasi dalam perkawinan dari 400 orang yang sudah
menikah. Berdasarkan output tersebut tentukan:
(a) Proporsi tingkat pendidikan yang dominan

(b) Proporsi daya adaptasi yang berhasil (tinggi dan sangat tinggi)
(c) Apakah daya adaptasi dipengaruhi (berhubungan) dengan tingkat pendidikan
(d) Derajat asosiasinya
Frequency Table
Pendidikan
Cumulative
Frequency Percent Valid Percent Percent
Valid ST 232 58,0 58,0 58,0
SM 116 29,0 29,0 87,0
SD 52 13,0 13,0 100,0
Total 400 100,0 100,0
Daya adaptasi
Cumulative
Frequency Percent Valid Percent Percent
Valid Sangat Rendah 46 11,5 11,5 11,5
Rendah 67 16,8 16,8 28,3
Tinggi 111 27,8 27,8 56,0
Sangat Tinggi 176 44,0 44,0 100,0
Total 400 100,0 100,0
Crosstabs
Pendidikan * Daya adaptasi Crosstabulation
Count
Daya adaptasi
Sangat
Rendah Rendah Tinggi Sangat Tinggi Total
Pendidikan ST 18 29 70 115 232
SM 17 28 30 41 116
SD 11 10 11 20 52
Total 46 67 111 176 400
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 19,943a 6 ,003
Likelihood Ratio 19,319 6 ,004
Linear-by-Linear
13,620 1 ,000
Association
N of Valid Cases 400
a. 0 cells (,0%) have expected count less than 5. The
minimum expected count is 5,98.
Symmetric Measures
Value Approx. Sig.

Nominal by Nominal Contingency Coefficient ,218 ,003
N of Valid Cases 400
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
***

07-Analisis Frekuensi Kategori

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

07-Analisis Frekuensi Kategori

Diunggah oleh

Hak Cipta:

Format Tersedia

Materi-7:

ANALISIS FREKUENSI KATEGORI

A. Analisis untuk Variabel Tunggal

Contoh 1: Tabel Frekuensi

Tabel 3: Tabel frekuensi Y (respon terhadap kebijakan ekonomi)

B. Tabel Frekuensi untuk Dua Variabel Berpasangan

Contoh 2: Tabel frekuensi tabulasi silang

Tabel 4 : Tabulasi-silang respons Y terhadap X

Bisa diamati bahwa:

Contoh 3. Frekuensi yang diharapkan

Tabel 6: Frekuensi Observasi dan Frekuensi Diharapkan

Terlihat nilai-nilai frekuensi observasi dengan frekuensi yang diharapkan tidak

total kolom ke-i x total baris ke-j

C. Analisis Hubungan dan Uji statistik data Tabulasi Silang

Apakah X dan Y berhubungan? Signifikansi hubungan dua variabel berpasangan

H0 : Tidak ada hubungan antara variabel I dengan variabel II

variabel I dengan variabel II.

Contoh 4: Uji  2 cosstabulation 2x2

(4  3.8) 2 (2  2.2) 2 (13  13.2) 2 (8  7.8) 2

Derajat hubungan X dan Y disebut koefisien kontingensi yang dihitung sebagai

Untuk kasus ini adalah

1. Misal respons Y = 1 menyatakan menderita kanker paru-paru dan Y = 0

Analisis apakah ada hubungan antara X dan Y, hitung koefisien kontingensi!

(a) Proporsi tingkat pendidikan yang dominan

Value Approx. Sig.

Anda mungkin juga menyukai