Anda di halaman 1dari 9

1

Analisis Diskriminan Pada Pasien Penyakit


Kanker Paru-Paru Oleh Bahan Karsinogenik di
RSUD Dr. Soetomo Surabaya
Gusde Melis, Dwi Mirsha Kristanti, Cicilia Ajeng Pratiwi, dan Bambang Widjanarko Otok
Departemen Statistika, Fakultas Matematika, Komputasi, dan Sains Data,
Institut Teknologi Sepuluh Nopember (ITS)
Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia
e-mail: bambang_wo@statistika.its.ac.id

Abstrak— Kanker paru-paru merupakan jenis kanker


e-mail: fisher, dimana variabel yang digunakan berupa usia perokok,
sprahayu@gmail.com
yang paling sering menyerang laki-laki yang berhubungan berat badan perokok dan tinggi badan perokok. Sebelum
dengan kebiasaan merokok terutama perokok aktif. Karena menganalisis diskriminan dan klasifikasi fisher terlebih dulu
dalam rokok mengandung zat karsinogenik yang memiliki sifat data akan diuji telah memenuhi asumsi atau tidak yaitu asumsi
mengandap dan merusak terutama pada organ paru-paru. Oleh
distribusi normal multivariat dan asumsi homogenitas [1].
karena itu pentingnya masalah penyakit kanker paru-paru,
maka perlu dilakukan analisis diskriminan terhadap pasien Analisis diskriminan adalah teknik statistik multivariat
penyakit kanker paru-paru oleh bahan karsinogenik yang terkait dengan pemisahan atau alokasi / klasifikasi
berdasarkan usia, berat badan, dan tinggi badan pasien perokok. sekelompok objek atau observasi ke dalam kelompok yang
Data yang digunakan pada penelitian ini adalah data sekunder telah terlebih dahulu didefinisikan. Diskriminan yang diambil
yang berasal dari Tugas Akhir Ni’matus Solikhah. Variabel adalah kasus yaitu case dan control. Setelah melakukan
penelitian yang digunakan yaitu variabel respon yang pengujian tersebut selanjutnya di analisis diskriminan dimana
dikategorikan menjadi dua dimana 0 sebagai pasien penyakit analisis diskriminan dilakukan untuk melihat perbedaan antara
kanker paru-paru dengan kelompok control dan 1 sebagai pasien
grup satu dan grup dua dimana grup yang dimaksud adalah
penyakit kanker paru-paru dengan kelompok case serta variabel
prediktornya adalah usia, berat badan, dan tinggi badan
yaitu case dan control untuk mengukur klasifikasi penderita
perokok. Hasil analisis menunjukkan bahwa data pasien dan yang bukan penderita kanker paru- paru yang disebabkan
penyakit kanker paru-paru oleh bahan karsinogenik memiliki oleh bahan karsinogenik.
rata-rata usia 46 tahun, rata-rata berat badan 54 kg, dan rata-
rata tinggi badan 161 cm serta data pasien penyakit kanker
paru-paru berdistribusi normal multivariat dan matriks varians II. TINJAUAN PUSTAKA
kovarians homogen. Kemudian berdasarkan hasil analisis
diskriminan model yang terbentuk dari fungsi diskriminan A. Karakteristik Data
kanonikal adalah Y  4 ,725  0 ,062 x1  0 ,066 x 2  0 ,025 x 3 Karakteristik data adalah metode-metode yang berkaitan
dengan ketepatan klasdifikasi data sebesar 74%. dengan pengumpulan dan penyajian suatu gugus data sehingga
memberikan informasi yang berguna tanpa menarik inferensia
Kata Kunci—Analisis Diskriminan, Kebiasaan Merokok, atau kesimpulan apapun tentang gugus data induknya yang
Penyakit Kanker Paru-Paru lebih besar, seperti penyusunan tabel, diagram, grafik, dan
besaran-besaran lain di majalah dan koran-koran. Karakteristik
I. PENDAHULUAN data meliputi mean, median, dan varians [2].
1. Mean

D ewasa ini kanker paru-paru adalah salah satu jenis kanker


yang paling bisa dicegah. Paling tidak terdapat 80-90
persen kasus kanker paru-paru yang berhubungan dengan
Mean (rata-rata) adalah teknik penjelasan kelompok yang
didasarkan atas nilai rata-rata dari kelompok tersebut.
Rata-Rata (mean) ini didapat dengan menjumlahkan data
kebiasaan merokok. Kanker paru-paru adalah jenis kanker seluruh individu dalam kelompok itu, kemudian dibagi
yang paling sering menyerang laki-laki Indonesia. Berdasarkan dengan jumlah individu yang ada pada kelompok tersebut
data Globocan atau International Agency for Research on [3].
Cancer (IARC) pada tahun 2012, di Indonesia terdapat 25.322 n
kasus kanker paru-paru yang menimpa pria. Orang yang paling  xi
i 1 (1)
berisiko terkena kanker paru-paru adalah perokok aktif, karena x
dalam rokok mengandung zat karsinogenik. Karsinogenik n
merupakan zat yang memiliki sifat mengendap dan merusak 2. Median
terutama pada organ paru-paru karena zat-zat yang terdapat Median adalah salah satu teknik penjelasan kelompok yang
pada rokok. Sehingga paru-paru menjadi berlubang dan didasarkan atas nilai tengah dari kelompok data yang telah
menyebabkan kanker. Oleh karena itu dilakukan penelitian disusun urutannya dari yang terkecil sampai yang terbesar,
terhadap pasien penyakit kanker paru-paru oleh bahan atau sebaliknya dari yang terbesar sampai yang terkecil [3].
karsinogenik menggunakan analisis diskriminan dan klasifikasi
2

Data ganjil : Me  x n 1 dilakukan untuk melihat apakah data distribusi normal


(2) multivariat atau tidak.
2
Hipotesis :
xn  xn
1
(3) H0 : Data berdistribusi normal nultivariat
Data genap : Me  2 2
H1 : Data tidak berdistribusi normal nultivariat
2
Daerah Penolakan : Tolak H0 jika rq<rp,a
3. Varians

  
Statistik Uji :
Varians adalah kuadrat standar deviasi yang mempunyai
n n n
perbedaan pada komponendasar, varians tanpa akar n  xi yi   xi  yi
kuadrat [3]. i 1 i 1 i 1
rq 

   
(6)
   
n 1 2 n n 2 n n 2
2 2 2
s   xi  x (4)  n  xi   xi  n  yi   yi 
n  1 i 1  i 1 i 1  i 1 i 1 
Keterangan:
B. Distribusi Normal Multivariat r = Koefisien Korelasi
Variabel X1,X2,...,Xp dikatakan berditribusi normal n = Jumlah Data
multivariat dengan parameter μ dan Ʃ jika mempunyai
probability density function : C. Uji Homogenitas Varians Kovarians
 ( X  μ )' 1 ( X  μ )
1
f ( X i , X 2 ,..., X p ) 
1
e 2
(5) Asumsi yang harus dipenuhi dalam analisis diskriminan
p/2 1/ 2
( 2 )  adalah kesamaan matriks kovariansi antar grup variabel
Jika X1,X2,.,Xpberdistribusi normal multivariat maka (X- dependen sehingga dapat dikatakan ada homogenitas data.
μ)'Ʃ-1(X-μ) berditribusi χp2. Berdasarkan sifat ini maka Namun jika variansi diantara anggota ditiap-tiap grup tidak
pemeriksaan distribusi multinormal dapat dilakukan dengan sama, dapat dikatakan bahwa terjadi heteroskedastisitas.
cara membuat q-q plot dari nilai di2=(Xi- x )'S-1(Xi- x ), Penyamarataan multivariat untuk homogenitas varians-
i=1,...,n [4]. kovarians setiap variabel dependen adalah homogenitas
Tahapan dari pembuatan q-q plot ini adalah sebagai matriks varians-kovarians. Asumsinya adalah matriks varians-
berikut. kovarians dalam setiap sel rancangannya adalah contoh dari
1. Menentukan nilai vektor rata-rata : x populasi matriks varians-kovarians yang sama. Jika tidak
2. Menentukan nilai matriks varians-kovarians : S homogen, kumpulan matriks adalah sesat atau tidak benar
3. Menentukan nilai jarak Mahalanobis setiap titik sebagai suatu estimasi kovariansdari varians error. Syarat ini
pengamatan dengan vektor rata-ratanya di2=(Xi- x )'S-1(Xi- akan jadi berbeda dari asumsi kesamaan kovarians yang
x ), i=1,...,n dibutuhkan oleh pengulangan pada varians analisis univariat.
4. Mengurutkan nilai di2dari kecil ke besar : d(1)2≤ d(2)2≤ Asumsi berikutnya, tidak dibutuhkan dalam multivariat analisis
d(3)2≤....≤d(n)2 varians, karena semua kovarians dalam kumpulan matriks
5. Tentukan nilai p  i  1 / 2 , i  1,..., n adalah equivalent. Pelanggaran dari homogenitas dari
i
n kovarians adalah dasar kebenaran untuk pengambilan
qi keputusan dalam multivariat analisis varians daripada
6. Tentukan nilai q i sedemikian hingga 2 2
 f (  ) d  pi
 pengulangan analisis varians. Pengujian homogenitas ini dapat
7. Buat scatter-plot di2 dengan qi menggunakan nilai Box’s M [4].
Hipotesis :
Pada Proporsi Square Distance menggunakan pemeriksaan
H0 :        (ragam dari semua perlakuan sama)
data berdistribusi multivariat normal jika prosentase di2≤ χ2p,0.5 1 2 k
mendekati 50%. H1 : minimal ada satu i   j
Pemeriksaan distribusi normal multivariat juga dapat
dilakukan secara visual dengan melihat pola sebaran data pada Statistik uji :
2  
C  1 u M

  
scatterplot antara nilai Square Distance ( d ) dengan nilai j


2 C  1  u   n l  1 ln S pooled  
  n l  1 ln S l (7)
j  0.05  . Apabila plot-plot data
q  j  0,5   n l l
c , p  p 
 n   n 
 Dimana,
pengamatan berada pada garis normal dan menyebar acak  1 1  2 p2  3 p  1 
u   (8)
  6 p  1g  1

  
maka bahwa dapat diputuskan data berdistribusi normal
multivariat, apabila tidak maka dapat dikatakan data tidak  l nl  1 l nl  1
n1  1S1  n 2  1S 2  ...  n g  1S g 
berdistribusi normal multivariat [4]. 1
S pooled 
 
Selain menggunakan kedua metode diatas pengujian (9)
distribusi multivariat biasa menggunakan uji korelasi untuk l n l  1
menguji tingkat signifikansi. Uji ini dilakukan dengan
mengkorelasikan antara nilai dj2 dengan nilai qc, p . Uji ini 2
Daerah penolakan: Tolak H0, jika C   p  p 1n 1 / 2 
3

n1 : ukuran sampel ke-l III. METODOLOGI PENELITIAN


Si : penduga tak bias
Spooled : penduga sampel matriks kovarians A. Sumber Data
p : banyaknya variabel respon yang diamati Data yang digunakan pada penelitian ini yaitu data
g : banyaknya matriks peragam yang diuji sekunder. Data diperoleh dari laporan tugas akhir dari
Ni’matus Solikhah dengan judul “Analisis Statistik Terhadap
D. Analisis Diskriminan Penyakit Kanker Paru Oleh Bahan Karsinogenik (Studi Kasus
Analisis diskriminan dan klasifikasi adalah teknik statistik Pasien Kanker Paru di RSUD Dr. Soetomo)”. Data diambil
multivariat yang terkait dengan pemisahan atau alokasi / pada hari Jumat, 20 April 2018 di Ruang Baca Statistika ITS.
klasifikasi sekelompok objek atau observasi ke dalam B. Variabel Penelitian
kelompok yang telah terlebih dahulu didefinisikan. Analisis Variabel yang digunakan dalam penelitian ini terdiri dari 3
diskriminan dengan pendekatan Fisher digunakan jika hanya variabel yaitu sebagai berikut.
terdapat dua populasi (π).Sebelum dilakukan pengalokasian, Tabel 1. Variabel Penelitian
terlebih dahulu menghitung S1, S2, Spooled, X 1 dan X 2 . Berikut Variabel Keterangan
langkah-langkah pengalokasian [4]. Pasien Kanker Paru-paru
1. Menghitung X 1 dan X 2 . dimana:
0 = Pasien Penyakit Kanker Paru-paru dengan
 X '11   X '21  Y
Kelompok Control
X'  X'  1 = Pasien Penyakit Kanker Paru-paru dengan
X 1   ...12  dan X 2   ...22  (10) Kelompok Case
X1 Usia Perokok
   
( n xp )
1
( n xp )
21

 X '1n1   X '2 n 2  X2 Berat Badan Perokok


2. Menghitung Spooled X3 Tinggi Badan Perokok

 n1  1   n2  1  C. Langkah Analisis
S pooled    S1    S 2 (11)
 ( n1  1)  ( n2  1)   ( n1  1)  ( n2  1)  Langkah analisis yang dilakukan dalam penelitian adalah
sebagai berikut.
1. Mengumpulkan data pasien penyakit kanker paru-paru
3. Menghitung ŷ j yang disebabkan oleh bahan karsinogenik.
 X1 
^
2. Menguji asumsi distribusi normal multivariat pada data
y  X X 2  S pooled
1
T

X dengan X  X 
(12) pasien penyakit kanker paru yang disebabkan oleh bahan
 2
1
j
~ ~
karsinogenik.
4. Menghitung m̂ 3. Menguji kehomogenan data pasien penyakit kanker paru

1 yang disebabkan oleh bahan karsinogenik dengan uji
m  2X  X 2  S pooled  X 1  X 2 
1
1
(13) homogenitas varians.
5. Pengalokasian 4. Melakukan analisis diskriminan data pasien penyakit
kanker paru yang disebabkan bahan karsinogenik.
Jika ŷ j ≥ m̂ maka masuk π1, jika ŷ j < m̂ maka masuk π2. 5. Mnginterpretasikan hasil analisis data.
E. Kanker Paru-Paru 6. Menarik kesimpulan dan saran.
Kanker paru-paru adalah salah satu jenis kanker yang
paling bisa dicegah. Paling tidak terdapat 80-90 persen kasus IV. ANALISIS DAN PEMBAHASAN
kanker paru-paru yang berhubungan dengan kebiasaan
merokok. Pada tahap awal, tidak ada tanda atau gejala kanker A. Statistika Deskriptif
paru-paru yang jelas. Merokok bisa dikatakan sebagai Tujuan dilakukan analisis statistika deskriptif adalah untuk
penyebab utama kanker paru-paru. Orang yang paling berisiko mengetahui karakteristik dari variabel yang diamati yaitu usia,
terkena kanker paru-paru adalah perokok aktif. Sekitar 80-90 berat, dan tinggi pada pasien penyakit kanker paru-paru di
persen kanker paru-paru dikaitkan dengan kebiasaan merokok. RSUD Dr. Soetomo Surabaya.
Meski begitu, bukan berarti setiap perokokan terkena kanker Tabel 2. Karakteristik Data
paru-paru. Selain itu, orang yang tidak merokok juga Kanker
Variabel Mean Varians Minimum Median Maksimum
berkemungkinan terserang kanker paru-paru, meski lebih Paru
rendah jumlahnya. Selain rokok, beberapa penyebab kanker 0 42,16 88,64 33 37 70
Usia
paru-paru lain adalah menghirup arsenik, radiasi, dan polusi 1 51,16 187,39 22 53 70
udara. Kanker paru-paru juga lebih umum terjadi pada orang 0 58,16 146,97 58 58 85
Berat
yang sudah lanjut usia [5]. 1 50,04 70,71 38 50 74
0 164,8 68,25 168 168 176
Tinggi
1 159,16 74,22 140 162 178
4

Tabel 2 menunjukkan bahwa penyakit kanker paru-paru paru di RSUD Dr. Soetomo Surabaya memenuhi asumsi
kelompok control (0) dan case (1) memiliki rata-rata yang distribusi normal multivariat.
rendah pada variabel usia dan berat badan yaitu 42 tahun dan 2. Uji Homogenitas Varians-Kovarians
50 kg dan dapat dikatakan bahwa 50% dari data tersebut diatas Pengujian homogenitas varians digunakan untuk
37 tahun dan 50 kg dengan interval mulai dari 33-70 tahun dan mengetahui matriks varians-kovarians telah homogen atau
38-74 kg serta keragaman data berturut-turut sebesar 88,64 tidak dari data pasien penyakit kanker paru-paru di RSUD Dr.
dan 70,71. Soetomo Surabaya.
Tabel 4. Hasil Uji Homogenitas Varians-Kovarians
B. Pengujian Asumsi Analisis Diskriminan
F df1 df2 F ;df 1,df 2 p-value
Terdapat dua asumsi pada analisis diskriminan yaitu
asumsi distribusi normal multivariat yang dapat dilihat dari 1,693 6 16693,132 2,099 0,118
proporsi, scatterplot, dan pengujian koefisien korelasi serta Tabel 4 menunjukkan bahwa nilai F sebesar 1,693 lebih
asumsi pengujian homogenitas varians kovarians. kecil dari Ftabel sebesar 2,099 dan p-value(0,118) lebih dari
1. Pemeriksaan dan Pengujian Normal Multivariat α(0,05) sehingga dapat diputuskan gagal tolak H0. Kesimpulan
Berikut adalah beberapa pemeriksaan yang dilakukan yang dapat diambil adalah matriks varians-kovarians homogen.
untuk mendeteksi data yang berdistribusi normal multivariat.
a. Proporsi Square Distance C. Analisis Diskriminan
Pemeriksaan proporsi square distance dilakukan untuk Analisis diskriminan digunakan untuk mengelompokkan
mengetahui apakah data pasien penyakit kanker paru-paru di observasi dimana variabel prediktornya merupakan data
RSUD Dr. Soetomo Surabaya merupakan data yang kuantitatif. Sebelum melakukan pengklasifikasian terlebih
berdistribusi normal multivariat dan hal tersebut dapat dilihat dahulu dilakukan uji serentak untuk mengetahui kemampuan
dari proporsi dj2. Setelah dilakukan pemeriksaan, diketahui variabel prediktor dalam membedakan variabel respon. Hasil
pengujiannya adalah sebagai berikut.
bahwa nilai dj2 yang kurang dari nilai  23,0.5 (2,366) adalah Tabel 5. Kemampuan Variabel Prediktor
sebanyak 22 data dan selanjutnya dapat dihitung nilai proporsi Test of Wilk’s Lambda Chi-square df P-value
1 0,041 0,535 0,286 0,001
dan didapatkan hasil sebesar 0,44. Hal ini dapat dikatakan
bahwa data pasien penyakit kanker paru-paru tidak Berdasarkan Tabel 5 dapat dilihat bahwa nilai p-value yang
diperoleh lebih kecil dari α (0,05). Ini berarti bahwa variabel
berdistribusi normal multivariat.
usia, berat badan, dan tinggi badan mampu membedakan
b. Plot Chi-Square secara signifikan kelompok pasien kanker paru-paru. Nilai
Berikut adalah pemeriksaan menggunakan scatterplot. Wilk’s Lambda sebesar 0,041 menjelaskan bahwa keragaman
8
yang tidak mampu dijelaskan oleh pasien kanker paru-paru
7
adalah 0,041. Selanjutnya dilakukan uji parsial untuk
6
mengetahui perbedaan mean masing-masing variabel antar
5
kelompok pasien kanker paru-paru. Hasil pengujiannya adalah
sebagai berikut.
dj2

4
Tabel 6. Perbedaan Rata-rata antar Kelompok
3
Wilk’s P-
2
Variabel F df1 df2
Lambda value
1 Usia 0,867 7,336 1 48 0,009
0 Berat Badan 0,864 7,572 1 48 0,008
0 2 4 6 8 10 12
chi-sq Tinggi Badan 0,896 5,582 1 48 0,022
Gambar 1. Scatterplot Berdasarkan Tabel 6 dapat dilihat bahwa nilai p-value
Gambar 1 menujukkan bahwa titik-titik merah berada variabel usia, berat badan, dan tinggi badan lebih kecil dari α
mengikuti garis linier sehingga dapat dikatakan bahwa data (0,05). Ini berarti bahwa terdapat perbedaan rata-rata pada
pasien penyakit kanker paru-paru di RSUD Dr. Soetomo usia, berat badan, dan tinggi badan antara kelompok control
dan case. Dimana besarnya pengaruh dari setiap variabel
Surabaya berdistribusi normal multivariat.
terhadap fungsi diskriminan yang terbentuk adalah sebagai
c. Pengujian Normal Multivariat
berikut.
Berikut adalah pengujian pada data pasien penyakit kanker Tabel 7. Strukrur Matrik
paru-paru di RSUD Dr. Soetomo Surabaya untuk mengetahui Variabel Function
apakah data berdistribusi normal multivariat. Usia 0,627
Tabel 3. Hasil Uji Normal Multivariat Berat Badan -0,618
rQ Critical point Tinggi Badan 0,539
0,985 0,977 Berdasarkan Tabel 7 dapat dilihat bahwa usia merupakan
Tabel 3 menunjukkan bahwa nilai rQ sebesar 0,985 lebih variabel yang paling berpengaruh dalam penentuan fungsi
besar dari critical point sebesar 0,977 sehingga diperoleh diskriminan karena memiliki nilai paling tinggi yaitu sebesar
keputusan gagal tolak H0. Kesimpulan yang dapat diambil 0,627 dibandingkan variabel berat badan dan tinggi badan.
pada penelitian ini adalah data pasien penyakit kanker paru- Untuk melihat kebaikan dari fungsi diskriminan yang terbentuk
digunakan korelasi kanonikal dengan hasil sebagai berikut.
5

Tabel 8. Keragaman Pasien Kanker Paru-paru Tabel 11 menunjukkan koefiisen fungsi atau model
Canonical diskriminan dari masing-masing kelompok pasien penderita
Eigen % of Cumulative
Function Correlation (CC)2
Value Variance %
(CC) kanker paru-paru. Model untuk pasien kanker paru-paru
1 0,041 100,0 100,0 0,535 0,286 kelompok control adalah sebagai berikut.
Berdasarkan Tabel 8 dapat dilihat nilai kuadrat dari Y1  0,540  0,348 x1  2,545 x 2  2111 ,657 x 3
korelasi kanonikal adalah 0,286. Ini berarti bahwa model Model untuk pasien kanker paru-paru kelompok case adalah
diskriminan yang terbentuk dapat menjelaskan keragaman sebagai berikut.
pasien kanker paru-paru sebesar 28,6%. Y2  0,618  0,430 x1  2,514 x 2  205 ,761 x 3
Dalam mengklasifikasikan observasi pada analisis Untuk pengklasifikasian observasinya berdasarkan nilai Y1
diskriminan digunakan dua metode yaitu metode centroid dan dan Y2. Jika score diskriminant Y1 > Y2 maka observasi
metode Fisher. tersebut diklasifikasikan ke dalam control dan sebaliknya.
1. Metode Centroid Berikut merupakan hasil pengklasifikan observasi
Berikut ini merupakan fungsi dari diskriminan kanonikal menggunakan metode Fisher.
metode centroid. Tabel 11. Ketepatan Klasifikasi Metode Fisher
Tabel 8. Koefisien Fungsi Diskriminan Kanonikal Predicted Group
Variabel Function Pasien Penderita
Membership Total
Constant -4,725 Kanker Paru-paru
0 1
Usia -0,062 0 19 6 25
Berat Badan 0,066 Original
1 7 18 25
Tinggi Badan 0,025
Berdasarkan Tabel 11 dapat diketahui bahwa hasil
Berdasarkan Tabel 8 persamaan dari fungsi diskriminan
klasifikasi dengan menggunakan metode Fisher sama dengan
dengan metode centroid adalah sebagai berikut.
metode centroid. Sehingga nilai APER yang diperoleh adalah
Y  4,725  0,062 x1  0,066 x 2  0 ,025 x 3
26% dan ketepatan akurasi sebesar 74%. Ini berarti bahwa
Untuk mengklasifikasikan observasi pada metode centroid kesalahan dalam pengklasifikasian data sebesar 26% dan
terlebih dahulu dihitung m̂ centroid. Hasilnya adalah sebagai ketepatan seluruh data diklasifikasikan sebesar 74%.
berikut..
Tabel 9. Fungsi pada Metode Centroid V. KESIMPULAN DAN SARAN
Variabel Function m̂ centroid
Control 0,620 Berdasarkan analisis dan pembahasan diatas dapat
0 diperoleh kesimpulan sebagai berikut.
Case -0,620
Berdasarkan Tabel 9 terlihat bawa nilai m̂ centroid adalah Berdasarkan analisis dan pembahasan diatas dapat diperoleh
0. Apabila nilai score discriminant yang diperoleh dari fungsi kesimpulan sebagai berikut.
diskriminan > 0, maka akan diklasifikan ke kategori 0 yaitu 1. Penyakit kanker paru-paru kelompok control (0) dan case
kelompok pasien penderita kanker control, sebaliknya jika (1) memiliki rata-rata yang rendah pada variabel usia dan
nilai score discriminant yang diperoleh dari fungsi diskriminan berat badan yaitu 42 tahun dan 50 kg.
< 0, maka akan diklasifikan ke kategori 1 yaitu kelompok 2. Data pasien penyakit kanker paru-paru berdistribusi normal
pasien penderita kanker case. Berikut merupakan hasil multivariat dan matriks varians kovarians homogen.
klasifikasinya. 3. Hasil analisis diskriminan adalah sebagai berikut.
Tabel 10. Ketepatan Klasifikasi Metode Centroid a. Variabel usia, berat badan, dan tinggi badan mampu
Predicted Group membedakan secara signifikan kelompok pasien kanker
Pasien Penderita
Membership Total paru-paru.
Kanker Paru-paru
0 1 b. Terdapat perbedaan rata-rata pada usia, berat badan,
0 19 6 25 dan tinggi badan antara kelompok control dan case.
Original
1 7 18 25 c. Usia merupakan variabel yang paling berpengaruh
Berdasarkan Tabel 10 dihitung ketepatan klasifikasi yang dalam penentuan fungsi diskriminan dibandingkan berat
dihasilkan dimana nilai APER yang diperoleh merujuk pada badan dan tinggi badan.
Lampiran 11 adalah 26% dan ketepatan akurasi sebesar 74%. d. Model diskriminan yang terbentuk dapat menjelaskan
Ini berarti bahwa kesalahan dalam pengklasifikasian data keragaman pasien kanker paru-paru sebesar 28,6%.
sebesar 26% dan ketepatan seluruh data diklasifikasikan e. Pada metode centroid fungsi diskriminannya adalah
sebesar 74%. Y  4,725  0,062 x1  0,066 x 2  0 ,025 x 3 dan ketepatan
2. Metode Fisher
klasifikasi data sebesar 74%.
Berikut ini merupakan koefisen fungsi diskriminan
f. Pada metode fisher fungsi diskriminannya adalah
berdasarkan metode Fisher.
Tabel 11. Koefisien Fungsi Diskriminan dari Metode Fisher
Y1  0,540  0,348 x1  2,545 x 2  2111 ,657 x 3 kelompok
Function control dan Y2  0,618  0,430 x1  2,514 x 2  205 ,761 x 3
Variabel
Control Case kelompok case serta data tepat diklasifikasikan sebesar
Constant 0,540 0,618 74%.
Usia -,348 -,430
Berat Badan 2,545 2,514
Tinggi Badan -211,657 -205,761
6

Saran untuk penelitian ini diharapkan lebih teliti dalam


menentukan jenis data, harus menggunakan data kategorik
yang bisa digunakan untuk analisis diskriminan, begitu pula
dalam menginterpretasikan hasil harus tepat agar dapat
memberikan informasi yang jelas. Diharapkan data yang
digunakan telah memenuhi semua asumsi-asumi dalam
melakukan analisis diskriminan, yaitu asumsi distribusi
multinormal dan asumsi homogenitas varians.

DAFTAR PUSTAKA
[1] Amin, Z. (2010). Kanker Paru. Jakarta: Pusat Penerbitan
Departemen Ilmu Penyakit Dalam Fakultas Kedokteran
Universitas Indonesia.
[2] Walpole. (1993). Pengantar Metode Statistika edisi ke-3.
Jakarta: PT. Gramedia Pustaka Utama.
[3] Partino, Idrus. (2009). Statistika Deskriptif. Yogyakarta:
Safira Insana Pers.
[4] Johnson, R. A., & Winchern, D. W. (2007). Applied
Multivariat Statistical Analysis Sixth Edition. New Jersey:
Pearson Prentice Hall.
[5] Suprijono, Agus., dkk. (2007). Penyebab Terjadinya
Kanker Paru-Paru. Surakarta: EGC.
LAMPIRAN 1 24 55 178
Lampiran 1. Data Pasien Penyakit Kanker Paru-Paru di 1 62 40 155
RSUD Dr. Soetomo Surabaya 1 50 55 150
Penyakit Kanker Paru Usia Berat Tinggi 1 53 50 163
0 52 58 158 1 65 74 162
0 50 79 171 1 44 45 166
0 70 70 174 1 36 50 154
0 35 48 150 1 55 45 150
0 41 52 159 1 65 47 168
0 36 45 150 1 64 40 155
0 37 78 176
0 37 51 169 Lampiran 2. Karakteristik Data
0 37 60 170 Descriptive Statistics: Usia; Berat; Tinggi Kelompok 0
0 46 85 170
Variable Mean Variance Minimum Median Maximum
0 45 75 174 Usia 42,16 88,64 33,00 37,00 70,00
Berat 58,16 146,97 40,00 58,00 85,00
0 54 70 161 Tinggi 164,80 68,25 150,00 168,00 176,00
0 34 48 170
0 37 50 165 Descriptive Statistics: Usia; Berat; Tinggi Kelompok 1
0 46 62 175 Variable Mean Variance Minimum Median Maximum
Usia 51,16 187,39 22,00 53,00 70,00
0 45 40 163 Bera 50,04 70,71 38,00 50,00 74,00
0 54 60 150 Tinggi 159,16 74,22 140,00 162,00 178,00
0 34 46 157
0 37 55 164 Lampiran 3. Output Pengujian Normal Multivariat
Data Display
0 35 60 171
0 35 48 152 Matrix MCova
0 56 49 162 155,862 4,749 -22,2314
0 34 60 171 4,749 123,439 43,6755
-22,231 43,676 77,8976
0 33 45 170
Data Display
0 34 60 168
1 70 48 163 dj2
0,650472 5,064900 7,028932 3,420261
1 44 45 163 0,398547 3,174142 5,610382
1 27 41 163 1,415326 1,241400 7,930965 3,884525
2,867186 2,456821 0,870453
1 48 38 150 2,239286 2,198383 3,471508 1,784685
1 53 51 163 0,611046 1,633359 2,700416
0,978944 1,766203 3,247529 1,413680
1 58 43 165 4,658010 0,961945 3,872575
2,733541 0,510316 3,191714 2,047742
1 55 50 150 4,216387 0,798460 4,186966
1 44 70 157 3,316349 3,756321 1,932439 6,513007
4,497691 5,854014 3,234355
1 54 52 165 2,442208 0,612108 5,509896 1,511702
1,972762 2,094109 4,841604
1 22 52 169
3,674425
1 40 55 150
Data Display
1 64 55 170
1 64 55 160 Prop 0,440000
1 48 45 140 Correlations: dj2; qc
1 70 50 150
Pearson correlation of dj2 and qc = 0,985
Lampiran 4. Output Pengujian Homogenitas Varians Lampiran 10. Fungsi pada Metode Centroid
Functions at Group Centroids
Test Results
Penyakit Kanker Paru-paru Function
Box's M 10.898 1
F Approx. 1.693 0 ,620
1 -,620
df1 6 Unstandardized canonical discriminant
functions evaluated at group means
df2 16693.132

Sig. .118 Lampiran 11. Hasil Klasifikasi Metode Centroid


Classification Resultsa
Lampiran 5. Kemampuan Variabel Prediktor Penyakit Predicted Group Total
Wilks' Lambda Kanker Paru- Membership
paru 0 1
Test of Wilks' Chi- df Sig.
Function(s) Lambda square 0 19 6 25
Count
1 ,714 15,672 3 ,001 1 7 18 25
Original
0 76,0 24,0 100,0
%
Lampiran 6. Perbedaan Signifikan antar Kelompok 1 28,0 72,0 100,0
Tests of Equality of Group Means a. 74,0% of original grouped cases correctly classified.
Wilks' F df1 df2 Sig. 67
Aper  x100%  26%
Lambda 50
Umur ,867 7,336 1 48 ,009
Berat ,864 7,572 1 48 ,008 Akurasi  (1  aper ) x100%  (1  0, 26) x100%  74%
Tinggi ,896 5,582 1 48 ,022
Lampiran 12. Koefisien Fungsi Diskriminan dari Metode
Lampiran 7. Strukrur Matrik Fisher
Structure Matrix Classification Function Coefficients
Function Penyakit Kanker Paru-paru
1 0 1
Berat ,627 Umur ,540 ,618
Umur -,618 Berat -,348 -,430
Tinggi ,539 Tinggi 2,545 2,514
Pooled within-groups correlations between discriminating (Constant) -211,657 -205,761
variables and standardized canonical discriminant functions Fisher's linear discriminant functions
Variables ordered by absolute size of correlation within
function. Lampiran 13. Ketepatan Klasifikasi Metode Fisher
Predicted Group
Pasien Penderita
Lampiran 8. Keragaman Pasien Kanker Paru-paru Membership Total
Kanker Paru-paru
Eigenvalues 0 1
Function Eigenvalue % of Cumulative Canonical 0 19 6 25
Original
Variance % Correlation 1 7 18 25
1 ,401a 100,0 100,0 ,535 67
Aper  x100%  26%
a. First 1 canonical discriminant functions were used in the 50
analysis.
Akurasi  (1  aper ) x100%  (1  0, 26) x100%  74%
Lampiran 9. Koefisien Fungsi Diskriminan Kanonikal
Canonical Discriminant Function Coefficients
Function
1
Umur -,062
Berat ,066
Tinggi ,025
(Constant) -4,752
Unstandardized coefficients
Lampiran 14. Hasil Pengklasifikasian Observasi dengan Lampiran 15. Hasil Pengklasifikasian Observasi dengan
Metode Centroid Metode Fisher
Obs Dis_1 Dis1_1 Obs Dis_1 Dis1_1 Obs Dis1_2 Dis2_2 Kel Obs Dis1_2 Dis2_2 Kel
1 1 -0,1744 26 1 -1,83261 1 0,47135 0,52865 1 26 0,05227 0,94773 1
2 0 1,66862 27 1 -0,41156 2 0,84786 0,15214 0 27 0,39009 0,60991 1
3 1 -0,09824 28 0 0,38252 3 0,49682 0,50318 1 28 0,64083 0,35917 0
4 0 0,0209 29 1 -1,45158 4 0,53552 0,46448 0 29 0,10311 0,89689 1
5 0 0,13852 30 1 -0,57472 5 0,57198 0,42802 0 30 0,33443 0,66557 1
6 1 -0,24018 31 1 -1,36597 6 0,44901 0,55099 1 31 0,11858 0,88142 1
7 0 2,53804 32 1 -1,0926 7 0,893 0,107 0 32 0,17902 0,82098 1
8 0 0,57302 33 0 1,09393 8 0,68749 0,31251 0 33 0,78395 0,21605 0
9 0 1,19449 34 1 -0,52046 9 0,7979 0,2021 0 34 0,35278 0,64722 1
10 0 2,29021 35 0 1,57378 10 0,8846 0,1154 0 35 0,8397 0,1603 0
11 0 1,79056 36 0 0,17319 11 0,85721 0,14279 0 36 0,58235 0,41765 0
12 0 0,57155 37 1 -0,81892 12 0,68716 0,31284 0 37 0,25563 0,74437 1
13 0 0,5863 38 1 -1,07047 13 0,69051 0,30949 0 38 0,18464 0,81536 1
14 0 0,40614 39 1 -1,23934 14 0,64696 0,35304 0 39 0,14448 0,85552 1
15 0 0,89207 40 1 -2,02711 15 0,75166 0,24834 0 40 0,03576 0,96424 1
16 1 -0,80515 41 0 1,87435 16 0,25985 0,74015 1 41 0,86296 0,13704 0
17 1 -0,36773 42 1 -2,0655 17 0,40519 0,59481 1 42 0,0331 0,9669 1
18 0 0,12677 43 1 -0,44981 18 0,56843 0,43157 0 43 0,37694 0,62306 1
19 0 0,71227 44 1 -0,64098 19 0,7176 0,2824 0 44 0,31234 0,68766 1
20 0 1,34424 45 0 0,17643 20 0,81631 0,18369 0 45 0,58331 0,41669 0
21 0 0,07121 46 1 -0,3361 21 0,55135 0,44865 0 46 0,41609 0,58391 1
22 1 -0,9193 47 0 0,19173 22 0,22583 0,77417 1 47 0,58782 0,41218 0
23 0 1,40654 48 1 -1,42389 23 0,82321 0,17679 0 48 0,10794 0,89206 1
24 0 0,44983 49 1 -1,46158 24 0,65805 0,34195 0 49 0,1014 0,8986 1
25 0 1,33108 50 1 -2,1901 25 0,8148 0,1852 0 50 0,02562 0,97438 1

Anda mungkin juga menyukai