Anda di halaman 1dari 12

JURNAL SAINS DAN SENI ITS Vol. 4, No.

1, (2015) 2337-3520 (2301-928X Print) 1

Analisis Diskriminan pada Faktor-Faktor yang


Mengindikasi Seseorang Merokok
Lidwina Galuh Wandira(10611910000023), Nuzul Widiawati(10611910000040), Fifi Dwi Haryanti,
Ir.Sri Pingit Wulandari, M.Si, Mike Prastuti, S.Si., M.Si.
Statistika Bisnis, Fakultas Vokasi, Institut Teknologi Sepuluh Nopember (ITS)
Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia
e-mail: lidwina.galuh.wandira@gmail.com
Abstrak—Merokok adalah sebuah kata kerja yaitu berdasarkan beberapa variabel. Sebelum masuk pada analisis
menikmati rokok dengan cara menghisap. Rokok sendiri diskriminan data harus memenuhi beberapa asumsi. Asumsi
merupakan gelintingan kertas yang berisi daun daun yang pertama adalah asumsi normalitas dimana residual data
tembakau yang telah dicacah. Didalam sebatang rokok harus berdistribusi normal[6]. Asumsi selanjutnya yaitu
terdapat banyak zat yang dapat mengganggu kesehatan. asumsi homogenitas varians kovarians serta asumsi
Beberapa faktor – faktor yang dapat mengindikasi sesorang multikolinearitas.
merokok antara lain kadar hemoglobin, kadar trigleserida, Praktikum ini bertujuan untuk mendeskripsikan
serta kadar kolesterol. Pada praktikum ini akan digunakan karakteristik dta, pemenuhan asumsi, serta variabel yang
signifikan sehingga dapat membentuk model diskriminan
metode analisis diskriminan pada faktor – faktor yang
yang sesuai pada faktor – faktor yang mengindikasi
mengindikasi seseorang merokok. Analisis diskriminan
seseorang merokok.
adalah metode untuk mengetahui dasar pengelompokan
individu berdasarkan lebih dari satu variabel. Hasil dari
analisis menunjukkan bahwa kegaraman data variabel II.TINJAUAN PUSTAKA
hemoglobin dan trigliserida cukup besar dan pada kolesterol
kecil. Analisis cluster hierarki membentuk paling optimum A. Statistika Deskriptif
sebanyak 2 cluster karena memiliki nilai F-pseudo Statistika deskriptif adalah bagian statistika mengenai
maksimum. Analisis cluster non hierarki dengan jumlah pengumpulan data, penyajian, penentuan nilai-nilai statistika,
kelompok yang diingankan diketahui pada cluster hierarki. pembuatan diagramatau gambar mengenai sesuatu hal, disini
Kata Kunci—Analisis Diskriminan, Merokok, Hemoglobin, data yang disajikan dalam bentuk yang lebih mudah
Kolesterol, Trigleserida. dipahami atau dibaca. Statistika deskriptif merupakan
metode-metode yang berkait dengan pengumpulan dan
penyajian sekumpulan data, sehingga dapat memberikan

M
informasi yang berguna. Perlu kiranya dimengerti bahwa
statistika deskriptif memberikan informasi hanya mengenai
I. PENDAHULUAN data yang dipunyai dan sama sekali tidak menarik
kesimpulan yang lebih banyak dan lebih jauh dari data yang
erokok adalah kegiatan menikmati rokok dengan cara ada [1].
menghisap. Rokok terbuat dari tembakau yang sudah dicecah 1. Mean
dan didelinting dalam kertas jenis tertentu. Merokok sendiri Rata-rata adalah suatu ukuran pemusatan data bila data itu
banyak memnyebabkan gangguan kesehatan, terutama pada diurutkan dari yang terkecil sampai yang terbesar atau
pernafasan. Merokok tidak hanya berdampak negatif pada sebaliknya [2]. Rumus untuk menghitung rata-rata sampel
pengguna namun memiliki dampak yang lebih negatif pada dan populasi adalah adalah sebagai berikut.
orang sekitar seng menghisap asap rokok tersebut[7].
Meskipun merokok memiliki banyak dampak negative bagi (1)
Kesehatan, menurut penrokok sendiri alas an merokok adalah
menghilangkan stress, emansipasi, dan juga menurunkan
berat badan. Faktor – faktor yang dapat mengindikasi (2)
seseorang merokok antara lain kadar hemoglobin, kadar
trigleserida, kadar kolesterol, dan lain sebagainya. Untuk Keterangan :
mengetahui apakah faktor – faktor tersebut benar : Rata-rata sampel
dapatmengindikasi seseorang merokok maka pada praktikum
ini digunakan analisis diskriminan. : Rata-rata populasi
Analisis diskriminan adalah metode untuk mencari dasar n : Banyaknya sampel
pengelompokan individu berdasarkan lebih dari satu variabel N : Banyaknya populasi
bebas. Analisis tersebut dipakai untuk menjawab pertanyaan : Data pengamatan ke-i (sampel)
bagaimana individu dapat dimasukkan ke dalam kelompok
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 2

: Data pengamatan ke-i (populasi) B. Asumsi Analisis Diskriminan


2. Median Asumsi-asumsi dalam analisis diskriminan yang harus
Median atau nilai tengah segugus data yang telah dipenuhi meliputi asumsi uji distribusi normal multivariat
diurutkan dari yang terkecil sampai terbesar atau terbesar dan uji homogenitas matriks varians kovarians. Kedua asumsi
sampai terkecil adalah pengamatan yang tepat di tengah- tersebut dijelaskan sebagai berikut .
tengah bila banyaknya pengamatan itu ganjil, atau rata-rata 1. Uji Homogenitas Varians Kovarians (Box’s
kedua pengamatan yang ditengah bila banyaknya M)
pengamatan genap [2]. Rumus median pada data genap Uji homogenitas adalah pengujian untuk mengetahui
adalah sebagai berikut. apakah varians dan kovarians dari variabel yang diteliti sama
atau berbeda. Pengujian homogenitas dapat menggunakan
(3) statistik uji Box’s M [4].
Hipotesis :
Keterangan : H0: (Matriks varians kovarians
Me: Median homogen).
Xn : Pengamatan ke-n H1: minimal satu (Matriks varians kovarians
3. Varians heterogen)
Varians adalah ukuran penyebaran yang menunjukkan Taraf Signifikan : α
penyimpangan atau deviasi dari rata-rata data sampel atau Ststistik Uji :
populasi. Varians dibagi menjadi dua yaitu varians populasi
dan varians sampel [2]. Rumus varians sampel dan populasi (6)
adalah sebagai berikut.
Keterangan :
F = Nilai statistic uji F
(4) MST = Mean Square Treatment
MSE = Mean Square Error
Daerah Kritis : Tolak H0 jika Fhitung > Ftabel atau P-value < α
2. Uji Distribusi Normal Multivariat
(5) Memeriksa data apakah merupakan multivariat normal

dapat dilihat dari plot antara dengan chi-square


Keterangan :
[2]. Kriteria pemenuhan asumsi dilakukan secara visual yaitu
: Varians sampel
jika plot membentuk garis lurus berarti data dapat didekati
: Varians populasi dengan sebaran normal. Langkah-langkah pengujian
4. Boxplot distribusi normal multivariat sebagai berikut.
Boxplot adalah salah satu cara dalam statistik deskriptif 1. Menghitung jarak tergeneralisasi
untuk menggambarkan secara grafik dari data numeris melalui
lima ukuran yaitu nilai observasi terkecil, kuartil terendah (7)
atau kuartil pertama (Q1), yang memotong 25% dari data dengan
terendah, median (Q2) atau nilai pertengahan, kuartil tertinggi
= vektor observasi sampel ke-j berukuran p x 1
atau kuartil ketiga (Q3), yang memotong 25% dari data
tertinggi dan nilai observasi terbesar [3]. = vektor rata-rata sampel berukuran p x 1
= invers matriks varian-kovarian sampel
berukuran p x p
2. Mengurutkan nilai dari yang terkecil sampai yang

terbesar sehingga

3. Membuat plot dimana

merupakan distribusi chi-square dengan derajat bebas


p.
Gambar 1 Contoh Gambar Boxplot 4. Variabel X1, X2,…, Xp dikatakan saling
independenatau tidak ada hubungan artinya korelasi
antar variabelnya sama dengan nol. Untuk menguji
korelasi antar variabel tersebut dilakukan Bartlett test.
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 3

Langkah-langkah pengujian hipotesis distribusi normal diri sendiri, tetapi juga orang lain yang ikut menghisap asap
multivariat sebagai berikut. rook tersebut[7].
Hipotesis :
E. Kolesterol
H0 : Data berdistribusi multivariat normal
H1 : Data tidak berdistribusi multivariat normal Kolesterol normal yang dihasilkan hati dan organ tubuh
Statistik uji : lainnya adalah 500 mg kolesterol. Jumlah ini lebih daru
cukup untuk memenuhi kebutuhan tubuh. Oleh karena itu
(8) kelebihan kolesterol yang berasal dari bahan pangan sangat
tidak dianjutkan. Kelebihan kolesterol diolah hati dan untuk
Daerah penolakannya adalah Tolak H0 jika nilai lebih sementara disimpan dalam kantong empedu. Sayangnya,
dari 50%. Artinya lebih dari 50% jarak mahalanobis berada kemampuan tubuh untuk membuang kolesterol yang
di dalam kontur normal multivariat [4]. berlebihan sangat terbatas. Sisa kelebihan yang tidak dapat
3. Deteksi Multikolinearitas kolesterol akan tertimbun dalam pembuluh nadi dan
Multikolinieritas adalah terjadinya kolerasi linear yang jariangan lain dan akan mengganggu sirkulasi darah dalam
tinggi diantara variabel-variabel prediktor [5]. Konsekuensi tubuh[8]
adanya multikolinieritas bisa menggunakan nilai VIF lebih
F. Trigleserida
besar dari 10 dan korelasi antar variabel, standard error
tinggi namun sedikit variabel prediktor yang signifikan atau Trigleserida (TG, triasilgliserol, TAG atau
bahkan tidak ada variabel prediktor yang signifikan, terdapat triasilgliserid) adalah ester yang diturunkan dari gliserol
perubahan tanda antara koefisien kolerasi dan koefisien dan tiga asam lemak. Trigleserida adalah unsur pokok dari
regresi. Persamaan untuk menghitung korelasi ditunjukkan lemah tubuh pada manusia dan hewan juga pada lemak
sebagai berikut. tumbuhan. Trigliserida juga ada pada darah untuk
memungkinkan pemindahan dua arah dari lemak pada
adiposa dan gula darah dari hati dan merupakan komponen
utama dari minyak pada kulit manusia[9].
(9)
G.Hemoglobin
Hemoglobin merupkan turunan porfirin yang
mengandung besi.Hemoglobin sebagai protein yang
terbanyak ada dalam sel darah merah merupakan protein
C.Analisis Diskriminan majemuk yang penting dalam transportasi oksigen dan
Analisis diskriminan adalah metode untuk mencari dasar karbondioksis pada organisme yang memiliki maupun tidak
pengelompokan individu berdasarkan lebih dari satu variabel memiliiki sister sirkulasi darah[10].
bebas. Analisis tersebut dipakai untuk menjawab pertanyaan
bagaimana individu dapat dimasukkan ke dalam kelompok III. METODOLOGI PENELITIAN
berdasarkan beberapa variabel [6]. Model Analisis
Diskriminan ditandai dengan ciri khusus yaitu data A. Sumber Data
variabel dependen yang harus berupa data kategori, Data yang digunakan pada praktikum ini adalah data
sedangkan data independen justr berupa data non kategori. sekunder mengenai faktor-faktor yang dapat mengindikasi
Hal ini dapat dimodelkan sebagai berikut. seseorang merokok di mana data tersebut diperoleh dari
(10) website Kaggle pada Kamis, 12 Mei 2022.
Keterangan : B. Variabel Penelitian
= Variabel independen adalah data metrik, yaitu Variabel penelitian yang digunakan dalam penelitian ini
data berskala interval atau rasio dijelaskan pada tabel 1 sebagai berikut.
Tabel 1 Variabel Penelitian
= Variabel dependen adalah data kategorikal atau
Variabel Keterangan Skala Data Satuan
nominal, jika data kategorikal tersebut hanya terdiri dari 2 Kadar
X1 Rasio g/dL
kode saja disebut Two-Groups Discriminant Analysis. Namun Hemoglobin
apabila lebih dari 2 kategori disebut Multiple Discriminant X2 Kadar Trigleserida Rasio mg/dL
Analysis. X3 Kadar Kolesterol Rasio mg/dL
Status Merokok
D.Merokok Y 1 : Tidak Merokok Nominal -
2 : Merokok
Merekok merupakan kegiatan yang menghirup batangan
rokok. Merokok diketahui membahayakan kesehatan,
meskipun begitu perokok tidak pernah sadar untuk berhenti C.Struktur Data
merokok. Alasan beberapa perokok dalah emansipasi, stress Struktur data yang digunakan pada penelitian ini
dan juga ada yang beralasan untuk menurunkan berat badan. dijelaskan pada tabel 2 berikut.
Didalam satu batang rokok banyak terdapat zat yang dapat Tabel 2 Struktur Data
mengganggu kesehatan. Merokok bukan hanya merugikan Observas Y X1 X2 X3
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 4

i Boxplot of triglyceride
1 1 X1.1 X1.2 X1.3 350

2 2 X2.1 X2.2 X2.3 300


: : : : :
50 5 X50.1 X50.2 X50.3 250

triglyceride
200

D.Langkah Analisis
Langkah-langkah yang dilakukan pada penelitian ini adalah 150
Mean: 129.2

sebagai berikut. 100


Median: 92

1. Mengumpulkan data faktor-faktor yang mengindikasi


seseorang merokok 50

2. Menganalisis karateristik data pada faktor-faktor yang Gambar 3 Boxplot Trigliserida


mengindikasi seseorang merokok. Gambar 3 menunjukkan bahwa rata – rata trigliserida
3. Melakukan uji asumsi homogenitas, uji asumsi sebesar 129,2 mg/dL dengan median sebesar 92 mg/dL yang
distribusi normal multivariat, dan uji asumsi berarti 50% data diatas dan dibawah 92 mg/dL. Berdasarkan
multikolinearitas pada faktor-faktor yang mengindikasi besar boxplot, keragaman data cukup tinggi. Berdasarkan
seseorang merokok. garis median yang tidak tepat berada ditengah boxplot
4. Melakukan anlisis diskriminan pada faktor-faktor yang menunjukkan bahwa data kadar trigliserida tidak tidak
mengindikasi seseorang merokok. simetris, serta tidak terdapat outlier.
5. Menginterpretasikan hasil analisis. Boxplot of Cholesterol
6. Menarik kesimpulan dan saran. 350

322

IV. ANALISIS DAN PEMBAHASAN 300


290

Bab ini akan membahas tentang analisis diskriminan pada 250


Cholesterol

data faktor-faktor yang mengindikasi seseorang merokok


meliputi karakteristik data, pengujian asumsi analisis 200 Mean: 198.7
Median: 191.5

diskriminan, dan analisis diskriminan.


150
A. Karakteristik Data
Karakteristik pada faktor-faktor yang mengindikasi 100
seseorang merokok adalah sebagai berikut. Gambar 4 Boxplot Kolesterol
Boxplot of hemoglobin Gambar 4 menunjukkan bahwa rata – rata kadar
18
kolesterol sebesar 198,7 mg/dL dengan median sebesar 191,5
17
mg/dL yang berarti 50% data diatas dan dibawah 191,5
mg/dL. Berdasarkan besar boxplot, keragaman data kecil.
16 Berdasarkan garis median yang tidak tepat berada ditengah
boxplot menunjukkan bahwa data kadar kolesterol tidak
hemoglobin

Median: 15.15
15
simetris, serta terdapat 2 outlier yaitu sebesar 322 mg/dL dan
Mean: 14.942

14 290 mg/dL.
13 B. Asumsi Analisis Diskriminan
Pengujian asumsi analisis diskriminan yang dilakukan
12
adalah pengujian asumsi homogenitas, asumsi distribusi
Gambar 2 Boxplot Hemoglobin normal, dan asumsi multikolinearitas pada faktor-faktor yang
Gambar 2 menunjukkan bahwa rata – rata hemoglobin mengindikasi seseorang merokok adalah sebagai berikut.
sebesar 14,942g/dL dengan median sebesar 15,15 g/dL yang 1. Uji Homogenitas
berarti 50% data diatas dan dibawah 15,15 g/dL. Berdasarkan Uji homogenitas multivariat dilakukan untuk menguji
besar boxplot, keragaman data cukup tinggi. Berdasarkan apakah matriks varians kovarians pada faktor-faktor yang
garis median yang tidak tepat berada ditengah boxplot mengindikasi seseorang merokok sama atau homogen. Uji
menunjukkan bahwa data kadar hemoglobin tidak tidak homogenitas multivariat menggunakan uji Box’s M
simetris, serta tidak terdapat outlier. ditunjukkan sebagai berikut.
Hipotesis:
H0 : i = 0 (Matriks varians kovarians data faktor-faktor
yang mengindikasi seseorang merokok
homogen)
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 5

H1 : i  0 (Matriks varians kovarians data faktor-faktor 0,42


yang mengindikasi seseorang merokok Tabel 4 menunjukkan bahwa didapatkan nilai T-proporsi
heterogen) sebesar 0,42 atau 42% tidak berada di dalam interval 50 ±
Taraf Signifikan : α = 0,05 5% maka diputuskan tolak H0 artinya data faktor-faktor yang
Daerah Penolakan : Tolak H0 jika Fhitung > Fα(df1, df2) atau Pvalue mengindikasi sesorang merokok tidak berdistribusi normal
< α = 0,05 multivariat, namun untuk praktikum kali ini data
Statistik Uji : diasumsikan berdistribusi normal .
Tabel 3 Uji Homogenitas 3. Deteksi Multikolienaritas
Fhitung F0,05(3;410422,860) Pvalu Pemeriksaan multikolinieritas dilakukan untuk mengetahui
e
apakah antar variabel prediktor yang mengindikasi seseorang
1,09 2,605 0,352
merokok terdapat korelasi atau tidak. Hasil analisis
Tabel 8 menunjukkan bahwa F hit sebesar 1,09 kecil dari
multikolinieritas disajikan pada Tabel 5 berikut.
F0,05(3;410422,860) sebesar 2,605 dan diperkuat dengan nilai Pvalue Tabel 5 Pemeriksaan Multikolinieritas
sebesar 0,06 lebih besar dari  sebesar 0,05 maka diputuskan Variabel Kolestero Trigliserid Hemoglobi
gagal tolak H0 yang artinya matriks varians kovarians data l a n
faktor-faktor yang mengindikasi seseorang merokok Kolesterol 1 0,4 -0,1
homogen. Trigliserida 0,4 1 0,31
2. Uji Distribusi Normal Multivariat Hemoglobi
-0,1 0,31 1,000
Pemeriksaan dan pengujian distribusi normal multivariat n
dilakukan untuk mengetahui apakah data faktor-faktor yang Tabel 5 menunjukkan bahwa tidak terdapat nilai korelasi
mengindikasi seseorang merokok berdistrbusi normal yang tinggi antar variabel karena nilai korelasi jauh dari 1
multivariat atau tidak. Pemeriksaan distribusi normal atau -1 sehingga tidak mengindikasikan adanya kasus
disajikan secara visual menggunakan scatterplot pada multikolinieritas antar variabel prediktor faktor-faktor yang
Gambar 6 berikut. mengindikasi seseorang merokok .
12 C. Analisis Diskriminan
10
Analisis diskriminan pada faktor-faktor yang
mengindikasi seseorang merokok terdiri dari analisis
8
perbedaan rata-rata, metode stepwise, estimasi parameter
6
model, dan ketepatan klasifikasi adalah sebagai berikut.
C5

1. Perbedaan Rata-Rata
4
Perbedaan rata-rata jenis (Y) pada faktor - faktor yang
2
mengindikasi seseorang merokok menunjukkan apabila rata –
rata antar jenis memiliki kedekatan maka dikatakan variabel
0
tersebut tidak terdapat perbedaan dan begitu pula sebaliknya.
0 2 4 6 8 10
C6 Perbedaan rata-rata jenis (Y) dalam data faktor - faktor yang
Gambar 5 Scatterplot
mengindikasi seseorang merokok disajikan pada Tabel 6
Gambar 5 menunjukkan bahwa plot-plot yang berikut.
Tabel 6 Perbedaan Rata-Rata
terbentuk cenderung tidak mengikuti garis normal. Data
Rata – Rata
dikatakan memenuhi asumsi distribusi normal jika plot-plot Kelompok
X1 X2 X3
data yang terbentuk mendekati atau mengikuti garis normal.
Tidak 14,314 132,535 211,392
Maka dapat disimpulkan bahwa data faktor-faktor yang Merokok 3 7 9
mengindikasi seseorang merokok tidak memenuhi asumsi 15,740 124,954 182,545
distribusi normal multivariat. Merokok
9 5 5
Untuk memperkuat asumsi maka dilakukan pengujian Tabel 6 menunjukkan bahwa tidak ada perbedaan rata –
asumsi normal multivariat selanjutnya adalah menggunakan rata kadar hemoglobin, trigliserida, dan kolesterol pada
uji T-Proporsi dengan hipotesis sebagai berikut. kelompok seseorang yang tidak merokok dan yang merokok
H0 : Data faktor-faktor yang mengindikasi seseorang diperkuat dengan pengujian hipotesis berikut.
merokok berdistribusi normal multivariat. H0 : Tidak ada perbedaan rata-rata kadar hemoglobin pada
H1 : Data faktor-faktor yang mengindikasi sesorang kelompok orang yang tidak merokok dan orang yang
merokok tidak berdistribusi normal multivariat. merokok.
Taraf signifikan (α) : 0.05 H1 : Ada perbedaan rata-rata kadar hemoglobin pada
Daerah penolakan : Tolak H0 jika T-proporsi diluar interval kelompok orang yang tidak merokok dan orang yang
50 ± 5% atau PValue < α merokok.
Statistik uji : H0 : Tidak ada perbedaan rata-rata kadar trigliserida pada
Tabel 4 Uji T-proporsi kelompok orang yang tidak merokok dan orang yang
T- merokok.
proporsi
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 6

H1 : Ada perbedaan rata-rata kadar trigliserida pada Model diskriminan dibentuk melalui nilai standarisasi
kelompok orang yang tidak merokok dan orang yang diskriminan. Nilai standarisasi diskriminan menunjukkan
merokok. bahwa hubungan searah atau tidaknya dengan fungsi
H0 : Tidak ada perbedaan rata-rata kadar kolesterol pada diskriminan pada faktor - faktor yang mengindikasi
kelompok orang yang tidak merokok dan orang yang seseorang merokok yang disajikan pada Tabel 9 berikut
merokok. Tabel 9 Nilai Standarisasi Diskriminan
H1 : Ada perbedaan rata-rata kadar kolesterol pada Functio
kelompok orang yang tidak merokok dan orang yang n
merokok. Kadar
0,82
Taraf signifikan : α = 0.05 Hemoglobin
Kadar Kolesterol -0,651
Daerah penolakan : Tolak H0 jika Fhiung > Fα(df1;df2) atau Pvalue
< α. Tabel 9 menunjukkan bahwa nilai koefisien kadar
Statistik Uji: hemoglobin memiliki hubungan yang searah dengan fungsi
Tabel 7 Pengujian Perbedaan Rata – Rata diskriminan. Sedangkan nilai koefisien kadar kolesterol
Variabel Fhitung F0,05(1;48) Pvalu memiliki hubungan yang tidak searah atau terbalik dengan
e funngsi diskriminan. Berdasarkan nilai standarisasi
Kadar 13,51 0,001 ezhwdiskriminan diatas, didapatkan persamaan diskriminan
Hemoglobin 9 sebegai berikut
4,042
Kadar Trigliserida 0,125 0,725 Y = 0,82X1 - 0,651X3
Kadar Kolesterol 7,753 0,008 Model diskriminan diatas menunjukkan bahwa jika kadar
Tabel 7 menunjukkan bahwa Fhitung pada kadar hemoglobin bertambah satu satuan maka seseorang merokok
hemoglobin dan kolesterol berturut-turut sebesar 13,519 dan bertambah sebesar 0,82 dengan syarat kadar kolesterol
7,753 lebih dari F0.05(1;48) sebesar 4,042 diperkuat dengan nilai konstan. Jika kadar kolesterol bertambah satu satuan maka
Pvalue berturut-turut sebesar 00,001 dan 0,008 kurang dari α seseorang merokok berkurang sebesar 0,651 dengan syarat
sebesar 0.05 sehingga diperoleh keputusan tolak H 0 yang kadar hemoglobin konstan.
artinya ada perbedaan rata-rata kadar hemoglobin dan b. Kebaikan Model
kolesterol pada kelompok orang yang tidak merokok dan Kebaikan model pada analisis diskriminan ditentukan
orang yang merokok. Sedangkan didapatkan F hitung pada kadar berdasarkan nilai eigenvalue. Nilai eigenvalue pada data
trigliserida sebesar 0,125 kurang dari F0.05(1;48) sebesar 4,042 faktor – faktor yang mengindikasi seseorang merokok dilihat
diperkuat dengan nilai Pvalue sebesar 0,725 lebih dari α dari nilai canonical correlation yang disajikan pada Tabel 10
sebesar 0.05 sehingga diperoleh keputusan gagal tolak H 0 sebagai berikut
yang artinya tidak ada perbedaan rata-rata kadar trigliserida Tabel 10 Nilai Eigen Value
pada kelompok orang yang tidak merokok dan orang yang Eigen R2
merokok. Value
2. Metode Stepwise 0.486 0.57
Analisis metode stepwise pada faktor - faktor yang 2
mengindikasi seseorang merokok disajikan pada Tabel 8 Tabel 10 menunjukkan bahwa nilai eigenvalue sebesar
sebagai berikut. 0,572 dapat diartikan bahwa kadar hemoglobin dan kolesterol
Tabel 8. Metode Stepwise dapat menjelaskan status merokok sebesar 0,572 atau 57,2%
Ste Statisti df df dan sisanya dijelaskan oleh variabel diluar model
Entered Pvalue diskriminan.
p c 1 2
Kadar 4. Ketepatan Klasifikasi
1 13,519 1 48 0,001
Hemoglobin Ketepatan klasifikasi pada faktor-faktor yang
2 Kadar Kolesterol 11,414 2 47 9,113.10-5 mempengaruhi seseorang menderita diabetes di Pima Indian
Tabel 8 menunjukkan bahwa metode stepwise pada ditunjukkan pada Tabel 11.
analisis diskriminan faktor - faktor yang mengindikasi Tabel 11 Ketepatan Klasifikasi
seseorang merokok terdapat 2 step. Pada step pertama Prediksi
Status Tota
variabel yang masuk kedalam model adalah kadar Merokok Tidak Meroko l
hemoglobin, kemudian pada step kedua variabel yang masuk Merokok k
kedalam model adalah kadar kolesterol sehingga pada model Tidak
19 9 28
diskriminan data faktor - faktor yang mengindikasi seseorang Merokok
merokok terdapat 2 variabel yaitu kadar hemoglobin kadar Merokok 5 17 22
kolesterol. Ketepatan klasifikasi 72%
3. Parameter Model
Tabel 11 menunjukkan bahwa hasil ketepatan klasifikasi
Estimasi parameter model diskriminan terdiri dari model
untuk variabel respon, dapat diketahui bahwa hasil
diskriminan dan kebaikan model. Berikut ini merupakan pengamatan seseorang yang tidak merokok tepat diprediksi
analisis estimasi parameter model diskriminan pada faktor - bahwa seseorang tersebut tidak merokok sebanyak 19 orang
faktor yang mengindikasi seseroang merokok. dan hasil pengamatan seseorang yang tidak merokok
a. Model Diskriminan diprediksi salah bahwa seseorang tersebut merokok
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 7

sebanyak 9 orang. Hasil pengamatan seseorang yang [9] Dr. Ir. Muhamad Firdaus, M. (2017). Diabetes
merokok diprediksi dengan salah bahwa seseorang tersebut dan Rumput Laut Cokelat. Malang: Universitas
tidak merokok sebanyak 5 orang dan seseorang yang Brawijaya Press
merokok tepat diprediksi bahwa seseorang tersebut merokok [10] Dr. Abdul Salam M. Sofro, P. (2011).
sebanyak 17 orang. Persentase ketepatan klasifikasi secara
Kenaekaragaman Genetik. Yogyakarta: Andi
keseluruhan sebesar 72%.
Offset

V. KESIMPULAN/RINGKASAN
Bab ini menjelaskan kesimpulan dan saran dari hasil dari
analisis yang telah dilakukan.
A. Kesimpulan
Berdasarkan hasil analisis dan pembahasan diperoleh
kesimpulan sebagai berikut.
1. Karakteristik data menunjukkan bahwa kegaraman data
variabel hemoglobin dan trigliserida cukup besar dan
pada kolesterol kecil. Ketiga variabel tidak simetris dan
terdapat outlier pada variabel kolesterol.
2. Faktor – faktor yang mengindikasi seseorang merokok
memenuhi asumsi homogenitas dan multikolinearitas,
namun tidak memenuhi asumsi normalitas.
3. Analisis diskriminan menunjukkan variabel kadar
homoglobin dan kadar kolesterol yang signifikan, model
yang dihasilkan tidak cukup baik, serta ketepatan
klasifikasi cukup tinggi.
B. Saran
Saran yang didapatkan berdasarkan analisis dari
praktikum ini adalah pembaca dan penulis dapat memahami
serta menerapkan analisis diskriminan dengan benar. Saran
untuk perokok diharapkan mengurangi kebiasaan merokok
yang tidak memberikan manfaat bagi Kesehatan.

DAFTAR PUSTAKA
[1] Achmad, Subagyo. 2003. Jurnal Teknologi dan Industri
Pangan. Jember
[2] Johnson, R.A. And Wichern, D. 2007. Applied
Multivariate Statistical Analysis. USA: Pearson
Education,Inc.
[3] Siagian, Sondang. 2000.Manajemen Sumber Daya
Manusia. Jakarta : Bumi Aksara
[4] Rencer, A. 2002. Methods of Multivariate
Analysis. Canada: John Wiley & Sons, Inc
[5] Lind, Douglas A. (2007). Teknik-teknik Statistik
dalam Berbisnis dan Ekonomi 2 Edisi 13. Jakarta:
Salemba Empat.
[6] Santoso, Singgih. 2010. Statistik Multivariat.
Jakarta: PT. Elex Media Komputindo.
[7] Andriyani, R. (2010). Bahaya Merokok. Jakarta:
Sarana Bangun Pustaka.
[8] dr. Sri Nilawati, I. D. (2008). Care Your Self,
Kolesterol. Jakarta: PT. Niaga Swadaya.
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 8

LAMPIRAN
C.Data Penelitian
No Trigliserid Hemoglobi
. Kolesterol a n Merokok
Tidak
1 215 82 12.9 Merokok
Tidak
2 192 115 12.7 Merokok
3 242 182 15.8 Merokok
Tidak
4 322 254 14.7 Merokok
Tidak
5 184 74 12.5 Merokok
Tidak
6 217 199 16.2 Merokok
7 226 68 17 Merokok
Tidak
8 222 269 15 Merokok
Tidak
9 210 66 13.7 Merokok
Tidak
10 198 147 16 Merokok
Tidak
11 184 141 14.7 Merokok
Tidak
12 184 197 17.9 Merokok
13 178 210 14.5 Merokok
Tidak
14 155 47 12.6 Merokok
Tidak
15 269 174 13.3 Merokok
Tidak
16 228 60 13.3 Merokok
Tidak
17 217 79 13.8 Merokok
18 227 318 16.7 Merokok
19 129 119 17 Merokok
Tidak
20 198 57 12.5 Merokok
21 191 77 14.4 Merokok
22 166 94 16.6 Merokok
23 186 80 15.4 Merokok
Tidak
24 179 76 16 Merokok
25 125 85 17.1 Merokok
26 191 218 17.6 Merokok
Tidak
27 290 273 15.9 Merokok
28 209 234 14.7 Merokok
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 9

Tidak
29 207 89 14 Merokok
Tidak
30 189 90 15.4 Merokok
Tidak
31 210 140 12.9 Merokok
32 217 245 16.7 Merokok
33 129 53 15.3 Merokok
34 187 65 16 Merokok
35 148 130 13.8 Merokok
36 229 82 15.7 Merokok
37 156 53 14.9 Merokok
Tidak
38 225 269 15.9 Merokok
Tidak
39 220 255 15.3 Merokok
Tidak
40 189 79 16.6 Merokok
Tidak
41 244 69 12.9 Merokok
Tidak
42 187 61 12 Merokok
43 223 101 16.1 Merokok
44 191 68 14.5 Merokok
Tidak
45 165 164 12.8 Merokok
Tidak
46 185 58 15.5 Merokok
47 134 80 14.8 Merokok
48 154 108 16.4 Merokok
Tidak
49 234 127 13.8 Merokok
50 178 79 15.3 Merokok

D.Output Software (Minitab)


a. Asumsi Homogenitas

Test Results

Box's M 3.429
F Approx. 1.090

df1 3

df2 410422.860

Sig. .352

Tests null hypothesis of equal


population covariance
matrices.

b. Asumsi Multikolinearitas
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 10

Correlations
Pearson 0,98
correlation 9
P-value 0,00
0
Correlations
Cholestero triglycerid
l e
triglyceride 0,471
0,001

hemoglobi -0,101 0,316


n
c. Asumsi Normlaitas 0,486 0,025
Data Display
Prop    0,420000

d. Analisis Diskriminan
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 11

Perbedaan rata-rata
Group Statistics

Std. Valid N (listwise)

Smoking Mean Deviation Unweighted Weighted

No Hemoglobin 14.3143 1.55771 28 28.000

Triglyceride 132.5357 75.69847 28 28.000

Cholesterol 211.3929 36.36985 28 28.000


Yes Hemoglobin 15.7409 1.05815 22 22.000
Triglyceride 124.9545 74.61806 22 22.000
Cholesterol 182.5455 36.35634 22 22.000
Total Hemoglobin 14.9420 1.52598 50 50.000

Triglyceride 129.2000 74.55309 50 50.000

Cholesterol 198.7000 38.78894 50 50.000

Uji Perbedaan rata-rata


Tests of Equality of Group Means

Wilks'
Lambda F df1 df2 Sig.

Hemoglobin .780 13.519 1 48 .001


Triglyceride .997 .125 1 48 .725
Cholesterol .861 7.753 1 48 .008

Metode Stepwise
Variables Entered/Removed a,b,c,d

Min. D Squared

Between Exact F

Step Entered Statistic Groups Statistic df1 df2 Sig.

1 Hemoglobin 1.097 No and Yes 13.519 1 48.000 .001


2 Cholesterol 1.892 No and Yes 11.414 2 47.000 9.113E-5

At each step, the variable that maximizes the Mahalanobis distance between the two
closest groups is entered.
a. Maximum number of steps is 6.
b. Maximum significance of F to enter is .05.
c. Minimum significance of F to remove is .10.
d. F level, tolerance, or VIN insufficient for further computation.
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 12

Standarisasi Analisis Diskriminan


Standardized Canonical
Discriminant Function
Coefficients

Function

Hemoglobin .820
Cholesterol -.651
Kebaikan Model dan Eigen Value
Eigenvalues

% of Cumulative Canonical
Function Eigenvalue Variance % Correlation

1 .486 a
100.0 100.0 .572

a. First 1 canonical discriminant functions were used in the


analysis.

Ketepatan Klasifikasi
Classification Results a

Predicted Group
Membership

Smoking No Yes Total

Original Count No 19 9 28

Yes 5 17 22

% No 67.9 32.1 100.0

Yes 22.7 77.3 100.0

a. 72.0% of original grouped cases correctly classified.

Anda mungkin juga menyukai