M
informasi yang berguna. Perlu kiranya dimengerti bahwa
statistika deskriptif memberikan informasi hanya mengenai
I. PENDAHULUAN data yang dipunyai dan sama sekali tidak menarik
kesimpulan yang lebih banyak dan lebih jauh dari data yang
erokok adalah kegiatan menikmati rokok dengan cara ada [1].
menghisap. Rokok terbuat dari tembakau yang sudah dicecah 1. Mean
dan didelinting dalam kertas jenis tertentu. Merokok sendiri Rata-rata adalah suatu ukuran pemusatan data bila data itu
banyak memnyebabkan gangguan kesehatan, terutama pada diurutkan dari yang terkecil sampai yang terbesar atau
pernafasan. Merokok tidak hanya berdampak negatif pada sebaliknya [2]. Rumus untuk menghitung rata-rata sampel
pengguna namun memiliki dampak yang lebih negatif pada dan populasi adalah adalah sebagai berikut.
orang sekitar seng menghisap asap rokok tersebut[7].
Meskipun merokok memiliki banyak dampak negative bagi (1)
Kesehatan, menurut penrokok sendiri alas an merokok adalah
menghilangkan stress, emansipasi, dan juga menurunkan
berat badan. Faktor – faktor yang dapat mengindikasi (2)
seseorang merokok antara lain kadar hemoglobin, kadar
trigleserida, kadar kolesterol, dan lain sebagainya. Untuk Keterangan :
mengetahui apakah faktor – faktor tersebut benar : Rata-rata sampel
dapatmengindikasi seseorang merokok maka pada praktikum
ini digunakan analisis diskriminan. : Rata-rata populasi
Analisis diskriminan adalah metode untuk mencari dasar n : Banyaknya sampel
pengelompokan individu berdasarkan lebih dari satu variabel N : Banyaknya populasi
bebas. Analisis tersebut dipakai untuk menjawab pertanyaan : Data pengamatan ke-i (sampel)
bagaimana individu dapat dimasukkan ke dalam kelompok
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 2
terbesar sehingga
Langkah-langkah pengujian hipotesis distribusi normal diri sendiri, tetapi juga orang lain yang ikut menghisap asap
multivariat sebagai berikut. rook tersebut[7].
Hipotesis :
E. Kolesterol
H0 : Data berdistribusi multivariat normal
H1 : Data tidak berdistribusi multivariat normal Kolesterol normal yang dihasilkan hati dan organ tubuh
Statistik uji : lainnya adalah 500 mg kolesterol. Jumlah ini lebih daru
cukup untuk memenuhi kebutuhan tubuh. Oleh karena itu
(8) kelebihan kolesterol yang berasal dari bahan pangan sangat
tidak dianjutkan. Kelebihan kolesterol diolah hati dan untuk
Daerah penolakannya adalah Tolak H0 jika nilai lebih sementara disimpan dalam kantong empedu. Sayangnya,
dari 50%. Artinya lebih dari 50% jarak mahalanobis berada kemampuan tubuh untuk membuang kolesterol yang
di dalam kontur normal multivariat [4]. berlebihan sangat terbatas. Sisa kelebihan yang tidak dapat
3. Deteksi Multikolinearitas kolesterol akan tertimbun dalam pembuluh nadi dan
Multikolinieritas adalah terjadinya kolerasi linear yang jariangan lain dan akan mengganggu sirkulasi darah dalam
tinggi diantara variabel-variabel prediktor [5]. Konsekuensi tubuh[8]
adanya multikolinieritas bisa menggunakan nilai VIF lebih
F. Trigleserida
besar dari 10 dan korelasi antar variabel, standard error
tinggi namun sedikit variabel prediktor yang signifikan atau Trigleserida (TG, triasilgliserol, TAG atau
bahkan tidak ada variabel prediktor yang signifikan, terdapat triasilgliserid) adalah ester yang diturunkan dari gliserol
perubahan tanda antara koefisien kolerasi dan koefisien dan tiga asam lemak. Trigleserida adalah unsur pokok dari
regresi. Persamaan untuk menghitung korelasi ditunjukkan lemah tubuh pada manusia dan hewan juga pada lemak
sebagai berikut. tumbuhan. Trigliserida juga ada pada darah untuk
memungkinkan pemindahan dua arah dari lemak pada
adiposa dan gula darah dari hati dan merupakan komponen
utama dari minyak pada kulit manusia[9].
(9)
G.Hemoglobin
Hemoglobin merupkan turunan porfirin yang
mengandung besi.Hemoglobin sebagai protein yang
terbanyak ada dalam sel darah merah merupakan protein
C.Analisis Diskriminan majemuk yang penting dalam transportasi oksigen dan
Analisis diskriminan adalah metode untuk mencari dasar karbondioksis pada organisme yang memiliki maupun tidak
pengelompokan individu berdasarkan lebih dari satu variabel memiliiki sister sirkulasi darah[10].
bebas. Analisis tersebut dipakai untuk menjawab pertanyaan
bagaimana individu dapat dimasukkan ke dalam kelompok III. METODOLOGI PENELITIAN
berdasarkan beberapa variabel [6]. Model Analisis
Diskriminan ditandai dengan ciri khusus yaitu data A. Sumber Data
variabel dependen yang harus berupa data kategori, Data yang digunakan pada praktikum ini adalah data
sedangkan data independen justr berupa data non kategori. sekunder mengenai faktor-faktor yang dapat mengindikasi
Hal ini dapat dimodelkan sebagai berikut. seseorang merokok di mana data tersebut diperoleh dari
(10) website Kaggle pada Kamis, 12 Mei 2022.
Keterangan : B. Variabel Penelitian
= Variabel independen adalah data metrik, yaitu Variabel penelitian yang digunakan dalam penelitian ini
data berskala interval atau rasio dijelaskan pada tabel 1 sebagai berikut.
Tabel 1 Variabel Penelitian
= Variabel dependen adalah data kategorikal atau
Variabel Keterangan Skala Data Satuan
nominal, jika data kategorikal tersebut hanya terdiri dari 2 Kadar
X1 Rasio g/dL
kode saja disebut Two-Groups Discriminant Analysis. Namun Hemoglobin
apabila lebih dari 2 kategori disebut Multiple Discriminant X2 Kadar Trigleserida Rasio mg/dL
Analysis. X3 Kadar Kolesterol Rasio mg/dL
Status Merokok
D.Merokok Y 1 : Tidak Merokok Nominal -
2 : Merokok
Merekok merupakan kegiatan yang menghirup batangan
rokok. Merokok diketahui membahayakan kesehatan,
meskipun begitu perokok tidak pernah sadar untuk berhenti C.Struktur Data
merokok. Alasan beberapa perokok dalah emansipasi, stress Struktur data yang digunakan pada penelitian ini
dan juga ada yang beralasan untuk menurunkan berat badan. dijelaskan pada tabel 2 berikut.
Didalam satu batang rokok banyak terdapat zat yang dapat Tabel 2 Struktur Data
mengganggu kesehatan. Merokok bukan hanya merugikan Observas Y X1 X2 X3
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 4
i Boxplot of triglyceride
1 1 X1.1 X1.2 X1.3 350
triglyceride
200
D.Langkah Analisis
Langkah-langkah yang dilakukan pada penelitian ini adalah 150
Mean: 129.2
322
Median: 15.15
15
simetris, serta terdapat 2 outlier yaitu sebesar 322 mg/dL dan
Mean: 14.942
14 290 mg/dL.
13 B. Asumsi Analisis Diskriminan
Pengujian asumsi analisis diskriminan yang dilakukan
12
adalah pengujian asumsi homogenitas, asumsi distribusi
Gambar 2 Boxplot Hemoglobin normal, dan asumsi multikolinearitas pada faktor-faktor yang
Gambar 2 menunjukkan bahwa rata – rata hemoglobin mengindikasi seseorang merokok adalah sebagai berikut.
sebesar 14,942g/dL dengan median sebesar 15,15 g/dL yang 1. Uji Homogenitas
berarti 50% data diatas dan dibawah 15,15 g/dL. Berdasarkan Uji homogenitas multivariat dilakukan untuk menguji
besar boxplot, keragaman data cukup tinggi. Berdasarkan apakah matriks varians kovarians pada faktor-faktor yang
garis median yang tidak tepat berada ditengah boxplot mengindikasi seseorang merokok sama atau homogen. Uji
menunjukkan bahwa data kadar hemoglobin tidak tidak homogenitas multivariat menggunakan uji Box’s M
simetris, serta tidak terdapat outlier. ditunjukkan sebagai berikut.
Hipotesis:
H0 : i = 0 (Matriks varians kovarians data faktor-faktor
yang mengindikasi seseorang merokok
homogen)
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 5
1. Perbedaan Rata-Rata
4
Perbedaan rata-rata jenis (Y) pada faktor - faktor yang
2
mengindikasi seseorang merokok menunjukkan apabila rata –
rata antar jenis memiliki kedekatan maka dikatakan variabel
0
tersebut tidak terdapat perbedaan dan begitu pula sebaliknya.
0 2 4 6 8 10
C6 Perbedaan rata-rata jenis (Y) dalam data faktor - faktor yang
Gambar 5 Scatterplot
mengindikasi seseorang merokok disajikan pada Tabel 6
Gambar 5 menunjukkan bahwa plot-plot yang berikut.
Tabel 6 Perbedaan Rata-Rata
terbentuk cenderung tidak mengikuti garis normal. Data
Rata – Rata
dikatakan memenuhi asumsi distribusi normal jika plot-plot Kelompok
X1 X2 X3
data yang terbentuk mendekati atau mengikuti garis normal.
Tidak 14,314 132,535 211,392
Maka dapat disimpulkan bahwa data faktor-faktor yang Merokok 3 7 9
mengindikasi seseorang merokok tidak memenuhi asumsi 15,740 124,954 182,545
distribusi normal multivariat. Merokok
9 5 5
Untuk memperkuat asumsi maka dilakukan pengujian Tabel 6 menunjukkan bahwa tidak ada perbedaan rata –
asumsi normal multivariat selanjutnya adalah menggunakan rata kadar hemoglobin, trigliserida, dan kolesterol pada
uji T-Proporsi dengan hipotesis sebagai berikut. kelompok seseorang yang tidak merokok dan yang merokok
H0 : Data faktor-faktor yang mengindikasi seseorang diperkuat dengan pengujian hipotesis berikut.
merokok berdistribusi normal multivariat. H0 : Tidak ada perbedaan rata-rata kadar hemoglobin pada
H1 : Data faktor-faktor yang mengindikasi sesorang kelompok orang yang tidak merokok dan orang yang
merokok tidak berdistribusi normal multivariat. merokok.
Taraf signifikan (α) : 0.05 H1 : Ada perbedaan rata-rata kadar hemoglobin pada
Daerah penolakan : Tolak H0 jika T-proporsi diluar interval kelompok orang yang tidak merokok dan orang yang
50 ± 5% atau PValue < α merokok.
Statistik uji : H0 : Tidak ada perbedaan rata-rata kadar trigliserida pada
Tabel 4 Uji T-proporsi kelompok orang yang tidak merokok dan orang yang
T- merokok.
proporsi
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 6
H1 : Ada perbedaan rata-rata kadar trigliserida pada Model diskriminan dibentuk melalui nilai standarisasi
kelompok orang yang tidak merokok dan orang yang diskriminan. Nilai standarisasi diskriminan menunjukkan
merokok. bahwa hubungan searah atau tidaknya dengan fungsi
H0 : Tidak ada perbedaan rata-rata kadar kolesterol pada diskriminan pada faktor - faktor yang mengindikasi
kelompok orang yang tidak merokok dan orang yang seseorang merokok yang disajikan pada Tabel 9 berikut
merokok. Tabel 9 Nilai Standarisasi Diskriminan
H1 : Ada perbedaan rata-rata kadar kolesterol pada Functio
kelompok orang yang tidak merokok dan orang yang n
merokok. Kadar
0,82
Taraf signifikan : α = 0.05 Hemoglobin
Kadar Kolesterol -0,651
Daerah penolakan : Tolak H0 jika Fhiung > Fα(df1;df2) atau Pvalue
< α. Tabel 9 menunjukkan bahwa nilai koefisien kadar
Statistik Uji: hemoglobin memiliki hubungan yang searah dengan fungsi
Tabel 7 Pengujian Perbedaan Rata – Rata diskriminan. Sedangkan nilai koefisien kadar kolesterol
Variabel Fhitung F0,05(1;48) Pvalu memiliki hubungan yang tidak searah atau terbalik dengan
e funngsi diskriminan. Berdasarkan nilai standarisasi
Kadar 13,51 0,001 ezhwdiskriminan diatas, didapatkan persamaan diskriminan
Hemoglobin 9 sebegai berikut
4,042
Kadar Trigliserida 0,125 0,725 Y = 0,82X1 - 0,651X3
Kadar Kolesterol 7,753 0,008 Model diskriminan diatas menunjukkan bahwa jika kadar
Tabel 7 menunjukkan bahwa Fhitung pada kadar hemoglobin bertambah satu satuan maka seseorang merokok
hemoglobin dan kolesterol berturut-turut sebesar 13,519 dan bertambah sebesar 0,82 dengan syarat kadar kolesterol
7,753 lebih dari F0.05(1;48) sebesar 4,042 diperkuat dengan nilai konstan. Jika kadar kolesterol bertambah satu satuan maka
Pvalue berturut-turut sebesar 00,001 dan 0,008 kurang dari α seseorang merokok berkurang sebesar 0,651 dengan syarat
sebesar 0.05 sehingga diperoleh keputusan tolak H 0 yang kadar hemoglobin konstan.
artinya ada perbedaan rata-rata kadar hemoglobin dan b. Kebaikan Model
kolesterol pada kelompok orang yang tidak merokok dan Kebaikan model pada analisis diskriminan ditentukan
orang yang merokok. Sedangkan didapatkan F hitung pada kadar berdasarkan nilai eigenvalue. Nilai eigenvalue pada data
trigliserida sebesar 0,125 kurang dari F0.05(1;48) sebesar 4,042 faktor – faktor yang mengindikasi seseorang merokok dilihat
diperkuat dengan nilai Pvalue sebesar 0,725 lebih dari α dari nilai canonical correlation yang disajikan pada Tabel 10
sebesar 0.05 sehingga diperoleh keputusan gagal tolak H 0 sebagai berikut
yang artinya tidak ada perbedaan rata-rata kadar trigliserida Tabel 10 Nilai Eigen Value
pada kelompok orang yang tidak merokok dan orang yang Eigen R2
merokok. Value
2. Metode Stepwise 0.486 0.57
Analisis metode stepwise pada faktor - faktor yang 2
mengindikasi seseorang merokok disajikan pada Tabel 8 Tabel 10 menunjukkan bahwa nilai eigenvalue sebesar
sebagai berikut. 0,572 dapat diartikan bahwa kadar hemoglobin dan kolesterol
Tabel 8. Metode Stepwise dapat menjelaskan status merokok sebesar 0,572 atau 57,2%
Ste Statisti df df dan sisanya dijelaskan oleh variabel diluar model
Entered Pvalue diskriminan.
p c 1 2
Kadar 4. Ketepatan Klasifikasi
1 13,519 1 48 0,001
Hemoglobin Ketepatan klasifikasi pada faktor-faktor yang
2 Kadar Kolesterol 11,414 2 47 9,113.10-5 mempengaruhi seseorang menderita diabetes di Pima Indian
Tabel 8 menunjukkan bahwa metode stepwise pada ditunjukkan pada Tabel 11.
analisis diskriminan faktor - faktor yang mengindikasi Tabel 11 Ketepatan Klasifikasi
seseorang merokok terdapat 2 step. Pada step pertama Prediksi
Status Tota
variabel yang masuk kedalam model adalah kadar Merokok Tidak Meroko l
hemoglobin, kemudian pada step kedua variabel yang masuk Merokok k
kedalam model adalah kadar kolesterol sehingga pada model Tidak
19 9 28
diskriminan data faktor - faktor yang mengindikasi seseorang Merokok
merokok terdapat 2 variabel yaitu kadar hemoglobin kadar Merokok 5 17 22
kolesterol. Ketepatan klasifikasi 72%
3. Parameter Model
Tabel 11 menunjukkan bahwa hasil ketepatan klasifikasi
Estimasi parameter model diskriminan terdiri dari model
untuk variabel respon, dapat diketahui bahwa hasil
diskriminan dan kebaikan model. Berikut ini merupakan pengamatan seseorang yang tidak merokok tepat diprediksi
analisis estimasi parameter model diskriminan pada faktor - bahwa seseorang tersebut tidak merokok sebanyak 19 orang
faktor yang mengindikasi seseroang merokok. dan hasil pengamatan seseorang yang tidak merokok
a. Model Diskriminan diprediksi salah bahwa seseorang tersebut merokok
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 7
sebanyak 9 orang. Hasil pengamatan seseorang yang [9] Dr. Ir. Muhamad Firdaus, M. (2017). Diabetes
merokok diprediksi dengan salah bahwa seseorang tersebut dan Rumput Laut Cokelat. Malang: Universitas
tidak merokok sebanyak 5 orang dan seseorang yang Brawijaya Press
merokok tepat diprediksi bahwa seseorang tersebut merokok [10] Dr. Abdul Salam M. Sofro, P. (2011).
sebanyak 17 orang. Persentase ketepatan klasifikasi secara
Kenaekaragaman Genetik. Yogyakarta: Andi
keseluruhan sebesar 72%.
Offset
V. KESIMPULAN/RINGKASAN
Bab ini menjelaskan kesimpulan dan saran dari hasil dari
analisis yang telah dilakukan.
A. Kesimpulan
Berdasarkan hasil analisis dan pembahasan diperoleh
kesimpulan sebagai berikut.
1. Karakteristik data menunjukkan bahwa kegaraman data
variabel hemoglobin dan trigliserida cukup besar dan
pada kolesterol kecil. Ketiga variabel tidak simetris dan
terdapat outlier pada variabel kolesterol.
2. Faktor – faktor yang mengindikasi seseorang merokok
memenuhi asumsi homogenitas dan multikolinearitas,
namun tidak memenuhi asumsi normalitas.
3. Analisis diskriminan menunjukkan variabel kadar
homoglobin dan kadar kolesterol yang signifikan, model
yang dihasilkan tidak cukup baik, serta ketepatan
klasifikasi cukup tinggi.
B. Saran
Saran yang didapatkan berdasarkan analisis dari
praktikum ini adalah pembaca dan penulis dapat memahami
serta menerapkan analisis diskriminan dengan benar. Saran
untuk perokok diharapkan mengurangi kebiasaan merokok
yang tidak memberikan manfaat bagi Kesehatan.
DAFTAR PUSTAKA
[1] Achmad, Subagyo. 2003. Jurnal Teknologi dan Industri
Pangan. Jember
[2] Johnson, R.A. And Wichern, D. 2007. Applied
Multivariate Statistical Analysis. USA: Pearson
Education,Inc.
[3] Siagian, Sondang. 2000.Manajemen Sumber Daya
Manusia. Jakarta : Bumi Aksara
[4] Rencer, A. 2002. Methods of Multivariate
Analysis. Canada: John Wiley & Sons, Inc
[5] Lind, Douglas A. (2007). Teknik-teknik Statistik
dalam Berbisnis dan Ekonomi 2 Edisi 13. Jakarta:
Salemba Empat.
[6] Santoso, Singgih. 2010. Statistik Multivariat.
Jakarta: PT. Elex Media Komputindo.
[7] Andriyani, R. (2010). Bahaya Merokok. Jakarta:
Sarana Bangun Pustaka.
[8] dr. Sri Nilawati, I. D. (2008). Care Your Self,
Kolesterol. Jakarta: PT. Niaga Swadaya.
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 8
LAMPIRAN
C.Data Penelitian
No Trigliserid Hemoglobi
. Kolesterol a n Merokok
Tidak
1 215 82 12.9 Merokok
Tidak
2 192 115 12.7 Merokok
3 242 182 15.8 Merokok
Tidak
4 322 254 14.7 Merokok
Tidak
5 184 74 12.5 Merokok
Tidak
6 217 199 16.2 Merokok
7 226 68 17 Merokok
Tidak
8 222 269 15 Merokok
Tidak
9 210 66 13.7 Merokok
Tidak
10 198 147 16 Merokok
Tidak
11 184 141 14.7 Merokok
Tidak
12 184 197 17.9 Merokok
13 178 210 14.5 Merokok
Tidak
14 155 47 12.6 Merokok
Tidak
15 269 174 13.3 Merokok
Tidak
16 228 60 13.3 Merokok
Tidak
17 217 79 13.8 Merokok
18 227 318 16.7 Merokok
19 129 119 17 Merokok
Tidak
20 198 57 12.5 Merokok
21 191 77 14.4 Merokok
22 166 94 16.6 Merokok
23 186 80 15.4 Merokok
Tidak
24 179 76 16 Merokok
25 125 85 17.1 Merokok
26 191 218 17.6 Merokok
Tidak
27 290 273 15.9 Merokok
28 209 234 14.7 Merokok
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 9
Tidak
29 207 89 14 Merokok
Tidak
30 189 90 15.4 Merokok
Tidak
31 210 140 12.9 Merokok
32 217 245 16.7 Merokok
33 129 53 15.3 Merokok
34 187 65 16 Merokok
35 148 130 13.8 Merokok
36 229 82 15.7 Merokok
37 156 53 14.9 Merokok
Tidak
38 225 269 15.9 Merokok
Tidak
39 220 255 15.3 Merokok
Tidak
40 189 79 16.6 Merokok
Tidak
41 244 69 12.9 Merokok
Tidak
42 187 61 12 Merokok
43 223 101 16.1 Merokok
44 191 68 14.5 Merokok
Tidak
45 165 164 12.8 Merokok
Tidak
46 185 58 15.5 Merokok
47 134 80 14.8 Merokok
48 154 108 16.4 Merokok
Tidak
49 234 127 13.8 Merokok
50 178 79 15.3 Merokok
Test Results
Box's M 3.429
F Approx. 1.090
df1 3
df2 410422.860
Sig. .352
b. Asumsi Multikolinearitas
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 10
Correlations
Pearson 0,98
correlation 9
P-value 0,00
0
Correlations
Cholestero triglycerid
l e
triglyceride 0,471
0,001
d. Analisis Diskriminan
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 11
Perbedaan rata-rata
Group Statistics
Wilks'
Lambda F df1 df2 Sig.
Metode Stepwise
Variables Entered/Removed a,b,c,d
Min. D Squared
Between Exact F
At each step, the variable that maximizes the Mahalanobis distance between the two
closest groups is entered.
a. Maximum number of steps is 6.
b. Maximum significance of F to enter is .05.
c. Minimum significance of F to remove is .10.
d. F level, tolerance, or VIN insufficient for further computation.
JURNAL SAINS DAN SENI ITS Vol. 4, No.1, (2015) 2337-3520 (2301-928X Print) 12
Function
Hemoglobin .820
Cholesterol -.651
Kebaikan Model dan Eigen Value
Eigenvalues
% of Cumulative Canonical
Function Eigenvalue Variance % Correlation
1 .486 a
100.0 100.0 .572
Ketepatan Klasifikasi
Classification Results a
Predicted Group
Membership
Original Count No 19 9 28
Yes 5 17 22