Abstrak - Data mining merupakan teknik menggali informasi baru dari gudang data, informasi sangat penting
dan berharga karena dengan menguasai informasi maka dengan mudah mencapai sebuah tujuan, hal ini
membuat setiap orang berlomba untuk memperoleh informasi, demikian juga pada bidang kesehatan terkhusus
yang diteliti penulis yaitu penderita hipertensi. Hipertensi merupakan penyakit tidak menular yang
prevalensinya sebesar 22% pada kelompok usia ≥ 18 tahun pada 2014 dan terus meningkat serta mampu
meningkatkan risiko penyakit jantung koroner sebesar 12% dan meningkatkan risiko stroke sebesar 24%.
Kebanyakan gejala yang dialami penderita tidak dapat dideteksi secara dini. Karenanya, perlu dilakukan
penelitian dalam mendiagnosa pola perilaku dan gaya hidup terhadap penderita hipertensi menggunakan
metode algoritma apriori. Data yang didapatkan melalui penyebaran kuisioner di puskesmas Melur dan rumah
sakit Aulia Hospital. Atribut yang digunakan pada penelitian ini adalah jenis kelamin, usia, kebiasaan merokok,
kebiasaan mengkonsumsi alkohol, intensitas aktifitas fisik, olahraga, dan pola konsumsi makanan. Pada
pengujian parameter algoritma apriori dalam mencari pola dengan melihat hasil nilai support dan confidence
pada metode algoritma apriori. Pengujian penelitian ini menggunakan tools Tanagra versi 1.4. Dari pengujian
300 data penderita hipertensi menggunakan nilai support 30% dan confidence 85% ditemukan 6 pola/rules
dengan lift ratio ≥1.
Kata kunci: Hipertensi, Diagnosa, Algoritma apriori, support, confidence, lift ratio
Abstract - Data mining is a technique to dig new information from the data warehouse, information is very
important and valuable because by mastering information, it is easy to achieve a goal, this makes everyone
compete to obtain information, as well as in the field of health, especially those studied by the author, namely
people with hypertension. Hypertension is a non-communicable disease whose prevalence was 22% in the age
group of ≥ 18 years in 2014 and continues to increase and is able to increase the risk of coronary heart disease
by 12% and increase the risk of stroke by 24%. Most of the symptoms experienced by sufferers cannot be
detected early.Therefore, it is necessary to conduct research in diagnosing behavioral patterns and lifestyles for
hypertension patients using the a priori algorithm method. The data obtained through the distribution of
questionnaires at the Melur health center and Aulia Hospital. The attributes used in this study were gender,
age, smoking habits, alcohol consumption habits, intensity of physical activity, exercise, and food consumption
patterns. In testing the parameters of the a priori algorithm, it is produced in looking for patterns by looking at
the results of support and confidence values in the a priori algorithm method. Testing this study using Tanagra
tools version 1.4. From testing 300 data on hypertension patients using support values of 30% and confidence
of 85% found 6 patterns / rules with an lift ratio of ≥1.
Keywords: Hypertension, Diagnosis, Apriori algorithm, support, confidence, lift ratio
1. Pendahuluan
Penyakit hipertensi adalah suatu peningkatan tekanan darah di dalam arteri. Hipertensi merupakan kondisi
tanpa adanya gejala, dimana tekanan yang abnormal tinggi di dalam arteri menyebabkan peningkatan terhadap
resiko stroke, aneurisma, gagal jantung, serangan jantung dan kerusakan ginjal. Hipertensi adalah faktor risiko
paling sering menyebabkan terjadinya stroke iskemik dan stroke hemoragik. Angka prevalensi hipertensi pada
orang dewasa di Indonesia meningkat dari 25,8% di tahun 2013 menjadi 34,1% di tahun 2018 dengan
perbandingan tiga diantara sepuluh penduduk Indonesia yang berusia 18 tahun ke atas adalah penderita
hipertensi [1]. Hipertensi masih menjadi penyakit tidak menular yang merupakan tantangan besar di Indonesia.
Hal ini merupakan masalah Kesehatan dengan prevalensi yang tinggi.
Peningkatan tekanan darah dipengaruhi beberapa faktor risiko antara lain umur, jenis kelamin, riwayat
keluarga, genetik (faktor risiko yang tidak dapat diubah/dikontrol) dan pola perilaku hidup, seperti kebiasaan
merokok, konsumsi garam berlebihan, konsumsi lemak jenuh, penggunaan minyak jelantah, kebiasaan
konsumsi minum-minuman beralkohol, obesitas, kurang aktifitas fisik, stress, penggunaan estrogen [2]. Salah
satu kebiasaan merokok berpengaruh dalam meningkatnya denyut jantung dan tekanan darah yang diakibatkan
oleh kandungan nikotin dalam rokok [3].Sementara untuk konsumsi alkohol dan karbon monoksida memiliki
efek yang hampir sama yaitu meningkatkan keasaman darah yang berakibat darah menjadi lebih kental dan
450
Jurnal Nasional Komputasi dan Teknologi Informasi
Vol. 5 No. 3, Juni 2022
P-ISSN 2620-8342
E-ISSN 2621-3052
2. Tinjauan Pustaka
2.1. Penelitian terdahulu
Berdasarkan pengamatan penelitian terdahulu yang menerapkan metode association rule yaitu “Prediction
of Dengue Disease Through Data Mining By Using Modified Apriori Algorithm”. Penelitian ini bertujuan untuk
membantu dalam menganalisa faktor-faktor penyebab penyakit dengue dengan hasil nilai minimum support
sebesar 60% dan nilai minimum confidence sebesar 90% [7]. Algoritma apriori digunakan karena algoritma
ini merupakan Teknik asosiasi yang sederhana untuk menentukan pola penyebab penyakit dengue yang dialami
penderita.
2.2. Data Mining
Data Mining atau penambangan data merupakan proses seleksi, eksplorasi, dan pemodelan dari sejumlah
besar data untuk menemukan pola atau kecenderungan yang biasanya tidak disadari keberadaannya. Data
mining mempunyai fungsi yang penting dalam membantu mendapatkan informasi yang berguna serta
meningkatkan pengetahuan bagi penggunanya [8]. Pada dasarnya, data mining mempunyai empat fungsi dasar
yaitu :
1. Deskripsi
Deskripsi bertujuan mengidentifikasi pola yang muncul secara berulang pada suatu data dan mengubah
pola tersebut menjadi aturan dan kriteria yang dapat dipahami oleh para ahli pada domain aplikasi yang
digunakan. Aturan yang dihasilkan harus mudah dimengerti agar dapat efektif meningkatkan pengetahuan
(knowledge) pada sistem dan dapat memvalidasi serta menjelaskan hasil dari proses data mining.
2. Prediksi
Prediksi merupakan proses menemukan model atau fungsi dalam menggambarkan class atau konsep dari
suatu data berdasarkan perilaku atau nilai yang diperkirakan pada masa yang akan datang.
3. Estimasi
Estimasi merupakan proses menetukan model atau fungsi berdasarkan variabel target estimasi yang lebih
ke numerik dan dibangun menggunakan record lengkap yang menyediakan nilai dan variabel target sebagai
nilai prediksi.
4. Klasifikasi
Klasifikasi merupakan proses menemukan model atau fungsi yang mendeskripsikan dan membedakan data
ke dalam kelas-kelas dengan melibatkan proses pemeriksaan karakteristik dari objek dan memasukkan
objek ke dalam salah satu kelas yang sudah didefinisikan sebelumnya.
5. Clustering
Clustering merupakan pengelompokan data tanpa melihat berdasarkan kelas data tertentu ke dalam kelas
451
Jurnal Nasional Komputasi dan Teknologi Informasi
Vol. 5 No. 3, Juni 2022
P-ISSN 2620-8342
E-ISSN 2621-3052
objek yang sama. Sebuah kluster adalah kumpulan record yang memiliki kemiripan denga record dalam
kluster lain dengan tujuan dapat menghasilkan pengelompokan objek yang mirip satu sama lain dalam
kelompok-kelompok.
6. Asosiasi
Asosiasi dalam data mining adalah menemukan atribut yang muncul dalam suatu waktu. Tugas asosiasi
berusaha untuk mengungkap aturan untuk mengukur atau melihat hubungan antara dua atau lebih atribut.
2.3. Algoritma Apriori
Algoritma apriori adalah teknik data mining untuk menemukan aturan suatu kombinasi item. Salah satu
tahapan analisis asosiasi yang menarik banyak perhatian dalam penelitian untuk menghasilkan algoritma yang
baik dan efisien adalah analisis pola frekuensi tinggi (frequent pattern mining) [9][11]. Nilai support adalah
nilai penunjang atau presentase kombinasi pada sebuah item dalam database [10]. Nilai confidence adalah nilai
kepastian yang mengaitkan hubungan antar item dalam sebuah apriori. Nilai confidence bisa dicari dengan
menghitung. Dalam perhitungan metode ini terdapat pembentukan aturan asosiasi dalam pencarian pola
frekuensi. Metode dasar pada analisis asosiasi ada dua tahap dengan aturan perhitungang sebagai berikut :
∑ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴
𝑆𝑢𝑝𝑝𝑜𝑟𝑡(𝐴) = ∑ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖
= 100% (2.1)
Sedangkan pada nilai support dari 2 item diperoleh dengan rumus sebagai berikut:
Tahapan berikut ini mencari aturan asosiatif yang memenuhi syarat minimum untuk confidence dengan
menghitung confidence A→B nilai confidence dari aturan A→B diperoleh dengan rumus :
Setelah itu dilakukan perhitungan lift ratio dengan menghitung nilai expected confidence terlebih dahulu
dengan rumus sebagai berikut:
Nilai lift ratio didapat dengan perbandingan nilai confidence dengan rumus sebagai berikut :
𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒
Lift Ratio = (5)
𝐸𝑥𝑝𝑒𝑐𝑡𝑒𝑑 𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒
Batasan pada nilai lift ratio dapat ditentukan dengan melihat jika tinggi nilai lift ratio maka akan semakin besar
kekuatan asosiasi pada kombinasi itemset tersebut.
2.4. Tanagra
Tanagra merupakan salah satu software dalam data mining yang dibangun dengan tujuan untuk
memberikan akses pada beberapa algoritma data mining. Tanagra dapat melakukan beberapa metode data
mining mulai dari mengeksplorasi analisis data, pembelajaran statistic, pembelajaran mesin, dan database.
3. Metode Penelitian
Metodologi penelitian merupakan tahapan-tahapan yang dilakukan oleh penulis untuk menganalisa suatu
masalah. Secara garis besar langkah-langkah penelitian dapat dilihat pada Gambar 1.
452
Jurnal Nasional Komputasi dan Teknologi Informasi
Vol. 5 No. 3, Juni 2022
P-ISSN 2620-8342
E-ISSN 2621-3052
Berikut Langkah-langkah metode penelitian pada Gambar 1 yang dapat diuraikan seperti berikut ini:
1. Perencanaan
Tahapan ini merupakan awal dari tahapan metodologi penelitian dengan melakukan studi pustaka atau studi
literatur. Pada tahapan ini akan dijelaskan bagaimana pengumpulan data dan infomasi dari berbagai sumber
yang didapat. Hasil yang didapat dari permasalahan pada tahapan ini adalah penerapan metode algoritma
Apriori dalam menentukan pola antar atribut terhadap penyakit hipertensi yang dapat digunakan sebagai
penunjang informasi penyakit hipertensi.
2. Pengumpulan Data
Pada tahapan ini dilakukan pengumpulan data namun bukan hanya mengambil data yang ada, akan tetapi
dapat mendeskripsikan data yang ada dan memiliki kontribusi terhadap pengetahuan. Pada tahapan ini terdapat
dua kegiatan dalam pengumpulan data, yaitu :
a. Data Primer
Pada tahapan ini pengumpulan data langsung dari sumber data dengan cara menyebar angket ke puskesmas
melur dan rumah sakit yang ada di kota pekanbaru. Data ini berupa seputar pertanyaan mengenai pola hidup
dan konsumsi sehari-hari. Selain itu juga dilakukan berupa pencarian informasi yang berkaitan dengan
metode asosiasi yang akan digunakan dalam penelitian.
b. Pengolahan Data Awal
Data yang sudah dikumpulkan akan diolah agar mengurangi data yang tidak relevan atau data yang
memiliki atribut yang hilang. Pada pengolahan ini data yang nilainya redudan (berlebihan) akan dikonversi
kedalam kelompok yang lebih kecil untuk mempermudah pembentukan model data.
3. Perancangan Algoritma Apriori
Pada tahapan ini akan dilakukan perancangan dengan algoritma apriori sehingga diperoleh nilai support
dan confidence yang dapat menghasilkan suatu aturan pola market basket analysis pada data penderita
hipertensi.
4. Implementasi Algoritma Apriori
Pada tahapan ini dilakukan langkah-langkah dalam menganalisa pola frekuensi dari tiap atribut yang
diproses dan dari pembentukan frekuensi tertinggi itu maka dapat ditentukan aturan asosiasi sesuai yang
diharapkan.
5. Pengujian Hasil
Pada tahapan ini, penulis melakukan pengujian menggunakan software data mining Tanagra 1.4. Sistem
diuji dengan prosedur-prosedur untuk melakukan eksplorasi dan permodelan dari data-data yang ada sehingga
mendapatkan suatu hubungan tersembunyi dari data tersebut.
453
Jurnal Nasional Komputasi dan Teknologi Informasi
Vol. 5 No. 3, Juni 2022
P-ISSN 2620-8342
E-ISSN 2621-3052
454
Jurnal Nasional Komputasi dan Teknologi Informasi
Vol. 5 No. 3, Juni 2022
P-ISSN 2620-8342
E-ISSN 2621-3052
Kombinasi 2 itemset
Proses pembentukan C2 atau disebut 2 itemset dicari dengan rumus (2.2) Analisa pola frekuensi tinggi, dari
table 4 dan melihat frekuensinya dari Tabel 5.
455
Jurnal Nasional Komputasi dan Teknologi Informasi
Vol. 5 No. 3, Juni 2022
P-ISSN 2620-8342
E-ISSN 2621-3052
Kombinasi 3 itemset
Proses pembentukan C3 atau disebut 3 itemset bisa dilihat pada Table 7.
Kombinasi 4 itemset
Proses pembentukan C4 atau disebut 4 itemset bisa dilihat pada Table 8.
Kombinasi 5 itemset
Proses pembentukan C5 atau disebut 5 itemset bisa dilihat pada Table 9.
456
Jurnal Nasional Komputasi dan Teknologi Informasi
Vol. 5 No. 3, Juni 2022
P-ISSN 2620-8342
E-ISSN 2621-3052
Kombinasi 6 itemset
Proses pembentukan C6 atau disebut 6 itemset bisa dilihat pada Table 10.
Adapun penjelasan dari rules yang diperoleh berdasarkan pola perilaku dan gaya hidup penderita hipertensi
adalah sebagai berikut:
1. KGL6,KO2 => KLJ6. Jika penderita hipertensi mengkonsumsi gula setiap hari dan kadang-kadang
mengkonsumsi obat, maka penderita hipertensi tersebut mengkonsumsi lemak jenuh setiap hari. Dengan
nilai support 30%, confidence 88 % dan lift ratio 2. Berdasarkan nilai lift ratio yang diperoleh, maka rule
ini layak dijadikan sebagai informasi karena memiliki nilai lift ratio ≥ 1.
457
Jurnal Nasional Komputasi dan Teknologi Informasi
Vol. 5 No. 3, Juni 2022
P-ISSN 2620-8342
E-ISSN 2621-3052
2. KO2,KLJ6 => KGL6. Jika penderita hipertensi kadang-kadang mengkonsumsi obat dan mengkonsumsi
lemak jenuh setiap hari, maka penderita hipertensi tersebut mengkonsumsi gula setiap hari. Dengan nilai
support 30%, confidence 93% dan lift ratio 1.86. Berdasarkan nilai lift ratio yang diperoleh maka rule ini
layak dijadikan sebagai informasi karena memiliki nilai lift ratio ≥ 1.
3. KA1,PR => M1. Jika penderita hipertensi tidak mengkonsumsi alkohol dan ia perempuan, maka penderita
hipertensi tersebut tidak merokok. Dengan nilai support 41%, confidence 99% dan lift ratio 1.61.
Berdasarkan nilai lift ratio yang diperoleh maka rule ini layak dijadikan sebagai informasi karena memiliki
nilai lift ratio ≥ 1.
4. KG6,PR => M1. Jika penderita hipertensi mengkonsumsi garam setiap hari dan ia perempuan, maka
penderita hipertensi tersebut tidak merokok. Dengan nilai support 30%, confidence 98% dan lift ratio 1.61.
Berdasarkan nilai lift ratio yang diperoleh maka rule ini layak dijadikan sebagai informasi karena memilik
nilai lift ratio ≥ 1.
5. AF2,PR => M1. Jika penderita hipertensi melakuan aktifitas fisik yang cukup dan ia perempuan, maka
penderita hipertensi tersebut tidak merokok. Dengan nilai support 30%, confidence 98% dan lift ratio 1.61.
Berdasarkan nilai lift ratio yang diperoleh maka rule ini layak dijadikan sebagai informasi karena memiliki
nilai lift ratio ≥ 1.
6. PR => M1. Jika penderita hipertensi adalah perempuan, maka ia tidak merokok. Dengan nilai support 50%,
confidence 98% dan lift ratio 1.60. Berdasarkan nilai lift ratio yang diperoleh maka rule ini layak dijadikan
sebagai informasi karena memiliki nilai lift ratio ≥ 1.
5. Kesimpulan
Berdasarkan pembahasan yang telah dilakukan dengan algoritma Apriori dan telah dilakukan pengujian
dengan aplikasi Tanagra versi 1.4 maka peneliti menndapat beberapa kesimpulan yaitu, proses penentuan
analisis pola perilaku dan gaya hidup pada 300 data penderita hipertensi dengan menggunakan algoritma apriori
dapat dikombinasi hingga menghasilkan 3 itemset dan 6 rules. Pengetahuan baru yang dapat diperoleh
berdasarkan hasil perhitungan algoritma apriori dapat diketahui pola konsumsi dan aktifitas penderita
hipertensi yang dominan yaitu penderita hipertensi yang mengkonsumsi gula setiap hari, kadang-kadang
mengonsumsi obat, maka ia mengkonsumsi lemak jenuh setiap hari. Penerapan Algoritma Apriori pada teknik
Data Mining sangat efisien dan dapat mempercepat proses pembentukan kecenderungan pola kombinasi
itemset dari data penderita hipertensi dengan lift ratio tertinggi 2, support 30% dan confidence 88%.
Daftar Pustaka
[1] Harmeiwaty, "Hipertensi Jadi Faktor Utama Stroke, Lakukan PTDR (Pengukuran Tekanan Darah di
Rumah )Untuk Mencegahnya. Jakarta. Kompas.com," 2019.
[2] RISKESDAS, "Riset Kesehatan Dasar (RISKESDAS) 2013," 2016.
[3] Waruwu and Buulolo, "Implementasi Algoritma Apriori Pada Analisa Pola Data Penyakit Manusia
Yang Disebabkan Oleh Rokok," pp. Vol.1, No. 1, Oktober 2017. ISSN 2597-464, 2017.
[4] Komaling, "Hubungan Mengonsumsi Alkohol Dengan Kejadian Hipertensi pada Laki-laki di Desa
Tompasobaru II Kecamatan Tompasobaru Kabupaten Minahasa Selatan," pp. Vol. 1, No. 1, 2013.
[5] Kusrini and Luthfi, "Algoritma Data Mining," 2016.
[6] Mulyana, "Pemakaian Metode asosiasi Dalam Data Mining untuk Penjualan Lebih Dari Satu Jenis
Produk Pada Perusahaan," pp. Vol. 10, No. 1, 2016.
[7] Jahangir and Hannan, "Prediction of Dengue Disease Through Data Mining By Using Modified Apriori
Algorithm," pp. ACM ISBN 978-1-4503-6447-8/18/07, 2018.
[8] A. s. darmawan, "Algoritma Apriori Untuk Rekomendasi Penawaran Produk Di Batik Putra Ghofur
Pekalongan," Jurnal Litbang Kota Pekalongan, Vols. vol.8 hal 65-73, 2015.
[9] S. Ristianingrum, "Implementasi Data Mining Menggunakan Algoritma Apriori," Prodising Sintak,
2017.
[10] H. S. B. R. Kennedi Tampubolon, "Implementasi Data Mining Algoritma Apriori Pada Sistem
Persediaan Alat-Alat Kesehatan, Informasi Dan Teknologi Ilmiah," 2016.
[11] N. R. S. Purba and F. Riandari, “Implementasi Data Mining Menggunakan Algoritma Apriori Untuk
Analisis Keranjang Belanja Transaksi Penjualan Pada PT Madu Kembang Joyo,” J. Nas. Komputasi
dan Teknol. Inf., vol. 4, no. 1, 2021.
458