Anda di halaman 1dari 10

A.

Kasus-kasus dalam negeri yang berkaitaan dengan Data Mining

1. Aplikasi Data Mining Untuk Memprediksi Kelulusan Siswa Dengan Metode Naïve
Bayes Studi Kasus SMP Negeri 11 Kotabumi Utara Data mining merupakan cara untuk
menemukan informasi baru yang diambil dari data dalam jumlah besar yang
membantu dalam pengambilan keputusan. Dengan memanfaatkan data induk siswa,
kelulusan siswa, dan nilai rata-rata siswa sebagai sumber datanya, diharapkan dapat
menghasilkan informasi tentang prediksi kelulusan siswa melalui teknik data mining.
Kategori prediksi kelulusan di ukur dari jenis kelamin, perilaku, nilai rata-rata rapor
dan nilai ratarata UAS (ujian akhir sekolah). Proses teknik data mining ini ada 2
macam yaitu, proses analisa pola data kelulusan siswa yang telah ada sebelumnya
(Data Training) berdasarkan atribut – atribut yang di ujikan dan proses dari analisa
pola data baru yang diujikan berdasarkan pola yang telah ada (Data Testing).
Informasi yang ditampilkan dari proses tersebut ada 2 macam yaitu, informasi hasil
proses data training dan informasi data berupa nilai probabilitas posterior
(kemungkinan kemunculan) dari masing-masing kategori prediksi kelulusan. Pada
analisa data yang dilakukan diproses testing, di dapat tingkat keakurasian sistem
sekitar 92% dan memiliki nilai error 0.8% berdasarkan pengujian 549 data siswa
tahun 2014 sampai dengan tahun 2017 dengan menggunakan perhitungan manual
metode naïve bayes clasifision dan perhitungan pembuktian menggunakan aplikasi
RapidMiner.

2. PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI TINGKAT KEGANASAN HAMA


PADA TANAMAN PADI (Studi Kasus : Dinas Pertanian Kabupaten Kerinci) Tanaman
padi merupakan tanaman pangan yang rentan terserang hama. Pengenalan terhadap
jenis hama yang menyerang merupakan langkah awal yang sangat penting untuk
menunjang keberhasilan dalam usaha pengendaliannya. Hama tanaman padi
tersebut dapat menjadi kendala bagi petani untuk bisa meningkatkan produksi.
karena hama tersebut dapat merusak tanaman padi hingga membuat gagal panen.
Dengan diadakannya klasifikasi pada hama padi menggunakan algoritma C4.5
diharapkan para petani dapat segera mengetahui jenis hama padi dan tingkat
keganasannya. Sehingga diharapkan mampu menangani hawa secara tepat, agar
tidak terjadi kerusakan dan gagal panen.

3. PENERAPAN DATA MINING PADA PENJUALAN MENGGUNAKAN METODE CLUSTERING


STUDY KASUS PT. INDOMARCO PALEMBANG PT. Indomarco Palembang merupakan
perusahaan yang bergerak dalam bidang distribusi makanan dan minuman. Tidak
hanya PT. Indomarco Palembang, masih cukup banyak perusahaan-perusahaan lain
yang bergerak di bidang serupa. Hal tersebut tentu saja menimbulkan persaingan
bisnis antar perusahaan. Data mining dimaksudkan untuk memberikan solusi bagi
para pengambil keputusan di dunia bisnis untuk mengembangkan bisnis mereka.
Untuk itu penulis tertarik mengangkat permasalahan ini kedalam penelian skripsi
dengan judul “Penerapan Data Mining Pada Penjualan Menggunakan Metode
Clustering Study Kasus PT. Indomarco Palembang”. Tujuan dari penelitian ini untuk
melihat penjualan yang paling banyak diminati konsumen khususnya penjualan
makanan dan minuman. Manfaatnya mempermudah analisis data yang besar dan
membantu memberikan informasi data penjualan yang diolah.Salah satu metode
yang terdapat dalam data mining yang digunakan dalam penelitian ini adalah metode
Clustering (Pengelompokkan). Hasil dari penelitian ini adalah aplikasi yang dibangun
dapat membantu perusahaan sebagai gambaran dalam pengambilan keputusan
dalam rangka mendapatkan pola penjualan produk.

4. PENERAPAN DATA MINING DALAM MENGELOMPOKKAN KUNJUNGAN WISATAWAN


KE OBJEK WISATA UNGGULAN DI PROV. DKI JAKARTA DENGAN K-MEANS Kunjungan
wisatawan asing ke indonesia dapat meningkatkan devisa negara dan meningkatkan
perekonomian masyarakat di daerah wisata. Jakarta adalah ibukota indonesia yang
menjadi salah satu tujuan wisata bagi turis. Ada 8 objek wisata unggulan di provinsi
DKI jakarta menurut data BPS Prov. DKI Jakarta yakni 1) Taman Impian Jaya Ancol, 2)
Taman Mini Indonesia Indah, 3) Kebon Binatang Ragunan, 4) Monumen Nasional, 5)
Museum Nasional, 6) Museum Satria Mandala, 7) Museum Sejarah Jakarta Dan 8)
Pelabuhan Sunda Kelapa. Tujuan penelitian ini adalah melakukan analsiis penerapan
datamining dalam mengelompokkan jumlah kunjungan wisatawan asing ke Prov. DKI
Jakarta menggunakan k-means. Sumber data penelitian berasal dari BPS Prov. DKI
Jakarta. Data penelitian yang digunakan adalah jumlah pengunjung wisatawan tahun
2007-2013 sesuai dengan BPS Prov. DKI Jakarta. Data dikelompokkan menjadi 3
cluster yaitu C1= jumlah kunjungan wisatawan tinggi, C2=jumlah kunjungan
wisatawan sedang dan C3= jumlah kunjungan wisatawan rendah. Nilai centroid akhir
yang digunakan pada C1= 15.438.488, C2= 4.464.577 dan C3= 342.332. Sehingga
diperoleh hasil pengelompokan C1= Taman Impian Jaya Ancol, C2= Taman Mini
Indonesia Indah Dan Kebon Binatang Ragunan dan C3= Monumen Nasional, Museum
Nasional, Museum Satria Mandala, Museum Sejarah Jakarta Dan Pelabuhan Sunda
Kelapa. Hasil pengelompokan C3 menjadi catatan bagi pemerintah Prov. DKI. Jakarta.

5. Data Mining Aplikasi Sistem Persediaan Barang Pada PT. Bina Perkasa Cemerlang
Menggunakan Metode Economic Order Quantity (EOQ) Pada perusahaan PT. Bina
Perkasa Cemerlang sistem persediaan barang yang dilakukan pada saat ini adalah
dengan cara manual dimana persediaan barang tersebut masih dibuat dengan
menggunakan Microsoft Office dalam bentuk Microsoft Word dan Microsoft Excel
yang didalamnya dituliskan datadata mengenai data barang chemical, pengeluaran
barang, dan pemesanan barang. Namun dengan demikian untuk penyajian data
kurang efisien dan efektif. Dengan melihat situasi dan kondisi ini maka penulis
membuat sebuah aplikasi sistem persediaan barang pada PT. Bina Perkasa Cemerlang
dengan menggunakan metode Economic Order Quantity (EOQ) dimana aplikasi ini
dapat membantu pemilik perusahaan dan karyawan yang bekerja di perusahaan ini
dalam mempermudah pekerjaannya dan juga membantu mengefisienkan dan
mengefektifkan dalam mendata barang chemical, pengeluaran barang, dan juga
pemesanan barang. Dalam aplikasi ini penulis menggunakan bahasa pemrograman
visual studio.net 2008 dengan database manajemen sistem MySql , dimana nantinya
data-data akan dimasukkan dan disimpan didalam database dan dikoneksikan ke
pemrograman visual studio.net 2008 sehinggan dalam pengendalian dan
pengoptimalan persediaan barang lebih mudah, efisien, dan efektif.

6. Data Mining Perancangan Aplikasi Forecasting Persediaan Bahan Baku Produksi


Tapioka Pada PT Hutahaean Menggunakan Metode Least Square Forecasting
(peramalan) merupakan alat bantu yang penting dalam perencanaan yang efektif dan
efisien khususnya dalam bidang ekonomi. Dalam organisasi modern mengetahui
keadaan yang akan datang tidak saja penting untuk melihat yang baik atau atau buruk
tetapi juga bertujuan untuk melakukan persiapan forecasting. Langkah penting
setelah forecasting dilakukan adalah verifikasi forecasting sedemikian rupa sehingga
mencerminkan data masa lalu dan sistem penyebab yang mendasari permintaan
tersebut. Sepanjang representasi forecasting tersebut dapat dipercaya, hasil
forecasting dapat digunakan. Persediaan timbul disebabkan oleh tidak singkronnya
permintaan dengan penyediaan dan waktu. Untuk menjaga keseimbangan
permintaan dengan penyediaan diperlukan suatu forecasting.

7. Sistem Keputusan Analisa Pola Penjualan Barang Dengan Algoritma Apriori (Studi
Kasus : Lucky Swalayan) Analisis asosiasi adalah teknik data mining untuk
menemukan aturan asosiatif antara suatu kombinasi item. Adapun teknik yang
digunakan dalam penelitian ini adalah algoritma apriori menggunakan 2 nilai analisis
2 nilai penting yaitu minimum support dan confidence. Dua nilai tersebut digunakan
dengan proses iterasi untuk menemukan setiap kombinasi item barang yang disebut
proses join dan proses untuk mengeliminasi pengelompokan barang yang tidak
memenuhi minimum support yang disebut proses prune Dari teknik-teknik yang
disebutkan diatas didapatkan frekuensi dan item barang yang paling sering muncul
bersamaan yang membantu management untuk menata dan mengelompokan barang
dan mengoptimalkan persediaan produk.

8. Data Mining Prediksi Besarnya Penggunaan Listrik Rumah Tangga di Kota Batam
Dengan Menggunakan Algoritma C4.5 Aktivitas manusia dalam penggunaan listrik
telah meningkat dari waktu ke waktu. Hal ini disebabkan energi listrik telah menjadi
bagian penting bagi pengembangan peradaban manusia di berbagai bidang termasuk
ekonomi, teknologi, sosial dan budaya manusia. Peramalan strategi diperlukan untuk
energi listrik. Kebutuhan masyarakat akan energi listrik terus bertambah setiap
tahun. Selain pertumbuhan populasi, pertumbuhan ekonomi suatu daerah diyakini
menjadi salah satu faktor yang mempengaruhi meningkatnya konsumsi energi listrik
di daerah tersebut. Sebagai kota Batam di kawasan Batam Center yang merupakan
kota industri dan penduduknya cukup padat. Area Batam Center termasuk area pusat
kota Batam karena area ini dekat dengan Bandara Hang Nadim Batam dan Batam
International Port Centre. Oleh karena itu setiap rumah tangga harus memahami
penggunaan listrik yang efektif sehingga kebutuhan listrik tidak menjadi lebih besar
dari pasokan listrik. Teknik penambangan data dengan algoritma C4.5 dapat
memprediksi penggunaan listrik rumah tangga untuk lebih mudah mengatur
penggunaan listrik rumah tangga. Sampel data diambil sebanyak 30 data
koresponden yang menggunakan meteran listrik di kawasan Batam Center. Jumlah
barang elektronik, jumlah pengguna, lama waktu di rumah dan luas bangunan rumah
akan bervariasi dalam menganalisis data. Ada variabel Luas Bangun Rumah dan
Jumlah Anggota Keluarga menjadi variabel pembentuk keputusan. Hasil perhitungan
telah diuji menggunakan Weka 3.7.4 dengan hasil aturan yang sama.

9. Penerapan Data Mining untuk Clustering Kualitas Batu Bara dalam Proses
Pembakaran di PLTU Sebalang Menggunakan Metode K-Means Penelitian ini
bertujuan untuk menjelaskan bagaimana membuat cluster kualitas batubara dari
data rekapitulasi kualitas dan kuantitas batubara pada PT PLN(Persero) Sektor
Pembangkitan Sebalang. Kondisi yang ada saat ini adalah belum adanya analisis data
kualitas batubara terhadap kinerja perusahaan yang digunakan untuk membantu
pegawai dalam mengevaluasi kinerja PLTU dan pasokan batubara, memberikan
informasi pengaruh kualitas batubara terhadap produksi listrik yang dihasilkan. Salah
satu solusi yang dapat diterapkan pada permasalahan ini dengan data mining untuk
clustering kualitas batubara menggunakan algoritma K-Means. Metode Pengumpulan
data yang digunakan yaitu metode dokumentasi, dan observasi untuk memperoleh
data yang di perlukan melalui data yang telah tersedia maka akan memberikan
kemudahan kepada peneliti untuk melakukan penelitian. Tools yang digunakan dalam
penerapan data mining adalah Weka. Hasil penelitian berdasarkan hasil analisis
secara keseluruhan akan menghasilkan output cluster kualitas batubara yang buruk,
normal, dan baik di PT PLN (Persero) Sektor Pembangkitan Sebalang.
10. IMPLEMENTASI DATA MINING SEBAGAI INFORMASI STRATEGIS PENJUALAN BATIK
(STUDI KASUS BATIK MAHKOTA LAWEYAN)Sebuah data warehouse yang telah dimiliki
oleh Batik Mahkota Laweyan bisa dijadikan sebagai sumber informasi bagi
manajemen perusahaan teterka dengan rencana strategis perusahaan di masa yang
akan datang yang berkaitan dengan tren kategori batik berdasarkan nama pola batik
dan wilayah pemasarannya dari waktu ke waktu. Namun, hal ini belum didukung
dengan metode yang baik serta kemudahan dalam hal akses data untuk menentukan
rencana strategis perusahaan. Penelitian ini dimaksudkan untuk melakukan data
mining guna menemukan informasi strategis terkait penjualan batik bagi manajemen
Batik Mahkota Laweyan. Metode dalam data mining yang digunakan untuk menggali
informasi dari data warehouse Batik Mahkota Laweyan adalah Decision Tree dengan
algoritma penentuan kriteria atributnya menggunakaninformation gain. Variabel
yang dicari informasi strategisnya adalah nama kategori batik berdasarkan variabel
nama pola, propinsi wilayah pemasaran, dan jenis kelamin pelanggan. Hasil penelitian
menunjukkan bahwa atribut yang memiliki pengaruh paling tinggi untuk menentukan
klasifikasi nama kategori batik adalah nama pola (X1). Hal ini ditunjukkan dengan
variabel X1 yang menempati sebagai simpul akar (root node) dalam diagram decision
tree.
B. Kasus-kasus luar Negeri yang berkaitaan dengan Data Mining
1. Comparative Analysis of Data Mining Classification Algorithms in Type-2 Diabetes
Prediction Data Using WEKA ApproachThe goal of this paper discusses about
different types of data mining classification algorithms accuracies that are widely
used to extract significant knowledge from huge amounts of data. Here illustrate
20 classifications of supervised data mining algorithms base on type-2 diabetes
disease dataset perspective to Bangladeshi populations. In this paper we compare
20 classification algorithms by measuring accuracies, speed and robustness of
those algorithms using WEKA toolkit version 3.6.5. Accuracies of classification
algorithms are measured in 3 cases like Total Training data set, 10 fold Cross
Validation and Percentage Split (66% taken). Speed (CPU Execution Time) and
error rate also measured as like as accuracy. Firstly checked top perform
algorithms that have best outcome for different cases and then ranked top
outcomes algorithms. Finally ranked best 5 algorithms among 20 algorithms
based on their accuracies.
2. Educational data mining: A survey from 1995 to 2005Currently there is an
increasing interest in data mining and educational systems, making educational
data mining as a new growing research community. This paper surveys the
application of data mining to traditional educational systems, particular web-
based courses, well-known learning content management systems, and adaptive
and intelligent web-based educational systems. Each of these systems has
different data source and objectives for knowledge discovering. After
preprocessing the available data in each case, data mining techniques can be
applied: statistics and visualization; clustering, classification and outlier detection;
association rule mining and pattern mining; and text mining. The success of the
plentiful work needs much more specialized work in order for educational data
mining to become a mature area.
3. A Survey of Quantification of Privacy Preserving Data Mining Algorithms
he aim of privacy preserving data mining (PPDM) algorithms is to extract relevant
knowledge from large amounts of data while protecting at the same time
sensitive information. An important aspect in the design of such algorithms is the
identification of suitable evaluation criteria and the development of related
benchmarks. Recent research in the area has devoted much effort to determine a
trade-off between the right to privacy and the need of knowledge discovery. It is
often the case that no privacy preserving algorithm exists that outperforms all the
others on all possible criteria.
Therefore, it is crucial to provide a comprehensive view on a set of metrics
related to existing privacy preserving algorithms so that we can gain insights on
how to design more effective measurement and PPDM algorithms. In this
chapter, we review and summarize existing criteria and metrics in evaluating
privacy preserving techniques.

4. Study of Text Mining Using Hybrid Agglomerative Clustering With ACO Algorithms
Textual document clustering technique was introduced in the area of text mining.
The two important main goals in document clustering are achieving high
performance or efficiency and obtaining highly accurate data clusters that are
closed to their natural classes or textual document cluster quality To enhance this
work, we are going to propose a new hybrid clustering algorithm using
Agglomerative Clustering with ACO (Ant Colony Optimization) algorithm. ACO
algorithms are a class of algorithms inspired by the observation of real ants. In
this paper single linkage and K-nearest Neighbor are used to achieve the high
efficiency and high quality. And also used four parameters recall, precision, time,
document are calculated for high efficiency and high quality.
5. A Survey of Random Decision Tree Framework Privacy Preserving Data Mining
Data mining with data privacy and data utility has been emerged to
manage distributed data efficiently. In this paper, to deal with this advancement
in privacy preserving data mining technology using accentuate approach of
Random Decision Tree (RDT). Random Decision Tree provides better efficiency
and data privacy than Cryptographic technique. Cryptographic technique is too
slow and infeasible to enable truly large scale analytics to manage era of big data.
Random Decision Tree is used for multiple data mining task like classification,
regression, ranking, and multiple classifications. Privacy preserving RDT uses both
randomization and cryptographic technique which provide data privacy for some
decision tree based learning task.
6. A Survey on Various Data Mining Techniques in Field of Agriculture for Prediction
of Crop Yield
Agriculture is a key to the economy and infrastructure of India. It plays the
significant most strategic role in the progress and financial growth of the nation.
In Order to get a proper tab on the agriculture sector of the nation, state wise and
geography wise, an appropriate program can be deployed, with the help of this
program we can predict the best crop. Crop yield prediction provides information
for decision makers to maximize the crop productivity. Data mining technology
proved to be a better choice for this purpose and has become an interesting and
recent research topic in agriculture to predict the crop yield. This paper presents
a brief comparative study of various methods and techniques available that can
be used to predict the crop yield in data mining.
7. A Survey on Big Data Mining Algorithms
In recent years with the explosive development of internet the size of data
has grown a large and reached petabytes size.
Bigdataisanimmensecollectionofboth structured and unstructured data.Due to its
large size discovering knowledge or obtaining pattern from big data within an
elapsed time is a complicated task. A number of algorithmic techniques have
been designed for big data mining in an effective manner. The various mining
algorithms like Two-Phase Top -Down Specialization approach (TPTDS), Tree-
Based Association rules (TARs), FuzzyC ? Means (FCM)algorithm and Associate
Rule Mining (ARM) algorithm are surveyed in this paper and theresults obtained
are compared and evaluated by the parameters such as execution time,
information loss and extraction time.
8. A Framework for Prediction of Response to HCV Therapy Using Different
Data Mining TechniquesHepatitis C which is a widely spread disease all over the
world is a fatal liver disease caused by Hepatitis C Virus (HCV). The only approved
therapy is interferon plus ribavirin. The number of responders to this treatment is
low, while its cost is high and side effects are undesirable. Treatment response
prediction will help in reducing the patients who suffer from the side effects and
high costs without achieving recovery. The aim of this research is to develop a
framework which can select the best model to predict HCV patients’ response to
the treatment of HCV from clinical information. The framework contains three
phases which are preprocessing phase to prepare the data for applying Data
Mining (DM) techniques, DM phase to apply different DM techniques, and
evaluation phase to evaluate and compare the performance of the built models
and select the best model as the recommended one. Different DM techniques
had been applied which are associative classification, artificial
neural network, and decision tree to evaluate the framework. The experimental
results showed the effectiveness of the framework in selecting the best
modelwhich is the model built by associative classification using histology activity
index, fibrosis stage, and alanine amino transferase.

9. The Survey of Data Mining Applications And Feature Scope


In this paper we have focused a variety of techniques, approaches and different
areas of the research which are helpful and marked as the important field of data
mining Technologies. As we are aware that many MNC’s and large organizations
are operated in different places of the different countries. Each place of operation
may generate large volumes of data. Corporate decision makers require access
from all such sources and take strategic decisions .The data warehouse is used in
the significant business value by improving the effectiveness of managerial
decision-making. In an uncertain and highly competitive business environment,
the value of strategic information systems such as these are easily recognized
however in today’s business environment, efficiency or speed is not the only key
for competitiveness. This type of huge amount of data’s are available in the form
of tera- to peta-bytes which has drastically changed in the areas of science and
engineering. To analyze, manage and make a decision of such type of huge
amount of data we need techniques called the data mining which will
transforming in many fields. This paper imparts more number of applications of
the data mining and also o focuses scope of the data mining which will helpful in
the further research.

10. Data Mining: Analysis of student database using Classification TeTechniqu Data
Analysis can be categorized into two forms. One is used for extracting models
describing important classes; another is to predict future trends. Data
classification can be used to generate models which are further used to predict
the unknown classes. The accuracy of the models can be examined by checking
the percentage of correctly classified instance. Lot of classification algorithms is
available nowadays. One of the most commonly used algorithms is decision tree
because of its simplicity of implementation and easier to understand when
compared to other classification algorithms. J48 is the one of the effective
classification method. In this paper, J48 algorithm is applied for analyzing student
dataset which includes academic year, department, academic grade and job
position.
DATA MINING
"Kasus-kasus dalam negeri yang
berkaitaan dengan Data Mining dan Kasus-kasus luar Negeri yang berkaitaan dengan
Data Mining "

OLEH :

MUHAMMAD EDY SETIAWAN HAMAL


1706080075

PROGRAM STUDI ILMU KOMPUTER


FAKULTAS SAINS DAN TEKNIK
UNIVERSITAS NUSA CENDANA
KUPANG
2019

Anda mungkin juga menyukai