INFORMASI
MANAJEMEN
dan DATA MINING
Hendra Jatnika
M. Farid Rifai
Yudhy S. Purwanto
i
SISTEM INFORMASI MANAJEMEN dan DATA MINING
Penulis:
Hendra Jatnika, S.Kom., M.Kom.
Mochamad Farid Rifai, S.Kom., M.Kom.
Yudhy S. Purwanto, S.S., M.Hum., MM.
Penerbit:
CV. AKSARA GLOBAL AKADEMIA
No Anggota IKAPI: 418/JBA/2021
Office:
Intan Regency Blok W No 13, Jln. Otto Iskandardinata, Tarogong Kidul –
Garut, Jawa Barat. Kode Pos: 44151
Telp / Wa Bisnis: +6281-2222-3230
Email: aksaraglobalpublications@gmail.com
aksaraglobal.info@aksaraglobal.info
Website: aksaraglobal.com
Link Bio: https://campsite.bio/aksaraglobalakademia
Link buku:
https://wa.me/p/6028689120492545/628122223230
https://www.aksaraglobal.com/gallery
ii
Undang-Undang Republik Indonesia Nomor. 19 Tahun 2002
tentang Hak Cipta
Lingkup Hak Cipta
Pasal 2:
1. Hak Cipta merupakan hak eksklusif bagi Pencipta atau Pemegang Hak Cipta untuk
mengumumkan atau memperbanyak Ciptaannya, yang timbul secara otomatis setelah suatu
ciptaan dilahirkan tanpa mengurangi pembatasan menurut peraturan perundang-undangan yang
berlaku.
Ketentuan Pidana
Pasal 72:
1. Barangsiapa dengan sengaja atau tanpa hak melakukan perbuatan sebagaimana dimaksud dalam
Pasal 2 ayat (1) atau Pasal 49 ayat (1) dan ayat (2) dipidana dengan pidana penjara masing-
masing paling singkat 1 (satu) bulan dan/atau denda paling sedikit Rp 1.000.000,00 (satu juta
rupiah), atau pidana penjara paling lama 7 (tujuh) tahun dan/atau denda paling banyak Rp
5.000.000.000,00 (lima milyar rupiah).
2. Barangsiapa dengan sengaja menyiarkan, memamerkan, mengedarkan, atau menjual kepada
umum suatu Ciptaan atau barang hasil pelanggaran.
iii
KATA PENGANTAR
v
pengetahuan di dalam basis data atau Knowledge Discovery in
Database. Prosesnya menggunakan teknik statistik,
matematika, kecerdasan buatan, dan machine learning untuk
mengekstraksi dan mengidentifikasi informasi yang
bermanfaat dan pengetahuan yang terkait dari berbagai
database besar sehingga mampu menggali nilai tambah dari
suatu kumpulan data berupa pengetahuan yang selama ini
tidak diketahui secara manual.
Buku ini penting anda miliki terutama sebagai
mahasiswa maupun dosen teknik informatika, manajemen
atau pun bidang lainnya guna memperkaya wawasan anda
dalam bidang sistem informasi manajemen dan data mining
di era digital ini.
vi
DAFTAR ISI
URAIAN HAL
KATA PENGANTAR v
SINOPSIS vi
BAB I
PENGANTAR SISTEM INFORMASI 1
MANAJEMEN
I. Pendahuluan 1
II. Pengertian Sistem Informasi 2
Manajemen
III. Sistem Informasi Manajemen 13
(SIM)
IV. Sistem dan Komputer 15
BAB II
DATA UNTUK SIM 17
I. Pendahuluan 17
II. Metode Pengumpulan Data 17
III. Pengertian Pengolahan Data 19
IV. Operasi Data
19
V. Sentralisasi dan Desentralisasi
22
Pengolahan Data
vii
URAIAN HAL
BAB III
FUNGSI, BIAYA, NILAI DAN MUTU 25
INFORMASI
A. Fungsi Informasi 25
B. Biaya Informasi 25
C. Nilai Informasi 26
D. Mutu Informasi 29
BAB IV
PERANAN SIM DALAM KEGIATAN 31
MANAJEMEN
I. Pendahuluan 31
II. Manajemen Sebagai Suatu 31
Sistem
BAB V
KOMPONEN-KOMPONEN DARI 37
SUATU SISTEM KOMPUTER DAN
PENGELOLA INFORMASI
I. Komponen–Komponen Sistem 37
Komputer
II. Komunikasi Data 39
III. Pengelolaan Informasi 41
IV. Evolusi SIM (CBIS) 43
V. Organisasi Pengelola Informasi 44
viii
URAIAN HAL
BAB VI
PERTUKARAN SISTEM MANUAL 47
KE SISTEM KOMPUTER
I. Konversi Sistem Manual ke 47
Sistem Komputer
II. Keunggulan Kompetitif 59
BAB VII
MANAJEMEN DATABASE / DBMS 63
I. Pendahuluan 63
II. Database 63
III. Fungsi DBMMS 66
BAB VIII
DAUR HIDUP PENGEMBANGAN 69
SIM (Systems Development Life
Cycle – SDLC)
I. Rekayasa Perangkat Lunak 69
Untuk SIM
ix
URAIAN HAL
BAB IX
DAUR HIDUP PENGEMBANGAN 75
SIM 2
(Systems Development Life Cycle –
SDLC) 75
I. Dasar-Dasar Analisis
Persyaratan Perangkat Lunak
76
II. Perancangan Perangkat Lunak
SIM
III. Ujian dan Pemeliharaan 77
Perangkat Lunak SIM
BAB X
PERANCANGAN SIM SECARA 81
UMUM BERBASIS KOMPUTER
I. Perancangan Model 81
II. Perancangan Basis Data untuk 82
SIM
III. Perancangan Teknologi 83
BAB XI
DATA MINING 85
I. Definisi Data Mining 85
II. Pengelompokan Data Mining 88
90
III. Arsitektur dari Sistem Data
Mining 92
IV. CRISP-DM
x
URAIAN HAL
BAB XII
ALGORITMA C.45 97
I. Pendahuluan 97
II. Perbedaan ID3 dengan C4.5 97
III. Entropy, Information Gain & 107
Gain Ratio
BAB XIII
NAÏVE BAYES 111
I. Definisi Naïve Bayes 111
II. Kegunaan Naïve Bayes 112
III. Kelebihan Naïve Bayes 112
IV. Persamaan Metode Naive 112
Bayes
V. Contoh Naive Bayes Prediksi
Serangan Hama Penggerek 115
Batang Padi
xi
TENTANG PENULIS
xiii
Sistem Informasi Manajemen dan Data Mining
1
BAB I
PENGANTAR
SISTEM INFORMASI MANAJEMEN
I. PENDAHULUAN
erkembangnya organisasi akan diikuti dengan
B berkembangnya pula kebutuhan akan informasi pada
tiap level manajemen. Sehingga kebutuhan koordinasi dan
komunikasi juga meningkat.
Ketika sistem informasi telah dibuat, kebiasan pelaporan
formal, setengah formal bahkan yang informal dapat
distandarisasikan. Arus informasi akan diatur berdasarkan
tingkatan pemakaiannya. Kriteria bagi sistem informasi
manajemen yang tepat adalah sistem tersebut dapat
memberikan data yang cermat, tepat waktu dan penting
artinya bagi perencanaan, analisis dan pengendalian
manajemen untuk mengoptimalkan pertumbuhan
perusahaan.
Sistem diartikan sebagai suatu kumpulan atau himpunan
dari komponen-komponen yang saling berhubungan dan
saling mempengaruhi untuk mencapai suatu tujuan.
Pendekatan sistem dapat dilakukan dengan dua cara,
pertama dengan penekanan terhadap elemen atau komponen,
dan berikutnya dengan penekanan terhadap prosedur. Sistem
dengan penekanan terhadap prosedur, berarti “sistem adalah
suatu jaringan kerja dari prosedur-prosedur yang saling
2 Sistem Informasi Manajemen dan Data Mining
B. Data
Menurut The Liang Gie, data atau bahan keterangan
adalah: “Hal peristiwa atau kenyataan lainnya apa pun yang
mengandung sesuatu pengetahuan untuk dijadikan dasar
guna penyusunan keterangan, pembuatan kesimpulan atau
penerapan keputusan. Data adalah ibarat bahan mentah yang
melalui pengolahan tertentu lalu menjadi keterangan
(informasi)”.
Menurut Gordon B. Davis: ”Data, bahan mentah bagi
informasi, dirumuskan sebagai kelompok lambang-lambang
tidak acak yang menunjukkan jumlah-jumlah, tindakan-
tindakan, hal-hal, dan sebagainya. Data-data dibentuk dari
lambang grafis seperti *, $, dan ~. Data-data disusun untuk
mengolah tujuan-tujuan menjadi susunan data, susunan
kearsipan, dan pusat data atau landasan data”.
C. Informasi
Menurut Gordon B. davis: “Informasi adalah data yang
telah diolah menjadi suatu bentuk yang penting bagi si
penerima dan mempunyai nilai nyata atau yang dapat
dirasakan dalam keputusan-keputusan yang sekarang atau
keputusan-keputusan yang akan datang”.
Penulis lain, Burch dan Strater, menyatakan: “Informasi
adalah pengumpulan atau pengolahan data untuk
memberikan pengetahuan dan keterangan”.
George R. Terry, Ph.D. menyatakan bahwa informasi
adalah: “data yang penting yang memberikan pengetahuan
yang berguna”. Selanjutnya dijelaskan oleh beliau bahwa
kegunaan informasi tergantung pada:
1. Tujuan si penerima
6 Sistem Informasi Manajemen dan Data Mining
D. Manajemen
Menurut Prof. Dr. Prajudi Atmosudirjo, S.H. pengertian
manajemen itu dapat dipandang sebagai:
1. Orang-orang:
Semua orang yang mempunyai fungsi/kegiatan pokok
sebagai pemimpin-pemimpin kerja.
2. Proses:
Sistem Informasi Manajemen dan Data Mining
7
Tingkatan manajemen
Dilihat dari tingkatan organisasi, manajemen dibagi
dalam 3 tingkatan yaitu:
1. Manajemen Puncak (Top Management)
Manajer bertaggungjawab atas pengaruh yang
ditimbulkan dari keputusan-keputusan manajemen
keseluruhan dari organisasi. Misal: Direktur, wakil
direktur, direktur utama. Keahlian yang dimiliki para
manajer tingkat puncak adalah konseptual, artinya
keahlian untuk membuat dan merumuskan konsep untuk
dilaksanakan oleh tingkatan manajer dibawahnya.
2. Manajemen Menengah (Middle Management)
8 Sistem Informasi Manajemen dan Data Mining
Keterampilan Manajer
Secara umum, terdapat empat keterampilan manajer pada
masing-masing tingkat manajer:
1. Keterampilan konseptual
Keterampilan atau kemampuan mental untuk
mengkoordinasikan dan mengintegrasikan seluruh
kepentingan dan kegiatan organisasi.
2. Keterampilan Kemanusiaan
Kemampuan untuk saling bekerja sama dengan
memahami dan memotivasi orang lain.
3. Keterampilan Administrasi
Kemampuan yang ada hubungannya dengan fungsi
manajemen yang dilakukan.
4. Keterampilan Teknik
Kemampuan untuk menggunakan peralatan-peralatan,
prosedur, dan metode dari suatu bidang tertentu.
Fungsi Manajemen
Fungsi Manajemen ialah berbagai jenis tugas atau
kegiatan manajemen yang mempunyai peranan khas dan
bersifat saling menunjang untuk mencapai tujuan yang telah
ditetapkan sebelumnya.
Banyak sekali ahli yang mengemukakan tentang fungsi
manajemen ini. Ambil contoh misalnya George R. Terry. Dia
menyebutkan bahwa fungsi manajemen terdiri dari:
a. Planning (Perencanaan)
b. Organizing (Pengorganisasian)
c. Actuating (Penggerakkan)
d. Controlling (Pengawasan)
BAB II
DATA UNTUK SIM
I. PENDAHULUAN
ikemukakan oleh Gordon B. Davis, Informasi adalah
D data yang telah diolah dan yang penting artinya untuk
pengambilan keputusan. Jadi dalam hal ini informasi adalah
mengumpulkan data, kemudian mengolahnya sehingga
menjadi informasi yang berguna.
B. Melalui wawancara
Keuntungan metode ini:
1. Data yang dikumpulkan akan lebih teliti karena
dikumpulkan sendiri.
18 Sistem Informasi Manajemen dan Data Mining
Kerugiannya adalah:
1. Metode ini merupakan metode yang mahal karena harus
banyak wakil yang ditunjuk pergi ke berbagai tempat
untuk mengumpulkan data.
2. Fakta-fakta yang dikumpulkan kurang teliti.
1. Arithmetic-logic unit
2. the control unit
3. the primary storage unit
4. the console
BAB III
FUNGSI, BIAYA, NILAI DAN MUTU
INFORMASI
C. Nilai Informasi
Menurut Burch dan Strater dalam buku mereka, Information
Systems: Theory and Practice, nilai informasi itu didasarkan atas
sepuluh sifat sebagai berikut:
1. Mudahnya dapat diperoleh
Sifat ini menunjukan mudahnya dan cepatnya dapat
diperoleh keluaran informasi. Kecepatan memperolehnya
dapat diukur, akan tetapi berapa nilainya bagi pemakai
informasi, sulit mengukurnya.
2. Sifat luas dan lengkapnya
Sifat ini menunjukkan lengkapnya isi informasi. Hal ini tidak
berarti hanya mengenai volumenya, akan tetapi juga
mengenai keluaran informasinya. Sifatnya ini sangat kabur
dan oleh karena itu, sulit mengukurnya.
3. Ketelitian
Sifat ini berhubungan dengan tingkat kebebasan dari
kesalahan keluaran informasi. Dalam hubungannya dengan
Sistem Informasi Manajemen dan Data Mining
27
D. Mutu Informasi
Informasi berbeda dalam mutunya disebabkan oleh
penyimpangan atau kesalahan.
Menurut Gordon B. Davis kesalahan dapat disebabkan oleh:
1. Metode pengumpulan dan pengukuran data yang tidak tepat.
2. Tidak dapat mengikuti prosedur pengolahan yang benar.
3. Hilang atau tidak terolahnya data.
4. Pemeriksaan atau pencatatan data yang salah
5. Dokumen (induk) sejarah yang salah (atau pengunaan
dokumen sejarah yang salah).
6. Kesalahan dalam prosedur pengolahan (misalnya kesalahan
program komputer).
7. Kesalahan yang dilakukan dengan sengaja.
2. Mempermudah komunikasi.
BAB IV
PERANAN SIM DALAM KEGIATAN
MANAJEMEN
I. PENDAHULUAN
uatu Sistem Informasi Manajemen yang baik harus
S mampu memberikan dukungan pada proses-proses
berikut:
a. Proses perencanaan
b. Proses pengendalian
c. Proses pengambilan keputusan
B. Pengawasan
Pengawasan adalah suatu proses yang terdiri atas tiga
langkah penting, yakni:
1. Mengukur keluaran-keluaran system;
2. Membandingkan keluaran-keluaran ini dengan rencana,
dan menentukan penyimpangan-penyimpangan apabila
ada; dan
3. Membetulkan penyimpangan-penyimpangan yang tidak
menguntungkan dengan melakukan tindakan
pembetulan.
C. Pengambilan Keputusan
1. Unsur-unsur pengambilan keputusan
Proses yang teratur untuk mengambil keputusan
mengandung empat unsur:
a) Model
Menunjukkan suatu gambaran masalah secara kuantitatif
atau kualitatif
b) Kriteria
Menunjukkan tujuan dari masalah keputusan misalnya
untuk mencapai jasa langganan yang maksimum.
c) Pembatas
Ada faktor-faktor tambahan yang harus
dipertimbangkan dalam pemecahan masalah keputusan.
d) Optimalisasi
Apabila masalah keputusan telah diuraikan dengan
sejelas-jelasnya (model). Maka manajer menentukan apa
yang diperlukan (kriteria) dan apa yang diperbolehkan
(pembatas). Pada titik ini pengambil keputusan siap
untuk memilih penyelesaian yang terbaik atau yang
optimum.
BAB V
KOMPONEN-KOMPONEN DARI SUATU
SISTEM KOMPUTER DAN PENGELOLA
INFORMASI
4. Output
Sarana output memberikan hasil akhir dari pengolahan
data. Alat ini mencatat informasi dari komputernya di
atas berbagai macam media, seperti kartu dan media
magnetik. Dan informasi ini kemudian dicetak diatas
kertas. Di samping itu alat output ini dapat memberikan
sinyal-sinyal untuk dikirimkan melalui jaringan
teleprocessing, menghasilkan gambaran grafik, gambaran
microfilm, dan berbagai bentuk khusus lainnya. Pada
umumnya aplikasi pokok dalam perusahaan hanya
berbentuk cetakan di atas kertas (printout).
BAB VI
PERTUKARAN SISTEM MANUAL KE
SISTEM KOMPUTER
1. Uraian Sistem
Uraian sistem pada dasarnya merupakan suatu
pernyataan tentang input, output, operasi pengolahan data
serta arsip utama yang diperlukan. Tujuannya adalah untuk
memperlihatkan arus informasi yang logis dan
48 Sistem Informasi Manajemen dan Data Mining
2. Dokumen Input
Setelah uraian sistem selesai dibuat, perlu diperinci
bagaimana informasinya harus dicatat dalam bentuk yang
dapat diterima oleh komputer. Pertimbangan dalam
penentuan format ini meliputi volume dari informasi,
frekwensi, ketepatan dan keperluan verifikasinya, serta
penanganan dari informasi tersebut. Kadang-kadang
informasi itu harus diterima dalam bentuk aslinya,
sebagaimana diterima dari luaran. Dalam hal ini hanya
Sistem Informasi Manajemen dan Data Mining
49
a. Fungsi DAD:
1) DAD membantu para analis sistem meringkas
informasi tentang sistem, mengetahui hubungan antar
sub-sub sistem, membantu perkembangan aplikasi
secara efektif.
2) DAD berfungsi sebagai alat komunikasi yang baik
antara pemakai dan analis sistem.
3) DAD dapat menggambarkan sejumlah batasan otomasi
untuk pengembangan alternatif sistem fisik.
b. Komponen-komponen DAD
Ada beberapa simbol yang digunakan dalam DFD yang
merupakan karakteristik dari suatu sistem sebagai contoh
versi Yourdan De Marco, yaitu:
2. Nama Proses
Proses
b. Atribut
Atribut adalah karakteristik dari entitas atau
relationship, yang menyediakan penjelasan detail tentang
entitas atau relationship tersebut.
Setiap entitas pasti mempunyai elemen yang disebut
atribut yang berfungsi untuk mendeskripsikan karakteristik
dari entitas tersebut. Isi dari atribut mempunyai sesuatu
yang dapat mengidentifikasikan isi elemen satu dengan yang
lain. Gambar atribut diwakili oleh simbol elips.
Sistem Informasi Manajemen dan Data Mining
55
c. Hubungan/Relasi
Adalah hubungan antara sejumlah entitas yang berasal
dari himpunan entitas yang berbeda. Relasi dapat
digambarkan sebagai berikut:
Relasi yang terjadi diantara dua himpunan entitas
(misalnya A dan B) dalam satu basis data yaitu (Abdul
Kadir, 2002: 48):
1) Satu ke satu (One to one)
Hubungan relasi satu ke satu yaitu setiap entitas pada
himpunan entitas A berhubungan paling banyak dengan
satu entitas pada himpunan entitas B.
2) Satu ke banyak (One to many)
Setiap entitas pada himpunan entitas A dapat
berhubungan dengan banyak entitas pada himpunan
entitas B, tetapi setiap entitas pada entitas B dapat
berhubungan dengan satu entitas pada himpunan entitas
A.
3) Banyak ke banyak (Many to many)
56 Sistem Informasi Manajemen dan Data Mining
3. Flowchart
Flowchart merupakan gambar atau bagan yang
memperlihatkan urutan dan hubungan antar proses beserta
instruksinya. Gambaran ini dinyatakan dengan simbol.
Dengan demikian setiap simbol menggambarkan proses
tertentu. Sedangkan hubungan antar proses digambarkan
dengan garis penghubung.
Flowchart ini merupakan langkah awal pembuatan
program. Dengan adanya flowchart urutan poses kegiatan
menjadi lebih jelas. Jika ada penambahan proses maka dapat
dilakukan lebih mudah. Setelah flowchart selesai disusun,
selanjutnya pemrogram (programmer) menerjemahkannya
ke bentuk program dengan bahasa pemrograman.
Simbol-simbol flowchart
Flowchart disusun dengan simbol-simbol. Simbol ini
dipakai sebagai alat bantu menggambarkan proses di dalam
program. Simbol-simbol yang dipakai antara lain:
Terminator Symbol
Yaitu simbol untuk permulaan (start) atau
akhir (stop) dari suatu kegiatan.
Connector Symbol
Yaitu simbol untuk keluar–masuk atau
penyambungan proses dalam lembar/halaman
yang sama.
Connector Symbol
Yaitu simbol untuk keluar–masuk atau
penyambungan proses pada lembar/halaman
yang berbeda.
Processing Symbol
Simbol yang menunjukkan pengolahan yang
dilakukan oleh komputer.
Simbol Decision
Simbol pemilihan proses berdasarkan kondisi
yang ada.
58 Sistem Informasi Manajemen dan Data Mining
Simbol Input-Output
Simbol yang menyatakan proses input dan
output tanpa tergantung dengan jenis
peralatannya.
Simbol Preparation
Simbol untuk mempersiapkan penyimpanan
yang akan digunakan sebagai tempat
pengolahan di dalam storage.
Simbol Display
Simbol yang menyatakan peralatan output
yang digunakan yaitu layar, plotter, printer
dan sebagainya.
Simbol Dokumen
Simbol yang menyatakan input berasal dari
dokumen dalam bentuk kertas atau output
dicetak ke kertas.
BAB VII
MANAJEMEN DATABASE / DBMS
I. PENDAHULUAN
BMS adalah perangkat lunak yang menangani semua
D pengaksesan database. Mempunyai fasilitas membuat,
mengakses, memanipulasi dan memelihara basis data.
II. DATABASE
Apakah Database itu?
Database dapat diartikan kumpulan tabel-tabel yang
saling berelasi sehingga memudahkan proses manipulasi
data. Bila sebuah organisasi memiliki suatu koleksi terpadu
dari data yang disusun secara logis dan dikendalikan secara
sentral, maka organisasi itu mempunyai sebuah Database.
Untuk setiap database telah dikembangkan sebuah sistem
untuk penggunaan database. Sistem ini, atau suatu rangkaian
peraturan dan metode, memungkinkan pemberian definisi,
penciptaan, perubahan, pembacaan, pemeliharaan, dan
perlindungan database tersebut.
Pendek kata sistem ini adalah Sistem Manajemen
Database (DBMS = Database Management System).
Database mempunyai beberapa komponen:
1) Setidak-tidaknya satu orang menjadi “pemiliknya” dan
bertanggung jawab atas database tersebut.
2) Serangkaian peraturan dan hubungan yang menentukan
dan mengatur interaksi antara berbagai unsur dari
database.
64 Sistem Informasi Manajemen dan Data Mining
BAB VIII
DAUR HIDUP PENGEMBANGAN SIM
(Systems Development Life Cycle–SDLC)
6) Pemeliharaan.
Tahap pemeliharaan meliputi kegiatan-kegiatan koreksi
kesalahan dan penyesuaian software terhadap perubahan
lingkungannya.
b. Model Spiral
Model Spiral merupakan perbaikan dari rekayasa
perangkat lunak menggunakan model air terjun dan teknik
prototyping. Model spiral menggabungkan keuntungan-
keuntungan model air terjun dan prototyping dan
memasukkan aktivitas analisis resiko (risk analysis).
Model Spiral melibatkan proses iterasi, dimana setiap
iterasi bekerja pada satu level software SIM yang diinginkan.
Dalam model spiral, setiap perpindahan level didahului oleh
analisis resiko.
Satu-satunya permasalahan yang dihadapi dalam
penggunaan model spiral adalah menuntut keahlian dalam
bidang analisis resiko.
Rekayasa perangkat lunak SIM menggunakan model
spiral terdiri atas empat aktivitas utama, yaitu:
1) Perencanaan
Aktivitas ini meliputi; penentuan sasaran, alternatif
solusi dan hambatan.
2) Analisis Resiko
Aktivitas ini meliputi; analisis alternatif solusi dan
identifikasi resiko.
3) Perekayasaan
Perekayasaan merupakan pengembangan produk pada
level berikutnya.
4) Evaluasi Pemakai
Sistem Informasi Manajemen dan Data Mining
73
BAB IX
DAUR HIDUP PENGEMBANGAN SIM 2
(Systems Development Life Cycle–SDLC)
BAB X
PERANCANGAN SIM SECARA UMUM
BERBASIS KOMPUTER
I. PERANCANGAN MODEL
erancangan sistem atau model adalah bagaimana
P mengorganisasikan sistem ke dalam subsistem-
subsistem, serta alokasi subsistem-subsistem ke komponen-
komponen perangkat keras, perangkat lunak, serta prosedur-
prosedur.
Perancangan model SIM dapat dibedakan menjadi dua,
yaitu:
▪ Pembuatan model logik (logical model)
▪ Model fisik sistem (physical model)
c. Control Program
Control program umumnya sebagian disimpan di main
memori tepatnya di ROM dan disebut juga dengan
resident program atau resident routine.
Sistem Informasi Manajemen dan Data Mining
85
BAB XI
DATA MINING
IV. CRISP-DM
Cross-Industry Standart Process for Data mining (CRISP-
DM) yang di kembangkan tahun 1996 oleh analisis dari
beberapa industri seperti Daimler Chrysler, SPSS dan NCR.
CRISP-DM menyediakan standar proses data mining sebagai
strategi pemecahan masalah secara umum dari bisnis atau
unit penelitian.
Dalam CRISP-DM sebuah proyek data mining memiliki
siklus hidup yang terbagi dalam enam fase. Keseluruhan
fase berurutan yang ada tersebut bersifat adaptif. Fase
berikutnya dalam urutan bergantung kepada keluaran dari
fase sebelumnya. Hubungan penting antar fase digambarkan
dengan panah. Sebagai contoh, jika proses berada pada fase
modeling. Berdasar pada perilaku dan karakteristik model,
proses mungkin kembali kepada fase data preparation untuk
perbaikan lebih lanjut terhadap data atau berpindah maju
kepada fase evaluation.
Terdapat enam fase dalam CRISP-DM ini yakni
dijelaskan pada gambar berikut (Larose, 2005):
Sistem Informasi Manajemen dan Data Mining
93
BAB XII
ALGORITMA C.45
I. PENDAHULUAN
lgoritma data mining C4.5 merupakan salah satu
A algoritma yang digunakan untuk melakukan klasifikasi
atau segmentasi atau pengelompokan dan bersifat prediktif.
Klasifikasi merupakan salah satu proses pada data mining
yang bertujuan untuk menemukan pola yang berharga dari
data yang berukuran relatif besar hingga sangat besar.
Algortima C4.5 sendiri merupakan pengembangan
dari algortima ID3.
Di mana:
r = nilai perbandingan error rate
n = total sample
z = Φ-1(c)
Keterangan :
S adalah himpunan (dataset) kasus
108 Sistem Informasi Manajemen dan Data Mining
Di mana:
a = atribut.
gain(a) = information gain pada atribut a
Split(a) = split information pada atribut a
Di mana:
S = ruang (data) sample yang digunakan untuk training.
Sistem Informasi Manajemen dan Data Mining
109
A = atribut.
Si = jumlah sample untuk atribut i
Di mana:
S = ruang (data) sample yang digunakan untuk
training.
A = atribut.
|Si| = jumlah sample untuk nilai V.
|S| = jumlah seluruh sample data.
Entropi(Si) = entropi untuk sample-sample yang memiliki
nilai i
4. Latihan Soal
BAB XIII
NAÏVE BAYES
𝑃 (𝑋|𝐻) . 𝑃(𝐻)
𝑃 (𝐻|𝑋) =
𝑃(𝑋)
Sistem Informasi Manajemen dan Data Mining
113
Di mana:
X : Data dengan class yang belum diketahui
H : Hipotesis data merupakan suatu class spesifik
P(H|X) : Probabilitas hipotesis H berdasar kondisi X
(posteriori probabilitas)
P(H) : Probabilitas hipotesis H (prior probabilitas)
P(X|H) : Probabilitas X berdasarkan kondisi pada
hipotesis H
P(X) : Probabilitas X
𝑃(𝐶)𝑃(𝐹1 … . 𝐹𝑛|𝐶)
(𝐶|𝐹1. . 𝐹𝑛)
𝑃(𝐹1 … 𝐹𝑛)
𝑝𝑟𝑖𝑜𝑟 𝑥 𝑙𝑖𝑘𝑒ℎ𝑜𝑜𝑑
𝑃𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 =
𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑒
a. Suhu
Variabel ini berisi range nilai yang telah diklasifikasikan
menjadi 3 kategori yaitu Rendah, Sedang, Tinggi.
Berikut adalah suhu yang telah diklasifikasikan:
118 Sistem Informasi Manajemen dan Data Mining
b. Kelembaban Udara
Variabel ini berisi range nilai yang telah diklasifikasikan
menjadi 3 kategori yaitu Rendah, Sedang, Tinggi.
Berikut adalah kelembaban udara yang telah
diklasifikasikan:
c. Curah Hujan
Variabel ini berisi range nilai yang telah diklasifikasikan
menjadi 4 kategori yaitu Rendah, Menengah, Tinggi, dan
Sangat Tinggi. Berikut adalah curah hujan yang telah
diklasifikasikan:
d. Prediksi Serangan
Variabel prediksi serangan merupakan class atau data
yang berfungsi untuk menentukan hasil dari adanya
serangan hama. Dalam pengelompokan data sudah
ditentukan secara tetap agar tidak terjadi kesalahan
dalam proses perhitungan program. Data keputusan
prediksi serangan memiliki dua nilai yaitu “ADA” dan
“TIDAK ADA”.
Data kategori di atas kemudian diklasifikasikan. Di
bawah ini merupakan data yang telah diklasifikasikan
tersebut.
2. Kelembaban = Sedang
P(Kelembaban = Sedang| Serangan Hama = ADA) =
57
=1
57
Sistem Informasi Manajemen dan Data Mining
123
2. Akurasi Persentase
nTIDAK ADA
TIDAK ADA =(
nADA+nTIDAK ADA
) ∗ 100%
0.013598139202004
=( ) ∗ 100%
0.40579710144928 + 0.013598139202004
= 3.24%
124 Sistem Informasi Manajemen dan Data Mining
g. Hasil
Berdasarkan data training yang berhasil diklasifikasikan
138 data training yang di uji pada data serangan hama.
Metode Naive Bayes berhasil memprediksi adanya
serangan hama dengan persentase keakuratan sebesar
96.76%.
Sistem Informasi Manajemen dan Data Mining
125
DAFTAR PUSTAKA