Anda di halaman 1dari 143

SISTEM

INFORMASI
MANAJEMEN
dan DATA MINING

Hendra Jatnika
M. Farid Rifai
Yudhy S. Purwanto

PENERBIT CV. AKSARA GLOBAL AKADEMIA

i
SISTEM INFORMASI MANAJEMEN dan DATA MINING

Penulis:
Hendra Jatnika, S.Kom., M.Kom.
Mochamad Farid Rifai, S.Kom., M.Kom.
Yudhy S. Purwanto, S.S., M.Hum., MM.

ISBN: ISBN: 978-623-6387-62-7


xi + 126 hlm, 15.5x23.5 cm

Desain Cover & Layout:


Mia Aksara

Penerbit:
CV. AKSARA GLOBAL AKADEMIA
No Anggota IKAPI: 418/JBA/2021
Office:
Intan Regency Blok W No 13, Jln. Otto Iskandardinata, Tarogong Kidul –
Garut, Jawa Barat. Kode Pos: 44151
Telp / Wa Bisnis: +6281-2222-3230
Email: aksaraglobalpublications@gmail.com
aksaraglobal.info@aksaraglobal.info
Website: aksaraglobal.com
Link Bio: https://campsite.bio/aksaraglobalakademia
Link buku:
https://wa.me/p/6028689120492545/628122223230
https://www.aksaraglobal.com/gallery

Cetakan Pertama: Juli 2022

Isi diluar tanggung jawab penerbit


@Hak cipta dilindungi undang-undang

ii
Undang-Undang Republik Indonesia Nomor. 19 Tahun 2002
tentang Hak Cipta
Lingkup Hak Cipta
Pasal 2:
1. Hak Cipta merupakan hak eksklusif bagi Pencipta atau Pemegang Hak Cipta untuk
mengumumkan atau memperbanyak Ciptaannya, yang timbul secara otomatis setelah suatu
ciptaan dilahirkan tanpa mengurangi pembatasan menurut peraturan perundang-undangan yang
berlaku.

Ketentuan Pidana
Pasal 72:
1. Barangsiapa dengan sengaja atau tanpa hak melakukan perbuatan sebagaimana dimaksud dalam
Pasal 2 ayat (1) atau Pasal 49 ayat (1) dan ayat (2) dipidana dengan pidana penjara masing-
masing paling singkat 1 (satu) bulan dan/atau denda paling sedikit Rp 1.000.000,00 (satu juta
rupiah), atau pidana penjara paling lama 7 (tujuh) tahun dan/atau denda paling banyak Rp
5.000.000.000,00 (lima milyar rupiah).
2. Barangsiapa dengan sengaja menyiarkan, memamerkan, mengedarkan, atau menjual kepada
umum suatu Ciptaan atau barang hasil pelanggaran.

iii
KATA PENGANTAR

S egala Puji dan Syukur kami panjatkan selalu kepada Tuhan


Yang Maha Esa atas rahmat, taufiq, dan hidayah yang
sudah diberikan-Nya sehingga kami bisa menyelesaikan
buku ini dengan tepat waktu. Tujuan dari penulisan buku ini
tidak lain adalah untuk membantu para mahasiswa maupun
dosen di dalam memahami Sistem Informasi Manajemen dan
Data Mining.
Kami menyadari bahwa penulisan buku ini bukan
merupakan buah hasil kerja keras kami sendiri. Ada banyak
pihak yang sudah berjasa dalam membantu kami di dalam
menyelesaikan buku ini, seperti pihak yang terlibat dalam
pengambilan data, pemilihan contoh, dan lain-lain. Maka dari
itu, kami mengucapkan banyak terimakasih kepada semua
pihak yang telah membantu memberikan wawasan dan
bimbingan kepada kami sebelum maupun ketika menulis ini.
Kami juga mengucapkan terima kasih kepada penerbit yang
menerbitkan buku ini sehingga buku ini akan tersebar
luaskan bagi pihak yang membutuhkan informasi yang
terkandung di buku ini.
Tak ada gading yang tak retak, buku yang kami susun
masih belum bisa dikatakan sempurna. Maka dari itu, kami
meminta dukungan dan masukan dari para pembaca, agar
turut mengkoreksi isi buku agar kami bisa melakukan
perbaikan di kemudian hari.

Jakarta, Juli 2022


Penulis
iv
SYNOPSIS

uku ini membahas Sistem Informasi Manajemen (SIM)


B yang merupakan metode formal dalam menyediakan
informasi yag akurat dan tepat waktu kepada manajemen
untuk mempermudah proses pengambilan keputusan dan
membuat organisasi dapat melakukan fungsi perencanaan,
operasi secara efektif dan pengendalian. Sistem yang
dibangun dan dijalankan dengan menggunakan komputer
sebagai alat bantunya. Elemen-elemen yang saling
berhubungan membentuk satu kesatuan untuk melaksanakan
pengolahan data untuk menghasilkan informasi dengan
menggunakan perangkat komputer. Elemen-elemen yang
saling berhubungan tersebut adalah: Perangkat keras
(Hardware), Perangkat lunak (Software), dan Brainware.
Dalam buku ini dibahas mengenai rekayasa perangkat
lunak SIM sebagai penerapan dan pemanfaatan prinsip-
prinsip rekayasa untuk menghasilkan software yang
ekonomis, andal dan bekerja secara efisien pada mesin-mesin
yang nyata. Di mana perancangan basis data dalam SIM
secara umum dilakukan dengan menentukan kebutuhan-
kebutuhan file-file dalam basis data berdasarkan DAD sistem
baru yang telah dibuat dan kemudian menentukan parameter
file dalam basis data.
Agar bisa membantu para pembaca memahami SIM
lebih jauh, maka para penuis melengkapi buku ini dengan
materi yang membahas mengenai data mining. Data mining
adalah langkah analisis terhadap proses penemuan

v
pengetahuan di dalam basis data atau Knowledge Discovery in
Database. Prosesnya menggunakan teknik statistik,
matematika, kecerdasan buatan, dan machine learning untuk
mengekstraksi dan mengidentifikasi informasi yang
bermanfaat dan pengetahuan yang terkait dari berbagai
database besar sehingga mampu menggali nilai tambah dari
suatu kumpulan data berupa pengetahuan yang selama ini
tidak diketahui secara manual.
Buku ini penting anda miliki terutama sebagai
mahasiswa maupun dosen teknik informatika, manajemen
atau pun bidang lainnya guna memperkaya wawasan anda
dalam bidang sistem informasi manajemen dan data mining
di era digital ini.

vi
DAFTAR ISI

URAIAN HAL

HALAMAN COPY RIGHT iii

KATA PENGANTAR v

SINOPSIS vi

DAFTAR ISI vii

BAB I
PENGANTAR SISTEM INFORMASI 1
MANAJEMEN
I. Pendahuluan 1
II. Pengertian Sistem Informasi 2
Manajemen
III. Sistem Informasi Manajemen 13
(SIM)
IV. Sistem dan Komputer 15

BAB II
DATA UNTUK SIM 17
I. Pendahuluan 17
II. Metode Pengumpulan Data 17
III. Pengertian Pengolahan Data 19
IV. Operasi Data
19
V. Sentralisasi dan Desentralisasi
22
Pengolahan Data

vii
URAIAN HAL

BAB III
FUNGSI, BIAYA, NILAI DAN MUTU 25
INFORMASI
A. Fungsi Informasi 25
B. Biaya Informasi 25
C. Nilai Informasi 26
D. Mutu Informasi 29

BAB IV
PERANAN SIM DALAM KEGIATAN 31
MANAJEMEN
I. Pendahuluan 31
II. Manajemen Sebagai Suatu 31
Sistem

BAB V
KOMPONEN-KOMPONEN DARI 37
SUATU SISTEM KOMPUTER DAN
PENGELOLA INFORMASI
I. Komponen–Komponen Sistem 37
Komputer
II. Komunikasi Data 39
III. Pengelolaan Informasi 41
IV. Evolusi SIM (CBIS) 43
V. Organisasi Pengelola Informasi 44

viii
URAIAN HAL

BAB VI
PERTUKARAN SISTEM MANUAL 47
KE SISTEM KOMPUTER
I. Konversi Sistem Manual ke 47
Sistem Komputer
II. Keunggulan Kompetitif 59

III. Penerapan Model untuk Sistem


60
Pemecahan Masalah di
Perusahaan

BAB VII
MANAJEMEN DATABASE / DBMS 63
I. Pendahuluan 63
II. Database 63
III. Fungsi DBMMS 66

BAB VIII
DAUR HIDUP PENGEMBANGAN 69
SIM (Systems Development Life
Cycle – SDLC)
I. Rekayasa Perangkat Lunak 69
Untuk SIM

ix
URAIAN HAL

BAB IX
DAUR HIDUP PENGEMBANGAN 75
SIM 2
(Systems Development Life Cycle –
SDLC) 75
I. Dasar-Dasar Analisis
Persyaratan Perangkat Lunak
76
II. Perancangan Perangkat Lunak
SIM
III. Ujian dan Pemeliharaan 77
Perangkat Lunak SIM

BAB X
PERANCANGAN SIM SECARA 81
UMUM BERBASIS KOMPUTER
I. Perancangan Model 81
II. Perancangan Basis Data untuk 82
SIM
III. Perancangan Teknologi 83

BAB XI
DATA MINING 85
I. Definisi Data Mining 85
II. Pengelompokan Data Mining 88
90
III. Arsitektur dari Sistem Data
Mining 92
IV. CRISP-DM

x
URAIAN HAL

BAB XII
ALGORITMA C.45 97
I. Pendahuluan 97
II. Perbedaan ID3 dengan C4.5 97
III. Entropy, Information Gain & 107
Gain Ratio

BAB XIII
NAÏVE BAYES 111
I. Definisi Naïve Bayes 111
II. Kegunaan Naïve Bayes 112
III. Kelebihan Naïve Bayes 112
IV. Persamaan Metode Naive 112
Bayes
V. Contoh Naive Bayes Prediksi
Serangan Hama Penggerek 115
Batang Padi

DAFTAR PUSTAKA 125

xi
TENTANG PENULIS

Hendra Jatnika, S.Kom., M.Kom adalah


dosen tetap pada program studi Teknik
Informatika, Fakultas Telematika Energi,
Institut Teknologi PLN (ITPLN). Selain
melaksanakan kewajiban Tridharma
Perguruan Tinggi, saat ini menjabat sebagai
Kepala Information Technology Certification
Center ITPLN dalam menyelenggarakan kegiatan pelatihan
bidang IT, Sertifikasi Internasional program Microsoft dan
MiktoTik. Karya buku yang sudah dipublikasikan yaitu: (1)
Pengantar Sistem Basis Data, tahun 2013, (2) Sistem Infomasi
Manajemen Berbasis Komputer, tahun 2013 (3) Internet of
Things: Mikrokontroler Arduino, tahun 2020, (4) Internet of
Things (IoT): Implementasi Mikrokontroler Pendeteksi Udara
dan Air, tahun 2021, (5) The Certification Material of Microsoft
Office Specialist Microsoft Word 2016: The Guide Book, tahun
2021.

Mochamad Farid Rifai, S.Kom., M.Kom


adalah dosen tetap pada program studi
Teknik Informatika, Fakultas Telematika
Energi, Institut Teknologi PLN (ITPLN).
Selain menjadi dosen, saat ini menjabat
sebagai Kepala Seksi Sistem Informasi
pada Pangkalan Data dan Sistem Informasi
ITPLN dan sebagai peneliti di bidang Data Science, IoT dan
Information System. Aktif sebagai Trainer dan Proctor
Microsoft dan MiktoTik pada program Microsoft Technology
Associate (MTA), Microsoft Office Specialist (MOS), Microsoft
xii
Certified Educator (MCE), Microsoft Certified Fundamentals:
Azure AI (MCF), MikroTik Certified Network Associate
(MTCNA), MikroTik Certified Routing Engineer (MTCRE).
Karya buku yang sudah dipublikasikan yaitu: (1) Internet of
Things (IoT): Implementasi Mikrokontroler Pendeteksi Udara
dan Air, tahun 2021. (2) Internet of Things: Mikrokontroler
Arduino, tahun 2020.

Yudhy S. Purwanto, M.Kom adalah


dosen tetap pada program studi
Teknik Informatika, Fakultas
Telematika Energi, Institut Teknologi
PLN (ITPLN). Karya buku yang sudah
dipublikasikan yaitu: (1) Internet of
Things (IoT): Implementasi
Mikrokontroler Pendeteksi Udara dan Air, tahun 2021. (2)
Internet of Things: Mikrokontroler Arduino, tahun 2020

xiii
Sistem Informasi Manajemen dan Data Mining
1

BAB I
PENGANTAR
SISTEM INFORMASI MANAJEMEN

I. PENDAHULUAN
erkembangnya organisasi akan diikuti dengan
B berkembangnya pula kebutuhan akan informasi pada
tiap level manajemen. Sehingga kebutuhan koordinasi dan
komunikasi juga meningkat.
Ketika sistem informasi telah dibuat, kebiasan pelaporan
formal, setengah formal bahkan yang informal dapat
distandarisasikan. Arus informasi akan diatur berdasarkan
tingkatan pemakaiannya. Kriteria bagi sistem informasi
manajemen yang tepat adalah sistem tersebut dapat
memberikan data yang cermat, tepat waktu dan penting
artinya bagi perencanaan, analisis dan pengendalian
manajemen untuk mengoptimalkan pertumbuhan
perusahaan.
Sistem diartikan sebagai suatu kumpulan atau himpunan
dari komponen-komponen yang saling berhubungan dan
saling mempengaruhi untuk mencapai suatu tujuan.
Pendekatan sistem dapat dilakukan dengan dua cara,
pertama dengan penekanan terhadap elemen atau komponen,
dan berikutnya dengan penekanan terhadap prosedur. Sistem
dengan penekanan terhadap prosedur, berarti “sistem adalah
suatu jaringan kerja dari prosedur-prosedur yang saling
2 Sistem Informasi Manajemen dan Data Mining

berhubungan, berkumpul bersama untuk melakukan suatu


kegiatan atau untuk menyelesaikan suatu tujuan tertentu”.

II. PENGERTIAN SISTEM INFORMASI MANAJEMEN


A. Pengertian Sistem (Sistem Abstrak dan Sistem Fisik)
Gordon B. Davis dalam bukunya, Management
Information System: Conceptual Foundation, Structure, and
Development, menyatakan sebagai berikut:
“Sistem dapat abstrak atau fisik. Sistem yang abstrak adalah
susunan yang teratur dari gagasan-gagasan atau konsepsi-konsepsi
yang saling tergantung. Misalnya, sistem teologi adalah susunan
yang teratur dari gagasan-gagasan tentang tuhan, manusia, dan
sebagainya. Sistem yang bersifat fisik adalah serangkaian unsur
yang bekerja sama untuk mencapai suatu tujuan“.
Untuk menjelaskan sistem yang bersifat fisik, Gordon B.
davis memberikan contoh-contoh antara lain sebagai berikut:
“Sistem angkutan pegawai-pegawai, mesin-mesin, dan
organisasi yang mengangkut barang-barang. Sistem sekolah,
gedung-gedung, guru-guru, administrator-administrator, buku-
buku pelajaran, dan sebagainya yang bersama-sama berfungsi
memberikan pelajaran kepada para siswa”.
Norman L. Enger bukunya, Management Standards for
Developing Information Sistems, menulis bahwa: “a system
consists of related that meet company objectives such as inventory
control or production scheduling”, suatu sistem terdiri atas
kegiatan-kegiatan yang berhubungan guna mencapai tujuan-
tujuan perusahaan seperti pengendalian inventaris atau
penjadwalan produksi.
Sistem Informasi Manajemen dan Data Mining
3

Prof. Dr. Mr. S. Prajudi Atmosudirdjo dalam bukunya


Pengambilan Keputusan, mengatakan: “Sistem sebagaimana
telah saya rumuskan dalam bagian-bagian terdahulu adalah
setiap sesuatu yang terdiri atas obyek-obyek, atau unsur-
unsur, atau komponen-komponen yang bertata-kaitan dan
bertata-hubungan satu sama lain sedemikian rupa sehingga
unsur-unsur tersebut merupakan suatu kesatuan pemrosesan
atau pengolahan tertentu”.
Richard A. Johnson, Fremont E. Kast, dan James E.
Rosenzweig dalam buku mereka yang berjudul The Theory and
Management of Systems, yang diterjemahkan oleh Drs. S.
Pamudji, M.P.A dalam bukunya, Teori Sistem dan
Penerapannya dalam Manajemen, mengemukakan bahwa
suatu sistem adalah “suatu himpunan atau perpaduan hal-hal
atau bagian-bagian yang membentuk suatu
kebulatan/keseluruhan yang kompleks atau utuh”.
Pada halaman lain dikemukakan: “Suatu sistem akan
didefinisikan sebagai suatu gugus komponen-komponen
yang dirancang untuk menyelesaikan suatu tujuan tertentu
sesuai dengan rencana. Terdapat tiga hal yang penting dalam
definisi ini: Pertama, adanya maksud atau tujuan, di mana
sistem dirancang untuk mengerjakannya. Kedua, adanya
suatu rancangan, atau suatu susunan komponen-komponen.
Akhirnya input informasi, energi (tenaga), dan bahan-bahan
(material) harus dialokasikan sesuai dengan rencana”.
Gordon B. Davis mengatakan bahwa sistem dibagi atau
dijadikan faktor-faktor/unsur-unsur dalam subsistem-
subsistem. Jadi subsistem adalah bagian atau faktor/unsur
dari sistem.
4 Sistem Informasi Manajemen dan Data Mining

a. Sistem Deterministik dan Sistem Probabilistik


Sistem deterministik (deterministic system) adalah suatu
sistem yang operasinya dapat diprediksi secara tepat,
misalnya sistem komputer. Sedangkan sistem
probabilistik (probabilistic system) adalah sistem yang tak
dapat diramal dengan pasti karena mengandung unsur
probabilitas, misalnya sistem arisan dan sistem sediaan,
kebutuhan rata-rata dan waktu untuk memulihkan
jumlah sediaan yang mana dapat ditentukan, tetapi nilai
yang tepat sesaat tidak dapat ditentukan dengan pasti.
b. Sistem Tertutup dan Sistem Terbuka
Sistem tertutup (closed system) adalah sistem yang tidak
bertukar materi, informasi, atau energi dengan
lingkungan, dengan kata lain sistem ini tidak
berinteraksi dan tidak dipengaruhi oleh lingkungan,
misalnya reaksi kimia dalam tabung yang terisolasi.
Sedangkan sistem terbuka (open system) adalah sistem
yang berhubungan dengan lingkungan dan dipengaruhi
oleh lingkungan, misalnya sistem perusahaan dagang.
c. Sistem Alamiah dan Sistem Buatan Manusia
Sistem Alamiah (natural system) adalah sistem yang
terjadi karena alam, misalnya sistem tata surya.
Sedangkan sistem buatan manusia (human made system)
adalah sistem yang dibuat oleh manusia, misalnya
sistem komputer.
d. Sistem Sederhana dan Sistem Kompleks
Berdasarkan tingkat kerumitannya, sistem dibedakan
menjadi sistem sederhana (misalnya sepeda) dan sistem
kompleks (misalnya otak manusia).
Sistem Informasi Manajemen dan Data Mining
5

B. Data
Menurut The Liang Gie, data atau bahan keterangan
adalah: “Hal peristiwa atau kenyataan lainnya apa pun yang
mengandung sesuatu pengetahuan untuk dijadikan dasar
guna penyusunan keterangan, pembuatan kesimpulan atau
penerapan keputusan. Data adalah ibarat bahan mentah yang
melalui pengolahan tertentu lalu menjadi keterangan
(informasi)”.
Menurut Gordon B. Davis: ”Data, bahan mentah bagi
informasi, dirumuskan sebagai kelompok lambang-lambang
tidak acak yang menunjukkan jumlah-jumlah, tindakan-
tindakan, hal-hal, dan sebagainya. Data-data dibentuk dari
lambang grafis seperti *, $, dan ~. Data-data disusun untuk
mengolah tujuan-tujuan menjadi susunan data, susunan
kearsipan, dan pusat data atau landasan data”.

C. Informasi
Menurut Gordon B. davis: “Informasi adalah data yang
telah diolah menjadi suatu bentuk yang penting bagi si
penerima dan mempunyai nilai nyata atau yang dapat
dirasakan dalam keputusan-keputusan yang sekarang atau
keputusan-keputusan yang akan datang”.
Penulis lain, Burch dan Strater, menyatakan: “Informasi
adalah pengumpulan atau pengolahan data untuk
memberikan pengetahuan dan keterangan”.
George R. Terry, Ph.D. menyatakan bahwa informasi
adalah: “data yang penting yang memberikan pengetahuan
yang berguna”. Selanjutnya dijelaskan oleh beliau bahwa
kegunaan informasi tergantung pada:
1. Tujuan si penerima
6 Sistem Informasi Manajemen dan Data Mining

Apabila informasi itu tujuannya untuk memberi bantuan,


maka informasi itu harus membantu si penerima dalam
apa yang ia usahakan untuk memperolehnya.
2. Ketelitian penyampaian dan pengolahan data dalam
menyampaikan dan mengolah data, inti dan pentingnya
informasi harus dipertahankan.
3. Waktu
Apakah informasi itu masih up-to-date?
4. Ruang atau tempat
Apakah informasi itu tersedia dalam ruangan atau tempat
yang tepat?
5. Bentuk
Dapatkah informasi itu digunakan secara efektif? Apakah
informasi itu menunjukkan hubungan-hubungan yang
diperlukan, bidang-bidang yang memerlukan perhatian
manajemen? Dan apakah informasi itu menekankan
situasi-situasi yang ada hubungannya?
6. Semantik
Apakah hubungan antara kata-kata dan arti yang
diinginkan cukup jelas? Apakah ada kemungkinan salah
tafsir?

D. Manajemen
Menurut Prof. Dr. Prajudi Atmosudirjo, S.H. pengertian
manajemen itu dapat dipandang sebagai:
1. Orang-orang:
Semua orang yang mempunyai fungsi/kegiatan pokok
sebagai pemimpin-pemimpin kerja.
2. Proses:
Sistem Informasi Manajemen dan Data Mining
7

Adanya kegiatan-kegiatan yang berarah ke bawah, jadi


berupa kerja-kerja untuk mencapai tujuan tertentu.
3. Sistem Kekuasaan:
Yaitu sistem kewenangan-wenangan supaya orang-orang
menjalankan pekerjaan.

Demikian juga apabila kita mengatakan top management,


middle management, dan lower management, maka yang kita
maksudkan adalah top manager, middle manager, dan lower
manager.
Dikatakan oleh George R. Terry, Ph.D. dalam bukunya,
Principles of Management, sebagai berikut:
“Manajemen adalah suatu proses tertentu yang terdiri atas
perencanaan, pengorganisasian, penggerakan, dan pengawasan,
yang dilakukan untuk menentukan dan mencapai tujuan yang telah
ditetapkan dengan menggunakan manusia dan sumber-sumber
lainnya”.

Tingkatan manajemen
Dilihat dari tingkatan organisasi, manajemen dibagi
dalam 3 tingkatan yaitu:
1. Manajemen Puncak (Top Management)
Manajer bertaggungjawab atas pengaruh yang
ditimbulkan dari keputusan-keputusan manajemen
keseluruhan dari organisasi. Misal: Direktur, wakil
direktur, direktur utama. Keahlian yang dimiliki para
manajer tingkat puncak adalah konseptual, artinya
keahlian untuk membuat dan merumuskan konsep untuk
dilaksanakan oleh tingkatan manajer dibawahnya.
2. Manajemen Menengah (Middle Management)
8 Sistem Informasi Manajemen dan Data Mining

Manajemen menengah harus memiliki keahlian


interpersonal/manusiawi, artinya keahlian untuk
berkomunikasi, bekerjasama dan memotivasi orang lain.
Manajer bertanggungjawab melaksanakan rencana dan
memastikan tercapainya suatu tujuan. Misal: manajer
wilayah, kepala divisi, direktur produk.
3. Manajemen Bawah/Lini (Low Management)
Manager bertanggung jawab menyelesaikan rencana-
rencana yang telah ditetapkan oleh para manajer yang
lebih tinggi. Pada tingkatan ini juga memiliki keahlian
yaitu keahlian teknis, artinya keahlian yang mencakup
prosedur, teknik, pengetahuan dan keahlian dalam bidang
khusus. Misal: supervisor/pengawas produksi, mandor.

Berikut adalah skema (Piramida) manajemen


berdasarkan tingkatannya:

Dilihat dari kegiatan yang dilakukan: Di dalam


melaksanakan tugas, setiap tingkatan manajer mempunyai
fungsi utama atau keahlian yang berbeda yaitu:
• Keahlian Teknik (Technical Skill) yaitu keahlian tentang
bagaimana cara mengerjakan dan menghasilkan sesuatu
yang terdiri atas pengarahan dengan motivasi, supervisi,
dan komunikasi.
Sistem Informasi Manajemen dan Data Mining
9

• Keahlian Manajerial (Managerial Skill) yaitu keahlian yang


terkait dengan hal penetapan tujuan perencanaan,
pengorganisasian, penyusunan personalia, dan
pengawasan.

Keterampilan Manajer
Secara umum, terdapat empat keterampilan manajer pada
masing-masing tingkat manajer:
1. Keterampilan konseptual
Keterampilan atau kemampuan mental untuk
mengkoordinasikan dan mengintegrasikan seluruh
kepentingan dan kegiatan organisasi.
2. Keterampilan Kemanusiaan
Kemampuan untuk saling bekerja sama dengan
memahami dan memotivasi orang lain.
3. Keterampilan Administrasi
Kemampuan yang ada hubungannya dengan fungsi
manajemen yang dilakukan.
4. Keterampilan Teknik
Kemampuan untuk menggunakan peralatan-peralatan,
prosedur, dan metode dari suatu bidang tertentu.

Robert L. Katz pada tahun 1970-an mengemukakan


bahwa setiap manajer membutuhkan minimal tiga
keterampilan dasar. Ketiga keterampilan tersebut adalah:
• Keterampilan konseptual (conceptional skill)
Manajer tingkat atas (top manager) harus memiliki
keterampilan untuk membuat konsep, ide, dan gagasan
demi kemajuan organisasi. Gagasan atau ide serta konsep
tersebut kemudian haruslah dijabarkan menjadi suatu
10 Sistem Informasi Manajemen dan Data Mining

rencana kegiatan untuk mewujudkan gagasan atau


konsepnya itu. Proses penjabaran ide menjadi suatu
rencana kerja yang kongkret itu biasanya disebut sebagai
proses perencanaan atau planning. Oleh karena itu,
keterampilan konsepsional juga merupakan keterampilan
untuk membuat rencana kerja.

• Keterampilan berhubungan dengan orang lain (humanity


skill)
Selain kemampuan konsepsional, manajer juga perlu
dilengkapi dengan keterampilan berkomunikasi atau
keterampilan berhubungan dengan orang lain, yang
disebut juga keterampilan kemanusiaan.
Komunikasi yang persuasif harus selalu diciptakan oleh
manajer terhadap bawahan yang dipimpinnya. Dengan
komunikasi yang persuasif, bersahabat, dan kebapak-an
akan membuat karyawan merasa dihargai dan kemudian
mereka akan bersikap terbuka kepada atasan.
Keterampilan berkomunikasi diperlukan, baik pada
tingkatan manajemen atas, menengah, maupun bawah.

• Keterampilan teknis (technical skill)


Keterampilan ini pada umumnya merupakan bekal bagi
manajer pada tingkat yang lebih rendah. Keterampilan
teknis ini merupakan kemampuan untuk menjalankan
suatu pekerjaan tertentu, misalnya menggunakan program
komputer, memperbaiki mesin, membuat kursi, akuntansi
dan lain-lain.
Sistem Informasi Manajemen dan Data Mining
11

Fungsi Manajemen
Fungsi Manajemen ialah berbagai jenis tugas atau
kegiatan manajemen yang mempunyai peranan khas dan
bersifat saling menunjang untuk mencapai tujuan yang telah
ditetapkan sebelumnya.
Banyak sekali ahli yang mengemukakan tentang fungsi
manajemen ini. Ambil contoh misalnya George R. Terry. Dia
menyebutkan bahwa fungsi manajemen terdiri dari:
a. Planning (Perencanaan)
b. Organizing (Pengorganisasian)
c. Actuating (Penggerakkan)
d. Controlling (Pengawasan)

Sedangkan Harold Koontz dan Cyril O’Donnel membagi


fungsi manajemen menjadi:
a. Planning (Perencanaan)
b. Organizing (Pengorganisasian)
c. Staffing (Penyusunan Pegawai)
d. Directing (Pembinaan Kerja)
e. Controlling (Pengawasan)

Tidak jauh berbeda dengan pendapat para ahli di atas,


Henry Fayol mengemukakan bahwa fungsi manajemen
terdiri dari:
a. Planning (Perencanaan)
b. Organizing (Pengorganisasian)
c. Commanding (Pemberian Komando)
d. Coordinating (Pengkoordinasian)
e. Controlling (Pengawasan)
12 Sistem Informasi Manajemen dan Data Mining

Ahli lain yang bernama Lyndall F. Urwick


menambahkan pendapat Henry Fayol dengan Forecasting
(Peramalan), sehingga urutannya menjadi:
a. Forecasting (Peramalan)
b. Planning (Perencanaan)
c. Organizing (Pengorganisasian)
d. Commanding (Pemberian Komando)
e. Coordinating (Pengkoordinasian)
f. Controlling (Pengawasan).

Selanjutnya Luther Gullick membagi fungsi manajemen


menjadi:
a. Planning (Perencanaan)
b. Organizing (Pengorganisasian)
c. Staffing (Penyusunan Pegawai)
d. Directing (Pembinaan Kerja)
e. Coordinating (Pengkoordinasian)
f. Reporting (Pelaporan)
g. Budgeting (Anggaran).

Untuk lebih jelasnya, berikut ini Anda akan mempelajari


uraian singkat tentang fungsi manajemen yang paling banyak
digunakan.
• Perencanaan (Planning) ialah fungsi manajemen yang
harus bisa menjawab rumus 5W1H. WHAT (apa) yang
akan dilakukan, WHY (mengapa) harus melakukan apa,
WHEN (kapan) melakukan apa, WHERE (di mana)
melakukan apa, WHO (siapa) yang melakukan apa, HOW
(bagaimana) cara melakukan apa.
Sistem Informasi Manajemen dan Data Mining
13

• Pengorganisasian (Organizing) ialah fungsi manajemen


yang berhubungan dengan pembagian tugas. Siapa
mengerjakan apa dan siapa bertanggung jawab pada
siapa.
• Penggerakkan (actuating) yaitu fungsi manajemen yang
berhubungan dengan bagaimana cara menggerakkan
kerabat kerja (bawahan) agar bekerja dengan penuh
kesadaran tanpa paksaan.
• Pengawasan (Controlling) disebut juga fungsi
pengendalian. Suatu proses untuk mengukur atau
membandingkan antara perencanaan yang telah dibuat
dengan pelaksanaan. Dengan adanya pengawasan ini,
diharapkan jangan sampai terjadi kesalahan atau
penyimpangan.

Disamping itu, Forecasting (Peramalan) sering dijadikan


sebagai bahan pertimbangan. Forecasting ialah kegiatan
meramalkan, memproyeksikan atau mengadakan taksiran
terhadap berbagai kemungkinan yang akan terjadi sebelum
suatu rencana yang lebih pasti dapat dilakukan.

III. SISTEM INFORMASI MANAJEMEN (SIM)


Burt Scanlan dan J. Bernard Keys dalam buku mereka
yang berjudul Management and Organizational Behaviour,
mengatakan bahwa suatu Sistem Informasi Manajemen
adalah suatu sistem formal mengenai hal melaporkan,
menggolongkan, dan menyebarkan informasi kepada orang-
orang yang tepat dalam suatu organisasi.
14 Sistem Informasi Manajemen dan Data Mining

The Liang Gie dalam bukunya, Pokok-pokok PPBS dan


SIM menyarankan perumusan SIM yang lebih luas
lingkupannya sebagai:
Keseluruhan jalinan hubungan antara satuan-satuan dan
jaringan lalu lintas macam-macam keterangan dalam sesuatu
organisasi serta segenap proses pengumpulan, pengolahan,
penyimpanan, pengambilan kembali dan penyebaran
keterangan itu dengan berbagai peralatan sehingga
memungkinkan para anggota melaksanakan tugas dengan
sebaik-baiknya maupun pimpinan membuat keputusan atau
menjalankan tugas kepemimpinanya yang lain secara tepat.
SIM adalah pengembangan dan penggunaan sistem-
sistem informasi yang efektif dalam organisasi-organisasi
(Kroenke, David, 1989).
SIM didefinisikan sebagai suatu sistem berbasis komputer
yang menyediakan informasi bagi beberapa pemakai yang
mempunyai kebutuhan yang serupa. Informasi menjelaskan
perusahaan atau salah satu sistem utamanya mengenai apa
yang telah terjadi di masa lalu, apa yang sedang terjadi
sekarang dan apa yang mungkin terjadi di masa depan.
Informasi tersebut tersedia dalam bentuk laporan periodik,
laporan khusus dan output dari simulasi matematika.
Informasi digunakan oleh pengelola maupun staf lainnya
pada saat mereka membuat keputusan untuk memecahkan
masalah (Mc. Leod, 1995).
SIM merupakan metode formal yang menyediakan
informasi yag akurat dan tepat waktu kepada manajemen
untuk mempermudah proses pengambilan keputusan dan
Sistem Informasi Manajemen dan Data Mining
15

membuat organisasi dapat melakukan fungsi perencanaan,


operasi secara efektif dan pengendalian (Stoner, 1996).

IV. SISTEM DAN KOMPUTER


Sistem yang dibangun dan dijalankan dengan
menggunakan komputer sebagai alat bantunya. Elemen-
elemen yang saling berhubungan membentuk satu kesatuan
untuk melaksanakan pengolahan data untuk menghasilkan
informasi dengan menggunakan perangkat komputer.
Elemen-elemen yang saling berhubungan tersebut adalah:
a. Perangkat keras (Hardware),
b. Perangkat lunak (Software),
c. Brainware

Di sini, perangkat keras (Hardware) adalah peralatan


komputer itu sendiri, perangkat lunak (Software) adalah
program yang berisi perintah-perintah untuk melakukan
proses tertentu, dan brainware adalah manusia yang terlibat di
dalam mengoperasikan serta mengatur sistem komputer.
Ketiga elemen sistem komputer tersebut harus saling
berhubungan dan membentuk satu kesatuan. Perangkat keras
tanpa perangkat lunak tidak akan berarti apa-apa, hanya
berupa benda mati. Kedua perangkat keras dan lunak juga
tidak dapat berfungsi jika tidak ada manusia yang
mengoperasikannya.
16 Sistem Informasi Manajemen dan Data Mining
Sistem Informasi Manajemen dan Data Mining
17

BAB II
DATA UNTUK SIM

I. PENDAHULUAN
ikemukakan oleh Gordon B. Davis, Informasi adalah
D data yang telah diolah dan yang penting artinya untuk
pengambilan keputusan. Jadi dalam hal ini informasi adalah
mengumpulkan data, kemudian mengolahnya sehingga
menjadi informasi yang berguna.

II. METODE PENGUMPULAN DATA


A. Melalui pengamatan sendiri secara langsung
Keuntungan metode ini adalah bahwa data yang
dikumpulkan akan lebih cermat karena pengamat sendiri
yang mengumpulkan.
Kerugiannya adalah:
1. Daerah pengamatan tidak luas, karena pengamat tidak
punya banyak waktu untuk mengumpulkan data.
2. Biayanya mahal
3. Tidak dapat dilakukan apabila banyak hal yang harus
diselidiki.

B. Melalui wawancara
Keuntungan metode ini:
1. Data yang dikumpulkan akan lebih teliti karena
dikumpulkan sendiri.
18 Sistem Informasi Manajemen dan Data Mining

2. Pengamatan dapat dilakukan dalam daerah yang luas


dan atas dasar prinsip angka yang banyak, hasilnya akan
lebih cermat.
3. Data dikumpulkan sendiri oleh pengamat meskipun
secara tidak langsung/melalui wakilnya.

Kerugiannya adalah:
1. Metode ini merupakan metode yang mahal karena harus
banyak wakil yang ditunjuk pergi ke berbagai tempat
untuk mengumpulkan data.
2. Fakta-fakta yang dikumpulkan kurang teliti.

C. Melalui perkiraan korespondensi (pembawa berita)


Keuntungan metode ini:
1. Metode ini sangat murah
2. Metode ini dapat meliputi daerah yang sangat luas
Kerugiannya adalah bahwa data yang dikumpulkan
sering kurang teliti.

D. Melalui daftar pertanyaan


Keuntungan metode ini:
1. Metode ini lebih murah dibandingkan dengan metode
wawancara pribadi secara langsung.
2. Data dapat dikumpulkan secara cepat.

Kerugiannya adalah informan-informan mungkin tidak


mengembalikan daftar pertanyaan atau mengembalikan akan
tetapi tidak menjawab semua pertanyaan.
Sistem Informasi Manajemen dan Data Mining
19

Dalam praktek langsung sering digunakan gabungan dari


dua metode atau lebih misalnya metode pengamatan secara
langsung dengan metode wawancara atau lainnya.

III. PENGERTIAN PENGOLAHAN DATA


George R. Terry, Ph.D. dalam bukunya, Office
Management and Control, mengatakan: “Pengolahan data
adalah serangkaian operasi atas informasi yang direncanakan
guna mencapai tujuan atau hasil yang diinginkan”.
Selanjutnya dikatakan bahwa ada 8 unsur pokok pengolahan
data, yakni:
1. Membaca
2. Menulis, mengetik, membuat lubang pada kartu atau pada
pita-kertas (sering disebut masukan).
3. Mencatat atau mencetak (sering disebut keluaran)
4. Menyortir
5. Menyampaikan atau memindahkan
6. Menghitung
7. Membandingkan
8. Menyimpan

IV. OPERASI DATA


Data adalah bahan mentah yang harus disusun untuk
menghasilkan informasi yang berguna dan berarti. Untuk
menyusun data tersebut agar berguna bagi penerima
diperlukan sepuluh operasi dasar yang menghasilkan
keluaran penting yang harus dilaksanakan.

Menurut Burch dan Strater kesepuluh operasi data adalah:


1. Pengambilan Data (Capturing)
20 Sistem Informasi Manajemen dan Data Mining

Operasi ini menunjukkan pencatatan data dari suatu


peristiwa dalam suatu bentuk seperti formulir
kepegawaian, pesanan pembelian, dan sebagainya.
2. Pemeriksaan (verifying)
Menunjukkan pengecekan atau pengesahan data untuk
menjamin agar data tersebut dapat diperoleh dan dicatat
secara cermat.
3. Penggolongan (classifying)
Menempatkan unsur-unsur data dalam kategori khusus
yang memberikan arti bagi si pemakai.
4. Penyusunan atau Penyortiran
Menempatkan unsur-unsur data dalam suatu rangkaian
khusus atau rangkaian yang telah ditentukan sebelumnya.
5. Peringkasan (Summarizing)
Menggabungkan atau mengumpulkan unsur-unsur data
dalam salah satu dari dua cara. Pertama mengumpulkan
data secara matematika, kedua mengurangi data secara
logika.
6. Perhitungan (calculating)
Operasi ini memerlukan penanganan data secara ilmu
hitung dan atau logika.
7. Penyimpanan (storing)
Menempatkan data ke dalam suatu media penyimpanan
seperti kertas, microfilm dan sebagainya, di mana data
dapat dipelihara untuk pemasukan dan pengambilan
kembali apabila diperlukan.
8. Pengambilan kembali (retrieving)
Sistem Informasi Manajemen dan Data Mining
21

Mengandung pencarian sampai ketemu dan mendapatkan


tambahan bagi unsur-unsur data khusus dari media di
mana unsur-unsur tersebut disimpan.
9. Reproduksi
Memperbanyak data dari satu media ke media yang lain
atau dalam kedudukan yang lain dalam media yang sama.
10. Penyebaran/pengkomunikasian
(disseminating/communicating)
Memindahkan data dari satu tempat ke tempat yang lain.

Menurut Burch dan Strater juga ada empat macam


metode pengolahan data yang penting diketahui, yakni:
a. Manual
Dalam data manual semua operasi data dilakukan dengan
tangan dan bantuan alat-alat penting seperti pensil, kertas,
dan sebagainya.
b. Electromechanical
Metode electromechanical merupakan suatu gabungan dari
orang dan mesin
c. Punched card equipment
Metode punched card equipment mengandung penggunaan
semua peralatan yang dipergunakan dalam apa yang
kadang-kadang disebut sebagai suatu sistem warkat unit.
d. Electronic computer
Metode electronic computer, komputer disini berarti suatu
susunan dari alat-alat masukan, suatu unit pengolahan
pusat (central processing unit), dan alat-alat keluaran.

Unit pengolah pusat terdiri atas 4 komponen pokok,


yakni:
22 Sistem Informasi Manajemen dan Data Mining

1. Arithmetic-logic unit
2. the control unit
3. the primary storage unit
4. the console

V. SENTRALISASI DAN DESENTRALISASI


PENGOLAHAN DATA
a. Sentralisasi pengolahan data
Dengan pengolahan data yang disentralisasi, sebagian
besar operasi pengolahan data dilaksanakan oleh suatu
bagian yang terpisah. Biasanya ini merupakan suatu bagian
terpisah yang diadakan dalam suatu organisasi dan disebut
Bagian Pengolahan Data Elektronik (Electronic Data Processing
Department), sering disingkat EDP Department. Akan tetapi
pengolahan data dapat juga dilakukan oleh:
1. Suatu biro jasa, yang merupakan perusahaan terpisah di
luar organisasi, yang memberikan macam-macam
pelayanan pengolahan data.
2. Fasilitas-fasilitas timesharing yang dibeli atau disewa dari
perusahaan privat, atau
3. Suatu susunan manajemen fasilitas di mana suatu
perusahaan privat mengambil alih pelaksanaan operasi
pengolahan data organisasi.

b. Desentralisasi pengolahan data


Susunan pendekatan hierarkis untuk menggunakan
pengolahan data yang didesentralisasi juga meliputi, seperti
halnya pendekatan hierarkis yang menggunakan pengolahan
data yang didesentralisasi, beberapa bidang fungsional
otonom atau sub organisasi dalam organisasi keseluruhan.
Sistem Informasi Manajemen dan Data Mining
23

Aliran informasi masih vertical dalam masing-masing bidang


fungsional.
c. Terdistribusi
Data-data yang akan diolah disebar ke bagian-bagian,
namun bagian-bagian yang tersebar tersebut disatukan
kembali secara logik dan di awasi oleh bagian yang lebih
tinggi tingkatannya sehingga terbentuk kesatuan.
Keuntungan:
1. Dapat meminimalkan biaya software dan hardware
2. Mempersingkat waktu respon
3. Pengontrolan data lebih cermat
4. Kemampuan back up data.
24 Sistem Informasi Manajemen dan Data Mining
Sistem Informasi Manajemen dan Data Mining
25

BAB III
FUNGSI, BIAYA, NILAI DAN MUTU
INFORMASI

alam perancangan suatu Sistem Informasi Manajemen


D terdapat empat unsur yang sangat penting dan harus
dipertimbangkan antara lain fungsi, biaya, nilai dan mutu
informasi. Berikut dibawah ini adalah uraian dari unsur-unsur
tersebut.
A. Fungsi Informasi
Fungsi utama informasi adalah menambah pengetahuan atau
mengurangi ketidakpastian pemakai informasi. Informasi
yang disampaikan kepada pemakai mungkin merupakan
hasil data yang dimasukkan ke dalam, dan pengolahan, suatu
model keputusan.
B. Biaya Informasi
Biaya operasi sistem informasi dapat diuraikan sebagai
berikut:
1) Biaya perangkat keras
2) Biaya ini biasanya merupakan biaya tetap atau biaya tertanam,
dan akan meningkat untuk tingkat-tingkat mekanisasi yang
lebih tinggi.
3) Biaya untuk analisis, perancangan, dan pelaksanaan sistem
4) Biaya ini merupakan biaya tertanam, dan biasanya akan
meningkat sesuai dengan tingkat mekanisasi yang lebih
tinggi.
26 Sistem Informasi Manajemen dan Data Mining

5) Biaya untuk tempat dan faktor-faktor kontrol lingkungan


6) Biaya ini setengah berubah-ubah (semi variabel). Biasanya
biaya ini meningkat sesuai dengan tingkat mekanisasi yang
tinggi.
7) Biaya perubahan
8) Biaya ini merupakan biaya tertanam dan meliputi setiap jenis
perubahan dari satu metode ke metode yang lain.
9) Biaya operasi
10) Biaya ini pada dasarnya merupakan biaya variabel dan
meliputi biaya bermacam-macam pegawai, pemeliharaan
fasilitas dan sistem, perlengkapan, barang-barang yang
berguna, dan fasilitas bantuan.

C. Nilai Informasi
Menurut Burch dan Strater dalam buku mereka, Information
Systems: Theory and Practice, nilai informasi itu didasarkan atas
sepuluh sifat sebagai berikut:
1. Mudahnya dapat diperoleh
Sifat ini menunjukan mudahnya dan cepatnya dapat
diperoleh keluaran informasi. Kecepatan memperolehnya
dapat diukur, akan tetapi berapa nilainya bagi pemakai
informasi, sulit mengukurnya.
2. Sifat luas dan lengkapnya
Sifat ini menunjukkan lengkapnya isi informasi. Hal ini tidak
berarti hanya mengenai volumenya, akan tetapi juga
mengenai keluaran informasinya. Sifatnya ini sangat kabur
dan oleh karena itu, sulit mengukurnya.
3. Ketelitian
Sifat ini berhubungan dengan tingkat kebebasan dari
kesalahan keluaran informasi. Dalam hubungannya dengan
Sistem Informasi Manajemen dan Data Mining
27

volume data yang besar, maka biasanya terjadi dua jenis


kesalahan, yakni kesalahan pencatatan dan kesalahan
perhitungan.
4. Kecocokan
Sifat ini menunjukan betapa baik keluaran informasi dalam
hubungannya dengan permintaan para pemakai. Isi informasi
harus ada hubungannya dengan masalah yang sedang
dihadapi, semua keluaran lainya tidak berguna akan tetapi
masalah mempersiapkannya. Sifat ini sulit mengukurnya.
5. Ketepatan Waktu
Sifat ini berhubungan dengan waktu yang dilalui yang lebih
pendek, daripada siklus dapat diperolehnya informasi:
masukan, pengolahan dan pelaporan keluaran kepada para
pemakai. Biasanya agar informasi itu tepat waktu, lamanya
siklus ini harus dikurangi. Dalam beberapa hal ketepatan
waktu dapat diukur.
6. Kejelasan
Sifat ini menunjukan tingkat keluaran informasi, bebas dari
istilah-istilah yang tidak jelas. Membetulkan laporan dapat
memakan biaya yang besar
7. Keluwesan
Sifat ini berhubungan dengan dapat disesuaikannya keluaran
informasi tidak hanya dengan lebih dari satu keputusan akan
tetapi juga dengan lebih dari seorang pengambilan keputusan.
Sifat ini sulit mengukurnya, akan tetapi dalam banyak hal
dapat diberikan nilai yang dapat diukur.
8. Dapat Dibuktikan
28 Sistem Informasi Manajemen dan Data Mining

Sifat ini menunjukan kemampuan beberapa pemakai


informasi untuk menguji keluaran informasi dan sampai pada
kesimpulan yang sama.
9. Tidak Ada Prasangka
Sifat ini berhubungan dengan tidak adanya keinginan untuk
mengubah informasi guna mendapatkan kesimpulan yang
telah dipertimbangkan sebelumnya.
10. Dapat Diukur
Sifat ini menunjukan hakikat informasi yang dihasilkan dari
sistem informasi formal. Meskipun kabar angin, desas-desus,
dugaan-dugaan, klenik, dan sebagainya sering dianggap
sebagai informasi, hal-hal tersebut berada diluar lingkup
pembicaraan kita.

Nilai informasi yang sempurna adalah bahwa mengambil


keputusan diizinkan untuk memilih keputusan optimal dalam
setiap hal, dan bukan keputusan yang “rata-rata” akan menjadi
optimal, dan untuk menghindarkan kejadian-kejadian yang akan
mengakibatkan suatu kerugian. Informasi ini tidak sempurna
karena lebih banyak memberikan perkiraan daripada
memberikan angka yang pasti.
Langkah-langkah dalam proses pengambilan keputusan,
menurut Gordon B. Davis, adalah sebagai berikut:
1. Tentukan tindakan-tindakan yang terbaik yang didasarkan
atas kemungkinan-kemungkinan sebelumnya.
2. Tentukan apakah tindakan itu akan berguna untuk
memperoleh informasi sampel.
3. Tentukan ukuran sampel yang optimal.
4. Sampel.
Sistem Informasi Manajemen dan Data Mining
29

5. Perbaiki kemungkinan-kemungkinan sebelumnya didasarkan


data sampel.

D. Mutu Informasi
Informasi berbeda dalam mutunya disebabkan oleh
penyimpangan atau kesalahan.
Menurut Gordon B. Davis kesalahan dapat disebabkan oleh:
1. Metode pengumpulan dan pengukuran data yang tidak tepat.
2. Tidak dapat mengikuti prosedur pengolahan yang benar.
3. Hilang atau tidak terolahnya data.
4. Pemeriksaan atau pencatatan data yang salah
5. Dokumen (induk) sejarah yang salah (atau pengunaan
dokumen sejarah yang salah).
6. Kesalahan dalam prosedur pengolahan (misalnya kesalahan
program komputer).
7. Kesalahan yang dilakukan dengan sengaja.

Kesulitan karena penyimpangan dapat ditangani dalam


pengolahan informasi melalui prosedur untuk menemukan dan
mengukur penyimpangan dan menyesuaikannya. Kesulitan
karena kesalahan dapat diatasi dengan:
1. Kontrol intern untuk menemukan kesalahan,
2. Pemeriksaan intern dan extern,
3. Penambahan “batas kepercayaan” kepada data,
4. Intruksi pemakai dalam prosedur pengolahan dan
pengukuran agar para pemakai dapat menilai kesalahan-
kesalahan yang mungkin terjadi.

Model fisik, naratif dan grafis berguna dalam hal:


1. Mempermudah pengertian/pemahaman.
30 Sistem Informasi Manajemen dan Data Mining

2. Mempermudah komunikasi.

Sedangkan model matematis memberikan tambahan untuk


memprediksi masa depan/perencanaan.
Sistem Informasi Manajemen dan Data Mining
31

BAB IV
PERANAN SIM DALAM KEGIATAN
MANAJEMEN

I. PENDAHULUAN
uatu Sistem Informasi Manajemen yang baik harus
S mampu memberikan dukungan pada proses-proses
berikut:
a. Proses perencanaan
b. Proses pengendalian
c. Proses pengambilan keputusan

II. MANAJEMEN SEBAGAI SUATU SISTEM


A. Perencanaan
Pada penganalisaan kegiatan perencanaan lebih lanjut,
perencanaan harus melaksanakan lima tugas pokok sebagai
berikut:
1. Menentukan tujuan.
2. Mengetahui kejadian-kejadian dan kegiatan-kegiatan
yang harus dilaksanakan untuk mencapai tujuan.
3. Menjelaskan sumber-sumber dan/atau bakat-bakat yang
diperlukan untuk melaksanakan tiap kegiatan.
4. Menentukan lamanya tiap kegiatan.
5. Menentukan urutannya, apabila ada kegiatan-kegiatan
yang harus dilaksanakan.
32 Sistem Informasi Manajemen dan Data Mining

• Dukungan SIM pada Proses Perencanaan


Suatu rencana merupakan suatu arah tindakan yang
telah ditetapkan lebih dahulu. Rencana adalah
menggabungkan antara tujuan yang hendak dicapai dan
kegiatan-kegiatan yang perlu dilaksanakan untuk
mencapai tujuan tersebut.
Rencana pada suatu organisasi adalah tergantung pada
individu-individu yang menjadikan organisasi tersebut.
Proses perencanaan akan memerlukan suatu model
perencanaan, data masukan, dan manipulasi model
untuk menghasilkan keluaran berupa suatu rencana.
Secara ringkas, dukungan SIM pada proses perencanaan
ditunjukkan Tabel 4.1.

Tabel 4.1 Dukungan SIM pada Proses Perencanaan


Kebutuhan Dukungan Sistem Informasi
Model Dukungan analitik dalam
Perencanaan pengembangan struktur dan
persamaan model.
Data historis untuk analisis
hubungan, perkiraan dan
perencanaan.
Suatu penggerak model
perencanaan untuk dijalankan
pada suatu komputer.
Data Data historis ditambah analisis
Masukan dan manipulasi data untuk
membangkitkan data masukan
yang berdasarkan data historis.
Sistem Informasi Manajemen dan Data Mining
33

Manipulasi Penggunaan komputer untuk


Model menjalankan suatu model
manipulasi data lainnya
berdasarkan teknik peramalan
dan ekstrapolasi.

B. Pengawasan
Pengawasan adalah suatu proses yang terdiri atas tiga
langkah penting, yakni:
1. Mengukur keluaran-keluaran system;
2. Membandingkan keluaran-keluaran ini dengan rencana,
dan menentukan penyimpangan-penyimpangan apabila
ada; dan
3. Membetulkan penyimpangan-penyimpangan yang tidak
menguntungkan dengan melakukan tindakan
pembetulan.

• Dukungan Sistem Informasi pada proses pengendalian


Dukungan yang diberikan pada proses pengendalian ini
mencakup hal-hal sebagai berikut:
1. Analisis perbedaan prestasi dengan standar prestasi
2. Analisis lain yang membantu dalam pemahaman
perbedaan
3. Arah tindakan yang akan memperbaiki prestasi pada
masa mendatang.
Dukungan lain dari SIM dalam proses pengendalian
adalah monitor yang terus menerus dari prestasi, bukan
hanya pelaporan periodik saja. Monitor dapat dilakukan
berdasarkan model perencanaan ditambah konsep
batasan pengendalian. Dengan demikian maka kegiatan-
34 Sistem Informasi Manajemen dan Data Mining

kegiatan dalam organisasi dapat dimonitor secara terus-


menerus dan penyimpangan-penyimpangan akan
segera terdeteksi. Untuk seterusnya keputusan-
keputusan baru dapat dibuat untuk mengembalikan
proses ke dalam batasan pengendalian.

C. Pengambilan Keputusan
1. Unsur-unsur pengambilan keputusan
Proses yang teratur untuk mengambil keputusan
mengandung empat unsur:
a) Model
Menunjukkan suatu gambaran masalah secara kuantitatif
atau kualitatif
b) Kriteria
Menunjukkan tujuan dari masalah keputusan misalnya
untuk mencapai jasa langganan yang maksimum.
c) Pembatas
Ada faktor-faktor tambahan yang harus
dipertimbangkan dalam pemecahan masalah keputusan.
d) Optimalisasi
Apabila masalah keputusan telah diuraikan dengan
sejelas-jelasnya (model). Maka manajer menentukan apa
yang diperlukan (kriteria) dan apa yang diperbolehkan
(pembatas). Pada titik ini pengambil keputusan siap
untuk memilih penyelesaian yang terbaik atau yang
optimum.

2. Jenis-jenis pengambilan keputusan


Dalam arti luas ada dua jenis pengambilan keputusan,
yakni:
Sistem Informasi Manajemen dan Data Mining
35

a) Pengambilan keputusan yang terprogram


Jenis pengambilan keputusan ini mengandung
tanggapan otomatis terhadap kebijaksanaan-
kebijaksanaan yang telah ditentukan sebelumnya.
Semua masalah yang sifatnya berulang dan menjadi
kebiasaan sehari-hari dengan parameter-parameter yang
dirumuskan dengan baik memberi kemungkinan untuk
pengambilan keputusan yang diprogramkan.
b) Pengambilan keputusan yang tidak terprogramkan
Jenis pengambilan keputusan ini menunjukkan proses
yang berhubungan dengan masalah-masalah yang tidak
jelas. Masalah-masalah tersebut biasanya kompleks,
hanya sebagian parameter yang diketahui dan banyak
parameter yang telah diketahui mempunyai banyak hal
yang sifatnya mungkin atau tidak pasti.

3. Tingkat-tingkat pengambilan keputusan


Untuk menggolongkan, kita membagi pengambilan
keputusan itu ke dalam tiga tingkat:
a) Pengambilan keputusan tingkat strategis
b) Keputusan stategis ditandai oleh banyak ketidakpastian
dan berorientasikan masa depan. Keputusan ini
menentukan rencana jangka panjang yang
mempengaruhi seluruh organisasi.
c) Pengambilan keputusan tingkat taktis
d) Pengambilan keputusan ini berhubungan dengan
kegiatan jangka pendek dan penentuan sumber daya
untuk mencapai tujuan. Sementara pengambilan
keputusan strategis sebagian besar mengandung kegiatan
perencanaan, pengambilan keputusan taktis memerlukan
36 Sistem Informasi Manajemen dan Data Mining

gabungan dari kegiatan perencanaan dan kegiatan


pengawasan yang hampir sama. Jenis pengambilan
keputusan ini mempunyai sedikit, apabila ada,
kemungkinan untuk pengambilan keputusan
terprogramkan.
e) Pengambilan keputusan tingkat teknis
Pada tingkat ini standar-standar ditentukan dan hasil
keputusan sifatnya menentukan. Pengambilan
keputusan teknis adalah suatu proses untuk menjamin
agar tugas-tugas khusus dapat dilaksanakan dengan cara
yang efektif dan efisien.

• Dukungan Sistem Informasi pada pengambilan


keputusan.
Dukungan SIM pada proses pengambilan keputusan
meliputi tiga tahapan, yaitu:
1. Penelusuran untuk pemahaman masalah, terdiri atas:
➢ Usaha-usaha penyelidikan lingkungan yang
memancing keputusan.
➢ Pengakuan adanya masalah.

2. Desain untuk penciptaan pemecahan masalah, meliputi


usaha-usaha:
➢ Penemuan alternatif-alternatif pemecahan masalah.
➢ Pengembangan alternatif-alternatif pemecahan
masalah analisis arah tindakan yang mungkin.

3. Pemilihan untuk pengujian kelayakan pemecahan


masalah
Sistem Informasi Manajemen dan Data Mining
37

➢ Melibatkan seleksi arah tindakan dan


pelaksanaannya.
Sistem Informasi Manajemen dan Data Mining
37

BAB V
KOMPONEN-KOMPONEN DARI SUATU
SISTEM KOMPUTER DAN PENGELOLA
INFORMASI

I. KOMPONEN–KOMPONEN SISTEM KOMPUTER


eskipun banyak manajer terpesona dan kadang-
M kadang dibuat bingung oleh komputer, operasinya
pada dasarnya tidak lebih kompleks dibandingkan sistem
manual. Bidang komputer ini disebut pengolahan data
secara elektronik (electronic data processing), dan
komputernya tidak lebih dari alat pengolahan data
elektronik, yang memiliki komponen-komponen yang sama
dengan sistem manual. Namun komputer menerima datanya
dalam bentuk alphanumeric (alphabetic dan numerical) atau
dalam bentuk huruf dan angka.
1. Input
Fungsi memasukkan data ke dalam sistem komputer
dilakukan oleh sebuah alat input. Berbeda dengan sistem
manual yang pengolahnya adalah manusia, input
kedalam komputer harus ke dalam bentuk yang dapat
diterima oleh mesin. Biasanya input ini berupa kartu key-
punch, media magnetik (pita, disk, diskette), dan input
langsung dari keyboard terminal.
2. Pengolah Pusat (Central Processing)
Pengolahan sentral ini merupakan komponen yang
paling utama dari komputer. Pengolah ini terdiri dari
38 Sistem Informasi Manajemen dan Data Mining

satu seksi pengendalian, yang mengkoordinasi semua


komponen sistem ini, dan unit penghitung/logika, yang
melakukan fungsi-fungsi seperti tambah, kurang, kali,
bagi, banding, geser, pindahkan, simpan dll. CPU
(Central Processing Unit) dari komputer ini
melaksanakannya dengan kecepatan dan ketepatan yang
fantastis. Logika pengolahan yang sederhana ini, yang
disertai lima fungsi sederhana pula, memungkinkan
berbagai variasi tugas yang tidak terhitung besarnya bagi
komputer tersebut.
3. Penyimpanan (storage)
Penyimpanan ini hampir mirip dengan sebuah filling
cabinet elektronik yang sangat besar, dengan indeks yang
lengkap, dan setiap saat terbuka bagi komputer.
Penyimpanan ini terdiri dari intern, yang merupakan
bagian dari komponen pengolahan dan ekstern.
Penyimpanan intern, yang sering disebut memory,
merupakan karakteristik yang memungkinkan komputer
itu menyimpan, dalam bentuk elektronik, data dari alat-
alat input dan serangkaian instruksi yang panjang, yang
disebut program, yang memerintahkan mesin akan tugas
yang harus dilakukannya.
Penyimpanan ekstern ada dua macam:
a) Direct access (langsung dapat dicari). Berbentuk disk,
diskette, magnetic drum dan sarana data cell yang dapat
menampung penyimpanan data massal tanpa urutan,
dan dapat dicari langsung tanpa harus membaca
arsip dari permulaannya untuk menemukan data
yang diinginkan.
Sistem Informasi Manajemen dan Data Mining
39

b) Sequential (urutan). Berupa magnetic tape (pita


magnetik) yang diisi menurut urutan, dan harus
dibaca dari awal untuk membaca atau menulis catatan
yang diinginkan.

4. Output
Sarana output memberikan hasil akhir dari pengolahan
data. Alat ini mencatat informasi dari komputernya di
atas berbagai macam media, seperti kartu dan media
magnetik. Dan informasi ini kemudian dicetak diatas
kertas. Di samping itu alat output ini dapat memberikan
sinyal-sinyal untuk dikirimkan melalui jaringan
teleprocessing, menghasilkan gambaran grafik, gambaran
microfilm, dan berbagai bentuk khusus lainnya. Pada
umumnya aplikasi pokok dalam perusahaan hanya
berbentuk cetakan di atas kertas (printout).

II. KOMUNIKASI DATA


Uraian tentang penggunaan komputer belum lengkap
tanpa menyebutkan komputer data–suatu perkawinan
antara pengolahan data dan transmisi data. Beberapa tahun
yang lalu, komunikasi data masih merupakan subyek yang
samar, dan yang hanya dipelajari oleh segelintir ahli belaka.
Proses komunikasi data pada umumnya membutuhkan lima
bagian:
1. Sebuah alat pengirim (transmitter) atau sumber informasi.
Biasanya ini berupa suatu jenis alat input/output, seperti
mesin tik, keyboard, atau layar display.
2. Sebuah pertukaran pada titik pengiriman. Ini merubah
sinyal transmisi data menjadi sinyal analog agar dapat
40 Sistem Informasi Manajemen dan Data Mining

dikirimkan melalui jaringan transmisi. Secara histories,


alat converter ini hampir selalu disediakan oleh
“perusahaan umum”.
3. Sebuah saluran transmisi atau sarana penyaluran
(carrier). Berbagai perusahaan telepon dan perusahaan
jasa menawarkan jasa saluran pribadi dengan kecepatan
yang berbeda-beda.
4. Sebuah converter pada titik penerimaan. Ini merubah
sinyal yang diterima dari saluran transmisi itu kembali
menjadi sinyal digital untuk pemakaian dalam
komputer.
5. Sebuah alat penerima transmisi informasi. Ini adalah
komputernya dari berbagai ragam alat-alat input/output.

Meskipun kemungkinan susunan dari terminal,


converter, saluran transmisi, dan komputer tidak ada
batasnya, sang manajer hanya perlu memahami beberapa
ide inti saja.
1. Konsepsi yang pertama
Komputer utama dalam sistem ini berkomunikasi
dengan semua terminalnya. Terminal-terminal ini
mungkin berbeda dalam tingkat “intelegensinya”. Input
dan output dilakukan oleh komputernya.
2. Konsepsi kedua
Merupakan contoh nyata dari pengolahan data yang
dibagi-bagi, karena komputer utamanya dan komputer-
komputer lainnya membagi tanggung jawab pengolahan,
terlepas dari intelegensi masing-masing terminalnya.
3. Konsepsi Ketiga
Sistem Informasi Manajemen dan Data Mining
41

Dikenal sebagai hubungan antara “majikan-dengan-


majikan” karena masing-masing komputer dalam
gabungan ini membagi beban pengolahan ke seluruh
sistem.

III. PENGELOLAAN INFORMASI


Tugas para manajer adalah mengelola sumber daya
yang ada dengan cara yang paling efektif. Jenis-jenis sumber
daya bagi manajer adalah:
1. Sumber daya fisik, terdiri atas:
• Manusia
• Material (termasuk mesin, fasilitas, dan energi)
• Uang

2. Sumber daya konseptual, yaitu berupa informasi


(termasuk data). Sumber daya konseptual digunakan
oleh manajer untuk mengelola sumber daya fisik.
Manajemen sumber daya fisik dapat dilakukan dengan
cara:
• Menyusun
• Memaksimalkan penggunaan dengan meminimalkan
waktu terbuang dan menjaganya agar berfungsi pada
efisiensi puncak.
• Akhirnya mengganti sumber daya tersebut pada saat
kritis yaitu sebelum sumber daya tersebut menjadi
tidak efisien dan usang.

3. Aktivitas dalam pengolahan informasi meliputi:


a) Memastikan bahwa data mentah yang diperlukan
telah terkumpul
42 Sistem Informasi Manajemen dan Data Mining

b) Memproses data mentah menjadi informasi yang


berguna
4. Memastikan bahwa informasi diterima orang yang
berhak dalam bentuk yang tepat pada saat yang tepat
sehingga dapat dimanfaatkan dengan efektif.
5. Membuang informasi usang dengan informasi yang
mutakhir dan akurat.

Seorang manajer yang berhasil harus memiliki banyak


keahlian, tetapi ada dua yang mendasar, yaitu:
1) Keahlian komunikasi, keahlian menerima dan
mengirimkan informasi dalam bentuk lisan atau tulisan.
2) Keahlian pemecahan masalah (problem solving),
merupakan semua kegiatan yang mengarah pada solusi
tentang permasalahan.

Seorang manajer juga harus memiliki pengetahuan


manajemen, yaitu:
1. Mengerti komputer (computer literacy), yaitu pengetahuan
mengenai komputer yang diperlukan untuk berfungsi di
masa kini, mencakup pengertian mengenai istilah-istilah
komputer, pemahaman mengenai keunggulan dan
kelemahan komputer, kemampuan menggunakan
komputer (walau tidak perlu jadi programmer), dll.
2. Mengerti informasi (information literacy), meliputi
pengertian mengenai bagaimana menggunakan
informasi pada tiap tahap dari prosedur pemecahan
masalah, dimana informasi dapat diperoleh, dan
bagaimana membagikan informasi kepada pihak lain.
Sistem Informasi Manajemen dan Data Mining
43

IV. EVOLUSI SIM (CBIS)


1. Fokus awal pada data
Selama paruh awal abad 20, saat purchase card dan
keydriven bookkeeping machines berada pada masa jayanya,
perusahaan-perusahaan umumnya mengabaikan
kebutuhan informasi para manajer. Karakter ini
diteruskan hingga komputer generasi pertama yang
terbatas untuk aplikasi akuntansi dengan nama
pengolahan data elektronik (Electronic Data
Processing/EDP). Istilah EDP tidak lagi popular dan telah
disingkat menjadi pengolahan data (Data Processing/DP).
2. Fokus baru pada informasi
Konsep SIM menyadari bahwa aplikasi komputer harus
diterapkan untuk tujuan utama menghasilkan informasi
manajemen.
3. Fokus revisi pada sistem pendukung keputusan (Decision
Support System/DSS)
Konsep DSS adalah sistem penghasil informasi yang
ditujukan pada suatu masalah tertentu yang harus
dipecahkan oleh manajer dan keputusan yang harus
dibuat oleh manajer.
4. Fokus sekarang pada komunikasi
Berbagai aplikasi komputer untuk otomasi (Office
Automation/OA) telah berkembang pesat antara lain
meliputi, konferensi jarak jauh, surat elektronik,
kalender elektronik dll.
44 Sistem Informasi Manajemen dan Data Mining

5. Fokus potensial pada konsultasi


Sistem pakar (Expert System/ES) yang menerapkan
kecerdasan buatan (Artificial Intelligent/AL) telah semakin
banyak diperhatikan.

V. ORGANISASI PENGELOLA INFORMASI

Spesialis Informasi (information specialist) adalah


menggambarkan pegawai perusahaan yang bertanggung
jawab penuh untuk mengembangkan dan memelihara
sistem informasi berbasis komputer/CBIS. Spesialis
informasi digolongkan menjadi lima macam, yaitu:
1. Analis sistem, adalah pakar dalam mendefinisikan
masalah dan menyiapkan dokumentasi tertulis mengenai
cara komputer membantu pemecahan masalah. Analis
sistem bekerja sama dengan pemakai mengembangkan
sistem baru dan memperbaiki sistem yang ada sekarang.
2. Pengelola basis data (Data Base Administrator/DBA),
bekerja sama dengan pemakai dan analis sistem
menciptakan basis data yang berisi data yang diperlukan
untuk menghasilkan informasi bagi pemakai.
Selanjutnya pengelola basis data mengelola basis data
sebagai sumber daya penting bagi perusahaan.
3. Spesialis Jaringan (network specialist), adalah orang yang
ahli dalam bidang komputer dan telekomunikasi.
Spesialis jaringan bekerja sama dengan analis sistem dan
pemakai membentuk jaringan komunikasi data yang
menyatukan berbagai sumber daya komputer yang
tersebar.
Sistem Informasi Manajemen dan Data Mining
45

4. Pemrogram (programmer), bekerja dengan menggunakan


dokumentasi yang disiapkan analis sistem untuk
membuat kode program dalam bahasa tertentu untuk
memproses data masukan yang tersedia menjadi
keluaran berupa informasi bagi para pemakai.
5. Operator, mengoperasikan peralatan komputer berskala
besar (misal: main frame, mini), memantau layar
komputer, mengganti ukuran kertas di printer,
mengelola perpustakaan disk storage, dan lain-lain.
46 Sistem Informasi Manajemen dan Data Mining
Sistem Informasi Manajemen dan Data Mining
47

BAB VI
PERTUKARAN SISTEM MANUAL KE
SISTEM KOMPUTER

I. KONVERSI SISTEM MANUAL KE SISTEM


KOMPUTER
ntuk meningkatkan pengertian kita tentang sistem
U informasi manajemen yang menggunakan komputer,
kita melanjutkan peralihan dari sistem manual ke sistem
komputer ini dengan menjelaskan langkah-langkah yang
diambil dalam konversi atau peralihan sistem. Langkah-
langkah yang diambil dalam konversi ini adalah persiapan
dari:
1. Uraian atau penjelasan sistemnya (secara keseluruhan)
2. Dokumen-dokumen input
3. Dokumen-dokumen output
4. Desain arsip
5. Program logikanya (detail)
6. Program komputer
7. Verifikasi sistem
8. Dokumentasi

1. Uraian Sistem
Uraian sistem pada dasarnya merupakan suatu
pernyataan tentang input, output, operasi pengolahan data
serta arsip utama yang diperlukan. Tujuannya adalah untuk
memperlihatkan arus informasi yang logis dan
48 Sistem Informasi Manajemen dan Data Mining

operasi-operasi logis yang perlu dilakukan untuk


menjalankan desain khusus yang dipilih.
Uraian sistem ini berbentuk tertulis dan berupa gambar
diagram.
1) Uraian Tertulis
Uraian secara tertulis ini menjelaskan bagaimana sistem
itu bekerja. Dalam uraian ini harus dicantumkan apa
inputnya, outputnya, arsipnya, dan operasinya.
Penjelasan itu harus cukup terperinci, agar para
pemakainya dan para teknisi komputernya memahami
operasi dari sistemnya, dan dapat menggunakan
penjelasan ini sebagai titik tolak untuk membuat desain
yang lebih terperinci.
2) Uraian berupa gambar
Sebuah gambar atau ilustrasi memungkinkan kita untuk
menyimpulkan uraian tertulis dari sistem secara drastis.
Bentuk simbolis ini mempermudah analisa cepat dari
pekerjaan yang harus dilaksanakan, dan memberikan
gambaran menyeluruh secara visual dari seluruh operasi.

2. Dokumen Input
Setelah uraian sistem selesai dibuat, perlu diperinci
bagaimana informasinya harus dicatat dalam bentuk yang
dapat diterima oleh komputer. Pertimbangan dalam
penentuan format ini meliputi volume dari informasi,
frekwensi, ketepatan dan keperluan verifikasinya, serta
penanganan dari informasi tersebut. Kadang-kadang
informasi itu harus diterima dalam bentuk aslinya,
sebagaimana diterima dari luaran. Dalam hal ini hanya
Sistem Informasi Manajemen dan Data Mining
49

diperlukan pembuatan suatu bentuk yang dapat digunakan


oleh mesin.
3. Dokumen Output
Pertimbangan-pertimbangan mengenai output hampir
tidak ada bedanya dengan input, hanya formatnya saja yang
harus dirancang lebih cermat karena ini merupakan tujuan
dari seluruh operasi ini. Manajemen khususnya hanya
memerlukan dokumen output ini, dan karena sifat yang
kritis ini, maka desainnya harus dilakukan dengan baik.
4. Desain Arsip
Logika yang diperlukan untuk mengendalikan arus
data di dalam sistem merupakan bagian dari desain sistem,
dan arus ini sebaliknya bergantung pada desain dari arsip-
arsip datanya. Kedua langkah ini berkaitan sangat erat dan
seharusnya dipertimbangkan bersamaan dengan
pertimbangan antar jenis peralatan, kepastian penyimpanan,
media input dan output, dan format.
5. Logika Program
Meskipun ada berbagai cara dalam penyusunan logika
dan mendokumentasikan program logika ini, kita akan
menggunakan bagan arus, karena hal ini sudah
mendominasi secara historis serta mudah untuk membuat
dan memahaminya.
Bagan arus program ini merupakan logika dari
penyusunan program (programmer) mengenai ilustrasi
selangkah demi selangkah bagaimana program komputer
melaksanakan pekerjaannya. Ini adalah “cetak biru” dari
suatu program, dan digunakan untuk mengumpulkan dan
menyusun fakta-fakta agar dapat diteliti di atas kertas; untuk
50 Sistem Informasi Manajemen dan Data Mining

menguraikan masalah, logika, dan pemecahannya; dan


untuk menangani seluruh masalah dengan langkah-langkah
yang sistematis.
6. Verifikasi Sistem
Setelah program disusun dan digunakan dalam proses
pemakaian, maka program tersebut disimpan dalam
memory dalam bentuk binary atau bentuk yang “dapat
dibaca mesin” dan siap untuk mengolah input dari terminal,
menyesuaikan catatan dalam arsip induk dalam disk, dan
mencetak laporan yang diperlukan. Komputer akan
melaksanakan instruksi-instruksi dari program tersebut
menurut urutannya, sampai programnya berhenti.
Supaya langkah ini tidak dianggap remeh, perlu
diperhatikan bahwa kemungkinan dari sebuah program
bekerja semestinya pada penggunaan pertama kalinya,
adalah nihil.
7. Dokumentasi
Dokumentasi yang diperlukan terdiri dari tiga jenis:
1) Bagi mereka yang menyediakan inputnya, diperlukan
sebuah gambaran menyeluruh yang sederhana dari
sistemnya, serta uraian yang jelas mengenai jenis input
apa yang diperlukan, dan catatan mengenai input
manakah yang tidak dapat diterima.
2) Bagi mereka yang menjalankan dan memelihara
sistemnya, diperlukan semua dokumentasi teknis yang
dihasilkan selama proses pengembangan sistem ini.
3) Bagi mereka yang menggunakan outputnya, diperlukan
sebuah gambaran menyeluruh yang sederhana dari
Sistem Informasi Manajemen dan Data Mining
51

sistemnya, serta uraian yang jelas mengenai makna


output tersebut, dan catatan tentang keterbatasannya.

Konversi Sistem menentukan bagaimana suatu sistem


akan menyelesaikan apa yang mesti diselesaikan. Tahap ini
menyangkut mengkonfigurasikan dari komponen-
komponen perangkat lunak dan perangkat keras dari suatu
sistem, sehingga setelah instalasi dari sistem, akan benar-
benar memuaskan rancang bangun yang telah ditetapkan
pada akhir tahap analisis sistem.
Dengan demikian Perancangan Sistem dapat diartikan
sebagai berikut:
1. Tahap setelah analisis dari siklus pengembangan sistem
2. Pendefinisian dari kebutuhan-kebutuhan fungsional
3. Persiapan untuk rancang bangun implementasi
4. Menggambarkan bagaimana suatu sistem dibentuk.
Dapat berupa penggambaran, perencanaan dan
pembuatan sketsa atau pengaturan dari beberapa elemen
yang terpisah ke dalam satu kesatuan yang utuh dan
berfungsi.

Termasuk menyangkut mengkonfigurasi dari


komponen-konponen perangkat lunak dan perangkat keras
dari suatu sistem
Konversi Sistem ini bisa digambarkan dengan:
1. DAD ( DFD)
2. ERD
3. Flowchart
52 Sistem Informasi Manajemen dan Data Mining

1. DAD (Diagram Arus Data)


DAD (Diagram Arus Data) adalah suatu modeling tool
yang memungkinkan sistem analis menggambarkan suatu
sistem sebagai suatu jaringan kerja proses dan fungsi yang
dihubungkan satu sama lain oleh penghubung yang disebut
alur data.

a. Fungsi DAD:
1) DAD membantu para analis sistem meringkas
informasi tentang sistem, mengetahui hubungan antar
sub-sub sistem, membantu perkembangan aplikasi
secara efektif.
2) DAD berfungsi sebagai alat komunikasi yang baik
antara pemakai dan analis sistem.
3) DAD dapat menggambarkan sejumlah batasan otomasi
untuk pengembangan alternatif sistem fisik.

b. Komponen-komponen DAD
Ada beberapa simbol yang digunakan dalam DFD yang
merupakan karakteristik dari suatu sistem sebagai contoh
versi Yourdan De Marco, yaitu:

1. Terminator (External Entity)

Terminator disimbolkan dalam bentuk persegi panjang,


yang mewakili entity luar dimana sistem berkomunikasi.
Biasanya notasi ini melambangkan orang atau kelompok
orang misalnya organisasi diluar sistem, grup, departemen,
perusahaan pemerintah, dan berada di luar kontrol sistem
yang dimodelkan. Pada sejumlah kasus dapat merupakan
Sistem Informasi Manajemen dan Data Mining
53

sistem lain, sebagai contoh: sistem komputer yang


berkomunikasi dengan sistem yang dimodelkan.

2. Nama Proses
Proses

Proses disimbolkan dalam bentuk lingkaran.


Melambangkan suatu proses dari data yang dimasukkan ke
dalam sistem yang mengubah input menjadi output.
Pemberian nama pada proses dengan menggunakan kata
kerja transistif (membutuhkan objek).

3. Penyimpanan Data (Data Store)


Nama Data Store

Data store disimbolkan dengan garis sejajar, yang


digunakan untuk memodelkan kumpulan data atau paket
data. Penyimpanan kadang kala didefinisikan sebagai suatu
mekanisme di antara dua proses yang dibatasi oleh jangka
waktu tertentu. Data store dapat berupa file/database yang
tersimpan dalam disket, hard disk, dll.

4. Alur data (Data Flow)


Data Flow disimbolkan dengan tanda anak panah, alur
ini mengalir di antara proses, data store, dan terminator.
Alur data menunjukkan arus data yang dapat berupa
masukkan untuk sistem atau hasil proses sistem.
54 Sistem Informasi Manajemen dan Data Mining

2. ERD (Entity Relationship Diagram)


ERD merupakan suatu model untuk menjelaskan
hubungan antar data dalam basis data berdasarkan objek-
objek dasar data yang mempunyai hubungan antar relasi.
ERD untuk memodelkan struktur data dan hubungan antar
data, untuk menggambarkannya digunakan beberapa notasi
dan simbol. Pada dasarnya ada tiga simbol yang digunakan,
yaitu:
a. Entitas/Entity
Entitas merupakan objek yang mewakili sesuatu yang
nyata dan dapat dibedakan dari sesuatu yang lain
(Fathansyah, 1999: 30). Simbol dari entitas ini biasanya
digambarkan dengan persegi panjang.
Entitas Set adalah kumpulan dari entitas sejenis, yang
dapat berupa:
• Objek secara fisik contoh rumah, kendaraan,
pekerjaan.
• Objek secara konsep contoh pekerjaan, perusahaan,
rencana.

b. Atribut
Atribut adalah karakteristik dari entitas atau
relationship, yang menyediakan penjelasan detail tentang
entitas atau relationship tersebut.
Setiap entitas pasti mempunyai elemen yang disebut
atribut yang berfungsi untuk mendeskripsikan karakteristik
dari entitas tersebut. Isi dari atribut mempunyai sesuatu
yang dapat mengidentifikasikan isi elemen satu dengan yang
lain. Gambar atribut diwakili oleh simbol elips.
Sistem Informasi Manajemen dan Data Mining
55

Nilai atribut merupakan suatu data aktual atau


informasi yang disimpan pada suatu atribut didalam suatu
entitas atau relationship.
• Jenis-jenis Atribut:
- Atibut Key
- Atribut Simple
- Atribut yang bernilai tunggal.
- Atribut Multivalue
- Atribut Derivatif

c. Hubungan/Relasi
Adalah hubungan antara sejumlah entitas yang berasal
dari himpunan entitas yang berbeda. Relasi dapat
digambarkan sebagai berikut:
Relasi yang terjadi diantara dua himpunan entitas
(misalnya A dan B) dalam satu basis data yaitu (Abdul
Kadir, 2002: 48):
1) Satu ke satu (One to one)
Hubungan relasi satu ke satu yaitu setiap entitas pada
himpunan entitas A berhubungan paling banyak dengan
satu entitas pada himpunan entitas B.
2) Satu ke banyak (One to many)
Setiap entitas pada himpunan entitas A dapat
berhubungan dengan banyak entitas pada himpunan
entitas B, tetapi setiap entitas pada entitas B dapat
berhubungan dengan satu entitas pada himpunan entitas
A.
3) Banyak ke banyak (Many to many)
56 Sistem Informasi Manajemen dan Data Mining

Setiap entitas pada himpunan entitas A dapat


berhubungan dengan banyak entitas pada himpunan
entitas B.

3. Flowchart
Flowchart merupakan gambar atau bagan yang
memperlihatkan urutan dan hubungan antar proses beserta
instruksinya. Gambaran ini dinyatakan dengan simbol.
Dengan demikian setiap simbol menggambarkan proses
tertentu. Sedangkan hubungan antar proses digambarkan
dengan garis penghubung.
Flowchart ini merupakan langkah awal pembuatan
program. Dengan adanya flowchart urutan poses kegiatan
menjadi lebih jelas. Jika ada penambahan proses maka dapat
dilakukan lebih mudah. Setelah flowchart selesai disusun,
selanjutnya pemrogram (programmer) menerjemahkannya
ke bentuk program dengan bahasa pemrograman.

Simbol-simbol flowchart
Flowchart disusun dengan simbol-simbol. Simbol ini
dipakai sebagai alat bantu menggambarkan proses di dalam
program. Simbol-simbol yang dipakai antara lain:

Flow Direction symbol


Yaitu simbol yang digunakan untuk
menghubungkan antara simbol yang satu
dengan simbol yang lain. Simbol ini disebut
juga connecting line.
Sistem Informasi Manajemen dan Data Mining
57

Terminator Symbol
Yaitu simbol untuk permulaan (start) atau
akhir (stop) dari suatu kegiatan.

Connector Symbol
Yaitu simbol untuk keluar–masuk atau
penyambungan proses dalam lembar/halaman
yang sama.

Connector Symbol
Yaitu simbol untuk keluar–masuk atau
penyambungan proses pada lembar/halaman
yang berbeda.

Processing Symbol
Simbol yang menunjukkan pengolahan yang
dilakukan oleh komputer.

Simbol Manual Operation


Simbol yang menunjukkan pengolahan yang
tidak dilakukan oleh komputer.

Simbol Decision
Simbol pemilihan proses berdasarkan kondisi
yang ada.
58 Sistem Informasi Manajemen dan Data Mining

Simbol Input-Output
Simbol yang menyatakan proses input dan
output tanpa tergantung dengan jenis
peralatannya.

Simbol Manual Input


Simbol untuk pemasukan data secara manual
on-line keyboard.

Simbol Preparation
Simbol untuk mempersiapkan penyimpanan
yang akan digunakan sebagai tempat
pengolahan di dalam storage.

Simbol Predefine Proses


Simbol untuk pelaksanaan suatu bagian (sub-
program)/procedure.

Simbol Display
Simbol yang menyatakan peralatan output
yang digunakan yaitu layar, plotter, printer
dan sebagainya.

Simbol disk and On-line Storage


Simbol yang menyatakan input yang berasal
dari disk atau di simpan ke disk.
Sistem Informasi Manajemen dan Data Mining
59

Simbol magnetik tape Unit


Simbol yang menyatakan input berasal dari
pita magnetik atau output disimpan ke pita
magnetik.

Simbol Punch Card


Simbol yang menyatakan bahwa input berasal
dari kartu atau output ditulis ke kartu.

Simbol Dokumen
Simbol yang menyatakan input berasal dari
dokumen dalam bentuk kertas atau output
dicetak ke kertas.

II. KEUNGGULAN KOMPETITIF


Pada bidang komputer keunggulan kompetitif
diartikan sebagai pemanfaatan informasi untuk
mendapatkan leverage di pasaran. Dasar pemikirannya,
perusahaan tidak harus sepenuhnya mengandalkan sumber
daya fisik yang lebih unggul saat terlibat dalam persaingan.
Sumber daya konseptual yang unggul (data dan informasi)
dapat digunakan sama baiknya dengan sumber daya fisik
lainnya.
Berdasarkan pengalaman, terdapat tiga hal penting untuk
mencapai keunggulan kompetitif dalam bidang komputer,
yaitu:
1. Tidak ada perusahaan yang sukses tersebut yang hanya
mengandalkan sumber daya fisik.
60 Sistem Informasi Manajemen dan Data Mining

2. Tidak ada aplikasi komputer inovatif yang memberikan


keunggulan kompetitif yang terus menerus bagi
perusahaan pemakainya. Umur yang singkat dari sistem
informasi menuntut para pembuat sistem untuk selalu
siap meraih peluang sistem baru yang lebih baik.
3. Perhatian utama perusahaan adalah memusatkan sumber
daya informasi pada para pelanggan mereka.

Berbagai bentuk sistem komunikasi data dapat dipilih


untuk membentuk operasi sistem.
Jenis-jenis sumber daya informasi dapat terdiri atas:
1. Perangkat Keras Komputer
2. Perangkat Lunak Komputer
3. Para Spesialis Informasi
4. Pemakai
5. Fasilitas
6. Basis Data
7. Informasi

III. PENERAPAN MODEL UNTUK SISTEM


PEMECAHAN MASALAH DI PERUSAHAAN
Model adalah penyederhanaan (abstraction) dari sesuatu
yang mewakili sejumlah obyek atau aktivitas yang disebut
entitas (entity).
Model umum sistem dapat digolongkan dalam empat
jenis yaitu:
1. Model fisik, merupakan penggambaran entitas dalam
bentuk tiga dimensi. Model fisik membantu suatu tujuan
Sistem Informasi Manajemen dan Data Mining
61

yang tidak dapat dipenuhi oleh benda nyata dan model


ini mempunyai nilai paling kecil bagi para manajer.
2. Model naratif, menggambarkan entitas secara lisan atau
tulisan. Model ini paling banyak digunakan dan paling
popular, namun jarang disadari para pemakainya.
3. Model grafis, menggambarkan entitas dengan sejumlah
garis, symbol, atau bentuk. Model ini banyak digunakan
untuk komunikasi bisnis, karena sifatnya yang ringkas
dan jelas.
4. Model matematis, merupakan segala bentuk formula atau
persamaan yang banyak digunakan dalam pembuatan
model bisnis (business modeling).

Model fisik, naratif dan grafis berguna dalam hal:


1. Mempermudah pengertian/pemahaman.
2. Mempermudah komunikasi
Sedangkan model matematis memberikan tambahan
untuk memprediksi masa depan/perencanaan.
62 Sistem Informasi Manajemen dan Data Mining
Sistem Informasi Manajemen dan Data Mining
63

BAB VII
MANAJEMEN DATABASE / DBMS

I. PENDAHULUAN
BMS adalah perangkat lunak yang menangani semua
D pengaksesan database. Mempunyai fasilitas membuat,
mengakses, memanipulasi dan memelihara basis data.

II. DATABASE
Apakah Database itu?
Database dapat diartikan kumpulan tabel-tabel yang
saling berelasi sehingga memudahkan proses manipulasi
data. Bila sebuah organisasi memiliki suatu koleksi terpadu
dari data yang disusun secara logis dan dikendalikan secara
sentral, maka organisasi itu mempunyai sebuah Database.
Untuk setiap database telah dikembangkan sebuah sistem
untuk penggunaan database. Sistem ini, atau suatu rangkaian
peraturan dan metode, memungkinkan pemberian definisi,
penciptaan, perubahan, pembacaan, pemeliharaan, dan
perlindungan database tersebut.
Pendek kata sistem ini adalah Sistem Manajemen
Database (DBMS = Database Management System).
Database mempunyai beberapa komponen:
1) Setidak-tidaknya satu orang menjadi “pemiliknya” dan
bertanggung jawab atas database tersebut.
2) Serangkaian peraturan dan hubungan yang menentukan
dan mengatur interaksi antara berbagai unsur dari
database.
64 Sistem Informasi Manajemen dan Data Mining

3) Manusia yang memasukkan data ke dalam database itu.


4) Orang yang mengeluarkan data dari database itu.
5) Database-nya sendiri.

Dampak adanya Database dalam organisasi sudah pasti


dibutuhkannya perangkat pendukung seperti:
a. Komputer dan kecepatannya
Kecepatan merupakan salah satu dari atribut
komputer yang paling berharga. Keistimewaan kedua
adalah kemampuan untuk menangani data dalam
volume besar secara akurat. Dan akhirnya, komputer
tidak menjadi lelah atau bosan dengan pekerjaannya
yang berulang-ulang. Semua karakteristik ini
mempunyai arti penting dalam manajemen database:
Kecepatan (speed), karena perusahaan yang modern
harus mengolah banyak transaksi dalam waktu yang
sangat singkat.
Ketelitian, karena banyak perusahaan membutuhkan
data, yang mereka simpan dan digunakan dengan benar.
Sangat baik dalam melakukan pekerjaan berulang-ulang,
karena database bersifat berulang (setidak-tidaknya dalam
format dan bentuk isinya)
b. Dampak atas manajemen
Tidak diragukan lagi, bahwa sistem database elektronik
ini merupakan faktor yang besar artinya dalam dunia
usaha. Dan hal ini akan menjadi bertambah penting
dengan berlalunya waktu. Namun DBMS ini
menimbulkan beberapa masalah serius bagi manajemen:
Sistem Informasi Manajemen dan Data Mining
65

1) Bagaimana mengelola ahli-ahli teknik yang


dibutuhkan untuk menggunakan database yang besar
dan canggih.
2) Bagaimana menjaga agar sistem ini tidak muncul
sebagai unsur utama dan menjadi benalu dalam
kegiatan utama perusahaan.
3) Bagaimana mendapatkan informasi dan bukan
setumpuk data dari database ini.
4) Bagaimana mempertahankan kebebasan manusia,
dengan adanya potensi dari database untuk
“mengingat” setiap gerak-gerik kita.
5) Bagaimana melakukan pengintegrasian DBMS secara
mulus dalam organisasi yang lebih besar.

Sebaliknya manajemen dapat menarik keuntungan besar


dari penggunaan yang tepat dari DBMS ini:
a) Lebih banyak data yang dapat dipertimbangkan dalam
menghasilkan informasi bagi manajemen untuk
mengambil keputusan.
b) Informasi dapat disajikan secara lebih cepat untuk
manajemen.
c) Usaha dapat dijalankan secara lebih efektif dan lebih
efisien (misalnya, bila data pelanggan segera tersedia,
dari dalam hal perbankan, pada cabang mana nasabah
mempunyai rekening).
d) Database dari sumber-sumber diluar perusahaan
tersedia untuk membantu manajemen dalam
mengambil keputusan (misalnya informasi tentang
persediaan barang).
66 Sistem Informasi Manajemen dan Data Mining

III. FUNGSI DBMS


1. Data Definition, DBMS harus dapat mengolah
pendefinisian data.
2. Data Manipulation, DBMS harus dapat menangani
permintaan dari pemakai untuk mengakses data.
3. Data Security & Integrity, DBMS harus dapat
memeriksa security dan integrity data yang
didefinisikan oleh DBA.
4. Data Recovery & Concurency, DBMS harus dapat
menangani kegagalan-kegagalan pengaksesan database
yang dapat disebabkan oleh kesalahan sistem, kerusakan
disk, dsb.
5. Data Dictionary, DBMS harus menyediakan data
dictionary.
6. Performance, DBMS harus menangani unjuk kerja dari
semua fungsi seefisien mungkin.

Beberapa hal yang harus dipertimbangkan oleh


manajemen dalam merancang dan menyusun sistem
manajemen database mereka:
1) Menyediakan tempat penyimpanan massal untuk data
yang relevan.
2) Membuat agar pemakainya mudah mendapatkan
(meng-akses) data.
3) Memungkinkan respon yang segera atas permintaan
dari data para pemakai.
4) Melakukan modifikasi terakhir dengan segera pada
database.
5) Menghapus data yang berlebihan.
Sistem Informasi Manajemen dan Data Mining
67

6) Memungkinkan penggunaan secara serentak dalam


beberapa pemakai.
7) Memungkinkan perkembangan lebih lanjut dalam
sistem database.
8) Melindungi data dari kerusakan fisik dan pemakaian
yang tidak di otorisasi.
68 Sistem Informasi Manajemen dan Data Mining
Sistem Informasi Manajemen dan Data Mining
69

BAB VIII
DAUR HIDUP PENGEMBANGAN SIM
(Systems Development Life Cycle–SDLC)

I. REKAYASA PERANGKAT LUNAK UNTUK SIM


1. Paradigma Terhadap Rekayasa Perangkat Lunak
ekayasa perangkat lunak SIM adalah penerapan dan
R pemanfaatan prinsip-prinsip rekayasa untuk
menghasilkan software yang ekonomis, andal dan bekerja
secara efisien pada mesin-mesin yang nyata. Elemen-elemen
kunci dalam rekayasa perangkat lunak SIM meliputi:
1). Metode/Method
Metode yang digunakan adalah how to yang bersifat
teknis. Metode yang digunakan meliputi bidang-bidang
perencanaan proyek, estimasi, analisis persyaratan,
perancangan, coding, pengujian dan pemeliharaan.
2). Alat/Tool
Alat akan memberikan dukungan otomasi bagi metode
(misal: Computer Aided Software Engineering/CASE)
3). Prosedur/Procedure
Prosedur akan mengintegrasikan metode dan alat.
Prosedur mendefinisikan kapan suatu metode akan
digunakan, hasil yang diharapkan, pengendalian untuk
menjamin kualitas hasil, dan milestone yang dapat
digunakan untuk mengevaluasi kemajuan.
70 Sistem Informasi Manajemen dan Data Mining

2. Siklus Klasik/Model Air Terjun


Siklus klasik/model air terjun perangkat lunak SIM
didasarkan siklus konvensional dalam bidang rekayasa
lainnya dengan pendekatan sekuensial yang sistematis.
Tahapan-tahapan dalam siklus klasik/model air terjun
rekayasa perangkat lunak SIM terdiri atas enam tahapan
yaitu:
1) Analisis dan Rekayasa Sistem
Software merupakan bagian dari sebuah SIM. Tahapan
analisis dan rekayasa sistem dilakukan untuk
mendapatkan gambaran yang meluas pada lingkup
sistem.
2) Analisis Persyaratan
Tahap analisis persyaratan difokuskan lebih terarah ke
software. Analisis persyaratan berusaha mengetahui aspek
what. Tahapan ini banyak melibatkan pemakai dan
pengembang SIM.
3) Perancangan
Tahap perancangan bertujuan menterjemahkan
persyaratan menjadi suatu bentuk representasi yang dapat
di evaluasi kualitas sebelum tahap coding dilakukan.
4) Coding (Penulisan Program)
Coding merupakan tahap penerjemahan rancangan ke
dalam bentuk yang dapat dimengerti komputer.
5) Pengujian
Tahap ini berfokus pada pengujian rincian logika software.
Pengujian bertujuan mengungkapkan dan menghilangkan
kesalahan-kesalahan yang ada sehingga software bekerja
sesuai dengan yang diharapkan.
Sistem Informasi Manajemen dan Data Mining
71

6) Pemeliharaan.
Tahap pemeliharaan meliputi kegiatan-kegiatan koreksi
kesalahan dan penyesuaian software terhadap perubahan
lingkungannya.

Siklus klasik/model air terjun rekayasa perangkat lunak


SIM akan menghadapi tiga permasalahan, yaitu:
1) Proyek-proyek pengembangan software jarang yang
mengikuti alur sekuensial yang ketat, tetapi banyak
melibatkan proses literasi.
2) Pemberi pekerjaan kesulitan untuk menyatakan semua
keinginannya secara eksplisit di awal tahap
pengembangan.
3) Hasil software yang dikembangkan baru akan diketahui
lama setelah proyek pengembangan dimulai.

3. Teknik 2 Model Rekayasa Perangkat Lunak untuk SIM


a. Prototyping
Teknik prototyping baik digunakan jika pemakai belum
siap dengan persyaratan software secara lengkap. Prototyping
digunakan untuk menunjukan model software SIM yang
dikembangkan. Model software dalam prototyping terdiri
atas:
1) Model “kertas”
Model “kertas” diperlukan agar pemakai mengerti
tentang interaksi antara pemakai dan software.
2) Model kerja
Model kerja diperlukan untuk mengimplementasikan
beberapa fungsi/modul dalam software.
3) Program
72 Sistem Informasi Manajemen dan Data Mining

Program dapat dikembangkan setelah sebagian atau


semua fungsi/modul dalam software yang akan
digunakan dalam SIM telah diimplementasikan.

b. Model Spiral
Model Spiral merupakan perbaikan dari rekayasa
perangkat lunak menggunakan model air terjun dan teknik
prototyping. Model spiral menggabungkan keuntungan-
keuntungan model air terjun dan prototyping dan
memasukkan aktivitas analisis resiko (risk analysis).
Model Spiral melibatkan proses iterasi, dimana setiap
iterasi bekerja pada satu level software SIM yang diinginkan.
Dalam model spiral, setiap perpindahan level didahului oleh
analisis resiko.
Satu-satunya permasalahan yang dihadapi dalam
penggunaan model spiral adalah menuntut keahlian dalam
bidang analisis resiko.
Rekayasa perangkat lunak SIM menggunakan model
spiral terdiri atas empat aktivitas utama, yaitu:
1) Perencanaan
Aktivitas ini meliputi; penentuan sasaran, alternatif
solusi dan hambatan.
2) Analisis Resiko
Aktivitas ini meliputi; analisis alternatif solusi dan
identifikasi resiko.
3) Perekayasaan
Perekayasaan merupakan pengembangan produk pada
level berikutnya.
4) Evaluasi Pemakai
Sistem Informasi Manajemen dan Data Mining
73

Evaluasi oleh pemakai diterapkan pada hasil proses


perekayasaan.
c. Kombinasi Beberapa Paradigma
Kombinasi beberapa paradigma dalam rekayasa
perangkat lunak SIM dimaksudkan untuk mengambil
kelebihan masing-masing paradigma.

4. Faktor 2 Manusia dalam Software


a. Faktor Manusia dalam Software Engineering
Faktor manusia dalam rekayasa perangkat lunak SIM
sangat penting, yaitu:
1) Agar bisa efektif, manajer software harus mengerti
stafnya secara individu dan mengerti bagaimana mereka
bergaul.
2) Sistem komputer dan perangkat lunak SIM yang
dikembangkan akan berpengaruh buruk bagi calon
pengguna jika tidak memperhitungkan kemampuan
calon pengguna pada saat rekayasa perangkat lunak.
3) Produktivitas programmer adalah faktor utama dalam
rekayasa perangkat lunak, untuk itu perlu dimengerti
faktor yang mempengaruhi produktivitas programmer
dalam rekayasa perangkat lunak agar dapat
meningkatkan produktivitas.
74 Sistem Informasi Manajemen dan Data Mining
Sistem Informasi Manajemen dan Data Mining
75

BAB IX
DAUR HIDUP PENGEMBANGAN SIM 2
(Systems Development Life Cycle–SDLC)

I. DASAR-DASAR ANALISIS PERSYARATAN


PERANGKAT LUNAK
nalisis persyaratan perangkat lunak berfungsi untuk
A menjembatani antara pengalokasian fungsi perangkat
lunak dan perancangan perangkat lunak. Hal ini akan
memungkinkan untuk mendefinisikan fungsi-fungsi dan
kinerja perangkat lunak, antarmuka perangkat lunak dengan
elemen sistem lainnya, dan kekangan-kekangan yang harus
dipenuhi oleh perangkat keras.
Aktivitas yang dilakukan pada saat analisis persyaratan
perangkat lunak, meliputi:
a. Pemahaman persoalan dalam konteks perangkat lunak.
Pemahaman persoalan dapat berasal dari spesifikasi
sistem dan rencana proyek. Hal ini akan berhasil jika
keterlibatan unsur manajemen dan teknis dari pihak
pemakai sangat besar.
b. Evaluasi dan sintesis
Aspek-aspek evaluasi dan sintesis meliputi :
▪ Aliran dan isi informasi
▪ Fungsi-fungsi yang dijalankan perangkat lunak
▪ Antarmuka
▪ Kekangan-kekangan yang mungkin muncul dalam
proses perancangan
76 Sistem Informasi Manajemen dan Data Mining

▪ Kriteria dan teknik validasi

c. Aktivitas evaluasi dan sintesis difokuskan pada


pertanyaan “apa” bukan “mengapa”. Pemodelan
(prototyping) perlu dibuat untuk memperkuat
pemahaman, dan berfungsi sebagai dasar pada tahap
perancangan dan pembuatan spesifikasi perangkat lunak.
d. Spesifikasi perangkat lunak dan review-nya
Spesifikasi perangkat lunak dan review-nya merupakan
dokumentasi yang dibuat bersama-sama oleh
pengembang dan pemakai.

Analisis persyaratan dalam pemodelan (prototyping)


diperlukan untuk menunjukan model perangkat lunak yang
akan dibuat. Analisis persyaratan pemodelan meliputi:
a. Apakah perangkat lunak yang akan dibuat cocok dibuat
prototype-nya
b. Jika ya, buatlah ringkasan persyaratan yang harus
dipenuhi oleh prototype
c. Buatlah prototype
d. Uji dan sempurnakan prototype
e. Presentasikan prototype yang telah disempurnakan kepada
pemakai
f. Ulangi langkah 4 dan 5 sampai semua persyaratan
dipenuhi sesuai permintaan pemakai atau jika prototype
telah berkembang menjadi produk yang sebenarnya.

II. PERANCANGAN PERANGKAT LUNAK SIM


Aktivitas pertama dalam perancangan perangkat lunak
SIM berawal dari model-model informasi yang terdiri dari
Sistem Informasi Manajemen dan Data Mining
77

fungsi, behavior, dan persyaratan-persyaratan lain. Model-


model tersebut diperlukan untuk menyusun:
a. Rancangan data, yaitu menentukan dominan struktur
basis data
b. Rancangan arsitektur, yaitu menentukan hubungan antar
komponen-komponen sruktural dari program
c. Prosedur, yaitu menentukan deskripsi prosedur dalam
sistem

Proses yang dilakukan dalam perancangan perangkat


lunak meliputi:
a. Menyusun rancangan awal, yaitu menentukan rancangan
arsitektur perangkat lunak
b. Menyusun rancangan terinci, yaitu penyempurnaan
rancangan arsitektur perangkat lunak menjadi bentuk-
bentuk struktur basis data dan algoritma yang terinci.

III. UJIAN DAN PEMELIHARAAN PERANGKAT


LUNAK SIM
a. Pendekatan dalam Pengujian
Pengujian perangkat lunak dibedakan menjadi dua, yaitu
pengujian white box dan pengujian black box.
Pengujian white box dilakukan sebagai berikut:
1) Menguji detail prosedural, yaitu mengamati jalur logical
yang dibentuk oleh struktur pengendalian program
(perulangan dan percabangan).
2) Bisa mengungkap 100% kesalahan logika yang mungkin
muncul dan bersifat exhaustive (melelahkan), karena
78 Sistem Informasi Manajemen dan Data Mining

terjadi ledakan kombinasi dari berbagai modul program


yang besar dan komplek.
3) Dilakukan pada awal tahap pengujian

Aktivitas pengujian white box sebaiknya dilakukan sebagai


berikut:
1) Setiap jalur paling sedikit diuji satu kali
2) Menguji setiap kondisi percabangan untuk nilai ‘benar’
dan ’salah’
3) Menguji perulangan pada batas perulangan dan pada
daerah operasionalnya
4) Menguji struktur data internal untuk memastikan
keakuratannya.

Metode pengujian yang dapat digunakan adalah:


1) Jalur Dasar (basis path)
2) Pengujian Kondisi
3) Pengujian Aliran Data
4) Pengujian Perulangan

Pengujian black box sebaiknya dilakukan sebagai berikut:


1) Difokuskan pada persyaratan fungsional dari perangkat
lunak
2) Dilakukan tidak pada awal tahap pengujian
3) Mengungkapkan kesalahan-kesalahan pada:
▪ Fungsi-fungsi yang salah atau hilang
▪ Antar muka
▪ Akses ke basis data external
▪ Kinerja
▪ Inisialisasi dan terminasi program
Sistem Informasi Manajemen dan Data Mining
79

Metode yang dapat digunakan untuk pengujian black box


adalah:
1) Equivalence partitioning
2) Analisis nilai batas
3) Teknik grafik sebagian akibat.

b. Pemeliharaan Perangkat Lunak


Jenis-jenis pemeliharaan perangkat lunak SIM meliputi:
1) Korektif, yaitu pemeliharaan yang dilakukan apabila
terjadi kesalahan atau kerusakan.
2) Adaptif atau produktif, yaitu pemeliharaan yang
dilakukan secara terus-menerus melalui proses
monitoring.
3) Penyempurnaan, yaitu pemeliharaan sebagai hasil
dari penemuan perawatan adaptif.
4) Preventif, yaitu pemeliharaan yang dilakukan untuk
pencegahan kerusakan.

Aktivitas yang perlu dilakukan apabila terjadi kesalahan


dalam perangkat lunak SIM adalah sebagai berikut:
1) Pelaporan, yaitu melaporkan adanya kesalahan dan
spesifikasi perubahan.
2) Aliran event dalam pemeliharaan.
3) Penyimpanan rekaman-rekaman selama tahap
pengembangan dan tahap penggunaan.
4) Evaluasi terhadap aktivitas-aktivitas yang dilakukan
dalam tahap pemeliharaan, hal ini berguna untuk
menentukan biaya perawatan selanjutnya.
80 Sistem Informasi Manajemen dan Data Mining
Sistem Informasi Manajemen dan Data Mining
81

BAB X
PERANCANGAN SIM SECARA UMUM
BERBASIS KOMPUTER

I. PERANCANGAN MODEL
erancangan sistem atau model adalah bagaimana
P mengorganisasikan sistem ke dalam subsistem-
subsistem, serta alokasi subsistem-subsistem ke komponen-
komponen perangkat keras, perangkat lunak, serta prosedur-
prosedur.
Perancangan model SIM dapat dibedakan menjadi dua,
yaitu:
▪ Pembuatan model logik (logical model)
▪ Model fisik sistem (physical model)

Model logik digunakan untuk menjelaskan secara logik


kepada pemakai tentang bagaimana fungsi-fungsi dalam SIM
akan bekerja. Model logik dapat digunakan dengan
menggunakan Diagram Arus Data/DAD (Data Flow
Diagram/DFD)
Model fisik digunakan untuk menjelaskan kepada
pemakai tentang bagaimana sistem secara fisik akan
diterapkan. Bagan alir sistem (system flowchart) merupakan
alat yang tepat untuk menunjukkan simbol fisik yang
digunakan, seperti terminal, media penyimpan, laporan dan
sebagainya. Bagan alir data merupakan alat berbentuk grafis
yang digunakan untuk menggambarkan aliran pemroses
dalam SIM berbasis komputer.
82 Sistem Informasi Manajemen dan Data Mining

II. PERANCANGAN BASIS DATA UNTUK SIM


Perancangan basis data secara umum dilakukan dengan
menentukan kebutuhan-kebutuhan file-file dalam basis data
berdasarkan DAD sistem baru yang telah dibuat dan
kemudian menentukan parameter file dalam basis data.
Beberapa hal penting yang perlu diperhatikan dalam
rancangan basis data adalah:
1. Minimalisasi kerangkapan data (data redundancy)
2. Dihindari terjadinya inkonsistensi data (inconsistency data)
3. Data-data dalam basis data harus dapat digunakan secara
bersama-sama (share ability)
4. Standarisasi data untuk menyeimbangkan perbedaan
kebutuhan data para pemakai
5. Pembatasan kewenangan (privacy) dan keamanan data
(data security)
6. Menjamin integritas data (data integrity)
7. Menghindari terjadinya data terisolasi ( data isolation )
8. Berorientasi pada data (data oriented) dan bukan pada
program (program oriented)
9. Data dapat digunakan oleh pemakai-pemakai yang
berbeda atau beberapa program aplikasi tanpa perlu
mengubah basis data
10. Data dapat berkembang dengan mudah baik volume
maupun strukturnya
11. Data yang ada dapat memenuhi kebutuhan sistem-sistem
secara mudah
12. Data dapat digunakan dengan cara yang berbeda-beda
13. Independensi data (data indepency), baik secara logik
maupun secara fisik
Sistem Informasi Manajemen dan Data Mining
83

14. Dihindari terjadinya penyimpangan (anomaly) dalam basis


data.

III. PERANCANGAN TEKNOLOGI


Secara umum, teknologi SIM adalah teknologi komputer
yang dikelompokan menjadi tiga klasifikasi, yaitu:
• Perangkat keras
• Perangkat Lunak
• Teknologi komunikasi data

1. Teknologi Perangkat Keras


Teknologi perangkat keras untuk SIM adalah teknologi
komputer. Secara umum, sistem komputer mempunyai
komponen perangkat keras yang terdiri atas:
Perangkat keras masukan, terdiri dari:
• Alat input langsung
• Alat input tidak langsung

Contoh perangkat keras masukan adalah: keyboard,


teleprinter terminal, dll.
Perangkat keras keluaran. Terdiri atas:
▪ Hard copy device, contoh; printer, plotter, dll.
▪ Soft copy device, contoh; video display, speaker, dll.
▪ Drive device, contoh; disk drive, cd drive, dll.

Perangkat keras unit pengolah atau Central Processing Unit


(CPU) terdiri atas:
• Aritmatic and Logic Unit (ALU)
• Control Unit
• Main Memory (RAM dan ROM)
84 Sistem Informasi Manajemen dan Data Mining

2. Teknologi Perangkat Lunak


a. Kategori perangkat lunak
Perangkat lunak dapat dikategorikan dalam tiga bagian
yaitu:
1) Perangkat lunak sistem operasi (Operating
System/OS), yaitu program yang ditulis untuk
mengendalikan dan mengkoordinasi kegiatan dari
perangkat keras sistem komputer
2) Perangkat lunak bahasa (Language Software), yaitu
program yang digunakan untuk menterjemahkan
intruksi-intruksi yang ditulis dalam bahasa
pemrograman ke dalam bahasa mesin supaya
dimengerti komputer
3) Perangkat lunak aplikasi (Aplication Software), yaitu
program yang ditulis dan diterjemahkan oleh
Language Software untuk menyelesaikan suatu aplikasi
tertentu.

b. Sistem Operasi (Operating System/OS)


Sistem operasi merupakan program yang ditulis untuk
mengendalikan dan mengkoordinasi kegiatan dari sistem
komputer.

c. Control Program
Control program umumnya sebagian disimpan di main
memori tepatnya di ROM dan disebut juga dengan
resident program atau resident routine.
Sistem Informasi Manajemen dan Data Mining
85

BAB XI
DATA MINING

I. DEFINISI DATA MINING


ata mining adalah langkah analisis terhadap proses
D penemuan pengetahuan di dalam basis data atau
Knowledge Discovery in Databases yang disingkat dengan KDD
(Fayyad, Usama. 1996).
Data mining merupakan salah satu dari rangkaian
Knowledge Discovery in Databases (KDD). KDD berhubungan
dengan Teknik integrasi dan penemuan ilmiah, interpretasi
dan visualisasi dari pola-pola sejumlah data (Tan, 2004).
Data mining adalah suatu istilah yang digunakan untuk
menguraikan penemuan pengetahuan di dalam database.
Data mining adalah proses yang menggunakan teknik
statistik, matematika, kecerdasan buatan, dan machine
learning untuk mengekstraksi dan mengidentifikasi
informasi yang bermanfaat dan pengetahuan yang terkait
dari berbagai database besar (Turban, dkk. 2005).
Data mining merupakan serangkaian proses untuk
menggali nilai tambah dari suatu kumpulan data berupa
pengetahuan yang selama ini tidak diketahui secara manual.
(Bramer, Max 2007)
Definisi umum dari data mining itu sendiri adalah proses
pencarian pola-pola yang tersembunyi ( hidden patern )
berupa pengetahuan ( knowledge ) yang tidak diketahui
sebelumnya dari suatu sekumpulan data yang mana data
86 Sistem Informasi Manajemen dan Data Mining

tersebut dapat berada di dalam database, data werehouse, atau


media penyimpanan informasi yang lain.
Hal penting yang terkait di dalam data mining adalah:
• Data mining merupakan suatu proses otomatis terhadap
data yang sudah ada.
• Data yang akan diproses berupa data yang sangat besar.
• Tujuan data mining adalah mendapatkan hubungan atau
pola yang mungkin memberikan indikasi yang
bermanfaat.

Data mining dilakukan dengan tool khusus, yang


mengeksekusi operasi data mining yang telah didefinisikan
berdasarkan model analisis. Data mining merupakan
proses analisis terhadap data dengan penekanan
menemukan informasi yang tersembunyi pada sejumlah
data besar yang disimpan ketika menjalankan bisnis
perusahaan.
Kemajuan luar biasa yang terus berlanjut dalam
bidang data mining didorong oleh beberapa faktor antara
lain:
• Pertumbuhan yang cepat dalam kumpulan data.
• Penyimpanan data dalam data warehouse, sehingga
seluruh perusahaan memiliki akses ke
dalam database yang andal.
• Adanya peningkatan akses data melalui navigasi web
dan internet.
• Tekanan kompetisi bisnis untuk meningkatkan
penguasaan pasar dalam globalisasi ekonomi.
• Perkembangan teknologi perangkat lunak untuk data
mining (ketersediaan teknologi).
Sistem Informasi Manajemen dan Data Mining
87

• Perkembangan yang hebat dalam kemampuan komputasi


dan pengembangan kapasitas media penyimpanan.
(Larose, 2005).

Istilah data mining dan knowledge discovery in databases


(KDD) sering kali digunakan secara bergantian untuk
menjelaskan proses penggalian informasi tersembunyi
dalam suatu basis data yang besar. Sebenarnya kedua istilah
tersebut memiliki konsep yang berbeda, tetapi berkaitan satu
sama lainnya. Salah satu tahapan dalam keseluruhan proses
KDD adalah data mining.
Proses KDD ada 5 tahapan yang dilakukan secara terurut,
yaitu:
• Data selection
Pemilihan (seleksi) data dari sekumpulan data
operasional perlu dilakukan sebelum tahap penggalian
informasi dalam KDD dimulai. Data hasil seleksi yang
digunakan untuk proses data mining , disimpan dalam
suatu berkas, terpisah dari basis data operasional.
• Pre-processing / cleaning
Sebelum proses data mining dapat dilaksanakan, perlu
dilakukan proses cleaning pada data yang menjadi fokus
KDD. Proses cleaning mencakup antara lain membuang
duplikasi data, memeriksa data yang inkonsisten, dan
memperbaiki kesalahan pada data.
• Transformation
Coding adalah proses transformasi pada data yang telah
dipilih, sehingga data tersebut sesuai untuk proses data
mining . Proses coding dalam KDD merupakan
88 Sistem Informasi Manajemen dan Data Mining

proses kreatif dan sangat tergantung pada jenis atau pola


informasi yang akan dicari dalam basis data.
• Data Mining
Data mining adalah proses mencari pola atau informasi
menarik dalam data terpilih dengan menggunakan teknik
atau metode tertentu. Teknik, metode, atau algoritma
dalam data mining sangat bervariasi. Pemilihan metode
atau algoritma yang tepat sangat bergantung pada tujuan
dan proses KDD secara keselurahan.
• Interpretation / evalution
Pola informasi yang dihasilkan dari proses data
mining perlu ditampilkan dalam bentuk yang mudah
dimengerti oleh pihak yang berkepentingan. Tahap ini
merupakan bagian dari proses KDD yang disebut
interpretation. Tahap ini mencakup pemeriksaan apakah
pola atau informasi yang ditemukan bertentangan
dengan fakta atau hipotesis yang ada sebelumnya
(Fayyad, 1996).

II. PENGELOMPOKAN DATA MINING


Data mining dibagi menjadi
beberapa kelompok berdasarkan tugas yang dapat
dilakukan, yaitu (Larose, 2005):
• Deskripsi
Terkadang peneliti dan analis secara sederhana ingin
mencoba mencari cara untuk menggambarkan pola dan
kecendrungan yang terdapat dalam data. Sebagai contoh,
petugas pengumpul suara mungkin tidak menemukan
keterangan atau fakta bahwa siapa yang tidak cukup
Sistem Informasi Manajemen dan Data Mining
89

profesional akan sedikit didukung dalam pemilihan


presiden. Deskripsi dari pola dan kecendrungan sering
memberikan kemungkinan penjelasan untuk suatu pola
atau kecendrungan.
• Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel
target estimasi lebih ke arah numerik dari pada ke arah
kategori. Model dibangun dengan record lengkap
menyediakan nilai dari variabel target sebagai nilai
prediksi. Selanjutnya, pada peninjauan berikutnya
estimasi nilai dari variabel target dibuat berdasarkan nilai
variabel prediksi.
• Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi,
kecuali bahwa dalam prediksi nilai dari hasil akan ada di
masa mendatang. Beberapa metode dan teknik yang
digunakan dalam klasifikasi dan estimasi dapat pula
digunakan (untuk keadaan yang tepat) untuk prediksi.
• Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori.
Sebagai contoh, penggolongan pendapatan dapat
dipisahkan dalam tiga kategori, yaitu pendapatan tinggi,
pendapatan sedang, dan pendapatan rendah.
• Pengklusteran
Pengklusteran merupakan pengelompokan record,
pengamatan, atau memperhatikan dan membentuk kelas
objek-objek yang memiliki kemiripan. Kluster adalah
kumpulan record yang memiliki kemiripan satu dengan
90 Sistem Informasi Manajemen dan Data Mining

yang lainnya dan memiliki ketidakmiripan


dengan record-record dalam kluster lain.
Pengklusteran berbeda dengan klasifikasi yaitu tidak
adanya variabel target dalam pengklusteran.
Pengklusteran tidak mencoba untuk melakukan
klasifikasi, mengestimasi, atau memprediksi nilai dari
variabel target. Akan tetapi, algoritma pengklusteran
mencoba untuk melakukan pembagian terhadap
keseluruhan data menjadi kelompok-kelompok yang
memiliki kemiripan record dalam satu kelompok akan
bernilai maksimal, sedangkan kemiripan dengan record
dalam kelompok lain akan bernilai minimal.
• Asosiasi
Tugas asosiasi dalam data mining adalah menemukan
atribut yang muncul dalam satu waktu. Dalam dunia
bisnis lebih umum disebut analisis keranjang belanja
(market basket analysis) (Larose,2005).

III. ARSITEKTUR DARI SISTEM DATA MINING


Arsitektur utama dari sistem data mining , pada
umumnya terdiri dari beberapa komponen sebagai berikut:
• Basis data (Database), data warehouse , atau media
penyimpanan informasi, terdiri dari satu atau beberapa
database, data warehouse, atau data dalam bentuk lain.
Pembersihan data dan integrasi data dilakukan terhadap
data tersebut. Database, data warehose , bertanggung jawab
terhadap pencarian data yang relevan sesuai dengan
yang diinginkan pengguna atau user.
Sistem Informasi Manajemen dan Data Mining
91

• Basis pengetahuan (Knowledge Base), merupakan


basis pengetahuan yang digunakan sebagai panduan
dalam pencarian pola.
• Data mining engine, merupakan bagian penting
dari sistem dan idealnya terdiri dari kumpulan modul-
modul fungsi yang digunakan dalam proses karakteristik
(characterization), klasifikasi (clasiffication),
dan analisis kluster (cluster analysis). Dan merupakan
bagian dari software yang menjalankan program
berdasarkan algoritma yang ada.
• Evaluasi pola (pattern evaluation), komponen ini pada
umumnya berinteraksi dengan modul-modul data
mining . Dan bagian dari software yang berfungsi untuk
menemukan pattern atau pola-pola yang terdapat
dalam database yang diolah sehingga nantinya proses data
mining dapat menemukan knowledge yang sesuai.
• Antar muka (Graphical user interface), merupakan
modul komunikasi antara pengguna atau user
dengan sistem yang memungkinkan pengguna
berinteraksi dengan sistem untuk menentukan
proses data mining itu sendiri.
92 Sistem Informasi Manajemen dan Data Mining

Gambar 11.1 Arsitektur Data mining

IV. CRISP-DM
Cross-Industry Standart Process for Data mining (CRISP-
DM) yang di kembangkan tahun 1996 oleh analisis dari
beberapa industri seperti Daimler Chrysler, SPSS dan NCR.
CRISP-DM menyediakan standar proses data mining sebagai
strategi pemecahan masalah secara umum dari bisnis atau
unit penelitian.
Dalam CRISP-DM sebuah proyek data mining memiliki
siklus hidup yang terbagi dalam enam fase. Keseluruhan
fase berurutan yang ada tersebut bersifat adaptif. Fase
berikutnya dalam urutan bergantung kepada keluaran dari
fase sebelumnya. Hubungan penting antar fase digambarkan
dengan panah. Sebagai contoh, jika proses berada pada fase
modeling. Berdasar pada perilaku dan karakteristik model,
proses mungkin kembali kepada fase data preparation untuk
perbaikan lebih lanjut terhadap data atau berpindah maju
kepada fase evaluation.
Terdapat enam fase dalam CRISP-DM ini yakni
dijelaskan pada gambar berikut (Larose, 2005):
Sistem Informasi Manajemen dan Data Mining
93

Gambar 11.2 Fase CRISP-DM

• Fase Pemahaman Bisnis (Business Understanding


Phase)
Tahap ini berfokus pada pemahaman tujuan dan
kebutuhan dari perspektif bisnis, kemudian
mengkonversikan masalah dalam data mining, serta
membuat rencana awal yang dirancang untuk tujuan
bisnis.
• Fase Pemahaman Data (Data Understanding Phase)
Fase pemahaman data dimulai dengan mengumpulkan
data awal, mengalisis data untuk pengetahuan awal,
mengenali lebih lanjut masalah kualitas data, atau
mendeteksi subdata untuk membentuk hipotesis
mengenai informasi yang tersembunyi.
94 Sistem Informasi Manajemen dan Data Mining

• Fase Pengolahan Data (Data Understanding Phase)


Tahap persiapan data mencakup semua kegiatan yang
diperlukan untuk membangun data set akhir (data yang
akan dimasukkan ke dalam alat pemodelan) dari data
mentah awal baik seleksi atribut hingga pembersihan
data untuk alat pemodelan.
• Fase Permodelan (Modelling Phase)
Pada fase ini, berbagai teknik pemodelan dipilih dan
diterapkan. Paramater data dikalibrasikan untuk
menghasilkan nilai optimal. Dan apabila diperlukan,
dapat kembali ke tahap persiapan data.
• Fase Evaluasi (Evaluation Phase)
Pada tahap ini, model sudah dibangun dan kemudian
dianalisis model sudah sesuai dengan tujuan pada fase
awal. Selain itu, sebelum melanjutkan penyebaran akhir
dari model, diperlukan evaluasi dan peninjauan kembali
langkah-langkah.
• Fase Penyebaran (Depoyment Phase)
Penciptaan model umumnya bukan akhir dari proyek.
Bahkan jika tujuan dari model ini adalah untuk
meningkatkan pengetahuan dari data, pengetahuan
yang diperoleh akan perlu diorganisasikan dan disajikan
dengan cara yang pelanggan dapat menggunakannya.
Ini sering melibatkan menerapkan “hidup” model dalam
proses untuk pengambilan keputusan misalnya
organisasi, real-time personalisasi halaman Web atau
scoring berulang database marketing. Tergantung pada
kebutuhan, tahap penyebaran bisa sesederhana
menghasilkan laporan atau serumit melaksanakan
Sistem Informasi Manajemen dan Data Mining
95

proses data mining berulang di seluruh perusahaan.


Dalam banyak kasus, itu adalah pelanggan, bukan analis
data yang melakukan langkah-langkah penyebaran.
Namun, bahkan jika analis akan melakukan upaya
penyebaran.
96 Sistem Informasi Manajemen dan Data Mining
Sistem Informasi Manajemen dan Data Mining
97

BAB XII
ALGORITMA C.45

I. PENDAHULUAN
lgoritma data mining C4.5 merupakan salah satu
A algoritma yang digunakan untuk melakukan klasifikasi
atau segmentasi atau pengelompokan dan bersifat prediktif.
Klasifikasi merupakan salah satu proses pada data mining
yang bertujuan untuk menemukan pola yang berharga dari
data yang berukuran relatif besar hingga sangat besar.
Algortima C4.5 sendiri merupakan pengembangan
dari algortima ID3.

II. PERBEDAAN ID3 DENGAN C4.5


Algoritma C4.5 mempunyai prinsip dasar kerja yang
sama dengan algoritma ID3. Beberapa perbedaannya antara
lain:
a. Mampu Menangani Atribut dengan Tipe Diskrit atau
Kontinu
Pemilihan atribut pada algoritma induksi decision tree
menggunakan ukuran berdasarkan entropi yang dikenal
dengan information gain sebagai sebuah heuristic untuk
memilih atribut yang merupakan bagian terbaik dari
contoh ke dalam kelas. Semua atribut adalah bersifat
kategori yang bernilai diskrit. Atribut dengan
nilai continuous harus di diskritkan.
98 Sistem Informasi Manajemen dan Data Mining

Gambar 12. 1 Atribut Kontinu

Diskritisasi atribut bertujuan untuk mempermudah


pengelompokan nilai berdasarkan kriteria yang telah
ditetapkan. Hal ini juga bertujuan untuk menyederhanakan
permasalahan dan meningkatkan akurasi dalam proses
pembelajaran.
Terdapat beberapa teknik yang bisa dilakukan,
diantaranya ‘binning’, yang mendefinisikan kumpulan kelas
nominal untuk setiap atribut, kemudian menetapkan setiap
nilai atribut ke dalam salah satu kelas. Misalnya, jika domain
atribut numerik mempunyai nilai dari 0 sampai dengan 100,
domain tersebut dapat dibagi menjadi empat bin (0..24,
25..49, 50..74, 75..100). Setiap nilai atribut akan dikonversi
menjadi atribut nominal yang berkorespondensi dengan
salah satu bin. Oleh karena itu metode binning
disebut unsupervised discretization method.
Sistem Informasi Manajemen dan Data Mining
99

Teknik berikutnya dapat dilakukan dengan pengukuran


entropi, dengan mempertimbangkan semua kemungkinan
pembagian dan cari pemotongan terbaik.

Gambar 12.2 Split Kontinu

Langkah pertama adalah urutkan nilai atribut kontinu


beserta nilai kelas utama nya. Kemudian lakukan
pemotongan dengan pertimbangan pembagian jumlah kelas
utama 50:50 atau mendekati, untuk memperkirakan
mendapat nilai entropi tertinggi atau mendekati 1. Contoh:
temperature < 71.5: yes/4, no/2
temperature ≥ 71.5: yes/5, no/3
Info([4,2],[5,3]) = 6/14 info([4,2]) + 8/14 info([5,3]) = 0.939

Teknik lain, normalisasi, juga dapat dilakukan dengan


cara mencari nilai rata dan 99 standard deviasi pada rentang
atribut kontinu.

b. Mampu Menangani Atribut yang Kosong (Missing


Value)
Nilai kosong pada sebuah data set wajib kita isi terlebih
dahulu sebelum diproses untuk tahap machine
learning atau bentuk ke dalam sebuah model decision tree.
100 Sistem Informasi Manajemen dan Data Mining

Gambar 12. 3 Missing Value C4.5-1

Cara paling mudah dalam pengisian atribut kosong


adalah dengan memberikan nilai berdasar nilai yang paling
banyak atau dominan dalam atribut tersebut. Contoh, atribut
Shape baris ketiga dan keempat kita beri nilai 4 dikarenakan
pada kelompok class 1 mayoritas atribut Shape memiliki
angka 4. Sedangkan pada class 0, baris 7 kita berikan nilai 1.
Sistem Informasi Manajemen dan Data Mining
101

Gambar 12.4 Missing-Value-C4.5-2

c. Pemangkasan Pohon Keputusan


Pada saat pembangunan pohon keputusan, banyaknya
cabang mungkin mencerminkan adanya noise atau outlier
pada training data. Pemangkasan pohon dapat dilakukan
untuk mengenali dan menghapus cabang-cabang tersebut.
Pohon yang dipangkas akan menjadi lebih kecil dan lebih
mudah dipahami. Pohon semacam itu biasanya juga menjadi
lebih cepat dan lebih baik dalam melakukan klasifikasi.
102 Sistem Informasi Manajemen dan Data Mining

Gambar 12.5 Overfitting vs Underfitting

Jika suatu fungsi atau dataset memiliki terlalu banyak


atribut (fitur), model pelatihan yang terbentuk akan
menghasilkan akurasi yang baik, namun akan sangat
mungkin mengalami kegagalan untuk memprediksi data
masukan baru seperti pada contoh di atas.
Pemangkasan pohon juga dapat digunakan untuk
mengatasi overfitting. Overfitting terjadi karena ada noise data
training, yaitu data yang tidak relevan sehingga
mengakibatkan pohon memiliki subtree yang panjang dan
tidak seimbang. Misal internal node memiliki kelas YA = 5
dan TIDAK = 1. Data yang berada pada kelas TIDAK
merupakan noise, sehingga apabila data tersebut di olah akan
menghasilkan pohon dengan subtree yang panjang.
Overfitting juga dapat terjadi karena data training yang
sedikit.
Sistem Informasi Manajemen dan Data Mining
103

Gambar 12.6 Overfitting

Ada dua metode dalam melakukan pemangkasan dalam


pohon keputusan, yaitu:
1) Prepruning, yaitu menghentikan pembangunan suatu
subtree lebih awal, yaitu dengan memutuskan untuk
tidak lebih jauh mempartisi data training. Pada
pendekatan prepruning, sebuah pohon dipangkas dengan
cara menghentikan pembangunannya jika partisi yang
akan dibuat di anggap tidak signifikan. Untuk
mengetahui nilai parameter apakah akan dilakukan
expanding atau pruning dapat menggunakan metode chi-
squared.
2) Postpruning, yaitu menyederhanakan pohon dengan
cara membuang beberapa cabang subtree setelah pohon
selesai dibangun. Metode postpruning ini merupakan
metode standard untuk algoritma C4.5.
3) Reduced Error Pruning, merupakan salah satu algoritma
postpruning. Algoritma ini membagi data menjadi dua,
yaitu training data dan test data. Training data adalah
data yang digunakan untuk membentuk pohon
keputusan, sedangkan test data digunakan untuk
104 Sistem Informasi Manajemen dan Data Mining

menghitung nilai error rate pada pohon setelah


dipangkas.

Cara kerja REP adalah dengan memangkas internal node


yang dimulai dari internal node paling bawah ke atas.
Pemangkasan dilakukan dengan cara mengganti atribut
dengan leaf node yang memiliki kelas yang dominan muncul.
Setelah itu test data diproses menggunakan rule hasil
pemangkasan, kemudian dihitung nilai error ratenya. Test
data juga diproses dengan rule awal, yaitu rule yang
terbentuk sebelum pohon dipangkas, kemudian dihitung
nilai error ratenya. Apabila nilai error rate yang dihasilkan
dari pemangkasan pohon lebih kecil, maka pemangkasan
dilakukan, berikut adalah reduced error pruning:

Di mana:
r = nilai perbandingan error rate
n = total sample
z = Φ-1(c)

Gambar 12. 7 Post Pruning Tree


Sistem Informasi Manajemen dan Data Mining
105

Pada contoh tersebut dapat diketahui bahwa atribut


“Health Plan Contribution” banyak memiliki class Bad, maka
dari itu dipangkas menjadi leaf node Bad untuk keseluruhan
atribut tersebut, dan seterusnya.

d. Pemilihan Atribut yang Dilakukan Menggunakan


Gain Ratio
Quinlan memperkenalkan metode C4.5, di mana untuk
pemilihan split atribut menggunakan metode Gain Ratio
(GR) menggantikan Information Gain (IG).
Information gain pada ID3 lebih mengutamakan
pengujian yang menghasilkan banyak keluaran. Dengan
kata lain, atribut yang memiliki banyak nilailah yang
dipilih sebagai splitting atribut. Sebagai contoh,
pembagian terhadap atribut yang berfungsi sebagai
unique identifier, seperti product_ID¸ akan menghasilkan
keluaran dalam jumlah yang banyak, di mana setiap
keluaran hanya terdiri dari satu tuple.
106 Sistem Informasi Manajemen dan Data Mining

Partisi semacam ini tentu saja bersifat pure, sehingga


informasi yang dibutuhkan untuk mengklasifikasi D
berdasarkan partisi seperti ini adalah sebesar
Infoproduct_ID(D) = 0. Sebagai akibatnya, information gain
yang dimiliki atribut product_ID menjadi maksimal.
Padahal, jelas sekali terlihat bahwa partisi semacam ini
tidaklah berguna. Karena itu algoritma C4.5 yang
merupakan suksesor dari ID3 menggunakan gain ratio untuk
memperbaiki information gain, dengan rumus gain ratio
(Larose, 2009).
Sistem Informasi Manajemen dan Data Mining
107

Gambar 12. 8 Split-Id-Code info([0,1]) + info([0,1]) + info([0,1]) + …… +


info([0,1])

Nilai information gain akan mencapai maksimal untuk


atribute ID code.

III. ENTROPY, INFORMATION GAIN & GAIN RATIO


Pemilihan atribut yang baik adalah atribut yang
memungkinkan untuk mendapatkan decision tree yang paling
kecil ukurannya. Atau atribut yang bisa memisahkan obyek
menurut kelasnya. Secara heuristik atribut yang dipilih
adalah atribut yang menghasilkan simpul yang paling
”purest” (paling bersih). Ukuran purity di nyatakan dengan
tingkat impurity, dan untuk menghitungnya, dapat
dilakukan dengan menggunakan konsep Entropi, Entropi
menyatakan impurity suatu kumpulan objek.
Formula mencari entropi sebagai berikut:

Keterangan :
S adalah himpunan (dataset) kasus
108 Sistem Informasi Manajemen dan Data Mining

k adalah banyaknya partisi S


pj adalah probabilitas yang di dapat dari Sum(Ya) dibagi
Total Kasus.

Information gain adalah kriteria yang paling populer


untuk pemilihan atribut. Algoritma C4.5 adalah
pengembangan dari algoritma ID3. Oleh karena
pengembangan tersebut algoritma C4.5 mempunyai prinsip
dasar kerja yang sama dengan algoritma ID3. Hanya saja
dalam algoritma C4.5 pemilihan atribut dilakukan dengan
menggunakan Gain Ratio dengan rumus:

Di mana:
a = atribut.
gain(a) = information gain pada atribut a
Split(a) = split information pada atribut a

Atribut dengan nilai Gain Ratio tertinggi dipilih sebagai


atribut test untuk simpul. Dengan gain adalah information
gain. Pendekatan ini menerapkan normalisasi pada
information gain dengan menggunakan apa yang disebut
sebagai split information. SplitInfo menyatakan entropi atau
informasi potensial dengan rumus:

Di mana:
S = ruang (data) sample yang digunakan untuk training.
Sistem Informasi Manajemen dan Data Mining
109

A = atribut.
Si = jumlah sample untuk atribut i

di mana Xi menyatakan sub himpunan ke-i pada sampel X.

Di mana:
S = ruang (data) sample yang digunakan untuk
training.
A = atribut.
|Si| = jumlah sample untuk nilai V.
|S| = jumlah seluruh sample data.
Entropi(Si) = entropi untuk sample-sample yang memiliki
nilai i

Alasan penggunaan gain ratio(a) pada C4.5 (bukan


gain(a) sebagai kriteria pada pemilihan atribut adalah gain
ternyata bias terhadap atribut yang memiliki banyak nilai
unik.
110 Sistem Informasi Manajemen dan Data Mining

4. Latihan Soal

Berikut hasil perhitungan dengan menghitung gain ratio.

contoh perhitungan gain ratio


Sistem Informasi Manajemen dan Data Mining
111

BAB XIII
NAÏVE BAYES

I. DEFINISI NAÏVE BAYES


aive Bayes merupakan pengklasifikasian probabilistik
N sederhana yang menghitung sekumpulan probabilitas
dengan menjumlahkan frekuensi dan kombinasi nilai dari
dataset yang diberikan. Algoritma mengunakan teorema
Bayes dan mengasumsikan semua atribut independen atau
tidak saling ketergantungan yang diberikan oleh nilai pada
variabel kelas (Syarli & Muin, 2016).
Definisi lain mengatakan Naive Bayes merupakan
pengklasifikasian dengan metode probabilitas dan statistik
yang dikemukan oleh ilmuwan Inggris Thomas Bayes, yaitu
memprediksi peluang di masa depan berdasarkan
pengalaman di masa sebelumnya. Naive Bayes didasarkan
pada asumsi penyederhanaan bahwa nilai atribut secara
kondisional saling bebas jika diberikan nilai output. Dengan
kata lain, diberikan nilai output, probabilitas mengamati
secara bersama adalah produk dari probabilitas individu.
Keuntungan penggunaan Naive Bayes adalah bahwa
metode ini hanya membutuhkan jumlah data pelatihan
(Training Data) yang kecil untuk menentukan estimasi
paremeter yang diperlukan dalam proses pengklasifikasian.
Naive Bayes sering bekerja jauh lebih baik dalam
kebanyakan situasi dunia nyata yang kompleks dari pada
yang diharapkan.
112 Sistem Informasi Manajemen dan Data Mining

II. KEGUNAAN NAÏVE BAYES


• Mengklasifikasikan dokumen teks seperti teks berita
ataupun teks akademis.
• Sebagai metode machine learning yang menggunakan
probabilitas.
• Untuk membuat diagnosis medis secara otomatis.
• Mendeteksi atau menyaring spam.

III. KELEBIHAN NAÏVE BAYES


• Bisa dipakai untuk data kuantitatif maupun kualitatif.
• Tidak memerlukan jumlah data yang banyak.
• Tidak perlu melakukan data training yang banyak.
• Jika ada nilai yang hilang, maka bisa diabaikan dalam
perhitungan.
• Perhitungannya cepat dan efisien.
• Mudah dipahami.
• Mudah dibuat.
• Pengklasifikasian dokumen bisa dipersonalisasi,
disesuaikan dengan kebutuhan setiap orang.
• Jika digunakan dalam bahasa pemrograman, code-nya
sederhana.
• Bisa digunakan untuk klasifikasi masalah biner
ataupun multiclass.

IV. PERSAMAAN METODE NAIVE BAYES


Persamaan dari teorema Bayes adalah:

𝑃 (𝑋|𝐻) . 𝑃(𝐻)
𝑃 (𝐻|𝑋) =
𝑃(𝑋)
Sistem Informasi Manajemen dan Data Mining
113

Di mana:
X : Data dengan class yang belum diketahui
H : Hipotesis data merupakan suatu class spesifik
P(H|X) : Probabilitas hipotesis H berdasar kondisi X
(posteriori probabilitas)
P(H) : Probabilitas hipotesis H (prior probabilitas)
P(X|H) : Probabilitas X berdasarkan kondisi pada
hipotesis H
P(X) : Probabilitas X

Untuk menjelaskan metode Naive Bayes, perlu


diketahui bahwa proses klasifikasi memerlukan sejumlah
petunjuk untuk menentukan kelas apa yang cocok bagi
sampel yang di analisis tersebut. Karena itu, metode Naive
Bayes di atas disesuaikan sebagai berikut:

𝑃(𝐶)𝑃(𝐹1 … . 𝐹𝑛|𝐶)
(𝐶|𝐹1. . 𝐹𝑛)
𝑃(𝐹1 … 𝐹𝑛)

Di mana Variabel C merepresentasikan kelas, sementara


variabel F1 ... Fn merepresentasikan karakteristik petunjuk
yang dibutuhkan untuk melakukan klasifikasi. Maka rumus
tersebut menjelaskan bahwa peluang masuknya sampel
karakteristik tertentu dalam kelas C (Posterior) adalah
peluang munculnya kelas C (sebelum masuknya sampel
tersebut, seringkali disebut prior), dikali dengan peluang
kemunculan karakteristik-karakteristik sampel pada kelas C
(disebut juga likelihood), dibagi dengan peluang kemunculan
karakteristik-karakteristik sampel secara global (disebut
114 Sistem Informasi Manajemen dan Data Mining

juga evidence). Karena itu, rumus di atas dapat pula ditulis


secara sederhana sebagai berikut:

𝑝𝑟𝑖𝑜𝑟 𝑥 𝑙𝑖𝑘𝑒ℎ𝑜𝑜𝑑
𝑃𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 =
𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑒

Nilai Evidence selalu tetap untuk setiap kelas pada satu


sampel. Nilai dari posterior tersebut nantinya akan
dibandingkan dengan nilai-nilai posterior kelas lainnya
untuk menentukan ke kelas apa suatu sampel akan
diklasifikasikan. Penjabaran lebih lanjut rumus Bayes
tersebut dilakukan dengan menjabarkan ( | 1, … , )
menggunakan aturan perkalian sebagai berikut:
(𝐶|𝐹1, . . , = 𝑃(𝐶)𝑃(𝐹|, . . , 𝐹𝑛|𝐶)
= (𝐶)𝑃(𝐹1|𝐶)𝑃(𝐹2, . . , 𝐹𝑛|𝐶, 𝐹1)
= 𝑃(𝐶)𝑃(𝐹1|𝐶)𝑃(𝐹2|𝐶, 𝐹1)𝑃(𝐹3, . . , 𝐹𝑛|𝐶, 𝐹1, 𝐹2)
= (𝐶)𝑃(𝐹1|𝐶)𝑃(𝐹2|𝐶, 𝐹1)𝑃(𝐹3|𝐶, 𝐹1, 𝐹2)𝑃(𝐹4, . . , 𝐹𝑛|𝐶, 𝐹1, 𝐹2, 𝐹3)
= ( ) ( 1| ) ( 2| , 1) ( 3| , 1, 2) … ( | , 1, 2, 3, … ,
− 1)

Dapat dilihat bahwa hasil penjabaran tersebut


menyebabkan semakin banyak dan semakin kompleksnya
faktor - faktor syarat yang mempengaruhi nilai probabilitas,
yang hampir mustahil untuk di analisa satu persatu.
Akibatnya, perhitungan tersebut menjadi sulit untuk
dilakukan. Di sinilah digunakan asumsi independensi yang
sangat tinggi (naif), bahwa masing-masing petunjuk
(F1,F2...Fn) saling bebas (independen) satu sama lain.
Dengan asumsi tersebut, maka berlaku suatu kesamaan
sebagai berikut:
Sistem Informasi Manajemen dan Data Mining
115

Untuk i≠j, sehingga:

(𝐹𝑖|𝐶, 𝐹𝑗) = (𝐹𝑖|𝐶)

Persamaan di atas merupakan model dari teorema Naive


Bayes yang selanjutnya akan digunakan dalam proses
klasifikasi.

V. CONTOH NAIVE BAYES PREDIKSI SERANGAN


HAMA PENGGEREK BATANG PADI
Data yang digunakan adalah data klimatologi berupa
curah hujan, kelembaban, dan suhu udara; dan data
serangan hama dari empat kecamatan yang ada di sebuah
kabupaten selama kurun waktu 2015-2018. Data yang
diperoleh adalah sebagai berikut:
116 Sistem Informasi Manajemen dan Data Mining

Tabel 3.1 Data Serangan Hama

Pada tahap ini, dilakukan proses seleksi data dan


transformasi data. Data yang sudah digunakan akan diolah
di fase pengolahan data. Proses penyeleksian data dilakukan
karena tidak semua data akan digunakan, sehingga
dibutuhkannya seleksi data. Data yang di ambil adalah data
yang sesuai dengan analisis yang digunakan. Peneliti hanya
menggunakan beberapa data, yaitu sebagai berikut:
Sistem Informasi Manajemen dan Data Mining
117

Tabel 13.2 Data Seleksi

Data yang telah di seleksi selanjutnya akan di proses lagi


pada tahap pengubahan data. Tahap pengubahan data
merupakan penggabungan data dengan melakukan
pengklasifikasian menjadi beberapa kategori. Berikut tabel
pengklasifikasian data:

a. Suhu
Variabel ini berisi range nilai yang telah diklasifikasikan
menjadi 3 kategori yaitu Rendah, Sedang, Tinggi.
Berikut adalah suhu yang telah diklasifikasikan:
118 Sistem Informasi Manajemen dan Data Mining

Tabel 13.3 Klasifikasi Suhu


Suhu ( C)o Kategori
< 24 Rendah
24 – 32 Sedang
> 33 Tinggi

b. Kelembaban Udara
Variabel ini berisi range nilai yang telah diklasifikasikan
menjadi 3 kategori yaitu Rendah, Sedang, Tinggi.
Berikut adalah kelembaban udara yang telah
diklasifikasikan:

Tabel 13.4 Klasifikasi Kelembaban Udara


Kelembaban Udara (%) Kategori
< 70 Rendah
71 – 90 Sedang
> 91 Tinggi

c. Curah Hujan
Variabel ini berisi range nilai yang telah diklasifikasikan
menjadi 4 kategori yaitu Rendah, Menengah, Tinggi, dan
Sangat Tinggi. Berikut adalah curah hujan yang telah
diklasifikasikan:

Tabel 13.5 Klasifikasi Curah Hujan


Kelembaban Udara (mm) Kategori
0 – 100 Rendah
100 – 300 Sedang
300 – 400 Tinggi
> 400 Sangat Tinggi
Sistem Informasi Manajemen dan Data Mining
119

d. Prediksi Serangan
Variabel prediksi serangan merupakan class atau data
yang berfungsi untuk menentukan hasil dari adanya
serangan hama. Dalam pengelompokan data sudah
ditentukan secara tetap agar tidak terjadi kesalahan
dalam proses perhitungan program. Data keputusan
prediksi serangan memiliki dua nilai yaitu “ADA” dan
“TIDAK ADA”.
Data kategori di atas kemudian diklasifikasikan. Di
bawah ini merupakan data yang telah diklasifikasikan
tersebut.

Tabel 13.6 Data Transformasi


120 Sistem Informasi Manajemen dan Data Mining

Gambar 13.1 Algoritma Naive Bayes

Dari proses di atas, dilakukan perhitungan Algoritma


Naïve Bayes menggunakan data training dan data testing
sebagai data uji. Berikut perhitunan menggunakan
Algoritma Naïve Bayes:
Sistem Informasi Manajemen dan Data Mining
121

a. Baca Data Training


Di bawah ini merupakan data training yang digunakan
dalam melakukan proses perhitungan Naïve Bayes.

Tabel 13.7 Data Training

Setelah mengetahui data training, selanjutnya data tersebut


akan diuji menggunakan data testing sebagai berikut,

Tabel 13.8 Data Testing


Curah Serangan
Kecamatan Waktu Suhu Kelembaban
Hujan Hama
Januari,
Amali 28,1 88 200 ?
2019
122 Sistem Informasi Manajemen dan Data Mining

Data testing di atas kemudian diklasifikasikan


berdasarkan data preparation (data transformation).

Tabel Data 13.9 Testing Transformation


Curah Serangan
Kecamatan Waktu Suhu Kelembaban
Hujan Hama
Januari,
Amali Sedang Sedang Menengah ?
2019

b. Hitung P(C1) pada setiap Class


Untuk menghitung Probabilitas class, yaitu:
𝐶𝑙𝑎𝑠𝑠 𝑠𝑒𝑟𝑎𝑛𝑔𝑎𝑛 ℎ𝑎𝑚𝑎 = "ADA"
𝑃(𝐶1) =
Jumlah data uji
𝐶𝑙𝑎𝑠𝑠 serangan hama = "TIDAK ADA"
P(C2) =
Jumlah data uji
57
1. P(ADA) = = 0.41304347826087
138
81
2. P(TIDAK ADA) = = 0.58695652173913
138

c. Hitung probabilitas pada setiap kriteria


P(X|H). P(H)
P (H|X) =
P(X)
1. Suhu = Sedang
57
P(Suhu = Sedang | Serangan Hama = ADA) = =1
57
P(Suhu = Sedang | Serangan Hama = TIDAK ADA) =
81
=1
81

2. Kelembaban = Sedang
P(Kelembaban = Sedang| Serangan Hama = ADA) =
57
=1
57
Sistem Informasi Manajemen dan Data Mining
123

P(Kelembaban = Sedang| Serangan Hama = TIDAK


19
ADA) = 81 = 0.23456790123457

3. Curah Hujan = Menengah


P(Curah Hujan=Menengah| Serangan Hama = ADA) =
56
= 0.98245614035088
57
P(Curah Hujan=Menengah| Serangan Hama = TIDAK
8
ADA) = 81 = 0,098765432098765

d. Perkalian nilai probabilitas pada setiap class


1. Probabilitas ADA
57 57 57 56
= 138 ∗ ∗ 57 ∗
57 57
= 0.41304347826087 ∗ 1 ∗ 1 ∗ 0.98245614035088
= 0.40579710144928

2. Proabilitas TIDAK ADA


81 81 19 8
= 138 ∗ ∗ ∗ 81
81 81
= 0.58695652173913 ∗ 1 ∗ 0.23456790123457 ∗
0.098765432098765
= 0.013598139202004

e. Hitung Persentase Keakurasian Kelulusan


1. Akurasi Persentase ADA = (nTIDAKnADA
ADA+nADA
) ∗ 100%
0.40579710144928
= ( 0.013598139202004 + ) ∗ 100%
0.40579710144928
= 96.76%

2. Akurasi Persentase
nTIDAK ADA
TIDAK ADA =(
nADA+nTIDAK ADA
) ∗ 100%
0.013598139202004
=( ) ∗ 100%
0.40579710144928 + 0.013598139202004
= 3.24%
124 Sistem Informasi Manajemen dan Data Mining

f. Membandingkan Nilai Akurasi


Dari hasil tersebut menyatakan P(X|C1) > P(X|C2) atau
P(X|C2) < P(X|C1)

g. Hasil
Berdasarkan data training yang berhasil diklasifikasikan
138 data training yang di uji pada data serangan hama.
Metode Naive Bayes berhasil memprediksi adanya
serangan hama dengan persentase keakuratan sebesar
96.76%.
Sistem Informasi Manajemen dan Data Mining
125

DAFTAR PUSTAKA

1. Drs, Moekijat, Pengantar Sistem Informasi Manajemen.


Penerbit PT. Remaja Karya CV.
2. Edhy Sutanta, Sistem Informasi Manajemen, Penerbit Graha
Ilmu.
3. Fayyad, Usama. 1996. Advances in Knowledge Discovery and
Data Mining. MIT Press.
4. Informatika. 2017. Algoritma C4.5.
https://informatikalogi.com/algoritma-c4-5/#1 Update 15
Juli 2017.
5. Joko Suntoro 2019. Data Mining: Algoritma dan
Implementasi dengan pemrograman PHP. Elexmedia
Komputindo Jakarta.
6. Kusrini dan Emha Taufiq L. 2009. Algoritma Data Mining,
Penerbit ANDI.
7. Larose, Daniel T. 2005. Discovering Knowledge in Data: An
Introduction to Data Mining. John Willey & Sons, Inc.
8. Retno Tri V. 2017. Data Mining: Teori dan Aplikasi
Rapidminer. Penerbit Gava Media Yogyakarta.
9. Robert G. Murdick/ Joel E. Ross, Sistem Informasi untuk
Manajemen Modern. Penerbit PT. Erlangga.
10. Syarli, & Muin, A. A. (2016). Metode Naive Bayes untuk
Prediksi Kelulusan (Studi Kasus : Data Mahasiswa Baru
Perguruan Tinggi). Jurnal Ilmiah Ilmu Komputer, 2(1), 1–5.
11. Suyanto. 2018. Data Mining untuk Klasifikasi dan
Klasterisasi Data. Informatika Bandung.
126 Sistem Informasi Manajemen dan Data Mining

12. Tan, O. 2004. Cognition, Metacognition, and Problem Based


Learning. Dalam Enhancing Thinking Through Problem Base-
Learning Approaches. Austalia: Thomson.
13. Turban, E., dkk. 2005. Decision Support System and
Intelligent System. Andi Offset Yogyakarta.
Sistem Informasi Manajemen dan Data Mining
127

Anda mungkin juga menyukai