Anda di halaman 1dari 47

PENAMBANGAN DATA DAN

KECERDASAN BISNIS
(DATA MINING AND BUSINESS
INTELLIGENCE)

Agus Sulistyanto S.Kom, MM


DAFTAR PUSTAKA
• Efraim Turban, Ramesh Ardha, Dursun Dellen. Decision Support and
Business Intelligence Systems, Pearson, 2011.
• Introduction to Data Mining, Pang-Ning Tan, Michael Steinbach, Vipin
Kumar, University of Minnesota, 2006
• Articles and White Papers, HBR and Gartner Researches 2013
• https://romisatriawahono.net/
• https://www.jagoanhosting.com/blog/apa-itu-data-mining/
• https://flinsetyadi.com/category/teknologi-dan-informatika/data-mini
ng
/
EVOLUTION OF SCIENCES
• Sebelum 1600: Empirical science
• Disebut sains kalau bentuknya kasat mata

• 1600-1950: Theoretical science


• Disebut sains kalau bisa dibuktikan secara matematis atau eksperimen
• 1950s-1990: Computational science
• Seluruh disiplin ilmu bergerak ke komputasi
• Lahirnya banyak model komputasi
• 1990-sekarang: Data science
• Kultur manusia menghasilkan data besar
• Kemampuan komputer untuk mengolah data besar
• Datangnya data mining sebagai arus utama sains

(Jim Gray and Alex Szalay, The World Wide Telescope: An Archetype for Online Science, Communication of ACM, 45(11): 50-54, Nov. 2002)

3
PERKEMBANGAN KOMPUTER
• 1950 – 1980 : Mainframe (Central Processing)
• 1980 – 2000 : Desktop PC (Distributing Processing)
• 2000 – 2020 : Notebook PC & Mobile (Cloud Computing)
• 2020 – 2030 : Robotic (Drone & Autonomous Car)
• 2030 – … : Space
Revolusi Industri 4.0

urah !
M ak in M
Biaya
at da n
C e p
N S I: Makin
EFIS IE

5
CHANGE OR DIE….
• Nokia dulu menyebut Android.  sebagai semut kecil merah yg mudah
digencet dan mati.
• Kodak menyebut kamera digital hanyalah tren sesaat, dan kamera
produksi mrk akan terus bertahan.
• Intel dan Micorosoft ( Dominasi yg dulu dikenal dgn duo Wintel )
mendominasi PC dan Laptop.
• RIM mendominasi dgn Blackberry dan BBM
From Stupid Apps to Smart Apps
Stupid Smart
Applications Applications
• Sistem Informasi • Sistem Prediksi Kelulusan
Akademik Mahasiswa
• Sistem Pencatatan Pemilu • Sistem Prediksi Hasil
• Sistem Laporan Kekayaan Pemilu
Pejabat • Sistem Prediksi Koruptor
• Sistem Pencatatan Kredit • Sistem Penentu Kelayakan
Kredit

7
PERUSAHAAN PENGOLAH PENGETAHUAN
• Uber - the world’s largest taxi company, owns no vehicles
• Google - world’s largest media/advertising company, creates no
content
• Alibaba - the most valuable retailer, has no inventory
• Airbnb - the world’s largest accommodation provider, owns no real
estate
• Gojek - perusahaan angkutan umum, tanpa memiliki kendaraan

8
Data
Data adalah fakta-fakta mentah atau deskripsi-deskripsi dasar dari hal,
event, aktivitas, dan transaksi yang ditangkap, direkam, disimpan,
diklasifikasikan, tetapi tidak diorganisasikan untuk tujuan spesifik
tertentu.
Contoh : umur, nilai test, kode mata kuliah, nama orang tua, jumlah
pasien, warna mobil, luas tanah, ukuran sepatu, jenis rambut, harga
motor.
Informasi
Informasi adalah sekumpulan fakta (data) yang diorganisir dengan cara
tertentu sehingga mereka mempunyai arti bagi si penerima.
Contoh: lulusan paling muda periode wisuda April, rata-rata IPK lulusan
periode wisuda Oktober, jadwal kuliah semester genap, Peringkat mobil
terlaris th 2008, Profil kredit motor 5 tahun, KRS, Slip ATM.
Pengetahuan
Pengetahuan terdiri dari informasi yang sudah diorganisasikan dan
diproses untuk memperoleh pemahaman, pengalaman, pembelajaran
yang terakumulasi, sehingga dapat diaplikasikan dalam masalah atau
proses bisnis tertentu.
Pengetahuan dapat juga diartikan sebagai informasi yang diproses
untuk mengekstrak implikasi kritis dan merefleksikan pengalaman masa
lampau menyediakan penerima dengan pengetahuan yang
terorganisasi dengan nilai yang tinggi.
Hubungan Data, Informasi, dan Pengetahuan
• Data : Suhu udara di ruang kelas saat ini 20 °C
• Informasi : Ruang kelas dingin
• Pengetahuan :
• Mahasiswa yang sedang flu sebaiknya memakai jaket
• Mahasiswa yang kedinginan memakai jaket
• Mahasiswa membawa jaket ke kelas
Hubungan Data, Informasi, dan Pengetahuan
• Data : Nilai mata kuliah PTI = E
• Informasi : Tidak Lulus PTI
• Pengetahuan : Hanya bisa mengulang tahun depan, semester depan
mengambil matakuliah lain
Hubungan Data, Informasi, dan Pengetahuan
• Data : Lampu kuning menyala.
• Informasi : Tanda harus mulai mengerem mobil.
• Pengetahuan : Saya harus mulai menginjak rem, jika tidak saya bisa
ditilang. Tapi banyak orang di Jakarta justru mempercepat mobilnya
sebelum lampu merah menyala, jika saya tidak mempercepat mobil,
saya bisa ditabrak dari belakang
Hubungan Data, Informasi, dan Pengetahuan
Hubungan Data, Informasi, dan Pengetahuan
• Data harus kita olah menjadi pengetahuan supaya bisa bermanfaat
bagi manusia
• Dengan pengetahuan tersebut, manusia dapat:
• Melakukan estimasi dan prediksi apa yang terjadi di depan
• Melakukan analisis tentang asosiasi, korelasi dan pengelompokan antar data
dan atribut
• Membantu pengambilan keputusan dan pembuatan kebijakan
Hubungan Data, Informasi, Pengetahuan dan Kebijakan

FUTURE

PAST
Informasi
SIM BI - DM

Data Pengetahuan

DSS

Aksi SOP Kebijakan

18

Siklus Data, Informasi, Pengetahuan dan Kebijakan


Perkembangan RAM
• Apollo 11 dulu memiliki satu komputer yang disebut Apollo Guidance
Computer (AGC). Komputer itu memiliki memori 2048 kata yang
dapat digunakan untuk menyimpan “hasil sementara”–data yang akan
hilang ketika tidak ada daya. Jenis memori ini disebut sebagai RAM
(Random Access Memory). Setiap kata terdiri dari 16 digit biner (bit),
dengan bit merupakan bilangan nol atau satu. Ini berarti bahwa
komputer Apollo memiliki 32.768 bit memori RAM.
• Ponsel terbaru biasanya memiliki 4 GB RAM. Itu adalah
34.359.738.368 bit. Ini berarti kapasitas memori ponsel satu juta kali
lebih banyak (tepatnya 1.048.576) daripada yang dimiliki komputer
Apollo dalam RAM
Perkembangan Data
Ukuran Data
Apa itu Big Data?

Big Data: istilah untuk data sangat besar dan kompleks yang tidak dapat
dikelola (capture, store, manage, analyze) dengan software dan tool
pemrograman database biasa/konvensional.

Tidak cukup dengan SQL biasa saja (Relational Database Management
System), sehingga butuh teknologi baru/tambahan NoSQL (Not only
SQL).

Tidak hanya berisi data berstruktur/relational tapi juga (mayoritas)
tidak berstruktur (unstructured).

22
Apa yang besar?

23

Sumber: http://vijjam.blogspot.com
3V – 4V – 5V

Volume: Ukuran data sangat besar dari sisi jumlah yang mencapai Milyaran
Terra Byte = trilyunan GB.

Velocity: Kecepatan data sangat besar dari sisi kemunculan dan perubahan.

Variety: Variasi jenis/tipe data sangat banyak, unstructured dan multi-
structured.

Value: Nilai yang dihasilkan juga sangat besar, dari sisi manfaat dalam
bentuk uang maupun non uang.

Veracity: Kebenaran dan keakuratan informasi yang tidak mudah
dipastikan, misal salah ketik di Twitter. 24
Data Mining (DM)
• Disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau
menemukan pola dari suatu data yang besar
• Ekstraksi dari data ke pengetahuan:
1. Data: fakta yang terekam dan tidak membawa arti
2. Pengetahuan: pola, rumus, aturan atau model yang muncul dari data
• Nama lain data mining:
• Knowledge Discovery in Database (KDD)
• Knowledge extraction
• Pattern analysis
• Information harvesting
• Business intelligence

25
Business Intelligence (BI)
• Business Intelligence (BI) mengacu pada teknologi, aplikasi, dan
praktik untuk pengumpulan, integrasi, analisis, dan penyajian
informasi bisnis.
• Tujuan Business Intelligence adalah untuk mendukung pengambilan
keputusan bisnis yang lebih baik dan cepat
• Pada dasarnya, sistem Business Intelligence adalah Sistem Pendukung
Keputusan berbasis data (DSS).
Data Warehouse (DW)
Data warehouse merupakan metode dalam perancangan database,
yang menunjang DSS (Decission Support System) dan EIS (Executive
Information System). Secara fisik data warehouse adalah database, tapi
perancangan data warehouse dan database sangat berbeda. Dalam
perancangan database tradisional menggunakan normalisasi,
sedangkan pada data warehouse normalisasi bukanlah cara yang
terbaik.
BI & DW & DM
• Business Intelligence dan data warehouse adalah dua hal yang
berbeda namun hampir tidak bisa dipisahkan.
• Data warehouse lebih mengenai bagaimana data- data yang besar dan
beragam disimpan dalam satu repository (gudang data) dan disusun
secara terstruktur sehingga memudahkan pencarian.
• sedangkan Business Intelligence adalah salah satu teknologi yang
digunakan untuk menyajikan data- data tersebut sehingga
memudahkan analisa dan pengambilan keputusan berdasarkan
informasi yang akurat dari sumber data.
• Suatu solusi Business Intelligence yang baik memerlukan sumber data
yaitu data warehouse.
BI & DW & DM
• Untuk mengumpulkan informasi tersebut, maka diperlukannya Data
Mining.
• Data Mining bekerja dalam proses penggalian data dari data warehouse
yang disimpan dalam basis data atau media penyimpanan lain sehingga
diharapkan setelah melakukan mining terhadap data akan didapatkan
suatu data baru yang kemudian disimpan menjadi informasi yang baru
juga.
• Jadi hubungan antara data mining dan business intellegence berada pada
data yang akan diproses.
• Awalnya dari data warehouse yang kemudian di proses data mining baru
kemudian disajikan pada business intellegence sehingga mendapat
informasi yang lebih akurat.
PROSES PENGAMBILAN DATA
Contoh Penerapan Data Mining
• Penentuan kelayakan kredit pemilihan rumah di bank
• Penentuan pasokan listrik PLN untuk wilayah Jakarta
• Prediksi profile tersangka koruptor dari data pengadilan
• Perkiraan harga saham dan tingkat inflasi
• Analisis pola belanja pelanggan
• Memisahkan minyak mentah dan gas alam
• Penentuan pola pelanggan yang loyal pada perusahaan operator telepon
• Deteksi pencucian uang dari transaksi perbankan
• Deteksi serangan (intrusion) pada suatu jaringan

31
Data Scientist
• Adalah sebuah profesi yang mengolah data dengan metode ilmiah
untuk menghasilkan informasi yang akurat dan bernilai tinggi
sehingga dapat membantu pengambilan keputusan.
• Data scientist harus menguasai ilmu multi disiplin, yaitu matematika
statistik, ilmu komputer, dan pengetahuan terhadap salah satu
domain tertentu. Dalam era Transformasi Digital saat ini, ilmu data
science sangat dibutuhkan, diantaranya adalah dalam bisnis ritel,
bisnis distribusi, kedokteran dan masih banyak lini bisnis lainnya.
Data Scientist
• Perkembangan revolusi industri 4.0. tentunya memiliki dampak positif
dan juga negatif. Dengan berkembangnya era digital dan juga artificial
intelligence, beberapa profesi harus rela digantikan pekerjaannya oleh
robot. Namun, beberapa profesi baru juga banyak yang lahir di era ini.
Apalagi ketika berbagai industri mulai membuka diri terhadap dunia
digital. Misalkan semua pertanyaan customer yang dulunya harus
dijawab oleh Customer Service, sekarang bisa digantikan tugasnya
oleh chatbot.
Data Scientist Dapat Mempengaruhi Keputusan Bisnis
• Menjadi seorang Data Scientist tentunya harus siap mengemban
banyak tugas-tugas berat yang berkaitan langsung dengan kemajuan
perusahaan tempat ia bekerja. Seorang Data Scientist menjadi
sesuatu yang sangat berharga bagi perusahaan karena hasil analisa
yang dihasilkan sangat mempengaruhi keputusan bisnis yang akan
diambil oleh pemegang kekuasaan
Data Scientist Dapat Mempengaruhi Keputusan Bisnis
• Data Scientist merupakan seseorang yang bertugas untuk mengolah
data dalam jumlah besar atau yang dikenal dengan big data, sehingga
akan menghasilkan informasi yang berguna. Tentunya dalam proses
pengolahan ini membutuhkan berbagai macam algoritma, tools, serta
pemahaman akan proses kerja dari mesin.
• Untuk membuat skill seorang Data Scientist semakin tajam, seorang
Data Scientist juga dapat menerapkan konsep akan ilmu data dalam
kehidupan sehari-hari. Salah satunya adalah dengan mengontrol
keuangan, kemudian melihat tren dan gaya hidup serta kebiasaan
seseorang yang akan menghasilkan keputusan yang terarah.
Kebutuhan yang Tidak Seimbang dengan Ketersediaan
• Dalam sebuah artikel Harvard Business Review disebutkan bahwa
meskipun profesi Data Scientist menjadi profesi paling hot dalam 10
tahun terakhir, namun ironis nya jumlah kebutuhan akan Data
Scientist masih belum bisa tercukupi karena jumlah ketersediaan
talent yang sangat terbatas. Meskipun sebuah perusahaan memiliki
infrastruktur penyediaan data yang sangat hebat, namun jika tidak
ada ahlinya (dalam hal ini Data Scientist) maka justru akan melahirkan
ketimpangan dan tidak mampu menghasilkan hasil yang maksimal.
Kebutuhan yang Tidak Seimbang dengan Ketersediaan
• Untuk menyeimbangkan antara infrastruktur dan skill dalam
pengolahan data, tidak jarang perusahaan yang akan menjemput
bola. Sehingga tidak mengherankan ketika seorang Data Scientist yang
sangat ahli di bidang ini malah tidak pernah merasakan bagaimana
rasanya mencari pekerjaan. Hal ini karena mereka justru ditawari oleh
banyak perusahaan untuk bergabung di perusahaan tersebut.
Siapa Pun Bisa Menjadi Data Scientist
• Untuk menjadi seorang Data Scientist tidak hanya terpaku di
beberapa background pendidikan saja. Meskipun yang paling umum
berasal dari Statistika, Matematika, Ilmu Komputer dan juga Teknik.
Namun semua background pendidikan memiliki kesempatan yang
sama untuk menjadi Data Scientist. Hal ini karena ilmu statistika yang
digunakan oleh Data Scientist bukan merupakan ilmu statistika murni
melainkan ilmu statistika terapan.
Siapa Pun Bisa Menjadi Data Scientist
• Selain ilmu Statistika, pemahaman akan coding juga menjadi suatu
kewajiban bagi seorang Data Scientist. Namun tenang saja, kebutuhan
Data Scientist yang begitu banyak ternyata juga berbanding lurus
dengan banyak nya kursus online yang dapat diambil untuk belajar
skill yang dibutuhkan oleh Data Scientist. Membangun portofolio juga
tidak kalah pentingnya. Mengingat bagaimana pentingnya posisi ini,
tentunya setiap perusahaan tidak ingin salah pilih orang. Sehingga
portofolio dapat membutikan bahwa orang tersebut benar memiliki
pemahaman akan Data Scientist serta dapat meningkatkan “nilai jual”
untuk dilirik oleh perusahaan.
METODE PENGAMBILAN
KEPUTUSAN/KEBIJAKAN
LATAR BELAKANG
• Setiap manusia pasti akan membuat keputusan dalam hidup.
• Keputusan yang diharapkan adalah keputusan yang benar utk itu
diperlukan pengujian.
• Kebenaran versi manusia adalah relatif.
• Perbedaan pendapat adalah sesuatu yang pasti
• Proses/metode lebih utama dibandingkan dgn hasil.
KENAPA MANUSIA BERBEDA PENDAPAT
• Manusia mempunyai keterbatasan
• Perbedaan disebabkan perbedaan sudut pandang dan waktu
• Manusia yang tinggal diatas gunung akan berpendapat gunung itu rendah
sedangkan manusia yang tinggal di kaki gunung akan berpendapat gunung itu
tinggi
• Jalan Sudirman adalah jalan yang macet jika dilihat pada saat jam plng kerja.
Jalan Sudirman adalah jalan yang lancar jika dilihat pada saat jam 2 pagi

SAMAKAN SUDUT PANDANG DAN WAKTU


PROBILITAS KEBENARAN
1. Jika keputusan diambil tanpa ada pengujian kebenaran maka
probabilitas kebenarannya adalah 50%  100%/2
2. Jika keputusan diambil berdasarkan keputusan pada point 1, maka
probabilitas kebenarannya adalah 25%  50%/2
3. Jika keputusan diambil berdasarkan keputusan pada point 2, maka
probabilitas kebenarannya adalah 12,5%  25%/2
4. Jika keputusan diambil berdasarkan keputusan pada point 3, maka
probabilitas kebenarannya adalah 6,25%  12,5%/2

Contoh : Permainan Pesan Berbisik


METODE PENGAMBILAN KEPUTUSAN
• Keputusan diambil berdasarkan perasaan
• Keputusan diambil berdasarkan logika
• Keputusan diambil berdasarkan informasi
• Keputusan diambil berdasarkan pengetahuan
• Keputusan diambil berdasarkan ilmu pengetahuan (sains)
PIRAMIDA PENGETAHUAN

Wis
do
m
Knowledge

Information

Data
METODE PENGUJIAN
• Dalam pengujian perlu digunakan alat uji yang sdh disepakati
• Cara pengujian :
• Langsung
• Tidak Langsung
• Jika tidak bisa dilakukan pengujian oleh diri sendiri
• Mengikuti pendapat orang yang bisa melakukan pengujian
• Mengikuti teori orang lain :
• Teori orang ahli lebih baik dari teori orang awam
• Teori beberapa orang ahli lebih baik dari seorang ahli
KESIMPULAN
• Metode pengambilan keputusan berdasarkan ilmu pengetahuan
adalah metode terbaik saat ini karena :
• Ilmu Pengetahuan adalah kumpulan dari pengetahuan-pengetahuan yang
telah diuji kebenarannya
• Ilmu Pengetahuan selalu diperbaharui berdasarkan temuan-temuan terbaru
• Metode ini sdh berkembang berabad yang lalu
• Ilmu pengetahuan merupakan kumpulan pengetahuan.
• Informasi merupakan bagian penting dalam proses pengetahuan.
• Informasi yang benar didapat dari proses pengumpulan data yang
benar.

Anda mungkin juga menyukai