Anda di halaman 1dari 29

ITB

DATA GROUP 8
COMMUNITY

LITERATURE REVIEW: BIG DATA


ANALYTICS
OUTLINE
01 DATA
Pada bagian ini akan dibahas mengenai
pengertian, fungsi dan jenis data

02 INFORMASI
Pada bagian ini akan dibahas mengenai
pengertian, fungsi dan jenis informasi

03 BIG DATA ANALYTICS


Pada bagian ini akan dibahas mengenai pengertian,
big data, big data analutics dan beberapa contoh
aplikasi big data
04 BUSINESS INTELLIGENCE
Pada bagian ini akan dibahas mengenai pengertian,
kegunaan dan langkah-langkah pengembangan
05 ANALYTICS LIFECYCLE
business intelligence

Pada bagian ini akan dibahas mengenai tahapan-


tahaoan yang digunakan jika bekerja dengan masalah
data science
DATA
Data adalah sesuatu yang belum
mempunyai arti bagi penerimanya dan
masih memerlukan adanya suatu
pengolahan. Data bisa berujut suatu
keadaan, gambar, suara, huruf, angka,
matematika, bahasa ataupun simbol-
simbol lainnya yang bisa kita gunakan
sebagai bahan untuk melihat
lingkungan, obyek, kejadian ataupun
suatu konsep.
Fungsi 01
Sebagai acuan dalam mengambil
Data suatu keputusan dalam
pemecahan masalah.

02
Sebagai pedoman atau dasar
suatu penelitian atau
perencanaan.

03
Sebagai acuan dalam implementasi
suatu kegiatan.

04
Sebagai dasar untuk melakukan
evaluasi terhadap suatu kegiatan.
Jenis
Data
01. DATA BERDASARKAN 02. DATA BERDASARKAN SUMBERNYA
CARA MEMPEROLEHNYA
Data Internal, yaitu data yang didapatkan dari
Data Primer, yaitu data asli atau internal suatu organisasi yang
data baru yang dikumpulkan menggambarkan keadaan organisasi
langsung oleh orang yang tersebut. Misalnya; informasi jumlah pegawai,
melakukan penelitian. jumlah modal, jumlah produksi, dan
sebagainya.
Data Sekunder, yaitu data
tersedia yang dikumpulkan dari Data Eksternal, yaitu data yang diperoleh dari
berbagai sumber yang sudah ada luar organisasi yang menggambarkan
sebelumnya. Misalnya; dari berbagai faktor yang dapat mempengaruhi
perpustakaan, dokumen kinerja organisasi tersebut. Misalnya;
penelitian terdahulu, dan lain-lain. informasi tentang daya beli masyarakat,
perubahan kebiasaan masyarakat, dan lain
sebagainya.
INFORMASI Informasi merupakan hasil
pengolahan dari sebuah model,
formasi, organisasi, ataupun
suatu perubahan bentuk dari
data yang memiliki nilai
tertentu, dan bisa digunakan
untuk menambah pengetahuan
bagi yang menerimanya.

Dalam hal ini, data bisa


dianggap sebagai obyek dan
informasi adalah suatu subyek
yang bermanfaat bagi
penerimanya.
Fungsi
Informasi

1. Menjadi Sumber Pengetahuan


Baru
2. Menghapus Ketidakpastian
3. Sebagai Media Hiburan
4. Sebagai Sumber Berita
5. Untuk Sosialisasi Kebijakan
6. Untuk Mempengaruhi Khalayak
7. Menyatukan Pendapat
JENIS INFORMASI

BERDASARKAN BERDASARKAN
BERDASARKAN BERDASARKAN
BIDANG LOKASI
SIFAT KEGUNAAN
KEHIDUPAN PERISTIWA
Faktual, yaitu informasi Dibagi menjadi dua bagian,
yang dibuat berdasarkan diantaranya; Ini adalah jenis Ini adalah jenis
fakta dan dapat dibuktikan Informasi yang menambah informasi yang informasi yang
kebenarannya. pengetahuan, yaitu dibuat dalam dibuat berdasarkan
Opini atau konsep, yaitu informasi yang isinya beberapa lokasi suatu
informasi yang dibuat menambah pengetahuan kategori, seperti peristiwa. Jenis
berdasarkan pendapat baru bagi seseorang. Informasi informasi ini dapat
seseorang tentang Informasi yang berdasarkan Kesehatan, dibagi menjadi dua,
sesuatu hal. penyajian, yaitu informasi Informasi yaitu informasi
Deskripsi, yaitu informasi yang disampaikan dalam Pendidikan, dalam negeri
yang dibuat dalam bentuk beberapa bentuk, misalnya Informasi Bisnis, (domestik), dan
penjelasan terperinci artikel, audio, gambar, Informasi informasi luar
BIG DATA
ANALYTICS BIG DATA adalah istilah khusus yang digunakan
untuk data yang melebihi kapasitas pemrosesan
database konvensional karena berjumlah terlalu
besar, bergerak terlalu cepat, dan tidak sesuai
dengan kemampuan struktural dari arsitektur
database tradisional.
BIG DATA ANALYTICS adalah keseluruhan
proses dari mengumpulkan, merapikan,
menganalisis big data sehingga diperoleh
informasi yang bernilai guna untuk
membantu penentuan keputusan atau
keberlangsungan suatu sistem. Hal ini
dilakukan dengan menggunakan teknologi
big data seperti Pig, Hadoop dan Hive.
Contoh Aplikasi
Big Data
Berikut ini beberapa contoh Aplikasi yang ditawarkan oleh
perusahaan/vendor dalam hal analisis terhadap big data :

IBM Big Data Analytics

HP Big Data

Microsoft Big Data


Analytics

SAP Big Data Analytics

Oracle Big Data Analytics


BUSINESS
INTELLIGE Istilah BUSINESS INTELLIGENCE (BI) pertama kali
NCE didengungkan pada tahun 1958 oleh seorang peneliti
dari IBM yang bernama Hans Peter Luhn. Beliau
mendefinisikan istilah intelligence sebagai
"Kemampuan dalam mengerti dan memahami suatu
hubungan timbal balik antara fakta-fakta yang
disajikan sedemikian rupa menjadi suatu landasan
dalam bertindak untuk mencapai tujuan yang
dikehendaki".

Menurut Wikipedia, BUSINESS


INTELLIGENCE adalah sekumpulan teknik dan alat
untuk mentransformasi dari data mentah menjadi
informasi yang berguna dan bermakna untuk tujuan
analisis bisnis.
Beberapa penerapan business Intelligence diantaranya
Kegunaan untuk:
Business • Analisa dalam perilaku konsumen
• Pola pembelian dan trend penjualan
Intelligence • Mengukur, melacak dan memprediksi penjualan dan kinerja
keuangan
• Penganggaran, perencanaan keuangan dan peramalan
• Mengetahui kinerja kegiatan pemasaran
• Optimalisasi proses dan kinerja operasional
• Meningkatkan efektifitas pengiriman dan pasokan
• Analisa CRM (Customer Relationship Management)
• Analisa Resiko Analisa nilai strategis
TAHAP 1 Planning TAHAP 3
TAHAP
adalah
2
Justification Business Planning
Business membahas melakukan adalah melakukan analisa
tentang evaluasi dari bisnis yang berjalan
Intelligence gambaran besar terhadap mengenai apa saja yang
infrastruktur yang
Development bagaimana Busin
dipunya saat ini
harus didukung
ess oleh Business
Steps Intelligence akan serta melakukan Intelligence yang akan
dibangun perencaan dibuat dan membuat
projek. rancangannya.

TAHAP 6
Deployment TAHAP 5 TAHAP 4
Construction Design
merupakan tahap
merupakan tahap untuk adalah
impelementasi Busine
melakukan persiapan membangun Business
ss
implementasi Business Intelligence berdasark
Intelligence dan Busin
Intelligence termasuk an apa yang telah
ess
salah satu tahapnya dirancang pada tahap
Intelligence digunaka
adalah migrasi data. 3
n oleh pengguna.
ANALYTICS
LIFECYCLE
Secara umum, kebanyakan data scientist akan melakukan
tahap-tahap berikut ketika bekerja dengan sebuah masalah
data science baru,

PROBLEM HYPOTHESIS DATA DATA MODEL MODEL


IDENTIFICATI FORMULATIO COLLECTI EXPLORATION BUILDING VALIDATION &
ON N ON & EVALUATION
PREPARATION
Problem Identifikasi masalah haruslah jelas, ringkas, dan
Identification terukur.
Secara garis besar masalah-masalah yang
diidentifikasi pada Data Science adalah sebagai
1. Mengelompokkan data
berikut:
2. Mengidentifikasi pola
3. Mengidentifikasi anomali
4. Tampilkan korelasi
5. Memprediksi hasil
SUPERVISED CLASSIFICATI
LEARNING ON
Develop predictive
Problem model based on both
input and output data
Type MACHINE REGRESSION
LEARNING
UNSUPERVISED
LEARNING
Group and interpret CLUSTERING
data based only on
input data

Setelah menentukan masalah, kita harus menentukan masalah


tersebut ke dalam tipe masalah apa. Machine Learning biasanya
membedakan masalah menjadi dua, yaitu Supervised Learning dan
Unsupervised Learning.

Supervised Learning adalah model prediksi berdasarkan input dan


ouput data. Sementara, Unsupervised Learning adalah model yang
mencari pola yang tersembunyi di input daya yang tidak memiliki
SUPERVISED CLASSIFICATI
LEARNING ON
Develop predictive
Problem model based on both
input and output data
Type MACHINE REGRESSION
LEARNING
UNSUPERVISED
LEARNING
Group and interpret CLUSTERING
data based only on
input data

Supervized Learning dibedakan menjadi dua yaitu classification


dan regresi. Classification adalah model yang memprediksi respons
kategoris diskrit. Sedangkan regresi adalah model yang
memprediksi respons numerik kontinu
Hypothesis
Formulation Hipotesis berasal dari Bahasa Yunani, hupo (di
bawah) dan thesis. Hipotesis adalah ide yang
dibuat dari bukti terbatas.
01. MEMBUAT ASUMSI 04. MENETAPKAN KRITERIA
Berbagai jenis pengujian hipotesis PENERIMAAN
Menetapkan ambang penerimaan
misalnya pada uji-t ditetapkan
membuat asumsi yang berbeda.
batas penerimaanya adalah
Hypothesis Asumsi terkait dengan distribusi
data, sampling, dan linearitas.
sebesar α =0,05
Process
02. MENETAPKAN HIPOTESIS 05. MELAKUKAN TES
NOL (H0) Melakukan tes sesuai dengan
Hipotesis nol adalah posisi awal. Ini
metode yang akan digunakan
adalah posisi status-quo. Ini adalah
misalnya uji-t
posisi yang ditolak atau gagal
ditolak. Ini adalah posisi yang perlu
06. EVALUASI HASIL
divalidasi. Ini adalah posisi yang
perlu diuji. Mengevaluasi hasil yang
03. MENETAPKAN HIPOTESIS didapatkan dari metode yang
ALTERNATIF (Ha) digunakan dengan kriteria
Hipotesis alternatif adalah penerimaan
pernyataan berlawanan dengan 07. MENARIK KESIMPULAN
hipotesis nol. Jika ada bukti yang
signifikan secara statistik yang
menunjukkan bahwa hipotesis
alternatif valid, maka hipotesis nol
Setelah masalah sudah didefinisikan dengan
Data
jelas dan membuat hipotesis, langkah
Collection selanjutnya adalah mengumpulkan data. Tahap
ini berguna untuk menjawab pertanyaan kunci
dan memvalidasi hipotesis.

Pengumpulan data adalah tahap kritis dalam


pemecahan masalah - jika bersifat dangkal, bias
atau tidak lengkap, analisis data akan sulit. Maka
dari itu, semua data yang dikumpulkan harus
terorganisir dengan baik dalam log bersama
dengan tanggal pengumpulan dan metadata
bermanfaat lainnya.
Berdasarkan pada jenis masalah yang dipecahkan,
berbagai teknik pengumpulan data dapat digunakan.
Data Teknik-teknik tersebut diantaranya:
Collection Secara sistematis
Mengumpulkan data
berdasarkan jawaban yang
Techniques memilih dan diberikan oleh responden
memperhatikan dalam bentuk tertulis
karakteristik orang,
Menggunakan data
benda atau peristiwa
yang sudah Tanya jawab secara lisan Memfasilitasi diskusi gratis
dikumpulkan oleh kepada responden, baik tentang topik tertentu
orang lain secara individu atau dengan kelompok peserta
kelompok yang dipilih

01 02 03 04 05
Langkah selanjutnya setelah data diperoleh
adalah pengorganisasian dan peraphian data.
Data Pada tahap ini kita akan menghapus data yang
Exploration & tidak lagi diperlukan, mengganti yang hilang
dan menstandarkan format di semua data yang
Preparation dikumpulkan.

Setelah data Anda siap digunakan, waktunya


untuk memahami data dan mengubahnya
menjadi pertanyaan data science (data
exploration).
Langkah-langkah dalam data exploration adalah sebagai
berikut:
Data
1. PEMERIKSAAN DATA DAN PROPERTINYA.
Exploration Jenis data yang berbeda (data numerik, data kategorikal,
data ordinal dan nominal, dll.) =memerlukan perawatan
yang berbeda, kita harus memeriksa data kita masuk ke
jenis yang mana.

2. MENGHITUNG STATISTIK DESKRIPTIF


Paha tahap ini kita akan mengekstraksi fitur dan menguji
variabel signifikan (biasanya) dengan korelasi.

3. VISUALISASI DATA
Untuk membantu mengidentifikasi pola dan tren yang
signifikan dalam data. Kita dapat menggunakan bantuan
diagram garis atau batang untuk membantu memahami
Pada tahap ini, model mulai dibangun untuk
Model menguji data dan mencari solusi optimal untuk
Building tujuan yang diminta.

Langkah-langkah dalam membangun model


adalah:
1.Menekankan masalah bisnis dengan jelas
2.Memilih variabel parameter yang relevan yang
berkontribusi pada prediksi hasil
3.Menentukan teknik dan metode ilmiah untuk
menyelesaikan masalah
Ada beberapa tugas yang dapat kita lakukan dalam
pemodelan. Kita dapat menggunakan metode
Modelling pemodelan yang berbeda-beda terhadap data yang
kita miliki dan memilih model yang memiliki performa
Methods terbaik. CLASSIFICATION
Biasanya untuk
REGRESSION mengidentifikasi,
dan
Biasanya digunakan untuk
mengelompokkan
memperkirakan nilai di
nilai-nilai grup.
Contoh:
masa depan
Contoh: Mengelompokkan pelanggan e-
• Melatih model untuk melakukan commerce kami untuk memahami
klasifikasi untuk membedakan email perilaku mereka di suatu situs web.
yang Anda terima sebagai "Kotak Dapat dilakukan dengan
Masuk" dan "Spam" menggunakan mengidentifikasi kelompok titik data
regresi logistik. menggunakan algoritma
• Memperkirakan nilai menggunakan pengelompokan seperti k-means
regresi linier. atau pengelompokan hierarkis
Tahap ini merupakan proses berkelanjutan yang bertujuan
untuk melihat efektivitas solusi dari waktu ke waktu.

Model Beberapa industri memiliki tingkat perubahan yang sangat


tinggi, sehingga memungkinkan solusi menjadi tidak feasible
Validation & untuk keadaan yang baru.
Evaluation
Akibatnya, kita perlu mengevaluasi model dari waktu ke
waktu dan melakukan sedikit perubahan-perubahan pada
solusi agar kembali ke jalurnya. Terkadang, kita harus
membangun seluruh solusi dari
awal karena lingkungan telah berubah secara dramatis
sehingga solusi yang dibuat tidak mencakup konteks bisnis
saat ini.
REFERENSI
ARTICLES
https://sis.binus.ac.id/2017/05/15/sekilas-tentang-business-intelligence/
https://widuri.raharja.info/index.php?title=Business_Intelligence
https://towardsdatascience.com/defining-a-data-science-problem-4cbf15a2a461
https://towardsdatascience.com/data-science-simplified-hypothesis-testing-
56e180ef2f71
https://brainhub.eu/blog/how-to-approach-data-science-problem/
https://towardsdatascience.com/5-steps-of-a-data-science-project-lifecycle-
26c50372b492

BOOKS
Larissa T. Moss, S. A. (2003). Business Intelligence Roadmap: The Complete
Project Lifecycle for Decision-Support Applications. Addison-Wesley Professional.
Prasad, Y. Lakhsmi. (2016). Big Data Analytics Made Easy. Notion Press.
OUR
TEAM

Fan Trisn
y a Ain
THANK
S
Does anyone have any
questions?

Anda mungkin juga menyukai