Anda di halaman 1dari 37

ANALISIS DAN PENGOLAHAN DATA

DIGITAL

I Wayan Supriana, iwayansupriana@gmail.com; wayan.supriana@unud.ac.id;


1. Peserta mampu menjelaskan konsep data science
2.Peserta mampu menjelaskan teknik analisis dalam
pengolahan data
Rencana Pembelajaran Semester
Analisis dan Pengolahan Data Digital
 Pengantar Data Science
 Pengembangan model berbasis data dengen metodelogi Data Science
 Menentukan object bisnis, teknis dan Rencana Projek Data Science (Business
Understanding)
 Mengumpulkan Data (Data Understanding 1)
 Menelaan/Menganalisis Data (Data Understanding 2)
 Menentukan Objek atau Memilah Data (Data Understanding 3)
 Membersihkan Data (Data Preparation 1)
 Mengkonstruksi Data (Data Preparation 2)
 Metode Data Analytic (Data Preparation 3)
 Membangun Model Uji Data
 Deployment Model
 Kontrak Kuliah
Kriteria dan standar penilaian dilakukan terhadap proses
pembelajaran, dengan komponen sebagai berikut:
 Tugas dan lainnya : 70%

o Keaktifan : 10%
o Quis : 20%
o Tugas Kelompok : 20%
o Tugas Mandiri : 20%

UTS : 15%
UAS : 15%
Konsep Pengolahan Data
 Pengolahan data menggunakan komputer terkenal dengan
Pengolahan Data Elektronik (PDE), atau Electronik Data
processing.
 Pengolahan data (data processing) adalah manipulasi data ke
dalam bentuk yang lebih berguna dan lebih berarti, berupa
suatu informasi.
Pengertian PDE
 PDE adalah manipulasi dari data ke dalam bentuk yang lebih
berarti berupa suatu informasi dengan menggunakan suatu
alat elektronik, yaitu komputer.
Siklus Pengolahan Data
 3 Tahapan Dasar siklus pengolahan data
(data processing life cycle)

Data Diolah Informasi


INPUT MODEL OUTPUT
Pengembangan Siklus Pengolahan Data
 Di tambah 3 tahapan lagi yaitu teknologi, basis data dan kontrol
/ pengendalian.

INPUT MODEL OUTPUT

TEKNOLOGI

STORAGE
(Basis Data)

KONTROL
Pengembangan Siklus Pengolahan Data
(LANJUTAN)

 Input, tahap ini merupakan proses memasukkan data ke dalam


komputer lewat alat input (Input device). Tahapan ini meliputi kegiatan
Collecting,Verifing, Encoding.
 Pencatatan data untuk sistem informasi berupa dokumen dasar yg
membantu penangan arus data pada sistem tersebut harus dapat :
1. Menunjukan macam data yg hrs dikumpulkan
2. Dicatat dengan jelas, konsisten & akurat
3. Data memiliki informasi lengkap, karena disebutkan satu-persatu
dlm dokumen dasarnya
4. Sebagi pendistribusi data utk individu/departemen lain
5. Alat bantu pembuktian terjadinya transaksi (audit trail)
6. Digunakan sebagai cadangan dari file2 data di komputer.
Proses memasukan data yg ditangkap di dokumen dasar.

Dokumen Dasar Proses Memasukan


Data Data
Pengembangan Siklus Pengolahan Data
(LANJUTAN)

 Output, tahap ini merupakan proses menghasilkan output/


keluaran dari hasil pengolahan data ke alat output (output
device), yaitu berupa informasi.
 Output dari sistem informasi dibuat menggunakan data yg ada
di basis data dan diproses menggunakan model tertentu
Pengembangan Siklus Pengolahan Data
(LANJUTAN)

 Basis Data, kumpulan data yang saling berhubungan satu dengan


lainnya, tersimpan di perangkat keras komputer dan dimanipulasi
menggunakan perangkat lunak dan dapat dipergunakan sebagai sebagai
bahan input untuk proses selanjutnya.
 3 Hal yg berhubungan dengan basis data :
1. Data yg diorganisasikan dlm bentuk basis data
2. Simpanan Permanen (storage) bagian dari perangkat keras contoh berupa
harddisk.
3. Perangkat lunak guna memanipulasi data. Dibuat dengan menggunakan bahasa
pemrograman atau berupa paket aplikasi Data Base Management System
(DBMS) ex : MySql, DBASE, Fox Base, Microsoft Acess, Oracle, dll
Pengembangan Siklus Pengolahan Data
(LANJUTAN)

 Komponen Model, Informasi yg berasal dari data yg diambil dari basis


data dioleh menggunakan model tertentu (tahapan Proses) berupa :
1. Model Logika ( if ….. Else ….. Endif)
2. Model Matematika , rumus-rumus matematis guna menghitung
hasil suatu informasi.
Pengembangan Siklus Pengolahan Data
(LANJUTAN)

 Komponen Teknologi, merupakan komponen yang penting di Sys


Info, hal tsb guna mendukung ketepatan waktu hasil informasi yg
dihasilkan dengan dukungan teknologi sistem komputer (H/W &
S/W) dan teknologi sistem telekomunikasi.
 Komponen Kontrol, yg menjamin informasi yg dihasilkan akurat.
Klasifikasi Kompnen Kontrol :
1. Sistem Pengendalian secara umum
Pengendalian organisasi, dokumentasi, perangkat keras,
keamanan fisik, kemanan data dan komunikasi.
2. Sistem Pengendalian Aplikasi , sudah diprogram S/W untuk
Pengendalian masukan, proses & keluaran
Metode Pengolahan Data
 Batch Processing (ProsesTunda)
 Data dikumpulkan terlebih dahulu
 Proses dilakukan dalam waktu tertentu
 Memiliki jumlah data yang besar
 Diawali proses perekaman data (storage)
 Kegiatan perekaman data terpisah dari proses pengolahan (off
line operation)
Metode Pengolahan Data
 Immediate Processing (Proses Segera)
 Pengolahan Segera
 Mempunyai terminal sebagai alat untuk memasukkan data
 On line operation (proses perekaman dan pengolahan jadi
satu)
 Waktu yang singkat / cepat.
Konsep Data Science
 Pada Dasarnya, DS Menggali dan Mengekstrak "Knowledge"
dan "Insight" dari data
 Di era digital ini, hampir semua kegiatan manusia, interaksi
manusia dengan lingkungannya, dan lingkungannya sendiri,
bisa terekam dalam bentuk digital, atau bida di digitalisasikan,
sehingga menjadi data
 Sehingga dapat dikatakan "everything is data"
 Secara inherence, ternyata berbadai data tersebut ada
strukturnya (inherence strukture atau hidden structure)
 Menjadi tantangan tersendiri bagi data scientist untuk
mengungkap inherence tructure atau hiden structure tersebut
menjadi " Knowledge" dan "insight"
Teori Data Science
 Teori yang mendasari DS boleh dikatan tidak ada yang berubah, antara lain
seperti:
 Teori peluang dan teori statistik
 Teori komputasi matriks
 Aljabar linier
 Kalkulus: limit, integral dan differential
 Fungsi, discriminant analysis
 Principle component analysis, factor analysis
 Data katagori dari distribus, dl
 Dengan tersediannya computing power yang besar, colume data yang
besar dan heterogen dan bisa terkumpul dengna cepat, serta bahasa
pemrograman yang canggih, membuat DS semakin powerful
 DS menjadi semakin menarik dan penting dengan hadirnya Big Data,
Computing Power, IoT, Blockchain, AI dll
Teknik-Teknik yang Digunakan untuk Data
Science
Big Data
 big data menggambarkan tentang sebuah data dengan
ukuran atau volume yang sangat besar. Data yang
dimaksud bisa data terstruktur maupun data tidak
terstruktur. Big data kini sudah banyak digunakan dalam
bisnis skala besar. Adanya big data mampu
mempermudah analisis suatu bisnis sehingga bisnis bisa
lebih baik ke depannya.
Big Data
Apa Itu Big Data?
Big data merupakan istilah baru yang muncul karena
banyaknya data yang dihasilkan oleh industri yang
menggunakan internet. Konsep big data sendiri mulai
disampaikan oleh analis industri bernama Doug Laney.
Beliau menyampaikan konsep bahwa big data itu terdiri
dari tiga bagian penting yaitu volume, kecepatan, dan
variasi.
Bagian Penting dalam Big Data
 Volume
Big data dikenal dengan ukurannya yang besar. Data yang
dimaksud bisa berasal dari berbagai sumber seperti aktivitas
di media sosial, transaksi bisnis, ataupun informasi mengenai
suatu sensor. Volume data dalam big data sangatlah besar dan
tentunya tidak dapat diproses dengan software atau aplikasi
Bagian Penting dalam Big Data
 Velocity
Velocity atau kecepatan merupakan bagian penting kedua dari
big data. Big data diproses dengan sangat cepat sehingga
mendekati waktu nyata. Anda bisa melihatnya di suatu media
sosial. Saat anda ingin melihat data yang disimpan, data
tersebut langsung ada. Itu karena kecepatan saat data diterima
sangatlah cepat.
Bagian Penting dalam Big Data
 Variety
Bagian penting selanjutnya dari big data adalah variety atau
variasi. Maksud dari variasi adalah berbagai jenis data yang
masuk dalam big data. Data tersebut baik data terstruktur
maupun data tidak terstruktur. Data yang masuk dalam data
terstruktur yaitu data numerik yang ada dalam database
tradisional.
Bagian Penting dalam Big Data
 Variabilitas
Arus data dalam periode tertentu kadang tidak konsisten
sehingga variabilitas menjadi salah satu bagian penting.
Contohnya ada pada media sosial. Di media sosial pasti akan
ada tren tertentu yang muncul dadakan. Tren tersebut
periodenya berbeda-beda, bisa harian, mingguan, maupun
bulanan. Beban puncak data yang seperti itu sangat
memerlukan analisis big data.
Bagian Penting dalam Big Data
 Kompleksitas
Adanya big data mampu mengatasi banyaknya data yang perlu
dicocokkan, dihubungkan, diubah ataupun dibersihkan. Data
perlu diperlakukan demikian karena data berasal dari
berbagai sumber yang berbeda. Nah big data sangat berperan
dalam mencari korelasi ataupun keterkaitan antara data satu
dan data lainnya.
Pentingnya Big Data
 Pentingnya Big Data
Big data dikatakan penting karena data besar yang bisa digunakan
untuk menganalisis solusi terbaik dari suatu bisnis atau
kepentingan lain. Permisalannya pada suatu bisnis. Banyak data
yang didapat dari suatu bisnis akan masuk dalam big data. Dengan
adanya big data tersebut, data akan diolah menggunakan teknologi
yang canggih ataupun dengan memanfaatkan artificial intelegence.
Penerapan Big Data
 Penggunaan mesin penelusuran
Riwayat penelusuran anda di mesin pencari google atau mesin
pencari lainnya akan disimpan. Riwayat yang disimpan tersebut
termasuk dalam kumpulan data atau big data karena jumlahnya
yang memang besar. Hasil analisis dari big data tersebut akan
memberikan hasil berupa saran kata kunci di google ataupun saran
situs yang bisa anda kunjungi.
Penerapan Big Data
 Penggunaan smartphone
Smartphone memiliki banyak fitur. Fitur yang dimaksud tentunya
akan merekam semua aktivitas anda. Aktivitas anda akan menjadi
data yang selalu disimpan. Jadi record sms ataupun telepon anda
akan selalu ada dan masuk dalam big data. Tidak hanya sms dan
telepon, riwayat lokasi anda saat menggunakan GPS ataupun
google map pun akan terekam dan tersimpan.
Penerapan Big Data
 Penggunaan sosial media
Penerapan selanjutnya dari big data adalah di penggunaan sosial media.
Semua teks , foto, audio, ataupun video yang anda upload akan menjadi
big data. Bayangkan saja berapa banyak orang yang menggunakan sosial
media dan update info setiap harinya. Nah big data merupakan gambaran
dari banyaknya data tersebut. Data anda di sosial media akan tetap
tersimpan dan dijadikan sumber untuk memperbaiki kekurangan-
kekurangan sosial media yang bersangkutan.
Penerapan Big Data
 Penggunaan sosial media
Penerapan selanjutnya dari big data adalah di penggunaan sosial media.
Semua teks , foto, audio, ataupun video yang anda upload akan menjadi
big data. Bayangkan saja berapa banyak orang yang menggunakan sosial
media dan update info setiap harinya. Nah big data merupakan gambaran
dari banyaknya data tersebut. Data anda di sosial media akan tetap
tersimpan dan dijadikan sumber untuk memperbaiki kekurangan-
kekurangan sosial media yang bersangkutan.
Tantangan Penggunaan Big Data
Terkait juga dengan big data adalah semakin merebaknya
implementasi Internet of Things (IoT). IoT secara singkat bisa
didefinisikan sebagai kumpulan berbagai jenis benda dan peranti
yang dilengkapi dengan chip, rangkaian elektronik, sensor,
perangkat lunak tertanam, dan konektivitas jaringan yang
memungkinkannya untuk mengumpulkan data, dan terhubung
lewat jaringan internet di antara satu sama lain, ataupun ke server.
Tantangan Penggunaan Big Data
Big data dan IoT pada dasarnya berjalan seiring sejalan. IoT dan
sensor mengumpulkan, menganalisis, berbagi dan mengirim
data secara real time, menuntut beban lebih pada
kemampuan big data suatu organisasi. Data hasil penjaringan
IoT mendorong teknologi penyimpanan data tradisional ke
batasnya.
Pengembangan Bisnis dengan Big
Data
Analisis terhadap data bisa digunakan untuk merancang strategi
aset yang tepat. Keandalan (reliability) dari aset akan
berdampak pada pendapatan bisnis. Namun untuk mengelola
ini, kita butuh wawasan, baik dari segi risiko maupun segi
finansial.
Pengembangan Bisnis dengan Big
Data
Misalnya, untuk menekan risiko operasi suatu mesin, pemilik industri
mungkin ingin melakukan pemeliharaan seminggu sekali, yang
sebenarnya mungkin tidak diperlukan, dan akan memakan biaya.
Solusinya adalah memanfaatkan data operasi dan perilaku mesin
tersebut, data pendapatan yang sudah didapatkan, serta anggaran
untuk pemeliharaan dan pengoperasian. Ketiga sumber data ini
bisa digunakan untuk mendapatkan profil risiko yang dapat
ditoleransi oleh bisnis, dengan biaya minimum.
Hal yang Perlu Dilakukan untuk
Implementasi Big Data
1. Implementasi sistem basis data dan arsitektur yang scalable
2. melakukan penambangan data terotomatisasi.
Hal yang Perlu Dilakukan untuk
Implementasi Big Data
Keuntungan utama sistem basis data scalable adalah dapat
dibangun secara modular, dan dikembangkan sesuai
kebutuhan, dengan biaya awal relatif murah. Bila suatu
organisasi hanya menangani data dalam jumlah sedikit,
belum perlu berinvestasi untuk server berukuran
petabyte.

Anda mungkin juga menyukai