Data Akusisi -> Presiapan Data - > Data Eksplorasi -> Memodelkan Data ->
Visualisasi Data -> Pengambilan Keputusan
1. E-Commerce
Saat ini orang-orang lebih banyak berbelanja secara digital atau biasa kita kenal
dengan marketplace. Hampir semua orang menggunakan marketplace, penjual
online secara otomatis akan menyesuaikan etalasenya berdasarkan profil data
pembeli. Dengan mengubah tata letak halaman dan menyesuaikan produk jualannya
secara otomatis dan real-time. Beberapa online shop juga menyesuaikan harga
berdasarkan profil penghasilan konsumen, atau disebut dengan harga yang
dipersonalisasi. Teknologi ini merupakan salah satu aplikasi penerapan ilmu Data
Science.
3. Dynamic Pricing
Penetapan dynamic pricing sangat berguna dalam industri travel. Penetapan harga
dinamis ini digunakan oleh perusahaan dengan menggunakan data untuk
mensegmentasikan pelanggan atau konsumen secara akurat. Setiap kelompok
pelanggan kemudian dapat ditawari produk dengan harga berbeda. Penawaran ini
didasari pada informasi yang dihasilkan oleh Data Science dan berbagai faktor
lainnya.
1.5 Kesimpulan
Data Science adalah bidang yang membahas segala sesuatu yang berhubungan
dengan pembersihan, persiapan, dan menganalisis data yang tidak terstruktur, semi
terstruktur, dan terstruktur
Data Akusisi -> Presiapan Data - > Data Eksplorasi -> Memodelkan Data ->
Visualisasi Data -> Pengambilan Keputusan
Contoh Penerapan Data Science :
1. E-Commerce
2. Fraud Detection
3. Dynamic Pricing
Data dibuat terus-menerus, dan pada tingkat yang terus meningkat. Ponsel, media
sosial, teknologi pencitraan untuk menentukan diagnosis medis—semua ini dan
lebih banyak lagi, menciptakan data baru, dan itu harus disimpan di suatu tempat
untuk tujuan tertentu. Perangkat dan sensor secara otomatis menghasilkan informasi
diagnostik yang perlu disimpan dan diproses secara real time
2. Semi Terstruktur : File data tekstual dengan pola yang dapat dilihat yang
memungkinkan penguraian
3.Quasi-data Terstruktur : Data tekstual dengan format data tidak menentu yang
dapat diformat dengan usaha, alat, dan waktu
4. Data Tidak terstruktuur : Data yang tidak memiliki struktur bawaan, yang termasuk
dokumen teks, PDF, gambar, dan video.
1. Besarnya volume data : lebih dari atau sejuta baris data, big data memiliki jumlah
baris data sebanyak triliuan dan jutaan jumlah kolom
Walaupun Volume Big Data cenderung menarik perahtian namun secara umum
variasi dab kecepatan data menyediakan lebih tepat dari dafenisi Big data.
Volume : Volume
Variety : variasi
Valocity : kecepatan
Berdasarkan stuktur dan ukurannya maka big data tidak dapat dianalisisi secara
efisien dengan menggunakan database atau metode yang tradisional.
contoh :
4. Mematuhi peraturan dan hukum yang berlaku : anti pencucian uang, pinjaman
yang sesuai dan lain-lain
2.6 Kesimpulan
Big Data adalah Data yang memiliki skala, keragaman, ditribusi dan/atau ketepatan
waktunya dan memerlukan penggunaan arsitektur teknik /analisis baru untuk
menemukan sumber nilai bisnis yang baru -McKinsey Global report from 2011:
Sumber data Data dibuat terus-menerus, dan pada tingkat yang terus meningkat.
Melalui Ponsel, media sosial, teknologi pencitraan untuk menentukan diagnosis
medis—semua ini dan lebih banyak lagi, menciptakan data baru, dan itu harus
disimpan di suatu tempat untuk tujuan tertentu. Perangkat dan sensor secara
otomatis menghasilkan informasi diagnostik yang perlu disimpan dan diproses
secara real time
1. Data terstruuktur : data yang sudah terdefenisi tipe data, format dan strukutrnya.
contohnya OLAP
2. Semi Terstruktur : File data tekstual dengan pola yang dapat dilihat yang
memungkinkan penguraian
3.Quasi-data Terstruktur : Data tekstual dengan format data tidak menentu yang
dapat diformat dengan usaha, alat, dan waktu
4. Data Tidak terstruktuur : Data yang tidak memiliki struktur bawaan, yang mungkin
termasuk dokumen teks, PDF, gambar, dan video.
1. Besarnya volume data : lebih dari atau sejuta baris data, big data memiliki jumlah
baris data sebanyak triliuan dan jutaan jumlah kolom
Walaupun Volume Big Data cenderung menarik perahtian namun secara umum
variasi dab kecepatan data menyediakan lebih tepat dari dafenisi Big data.
Variety : variasi
Valocity : kecepatan
Karakteristik Big data dikenal denngan 3 V yaitu Volume, Variety dan Velocity
Perusahaan komersial di hampir setiap industri menggunakan data science dan big
data untuk mendapatkan pandangan terbaru tentang pelanggan, proses, staf,
penyelesaian, dan produk mereka. Banyak perusahaan menggunakan data science
untuk menawarkan kepada user pengalaman yang lebih baik, serta untuk menjual
silang, menjual lebih tinggi, dan mempersonalisasi penawaran.
Pada saat ini, setidaknya 50% perdagangan di seluruh dunia dilakukan secara
otomatis oleh mesin dengan memanfaatkan algoritma yang dikembangkan oleh
quants, demikian sebutan ilmuwan data yang bekerja mengembangkan algoritma
perdagangan, dengan memanfaatakn data science dan big data
3.3 Manfaat di bidang Non Komersial
Saat ini pemerintahan juga banyak memanfaatkan Big data dan Data science.
Pemerintah sangat menyadari pentingnya nilai dari sebuah informasi.
Contoh aplikasi Data.gov merupakan aplikasi milik pemerintah yang dibuka untuk
umum. aplikasi ini juga dikembangkan oleh ilmuan data science untu mendeteksi
orang-orang yang melakukan penipuan dengan memanfaatkan data tersebut.
■ Structured
■ Unstructured
■ Natural language
■ Machine-generated
■ Graph-based
■ Streamin
Data terstruktur adalah data yang bergantung pada model data dan berada pada
catatan yang sudah ditentukan. contoh data dalam file excell
2. Data Tidak terstruktur
Data tidak terstruktur adalah data yang tidak mudah dimasukkan ke dalam model
data karena kontennya bersifat spesifik atau bervariasi
3. Bahasa Alami
Bahasa alami adalah tipe khusus dari data tidak terstruktur; sulit untuk diproses
karena memerlukan pengetahuan tentang teknik ilmu data dan linguistik tertentu
Audio, gambar, dan video adalah tipe data yang menimbulkan tantangan khusus
bagi ilmuwan data. Tugas yang sepele bagi manusia, seperti mengenali objek dalam
gambar, ternyata menjadi tantangan bagi komputer
7. Streaming data
Meskipun streaming data dapat mengambil hampir semua bentuk sebelumnya, ini
memiliki properti tambahan. Data mengalir ke sistem ketika suatu peristiwa terjadi
alih-alih dimuat ke dalam penyimpanan data dalam batch. Meskipun ini sebenarnya
bukan jenis data yang berbeda, diperlukan di sini sepertimenyesuaikan proses untuk
menangani jenis ini informasi