Anda di halaman 1dari 10

1.

1 Pengertian Data Science


Data Science adalah bidang yang membahas segala sesuatu yang berhubungan dengan
pembersihan, persiapan, dan menganalisis data yang tidak terstruktur, semi terstruktur, dan
terstruktur

Bidang Data Science erat hubungannya dengan statistik, matematika, pemrogrman,


problem-solving dan proses capture data untuk menjadi sebuah informasi

1.2 Tahapan Data Science

Tahapan data Science : Target = Bisnis Profit

Data Akusisi -> Presiapan Data - > Data Eksplorasi  -> Memodelkan Data ->
Visualisasi Data -> Pengambilan Keputusan

1.3 Contoh Penerapan Data Science


Data Science menjadi satu dari sekian istilah paling populer dalam dunia
perindustrian. Data Science pun menjadi teknologi yang berperan besar di
dalamnya. 

1.  E-Commerce
Saat ini orang-orang lebih banyak berbelanja secara digital atau biasa kita kenal
dengan marketplace. Hampir semua orang menggunakan marketplace, penjual
online secara otomatis akan menyesuaikan etalasenya berdasarkan profil data
pembeli. Dengan mengubah tata letak halaman dan menyesuaikan produk jualannya
secara otomatis dan real-time. Beberapa online shop juga menyesuaikan harga
berdasarkan profil penghasilan konsumen, atau disebut dengan harga yang
dipersonalisasi. Teknologi ini merupakan salah satu aplikasi penerapan ilmu Data
Science.

1.4 Contoh Penerapan Data Science


2. Fraud Detection
Mendeteksi penipuan adalah bagian terpenting dari segala industri keuangan. Data
Science dan AI adalah kedua ilmu yang sering digunakan disini. Bahkan kerusakan
dan gangguan kecil akan dapat menyebabkan kerugian finansial. Analisis prediksi
real-time membantu dalam peningkatan deteksi penipuan dan juga keamanan
cyber. Dengan bantuan Data Science, perusahaan dapat menyediakan layanan
keuangan yang lebih efektif. Teknologi ini membantu untuk mengidentifikasi potensi
transaksi penipuan yang dilakukan di setiap aktivitas. Dan ini juga akan membantu
untuk memblokir sesi atau akun jika terdeteksi ada aktivitas keuangan yang tidak
biasa.

3. Dynamic Pricing
Penetapan dynamic pricing sangat berguna dalam industri travel. Penetapan harga
dinamis ini digunakan oleh perusahaan dengan menggunakan data untuk
mensegmentasikan pelanggan atau konsumen secara akurat. Setiap kelompok
pelanggan kemudian dapat ditawari produk dengan harga berbeda. Penawaran ini
didasari pada informasi yang dihasilkan oleh Data Science dan berbagai faktor
lainnya.

Salah satu contoh perusahaan yang menerapkannya adalah Airbnb. Airbnb


menggunakan ilmu Data Science dan algoritma dynamic pricing yang berfokus pada
harga. Algoritma ini memperhitungkan berbagai macam kategori. Seperti lead time,
review properti dan fasilitas yang disediakan. Algoritma ini juga dapat digunakan
oleh pemilik properti untuk menentukan biaya per malam secara otomatis.

1.5 Kesimpulan
Data Science adalah bidang yang membahas segala sesuatu yang berhubungan
dengan pembersihan, persiapan, dan menganalisis data yang tidak terstruktur, semi
terstruktur, dan terstruktur

Tahapan data Science : Target = Bisnis Profit

Data Akusisi -> Presiapan Data - > Data Eksplorasi  -> Memodelkan Data ->
Visualisasi Data -> Pengambilan Keputusan
Contoh Penerapan Data Science :

1. E-Commerce

2. Fraud Detection

3. Dynamic Pricing

2.1 Pengertian Big Data


Big Data adalah Data yang memiliki skala, keragaman, ditribusi dan/atau ketepatan
waktunya dan memerlukan penggunaan arsitektur teknik /analisis  baru untuk
menemukan sumber nilai bisnis yang baru -McKinsey Global report from 2011:

Berdasarkan defenisi diatas menyiratkan bahwa sebuah organisasi membutuhkan


arsitektur data yang baru,  tool  yang baru, metode yang baru dan gabungan dari
kemampuan ilmuan yang baru untuk menentukan aturan-aturan yang baru.

2.2 Sumber Data


Hal-hal yang memicu besarnya gelombang data yaitu 

Data dibuat terus-menerus, dan pada tingkat yang terus meningkat. Ponsel, media
sosial, teknologi pencitraan untuk menentukan diagnosis medis—semua ini dan
lebih banyak lagi, menciptakan data baru, dan itu harus disimpan di suatu tempat
untuk tujuan tertentu. Perangkat dan sensor secara otomatis menghasilkan informasi
diagnostik yang perlu disimpan dan diproses secara real time

Terakhir diperbaharui: Sunday, 20 March 2022


2.3 Struktur Big Data
1. Data terstruuktur : data yang sudah terdefenisi tipe data, format dan strukutrnya.
contohnya OLAP

2. Semi Terstruktur : File data tekstual dengan pola yang dapat dilihat yang
memungkinkan penguraian

3.Quasi-data Terstruktur  : Data tekstual dengan format data tidak menentu yang
dapat diformat dengan usaha, alat, dan waktu

4. Data Tidak terstruktuur : Data yang tidak memiliki struktur bawaan, yang termasuk
dokumen teks, PDF, gambar, dan video. 

2.4 Karakteristik Big data


Karateristik Big Data dapat diamati melalui 3 atribut berikut :

1. Besarnya volume data : lebih dari atau sejuta baris data, big data memiliki jumlah 
baris data sebanyak triliuan dan jutaan jumlah kolom

2. Kompleksitas tipe data dan strukturnya L Big data mecerminkan beragamnya


sumber data, format dan struktur, termasuk penelusuran digital yang ada pada web
dan repositori digital untuk setiap analisis data

3. Cepatnya bertumbbuh dan terbentuknya data yang baru : ig data


menggambarkan tingginya kecepatan data dengan cepatnya penyerapan data serta
analisis data yang mendekati waktu realtime

Walaupun Volume Big Data cenderung menarik perahtian namun secara umum
variasi dab kecepatan data menyediakan lebih tepat dari dafenisi Big data.

Big Data Dikenal dengan 3V yaitu :

Volume : Volume

Variety : variasi

Valocity : kecepatan
Berdasarkan  stuktur dan ukurannya maka big data tidak dapat dianalisisi secara
efisien dengan menggunakan database atau metode yang tradisional.

Big Data membutuhkan tool yang baru dan teknologi penyimpanan, manajemen


dan kesadaran keuntungan bisnis

2.5 Contoh Impelementasi Big Data


Saat ini masalah-masalah pada  bisnis memberikan kesempatan untuk sebuah
organisasi untuk menjadi lebih analisis dan mengendalikan data

contoh :

1.  Pengompimalan bisnis operasi seperti penjualan, pemberian hargam keuntungan


dan efisiensi

2. mengidentifikasi resiko bisnis : Penggantian pelanggan,  penipuan dan dan lain-


lain

3. Memprediksi Peluang bsisnis yang bbaru, : Penjualan yang sedang tinggi,


penjualan yang saling silang serta prospek kustomer yang terbaru

4. Mematuhi peraturan dan hukum yang berlaku :  anti pencucian  uang, pinjaman
yang sesuai dan lain-lain

2.6 Kesimpulan
Big Data adalah Data yang memiliki skala, keragaman, ditribusi dan/atau ketepatan
waktunya dan memerlukan penggunaan arsitektur teknik /analisis  baru untuk
menemukan sumber nilai bisnis yang baru -McKinsey Global report from 2011:

Sumber data Data dibuat terus-menerus, dan pada tingkat yang terus meningkat.
Melalui Ponsel, media sosial, teknologi pencitraan untuk menentukan diagnosis
medis—semua ini dan lebih banyak lagi, menciptakan data baru, dan itu harus
disimpan di suatu tempat untuk tujuan tertentu. Perangkat dan sensor secara
otomatis menghasilkan informasi diagnostik yang perlu disimpan dan diproses
secara real time

Struktur Big data :

1. Data terstruuktur : data yang sudah terdefenisi tipe data, format dan strukutrnya.
contohnya OLAP

2. Semi Terstruktur : File data tekstual dengan pola yang dapat dilihat yang
memungkinkan penguraian

3.Quasi-data Terstruktur  : Data tekstual dengan format data tidak menentu yang
dapat diformat dengan usaha, alat, dan waktu

4. Data Tidak terstruktuur : Data yang tidak memiliki struktur bawaan, yang mungkin
termasuk dokumen teks, PDF, gambar, dan video. 

Karateristik  Big Data :

Karateristik Big Data dapat diamati melalui 3 atribut berikut :

1. Besarnya volume data : lebih dari atau sejuta baris data, big data memiliki jumlah 
baris data sebanyak triliuan dan jutaan jumlah kolom

2. Kompleksitas tipe data dan strukturnya L Big data mecerminkan beragamnya


sumber data, format dan struktur, termasuk penelusuran digital yang ada pada web
dan repositori digital untuk setiap analisis data

3. Cepatnya bertumbbuh dan terbentuknya data yang baru : ig data


menggambarkan tingginya kecepatan data dengan cepatnya penyerapan data serta
analisis data yang mendekati waktu realtime

Walaupun Volume Big Data cenderung menarik perahtian namun secara umum
variasi dab kecepatan data menyediakan lebih tepat dari dafenisi Big data.

Big Data Dikenal dengan 3V yaitu :


Volume : Volume

Variety : variasi

Valocity : kecepatan

3.1 Big Data


Big Data adalah sekumpulan data yang begitu besar dan kompleks sehingga
menjadi sulit untuk memprosesnya menggunakan teknik manajemen data
tradisional seperti, misalnya, RDBMS (sistem manajemen basis data relasional).

Data Science merupakan metode untuk menganalisis sejumlah besar data dan


mengekstrak pengetahuan yang dikandungnya

Karakteristik Big data dikenal denngan 3 V yaitu Volume, Variety dan Velocity

3.2 Manfaat dan Kegunaan Data Science


Data Science dan Big Data memiliki peran yang besar di dunia komersial maupun
non komersial

Perusahaan komersial di hampir setiap industri menggunakan data science dan big
data untuk mendapatkan pandangan terbaru tentang pelanggan, proses, staf,
penyelesaian, dan produk mereka. Banyak perusahaan menggunakan data science
untuk menawarkan kepada  user pengalaman yang lebih baik, serta untuk menjual
silang, menjual lebih tinggi, dan mempersonalisasi penawaran.

Contoh Google Adsense , Max Point, Moneyball, Financial Institution

Pada saat ini, setidaknya 50% perdagangan di seluruh dunia dilakukan secara
otomatis oleh mesin dengan memanfaatkan algoritma yang dikembangkan oleh
quants, demikian sebutan ilmuwan data yang bekerja mengembangkan algoritma
perdagangan, dengan memanfaatakn data science dan big data
3.3 Manfaat di bidang Non Komersial
Saat ini  pemerintahan juga banyak memanfaatkan Big data dan Data science.
Pemerintah sangat menyadari pentingnya nilai dari sebuah informasi.

Contoh aplikasi Data.gov merupakan aplikasi milik pemerintah yang dibuka untuk
umum. aplikasi ini juga dikembangkan oleh ilmuan data science untu mendeteksi
orang-orang yang melakukan penipuan dengan memanfaatkan data tersebut.

Pemerintah sendiri menghimpun data tersebut dengan memanfaatkan google


map,email,text mining,dan lain lain

3.4 Kategori Data


Ada banyak jenis data pada datascience dan Big data dengan demikian menganalisa
data tersebut juga dengan teknik dan tool yang berbeda-beda :

■ Structured 

■ Unstructured 

■ Natural language

■ Machine-generated 

■ Graph-based 

■ Audio, video, and images 

■ Streamin

3.5 Data Terstruktur


1. Data Terstruktur

Data terstruktur adalah data yang bergantung pada model data dan berada pada
catatan yang sudah ditentukan. contoh data dalam file excell
2. Data Tidak terstruktur

Data tidak terstruktur adalah data yang tidak mudah dimasukkan ke dalam model
data karena kontennya bersifat spesifik atau bervariasi

3. Bahasa Alami 

Bahasa alami adalah tipe khusus dari data tidak terstruktur; sulit untuk diproses
karena memerlukan pengetahuan tentang teknik ilmu data dan linguistik tertentu

3.6 Mesin Pembangkit Data


Data yang dihasilkan mesin adalah informasi yang dibuat secara otomatis oleh
komputer, proses, aplikasi, atau mesin lain tanpa campur tangan manusia.

5. Audio, image, and video

Audio, gambar, dan video adalah tipe data yang menimbulkan tantangan khusus
bagi ilmuwan data. Tugas yang sepele bagi manusia, seperti mengenali objek dalam
gambar, ternyata menjadi tantangan bagi komputer

3.7 Data Graph dan Berbasis jaringan


Data berbasis graph adalah cara alami untuk mewakili jejaring sosial, dan strukturnya
memungkinkan untuk menghitung metrik tertentu seperti pengaruh seseorang dan
jalur terpendek antara dua orang

7. Streaming data
Meskipun streaming data dapat mengambil hampir semua bentuk sebelumnya, ini
memiliki properti tambahan. Data mengalir ke sistem ketika suatu peristiwa terjadi
alih-alih dimuat ke dalam penyimpanan data dalam batch. Meskipun ini sebenarnya
bukan jenis data yang berbeda, diperlukan di sini sepertimenyesuaikan proses untuk
menangani jenis ini informasi

Anda mungkin juga menyukai