Anda di halaman 1dari 36

NAMA : AGUS KRISWANTO NIM : 202123001

PRODI : TEKNIK MESIN MATA UJIAN : DATA SCIENCE

A. Buatlah : Penjelasan, Resume, Analisis Kritis dan Telaah Referensi Dari semua materi berikut
- Pengenalan Big Data dan Data Science
Big Data
a) Pengertian Big Data
Menurut (Eaton, Dirk, Tom, George, & Paul) Big Data merupakan istilah yang berlaku untuk
informasi yang tidak dapat diproses atau dianalisis menggunakan alat tradisional.
Menurut (Dumbill, 2012) , Big Data adalah data yang melebihi proses kapasitas dari kovensi
sistem database yang ada. Data terlalu besar dan terlalu cepat atau tidak sesuai dengan
struktur arsitektur database yang ada. Untuk mendapatkan nilai dari data, maka harus memilih
jalan altenatif untuk memprosesnya.
Berdasarkan pengertian para ahli di atas, dapat disimpulkan bahwa Big Data adalah data yang
memiliki volume besar sehingga tidak dapat diproses menggunakan alat tradisional biasa dan
harus menggunakan cara dan alat baru untuk mendapatkan nilai dari data ini
Big data dikatakan kumpulan proses yang terdiri volume data dalam jumlah besar yang
terstruktur maupun tidak terstruktur dan digunakan untuk membantu kegiatan bisnis. Big data
sendiri merupakan pengembangan dari sistem database pada umumnya. Yang membedakan
disini adalah proses kecepatan, volume, dan jenis data yang tersedia lebih banyak dan
bervariatif daripada DBMS (Database Management System) pada umumnya.
b) Dimensi Big Data
Ada 3 dimensi awal dalam Big Data yaitu 3V: Volume, Variety dan Velocity:
- Volume: Ukuran data yang dimiliki oleh big data memiliki kapasitas yang besar. Dapat
mencoba melakukan proses data dengan ukuran yang besar untuk dijalankan.
- Velocity: Kecepatan transfer data juga sangat berpengaruh dalam proses pengiriman data
dengan efektif dan stabil. Big data memiliki kecepatan yang memungkinkan untuk dapat
diterima secara langsung (real-time). Kecepatan tertinggi yang bisa didapatkan langsung
melalui aliran data ke memori apabila dibandingkan dengan yang ditulis pada sebuah disk.
- Variety: Jenis variasi data yang dimiliki oleh big data lebih banyak daripada menggunakan
sistem database SQL. Jenis data yang masih bersifat tradisional, lebih terstruktur daripada
data yang belum terstruktur. Contohnya adalah teks, audio, dan video merupakan data
yang belum terdefinisikan secara langsung dan harus melalui beberapa tahap untuk dapat
diproses dalam sebuah database.
Selain dari 3V diatas, masih ada 2V lain yang merupakan bagian dari big data sendiri.
Yaitu Value dan Veracity:
- Untuk value, merupakan nilai atau aliran data yang tidak teratur dan konsisten dalam
beberapa kondisi dan periode. Hal tersebut dapat terjadi pada suatu kasus dimana
terdapat lonjakan data yang besar sehingga, akan memproses data dengan resource
memori yang lebih besar.  
- Veracity merupakan bentuk pembenaran suatu data. Jadi, mengacu pada kualitas data
tersebut, dapat berasal dari berbagai sumber. Perlu adanya proses untuk
menghubungkan dan mengkorelasikan beberapa hubungan data. Jika tidak ada relasi
yang baik, maka dapat menimbulkan kontrol yang lepas kendali.
c) Fungsi Big Data
Big data memiliki beberapa fungsi penting dalam proses pengembangan dan penyempurnaan
sebuah aplikasi. Berikut ini merupakan beberapa fungsi terkait dengan big data:
1. Dapat menentukan penyebab suatu masalah, kegagalan secara real time, Fungsi pertama
dari big data adalah menentukan dan menganalisa penyebab dari suatu permasalahan
yang terjadi di dalam sistem. Kemudian, dengan penggunaannya saat ini, juga dapat
meminimalisir terjadinya kegagalan dalam proses penyimpanan data. Untuk hasil analisis
tersebut dapat ditampilkan secara real-time.
2. Pengambilan sebuah keputusan yang cerdas dan tepat, Big data juga dapat digabungkan
dengan sistem dan perangkat teknologi cerdas seperti IoT (Internet of Things) dan AI
(Artificial Intelligence). Tugasnya adalah untuk memberikan dan menyimpan data dan
informasi yang dibutuhkan dalam pengembangan sebuah produk. Misalnya saja smart
city atau kota cerdas yang menggunakan bantuan kecerdasan buatan dan jaringan internet
berskala besar yang mampu untuk menghubungkan tiap sudut kota, bangunan, dan
infrastruktur pendukung lain.
3. Mendeteksi sebuah anomali atau perilaku yang menyimpang dalam struktur bisnis anda,
Fungsi yang ketiga adalah mampu untuk mendeteksi secara cepat dan tepat, bentuk atau
proses kegiatan yang menyimpang dan berhenti karena ada kesalahan dari sisi teknis
maupun non teknis. Big data juga dapat merencanakan beberapa opsi untuk mengurangi
dan mengatasi anomali tersebut dengan lebih cepat untuk membantu aktivitas bisnis
perusahaan atau organisasi anda.
4. Mengurangi biaya, waktu, dan meningkatkan performa produk aplikasi, Penyimpanan data
dengan menggunakan sistem big data juga dapat mengurangi biaya yang harus
dikeluarkan oleh perusahaan. Kemudian, waktu dalam mengelola dan menjalankan
sebuah operasi menjadi lebih cepat dengan transfer data diatas rata – rata sistem
database lain.  Peningkatan performa juga menjadi kelebihan tersendiri untuk mendukung
pengembangan perangkat lunak. 
d) Manfaat Big data
Banyak sekali kemudahan yang dimiliki oleh big data dari sisi fungsionalitas dan fitur yang
dimiliki. Kami membagi menjadi 2 manfaat untuk kebutuhan dalam proses teknologi informasi
(TI) dan bisnis.
1. Bidang Teknologi Informasi
 Penggunaan Perangkat Mobile
Saat ini, penggunaan perangkat seperti smartphone, tablet, IPOD, dll. Sering kita
jumpai karena telah mendukung dan support dengan berbagai sistem aplikasi.
Kemudian, faktor user friendly dan mudah dibawa kemana saja merupakan kelebihan
utama dari perangkat mobile. Penggunaannya juga digunakan untuk pengembangan
perangkat mobile saat ini. Salah satu contoh yang mudah untuk anda lihat adalah
aplikasi GPS yang tentunya sudah terinstall dalam perangkat anda. GPS (Global
Positioning System) yang dimiliki oleh Google Maps menggunakan bantuan dari big
data dalam memproses dan memanajemen berbagai bentuk data. Karena, sistem
database yang dibutuhkan sangat besar. Mulai dari gambar, pemetaan lokasi hingga
dapat menjangkau hampir seluruh penjuru dunia sekaligus. Tentunya membutuhkan
sebuah basis data dengan kapasitas yang sangat besar. Sekarang, Google telah
menerapkan sistem penyimpanan berbasis cloud (awan). Sehingga, penyimpanan
dapat dilakukan secara online dan real-time dengan kapasitas yang lebih besar lagi. 
 Media Sosial, Hampir setiap orang menggunakan yang namanya media sosial untuk
mengakses berbagai informasi dan membagikan aktivitas keseharian pribadi.
Tentunya, banyak yang mengupload foto, video maupun teks ke dalam aplikasi media
sosial tersebut. Semua informasi tersebut merupakan jenis data yang akan terekam
dan tersimpan dalam sistem basis data dengan kapasitas besar. Bisa membayangkan
berapa ukuran yang harus dialokasi oleh media sosial seperti Facebook, Twitter,
Instagram, dll. Untuk menampung data setiap harinya. Solusi terbaik untuk mengatasi
masalah tersebut adalah dengan menggunakan big data yang memiliki performa yang
baik dalam penanganan data dengan skala besar.
 Perangkat Cerdas, Sistem cerdas untuk saat ini banyak dikembangkan oleh negara –
negara maju seperti China, Jepang, Amerika, dll. Salah satu manfaat yang dimiliki oleh
perangkat cerdas adalah mampu membantu kegiatan manusia dengan lebih efektif dan
efisien. Contoh dari perangkat cerdas adalah teknologi IoT yang saat ini banyak
diterapkan pada perangkat elektronik seperti kulkas, mesin cuci, AC, dan lain
sebagainya. Dengan menggunakan sistem yang telah terintegrasi dengan jaringan
internet, maka segala bentuk aktivitas dapat dikoordinir dalam satu sistem aplikasi saja
dengan bantuan big data sebagai penyedia layanan informasi dan penyimpanan data.
 Media Digital, Selanjutnya, big data juga mempengaruhi dari sisi penggunaan media
digital. Contohnya, penggunaan fitur pada website dan aplikasi streaming
seperti spotify dan netflix. Dalam sistem basis data yang mereka gunakan, mampu
mencatat data musik, film yang telah anda tonton dan memberikan sebuah
rekomendasi untuk anda. Dengan bantuan teknologi AI sendiri, basis data dapat
terintegrasi dengan baik dan cepat untuk memberikan kemudahan dalam penggunaan
aplikasi tersebut. Contoh lain dari penerapan media digital adalah fitur pada e-
commerce yang telah menerapkan AI dengan big data untuk memudahkan pengguna
dalam memberikan rekomendasi produk
2. Bidang Bisnis
 Meningkatkan sistem operasional bisnis, Untuk meningkatkan produktivitas dan
efektivitas bisnis yang anda rintis, tentu memerlukan sumber daya yang memadai.
Salah satunya akan kebutuhan data yang terus meningkat. Big data dapat mengatasi
permasalahan data dengan kebutuhan yang besar untuk membantu proses
operasional bisnis anda.
 Customer Relationship Management (CRM), Perlu menjaga dan meningkatkan
hubungan baik dengan pelanggan dan sales. Dengan melakukan management
menggunakan beberapa fitur tambahan untuk membantu anda dalam memonitoring
kegiatan penjualan, menghitung rata – rata konversi, dan lain sebagainya. 
 Mengoptimalkan pengalaman penggunaan aplikasi, Penggunaan perangkat mobile
terus meningkat, sehingga perlu adanya optimasi dari sisi software dan hardware.
Selain itu, penyimpanan data juga sangat berpengaruh terhadap optimalisasi sebuah
aplikasi. Dengan big data, proses transfer dan manajemen data berjalan lebih cepat
dan akurat
3. Big Data for development
Big Data untuk keperluan development berkaitan dengan, tetapi berbeda dari, 'tradisional
Data pembangunan '(misalnya data survei, statistik resmi), dan sektor swasta dan media
mainstream menyebutnya 'Big Data’. Big Data untuk sumber Pengembangan umumnya
memiliki beberapa / semua fitur ini:
1. Digitally generated: data yang dihasilkan secara digital (sebagai lawan yang
didigitalkan manual), dan dapat disimpan dengan menggunakan rangkaian satu dan
nol, dan dengan demikian dapat dimanipulasi oleh computer.
2. Passively produced: Data ini merupakan data yang dihasilkan atau produk dari
kehidupan kita sehari-hari atau interaksi dengan jasa digital.
3. Automatically collected: Data-data yang terbentuk dari data-data operasional dan
transaksi yang dikumpulkan dan telah diproses (ETL) dan si simpan kedalam data
mart.
4. Geographically or temporally trackable, Data –data yang menunjukan lokasi atau
posisi, misalnya data lokasi ponsel atau durasi waktu panggilan.
5. Continuously analysed: Informasi yang relevan dengan kesejahteraan manusia dan
pembangunan dan dapat dianalisis secara real-time
4. Pengunaan Big Data dalam perusahaan
 IT logs Analytics
Penyimpanan Log jangka panjang, digunakan untuk analisa proses sistem yang
sedang berjalan untuk mencegah dan menaggulangi kegagalan dalam sistem,
mengunakan hasil analisa log untuk menemukan dan mentukan secara pasti
kegagalan apa yang terjadi didalam sistem, menyiapkan langkah-langkah pasti yang
dapat digunakan sebagai solusi masalah sistem.
 Fraud Detection Pattern
Banyak digunakan dalam Bidang keuangan atau dimana saja transaksi finasial terlibat,
Memaksimalkan pengunaan data-data yang ada untuk memberikan kemampuan unutk
mendeteksi fraud ketika transaksi sedang berlangsung.
 The Social Media Pattern
Pengunaan Big data untuk analisa media social dan sentiment pelangan, memberikan
kemampuan bagi perusahan untuk mengetahui keinginan customer secara luas,
mendapatkan feedback secara langsung, dan mengenali langsung dampak sentimen
terhadap penjualan, serta efektivitas dan penerimaan pelangan terhadap pemasaran
yang dilakukan.
 The Call centere Mantra
Penyimpanan hasil perbincangan atau laporan customer dalam bentuk text yang
kemudian digunakan sebagai data untuk analisa masalah yang dihadapai customer,
memberikan kemampuan bagi perusahaan untuk memberikan tanggapan yang cepat
maupun secara langsung terhadap masalah yang dihadapi customer, serta
kemampuan unutk mendeteksi penurunan loyalitas customer dikarenakan masalah dan
ketidakpuasaan.
 Risk: Patterns for Modeling and Management
Memberikan kempuaan pengunaan data secara penuh dan analisis dalam pemodelan
resiko dan menejemen resiko untuk memberikan pengetahuan akan resiko dan
penanggulangannya secara tepat dan langsung.
 Big data and The Energy Sector
Memberikan kemampuan penyimpanan dan pemrosesan data secara langsung dari
berbagai sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk
memisahkannya dari signal.
e) Membangun Big Data Platform
Seperti data pergudangan, toko web atau platform TI, infrastruktur untuk data yang besar
memiliki kebutuhan yang unik. Dalam mempertimbangkan semua komponen platform data
yang besar, penting untuk diingat bahwa tujuan akhir adalah untuk dengan mudah
mengintegrasikan data yang besar dengan data perusahaan Anda untuk memungkinkan Anda
untuk melakukan analisis mendalam pada set data gabungan.
Requirement dalam big data infrastruktur :
 data acquisition,
Tahap akuisisi adalah salah satu perubahan besar dalam infrastruktur pada hari-hari
sebelum big data. Karena big data mengacu pada aliran data dengan kecepatan yang
lebih tinggi dan ragam yang bervariasi, infrastruktur yang diperlukan untuk mendukung
akuisisi data yang besar harus disampaikan secara perlahan, dapat diprediksi baik di
dalam menangkap data dan dalam memprosesnya secara cepat dan sederhana, dapat
menangani volume transaksi yang sangat tinggi , sering dalam lingkungan terdistribusi,
dan dukungan yang fleksibel, struktur data dinamis.
Database NoSQL sering digunakan untuk mengambil dan menyimpan big data. Mereka
cocok untuk struktur data dinamis dan sangat terukur. Data yang disimpan dalam database
NoSQL biasanya dari berbagai variasi/ragam karena sistem dimaksudkan untuk hanya
menangkap semua data tanpa mengelompokkan dan parsing data.
Sebagai contoh, database NoSQL sering digunakan untuk mengumpulkan dan menyimpan
data media sosial. Ketika aplikasi yang digunakan pelanggan sering berubah, struktur
penyimpanan dibuat tetap sederhana. Alih-alih merancang skema dengan hubungan antar
entitas, struktur sederhana sering hanya berisi kunci utama untuk mengidentifikasi titik
data, dan kemudian wadah konten memegang data yang relevan. Struktur sederhana dan
dinamis ini memungkinkan perubahan berlangsung tanpa reorganisasi pada lapisan
penyimpanan
 data organization
Dalam istilah Data pergudangan klasik, pengorganisasian data disebut integrasi data.
Karena ada volume/jumlah data yang sangat besar, ada kecenderungan untuk mengatur
data pada lokasi penyimpanan aslinya, sehingga menghemat waktu dan uang dengan
tidak memindah-midahkan data dengen volume yang besar. Infrastruktur yang diperlukan
untuk mengatur data yang besar harus mampu mengolah dan memanipulasi data di lokasi
penyimpanan asli. Biasanya diproses didalam batch untuk memproses data yang besar,
beragam format, dari tidak terstruktur menjadi terstruktur.
Apache Hadoop adalah sebuah teknologi baru yang memungkinkan volume data yang
besar untuk diatur dan diproses sambil menjaga data pada cluster penyimpanan data asli.
Hadoop Distributed File System (HDFS) adalah sistem penyimpanan jangka panjang untuk
log web misalnya. Log web ini berubah menjadi perilaku browsing dengan menjalankan
program MapReduce di cluster dan menghasilkan hasil yang dikumpulkan di dalam cluster
yang sama. Hasil ini dikumpulkan kemudian dimuat ke dalam sistem DBMS relasional.
 data analysis
Karena data tidak selalu bergerak selama fase organisasi, analisis ini juga dapat dilakukan
dalam lingkungan terdistribusi, di mana beberapa data akan tinggal di mana data itu
awalnya disimpan dan diakses secara transparan dari sebuah data warehouse.
Infrastruktur yang diperlukan untuk menganalisis data yang besar harus mampu
mendukung analisis yang lebih dalam seperti analisis statistik dan data mining, pada data
dengan jenis yang beragam dan disimpan dalam sistem yang terpisah, memberikan waktu
respon lebih cepat didorong oleh perubahan perilaku; dan mengotomatisasi keputusan
berdasarkan model analitis. Yang paling penting, infrastruktur harus mampu
mengintegrasikan analisis pada kombinasi data yang besar dan data perusahaan
tradisional. Wawasan baru datang bukan hanya dari analisis data baru, tapi dari
menganalisisnya dalam konteks yang lama untuk memberikan perspektif baru tentang
masalah lama.
Misalnya, menganalisis data persediaan dari mesin penjual otomatis cerdas dalam
kombinasi dengan acara kalender untuk tempat di mana mesin penjual otomatis berada,
akan menentukan kombinasi produk yang optimal dan jadwal pengisian untuk mesin
penjual otomatis.

f) Tantangan dalam pemanfaatan Big Data


Dalam usaha pemanfaatan Big Data dapat terdapat banyak hambatan dan tantangan,
beberapa hal diantaranya berhubungan dengan data dimana melibatkan acquisition, sharing
dan privasi data, serta dalam analisis dan pengolahan data.
 Privasi
Privasi merupakan isu yang paling sensitif, dengan konseptual, hukum, dan teknologi,
Privasi dapat dipahami dalam arti luas sebagai usaha perusahaan untuk melindungi daya
saing dan konsumen mereka. Data-data yang digunakan / disimpan sebagai big data
 Access dan sharing
Akses terhadap data, baik data lama maupun data baru dapat menjadi hambatan dalam
mendapatkan data untuk big data, terlebih pada data lama dimana data- data tersimpan
dalam bentuk – bentuk yang berbeda-beda dan beragam ataupun dalam bentuk fisik, akses
terhadap data baru juga membutuhkan usaha yang lebih kerana diperlukannya izin dan
lisensi untuk mengakses data-data non-public secara legal.
 Analisis
Bekerja dengan sumber data baru membawa sejumlah tantangan analitis. relevansi dan
tingkat keparahan tantangan akan bervariasi tergantung pada jenis analisis sedang
dilakukan, dan pada jenis keputusan yang akhirnya akan bisa diinformasikan oleh data
tergantung dari jenis data terdapat 3 kategori dalam analisis data:
o Penentuan gambaran yang benar
Masalah ini biasanya ditemukan dalam penanganan unstructured user-generated text-
based data dimana data yang didapatkan belum tentu benar karena data atau sumber
yang salah.
o Interpreting Data
Kesalahan –kesalahan seperti Sampling selection bias merupakan hal yang sering
ditemukan dimana data yang ada tidak dapat digunakan untuk mepresentasikan semua
populasi yang ada, dan apophenia, melihat adanya pola walaupun tidak benar-benar
ada dikarenakan jumlah data yang besar, dan kesalahan dalam menginterpreasikan
hubungan dalam data.
o Defining and detecting anomalies
Tantangan sensitivitas terhadap spesifisitas pemantauansistem. Sensitivitas mengacu
pada kemampuan sistem pemantauan untuk mendeteksi semua kasus sudah diatur
untuk mendeteksi sementara spesifisitas mengacu pada kemampuannya untuk
mendeteksi hanya kasus-kasus yang relevan. kegagalan untukmencapai hasil yang
terakhir "Tipe I kesalahan keputusan", juga dikenal sebagai "positif palsu";
kegagalanuntuk mencapai mantan "Type II error", atau "negatif palsu." Kedua
kesalahan yang tidak diinginkan ketika mencoba untuk mendeteksi malfungsi atau
anomali, bagaimanapun didefinisikan, untuk berbagai alasan. Positif palsu merusak
kredibilitas sistem sementara negatif palsu dilemparkan ragu pada relevansinya. Tapi
apakah negatif palsu lebih atau kurang bermasalah daripada positif palsu tergantung
pada apa yang sedang dipantau, dan mengapa itu sedang dipantau
g) Tools yang digunakan
Terdapat beberapa tools yang digunakan terkait dengan penggunaan basis data skala besar.
Berikut beberapa tools yang dapat anda coba dan gunakan untuk kepentingan bisnis anda. 
1. Tableau
2. Xplenty
3. RapidMiner
4. Pentaho
5. Skytree
6. Looker
7. Domo
8. Knime 
9. Sisense 
10. Cassandra
Sebenarnya, masih banyak tools yang dapat anda gunakan untuk mengembangkan big data.
Apabila anda menginginkan penyimpanan yang lebih besar, teknologi cloud sangat kami
rekomendasikan. Contohnya, menggunakan software milik google seperti BigTable
berbasis cloud base.
h) Resume
 Big data adalah kumpulan dari proses yang terdiri dari volume data dengan kapasitas yang
besar dan dapat menampung data terstruktur dan tidak terstruktur. 
 Terdapat 3 definisi yang dapat merepresentasikan apa itu big data. Pertama adalah volume
(kapasitas), velocity (kecepatan), dan variety (variasi).
 Big data memiliki beberapa fungsi dan manfaat terkait dengan kebutuhan penyimpanan
data yang besar dengan proses pembacaan data lebih cepat dan efisien. Terdapat
beberapa tools yang dapat kami rekomendasikan untuk kebutuhan penunjang bisnis.
 Big data sudah mulai dimanfaatkan dan akan sangat berguna untuk dipahami lebih dalam
untuk mengimbangi perkembangan jaman ke arah teknologi dan analisis yang lebih
praktis.
i) Saran
- Mempelajari lebih dalam mengenai big data, karena hal ini akan sangat berguna bagi
perusahaan, dimana perusahaan jaman sekarang mulai mempelajari tren pasar dan pola
hidup konsumen.
- Dalam penerapannya, perusahaan akan membutuhkan orang yang khusus dalam bidang
data mining, karena hal ini cukup rumit dan diperlukan orang yang paham cara untuk
menggunakan data.
Data Science
a) Pengertian Data Science
Data science merupakan ilmu yang menggabungkan sebuah kemahiran di bidang ilmu tertentu
dengan keahlian pemrograman, matematika, dan statistik.
Tujuannya adalah untuk mengekstrak sebuah pengetahuan atau informasi dari data.
Biasanya, orang-orang yang mahir dalam bidang data science menggunakan
algoritma machine learning atau pemelajaran mesin.
Hal ini berguna dalam mengolah teks, gambar, video, audio, dan lain-lain untuk menghasilkan
sistem kecerdasan buatan.
Sistem kecerdasan buatan ini dapat dirancang untuk melakukan berbagai tugas yang terlalu
sulit untuk kecerdasan manusia.
Hasil data yang diolah sistem kecerdasan buatan akan dapat dimanfaatkan oleh analis dan
pengguna dalam bisnis untuk merancang strategi yang tepat untuk menyelesaikan suatu
masalah atau mencapai sebuah tujuan
b) Penggunaan Data Science
Data science atau ilmu data merupakan ilmu terapan baru yang perkembangannya dituntut
oleh meningkatnya penggunaan teknologi secara signifikan. Data science digunakan oleh
perusahaan maupun instansi tertentu untuk melakukan analisis data yang tidak bisa dilakukan
dengan metode sederhana. Misalkan marketplace Tokopedia memerlukan suatu pengetahuan
yang dapat melakukan analisis data penjual dan pembeli di platform mereka. Tentunya, data
yang mereka punyai setiap detiknya terus berubah atau bertambah. Sehingga diperlukan
suatu metode komputasi untuk mengambil data tersebut serta melakukan perhitungan yang
dapat menganalisis informasi pada data tersebut. Disinilah peran data science dalam
pemenuhan kebutuhan suatu perusahaan atau instansi
c) Disiplin Ilmu Data Science
Data science mencakup disiplin ilmu yang luas, berdasarkan diagram di atas terdapat 3 disiplin
ilmu yang fokus pada data science:
- Machine Learning
Machine learning merupakan irisan dari ilmu matematika dan statistika dengan ilmu
komputer. Machine Learning adalah cabang dari disiplin ilmu kecerdasan buatan (Artificial
Intelligence) yang bertujuan memberikan kemampuan kepada komputer untuk dapat
melakukan proses belajar. Banyak algoritma machine learning yang digunakan untuk
melakukan analisis data dengan tingkat akurasi yang tinggi, yang paling populer
adalah neural network. Dimana kita ketahui fundamental sebuah algoritma selalu
menggunakan ilmu matematika. Salah satu penerapannya adalah Cortana atau yang lebih
dikenal sebagai asisten dari pengguna Windows 10 merupakan salah satu penerapan
machine learning.
- Traditional Software
Traditional software merupakan irisan dari ilmu komputer dengan SME (Subject Matter
Expertise), SME adalah pengetahuan mengenai proses dari suatu bisnis atau instansi
untuk beroperasi sehingga dapat dibuat (develop) suatu sistem yang dapat membantu
bisnis atau instansi tersebut. Penerapan traditional software hampir digunakan oleh
seluruh instansi pemerintahan maupun bisnis, contohnya e-learning, e-library, online
banking, Point of Sales (PoS), dan lain-lain.
- Traditional Research
Traditional research merupakan irisan dari ilmu matematika dan statistika dengan
SME (Subject Matter Expertise). Traditional research hampir digunakan berbagai
perusahaan, instansi serta universitas. Penelitian-penelitian yang dilakukan umumnya
menggunakan traditional research.
Dari ketiga bidang ilmu tersebut, terbentuklah data science sebagai disiplin ilmu baru yang
dapat memenuhi kebutuhan analisis data menggunakan kecerdasan komputer.
d) Pilar Data Science
Data science bisa digunakan untuk berbagai ilmu. Namun, ada tiga pilar penting yang
mendukungnya, yaitu:
1. Bisnis
Seorang data scientist yang mengolah data berdasarkan ilmu data science harus bisa
mengolah data menjadi informasi yang bisa dipahami untuk membantu perancangan
strategi guna menyelesaikan masalah bisnis. Untuk bisa melakukan ini, keahlian data
science pun harus disertai pemahaman bisnis sehingga penyelesaian yang diusulkan
berdasarkan data mungkin untuk dilakukan sebuah bisnis untuk mencapai tujuannya.
2. Matematika dan statistika
Data science sangat membutuhkan ilmu matematika, karena data harus diolah secara
kuantitatif. Banyak permasalahan dalam bisnis yang dapat diselesaikan dengan membuat
model analitik dengan dasar matematika. Untuk membuatnya, dibutuhkan pemahaman
matematika yang mendalam. Contohnya, algoritma untuk merancang machine
learning sebagai salah satu aplikasi ilmu data science sangat lekat dengan matematika.
Statistik untuk data science adalah hal yang tak kalah penting. Tidak hanya mengerti
statistika klasik, seorang data scientist juga perlu memahami statistika Bayes.
3. Teknologi
Tentu saja, data science tidak bisa lepas dari teknologi dan kreativitas serta kecerdasan
dalam menggunakan keahlian teknis untuk menyelesaikan suatu permasalahan. Data
science adalah keilmuan yang menggunakan data dalam jumlah besar dan algoritma yang
rumit, sehingga butuh keahlian ilmu komputer yang mendalam. Seorang data
scientist perlu menguasai bahasa pemrograman seperti SQL, Phyton, R, SAS, Java,
Scala, Julia, dan masih banyak lagi. Seorang data scientist harus mampu berpikir layaknya
algoritma dalam memecahkan permasalahan yang paling sulit sekalipun.
e) Proses Data Science
Menurut Towards Data Science, menjelaskan proses data science adalah hal yang tidak
mudah. Namun, kira-kira prosesnya dapat dirangkum dalam lima poin OSEMN sebagai
berikut:
- Obtain
Langkah pertama untuk memulai sebuah proyek data science adalah obtain, yaitu
mendapatkan atau mengumpulkan data. Data dikumpulkan dari sumber-sumber data.
Kemudian digunakan kemampuan teknis seperti MySQL untuk memroses datanya. Jika
menggunakan Python atau R, kamu bisa langsung membaca data dari sumbernya secara
langsung ke program data science yang digunakan. Untuk mengambil data dari sumber,
dibutuhkan kemahiran bermacam-macam sesuai dengan tipe dan ukuran file yang
didapatkan.
- Scrub
Setelah data dikumpulkan, hal selanjutnya yang harus dilakukan dalam tahap proses data
science adalah scrubbing data. Scrubbing data adalah proses pembersihan atau filter data.
Jika ada data yang tidak penting atau tidak relevan, harus disingkirkan.
Pada tahap ini, dilakukan juga standardisasi format data. Dari format bermacam-macam di
tahap pertama, seluruh data dikonversi ke satu format yang sama. Setelah itu, jika ada
data yang kurang atau hilang, harus dilakukan penyesuaian agar dapat diproses.
Proses scrubbing juga meliputi penyatuan dan pemisahan kategori data tergantung
kebutuhan. Pada dasarnya, tahap scrubbing merupakan proses mengatur, merapikan
data, serta membuang apa pun yang tidak diperlukan, dan mengganti data yang hilang
serta menstandardisasi seluruh formatnya.
- Explore
Pada tahap ini, penggalian dan pemeriksaan data dilakukan. Pertama-tama, semua data
harus diperiksa propertinya, karena tipe data yang berbeda memerlukan perlakuan yang
berbeda pula. Kemudian, statistik deskriptif harus dihitung untuk dapat mengekstrak fitur
dan menguji variabel yang signifikan. Terakhir, visualisasi data digunakan untuk
mengidentifikasi pola dan tren signifikan dalam data yang sudah kamu dapatkan. Dengan
begitu, bisa diperoleh gambaran yang lebih jelas dengan grafik agar pentingnya data dapat
lebih dipahami.
- Model
Setelah memastikan tahap scrub dan explore sudah dilakukan maksimal, maka kamu
dapat lanjut ke tahap data science selanjutnya, yaitu model. Pada tahap ini, dibuat model
data untuk mencapai tujuan yang diinginkan. Pada tahap ini, digunakan regresi dan
prediksi untuk memperkirakan nilai di waktu mendatang serta melakukan klasifikasi dan
pengelompokan grup nilai dari data.
- Interpretasi
Tahap terakhir dalam proses data science adalah interpretasi data. Interpretasi data
adalah proses penting di mana dilakukan interpretasi model dan data. Output dari
pengolahan data yang diinterpretasi harus bisa dipahami oleh orang-orang awam yang
tidak mengerti istilah teknis. Presentasinya bertujuan untuk menjawab persoalan bisnis
berdasarkan data yang diperoleh. Pada tahap interpretasi data, kemampuan komunikasi
yang baik juga sangat dibutuhkan untuk menyampaikan poin-poin pentingnya secara
efektif pada semua orang yang berkepentingan.
f) Penerapan Data Science
Sejatinya, data science adalah bidang yang bertujuan untuk memberikan insight signifikan
dalam ketersediaan data yang banyak. Ia biasanya terhubung pada berbagai bidang
pekerjaan, dengan tujuan untuk melakukan proses perhitungan dan penerjemahan akan data
yang hendak disaring.
Maka dari itu, ilmu satu ini dapat ditemukan penerapannya pada berbagai sektor industri, mulai
dari bidang kesehatan hingga e-commerce untuk keperluan bisnis. Nah, memangnya seperti
apa contoh penerapan data science dalam era modern ini? Berikut adalah daftar dan
pemaparannya.
- Bidang Kesehatan
Salah satu contoh penerapan terbesar data science adalah pada sektor industri kesehatan.
Bahkan, menurut laman Built In, ilmu data science pertama kali dikenalkan pada dunia
lewat industri kesehatan pada tahun 2008. Pada tahun tersebut, Google menemukan
bahwa mereka dapat memetakan wabah flu secara real time dengan melacak data lokasi
pada pencarian terkait flu. Peta dari CDC (Centers for Disease Control and Prevention)
yang ada dari kasus flu yang didokumentasikan, FluView, diperbarui hanya sekali
seminggu. Hasilnya, Google dengan cepat meluncurkan alat pesaing dengan pembaruan
berita yang lebih up-to-date, yakni Google Flu Trends.
- Bidang finansial
Contoh penerapan data science berikutnya adalah untuk keperluan fraud detection pada
bidang finansial. Kebanyakan bank dan perusahaan berbasis finance kini
menggunakan data science untuk mengklasifikasikan, mengelompokkan, dan
menyegmentasikan data yang mungkin menandakan pola penipuan. Hal ini diperlukan
guna menghindari terjadinya proses kriminalisasi berkelanjutan di dalam sistem milik
perusahaan. Sistem pakar dalam perusahaan finansial juga bisa mengkodekan data yang
mampu mendeteksi penipuan dalam bentuk-bentuk yang tak terduga.
- Bidang olahraga professional
Siapa sangkah bahwa ternyata data science memiliki imbas yang cukup besar bagi dunia
olahraga profesional. Ya, ilmu satu ini ternyata sering digunakan untuk keperluan
rekrutmen pemain muda yang berpotensi menjadi bintang. Salah satu contoh
penerapannya adalah pada tim baseball Oakland Athletics. Mereka menggunakan statistik
dalam gim yang sering diabaikan tim lain untuk memprediksi potensi pemain dan
membentuk tim yang kuat dengan harga murah.
- Bidang e-commerce
Contoh terakhir penerapan data science adalah pada bidang e-commerce untuk berbagai
keperluan dynamic pricing. Penetapan harga ini dibentuk oleh suatu perusahaan e-
commerce untuk menyegmentasikan pelanggan atau konsumen secara tepat. Dynamic
pricing ini juga diperlukan agar setiap kelompok pelanggan dapat ditawari produk dengan
harga yang sesuai dengan kebutuhan mereka. Penghitungan dynamic pricing pada suatu
perusahaan biasanya melihat dari berbagai macam kategori data, seperti lead
time, review properti, dan fasilitas yang disediakan produk.
g) Rangkuman
1. Data science merupakan ilmu yang menggabungkan sebuah kemahiran di bidang ilmu
tertentu dengan keahlian pemrograman, matematika, dan statistik. Tujuannya adalah untuk
mengekstrak sebuah pengetahuan atau informasi dari data.
2. Disiplin ilmu dari data science terbagi menjadi 3 yaitu, machine learning, traditional
software dan traditional research
3. Tiga pilar dari data science adalah, bisnis, matematika dan statistika, dan teknologi.
4. Tahapan-tahapan proses data science dapat dikatakan sebagai lima poin OSMEN yaitu,
Obtain, Scrub, Model dan Interpretasi
Hubungan Big Data dengan Data Science
Big data sangat diperlukan dalam pengolahan data yang mana tujuannya untuk menghasilkan
informasi untuk perusahaan maupun personal. Untuk mengolah big data ini diperlukanlah data
science.
- Pengenalan Cloud Computing
a) Pengertian
Cloud computing adalah konsep komputasi berbasis internet. Jadi, dengan cloud computing,
Anda bisa melakukan pekerjaan layaknya menggunakan komputer seperti menyimpan,
mengakses, dan mengolah data dengan mudah. Bedanya, pada cloud computing, perangkat
komputasinya adalah server yang bisa Anda akses di mana saja selama ada jaringan internet.
Saat ini, konsep komputasi awan ini makin sering digunakan seiring kebutuhan pengguna
untuk melakukan pekerjaan secara online. Contoh cloud computing yang umum digunakan
adalah layanan penyimpanan file seperti Google Drive atau aplikasi pengolah kata seperti
Google Docs. Kedua layanan tersebut memungkinkan Anda untuk menyimpan dan
mengakses data melalui internet. Tak hanya untuk penggunaan umum, komputasi cloud juga
bisa digunakan secara khusus oleh perusahaan dan organisasi untuk kebutuhan internal.
Misalnya, untuk menyimpan dan mengolah data perusahaan yang biasanya mengandalkan
sebuah data center, baik dikelola sendiri atau menyewa dari layanan pihak ketiga.
b) Tipe Cloud Computing
- Software-as-a-Service (SaaS)
Seperti namanya, SaaS adalah layanan cloud computing yang menyediakan aplikasi siap
pakai. Sebab, pengguna SaaS tidak perlu menginstal aplikasi di perangkatnya. Selain itu,
pengguna tidak dipusingkan dengan update karena developer penyedia layanan-lah yang
melakukannya.
Salah satu contoh SaaS adalah Office 365 yang menawarkan aplikasi-aplikasi Microsoft
Office yang bisa diakses melalui browser. Bayangkan, Anda menggunakan Microsoft
Word, tetapi dokumennya otomatis tersimpan di akun Anda. Jadi, dokumen tersebut bisa
diakses di perangkat apapun asal Anda log in ke akun.
- Infrastructure-as-a-Service (IaaS)
Berbeda dengan SaaS yang berupa aplikasi siap pakai, IaaS merupakan rangkaian
sumber daya komputasi atau server. Server IaaS tersedia dalam spesifikasi yang berbeda-
beda, jadi pengguna bisa memilih yang sesuai kebutuhannya. Umumnya, pengguna juga
boleh memilih sistem operasi dan jenis virtualisasi untuk server mereka.Tanpa IaaS,
pengguna harus membuat server sendiri. Ini tentunya mahal dan repot, terutama saat
pengguna perlu menambah sumber daya untuk servernya.
Nah, karena fleksibilitas dan sumber daya yang ditawarkan IaaS, umumnya layanan
tersebut ditujukan kepada perusahaan. Contoh penyedia layanan ini adalah Amazon Web
Service dan Microsoft Azure.
- Platform-as-a-Service (PaaS)
Jenis cloud computing ini menyediakan platform bagi developer untuk menciptakan dan
mengujicoba aplikasi secara online. Sumber daya dan sistem operasi platform dikelola
oleh penyedia, sehingga developer tidak perlu memusingkan perangkat untuk pekerjaan
mereka.
c) Fungsi Cloud Computing
Berikut ini adalah contoh fungsi dari cloud computing antara lain:
1. Menawarkan Kemudahan Skalabilitas
Bayangkan ketika Anda butuh kapasitas penyimpanan yang lebih besar. Jika
menggunakan komputer atau server pribadi, Anda harus mengganti atau menambah
komponen penyimpanannya sendiri, bukan? Dengan cloud computing, menambah
penyimpanan atau meningkatkan kemampuan komputasi lainnya lebih praktis. Anda
tinggal memilih paket layanan dengan spesifikasi yang lebih tinggi sesuai penyedia
layanan cloud computing yang Anda gunakan.
2. Memudahkan Akses Data
Pernahkah Anda harus presentasi, tetapi flashdisk yang menyimpan file Anda tertinggal?
Masalah seperti itu tidak akan terjadi apabila Anda menggunakan cloud computing.
Layanan komputasi cloud memungkinkan Anda untuk menyimpan dan mengakses file
secara online. Dengan demikian, file-file Anda selalu tersedia asal Anda terhubung dengan
internet.
3. Memudahkan Kolaborasi
Dengan kemudahan akses data, kolaborasi dalam menyelesaikan sebuah pekerjaan juga
menjadi gampang. Sebagai contoh, ketika menggunakan Google Sheets, Anda dan rekan
kerja bisa membuat dan mengedit sebuah dokumen yang sama di lokasi yang berbeda.
Jadi, lebih mendukung untuk Anda yang sedang bekerja dari rumah (WFH), kan? Bahkan,
perubahan pada dokumen tersebut otomatis tersimpan dan bisa dilihat secara langsung
(real time), jadi rekan Anda selalu mendapatkan versi terkini saat itu juga.
Kalau menggunakan aplikasi di komputer, pekerjaan Anda dan rekan tidak sepraktis itu.
Rekan Anda harus meminta dokumen yang Anda buat atau bekerja di satu tempat yang
sama untuk mendapatkan versi terbarunya.
4. Menyediakan Sarana yang Selalu Up to Date
Hardware dan software terbaru umumnya menawarkan kemampuan yang lebih baik.
Sebagai contoh, prosesor terbaru, tentu akan memiliki performa yang lebih cepat dan
efisien dari pendahulunya. Sayangnya, memperbarui hardware dan software tidak murah.
Selain itu, Anda perlu menyisihkan waktu untuk instalasinya. Beda halnya jika Anda
menggunakan cloud computing. Penyedia layanan komputasi cloud selalu memperbarui
semua sarananya agar pengguna mendapatkan manfaat maksimal.
d) Cara Kerja Cloud Computing
Setiap varian cloud computing memiliki dua faktor yang sama secara umum, yakni data center
yang berada di luar dan harus memiliki internet untuk mengaksesnya. Sumber daya server
dalam data center ini dikumpulkan untuk membuat platform yang sangat besar agar siap
menampung layanan virtual.
Sumber daya yang dikumpulkan ini diatur agar bisa fleksibel, sehingga para penggunanya bisa
mengakses lebih banyak ruang penyimpanan jika diperlukan. Demikian pula dengan sumber
daya yang sedang tidak digunakan, ini akan dilepas kembali ke cloud jika memang sudah tidak
lagi dibutuhkan. Penggunaan sumber daya berbasis on-demand ini menawarkan skalabilitas
dan fleksibilitas yang hampir tidak terbatas. Pasalnya, kebutuhan Anda akan cloud
computing senantiasa berubah atau dinamis
e) Keuntungan Menggunakan Cloud Computing
1. Hemat Biaya, Ruang, dan Waktu Biaya yang harus Anda keluarkan untuk membuat
infrastruktur dan mengelolanya sendiri cukup mahal. Belum lagi, Anda harus menyediakan
tempat yang memadai untuk perangkat yang digunakan. Kalau menggunakan cloud
computing, Anda bisa menghemat biaya, ruang, dan waktu. Dari segi biaya, misalnya, alih-
alih harus membeli semua komponen infrastruktur, Anda tinggal membayar biaya bulanan
yang jauh lebih murah. Belum lagi, Anda harus memiliki seorang yang khusus bertugas
mengelola komponen tersebut agar mampu bekerja optimal. Selain itu, Anda tidak perlu
menyiapkan tempat untuk membangun infrastruktur jika menggunakan komputasi cloud.
Sebab, infrastrukturnya dikelola oleh penyedia layanan. Proses untuk membangun dan
mengelola infrastruktur komputasi juga membutuhkan waktu yang tidak sedikit. Apalagi,
kalau Anda belum memiliki pengalaman yang baik.
2. Skalabilitas Mudah Seiring berkembangnya bisnis, data yang Anda gunakan akan
bertambah banyak. Misalnya akun pelanggan dan data transaksi. Dengan begitu,
kapasitas komputasi Anda juga harus ditingkatkan. Apabila menggunakan infrastruktur
sendiri, Anda yang harus menambah atau mengganti komponen. Hal itu tidak hanya
merepotkan, tetapi juga mahal. Beda halnya kalau Anda menggunakan layanan cloud
computing. Skalabilitasnya lebih mudah karena Anda tinggal upgrade layanan sesuai
kebutuhan. Misalnya, Anda bisa menambah kapasitas penyimpanan atau upgrade ke
layanan yang lebih cepat.
3. Akses ke Teknologi Terbaru Bayangkan jika ada hardware atau software terbaru yang
Anda butuhkan, tetapi Anda belum bisa membelinya. Atau, software Anda perlu diperbarui
untuk bisa melayani pelanggan dengan lebih baik, tetapi spesifikasi server Anda tidak
sesuai. Kendala seperti itu tidak akan terjadi apabila Anda menggunakan cloud computing.
Sebab, penyedia layanan senantiasa memperbarui hardware dan software-nya.
4. Memungkinkan Kolaborasi dari Manapu Karena tinggal diakses secara online, layanan
cloud computing memungkinkan Anda untuk bekerja dari manapun. Manfaat ini semakin
terasa jika Anda bekerja dalam tim. Masing-masing anggota tim jadi tidak perlu berada di
satu tempat untuk untuk berkolaborasi.
5. Backup Data Lebih Mudah Kebanyakan layanan komputasi cloud dilengkapi dengan fitur
backup otomatis. Dengan ini Anda, jadi tidak perlu mengingatkan diri atau anggota tim
untuk melakukan tugas tersebut. Data yang di-backup pun selalu tersedia untuk Anda
gunakan.
f) Kendala dalam penggunaan Cloud Computing
Ada beberapa tantangan yang masih dihadapi dalam penggunaan cloud computing, yaitu:
1. Harus Selalu Terhubung ke Internet Internet adalah sarana utama dalam layanan cloud
computing. Jadi, kalau koneksi internet Anda buruk, Anda tidak bisa menggunakan
teknologi tersebut dengan optimal. Apalagi, kalau penyedia layanan internet mengalami
gangguan (downtime).
2. Kendala Saat Downtime, Downtime juga bisa terjadi pada penyedia layanan komputasi
cloud yang Anda gunakan. Akibatnya, layanan tidak dapat diakses. Hal ini adalah masalah
besar jika bisnis Anda bergantung pada layanan tersebut. Agar kendala ini tidak terjadi
pada Anda, pilihlah penyedia layanan cloud computing yang jarang mengalami downtime.
Hal itu bisa dilihat dari komitmen untuk menyediakan uptime yang tinggi. Contohnya
adalah Niagahoster yang menawarkan hosting dengan uptime 99,98%.
3. Ancaman Keamanan Data Cloud computing memungkinkan Anda untuk mengakses data
secara online. Oleh karena itu, memilih penyedia layanan yang keamanannya baik
merupakan keharusan. Layanan komputasi cloud yang tidak memperhatikan keamanan
data pengguna sangat rawan terhadap berbagai ancaman. Jika hacker bisa mengakses
server layanan tersebut, data Anda bisa bocor atau bahkan dihapus.
4. Kesulitan Migrasi Data Memindahkan data dari layanan cloud computing bukan hal yang
mudah. Apalagi jika penyedia layanan belum mendukung hal tersebut. Sebagai solusinya,
Anda bisa melakukan migrasi secara manual. Namun, tindakan ini penuh risiko. Ketika
ingin memindahkan website ke layanan hosting yang berbeda, misalnya, data bisa hilang
atau rusak
g) Resume
Cloud Computing Merupakan layanan penyimpanan data secara Online di Storage Server,
atau dengan kata lain data kita akan disimpan pada database (storage) milik server online.
Manfaat Cloud Computing:
- Pengguna  atau user  bebas dalam berkreasi  dan  tidak  perlu menyediakan infrastruktur
(data center, processing power, storage, sampai ke aplikasidesktop) untuk dapat memiliki
sebuah sistem, karena semua sistemnya  sudah disediakan secara virtual.
- Dengan Cloud computing, mereka (perusahaan/organisasi) hanya menyewa layanan atau
jasa dari penyedia Cloud computing.
- Investasi suatu peruahaan atau lembaga akan lebih mudah untuk dikelolah.
- Cloud computing memberikan solusi bagi perusahaan untuk meringankan operasional
perusahaan tersebut dalam hal pengolahan data.
- Cloud Computing (komputasi awan) akan memberikan dampak lebih ekonomis dan sumber
daya IT yang digunakan lebih efisien, saat aplikasi bisnis dioperasikan dalamsuatu lingkungan.
DenganCloud Kemampuan untuk menangani tugas-tugas penting, dapat dilakukan lebih
efisien oleh karena dilakukan oleh pihak ketiga.
Karakteristik Cloud Computing:
On-Demand Self-Services: harus dapat dimanfaatkan oleh pengguna melalui mekanisme
swalayan dan langsung tersedia pada saat dibutuhkan.
Broad Network Access harus dapat diakses dari mana saja, kapan saja, dengan alat apa pun,
asalkan kita terhubung ke jaringan layanan.
Resource Pooling: Harus tersedia secara terpusat dan dapat membagi sumber daya secara
efisien.
Rapid Elasticity: Harus dapat menaikkan atau menurunkan kapasitas sesuai kebutuhan.
Measured: Harus disediakan secara terukur, karena nantinya akan digunakan dalam proses
pembayaran.
Aspek Keamanan dan Komunikasi: Manajemen Resiko dan Ketaatan, Manajemen Akses dan
Identitas, Integritas Layanan, Integritas client, Proteksi Informasi
Kelebihan Cloud Computing: Kemudahan Akses, Fleksibilitas, Penghematan (Tanpa investasi
awal), Mengubah CAPEX (Capital Expenditure) Menjadi OPEX (Operational Expenditure),
Lentur dan Mudah Dikembangkan (Rapid Elasticity), Fokus pada bisnis bukan pada TI.
Kekurangan Cloud Computing: Komputer akan menjadi lambat atau tidak bisa dipakai sama
sekali jika internet bermasalah atau kelebihan beban. Dan juga perusahaan yang menyewa
layanan dari cloud computing tidak punya akses langsung ke sumber daya. Jadi, semua
tergantung dari kondisi vendor/penyedia layanan cloud storage. Jika server vendor rusak atau
punya layanan back up yang buruk, maka perusahaan akan mengalami kerugian besar.
- Metodologi dan Design Thingking Data Science
a) Pengertian Metodologi dan Design Thinking Data Science
Metodologi data science 
Metodologi data science adalah langkah-langkah digunakan dalam proyek data science agar
dapat menghasilkan hasil yang optimal yang dapat menjawab pertanyaan dari suatu masalah
yang ingin diselesaikan. Metodologi ini tidak bergantung pada teknologi atau tools tertentu.
Metodologi data science yang dibahas disini adalah metode CRISP-DM yang dikemukakan
oleh John Rollins yang merupakan seorang senior Data Scientist di IBM. Gambar di bawah ini
merupakan 10 tahapan metodologi data science dengan metode CRISP-DM.
Design Thinking
Design thinking adalah proses berulang dimana kita berusaha memahami pengguna,
menantang asumsi, dan mendefinisikan kembali masalah dalam upaya mengidentifikasi
strategi dan solusi alternatif yang mungkin tidak langsung terlihat dengan tingkat awal
pemahaman kita. Pada saat yang sama, Design Thinking menyediakan pendekatan berbasis
solusi untuk menyelesaikan masalah. Ini adalah cara berpikir dan bekerja serta kumpulan
metode langsung.
Design Thinking berputar di sekitar minat yang mendalam dalam mengembangkan
pemahaman dari orang-orang yang menjadi tujuan perancangan produk atau layanan. Hal ini
membantu kita mengamati dan mengembangkan empati dengan target pengguna. Design
Thinking membantu kita dalam proses bertanya: mempertanyakan masalah, mempertanyakan
asumsi, dan mempertanyakan keterkaitannya. Design Thinking sangat berguna dalam
mengatasi masalah-masalah yang tidak jelas atau tidak dikenal, dengan
melakukan reframing masalah dengan cara-cara yang berpusat pada manusia, menciptakan
banyak ide dalam brainstorming, dan mengadopsi pendekatan langsung dalam
pembuatan prototype dan testing. Design Thinking juga melibatkan eksperimen yang sedang
berjalan: membuat sketsa, membuat prototype, testing, dan mencoba berbagai konsep dan
ide.
Design thinking meliputi proses-proses seperti analisis konteks, penemuan dan pembingkaian
masalah, pembuatan ide dan solusi, berpikir kreatif, membuat sketsa dan menggambar,
membuat model dan membuat prototipe, menguji dan mengevaluasi.
b) Tahapan dalam Proses Metodologi dan Design Thinking Data Science
1. Empathis
Tahap pertama dari proses Design Thinking adalah untuk mendapatkan pemahaman
empatik tentang masalah yang dicoba untuk diselesaikan. Ini melibatkan para ahli
konsultasi untuk mencari tahu lebih banyak tentang bidang yang menjadi perhatian melalui
pengamatan, keterlibatan, dan empati dengan orang-orang untuk memahami pengalaman
dan motivasi mereka sehingga memperoleh pemahaman pribadi yang lebih jelas tentang
masalah yang terlibat. Empati sangat penting untuk proses desain yang berpusat pada
manusia seperti Design Thinking, dan empati memungkinkan pemikir desain untuk
mengesampingkan asumsi mereka sendiri tentang dunia untuk mendapatkan wawasan
tentang pengguna dan kebutuhan mereka.
2. Define
Selama tahap Define, kita mengumpulkan informasi yang telah kita buat dan kumpulkan
selama tahap Empathise. Disinilah kita akan menganalisis pengamatan dan
mensistesisnya untuk menentukan masalah inti yang telah diidentifikasi. Kita harus
berusaha menidentifikasi masalah sebagai pernyataan masalah dengan cara yang
berpusat pada manusia.
Sebagai ilustrasi, alih-alih mengidentifikasi masalah sebagai keinginan atau kebutuhan
perusahaan seperti, “Kita perlu meningkatkan pangsa pasar produk makanan diantara
remaja perempuan sebesar 5%,” cara yang lebih baik untuk mendafinisikan masalah
adalah jadilah, “Gadis remaja perlu makan makanan bergizi agar dapat berkembang,
menjadi sehat dan tumbuh.”
Tahap Define akan membantu para desainer dalam sebuah tim untuk mengumpulkan ide-
ide hebat untuk membangun fitur, fungsi, dan elemen lain yang akan memungkinkan
mereka untuk menyelesaikan masalah atau, paling tidak, memungkinkan pengguna untuk
menyelesaikan masalah sendiri dengan tingkat kesulitan minimal.
3. Ideate
Selama tahap ketiga dari proses Design Thinking, desainer siap untuk mulai menghasilkan
ide. Kita telah tumbuh untuk memahami pengguna dan kebutuhan mereka di
tahap Empathize, dan kita telah menganalisis dan mensistesis pengamatan Anda di
tahap Define, dan berakhir dengan pernyataan masalah yang berpusat pada manusia.
Dengan latar belakang yang kuat, kita dan anggota tim dapat mulai “berpikir di luar kotak”
untuk mengidentifikasi solusi baru untuk pernyataan masalah yang dibuat, dan kita dapat
mulai mencari cara alternatif untuk melihat masalah.
Ada ratusan teknik Ideation seperti Brainstorm, Brainwrite, Worst Possible Idea, dan
SCRAMPER. Sesi Brainstorm dan Worst Possible Idea biasanya digunakan untuk
merangsang pemikiran bebas dan untuk memperluas ruang masalah. Penting untuk
mendapatkan sebanyak mungkin ide atau solusi masalah. Kita harus memilih beberapa
teknik Ideation lainnya pada akhir fase Ideation untuk membantu kita menyelidiki dan
menguji ide-ide kita sehingga kita dapat menemukan cara terbaik untuk memecahkan
masalah atau menyediakan elemen-elemen yang diperlukan untuk menghindarinya.
4. Prototype
Tim desain akan menghasilkan sejumlah versi produk yang murah dan diperkecil atau fitur
spesifik yang ditemukan dalam produk, sehingga mereka dapat menyelidiki solusi masalah
yang dihasilkan pada tahap sebelumnya. Prototype dapat dibagikan dan diuji dalam tim itu
sendiri, di departemen lain, atau pada sekelompok kecil orang diluar tim desain. Ini adalah
fase eksperimental, dan tujuannya adalah untuk mengidentifikasi solusi terbaik untuk
setiap masalah yang diidentifikasi selama tiga tahap pertama. Solusi diimplementasikan
dalam prototype, dan satu per satu, mereka diselidiki dan diterima, diperbaiki dan diperiksa
ulang, dan ditolak berdasarkan pengalaman pengguna.
Pada akhir tahap ini, tim desain akan memiliki gagasan yang lebih baik tentang kendala
yang melekat pada produk dan masalah yang ada, dan memiliki pandangan yang lebih
jelas tentang bagaimana pengguna yang sebenarnya akan berperilaku, berpikir, dan
rasakan ketika berinteraksi dengan bagian akhir produk.
5. Test
Desainer menguji produk lengkap secara ketat menggunakan solusi terbaik yang
diidentifikasi selama fase prototyping. Ini adalah tahap akhir dari design thinking, tetapi
dalam proses berulang, hasil yang dihasilkan selama fase testing sering digunakan untuk
mendefinikan kembali satu atau lebih masalah dan menginformasi pemahaman pengguna,
kondisi penggunaan, bagaimana orang berpikir, berperilaku, dan merasakan, dan
berempati. Bahkan selama fase ini, perubahan dan penyempurnaan dilakukan untuk
menyingkirkan solusi masalah dan memperoleh pemahaman sedalam mungkin terhadap
produk dan penggunanya.

c) Elemen-Elemen dalam Design Thinking:


1. Fokus pada Pengguna (User-Centered) Fokus pada pengguna adalah keharusan dalam
melakukan design thinking. Artinya, apapun solusi harus berpusat pada kebutuhan
pengguna. Khususnya untuk menyelesaikan masalah mereka.
2. Iteratif (Iterative) Berikutnya, iteratif atau membutuhkan proses berulang. Design thinking
menuntut untuk melakukan proses berulang dalam berinovasi sampai mendapatkan solusi
paling optimal.
3. Kreativitas Tinggi (Highly Creative) Dalam design thinking, bebas mengembangkan
kreativitas untuk menghasilkan solusi terbaik. Tapi jangan lupa, setiap ide kreatif Anda
harus menerapkan elemen-elemen dalam design thinking.
4. Langsung (Hands On) Tidak hanya teori atau sketsa saja, design thinking mengharuskan
Anda melakukan pengujian ide produk secara langsung. Jadi, konsep produk Anda benar-
benar diluncurkan ke calon pengguna untuk melihat bagaimana efektivitasnya. Dengan
mengadopsi design thinking, Anda mampu memahami kebutuhan calon konsumen dan
menciptakan solusi yang efektif.
d) Manfaat Design Thinking:
- Memudahkan perusahaan memahami kebutuhan calon konsumen;
- Meningkatkan efisiensi proses desain;
- Membantu menciptakan inovasi baru yang berkelanjutan;
- Mengurangi risiko kegagalan produk;
- Menghemat anggaran perusahaan;
e) Penerapan Metodologi dan Design Thinking Data Science
Contoh Design Thinking yang diterapkan dalam skala besar dapat dilihat di Estonia, negara
pasca-Soviet. Proyek Estonia dikenal sebagai e-Estonia, sebuah rencana revolusioner yang
berpotensi untuk mengubah negara dari negara tradisional menjadi masyarakat digital masa
depan. Apa yang ingin dilakukan e-Estonia adalah menghubungkan semua untaian negara –
baik itu pemungutan suara, layanan kesehatan, pajak, pendidikan, kepolisian dan sebagainya
– pada satu platform. Hal ini akan merampingkan aspek besar kehidupan orang. Misalnya,
menghilangkan kebutuhan untuk mengisi formulir yang tak terhitung jumlahnya sehingga satu
lembaga-katakanlah, bank – dapat mengakses informasi Anda dari yang lain – seperti kantor
pajak. Pada dasarnya, semua proses birokrasi dapat diselesaikan secara online,
memungkinkan warga negara untuk menjalani hidup mereka tanpa repot. Bayangkan bisa
menghabiskan waktu berharga bersama teman atau keluarga alih-alih pergi ke TPS?
f) Resume
Metodologi data science adalah langkah-langkah digunakan dalam proyek data science agar
dapat menghasilkan hasil yang optimal yang dapat menjawab pertanyaan dari suatu masalah
yang ingin diselesaikan. Metodologi ini tidak bergantung pada teknologi atau tools.
Design Thinking adalah proses berulang dimana kita berusaha memahami pengguna,
menantang asumsi, dan mendefinisikan kembali masalah dalam upaya mengidentifikasi
strategi dan solusi alternatif yang mungkin tidak langsung terlihat dengan tingkat awal
pemahaman kita
Tahapan dalam proses Metodologi dan Design Thinking Data Science terbagi menjadi 5 tahap
yaitu, empathis, define, ideate, prototype dan test
Inti dari design thinking meliputi kemampuan untuk:
 Menyelesaikan masalah yang rumit.
 Mengubah strategi menjadi solusi.
 Menggunakan nalar abduktif dan produktif.
 Menggunakan media pemodelan non-verbal, grafik atau spasial, misalnya, membuat sketsa
dan membuat purwarupa.
- Tools Data Science
a. Pengertian Tools dalam Data Science
Sebelumnya kita telah sama-sama belajar mengenai pengertian data science yang ternyata
memiliki memiliki empat pondasi teknis yang rumit. Yang artinya, tools-tools yang digunakan
untuk pengimplementasiannya pun bervariasi dan cukup banyak pula. Selain itu setiap
perusahaan dan setiap kebutuhan menggunakan tools-tools yang berbeda-beda pula.
Misalnya untuk data store biasanya menggunakan mongoDB, SQL, dan Postgresql, lalu untuk
keperluan mentransformasi data biasanya menggunakan SQL, Python dan Spark. Untuk
membuat pemodelan biasanya menggunakan scikit learn, tensorflow, spark, dan pandas.
Kemudian tools untuk memvisualisasikan data berbeda lagi banyak developer yang
menggunakan ggplot2, matplotlib, tableau, dan powerBI. Selain tools-tools di atas, microsoft
excel juga cukup powerful untuk melakukan pengolahan data skala menengah dan sekaligus
memvisualisasikannya dalam bentuk chart atau grafik yang interaktif.
b. Jenis-Jenis Tools dalam Data Science
1. Algorithms.io.
Tools ini adalah resource dari machine-learning (ML) yang mengambil data mentah dan
membentuknya menjadi pengetahuan secara real-time dan peristiwa yang dapat
ditindaklanjuti, terutama dalam konteks machine learning. Keuntungan:
- Tools ini tersedia di platform cloud, sehingga memiliki semua kelebihan SaaS dari
skalabilitas, keamanan, dan infrastruktur
- Membuat machine learning sederhana dan dapat diakses oleh pengembang dan
perusahaan.
2. Apache Hadoop
Kerangka kerja yang bersifat open source ini menciptakan model pemrograman sederhana
dan mendistribusikan pemrosesan kumpulan data yang luas di ribuan kluster komputer.
Hadoop bekerja sama baiknya untuk tujuan penelitian dan produksi. Hadoop sangat cocok
untuk komputasi tingkat tinggi. Keuntungan:
- Bersifat Open-source
- Sangat terukur
- Tools ini memiliki banyak modul yang tersedia
- Kegagalan dapat ditangani pada lapisan aplikasi
3. Apache Spark
Juga disebut “Spark,” tools ini adalah mesin analisa yang sangat kuat dan memiliki
perbedaan sehingga menjadi tools data science yang paling banyak digunakan. Tools oni
dikenal karena menawarkan komputasi klaster dengan kecepatan tinggi. Spark mengakses
berbagai sumber data seperti Cassandra, HDFS, HBase, dan S3. Tools ini juga dapat
dengan mudah menangani set data yang besar. Keuntungan:
- Lebih dari 80 operator tingkat tinggi menyederhanakan proses pembuatan aplikasi
parallel
- Dapat digunakan secara interaktif dari Scale, Python dan R
- Mesin eksekusi DAG tingkat lanjut mendukung komputasi dalam memori dan aliran
data acyclic
4. BigML
Tools ini adalah salah satu tools terbaik data science lainnya yang menyediakan hubungan
antara pengguna dengan lingkungan GUI berbasis cloud sehingga dapat berinteraksi
sepenuhnya dan ideal untuk memproses algoritme ML. Kita dapat membuat akun gratis
atau premium tergantung pada kebutuhan Kita, dan interface web yang mudah digunakan.
Keuntungan:
- Sumber daya yang terjangkau untuk membangun solusi machine learning yang
kompleks
- Mengambil pola data prediktif dan mengubahnya menjadi aplikasi cerdas dan praktis
yang dapat digunakan oleh siapa saja
- Tools ini dapat berjalan di cloud atau on premise
5. D3.js
D3.js adalah library JavaScript yang bersifat open-source sehingga memungkinkan Kita
untuk membuat visualisasi interaktif di browser web Kita. Tools ini menekankan standar
versi web untuk mengambil keuntungan secara penuh dari semua fitur yang tersedia di
browser modern, tanpa terganggu dengan kerangka kerja yang rumit. Keuntungan :
- D3.js berbasis pada JavaScript yang sangat populer saat ini

- Ideal untuk interaksi Internet of Things (IoT) sisi klien

- Berguna untuk membuat visualisasi interaktif


6. Data Robot
Tools ini digambarkan sebagai platform yang canggih untuk otomatiasi machine learning.
Data scientist, eksekutif, profesional IT, dan engineer perangkat lunak menggunakannya
untuk membantu mereka membangun model prediktif dengan kualitas yang lebih baik
serta dapat melakukannya lebih cepat. Keuntungan :
- Hanya dengan satu klik atau baris kode, Kita dapat melatih, menguji, dan
membandingkan banyak model yang berbeda
- Tools ini tersedia untuk fitur pengembangan Python SDK dan API

- Muncul dengan proses model deployment yang sederhana


7. Excel
Excel sampai saat ini masih menjadi salah satu tools terpopuler data science. Awalnya
dikembangkan oleh Microsoft untuk perhitungan spreadsheet namun telah digunakan
secara luas sebagai alat untuk pemrosesan data, visualisasi, dan perhitungan yang
canggih. Keuntungan :
- Kita bisa mengurutkan dan memfilter data Kita dengan satu klik

- Fungsi Advance Filtering memungkinkan Kita memfilter data berdasarkan kriteria


favorit Kita
- Tools ini terkenal dan ditemukan di mana-mana
8. ForecastThis
Jika Kita seorang data scientist yang menginginkan pemilihan model prediktif otomatis,
maka ini adalah tools yang sangat cocok untuk kita gunakan. ForecastThis membantu
manajer investasi, data scientist, dan analis kuantitatif untuk menggunakan data in-house
mereka untuk mengoptimalkan tujuan masa depan yang kompleks dan menciptakan
perkiraan yang kuat. Keuntungan:
- Mudah diskalakan agar sesuai dengan tantangan ukuran apa pun

- Termasuk algoritma pengoptimalan yang kuat

- Spreadsheet sederhana dan plugin API


9. Google BigQuery
Tools ini adalah tools data warehouse yang bersifat serverless sehingga dapat diskalakan
untuk pembuatan analisa data produktif. Tools ini menggunakan kekuatan pemrosesan
berbasis infrastruktur Google untuk menjalankan kueri SQL super cepat terhadap tabel
yang ditambahkan. Keuntungan:
- Sangat cepat

- Menjaga dari biaya yang turun karena pengguna hanya perlu membayar penyimpanan
dan penggunaan computer
- Mudah diskalakan
10. Java
Java adalah bahasa pemrograman klasik yang berorientasi objek yang sudah ada selama
bertahun-tahun. Tools ini sederhana, memiliki arsitektur yang netral, aman, platform yang
bersifat mandiri, dan berorientasi objek. Keuntungan :
- Cocok untuk proyek sains yang besar jika digunakan dengan Java 8 dan Lambdas

- Java memiliki rangkaian alat dan perpustakaan yang luas sehingga sempurna untuk
machine learning dan data science
- Mudah dimengerti
11. MATLAB
MATLAB adalah bahasa tingkat tinggi yang digabungkan dengan lingkungan interaktif
untuk komputasi numerik, pemrograman, dan visualisasi. MATLAB adalah tools yang kuat
dengan bahasa yang digunakan dalam komputasi teknis, dan ideal untuk grafis,
matematika, dan pemrograman.
Keuntungan:
- Penggunaan yang bersifat intuitif

- Tools ini menganalisis data, membuat model, dan mengembangkan algoritma

- Hanya dengan beberapa perubahan kode sederhana, tools ini menskalakan analisa
agar berjalan di cloud, kluster, dan GPU
12. MySQL
Sebagai salah tools terpopuler, MySQL adalah salah satu database open source paling
populer yang tersedia saat ini. Tools ini ideal untuk mengakses data dari database.
Keuntungan :
- Pengguna dapat dengan mudah menyimpan dan mengakses data secara terstruktur

- Bekerja dengan bahasa pemrograman seperti Java

- Tools ini adalah sistem manajemen database relasional yang bersifat open source


13. NLTK
NLTK merupakan singkatan dari Natural Language Toolkit, tools open souce ini bekerja
dengan data bahasa manusia dan merupakan pengembang dalam program Python yang
sangat disukai. NLTK sangat ideal untuk data scientist dan siswa pemula. Keuntungan :
- Dilengkapi dengan serangkaian library pemrosesan teks

- Menawarkan lebih dari 50 interface yang mudah digunakan

- Tools ini memiliki forum diskusi aktif sehingga menyediakan banyak informasi baru
14. Rapid Miner
Tools data science ini adalah platform terpadu yang menggabungkan persiapan data,
machine learning, dan model deployment untuk membuat proses data science menjadi
lebih mudah dan cepat. Tools ini mampu melakukan sejumlah tugas yang berat dalam
industri manufaktur, telekomunikasi, utilitas, dan perbankan.
Keuntungan :
- Semua sumber daya terletak di satu platform

- GUI berdasarkan pada proses diagram blok, menyederhanakan blok ini ke lingkungan
plug-and-play
- Menggunakan desainer alur kerja visual untuk memodelkan algoritma machine learning
15. SAS
Tools data science ini dirancang khusus untuk operasi statistik. Tools ini adalah alat
perangkat lunak yang berifat close source digunakan khusus untuk menangani dan
menganalisis sejumlah besar data milik organisasi besar.
Tools ini didukung dengan baik oleh perusahaan pengembang tools dan sangat dapat
diandalkan. Namun, tools ini tidak dapat digunakan oleh individu karena biaya SAS yang
mahal dan paling cocok untuk perusahaan besar atau organisasi. Keuntungan :
- Banyak fungsi Analisa yang mencakup segala sesuatu mulai dari media sosial hingga
perkiraan otomatis serta data lokasi
- Tools ini memiliki fitur dasbor dan laporan interaktif sehingga memungkinkan pengguna
langsung melakukan pelaporan ke analisis
- Berisi teknik visualisasi data tingkat lanjut seperti pembuatan bagan otomatis untuk
menyajikan hasil dan data yang menarik.
c. Rangkuman
Tools dalam data science beragam jenisnya mulai dari algorithm.os., apache Hadoop, apache
spark, bigML, D3.js, Data robot, excel, forescastthis, Google BigQuery, Java, MATLAB,
MYSQL, NLTK, Rapit Miner, dan SAAS yang masing-masing memiliki keuntungan dan
kelemahannya masing-masing dalam penggunaannya
- SQL dan Database
SQL
1. Definisi MySQL
SQL atau Standard Query Language adalah bahasa pemrograman yang digunakan dalam
mengakses, mengubah, dan memanipulasi data yang berbasis relasional. Tentu saja bahasa
komputer dalam data basis relasional ini berdasarkan standar yang dikeluarkan oleh American
National Standard Institute (ANSI). Standardisasi SQL sudah ada sejak tahun 1986 dan
memang diinisiasi oleh ANSI. Hingga saat ini banyak server dalam sebuah database
maupun software mampu mengartikan bahasa SQL. Maka dari itulah, SQL merupakan bahan
pembicaraan dan sebuah materi yang sangat penting bagi kamu yang bergelut dalam dunia IT
maupun hal-hal yang bersinggungan dengan database relasional.
2. Sejarah Kemunculan MySQL dan Data Base
Bila kita berbicara mengenai sejarah munculnya dan pengertian SQL dapat mengacu pada
artikel dari Jhonny Oracle yang merupakan salah seorang peneliti di IBM. Artikel tersebut
membahas mengenai ide pembuatan sebuah basis data relasional yang muncul di tahun 1970,
tepatnya pada bulan Juni. Pada artikel tersebut juga dibahas mengenai kemungkinan di masa
mendatang untuk menciptakan sebuah bahasa data yang standar. Oleh karena itulah
kemudian muncul istilah SEQUEL yang mengacu pada singkatan dari Structured English
Query Language. Selang beberapa waktu, IBM lantas mencanangkan proyek basis data
relasional SEQUEL dan karena namanya cukup sulit dieja maka disingkat menjadi SQL.
Setelah proses standardisasi selesari tahun 1986, lalu SQL mengalami perbaikan tahun 1989.
Tahun 1992 muncul versi SQL92 dan di tahun 1999 dengan berbagai pembaharuan muncullah
SQL99. Namun, dalam dunia IT SQL yang sering digunakan mereferensikan pada SQL92.
Meski begitu, sampai sekarang pun sebenarnya tidak ada sebuah server berbasis data yang
menggunakan maupun mendukung SQL99. Ini lebih tergantung pada dialek masing-
masing server yang digunakan.
3. Fungsi MySQL
Keberadaan SQL dalam mengelola sebuah database memberikan fungsi tersendiri. Bagi
seorang admin, adanya SQL dapat memungkinkan kamu untuk mengakses maupun
mengubah database. Kamu pun bisa menjalankan sebuah query maupun mengambil data
yang dibutuhkan. Termasuk pula memperbarui atau menyisipkan data dalam database.
SQL juga bisa digunakan untuk menghapus sebuah data pada database. Fungsi lainnya SQL
adalah untuk membuat sebuah prosedur baru dan ini akan tersimpan dalam sebuah database.
Selain itu juga bisa mengatur hak akses dalam tabel, prosedur, maupun hal-hal penting
lainnya.
4. Jenis-Jenis Perintah dalam MySQL
Setelah kamu mengetahui sejarah dan pengertian SQL, kini saatnya untuk lebih mengetahui
apa saja perintah-perintah dasar yang terdapat dalam SQR tersebut. Setidaknya ada tiga jenis
perintah dasar dalam SQL yang penjabarannya akan diulas dalam poin-poin berikut ini.
a. Data Definition Language (DDL)
Data Definition Languange (DDL) adalah perintah yang digunakan untuk mendefinisikan
data seperti membuat tabel database baru, mengubah dataset, dan menghapus data.
Kemudian, perintah dasar DDL masih dibedakan lagi ke dalam setidaknya lima jenis
perintah yakni bisa kamu lihat di bawah ini.
- Perintah Create: perintah untuk membuat tabel baru di dalam sebuah database adalah
create. Tak cuma untuk tabel baru, tapi juga database maupun kolom baru. Kamu bisa
membuat sebuah query dengan contoh ‘CREATE DATABASE nama_database.
- Perintah Alter: biasa digunakan ketika seseorang ingin mengubah struktur tabel yang
sebelumnya sudah ada. Bisa jadi dalam hal ini adalah seperti nama tabel, penambahan
kolom, mengubah, maupun menghapus kolom serta menambahkan atribut lainnya.
- Perintah Rename: dapat kamu gunakan untuk mengubah sebuah nama di sebuah
tabel ataupun kolom yang ada. Bila kamu menggunakan perintah ini maka query-nya
menjadi ‘RENAME TABLE nama_tabel_lama TO nama_tabel_baru”
- Perintah Drop: Bisa kamu gunakan dalam menghapus baik itu berupa database, table
maupun kolom hingga index.
- Perintah Show: perintah DDL ini digunakan untuk menampilkan sebuah tabel yang ada.
b. Data Manipulation Language (DML)
Pada database SQL, perintah yang digunakan untuk memanipulasi data adalah Data
Manipulation Language atau DML. Perintah dalam DML juga terbagi ke dalam empat jenis.
Beberapa di antaranya adalah insert, select, update, dan delete.
 Perintah Insert: Kamu bisa menggunakan perintah ini untuk memasukkan
sebuah record baru di dalam sebuah tabel database.
 Perintah Select: Select digunakan untuk memanipulasi data dengan tujuan
menampilkan maupun mengambil sebuah data pada tabel. Data yang diambil pun tidak
hanya terbatas pada satu jenis saja melainkan lebih dari satu tabel dengan memakai
relasi.
 Perintah update: Ini dapat kamu gunakan ketika ingin melakukan pembaruan data di
sebuah tabel. Contohnya saja jika ada kesalahan ketika memasukkan sebuah record.
Kamu tidak perlu menghapusnya dan bisa diperbaiki menggunakan perintah ini.
 Perintah Delete: Perintah DML ini dapat digunakan ketika kamu ingin menghapus
sebuah record yang ada dalam sebuah tabel.
c. Data Control Language (DCL)
Perintah dasar berikutnya adalah Data Control Language atau DCL. Perintah SQL ini
digunakan khususnya untuk mengatur hak apa saja yang dimiliki oleh pengguna. Baik itu
hak terhadap sebuah database ataupun pada tabel maupun field yang ada. Melalui
perintah ini, seorang admin database bisa menjaga kerahasiaan sebuah database.
Terutama untuk yang penting. DCL berdasarkan perintah dasarnya terbagi dalam dua
perintah utama yakni:
 Perintah Grant: Perintah ini biasanya digunakan ketika admin database ingin
memberikan hak akses ke user lainnya. Tentu pemberian hak akses ini dapat dibatasi
atau diatur. Dalam hal ini admin pun dapat memberikan akses mengenai perintah
dalam DML di atas.
 Perintah Revoke: Kebalikannya dari Grant, Revoke terkadang sering digunakan untuk
mencabut maupun menghapus hak akses seorang pengguna yang awalnya diberikan
akses oleh admin database melalui perintah Grant sebelumnya.
5. Pekerjaan yang Membutuhkan Keterampilan MySQL
Setelah membahas tentang apa itu SQL, mari kita singgung sedikit mengenai jenis-jenis
pekerjaan yang membutuhkan keterampilan SQL. Karena SQL sangat berkaitan erat dengan
pengelolaan data, maka sebagian besar profesi dalam bidang data memerlukan
keterampilan untuk menggunakan sistem query ini. Di bawah ini adalah beberapa pekerjaan
yang membutuhkan keterampilan SQL:
a) Data Scientist
Data scientist adalah seseorang yang bergulat dengan pembuatan database, mengolah
data, dan menerjemahkannya menjadi sesuatu yang lebih mudah untuk ditelaah —
terjemahan ini disebut dengan produk data.
Produk data inilah yang nantinya akan dijadikan acuan oleh sebuah perusahaan untuk
membuat keputusan bisnis dan kebijakan lainnya. Karena sifat pekerjaan yang berkaitan
erat dengan data, maka data scientist memerlukan skill pengelolaan data dengan SQL.
b) Data Engineer
Seorang data engineer bertanggung jawab untuk menemukan tren atau pola dalam
sebuah set data, kemudian mengembangkan sebuah algoritma untuk membuat data
tersebut memiliki manfaat bagi perusahaan. Selain itu, data engineer juga bertanggung
jawab untuk membangun algoritma yang dapat digunakan untuk mengakses data mentah
dengan lebih mudah. Maka dari itu, data engineer memerlukan keahlian dalam SQL untuk
mempermudah pengelolaan data.
c) Business Analyst
Seorang business analyst bertugas untuk memandu perusahaan dalam menciptakan
proses, produk, layanan, dan software melalui analisa bisnis. Pada umumnya, seorang
business analyst akan menjalankan gap analysis dengan tujuan untuk mengidentifikasi
langkah yang diperlukan untuk memajukan bisnis tersebut. Apabila hasil dari gap
analysis tersebut berkaitan dengan data, maka SQL diperlukan untuk menemukan
kesenjangan dalam data set tersebut. Analisa kesenjangan yang terperinci adalah kunci
sukses dari seorang business analyst.
d) Database Administrator
Seorang Database Administrator (DBA) bertugas untuk mengelola software database
untuk menyimpan, menyusun, dan mengakses data dengan sistem yang matang. DBA
pada umumnya membawahi tim SQL programmer, yang tentu saja mewajibkannya untuk
menguasai bahasa pemrograman tersebut.
e) Quality Assurance Tester
Seorang QA Tester pada umumnya bertugas untuk memeriksa keruskan atau masalah
pada produk digital seperti aplikasi, software e, game, dan website. Produk digital
seperti di atas seringkali menyimpan sebagian besar informasi pengguna dalam sebuah
database berbasis SQL. Untuk mengetahui detail terkait kerusakan dan masalah pada
produk digital, QA Tester tentunya wajib menguasai SQL agar dapat menemukan informasi
tersebut.
Data Base
1. Definisi Data Base
Database atau basis data adalah kumpulan data yang dikelola sedemikian rupa berdasarkan
ketentuan tertentu yang saling berhubungan sehingga mudah dalam pengelolaannya. Melalui
pengelolaan tersebut pengguna dapat memperoleh kemudahan dalam mencari informasi,
menyimpan informasi dan membuang informasi. Adapun pengertian lain dari database adalah
sistem yang berfungsi sebagai mengumpulkan file, tabel, atau arsip yang terhubung dan
disimpan dalam berbagai media elektronik.
2. Jenis dan Fungsi Data Base
a. Operational Database
Operational Database atau biasa disebut dengan database OLTP (On Line Transaction
Processing), berguna untuk mengelola data yang dinamis secara langsung atau real-time.
Jenis ini memungkinkan para pengguna dapat melakukan, melihat, dan memodifikasi data.
Modifikasi tersebut bisa berupa mengubah, menambah, menghapus data secara langsung
melalui perangkat keras yang digunakan.
1) JSON
JSON (JavaScript Object Notation) adalah format file yang menggunakan teks untuk
pengiriman data. Format ini sangat umum digunakan pengguna untuk pertukaran data
layaknya berkomunikasi cepat dengan melalui web browser dan web server.
Sinkronisasi data bisa dilakukan secara real-time. Format JSON sendiri berasal dari
pemrograman JavaScript, melalui pembuatannya JSON memiliki format bahasa yang
berbeda dari lainnya. Diketahui bahwa semua file JSON selalu menggunakan ekstensi
khusus berupa “json”.
2) XML
XML (Extensible Markup Language) adalah bahasa program markup yang memiliki
aturan untuk memberikan dua kode dokumen berbeda yang bisa dibaca oleh manusia
dan dibaca oleh komputer. Melalui XML, akan menghasilkan format data berupa teks
yang dapat digunakan untuk merepresentasikan struktur basis data. Selain itu,
sinkronisasi data dapat dilakukan secara real-time oleh pengguna. Bahasa program ini
sangat cocok digunakan untuk menangani basis data pada web browser dan web
server. Struktur yang digunakan XML dinilai banyak memiliki kesamaan dengan format
JSON.
b. Database Warehouse
Database Warehouse adalah sistem basis data yang biasa digunakan untuk pelaporan dan
analisis data. Sistem ini dianggap sebagai komponen inti dari business
intelligence. Database Warehouse merupakan repositori sentral data yang terpadu dari
satu atau lebih sumber yang berbeda. Database tersebut juga menyimpan data terkini dan
historis dengan satu tempat yang digunakan untuk membuat laporan analisis. Data yang
tersimpan di warehouse awalnya diunggah dari sistem operasi. Data bisa melewati
penyimpanan operasional dan memungkinkan untuk pembersihan data. Proses tersebut
menjadi operasi tambahannya dan dapat memastikan kualitas data sebelum digunakan
di warehouse sebagai pelaporannya.
c. Microsoft SQL Server
Microsoft SQL Server adalah sistem basis data yang dibangun oleh Microsoft.
Sebagai server database, sistem ini merupakan produk perangkat lunak yang berfungsi
menyimpan dan mengambil data sesuai permintaan aplikasi lainnya. Hal tersebut
memungkinkan dapat berjalan baik melalui komputer yang sama atau komputer lainnya
melalui jaringan internet. Setidaknya Microsoft pernah memasarkan 12 edisi yang berbeda
sistem Microsoft SQL Server ini. Hal itu ditujukan untuk memberikan pilihan kepada
pengguna dan untuk kebutuhan yang berbeda juga.
d. Distributed Database
Distributed Database adalah basis data yang perangkat penyimpanannya tidak terpasang
pada perangkat komputer yang sama. Basis data tersebut disimpan di beberapa perangkat
komputer yang terletak di tempat yang sama atau tersebar melalui jaringan komputer
lainnya yang saling berhubungan. Sistem ini tidak sama dengan sistem paralel yang
menggabungkan erat dan bersistem data tunggal. Sistem ini terdistribusi melalui situs yang
tergabung dan tidak memiliki komponen fisik. Melalui administratornya, basis data dapat
mendistribusikan sekumpulan data di beberapa lokasi yang berada di server jaringan
terorganisir. Karena sistem yang begitu unik, basis data terdistribusi bisa meningkatkan
kinerja bagi end user dengan membiarkan transaksi melalui proses mesin yang banyak
sehingga tidak fokus pada satu mesin saja.
e. Microsoft Access (Office)
Microsoft Access adalah sistem DBMS yang menggabungkan Microsoft Jet Database
Engine dengan alat pengembang perangkat lunak. Microsoft Access menyimpan data
dengan formatnya sendiri. Melalui software ini pengguna dapat mengimpor atau
menghubungkan langsung ke data yang tersimpan di database lainnya. Microsoft Access
sangat cocok digunakan pada sistem informasi dengan distributed database. Karena
penyimpanan file tidak memerlukan server database aktif sehingga bersifat portable.
f. Relational Database
Relational Database atau basis data relasional adalah basis data yang mengorganisir
berdasarkan model hubungan data. Banyak sekali perangkat lunak yang menggunakan
sistem ini untuk mengatur dan memelihara basis data melalui hubungan setiap data.
Umumnya, semua sistem menggunakan Structured Query Language (SQL) sebagai
bahasa pemrograman untuk pemeliharaan basis data dan query.
g. MySQL
MySQL adalah sebuah sistem untuk manajemen basis data relasional. Banyak sekali
produk-produk IT yang dibuat dengan menggunakan komponen utama MySQL. Beberapa
aplikasi seperti WordPress, Google, Flickr, Youtube, Facebook, Joomla, phpBB, Drupal,
dan MODx menggunakan sistem ini untuk manajemen basis data relasional mereka.
h. PostgreSQL
Sistem kedua yang merupakan sistem pengelolaan basis data relasional adalah
PostgreSQL. Sistem ini berfungsi untuk menyimpan data secara aman dan dapat
mengembalikan data tersebut sebagai respon atas request dari aplikasi lainnya.
PostgreSQL dapat bekerja melalui aplikasi mesin tunggal kecil hingga aplikasi internet
besar beserta pengguna yang banyak secara bersamaan. Sistem ini biasa digunakan pada
sistem operasi mac OS server, karena pengaturannya sudah tersedia secara default.
Sistem operasi lainnya seperti Windows dan Linux juga dapat ditemukan dengan
mengubah pengaturannya.
i. MariaDB
MariaDB adalah sistem yang dikembangkan dari MySQL. Pengembangan ini bertujuan
untuk mempertahankan kompatibilitas yang tinggi dari MySQL dan cocok dengan API
MySQL beserta perintah-perintahnya. MariaDB memiliki mesin penyimpanan XtraDB untuk
mengganti InnoDB. Sistem ini dikembangkan langsung oleh beberapa pengembang asli
MySQL dengan pihak yang bercabang. Tujuannya adalah agar tidak diakuisisi oleh Oracle
Corporation yang merupakan kompetitornya.
j. MongoDB
MongoDB adalah software database yang berorientasi pada
dokumen cross platform dan open source. MongoDB menggunakan dokumen yang mirip
dengan skema JSON, oleh karena itu sistemnya diklasifikasikan ke dalam program basis
data NoSQL.
k. Oracle Database
Oracle Database adalah sistem relation database selanjutnya yang diproduksi dan
dipasarkan oleh perusahaan Oracle. Dalam penggunaannya, sistem Oracle mengacu pada
struktur memori server–side sebagai sistem area globalnya. Sistem area global dapat
menyimpan cache, perintah SQL, dan informasi pengguna. Selain itu, sistem ini
memungkinkan untuk menyimpan riwayat transaksional seperti redo log online.
l. SAP HANA
SAP HANA adalah sistem lain yang berorientasi pada kolom dan hubungan antar tabel.
Sistem ini memiliki fungsi utama sebagai database server yang menyimpan dan
mengambil data sesuai permintaan aplikasi. Selain fungsi tersebut, SAP HANA juga dapat
melakukan analisis lanjutan seperti analisis prediksi, pemrosesan data spasial, analisis
teks, analisis streaming, pencarian teks, dan pemrosesan data grafik. SAP HANA ini
merupakan sistem yang dikembangkan oleh SAP SE.
m. IBM Db2
IBM Db2 adalah sistem lainnya yang dikembangkan oleh perusahaan IBM. Melalui sistem
ini, model relasional dapat terdukung. Hanya saja versi terbarunya IBM Db2 memiliki multi-
fungsi yang mendukung fitur relasional dan non relasional seperti JSON dan XML. Melalui
sejarahnya, IBM Db2 merupakan sistem yang dibuat untuk produk DB2 pada masing-
masing sistem operasi utamanya. Pada tahun 1990-an, Perusahaan IBM mulai membuat
produk DB2 universal yang kodenya dapat digunakan untuk sistem operasi lainnya.
n. MemSQL
MemSQL adalah sistem manajemen basis data SQL terdistribusi dan in–memory. Sistem
ini juga termasuk ke dalam sistem manajemen basis data relasional (RDBMS). MemSQL
berfungsi untuk mengkompilasi SQL ke dalam kode mesin melalui proses pembuatan kode
atau code generation.
o. Interbase
Interbase adalah sistem RBMS yang berbeda dengan produk lainnya. Sistem ini
memiliki footprint yang minim, persyaratan administrasi yang hampir nol dan arsitektur
multi generasi. Interbase dapat digunakan di sistem operasi Windows, macOS, Linux,
Solaris, iOS, dan Android. Sistem ini dibangun langsung oleh Embarcadero Technologies
(Borland dulunya).
p. Firebird
Sistem basis data relasional terakhir adalah Firebird. Firebird adalah sistem SQL
yang open source dan berjalan di sistem operasi mac OS X, Windows, Linux, dan sistem
operasi lainnya yang unik. Basis data Firebird juga merupakan cabang dari open
source Borland Interbase pada tahun 2000. Hanya saja sejak versi Firebird 1.5 kode yang
dibuat sebagian besar telah ditulis ulang.
q. End-User Database
r. SQLite
s. SQLite adalah sistem manajemen basis data yang ada pada library pemrograman C.
Berbeda dengan sistem lainnya, SQLite bukan merupakan mesin database client server.
SQLite tertanam ke dalam program akhir sehingga cocok digunakan dalam mendukung
penyimpanan data akhir end user. SQLite sangat populer digunakan sebagai perangkat
lunak database untuk penyimpanan lokal / klien melalui perangkat lunak aplikasi seperti
peramban web. Sistem ini merupakan sistem yang paling banyak digunakan melalui sistem
operasi, peramban web, dan sistem embedded yang lebih luas seperti ponsel.
3. Manfaat Data Base
Dari berbagai jenis beserta fungsi dan pengertian database sebelumnya, ternyata sistem ini
bermanfaat bagi penggunanya. Manfaat tersebut berupa:
1. Kecepatan dan kemudahan
Sistem database memberikan kemampuan dalam seleksi data menjadi satu kelompok
yang terurut dengan cepat. Instrumen tersebut menghasilkan pencarian informasi yang
dibutuhkan ditemukan dengan cepat. Kecepatannya juga dipengaruhi oleh
jenis database yang digunakan. Setiap jenis database memberikan kemampuan yang
berbeda-beda.
2. Multi-user
Database memberikan kemudahan akses bagi banyak pengguna dalam waktu yang
bersamaan. Sistem tersebut memungkinkan akses suatu dokumen ke lebih dari satu
pengguna. Sehingga kinerja mesin dan jaringan dimudahkan melalui multi-user karena
penyimpanan hanya terdiri satu unit yang dapat diakses secara bersamaan.
3. Keamanan data
Sistem database melalui bahasa pemrogramannya telah dibuat secara safety. Melalui
instrumen password membuat data tersebut hanya bisa diakses kepada pihak yang
diijinkan. Manajemen tersebut telah diterapkan pada hampir seluruh jenis sistem database.
Sehingga menjadikan keamanan data merupakan hal prioritas bagi layanan
sistem database.
4. Penghematan biaya perangkat
Memiliki satu database terpusat sudah cukup bagi perusahaan besar yang membutuhkan
pengumpulan data secara ringkas. Hal ini membuat perusahaan tidak memerlukan ruang
penyimpanan di tiap tempat yang berbeda. Melalui jaringan internet, cabang perusahaan di
daerah terpencil pun bisa melakukan akses data yang ada di pusat.
5. Kontrol data terpusat
Database tidak memerlukan server lebih dari satu dalam penggunaannya. Cukup
satu server terpusat untuk menyimpan data sehingga data tersebut bisa diakses oleh
banyak pengguna. Hal ini memberikan harga yang murah bagi perusahaan untuk investasi
ruang penyimpanan data penting perusahaan. Seperti kantor perusahaan tidak perlu
membuat suatu data di tiap divisi jobnya. Setiap divisi bisa mengumpulkan data khusus
melalui satu server yang ditentukan sehingga laporan untuk atasan menjadi ringkas.
6. Mudah membuat aplikasi
Melalui kaitannya terhadap perusahaan jika perusahaan membutuhkan aplikasi input data
yang baru, programmer tidak perlu membuat ulang struktur database. Menggunakan
struktur database yang dibuat sebelumnya sudah cukup untuk mengenali aplikasi input
data yang baru.
Rangkuman
1. SQL atau Standard Query Language adalah bahasa pemrograman yang digunakan dalam
mengakses, mengubah, dan memanipulasi data yang berbasis relasional.
2. Fungsi dari SQL digunakan untuk menghapus sebuah data pada database, untuk membuat
sebuah prosedur baru dan ini akan tersimpan dalam sebuah database dan untuk mengatur
hak akses dalam tabel, prosedur, maupun hal-hal penting lainnya.
3. Jenis-jenis perintah SQL antara lain ada DDL, DML dan DCL
4. Database atau basis data adalah kumpulan data yang dikelola sedemikian rupa berdasarkan
ketentuan tertentu yang saling berhubungan sehingga mudah dalam pengelolaannya
5. Jenis dan fungsi dari data base antara lain, operational data base, warehouse database,
distributed database dan relational database serta end-user database
6. Manfaat dari penggunaan data base dapat dilihat dari kecepatan dan kemudahan, multiuser,
keamanan data, penghematan biaya perangkat, control data yang terpusat dan
kemudahannya dalam membuat aplikasi

- Pengantar Bahasa Pyton


A. Definisi Bahasa Python
Python adalah bahasa pemrograman tujuan umum yang ditafsirkan, tingkat tinggi. Dibuat
oleh Guido van Rossum dan pertama kali dirilis pada tahun 1991, filosofi desain Python
menekankan keterbacaan kode dengan penggunaan spasi putih yang signifikan. Konstruksi
bahasanya dan pendekatan berorientasi objek bertujuan untuk membantu pemrogram menulis
kode yang jelas dan logis untuk proyek skala kecil dan besar. Python diketik secara
dinamis dan pengumpulan sampah. Ini mendukung beberapa paradigma pemrograman,
termasuk pemrograman terstruktur (terutama, prosedural), berorientasi objek, dan fungsional.
Python sering dideskripsikan sebagai bahasa "termasuk baterai" karena perpustakaan
standarnya yang komprehensif. Python dibuat pada akhir 1980-an sebagai penerus bahasa
ABC. Python 2.0, dirilis pada tahun 2000, memperkenalkan fitur-fitur seperti pemahaman
daftar dan sistem pengumpulan sampah dengan penghitungan referensi.
Python 3.0, dirilis pada tahun 2008, adalah revisi utama dari bahasa yang tidak
sepenuhnya kompatibel dengan versi sebelumnya, dan banyak kode Python 2 yang tidak
berjalan tanpa modifikasi pada Python 3. Penerjemah Python tersedia untuk banyak sistem
operasi. Komunitas pemrogram global mengembangkan dan memelihara CPython,
implementasi referensi yang bebas dan sumber terbuka. Sebuah organisasi nirlaba, Python
Software Foundation, mengelola dan mengarahkan sumber daya untuk pengembangan Python
dan CPython.

B. Sejarah Bahasa Python


Python dibuat pada akhir 1980-an oleh Guido van Rossum di Centrum Wiskunde &
Informatica (CWI) di Belanda sebagai penerus bahasa ABC (sendiri terinspirasi
oleh SETL), mampu menangani pengecualian dan berinteraksi dengan sistem
operasi Amoeba. Implementasinya dimulai pada bulan Desember 1989. Van Rossum memikul
tanggung jawab penuh atas proyek tersebut, sebagai pengembang utama, hingga 12 Juli
2018, ketika ia mengumumkan "liburan permanen" dari tanggung jawabnya
sebagai Benevolent Dictator For Life Python, sebuah gelar yang diberikan komunitas Python
kepadanya untuk mencerminkan komitmen jangka panjangnya sebagai pengambil keputusan
utama proyek.
Python 2.0 dirilis pada 16 Oktober 2000 dengan banyak fitur utama baru, termasuk pengumpul
sampah pendeteksian siklus dan dukungan untuk Unicode. Tanggal akhir masa pakai Python
2.7 yang awalnya ditetapkan pada tahun 2015 kemudian ditunda hingga tahun 2020 karena
sejumlah besar kode yang tidak dapat dengan mudah dilanjutkan ke Python 3.
C. Fitur Python
1. Mudah untuk belajar: Python memiliki relatif sedikit kata kunci, struktur sederhana dan
sintaks dari kurva belajar yang jelas lebih mudah.
2. Mudah dibaca: definisi kode Python lebih jelas.
3. Mudah untuk mempertahankan: Keberhasilan Python terletak pada kode sumbernya cukup
mudah untuk mempertahankan.Berbagai perpustakaan standar: Salah satu keuntungan
terbesar dari Python adalah perpustakaan yang kaya, cross-platform, pada UNIX,
Windows dan Macintosh kompatibel dengan baik.
4. Modus Interaktif: modus interak tif, Anda dapat memasukkan untuk mengeksekusi kode
dari terminal dan mendapatkan tes bahasa dan debug kode potongan untuk berinteraksi.
5. Portabel: Berdasarkan karakteristik open source, Python telah porting (yaitu untuk
membuatnya bekerja) ke banyak platform.
6. Scalable: Jika Anda perlu menjalankan beberapa kode kunci cepat, atau ingin menulis
beberapa algoritma tidak ingin membuka, Anda dapat menggunakan C atau C ++ untuk
menyelesaikan bagian dari program, dan kemudian memanggil dari program Python Anda.
7. Database: Python menyediakan sebuah antarmuka untuk semua database komersial
utama.
8. GUI Programming: Python GUI dukungan dapat dibuat dan porting ke banyak sistem
panggilan.
9. Dapatkah Embed: Anda dapat menanamkan Python C / C ++ program yang
memungkinkan pengguna program Anda telah "scripted" kemampuan.
D. Desain Fitur dan Filosofi
Python adalah bahasa pemrograman multi-paradigma. Pemrograman berorientasi
objek dan pemrograman terstruktur juga didukung penuh, dan banyak fiturnya
mendukung pemrograman fungsional dan pemrograman berorientasi aspek (termasuk
dengan metaprogramming dan metaobjects (metode ajaib)). Banyak paradigma lain yang
didukung melalui ekstensi, termasuk desain berdasarkan kontrak dan pemrograman logika.
Desain Python menawarkan beberapa dukungan untuk pemrograman fungsional dalam
tradisi Lisp. Memiliki fungsi filter, map, dan reduce;daftar pemahaman, kamus, set, dan
ekspresi generator. Pustaka standar memiliki dua modul (itertools dan functools) yang
mengimplementasikan alat fungsional yang dipinjam dari Haskell dan Standard ML. Filosofi inti
bahasa diringkas dalam dokumen The Zen of Python (PEP 20), yang mencakup kata-kata
mutiara seperti:
 Cantik itu lebih baik dari pada jelek.
 Eksplisit lebih baik daripada implisit.
 Sederhana lebih baik daripada kompleks.
 Kompleks lebih baik daripada rumit.
 Keterbacaan itu penting.
Daripada memiliki semua fungsionalitas yang dibangun ke dalam intinya, Python dirancang
untuk menjadi sangat dapat dikembangkan. Modularitas yang ringkas ini membuatnya sangat
populer sebagai sarana untuk menambahkan antarmuka yang dapat diprogram ke aplikasi
yang ada. Visi Van Rossum tentang bahasa inti kecil dengan perpustakaan standar yang
besar dan penerjemah yang mudah diperluas berasal dari rasa frustrasinya dengan ABC, yang
mendukung pendekatan yang berlawanan. Pengguna dan peminat Python, terutama mereka
yang dianggap berpengetahuan atau berpengalaman, sering disebut sebagai Pythonistas.
E. Pernyataan dan Aliran Kontrol
Penetapan nilai yang sama secara berurutan ke beberapa nama,
misalnya, x=2; y=2; z=2 menghasilkan pengalokasian penyimpanan ke (paling banyak) tiga
nama dan satu objek numerik, yang ketiganya terikat. Karena nama adalah pemegang
referensi umum, tidak masuk akal untuk mengasosiasikan tipe data tetap dengannya. Namun
pada waktu tertentu sebuah nama akan terikat ke suatu objek, yang akan memiliki tipe; jadi
ada pengetikan dinamis.
 Pernyataan if, yang secara kondisional mengeksekusi blok kode, bersama
dengan else dan elif (sebuah kontraksi dari else-if).
 Pernyataan for yang melakukan iterasi pada objek yang dapat diulang, menangkap setiap
elemen ke variabel lokal untuk digunakan oleh blok terlampir.
 Pernyataan while yang mengeksekusi sebuah blok kode selama kondisinya benar.
 Pernyataan try yang memungkinkan pengecualian yang dimunculkan dalam blok kode
terlampir untuk ditangkap dan ditangani oleh except klausul; itu juga memastikan bahwa
kode-pembersihan dalam file blok finally akan selalu berjalan terlepas dari bagaimana blok
keluar.
 Pernyataan raise digunakan untuk memunculkan pengecualian tertentu atau memunculkan
kembali pengecualian yang tertangkap.
 Pernyataan class yang mengeksekusi blok kode dan menempelkan namespace lokalnya
ke class, untuk digunakan dalam pemrograman berorientasi objek.
 Pernyataan def yang mendefinisikan fungsi atau metode.
 Pernyataan with dari Python 2.5 dirilis pada September 2006,[49] yang membungkus blok
kode dalam manajer konteks (misalnya, memperoleh kunci sebelum blok kode dijalankan
dan melepaskan kunci setelahnya, atau membuka file dan kemudian menutupnya),
memungkinkan perilaku seperti Resource Acquisition Is Initialization (RAII) dan
menggantikan idiom percobaan / akhirnya yang umum.
 Pernyataan break keluar dari loop.
 Pernyataan continue melewati iterasi ini dan melanjutkan dengan item berikutnya.
 Pernyataan pass yang berfungsi sebagai NOP. Ini secara sintaksis diperlukan untuk
membuat blok kode kosong.
 Pernyataan assert digunakan selama debugging untuk memeriksa kondisi yang
seharusnya diterapkan.
 Pernyataan yield yang mengembalikan nilai dari fungsi generator. Dari Python
2.5, yield juga seorang operator. Formulir ini digunakan untuk mengimplementasikan
coroutine.
 Pernyataan import , yang digunakan untuk mengimpor modul yang fungsi atau variabelnya
dapat digunakan dalam program saat ini. Ada tiga cara menggunakan import: import
<nama modul> [sebagai <alias>] atau from <nama modul> import * atau from <nama
modul> import <definisi 1> [sebagai <alias 1>], <definisi 2> [sebagai <alias 2>], ....
 Pernyataan print diubah menjadi fungsi print() dengan Python 3.
F. Penulisan Bahasa Python
Python menggunakan duck typing dan memiliki objek yang diketik tetapi nama variabel yang
tidak diketik. Batasan jenis tidak diperiksa pada waktu kompilasi; sebaliknya, operasi pada
suatu objek mungkin gagal, menandakan bahwa objek yang diberikan bukan tipe yang sesuai.
Meskipun diketik secara dinamis, Python diketik dengan kuat, melarang operasi yang tidak
terdefinisi dengan baik (misalnya, menambahkan angka ke string) daripada secara diam-diam
mencoba memahaminya.
Python memungkinkan pemrogram untuk menentukan tipe mereka sendiri menggunakan
kelas, yang paling sering digunakan untuk pemrograman berorientasi objek.
Contoh instance baru dibangun dengan memanggil kelas
(misalnya, SpamClass() atauEggsClass()), dan kelas-kelasnya adalah instance
dari metaclass type (itu sendiri merupakan contoh dari dirinya sendiri),
memungkinkan metaprogramming dan refleksi.
G. Contoh Pemrograman Python
Program Halo Dunia:
print('Hello, world!')
Program untuk menghitung faktorial dari bilangan bulat positif:
n = int(input('Ketik sebuah angka, dan faktorialnya akan diprinted: '))
if n < 0:
raise ValueError('Anda harus memasukkan bilangan bulat bukan negatif')
faktorial = 1
for i in range(2, n + 1):
faktorial *= i
print(faktorial)
Contoh kelas dalam bahasa pemrograman Python:
class Orang:
def __init__(self, nama)
self.nama = nama
def tampilkan_nama(self)
return self.nama
orang = Orang("Wikipedia") # Initialisasi object
print(orang.tampilkan_nama()) # Output: Wikipedia
Rangkuman
Python adalah bahasa pemrograman tujuan umum yang ditafsirkan, tingkat tinggi. Dibuat
oleh Guido van Rossum dan pertama kali dirilis pada tahun 1991. Python dibuat pada akhir 1980-
an oleh Guido van Rossum di Centrum Wiskunde & Informatica (CWI) di Belanda sebagai
penerus bahasa ABC (sendiri terinspirasi oleh SETL), mampu menangani pengecualian dan
berinteraksi dengan sistem operasi Amoeba. Implementasinya dimulai pada bulan Desember 1989.
Fitur python itu mudah untuk belajar, mudah dibaca, mudah untuk mempertahankan, dll. Desain
Python menawarkan beberapa dukungan untuk pemrograman fungsional dalam tradisi Lisp.
Memiliki fungsi filter, map, dan reduce;daftar pemahaman, kamus, set, dan
ekspresi generator. Pustaka standar memiliki dua modul (itertools dan functools) yang
mengimplementasikan alat fungsional yang dipinjam dari Haskell dan Standard ML

- Pemahaman Data Bisnis


A. Definisi Pemahaman Data Bisnis
Bisnis database adalah suatu bisnis yang dilakukan dengan cara mengumpulkan nomor
telepon, WhatsApp, email dan sejenisnya dari para produsen, supplier, perusahaan, nama,
dan juga alamat untuk selanjutnya di jual.Produk utama dari bisnis database ini adalah data.
Cara memperolehnya pun sangat banyak, ada yang mengambil database dari berbagai
aplikasi yang mengumpulkan setiap data pengguna, dan masih banyak lagi.
Contoh sederhananya adalah praktik jual beli pulsa dan paket data, ketika Anda diminta untuk
menuliskan nomor telepon Anda, maka dari data tersebut sudah bisa dijadikan untuk berjualan
database. Berbagai date tersebut bisa dikumpulkan dan dijual kepada orang ataupun
perusahaan yang memerlukan.Umumnya, berbagai data ini dibutuhkan untuk kebutuhan
promosi, survei, dll. kepada para konsumen.
B. Kelebihan Data Bisnis
1. Mudah Dijalankan
Kelebihan paling utama dalam menjalankan bisnis database adalah salah satu bisnis yang
mudah dijalankan. Nah, Anda bisa menawarkan berbagai database potensial ini melalui
media sosial, iklan maupun website. Lebih enaknya lagi, satu database bisa Anda jual
berulang kali kepada pihak yang memerlukan. Jadi, menjalankan bisnis ini sangatlah
mudah, tidak perlu menyiapkan persediaan ataupun produksi, Anda bisa tetap jualan
setiap saat.
2. Cukup Modal Sekali
Keuntungan lainnya dari bisnis database adalah cukup membayar modal sekali saja saat
melakukan pembayaran pertama. Jadi, sebagai contoh Anda membeli  database supplier
fashion senilai 200 ribu. Nah, dari data tersebut Anda bisa menjualnya berulang kali pada
para pemilik toko online dan offline yang memerlukan supplier. Karena bentuknya ini
berupa file, maka Anda bisa menjualnya kembali dan bisa balik modal dengan cepat.
3. Prospek Kedepan yang Bagus
Bisnis database memiliki masa depan yang cukup bagus dengan minat belanja online yang
selalu meningkat. Contohnya saja dari penjualan database produsen fashion, akan ada
banyak sekali penjual yang memerlukan database produsen fashion untuk mencari harga
yang paling murah pada tiap produknya.
Setiap pebisnis online, mulai dari pihak penjual, reseller, dropshipper dan para bisnis
offline pun juga sangat membutuhkannya. Untuk itu, prospek bisnis database ini
kedepannya masih sangat bagus untuk Anda yang baru ingin bergabung ke dalam bisnis
database.
4. Bisa Dilakukan Oleh Siapa Saja
Bisnis database ini bisa dilakukan oleh siapa saja karena dalam prosesnya juga tidak
membutuhkan perhatian yang sangat banyak. Bisnis ini bisa dilakukan oleh mahasiswa,
pelajar, ibu rumah tangga, bahkan bisa dilakukan oleh para pekerja juga. Selain itu, bisnis
ini juga tidak membutuhkan latar belakang ilmu apapun.
5. Fleksibel
Bisnis ini bisa dilakukan di waktu dan tempat manapun, sehingga bisa Anda sesuai dengan
setiap kegiatan Anda.
C. Kekurangan Data Bisnis
1. Termasuk Bisnis Ilegal
Di negara kita sendiri, bisnis yang didalamnya memperjualbelikan data pribadi tergolong
pada bisnis yang ilegal. Berdasarkan undang-undang nomor 19 tahun 2016 terkait
informasi dan transaksi elektronik atau ITE, bisnis jual beli data ini dilarang dan bisa
diancam tindakan pidana.
2. Validitas Data yang Dijual
Kekurangan selanjutnya adalah terkait validitas data yang diperjualbelikan di dalamnya.
Banyak sekali kasus database yang dijual adalah database yang sudah tidak valid,
sehingga banyak konsumen yang merasa tertipu. Bila sudah terjadi, maka tentunya akan
mencoreng nama baik Anda dan Anda pun sudah tidak bisa lagi dipercaya oleh konsumen
Anda. Oleh karena itu, Anda harus bisa menjaga tingkat validitas data yang dijual agar bisa
sama-sama saling menguntungkan antara yang satu dengan yang lainnya.
3. Indikasi MLM
Terdapat indikasi bisnis database seperti MLM atau Multi Level Marketing. Anda membeli
sekumpulan data lalu menjualnya lagi pada pihak lain, lalu orang tersebut menjualnya lagi,
dan seterusnya. Untuk itu, pastikanlah mereka yang membeli database ini adalah mereka
yang memang memerlukan data tersebut, bukan untuk dijual lagi untuk mencari
keuntungan pribadi.
D. Instrumen yang Digunakan pada Bisnis Database
Bisnis database adalah bisnis yang menjanjikan, murah, dan tidak memerlukan banyak
instrumen dalam memulainya. Beberapa instrumen yang diperlukan untuk memulai bisnis
database adalah smartphone dan paket internet atau wifi, database original yang dibeli
sebagai bentuk modal, media sosial, dan website ataupun blog sebagai media pemasarannya.
E. Cara jual database agar cepat laku
1. Menentukan Harga
Harga merupakan faktor penentu pada suatu bisnis yang dijalankan oleh
setiap pebisnis. Umumnya, terdapat harga dan rupa dari produk yang dijual. Untuk itu,
tentukanlah harga produk database yang ingin anda jual. Disarankan untuk memberikan
label pada harga produk sesuai dengan modal ataupun lebih dari itu. Bila peminatnya
ternyata sudah semakin banyak, maka Anda bisa meningkatkan harga jual produk
tersebut.
2. Membuat Grup
Setelah berhasil menentukan harga jual, maka Anda bisa membuat grup agar bisa
menampung setiap member baru. Umumnya, media yang bisa dimanfaatkan adalah
WhatsApp atau Facebook. Kedua jenis media ini terbilang cukup mudah untuk dibuat.
Setelah berhasil membuat grup, maka Anda bisa mulai membagikan informasi terkait
produk Anda. informasinya pun bisa berbentuk foto, video, atau aneka tulisan yang
menarik.
3. Buat Timeline
Timeline dibutuhkan dalam proses penjualan database. Timeline harus dibuat dengan jelas
dan lengkap agar bisa dengan mudah dipahami dan juga menarik. Contohnya adalah
memberikan testimoni berbentuk foto produk, dll.
4. Promosi
Setelah berhasil mempersiapkan segala yang diperlukan, maka langkah selanjutnya yang
diperlukan untuk melakukan bisnis database adalah melakukan promosi. Walaupun
memang sulit, Anda bisa melakukan bentuk promosi yang menarik dengan cara
memasang iklan di berbagai media sosial. Usahakanlah untuk selalu melakukan promosi
ini setiap hari dan melakukan upload foto yang banyak dengan melengkapinya
menggunakan hashtag.
5. Cara Menjaring Konsumen
Agar bisa memperoleh banyak konsumen untuk membeli database yang Anda tawarkan,
maka Anda bisa melakukannya dengan cara beriklan di media sosial website ataupun
blog. Iklan menjadi cara yang paling utama dan juga paling ampuh agar bisnis database
Anda menjadi semakin besar. Bisnis online yang satu ini sangatlah mudah untuk
dilakukan. Kemampuan promosi menjadi hal yang paling utama dalam mengembangkan
bisnis.
Selain itu, Anda juga bisa mendapatkan dukungan dengan testimunda dari beberapa
pebisnis sebelumnya terkait keuntungan yang bisa Anda peroleh. Dengan menampilkan
berbagai testimoni ini, maka akan membuat banyak orang tertarik untuk bergabung
dengan Anda.
F. Rangkuman
1. Bisnis database adalah suatu bisnis yang dilakukan dengan cara mengumpulkan nomor
telepon, WhatsApp, email dan sejenisnya dari para produsen, supplier, perusahaan, nama,
dan juga alamat untuk selanjutnya di jual.Produk utama dari bisnis database ini adalah
data.
2. Kelebihan data bisnis yaitu mudah dijalankan, cukup modal sekali. Prospek kedepan yang
bagus, bisa dilakukan oleh siapa saja, fleksibel.
3. Kekurangan data bisnis yaitu termasuk bisnis illegal, validitas data yang dijual, indikasi
mlm.
4. Bisnis database adalah bisnis yang menjanjikan, murah, dan tidak memerlukan banyak
instrumen dalam memulainya

Anda mungkin juga menyukai