A. Buatlah : Penjelasan, Resume, Analisis Kritis dan Telaah Referensi Dari semua materi berikut
- Pengenalan Big Data dan Data Science
Big Data
a) Pengertian Big Data
Menurut (Eaton, Dirk, Tom, George, & Paul) Big Data merupakan istilah yang berlaku untuk
informasi yang tidak dapat diproses atau dianalisis menggunakan alat tradisional.
Menurut (Dumbill, 2012) , Big Data adalah data yang melebihi proses kapasitas dari kovensi
sistem database yang ada. Data terlalu besar dan terlalu cepat atau tidak sesuai dengan
struktur arsitektur database yang ada. Untuk mendapatkan nilai dari data, maka harus memilih
jalan altenatif untuk memprosesnya.
Berdasarkan pengertian para ahli di atas, dapat disimpulkan bahwa Big Data adalah data yang
memiliki volume besar sehingga tidak dapat diproses menggunakan alat tradisional biasa dan
harus menggunakan cara dan alat baru untuk mendapatkan nilai dari data ini
Big data dikatakan kumpulan proses yang terdiri volume data dalam jumlah besar yang
terstruktur maupun tidak terstruktur dan digunakan untuk membantu kegiatan bisnis. Big data
sendiri merupakan pengembangan dari sistem database pada umumnya. Yang membedakan
disini adalah proses kecepatan, volume, dan jenis data yang tersedia lebih banyak dan
bervariatif daripada DBMS (Database Management System) pada umumnya.
b) Dimensi Big Data
Ada 3 dimensi awal dalam Big Data yaitu 3V: Volume, Variety dan Velocity:
- Volume: Ukuran data yang dimiliki oleh big data memiliki kapasitas yang besar. Dapat
mencoba melakukan proses data dengan ukuran yang besar untuk dijalankan.
- Velocity: Kecepatan transfer data juga sangat berpengaruh dalam proses pengiriman data
dengan efektif dan stabil. Big data memiliki kecepatan yang memungkinkan untuk dapat
diterima secara langsung (real-time). Kecepatan tertinggi yang bisa didapatkan langsung
melalui aliran data ke memori apabila dibandingkan dengan yang ditulis pada sebuah disk.
- Variety: Jenis variasi data yang dimiliki oleh big data lebih banyak daripada menggunakan
sistem database SQL. Jenis data yang masih bersifat tradisional, lebih terstruktur daripada
data yang belum terstruktur. Contohnya adalah teks, audio, dan video merupakan data
yang belum terdefinisikan secara langsung dan harus melalui beberapa tahap untuk dapat
diproses dalam sebuah database.
Selain dari 3V diatas, masih ada 2V lain yang merupakan bagian dari big data sendiri.
Yaitu Value dan Veracity:
- Untuk value, merupakan nilai atau aliran data yang tidak teratur dan konsisten dalam
beberapa kondisi dan periode. Hal tersebut dapat terjadi pada suatu kasus dimana
terdapat lonjakan data yang besar sehingga, akan memproses data dengan resource
memori yang lebih besar.
- Veracity merupakan bentuk pembenaran suatu data. Jadi, mengacu pada kualitas data
tersebut, dapat berasal dari berbagai sumber. Perlu adanya proses untuk
menghubungkan dan mengkorelasikan beberapa hubungan data. Jika tidak ada relasi
yang baik, maka dapat menimbulkan kontrol yang lepas kendali.
c) Fungsi Big Data
Big data memiliki beberapa fungsi penting dalam proses pengembangan dan penyempurnaan
sebuah aplikasi. Berikut ini merupakan beberapa fungsi terkait dengan big data:
1. Dapat menentukan penyebab suatu masalah, kegagalan secara real time, Fungsi pertama
dari big data adalah menentukan dan menganalisa penyebab dari suatu permasalahan
yang terjadi di dalam sistem. Kemudian, dengan penggunaannya saat ini, juga dapat
meminimalisir terjadinya kegagalan dalam proses penyimpanan data. Untuk hasil analisis
tersebut dapat ditampilkan secara real-time.
2. Pengambilan sebuah keputusan yang cerdas dan tepat, Big data juga dapat digabungkan
dengan sistem dan perangkat teknologi cerdas seperti IoT (Internet of Things) dan AI
(Artificial Intelligence). Tugasnya adalah untuk memberikan dan menyimpan data dan
informasi yang dibutuhkan dalam pengembangan sebuah produk. Misalnya saja smart
city atau kota cerdas yang menggunakan bantuan kecerdasan buatan dan jaringan internet
berskala besar yang mampu untuk menghubungkan tiap sudut kota, bangunan, dan
infrastruktur pendukung lain.
3. Mendeteksi sebuah anomali atau perilaku yang menyimpang dalam struktur bisnis anda,
Fungsi yang ketiga adalah mampu untuk mendeteksi secara cepat dan tepat, bentuk atau
proses kegiatan yang menyimpang dan berhenti karena ada kesalahan dari sisi teknis
maupun non teknis. Big data juga dapat merencanakan beberapa opsi untuk mengurangi
dan mengatasi anomali tersebut dengan lebih cepat untuk membantu aktivitas bisnis
perusahaan atau organisasi anda.
4. Mengurangi biaya, waktu, dan meningkatkan performa produk aplikasi, Penyimpanan data
dengan menggunakan sistem big data juga dapat mengurangi biaya yang harus
dikeluarkan oleh perusahaan. Kemudian, waktu dalam mengelola dan menjalankan
sebuah operasi menjadi lebih cepat dengan transfer data diatas rata – rata sistem
database lain. Peningkatan performa juga menjadi kelebihan tersendiri untuk mendukung
pengembangan perangkat lunak.
d) Manfaat Big data
Banyak sekali kemudahan yang dimiliki oleh big data dari sisi fungsionalitas dan fitur yang
dimiliki. Kami membagi menjadi 2 manfaat untuk kebutuhan dalam proses teknologi informasi
(TI) dan bisnis.
1. Bidang Teknologi Informasi
Penggunaan Perangkat Mobile
Saat ini, penggunaan perangkat seperti smartphone, tablet, IPOD, dll. Sering kita
jumpai karena telah mendukung dan support dengan berbagai sistem aplikasi.
Kemudian, faktor user friendly dan mudah dibawa kemana saja merupakan kelebihan
utama dari perangkat mobile. Penggunaannya juga digunakan untuk pengembangan
perangkat mobile saat ini. Salah satu contoh yang mudah untuk anda lihat adalah
aplikasi GPS yang tentunya sudah terinstall dalam perangkat anda. GPS (Global
Positioning System) yang dimiliki oleh Google Maps menggunakan bantuan dari big
data dalam memproses dan memanajemen berbagai bentuk data. Karena, sistem
database yang dibutuhkan sangat besar. Mulai dari gambar, pemetaan lokasi hingga
dapat menjangkau hampir seluruh penjuru dunia sekaligus. Tentunya membutuhkan
sebuah basis data dengan kapasitas yang sangat besar. Sekarang, Google telah
menerapkan sistem penyimpanan berbasis cloud (awan). Sehingga, penyimpanan
dapat dilakukan secara online dan real-time dengan kapasitas yang lebih besar lagi.
Media Sosial, Hampir setiap orang menggunakan yang namanya media sosial untuk
mengakses berbagai informasi dan membagikan aktivitas keseharian pribadi.
Tentunya, banyak yang mengupload foto, video maupun teks ke dalam aplikasi media
sosial tersebut. Semua informasi tersebut merupakan jenis data yang akan terekam
dan tersimpan dalam sistem basis data dengan kapasitas besar. Bisa membayangkan
berapa ukuran yang harus dialokasi oleh media sosial seperti Facebook, Twitter,
Instagram, dll. Untuk menampung data setiap harinya. Solusi terbaik untuk mengatasi
masalah tersebut adalah dengan menggunakan big data yang memiliki performa yang
baik dalam penanganan data dengan skala besar.
Perangkat Cerdas, Sistem cerdas untuk saat ini banyak dikembangkan oleh negara –
negara maju seperti China, Jepang, Amerika, dll. Salah satu manfaat yang dimiliki oleh
perangkat cerdas adalah mampu membantu kegiatan manusia dengan lebih efektif dan
efisien. Contoh dari perangkat cerdas adalah teknologi IoT yang saat ini banyak
diterapkan pada perangkat elektronik seperti kulkas, mesin cuci, AC, dan lain
sebagainya. Dengan menggunakan sistem yang telah terintegrasi dengan jaringan
internet, maka segala bentuk aktivitas dapat dikoordinir dalam satu sistem aplikasi saja
dengan bantuan big data sebagai penyedia layanan informasi dan penyimpanan data.
Media Digital, Selanjutnya, big data juga mempengaruhi dari sisi penggunaan media
digital. Contohnya, penggunaan fitur pada website dan aplikasi streaming
seperti spotify dan netflix. Dalam sistem basis data yang mereka gunakan, mampu
mencatat data musik, film yang telah anda tonton dan memberikan sebuah
rekomendasi untuk anda. Dengan bantuan teknologi AI sendiri, basis data dapat
terintegrasi dengan baik dan cepat untuk memberikan kemudahan dalam penggunaan
aplikasi tersebut. Contoh lain dari penerapan media digital adalah fitur pada e-
commerce yang telah menerapkan AI dengan big data untuk memudahkan pengguna
dalam memberikan rekomendasi produk
2. Bidang Bisnis
Meningkatkan sistem operasional bisnis, Untuk meningkatkan produktivitas dan
efektivitas bisnis yang anda rintis, tentu memerlukan sumber daya yang memadai.
Salah satunya akan kebutuhan data yang terus meningkat. Big data dapat mengatasi
permasalahan data dengan kebutuhan yang besar untuk membantu proses
operasional bisnis anda.
Customer Relationship Management (CRM), Perlu menjaga dan meningkatkan
hubungan baik dengan pelanggan dan sales. Dengan melakukan management
menggunakan beberapa fitur tambahan untuk membantu anda dalam memonitoring
kegiatan penjualan, menghitung rata – rata konversi, dan lain sebagainya.
Mengoptimalkan pengalaman penggunaan aplikasi, Penggunaan perangkat mobile
terus meningkat, sehingga perlu adanya optimasi dari sisi software dan hardware.
Selain itu, penyimpanan data juga sangat berpengaruh terhadap optimalisasi sebuah
aplikasi. Dengan big data, proses transfer dan manajemen data berjalan lebih cepat
dan akurat
3. Big Data for development
Big Data untuk keperluan development berkaitan dengan, tetapi berbeda dari, 'tradisional
Data pembangunan '(misalnya data survei, statistik resmi), dan sektor swasta dan media
mainstream menyebutnya 'Big Data’. Big Data untuk sumber Pengembangan umumnya
memiliki beberapa / semua fitur ini:
1. Digitally generated: data yang dihasilkan secara digital (sebagai lawan yang
didigitalkan manual), dan dapat disimpan dengan menggunakan rangkaian satu dan
nol, dan dengan demikian dapat dimanipulasi oleh computer.
2. Passively produced: Data ini merupakan data yang dihasilkan atau produk dari
kehidupan kita sehari-hari atau interaksi dengan jasa digital.
3. Automatically collected: Data-data yang terbentuk dari data-data operasional dan
transaksi yang dikumpulkan dan telah diproses (ETL) dan si simpan kedalam data
mart.
4. Geographically or temporally trackable, Data –data yang menunjukan lokasi atau
posisi, misalnya data lokasi ponsel atau durasi waktu panggilan.
5. Continuously analysed: Informasi yang relevan dengan kesejahteraan manusia dan
pembangunan dan dapat dianalisis secara real-time
4. Pengunaan Big Data dalam perusahaan
IT logs Analytics
Penyimpanan Log jangka panjang, digunakan untuk analisa proses sistem yang
sedang berjalan untuk mencegah dan menaggulangi kegagalan dalam sistem,
mengunakan hasil analisa log untuk menemukan dan mentukan secara pasti
kegagalan apa yang terjadi didalam sistem, menyiapkan langkah-langkah pasti yang
dapat digunakan sebagai solusi masalah sistem.
Fraud Detection Pattern
Banyak digunakan dalam Bidang keuangan atau dimana saja transaksi finasial terlibat,
Memaksimalkan pengunaan data-data yang ada untuk memberikan kemampuan unutk
mendeteksi fraud ketika transaksi sedang berlangsung.
The Social Media Pattern
Pengunaan Big data untuk analisa media social dan sentiment pelangan, memberikan
kemampuan bagi perusahan untuk mengetahui keinginan customer secara luas,
mendapatkan feedback secara langsung, dan mengenali langsung dampak sentimen
terhadap penjualan, serta efektivitas dan penerimaan pelangan terhadap pemasaran
yang dilakukan.
The Call centere Mantra
Penyimpanan hasil perbincangan atau laporan customer dalam bentuk text yang
kemudian digunakan sebagai data untuk analisa masalah yang dihadapai customer,
memberikan kemampuan bagi perusahaan untuk memberikan tanggapan yang cepat
maupun secara langsung terhadap masalah yang dihadapi customer, serta
kemampuan unutk mendeteksi penurunan loyalitas customer dikarenakan masalah dan
ketidakpuasaan.
Risk: Patterns for Modeling and Management
Memberikan kempuaan pengunaan data secara penuh dan analisis dalam pemodelan
resiko dan menejemen resiko untuk memberikan pengetahuan akan resiko dan
penanggulangannya secara tepat dan langsung.
Big data and The Energy Sector
Memberikan kemampuan penyimpanan dan pemrosesan data secara langsung dari
berbagai sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk
memisahkannya dari signal.
e) Membangun Big Data Platform
Seperti data pergudangan, toko web atau platform TI, infrastruktur untuk data yang besar
memiliki kebutuhan yang unik. Dalam mempertimbangkan semua komponen platform data
yang besar, penting untuk diingat bahwa tujuan akhir adalah untuk dengan mudah
mengintegrasikan data yang besar dengan data perusahaan Anda untuk memungkinkan Anda
untuk melakukan analisis mendalam pada set data gabungan.
Requirement dalam big data infrastruktur :
data acquisition,
Tahap akuisisi adalah salah satu perubahan besar dalam infrastruktur pada hari-hari
sebelum big data. Karena big data mengacu pada aliran data dengan kecepatan yang
lebih tinggi dan ragam yang bervariasi, infrastruktur yang diperlukan untuk mendukung
akuisisi data yang besar harus disampaikan secara perlahan, dapat diprediksi baik di
dalam menangkap data dan dalam memprosesnya secara cepat dan sederhana, dapat
menangani volume transaksi yang sangat tinggi , sering dalam lingkungan terdistribusi,
dan dukungan yang fleksibel, struktur data dinamis.
Database NoSQL sering digunakan untuk mengambil dan menyimpan big data. Mereka
cocok untuk struktur data dinamis dan sangat terukur. Data yang disimpan dalam database
NoSQL biasanya dari berbagai variasi/ragam karena sistem dimaksudkan untuk hanya
menangkap semua data tanpa mengelompokkan dan parsing data.
Sebagai contoh, database NoSQL sering digunakan untuk mengumpulkan dan menyimpan
data media sosial. Ketika aplikasi yang digunakan pelanggan sering berubah, struktur
penyimpanan dibuat tetap sederhana. Alih-alih merancang skema dengan hubungan antar
entitas, struktur sederhana sering hanya berisi kunci utama untuk mengidentifikasi titik
data, dan kemudian wadah konten memegang data yang relevan. Struktur sederhana dan
dinamis ini memungkinkan perubahan berlangsung tanpa reorganisasi pada lapisan
penyimpanan
data organization
Dalam istilah Data pergudangan klasik, pengorganisasian data disebut integrasi data.
Karena ada volume/jumlah data yang sangat besar, ada kecenderungan untuk mengatur
data pada lokasi penyimpanan aslinya, sehingga menghemat waktu dan uang dengan
tidak memindah-midahkan data dengen volume yang besar. Infrastruktur yang diperlukan
untuk mengatur data yang besar harus mampu mengolah dan memanipulasi data di lokasi
penyimpanan asli. Biasanya diproses didalam batch untuk memproses data yang besar,
beragam format, dari tidak terstruktur menjadi terstruktur.
Apache Hadoop adalah sebuah teknologi baru yang memungkinkan volume data yang
besar untuk diatur dan diproses sambil menjaga data pada cluster penyimpanan data asli.
Hadoop Distributed File System (HDFS) adalah sistem penyimpanan jangka panjang untuk
log web misalnya. Log web ini berubah menjadi perilaku browsing dengan menjalankan
program MapReduce di cluster dan menghasilkan hasil yang dikumpulkan di dalam cluster
yang sama. Hasil ini dikumpulkan kemudian dimuat ke dalam sistem DBMS relasional.
data analysis
Karena data tidak selalu bergerak selama fase organisasi, analisis ini juga dapat dilakukan
dalam lingkungan terdistribusi, di mana beberapa data akan tinggal di mana data itu
awalnya disimpan dan diakses secara transparan dari sebuah data warehouse.
Infrastruktur yang diperlukan untuk menganalisis data yang besar harus mampu
mendukung analisis yang lebih dalam seperti analisis statistik dan data mining, pada data
dengan jenis yang beragam dan disimpan dalam sistem yang terpisah, memberikan waktu
respon lebih cepat didorong oleh perubahan perilaku; dan mengotomatisasi keputusan
berdasarkan model analitis. Yang paling penting, infrastruktur harus mampu
mengintegrasikan analisis pada kombinasi data yang besar dan data perusahaan
tradisional. Wawasan baru datang bukan hanya dari analisis data baru, tapi dari
menganalisisnya dalam konteks yang lama untuk memberikan perspektif baru tentang
masalah lama.
Misalnya, menganalisis data persediaan dari mesin penjual otomatis cerdas dalam
kombinasi dengan acara kalender untuk tempat di mana mesin penjual otomatis berada,
akan menentukan kombinasi produk yang optimal dan jadwal pengisian untuk mesin
penjual otomatis.
- Menjaga dari biaya yang turun karena pengguna hanya perlu membayar penyimpanan
dan penggunaan computer
- Mudah diskalakan
10. Java
Java adalah bahasa pemrograman klasik yang berorientasi objek yang sudah ada selama
bertahun-tahun. Tools ini sederhana, memiliki arsitektur yang netral, aman, platform yang
bersifat mandiri, dan berorientasi objek. Keuntungan :
- Cocok untuk proyek sains yang besar jika digunakan dengan Java 8 dan Lambdas
- Java memiliki rangkaian alat dan perpustakaan yang luas sehingga sempurna untuk
machine learning dan data science
- Mudah dimengerti
11. MATLAB
MATLAB adalah bahasa tingkat tinggi yang digabungkan dengan lingkungan interaktif
untuk komputasi numerik, pemrograman, dan visualisasi. MATLAB adalah tools yang kuat
dengan bahasa yang digunakan dalam komputasi teknis, dan ideal untuk grafis,
matematika, dan pemrograman.
Keuntungan:
- Penggunaan yang bersifat intuitif
- Hanya dengan beberapa perubahan kode sederhana, tools ini menskalakan analisa
agar berjalan di cloud, kluster, dan GPU
12. MySQL
Sebagai salah tools terpopuler, MySQL adalah salah satu database open source paling
populer yang tersedia saat ini. Tools ini ideal untuk mengakses data dari database.
Keuntungan :
- Pengguna dapat dengan mudah menyimpan dan mengakses data secara terstruktur
- Tools ini memiliki forum diskusi aktif sehingga menyediakan banyak informasi baru
14. Rapid Miner
Tools data science ini adalah platform terpadu yang menggabungkan persiapan data,
machine learning, dan model deployment untuk membuat proses data science menjadi
lebih mudah dan cepat. Tools ini mampu melakukan sejumlah tugas yang berat dalam
industri manufaktur, telekomunikasi, utilitas, dan perbankan.
Keuntungan :
- Semua sumber daya terletak di satu platform
- GUI berdasarkan pada proses diagram blok, menyederhanakan blok ini ke lingkungan
plug-and-play
- Menggunakan desainer alur kerja visual untuk memodelkan algoritma machine learning
15. SAS
Tools data science ini dirancang khusus untuk operasi statistik. Tools ini adalah alat
perangkat lunak yang berifat close source digunakan khusus untuk menangani dan
menganalisis sejumlah besar data milik organisasi besar.
Tools ini didukung dengan baik oleh perusahaan pengembang tools dan sangat dapat
diandalkan. Namun, tools ini tidak dapat digunakan oleh individu karena biaya SAS yang
mahal dan paling cocok untuk perusahaan besar atau organisasi. Keuntungan :
- Banyak fungsi Analisa yang mencakup segala sesuatu mulai dari media sosial hingga
perkiraan otomatis serta data lokasi
- Tools ini memiliki fitur dasbor dan laporan interaktif sehingga memungkinkan pengguna
langsung melakukan pelaporan ke analisis
- Berisi teknik visualisasi data tingkat lanjut seperti pembuatan bagan otomatis untuk
menyajikan hasil dan data yang menarik.
c. Rangkuman
Tools dalam data science beragam jenisnya mulai dari algorithm.os., apache Hadoop, apache
spark, bigML, D3.js, Data robot, excel, forescastthis, Google BigQuery, Java, MATLAB,
MYSQL, NLTK, Rapit Miner, dan SAAS yang masing-masing memiliki keuntungan dan
kelemahannya masing-masing dalam penggunaannya
- SQL dan Database
SQL
1. Definisi MySQL
SQL atau Standard Query Language adalah bahasa pemrograman yang digunakan dalam
mengakses, mengubah, dan memanipulasi data yang berbasis relasional. Tentu saja bahasa
komputer dalam data basis relasional ini berdasarkan standar yang dikeluarkan oleh American
National Standard Institute (ANSI). Standardisasi SQL sudah ada sejak tahun 1986 dan
memang diinisiasi oleh ANSI. Hingga saat ini banyak server dalam sebuah database
maupun software mampu mengartikan bahasa SQL. Maka dari itulah, SQL merupakan bahan
pembicaraan dan sebuah materi yang sangat penting bagi kamu yang bergelut dalam dunia IT
maupun hal-hal yang bersinggungan dengan database relasional.
2. Sejarah Kemunculan MySQL dan Data Base
Bila kita berbicara mengenai sejarah munculnya dan pengertian SQL dapat mengacu pada
artikel dari Jhonny Oracle yang merupakan salah seorang peneliti di IBM. Artikel tersebut
membahas mengenai ide pembuatan sebuah basis data relasional yang muncul di tahun 1970,
tepatnya pada bulan Juni. Pada artikel tersebut juga dibahas mengenai kemungkinan di masa
mendatang untuk menciptakan sebuah bahasa data yang standar. Oleh karena itulah
kemudian muncul istilah SEQUEL yang mengacu pada singkatan dari Structured English
Query Language. Selang beberapa waktu, IBM lantas mencanangkan proyek basis data
relasional SEQUEL dan karena namanya cukup sulit dieja maka disingkat menjadi SQL.
Setelah proses standardisasi selesari tahun 1986, lalu SQL mengalami perbaikan tahun 1989.
Tahun 1992 muncul versi SQL92 dan di tahun 1999 dengan berbagai pembaharuan muncullah
SQL99. Namun, dalam dunia IT SQL yang sering digunakan mereferensikan pada SQL92.
Meski begitu, sampai sekarang pun sebenarnya tidak ada sebuah server berbasis data yang
menggunakan maupun mendukung SQL99. Ini lebih tergantung pada dialek masing-
masing server yang digunakan.
3. Fungsi MySQL
Keberadaan SQL dalam mengelola sebuah database memberikan fungsi tersendiri. Bagi
seorang admin, adanya SQL dapat memungkinkan kamu untuk mengakses maupun
mengubah database. Kamu pun bisa menjalankan sebuah query maupun mengambil data
yang dibutuhkan. Termasuk pula memperbarui atau menyisipkan data dalam database.
SQL juga bisa digunakan untuk menghapus sebuah data pada database. Fungsi lainnya SQL
adalah untuk membuat sebuah prosedur baru dan ini akan tersimpan dalam sebuah database.
Selain itu juga bisa mengatur hak akses dalam tabel, prosedur, maupun hal-hal penting
lainnya.
4. Jenis-Jenis Perintah dalam MySQL
Setelah kamu mengetahui sejarah dan pengertian SQL, kini saatnya untuk lebih mengetahui
apa saja perintah-perintah dasar yang terdapat dalam SQR tersebut. Setidaknya ada tiga jenis
perintah dasar dalam SQL yang penjabarannya akan diulas dalam poin-poin berikut ini.
a. Data Definition Language (DDL)
Data Definition Languange (DDL) adalah perintah yang digunakan untuk mendefinisikan
data seperti membuat tabel database baru, mengubah dataset, dan menghapus data.
Kemudian, perintah dasar DDL masih dibedakan lagi ke dalam setidaknya lima jenis
perintah yakni bisa kamu lihat di bawah ini.
- Perintah Create: perintah untuk membuat tabel baru di dalam sebuah database adalah
create. Tak cuma untuk tabel baru, tapi juga database maupun kolom baru. Kamu bisa
membuat sebuah query dengan contoh ‘CREATE DATABASE nama_database.
- Perintah Alter: biasa digunakan ketika seseorang ingin mengubah struktur tabel yang
sebelumnya sudah ada. Bisa jadi dalam hal ini adalah seperti nama tabel, penambahan
kolom, mengubah, maupun menghapus kolom serta menambahkan atribut lainnya.
- Perintah Rename: dapat kamu gunakan untuk mengubah sebuah nama di sebuah
tabel ataupun kolom yang ada. Bila kamu menggunakan perintah ini maka query-nya
menjadi ‘RENAME TABLE nama_tabel_lama TO nama_tabel_baru”
- Perintah Drop: Bisa kamu gunakan dalam menghapus baik itu berupa database, table
maupun kolom hingga index.
- Perintah Show: perintah DDL ini digunakan untuk menampilkan sebuah tabel yang ada.
b. Data Manipulation Language (DML)
Pada database SQL, perintah yang digunakan untuk memanipulasi data adalah Data
Manipulation Language atau DML. Perintah dalam DML juga terbagi ke dalam empat jenis.
Beberapa di antaranya adalah insert, select, update, dan delete.
Perintah Insert: Kamu bisa menggunakan perintah ini untuk memasukkan
sebuah record baru di dalam sebuah tabel database.
Perintah Select: Select digunakan untuk memanipulasi data dengan tujuan
menampilkan maupun mengambil sebuah data pada tabel. Data yang diambil pun tidak
hanya terbatas pada satu jenis saja melainkan lebih dari satu tabel dengan memakai
relasi.
Perintah update: Ini dapat kamu gunakan ketika ingin melakukan pembaruan data di
sebuah tabel. Contohnya saja jika ada kesalahan ketika memasukkan sebuah record.
Kamu tidak perlu menghapusnya dan bisa diperbaiki menggunakan perintah ini.
Perintah Delete: Perintah DML ini dapat digunakan ketika kamu ingin menghapus
sebuah record yang ada dalam sebuah tabel.
c. Data Control Language (DCL)
Perintah dasar berikutnya adalah Data Control Language atau DCL. Perintah SQL ini
digunakan khususnya untuk mengatur hak apa saja yang dimiliki oleh pengguna. Baik itu
hak terhadap sebuah database ataupun pada tabel maupun field yang ada. Melalui
perintah ini, seorang admin database bisa menjaga kerahasiaan sebuah database.
Terutama untuk yang penting. DCL berdasarkan perintah dasarnya terbagi dalam dua
perintah utama yakni:
Perintah Grant: Perintah ini biasanya digunakan ketika admin database ingin
memberikan hak akses ke user lainnya. Tentu pemberian hak akses ini dapat dibatasi
atau diatur. Dalam hal ini admin pun dapat memberikan akses mengenai perintah
dalam DML di atas.
Perintah Revoke: Kebalikannya dari Grant, Revoke terkadang sering digunakan untuk
mencabut maupun menghapus hak akses seorang pengguna yang awalnya diberikan
akses oleh admin database melalui perintah Grant sebelumnya.
5. Pekerjaan yang Membutuhkan Keterampilan MySQL
Setelah membahas tentang apa itu SQL, mari kita singgung sedikit mengenai jenis-jenis
pekerjaan yang membutuhkan keterampilan SQL. Karena SQL sangat berkaitan erat dengan
pengelolaan data, maka sebagian besar profesi dalam bidang data memerlukan
keterampilan untuk menggunakan sistem query ini. Di bawah ini adalah beberapa pekerjaan
yang membutuhkan keterampilan SQL:
a) Data Scientist
Data scientist adalah seseorang yang bergulat dengan pembuatan database, mengolah
data, dan menerjemahkannya menjadi sesuatu yang lebih mudah untuk ditelaah —
terjemahan ini disebut dengan produk data.
Produk data inilah yang nantinya akan dijadikan acuan oleh sebuah perusahaan untuk
membuat keputusan bisnis dan kebijakan lainnya. Karena sifat pekerjaan yang berkaitan
erat dengan data, maka data scientist memerlukan skill pengelolaan data dengan SQL.
b) Data Engineer
Seorang data engineer bertanggung jawab untuk menemukan tren atau pola dalam
sebuah set data, kemudian mengembangkan sebuah algoritma untuk membuat data
tersebut memiliki manfaat bagi perusahaan. Selain itu, data engineer juga bertanggung
jawab untuk membangun algoritma yang dapat digunakan untuk mengakses data mentah
dengan lebih mudah. Maka dari itu, data engineer memerlukan keahlian dalam SQL untuk
mempermudah pengelolaan data.
c) Business Analyst
Seorang business analyst bertugas untuk memandu perusahaan dalam menciptakan
proses, produk, layanan, dan software melalui analisa bisnis. Pada umumnya, seorang
business analyst akan menjalankan gap analysis dengan tujuan untuk mengidentifikasi
langkah yang diperlukan untuk memajukan bisnis tersebut. Apabila hasil dari gap
analysis tersebut berkaitan dengan data, maka SQL diperlukan untuk menemukan
kesenjangan dalam data set tersebut. Analisa kesenjangan yang terperinci adalah kunci
sukses dari seorang business analyst.
d) Database Administrator
Seorang Database Administrator (DBA) bertugas untuk mengelola software database
untuk menyimpan, menyusun, dan mengakses data dengan sistem yang matang. DBA
pada umumnya membawahi tim SQL programmer, yang tentu saja mewajibkannya untuk
menguasai bahasa pemrograman tersebut.
e) Quality Assurance Tester
Seorang QA Tester pada umumnya bertugas untuk memeriksa keruskan atau masalah
pada produk digital seperti aplikasi, software e, game, dan website. Produk digital
seperti di atas seringkali menyimpan sebagian besar informasi pengguna dalam sebuah
database berbasis SQL. Untuk mengetahui detail terkait kerusakan dan masalah pada
produk digital, QA Tester tentunya wajib menguasai SQL agar dapat menemukan informasi
tersebut.
Data Base
1. Definisi Data Base
Database atau basis data adalah kumpulan data yang dikelola sedemikian rupa berdasarkan
ketentuan tertentu yang saling berhubungan sehingga mudah dalam pengelolaannya. Melalui
pengelolaan tersebut pengguna dapat memperoleh kemudahan dalam mencari informasi,
menyimpan informasi dan membuang informasi. Adapun pengertian lain dari database adalah
sistem yang berfungsi sebagai mengumpulkan file, tabel, atau arsip yang terhubung dan
disimpan dalam berbagai media elektronik.
2. Jenis dan Fungsi Data Base
a. Operational Database
Operational Database atau biasa disebut dengan database OLTP (On Line Transaction
Processing), berguna untuk mengelola data yang dinamis secara langsung atau real-time.
Jenis ini memungkinkan para pengguna dapat melakukan, melihat, dan memodifikasi data.
Modifikasi tersebut bisa berupa mengubah, menambah, menghapus data secara langsung
melalui perangkat keras yang digunakan.
1) JSON
JSON (JavaScript Object Notation) adalah format file yang menggunakan teks untuk
pengiriman data. Format ini sangat umum digunakan pengguna untuk pertukaran data
layaknya berkomunikasi cepat dengan melalui web browser dan web server.
Sinkronisasi data bisa dilakukan secara real-time. Format JSON sendiri berasal dari
pemrograman JavaScript, melalui pembuatannya JSON memiliki format bahasa yang
berbeda dari lainnya. Diketahui bahwa semua file JSON selalu menggunakan ekstensi
khusus berupa “json”.
2) XML
XML (Extensible Markup Language) adalah bahasa program markup yang memiliki
aturan untuk memberikan dua kode dokumen berbeda yang bisa dibaca oleh manusia
dan dibaca oleh komputer. Melalui XML, akan menghasilkan format data berupa teks
yang dapat digunakan untuk merepresentasikan struktur basis data. Selain itu,
sinkronisasi data dapat dilakukan secara real-time oleh pengguna. Bahasa program ini
sangat cocok digunakan untuk menangani basis data pada web browser dan web
server. Struktur yang digunakan XML dinilai banyak memiliki kesamaan dengan format
JSON.
b. Database Warehouse
Database Warehouse adalah sistem basis data yang biasa digunakan untuk pelaporan dan
analisis data. Sistem ini dianggap sebagai komponen inti dari business
intelligence. Database Warehouse merupakan repositori sentral data yang terpadu dari
satu atau lebih sumber yang berbeda. Database tersebut juga menyimpan data terkini dan
historis dengan satu tempat yang digunakan untuk membuat laporan analisis. Data yang
tersimpan di warehouse awalnya diunggah dari sistem operasi. Data bisa melewati
penyimpanan operasional dan memungkinkan untuk pembersihan data. Proses tersebut
menjadi operasi tambahannya dan dapat memastikan kualitas data sebelum digunakan
di warehouse sebagai pelaporannya.
c. Microsoft SQL Server
Microsoft SQL Server adalah sistem basis data yang dibangun oleh Microsoft.
Sebagai server database, sistem ini merupakan produk perangkat lunak yang berfungsi
menyimpan dan mengambil data sesuai permintaan aplikasi lainnya. Hal tersebut
memungkinkan dapat berjalan baik melalui komputer yang sama atau komputer lainnya
melalui jaringan internet. Setidaknya Microsoft pernah memasarkan 12 edisi yang berbeda
sistem Microsoft SQL Server ini. Hal itu ditujukan untuk memberikan pilihan kepada
pengguna dan untuk kebutuhan yang berbeda juga.
d. Distributed Database
Distributed Database adalah basis data yang perangkat penyimpanannya tidak terpasang
pada perangkat komputer yang sama. Basis data tersebut disimpan di beberapa perangkat
komputer yang terletak di tempat yang sama atau tersebar melalui jaringan komputer
lainnya yang saling berhubungan. Sistem ini tidak sama dengan sistem paralel yang
menggabungkan erat dan bersistem data tunggal. Sistem ini terdistribusi melalui situs yang
tergabung dan tidak memiliki komponen fisik. Melalui administratornya, basis data dapat
mendistribusikan sekumpulan data di beberapa lokasi yang berada di server jaringan
terorganisir. Karena sistem yang begitu unik, basis data terdistribusi bisa meningkatkan
kinerja bagi end user dengan membiarkan transaksi melalui proses mesin yang banyak
sehingga tidak fokus pada satu mesin saja.
e. Microsoft Access (Office)
Microsoft Access adalah sistem DBMS yang menggabungkan Microsoft Jet Database
Engine dengan alat pengembang perangkat lunak. Microsoft Access menyimpan data
dengan formatnya sendiri. Melalui software ini pengguna dapat mengimpor atau
menghubungkan langsung ke data yang tersimpan di database lainnya. Microsoft Access
sangat cocok digunakan pada sistem informasi dengan distributed database. Karena
penyimpanan file tidak memerlukan server database aktif sehingga bersifat portable.
f. Relational Database
Relational Database atau basis data relasional adalah basis data yang mengorganisir
berdasarkan model hubungan data. Banyak sekali perangkat lunak yang menggunakan
sistem ini untuk mengatur dan memelihara basis data melalui hubungan setiap data.
Umumnya, semua sistem menggunakan Structured Query Language (SQL) sebagai
bahasa pemrograman untuk pemeliharaan basis data dan query.
g. MySQL
MySQL adalah sebuah sistem untuk manajemen basis data relasional. Banyak sekali
produk-produk IT yang dibuat dengan menggunakan komponen utama MySQL. Beberapa
aplikasi seperti WordPress, Google, Flickr, Youtube, Facebook, Joomla, phpBB, Drupal,
dan MODx menggunakan sistem ini untuk manajemen basis data relasional mereka.
h. PostgreSQL
Sistem kedua yang merupakan sistem pengelolaan basis data relasional adalah
PostgreSQL. Sistem ini berfungsi untuk menyimpan data secara aman dan dapat
mengembalikan data tersebut sebagai respon atas request dari aplikasi lainnya.
PostgreSQL dapat bekerja melalui aplikasi mesin tunggal kecil hingga aplikasi internet
besar beserta pengguna yang banyak secara bersamaan. Sistem ini biasa digunakan pada
sistem operasi mac OS server, karena pengaturannya sudah tersedia secara default.
Sistem operasi lainnya seperti Windows dan Linux juga dapat ditemukan dengan
mengubah pengaturannya.
i. MariaDB
MariaDB adalah sistem yang dikembangkan dari MySQL. Pengembangan ini bertujuan
untuk mempertahankan kompatibilitas yang tinggi dari MySQL dan cocok dengan API
MySQL beserta perintah-perintahnya. MariaDB memiliki mesin penyimpanan XtraDB untuk
mengganti InnoDB. Sistem ini dikembangkan langsung oleh beberapa pengembang asli
MySQL dengan pihak yang bercabang. Tujuannya adalah agar tidak diakuisisi oleh Oracle
Corporation yang merupakan kompetitornya.
j. MongoDB
MongoDB adalah software database yang berorientasi pada
dokumen cross platform dan open source. MongoDB menggunakan dokumen yang mirip
dengan skema JSON, oleh karena itu sistemnya diklasifikasikan ke dalam program basis
data NoSQL.
k. Oracle Database
Oracle Database adalah sistem relation database selanjutnya yang diproduksi dan
dipasarkan oleh perusahaan Oracle. Dalam penggunaannya, sistem Oracle mengacu pada
struktur memori server–side sebagai sistem area globalnya. Sistem area global dapat
menyimpan cache, perintah SQL, dan informasi pengguna. Selain itu, sistem ini
memungkinkan untuk menyimpan riwayat transaksional seperti redo log online.
l. SAP HANA
SAP HANA adalah sistem lain yang berorientasi pada kolom dan hubungan antar tabel.
Sistem ini memiliki fungsi utama sebagai database server yang menyimpan dan
mengambil data sesuai permintaan aplikasi. Selain fungsi tersebut, SAP HANA juga dapat
melakukan analisis lanjutan seperti analisis prediksi, pemrosesan data spasial, analisis
teks, analisis streaming, pencarian teks, dan pemrosesan data grafik. SAP HANA ini
merupakan sistem yang dikembangkan oleh SAP SE.
m. IBM Db2
IBM Db2 adalah sistem lainnya yang dikembangkan oleh perusahaan IBM. Melalui sistem
ini, model relasional dapat terdukung. Hanya saja versi terbarunya IBM Db2 memiliki multi-
fungsi yang mendukung fitur relasional dan non relasional seperti JSON dan XML. Melalui
sejarahnya, IBM Db2 merupakan sistem yang dibuat untuk produk DB2 pada masing-
masing sistem operasi utamanya. Pada tahun 1990-an, Perusahaan IBM mulai membuat
produk DB2 universal yang kodenya dapat digunakan untuk sistem operasi lainnya.
n. MemSQL
MemSQL adalah sistem manajemen basis data SQL terdistribusi dan in–memory. Sistem
ini juga termasuk ke dalam sistem manajemen basis data relasional (RDBMS). MemSQL
berfungsi untuk mengkompilasi SQL ke dalam kode mesin melalui proses pembuatan kode
atau code generation.
o. Interbase
Interbase adalah sistem RBMS yang berbeda dengan produk lainnya. Sistem ini
memiliki footprint yang minim, persyaratan administrasi yang hampir nol dan arsitektur
multi generasi. Interbase dapat digunakan di sistem operasi Windows, macOS, Linux,
Solaris, iOS, dan Android. Sistem ini dibangun langsung oleh Embarcadero Technologies
(Borland dulunya).
p. Firebird
Sistem basis data relasional terakhir adalah Firebird. Firebird adalah sistem SQL
yang open source dan berjalan di sistem operasi mac OS X, Windows, Linux, dan sistem
operasi lainnya yang unik. Basis data Firebird juga merupakan cabang dari open
source Borland Interbase pada tahun 2000. Hanya saja sejak versi Firebird 1.5 kode yang
dibuat sebagian besar telah ditulis ulang.
q. End-User Database
r. SQLite
s. SQLite adalah sistem manajemen basis data yang ada pada library pemrograman C.
Berbeda dengan sistem lainnya, SQLite bukan merupakan mesin database client server.
SQLite tertanam ke dalam program akhir sehingga cocok digunakan dalam mendukung
penyimpanan data akhir end user. SQLite sangat populer digunakan sebagai perangkat
lunak database untuk penyimpanan lokal / klien melalui perangkat lunak aplikasi seperti
peramban web. Sistem ini merupakan sistem yang paling banyak digunakan melalui sistem
operasi, peramban web, dan sistem embedded yang lebih luas seperti ponsel.
3. Manfaat Data Base
Dari berbagai jenis beserta fungsi dan pengertian database sebelumnya, ternyata sistem ini
bermanfaat bagi penggunanya. Manfaat tersebut berupa:
1. Kecepatan dan kemudahan
Sistem database memberikan kemampuan dalam seleksi data menjadi satu kelompok
yang terurut dengan cepat. Instrumen tersebut menghasilkan pencarian informasi yang
dibutuhkan ditemukan dengan cepat. Kecepatannya juga dipengaruhi oleh
jenis database yang digunakan. Setiap jenis database memberikan kemampuan yang
berbeda-beda.
2. Multi-user
Database memberikan kemudahan akses bagi banyak pengguna dalam waktu yang
bersamaan. Sistem tersebut memungkinkan akses suatu dokumen ke lebih dari satu
pengguna. Sehingga kinerja mesin dan jaringan dimudahkan melalui multi-user karena
penyimpanan hanya terdiri satu unit yang dapat diakses secara bersamaan.
3. Keamanan data
Sistem database melalui bahasa pemrogramannya telah dibuat secara safety. Melalui
instrumen password membuat data tersebut hanya bisa diakses kepada pihak yang
diijinkan. Manajemen tersebut telah diterapkan pada hampir seluruh jenis sistem database.
Sehingga menjadikan keamanan data merupakan hal prioritas bagi layanan
sistem database.
4. Penghematan biaya perangkat
Memiliki satu database terpusat sudah cukup bagi perusahaan besar yang membutuhkan
pengumpulan data secara ringkas. Hal ini membuat perusahaan tidak memerlukan ruang
penyimpanan di tiap tempat yang berbeda. Melalui jaringan internet, cabang perusahaan di
daerah terpencil pun bisa melakukan akses data yang ada di pusat.
5. Kontrol data terpusat
Database tidak memerlukan server lebih dari satu dalam penggunaannya. Cukup
satu server terpusat untuk menyimpan data sehingga data tersebut bisa diakses oleh
banyak pengguna. Hal ini memberikan harga yang murah bagi perusahaan untuk investasi
ruang penyimpanan data penting perusahaan. Seperti kantor perusahaan tidak perlu
membuat suatu data di tiap divisi jobnya. Setiap divisi bisa mengumpulkan data khusus
melalui satu server yang ditentukan sehingga laporan untuk atasan menjadi ringkas.
6. Mudah membuat aplikasi
Melalui kaitannya terhadap perusahaan jika perusahaan membutuhkan aplikasi input data
yang baru, programmer tidak perlu membuat ulang struktur database. Menggunakan
struktur database yang dibuat sebelumnya sudah cukup untuk mengenali aplikasi input
data yang baru.
Rangkuman
1. SQL atau Standard Query Language adalah bahasa pemrograman yang digunakan dalam
mengakses, mengubah, dan memanipulasi data yang berbasis relasional.
2. Fungsi dari SQL digunakan untuk menghapus sebuah data pada database, untuk membuat
sebuah prosedur baru dan ini akan tersimpan dalam sebuah database dan untuk mengatur
hak akses dalam tabel, prosedur, maupun hal-hal penting lainnya.
3. Jenis-jenis perintah SQL antara lain ada DDL, DML dan DCL
4. Database atau basis data adalah kumpulan data yang dikelola sedemikian rupa berdasarkan
ketentuan tertentu yang saling berhubungan sehingga mudah dalam pengelolaannya
5. Jenis dan fungsi dari data base antara lain, operational data base, warehouse database,
distributed database dan relational database serta end-user database
6. Manfaat dari penggunaan data base dapat dilihat dari kecepatan dan kemudahan, multiuser,
keamanan data, penghematan biaya perangkat, control data yang terpusat dan
kemudahannya dalam membuat aplikasi