DEPOK
APRIL 2019
STATEMENT OF AUTHORSHIP
Kami yang bertanda tangan di bawah ini menyatakan bahwa tugas terlampir adalah murni hasil
pekerjaan kami sendiri. Tidak ada pekerjaan orang lain yang kami gunakan tanpa menyebutkan
sumbernya.
Materi ini belum pernah disajikan sebagai bahan untuk tugas kecuali kami menyatakan dengan jelas
bahwa kami menyatakan menggunakannya.
Kami memahami bahwa tugas yang kami kumpulkan ini dapat diperbanyak dan/atau dikomunikasikan
untuk tujuan mendeteksi adanya plagiarisme.
1
Nama : Muhammad Rayhan Akbar
NPM : 1706057644
Tanda Tangan :
2
KATA PENGANTAR
Assalamualaikum Wr. Wb.
Puji syukur ke hadirat Tuhan Yang Maha Esa atas limpahan rahmat, taufik, dan
hidayah-Nya sehingga kami dapat menyelesaikan penyusunan makalah yang berjudul
“Penggunaan Big Data di Industri Teknologi: Analisis Kasus Data Mining yang Dilakukan
oleh Facebook” ini. Makalah ini disusun sebagai salah satu tugas kelompok mingguan untuk
memenuhi salah satu kriteria kelulusan mata kuliah Pengantar Teknologi Informasi di
Fakultas Ekonomi dan Bisnis, Universitas Indonesia tahun ajaran 2018 – 2019.
Tentunya, pembuatan makalah ini tidak terlepas dari bantuan pihak – pihak yang
terkait, baik yang melakukan secara langsung maupun tidak langsung. Oleh karena itu, pada
kesempatan ini, kami ingin mengucapkan terima kasih yang sebesar – besarnya kepada pihak
– pihak yang terkait, antara lain:
1. Ibu Rizqiah Insanita, S.T., M.M. dan Bapak Arviansyah, S.E., M.Sc., Ph.D.,
selaku dosen mata kuliah Pengantar Teknologi Informasi;
2. Rekan – rekan kelas Pengantar Teknologi Informasi; dan,
3. Pihak lainnya yang telah terlibat, baik secara langsung maupun tidak langsung.
Kami menyadari bahwa makalah yang telah kami buat sangatlah jauh dari kata
sempurna. Oleh karena itu, kami mengharapkan kritik dan saran, terlebih dari Ibu Rizqiah
Insanita, S.T., M.M. dan Bapak Arviansyah, S.E., M.Sc., Ph.D. selaku dosen mata kuliah
Pengantar Teknologi Informasi, agar dapat menjadi acuan dan bekal pengalaman bagi kami
agar dapat menjadi lebih baik ke depannya. Kami harap makalah ini dapat berguna bagi para
pembacanya dan dapat diimplementasikan dalam kehidupan sehari – hari. Sekian dan terima
kasih.
Wassalamualaikum Wr. Wb.
Depok, 11 April 2019
Tim Penulis
3
DAFTAR ISI
STATEMENT OF AUTHORSHIP 1
KATA PENGANTAR 3
DAFTAR ISI 4
BAB I PENDAHULUAN 5
A. Sinopsis Kasus 5
B. Tujuan Penulisan 5
DAFTAR PUSTAKA 30
LAMPIRAN 32
4
BAB I
PENDAHULUAN
A. Sinopsis Kasus
Data, informasi, dan database adalah hal yang paling krusial di era informasi saat
ini. Bisnis terus menerus tumbuh dan berkembang, terutama dipengaruhi efek
globalisasi, telah membuat semua data maupun informasi dapat dengan mudah diakses
dimana dan kapan saja. Data dan informasi menjadi hal yang sangat menguntungkan
bagi para pebisnis untuk menjalankan bisnisnya agar lebih efektif. Jika sebuah bisnis
gagal dalam menggunakan data yang ia peroleh, hal ini dapat membuatnya kalah saing
dengan kompetitornya. Saat ini, maraknya penggunaan media sosial pun juga menjadi
ladang bagi para pebisnis untuk dapat memperoleh keuntungan dengan menganalisis
pola, kebiasaan, dan kesukaan konsumennya. Menggunakan data yang sangat personal
dari media sosial juga dapat meningkatkan relasi antara pebisnis dengan konsumennya,
bahkan calon konsumen.
Data dan informasi yang dimiliki oleh pebisnis akan menjadi business intelligence
dari bisnis mereka. Menggunakan business intelligence dapat membuat sebuah
perusahaan memiliki Competitive advantage di pasar tempat bisnis tersebut
berkecimpung. Salah satu cara yang paling sering dilakukan untuk bisa mendapatkan
competitive advantage adalah dengan menggunakan data dan informasi sebagai dasar
untuk targeting. Menyasar konsumen dengan tipe bisnis yang cocok menjadi salah satu
hal yang efisien dan efektif untuk pertumbuhan sebuah bisnis. Data dan informasi yang
telah menjadi business intelligence dapat menguak trend dari sebuah pasar dan juga
pola yang dilakukan oleh konsumen-konsumennya. Dengan kata lain, pebisnis tersebut
dapat mengenal target pasar dan calon konsumennya lebih dalam lagi. Hal yang paling
terutama dari business intelligence sendiri adalah sebagai penimbang pebisnis untuk
mengambil sebuah keputusan. Langkah yang tepat akan semakin mudah diambil
dengan adanya business intelligence.
B. Tujuan Penulisan
Makalah ini kami tulis untuk memenuhi beberapa tujuan, antara lain:
5
1. Untuk mengetahui bagaimana implementasi business intelligence di dunia
elalui salah satu media sosial terpopuler
nyata dalam bentuk data mining m
di dunia, yakni Facebook; dan
2. Untuk mengetahui bagaimana Facebook menggunakan business intelligence
sebagai peluang untuk melakukan iklan yang lebih tersegmentasi.
6
BAB II
LANDASAN TEORI
7
kebijakan dan prosedur khusus yang menetapkan aturan tentang bagaimana
informasi diatur, diperbarui, dipelihara, dan diakses. Tata kelola informasi
mengarah pada semua manajemen dari ketersediaan, kegunaan, integritas, dan
keamanan akan data perusahaan.
8
Database h arus memiliki fleksibilitas untuk memungkinkan tiap penggunanya
mengakses informasi dalam cara apa pun yang sesuai dengan kebutuhan mereka.
Terdapat perbedaan antara pandangan logical dan physical d ari Informasi
(Baltzan, 2014).
a. Physical View of Information
Berhubungan dengan penyimpanan fisik dari informasi pada perangkat
penyimpanan (Baltzan, 2014).
b. Logical View of Information
Fokus pada bagaimana pengguna individu secara logis mengakses
informasi untuk memenuhi kebutuhan khusus bisnisnya (Baltzan, 2014).
an Kinerja
2. Meningkatkan Scalability d
Database h arus scalable untuk menampung informasi yang sangat banyak dan
emiliki skala yang luar
juga pengguna yang banyak. Pada saat ini, database m
biasa sehingga segala jenis pengguna dan program dapat melakukan pemrosesan
informasi dan mencari informasi (Baltzan, 2014).
9
b. Business-Critical Integrity Constraints
Melakukan penegakkan terhadap aturan bisnis yang vital untuk
kesuksesan organisasi dan sering membutuhkan pengetahuan dan
wawasan lebih dibanding relational integrity constraints ( Baltzan, 2014).
enghasilkan
Spesifikasi dan pelaksanaan dari integrity constraints m
informasi yang kualitasnya bagus dan akan memberikan bantuan yang
lebih baik untuk keputusan bisnis.
5. Meningkatkan Keamanan Informasi
Database menawarkan berbagai macam fitur keamanan seperti kata sandi
(password) untuk memberikan authentication, tingkat akses (access level) untuk
menentukan siapa saja yang dapat mengakses data, dan kontrol akses (access
control) untuk menentukan jenis akses apa yang dimiliki untuk informasi.
10
MIS; pengguna dapat memperbaharui situs web berbasis data dengan atau
tanpa pelatihan.
e. Mudah untuk menyimpan data dengan jumlah yang banyak. Situs web
berbasis data dapat menyimpan volume informasi yang banyak
terorganisir. Pemilik situs web dapat menggunakan templates u ntuk
mengimplementasikan perubahan pada layout, n avigasi, atau struktur situs
web. Hal tersebut dapat meningkatkan keandalan, scalability, dan kinerja
situs web.
f. Mudah untuk mengeliminasi kesalahan yang disebabkan manusia (human
error). Situs web berbasis data menangkap kesalahan entri data,
mengeliminasi ketidakkonsistenan sambil memastikan semua informasi
dimasukkan secara benar.
11
F. Melakukan Analisis Bisnis Menggunakan Data MART
Extraction, Transforming, dan Loading (ETL) adalah proses-proses yang
mengekstraksi informasi dari basis data internal dan eksternal, kemudian melakukan
transformasi dengan menggunakan seperangkat alat perusahaan yang umum, dan
memuatnya ke dalam gudang data. Gudang data kemudian mengirimkan bagian-bagian
dari informasi ke data mart. Data mart berisi sebagian informasi gudang data. gudang
data bisa dikatakan sebagai sebuah tempat yang menyimpan seluruh informasi terkait
dengan perusahaan tersebut sedangkan data mart hanya memuat informasi-informasi
yang dibutuhkan sebuah divisi seperti pemasaran atau keuangan.
1. Analisis Multidimensional
Mayoritas dari gudang data dan data mart adalah basis data berbentuk
multidimensi. Dimensi adalah atribut informasi tertentu. Setiap lapisan dalam
gudang data atau data mart mewakili informasi sesuai dengan dimensi tambahan.
Kubus informasi adalah istilah umum untuk representasi informasi multidimensi
2. Pembersihan Informasi
Menjaga informasi yang berkualitas di gudang data atau data mart sangat penting.
Untuk meningkatkan kualitas informasi organisasi dan dengan demikian
efektivitas Pengambilan keputusan, perusahaan harus mampu merumuskan
strategi untuk menjaga informasi tetap bersih. menggosok atau membersihkan
informasi adalah sebuah proses yang berfungsi untuk menyingkirkan dan
memperbaiki atau membuang data yang tidak konsisten, informasi yang salah,
atau juga informasi yang kurang lengkap. Perusahaan juga dapat mengorbankan
akurasi untuk kelengkapan data. Informasi yang akurat adalah benar, sementara
informasi lengkap tidak memiliki kekosongan. Banyak perusahaan melakukan
audit kualitas data untuk menentukan akurasi dan kelengkapan datanya
12
memungkinkan mereka untuk mengidentifikasi tren dan meningkatkan prakiraan.
Untuk melakukan data mining, pengguna membutuhkan data-mining tools. Data
mining tools menggunakan berbagai teknik untuk menemukan pola dan hubungan
dalam volume besar informasi yang memprediksi perilaku dan panduan pengambilan
keputusan.
Data mining mengungkapkan tren dan pola, yang analis gunakan untuk
membangun model yang, bila terkena new information set, melakukan berbagai fungsi
analisis informasi. Data-mining tools untuk data gudang membantu pengguna
mengungkap business intelligence dalam data mereka. Beberapa bidang utama dimana
eliputi:
bisnis menggunakan data mining m
● Klasifikasi: menetapkan catatan untuk salah satu set kelas yang sudah ditetapkan.
● Estimasi: menentukan nilai untuk perilaku variabel kontinu yang tidak dikenal
atau perkiraan nilai masa depan.
13
● Afinitas pengelompokan-menentukan mana hal-hal pergi bersama.
● Clustering-segmen populasi yang heterogen catatan ke sejumlah lebih homogen
sub kumpulan.
Data mining t erjadi pada data terstruktur yang sudah dalam database atau
spreadsheet. Data terstruktur tidak ada di lokasi tetap dan dapat mencakup dokumen
teks, PDF, pesan suara, email, dan sebagainya. Text mining menganalisa data
terstruktur untuk menemukan tren dan pola dalam kata-kata dan kalimat. Tiga bentuk
umum untuk mining structured a nd unstructured adalah:
● Analisis Cluster
● Deteksi Asosiasi
Association Detection mengungkapkan hubungan antara variabel bersama
dengan sifat dan frekuensi hubungan. Banyak orang menyebut asosiasi deteksi
algoritma sebagai aturan asosiasi generator karena mereka membuat aturan
untuk menentukan kemungkinan dari peristiwa yang terjadi bersama pada
waktu tertentu atau mengikuti satu sama lain di logical progression. Salah satu
bentuk yang paling umum dari analisis association detection ialah Market
basket analysis. Market basket analysis menganalisis barang tersebut sebagai
situs web dan checkout scanner informasi untuk mendeteksi perilaku
customer's buying dan memprediksi perilaku dengan mengidentifikasi afinitas
di antara pilihan produk dan layanan customer's. Market basket analysis sering
digunakan untuk mengembangkan kampanye pemasaran untuk cross-selling
produk dan layanan (terutama di bidang perbankan, asuransi, dan keuangan)
dan untuk persediaan kontrol, rak-penempatan produk, dan aplikasi ritel serta
pemasaran.
● Analisis Statistik
Statistical Analysis melakukan fungsi tersebut sebagai informasi korelasi,
distribusi, perhitungan, dan analisis varians. Data mining tools menawarkan
pengetahuan pekerja yang luas serta berbagai kemampuan statistik sehingga
mereka dapat dengan cepat membangun berbagai statistik model. Peramalan
adalah bentuk yang umum pada analisis statistik. Time-Series information
times tamped informasi yang dikumpulkan pada frekuensi tertentu. Secara
resmi ditetapkan, forecast adalah prediksi berdasarkan waktu-informasi seri.
14
Contoh time-Series informasi termasuk web kunjungan per jam, penjualan per
bulan, dan panggilan setiap hari.
● Airlines: Analisis lokasi liburan populer dengan listing penerbangan saat ini.
● Banking: Memahami penggunaan kartu kredit pelanggan dan harga gagal
bayar.
● Perawatan kesehatan: Membandingkan demografi pasien dengan penyakit
kritis.
● Asuransi: Memprediksi jumlah klaim dan biaya cakupan medis.
● Penegakan hukum: Melacak pola kejahatan, lokasi, dan perilaku kriminal.
● Pemasaran: Analisis pelanggan demografi.
● Eceran: Memprediksi penjualan, tingkat persediaan, dan distribusi.
● Teknologi: Memprediksi kegagalan perangkat keras.
15
Visual Business Intelligence
Informing sedang mengakses sejumlah besar data dari tiga tahun berbeda sistem.
Infografis (informasi grafis) menampilkan informasi grafis sehingga hal ini dapat
mudah dipahami. Infographics dapat menyajikan hasil analisis data besar mencari pola
dan hubungan yang memantau perubahan dalam variabel seiring waktu. Data visualisasi
menjelaskan teknologi yang memungkinkan pengguna untuk “see” atau
memvisualisasikan data untuk mengubah informasi ke dalam perspektif bisnis. Business
intelligence dashboards melacak matriks perusahaan seperti faktor keberhasilan kritis
dan kunci indikator kinerja dan mencakup kemampuan maju seperti kontrol interaktif
yang memungkinkan pengguna untuk memanipulasi data untuk analisis.
16
BAB III
PEMBAHASAN
17
Berbicara mengenai information timeliness Facebook, Facebook selalu memberikan
real-time information baik kepada karyawannya maupun para penggunanya. Berdasarkan data
yang diperoleh dari wishpond.com, terdapat sekitar 1.500 posts yang sangat memungkinkan
untuk muncul dalam feed seseorang di Facebook. Selain itu, sebagai perusahaan dunia
Facebook juga menekankan pada information quality yang dihasilkan. Facebook sangat
berusaha mengurangi information inconsistency yang ada, contohnya adalah dengan
menciptakan community standards yang mengatur berbagai aspek seperti kekerasan dan
perilaku kriminal, keamanan, objectionable content, integritas dan keaslian, respecting
intellectual property, dan content-related requests. Facebook juga telah melakukan beberapa
upaya untuk mengurangi hoax agar tidak merugikan para penggunanya seperti dengan
menggunakan teknik Related Article serta bekerja sama dengan Google dan Twitter untuk
memberhentikan penyebaran informasi yang keliru.
Namun, Facebook masih menghadapi beberapa kendala dalam Information
Governance. Facebook pernah gagal saat melindungi keamanan data perusahaannya. Sebut
saja, ketika Cambridge Analytica, sebuah perusahaan consulting politik asal Inggris yang
menggunakan personal data para pengguna Facebook agar dapat dimanfaatkan sesuai dengan
keinginan politikus yang bekerja sama dengan Cambridge Analytica. Kasus ini tentunya
sangat dapat menurunkan rasa kepercayaan para pengguna terhadap Facebook itu sendiri.
18
Facebook Ads akan dapat ditinjau dari Ads Insights API. Facebook juga bekerja sama dengan
LinkedIn, Twitter, dan Google untuk menciptakan WebScaleSQL, sebuah MySQL sistem
yang dirancang khusus untuk website-website besar. Melalui WebScaleSQL,
perusahaan-perusahaan ini dapat memiliki sistem database yang saling terintegrasi serta open
sourced, sehingga data dari satu website dapat dengan mudah dibagikan.
Contoh Data Element yang ada adalah berbagai pages yang pengguna gemar
kunjungi, comments, dan konten-konten lainnya yang mereka sukai, dan berbagai hal lainnya.
Data-data ini akan mampu menghasilkan kesimpulan akan psychographic profile dari
seseorang. Facebook juga memiliki Data Model untuk berbagai aktivitas di dalamnya.
Berikut adalah contoh Data Model dari aktivitas My Facebook App Invitations :
Sumber Gambar :
http://www.databaseanswers.org/data_models/my_facebook_app_invitations/index.htm
Facebook juga menggunakan Metadata. Melalui sharing system yang dimiliki
Facebook yang disebut dengan Open Graph, Metadata dapat ditampilkan. Contohnya, ketika
seseorang mengunggah foto ke dalam Facebook, Metadata Tags akan dapat memberikan
informasi mengenai image size, location data, penggunaan dan jenis kamera, serta thumbnail
foto tersebut.
Sosial media yang diciptakan oleh Mark Zuckerberg ini memiliki Attribution Models
yang dapat diklasifikasi menjadi dua : Rule Based Attribution Models dan Algorithmic
Attribution Models. Contoh Rule Based Attribution Models adalah Even Credit, Last Click or
19
Visit, Last Touch, Positional 30%, Positional 40%, Time Decay 1-Day, dan Time Decay
acebook juga memiliki Entity, contohnya data mengenai lagu musisi yang seseorang
7-Day. F
dengarkan serta mengetahui siapa yang menyukai musisi tersebut dan data kunjungan
restoran seseorang seperti lokasinya, siapa pengunjungnya, dan restoran lainnya yang disukai.
Terakhir, Facebook juga menerapkan Keys. Primary Key yang digunakan Facebook adalah
User ID masing-masing pengguna, dan Foreign Key yang digunakan misalnya merujuk ke
mutual friends masing-masing pengguna.
20
lebih tersaringnya informasi dari data yang begitu banyak. Dengan itu, Facebook lebih mudah
untuk menargetkan pengguna dengan iklan tertentu.
Selain mengurangi informasi yang overload, scalability d an kinerja Facebook
meningkat. Padahal data yang dimiliki Facebook semakin lama semakin banyak. Namun,
dengan bantuan perangkat-perangkat SQL Facebook menjadi lebih mudah dalam mengelola
data-data tersebut. selain itu, Penggunaan data menjadi lebih efektif. Hal ini didukung dengan
kemampuan Hive/Hadoop Warehouse yang memiliki spesifikasi penyimpanan data sebagai
berikut:
● 4800 cores, 5.5 PetaBytes
● 12 TB per node
● Topologi jaringan dua tingkat
○ 1 Gbit/sec dari node ke saklar rak
○ 4 Gbit/sec ke saklar rak tingkat atas
Berikut merupakan desain dari database yang dimiliki Facebook.
Sumber Gambar:
21
http://web.archive.org/web/20121031052327/http://blogs.x2line.com/al/archive/2007/
06/02/3124.aspx
22
● Ajak orang memasang aplikasi Anda
● Tingkatkan interaksi dalam aplikasi Anda
● Giring orang untuk menonton video Anda
Profil bisnis Instagram juga dapat memilih audiens mereka sendiri dengan
menggunakan data-data yang Instagram miliki seperti tempat, usia, jenis kelamin, bahasa,
hubungan, pendidikan, pekerjaan, status keuangan, dan masih banyak lagi. Para pengguna
profil bisnis Instagram dapat membuat apa yang disebut dengan custom audience untuk
menjangkau orang-orang yang sudah berinteraksi dengan bisnis mereka, atau lookalike
audience u ntuk menjangkau orang-orang baru di Facebook yang mirip dengan audience
mereka yang paling berharga. Bahkan, para pengguna profil bisnis Instagram dapat
mengiklankan produk mereka dengan jadwal yang telah dibuat oleh mereka sendiri.
Tentunya, hal ini sangat membantu pebisnis agar lebih mudah membuat konten yang cocok
dan juga mengatur penjadwalan yang tepat setelah mendapat data-data tersebut.
Sebenarnya, data-data asli para pengguna tidak dapat dilihat langsung oleh para
pebisnis ini. Sistem kerjanya adalah Instagram mengunggah iklan-iklan tersebut kepada
pengguna yang cocok dengan kriteria audiens para pebisnis. Lebih tepatnya, para pebisnis ini
tidak perlu repot-repot mengelola data.
23
Dalam penggunaan Business Intelligence, Instagram menggunakan Artificial
Intelligence atau biasa disebut dengan AI untuk mendukung keputusan bisnis yang akan
diambil. Contohnya seperti dalam filter spam, I nstagram menggunakan AI untuk memenuhi
kemauan penggunanya agar tidak ada fake messages y ang masuk. Ketika ada fake messages
atau fake account y ang masuk ke dalam database Instagram, maka Instagram langsung
menghapus pesan atau akun tersebut secara otomatis dengan bantuan AI. AI juga dapat
memerangi Cyberbullying dan menghapus komentar - komentar user y ang bersifat offensive
atau mempunyai konten negatif di dalam komentarnya. Instagram juga mempelajari Human
Condition d engan bantuan AI. Dalam satu studi, 100 juta foto di dalam Instagram digunakan
untuk mempelajari pola berpakaian secara global. Selain pakaian, banyak juga akun
Instagram yang bisa dianalisis oleh AI untuk memperkirakan kondisi ekonomi, sosial, dan
budaya di seluruh dunia.
24
memetakan customer untuk perusahaan A sehingga kesalahan untuk beriklan
akan minim.
2. Identifikasi peluang produk baru
Selain itu, Facebook dapat melihat peluang produk baru, seperti yang kita tahu
bahwa produk baru memiliki tantangan yang sangat besar ketika baru muncul di
pasar, oleh karena itu Data Warehousing yang dimiliki Facebook dapat
membantu untuk melihat peluang produk baru.
3. Menganalisis Trend
Banyaknya pengguna Facebook untuk membagikan kegiatan sehari-hari mereka
menjadi salah satu peluang untuk Facebook memahami trend yang sedang
berlaku di suatu tempat. sehingga analisis pasar akan lebih mudah
4. Memahami Kompetitor
Selain itu kita juga dapat memahami kompetitor dengan menggunakan Data
Warehouse karena seluruh data akan tersedia sehingga kita sebagai pelaku bisnis
dapat menganalisis SWOT dari perusahaan kompetitor.
5. Memahami performa produk
Performa produk di pasaran dapat dipahami pula melalui Data Warehouse.
karena dengan memanfaatkan data yang ada, kita dapat menganalisis produk
yang kita punya untuk memperkuat produk yang perusahaan punya.
25
ada di dalam perusahaan. sehingga setiap informasi yang ada akan
direpresentasikan untuk keperluan bisnis bagi perusahaan perusahaan tertentu.
2. Pembersihan Informasi
Pengambilan keputusan di dalam Facebook harus mempertimbangkan
kebersihan informasi tetap terjaga. Dalam hal ini, Facebook harus menjamin
adanya kerahasiaan informasi perusahaan, serta keakuratan informasi yang
menjamin adanya data yang dipegang oleh perusahaan.
26
BAB IV
PENUTUP
A. Kesimpulan
Facebook memiliki beberapa information formats, seperti dokumen, presentasi,
spreadsheet, dan database s eperti perusahaan-perusahaan lainnya. Untuk small data
workload, Facebook menggunakan aplikasi TAO dan Memcache. Sedangkan, untuk
menghadapi big data, Facebook memanfaatkan aplikasi ODS yang dapat menyimpan 2
miliar time series of counters, Scuba, dan Hive. Facebook juga menggunakan beberapa
custom-built software l ainnya dengan fungsi khususnya masing-masing seperti Hbase
yang digunakan untuk graph search and messages, Cassandra untuk inbox search,
Haystack untuk menyimpan foto, Memcached untuk in-memory key atau value store,
dan Scribe untuk logging. Facebook juga tentunya juga memiliki Information
Granularities y ang sangat baik.
Facebook mengumpulkan banyak data penggunanya, mulai dari alamat e-mail
sampai dengan baterai handphone yang digunakan oleh penggunanya. Facebook
mengumpulkan data ini disebut dengan data mining. Facebook menggunakan data
mining j enis Association Detection dan Statistical Analysis. Informasi-informasi yang
dimiliki oleh Facebook ini akan digunakan untuk menyediakan, mempersonalisasi,
serta meningkatkan produk Facebook; melakukan pengukuran, analisis, dan riset;
meningkatkan keamanan dan integritas, berkomunikasi dengan penggunanya, dan
melakukan riset untuk keperluan sosial. Facebook juga akan menggunakan hasil analisis
ini dengan berbagai aplikasi third-party seperti mitra-mitranya yang menggunakan jasa
pengukuran dari Facebook, advertisers, penyedia barang dan jasa, researchers d an
akademisi, serta law enforcement.
Facebook mengelola data yang relasional melalui aplikasi MySQL. MySQL
merupakan software a tau tools untuk mengelola atau memanajemen SQL dengan
menggunakan Query a tau Bahasa khusus. Selain menggunakan MySQL, Facebook juga
menggunakan Hive (Gudang data untuk Hadoop, mendukung tabel dan varian SQL
yang disebut hiveQL) dan Cassandra (Multidimensi, distributed key-value store) untuk
perpesanan pribadi Facebook. Dengan menggunakan aplikasi serta data warehouse
27
MySQL, Hive, dan Cassandra, Facebook lebih mudah dalam mengelola datanya.
Keuntungan yang paling utama dirasakan Facebook adalah lebih tersaringnya informasi
dari data yang begitu banyak. Dengan itu, Facebook lebih mudah untuk menargetkan
pengguna dengan iklan tertentu.
Dalam penggunaan Business Intelligence, Instagram yang merupakan bagian dari
Facebook, menggunakan Artificial Intelligence ( AI) untuk mendukung keputusan bisnis
yang akan diambil. Facebook menggunakan Data Warehousing untuk menciptakan
beberapa keuntungan kompetitif. Manfaat yang didapatkan oleh Facebook dari
menggunakan Data Warehousing, yaitu mengembangkan profil customer, identifikasi
peluang produk baru, menganalisis tren, memahami kompetitor, memahami performa
produk.
B. Saran
Data mining s ebagai implementasi business intelligence memudahkan Facebook
mengumpulkan data penggunanya. Big data kemudian menjadi output dari proses data
mining. Seperti telah dijelaskan sebelumnya, Facebook dan Instagram –dibeli oleh
Facebook– menggunakan big data untuk keperluan iklan dengan pihak ketiga. Data
yang terkumpul berupa informasi mengenai gender, hobi, umur, apa yang disukai,
hingga wilayah tempat para pengguna tinggal. Situasi ini menunjukan Facebook
memiliki kewajiban untuk melindungi privasi penggunanya. Hal ini dijelaskan oleh juru
bicara Facebook yang mengatakan Facebook tidak menjual data kepada pihak ketiga.
Kebijakan mengenai perlindungan data ini diperkuat melalui laman kebijakan data yang
memuat mengenai penggunaan data pribadi pengguna oleh Facebook.
Masalah yang kemudian muncul adalah pencurian data. Data set yang dimiliki
oleh Facebook tentu sangat berharga, hal inilah yang membuat Facebook rentan dengan
pencurian data. Berdasarkan laporan The New York Times dan The Observer,
perusahaan konsultan politik Cambridge Analytica telah mencuri informasi dari 50 juta
akun Facebook. Informasi ini kemudian digunakan oleh Cambridge Analytica untuk
merancang peranti lunak guna memprediksi dan mempengaruhi pemilik suara dalam
pemilihan presiden Amerika Serikat pada tahun 2016.
Kasus ini terungkap akibat pernyataan Christopher Wylie, mantan kepala peneliti
Cambridge Analytica, y ang mengungkapkan kepada The Observer mengenai perilaku
28
Cambridge Analytica yang menggunakan informasi personal yang diambil tanpa izin
pada awal tahun 2014 untuk merancang iklan politik. Situasi ini kemudian membuat
kepercayaan publik terhadap facebook menurun. Situasi diperparah dengan turunnya
saham Facebook yang salah satu penyebabnya adalah kasus pencurian data.
Menanggapi hal ini, tentunya Facebook harus meyakinkan kembali para investor hingga
pengguna Facebook bahwa data-data yang diberikan tetap aman kemudian memberikan
proteksi lebih dan kebijakan yang tegas terkait keamanan data pengguna Facebook. Hal
ini guna mempertahankan bisnis dan kelangsungan hidup Facebook.
Hal lain yang menjadi persoalan dari big data adalah konsep big data hubris yang
menjelaskan big data sebagai pengganti, bukan pelengkap, dari pengumpulan dan
analisis tradisional. Situasi ini kemudian menciptakan big data trap. I dealnya, big data
menjadi pelengkap dari pengumpulan data dan analisis tradisional. Hal ini disebabkan
relatif banyak masalah small data pada big data. Persoalan big data trap ini tercermin
pada kasus Google Flu Trends. Analisis dari Google Flu Trends gagal memperkirakan
arah flu. Centers for Disease Control and Prevention (CDC), badan pengumpulan data
dan analisis tradisional, kemudian mengungkapkan bahwa estimasi Google berlebih dua
faktor.
enekankan pada korelasi atau
Situasi ini disebabkan analisis big data m
hubungan ketimbang penyebab. Selain itu, analisis big data menekankan konsep
theory-free. Jika tidak ada pengertian mendasar atau teori mengenai korelasi atau
hubungan, maka penyebab dari korelasi atau hubungan tersebut tidak dapat diketahui.
Analisis big data memang lebih cepat jika dibandingkan dengan analisis tradisional,
namun analisis tradisional tidak boleh diacuhkan. Hal ini yang kemudian perlu
menjadi pertimbangan Facebook dalam menggunakan data set yang dimiliki agar
sasaran iklan menjadi lebih akurat.
29
DAFTAR PUSTAKA
Buku
Baltzan, Paige (2014). Business Driven Information Systems (4th ed.). New York: McGraw
Hill.
Online
Borthakur, Dhruba. (2009). Hadoop and Hive Development at Facebook. [online] Diakses
pada 8 April 2019 melalui http://borthakur.com/ftp/hadoopworld.pdf
Digitalmarketer.id. Berniat Membuat Facebook Ads? Ini Caranya! (Tutorial). [online]
Diakses pada 6 April 2019 melalui
https://digitalmarketer.id/tools/berniat-membuat-facebook-ads-ini-caranya-tutorial/
Digitalmarketer.id. Membuat Iklan di Instagram untuk Mempromosikan Bisnis Anda. [online]
Diakses pada 5 April 2019 melalui
https://digitalmarketer.id/social-media/membuat-iklan-di-instagram-untuk-memprom
osikan-bisnis-anda/
Facebook. (2019). Data Policy. [online] Diakses pada 7 April 2019 melalui
https://www.facebook.com/full_data_use_policy
Ford, Paul. (2015). I Dreamed of a Perfect Database. [online] Diakses pada 7 April 2019
melalui https://newrepublic.com/article/124425/dreamed-perfect-database
Laucereno, S. F. (2016). Saham Facebook Turun 40%, Karena Kasus Data Pengguna Bocor.
https://finance.detik.com/bursa-dan-valas/d-4319752/saham-facebook-turun-40-kare
na-kasus-data-pengguna-bocor
Marr, Bernard. (2018). The Amazing Ways Instagram Uses Big Data and Artificial
Intelligence. [online] Diakses pada 7 April 2019 melalui
https://www.forbes.com/sites/bernardmarr/2018/03/16/the-amazing-ways-instagram-
uses-big-data-and-artificial-intelligence/#317221a75ca6
30
OptimizeSmart. Introduction to Attribution Models in Facebook. [online] Diakses pada 9
https://www.optimizesmart.com/introduction-to-attribution-models-in-facebook/
Governance amongst Tech Firms. [online] Diakses pada 8 April 2019 melalui
https://www.quality.org/news/latest-facebook-scandal-indicative-failure-operational-
governance-amongst-tech-firms
Ritonga, Efri. (2016). Skandal Data Facebook: Kronologi, Pemain Kunci dan Kasus di 10
https://investigasi.tempo.co/249/skandal-data-facebook-kronologi-pemain-kunci-dan
-kasus-di-10-negara
Vomiero, Jessica. (2019). Facebook plans to deepen data sharing between Messenger,
Instagram, Whatsapp: Report. [online] Diakses pada 9 April 2019 melalui
https://globalnews.ca/news/4892985/facebook-messenger-whatsapp-instagram-data-
sharing/
Wagner, Kurt. (2018). This is How Facebook Uses Your Data for Ad Targeting. [online]
Diakses pada 4 April 2019 melalui
https://www.recode.net/2018/4/11/17177842/facebook-advertising-ads-explained-ma
rk-zuckerberg
Websight Design Inc. Social Media Metadata: Facebook Open Graph and Twitter Cards.
[online] Diakses pada 8 April 2019 melalui
https://www.websightdesign.com/services/internet-marketing/search-engine-optimiz
ation/social-media-metadata
31
LAMPIRAN
Facebook collects a lot of data about you — everything from your email address to the
strength of your phone’s battery.
The simplest explanation for this is that Facebook uses that data to make money. No,
Facebook doesn’t sell your data. But it does sell access to you, or more specifically, access to
your News Feed, and uses that data to show you specific ads it thinks you’re likely to enjoy or
click on.
This targeted advertising is big business for Facebook. The company reported advertising
revenue of $40 billion last year, and it’s only going to keep growing. Given the company’s
32
recent privacy issues involving Cambridge Analytica, a third-party data firm that got its hands
on personal data for as many as 87 million Facebook userswithout their permission, we
thought it might be helpful to take a closer look at how Facebook uses your data to make
money.
It’s also clear that many people don’t know the details of how Facebook’s advertising
business works. Many of these questions were asked by lawmakers on Tuesday when
Facebook CEO Mark Zuckerberg testified before Congress in Washington, D.C.
Some of these answers can be found in the company’s Data Policy, which Facebook just
updated to better explain what it collects and how it’s used. We also asked a company
spokesperson for responses to all of these questions. Those answers are summarized below.
No. Facebook uses your data to sell access to you. For example, it will put an ad in your
News Feed, but it doesn’t sell the data you provide to outside buyers. That makes sense when
you stop and think about it. Facebook’s business is valuable because it has so much personal
data about its users. Selling that data to advertisers would significantly decrease Facebook’s
value.
Outside businesses can collect your data if you grant them permission — for example, if you
use your Facebook account to log in to a third-party app like Uber or Spotify. Facebook just
announced changes to some of those data-sharing APIs to better ensure that agreeing to share
your own data won’t let those outside companies collect data about your friends without their
permission. (This is what happened with the Cabridge Analytica situation.) Of course, any
data you share publicly to your Facebook page is accessible to anyone online.
How can you see what data Facebook has collected about you?
There are a couple places to look. Visit “Settings” on Facebook, and under the “General” tab
you will see an option to “Download a copy of your Facebook data.” Click that. This will
give you all of the data Facebook has collected about you, from private messages to photos to
your search history.
33
Under “Settings” you can also click “Ads,” which will bring you to an “Ad Preferences” page
that includes the interests Facebook thinks you have (and advertisers use to target you), and
other information they might use to target you (e.g. the type of phone you use). You can
remove interests or information from this page that isn’t relevant or that you don’t want
Facebook using to target you.
Not really. Advertisers can see details about who sees their ads, but only in aggregate. For
example, an advertiser could see that their ad reached 1,000 males in San Francisco, but it
could not see names of each of those 1,000 users.
Does Facebook use info from your private messages to target you with ads?
No. Facebook says it might look at your private messages to determine if they violate the
company’s policies, but it doesn’t use that information for ad targeting. Facebook won’t use
the contents of your private messages to target you with ads on Facebook Messenger,
WhatsApp or Instagram either, according to a spokesperson.
Does Facebook use your phone’s microphone to listen to you at any time?
The company says no. “We only access your microphone if you have given our app
permission and if you are actively using a specific feature that requires audio,” the company
wrote on its blog.
Does Facebook use your call history or off-Facebook text message data to target you
with ads?
No, Facebook does not use this data to target you with ads, according to a Facebook
spokesperson. Facebook can see the call and text history for Android users who opt in to let
the company see that data. It also says it doesn’t use it to recommend friends you might like
to connect with.
Does Facebook use the same set of data to target you with ads on Instagram that is uses
to target you with ads on Facebook?
34
Yes. What you do on Instagram could lead to ads you see on Facebook, and vice versa. “The
same interest-based targeting available to advertisers who target ads to people on Facebook is
available for Instagram ads,” a company spokesperson told Recode. “This includes interests
based on the things people do on and off Facebook.”
Does Facebook use the same set of data to target you with ads on Messenger that it uses
to target you with ads on Facebook?
Again, yes. “Messenger Ads (ads placed in people’s Messenger home screen) use the same
audience targeting options as Facebook ads,” a spokesperson says.
Sumber: Wagner, Kurt. (2018). This is How Facebook Uses Your Data for Ad Targeting. [online] Diakses pada
4 April 2019 melalui
https://www.recode.net/2018/4/11/17177842/facebook-advertising-ads-explained-mark-zuckerberg
35