Analytics membedakan bisnis di abad ke-21. Data transaksional, sosial, seluler, cloud, Web, dan sensor
menawarkan potensi yang sangat besar. Tetapi tanpa alat yang dapat menganalisis tipe dan volume data
ini, tidak ada banyak perbedaan antara bisnis di abad ke-20 dan bisnis saat ini - kecuali untuk
peningkatan akses seluler. Alat, data berkualitas tinggi, dan keahlian manusia semuanya penting untuk
nilai analitik, seperti yang ditunjukkan pada Gambar 3.1. Keahlian manusia diperlukan karena analitik
saja tidak dapat menjelaskan alasan tren atau hubungan; tahu tindakan apa yang harus diambil; atau
memberikan konteks yang cukup untuk menentukan apa yang angka-angka itu wakili dan bagaimana
menafsirkannya.
Basis data, gudang data, data besar, dan teknologi intelijen bisnis (BI) berinteraksi untuk menciptakan
ekosistem bisnis-teknologi baru. Analis saat ini dihadapkan dengan arus masuk data yang sangat besar
yang perlu mereka saringhingga efisiensi operasional yang meningkatkan margin. Analitik data besar, BI,
dan penambangan data adalah alat untuk menemukan wawasan dan hubungan yang mungkin tidak
diakui. Penambangan teks adalah analisis data teks semi terstruktur atau tidak terstruktur. Tujuannya
adalah untuk mengubah informasi teks menjadi angka sehingga algoritma penambangan data dapat
diterapkan. Mayoritas informasi muncul sebagai teks bentuk bebas yang, sebelum pengembangan
penambangan teks, perlu dibaca secara keseluruhan agar informasi dapat diperoleh darinya. Data
penambangan atau teks yang diambil dari operasi bisnis sehari-hari mengungkapkan informasi berharga,
seperti keinginan pelanggan, produk yang paling penting, atau proses yang dapat dibuat lebih
efisien. Wawasan ini memperluas kemampuan untuk memanfaatkan peluang, meminimalkan risiko, dan
mengendalikan biaya.
Teknologi dan teknik manajemen data primer yang menangkap, menyimpan, dan mempertahankan
kualitas data; terus memberi tahu pengguna; dan mendukung proses bisnis adalah sebagai berikut:
a. Database menyimpan data yang dihasilkan oleh aplikasi bisnis, sensor, operasi, dan sistem
pemrosesan transaksi (TPS). Data dalam basis data sangat fluktuatif. Perusahaan menengah dan
besar biasanya memiliki banyak basis data dari berbagai jenis.
b. Gudang data mengintegrasikan data dari berbagai basis data dan silo data dan mengaturnya
untuk analisis yang kompleks, penemuan pengetahuan, dan mendukung pengambilan
keputusan. Misalnya, data diambil dari database, diproses untuk membakukan formatnya, dan
kemudian dimuat ke dalam gudang data pada waktu tertentu, seperti mingguan. Dengan
demikian, data di gudang data tidak mudah menguap dan siap untuk dianalisis.
c. Data mart adalah gudang data skala kecil yang mendukung fungsi tunggal atau satu
departemen. Perusahaan yang tidak mampu berinvestasi dalam pergudangan data dapat mulai
dengan satu atau lebih data mart
d. Alat dan teknik data mining dan intelijen bisnis (BI) memproses data dan analisis statistik kinerja
untuk wawasan dan penemuan. Alat BI, misalnya, mengekstrak pengetahuan dari data,
menemukan hubungan yang bermakna dalam data, mendeteksi tren, dan mengidentifikasi
peluang dan risiko. Penambangan data dapat memberikan wawasan baru, membentuk dasar
yang dapat diandalkan untuk peramalan yang akurat, dan membantu manajer membuat
keputusan yang lebih baik .
Teknik pemrosesan data, kekuatan pemrosesan, dan kemampuan manajemen kinerja perusahaan telah
mengalami kemajuan revolusioner dalam beberapa tahun terakhir yang telah akrab dengan data besar,
analitik, mobilitas, dan cloud untuk alasan Anda menghitung
DBMS DAN SQL
Sistem manajemen basis data (DBMSS) terintegrasi dengan sistem pengumpulan data seperti TPS dan
aplikasi bisnis; menyimpan data secara terorganisir; dan menyediakan fasilitas untuk mengakses dan
mengelola data itu. Selama 25 tahun terakhir, basis data relasional telah menjadi model basis data
standar yang diadopsi oleh sebagian besar perusahaan. Sistem manajemen basis data relasional
(RDBMS) menyimpan data dalam tabel yang terdiri dari kolom dan baris, mirip dengan format
spreadsheet.
RDBMSS menyediakan akses ke data menggunakan bahasa query terstruktur-bahasa deklaratif
(SQL). Bahasa deklaratif menyederhanakan akses data karena mereka hanya mengharuskan pengguna
menentukan data apa yang ingin mereka akses (menggunakan format tertentu) tanpa harus menulis
kode. Format pernyataan SQL dasar adalah sebagai berikut:
SISTEM MANAJEMEN DATABASE DAN SQL
Database management systems (DBMSS) adalah perangkat lunak yang digunakan untuk mengelola
penambahan, pembaruan, dan keterlambatan data saat transaksi terjadi; dan mendukung pertanyaan
dan pelaporan data. Mereka adalah sistem OLTP. adalah SOL adalah bahasa permintaan standar untuk
mengakses database
Berikut ini adalah beberapa contoh bagaimana dua perusahaan menggunakan ADW:
Modal Satu. Capital One menggunakan ADW untuk melacak "skor profitabilitas" setiap
pelanggan untuk menentukan tingkat layanan pelanggan yang akan diberikan kepada orang
itu. Layanan personalisasi berbiaya lebih tinggi hanya diberikan kepada mereka yang memiliki
skor tinggi. Misalnya, ketika seorang pelanggan memanggil Capital One, ia diminta untuk
memasukkan nomor kartu kredit, yang dikaitkan dengan skor profitabilitas. Pelanggan
berpenghasilan rendah hanya mendapatkan unit respons suara; pelanggan dengan laba tinggi
terhubung ke perwakilan layanan pelanggan langsung (CSR) karena perusahaan ingin
meminimalkan risiko kehilangan pelanggan tersebut. OS Travelocity. Jika Anda menggunakan
Travelocity, sebuah ADW menemukan penawaran perjalanan terbaik khusus untuk
Anda. Tujuannya adalah untuk menggunakan "data hari ini hari ini" alih-alih "data kemarin hari
ini." ADW agen perjalanan online mengalami riwayat pencarian Anda dan definisi minat dan
kemudian memperkirakan penawaran perjalanan yang kemungkinan besar akan Anda
beli. Penawaran relevan dan tepat waktu untuk meningkatkan pengalaman Anda, yang
membantu menutup penjualan di pasar yang sangat kompetitif. Misalnya, ketika pelanggan
mencari penerbangan dan hotel di Las Vegas, Travelocity mengenali minat - pelanggan ingin
pergi ke Vegas. ADW mencari penerbangan dengan harga terbaik dari semua operator,
membangun beberapa paket penawaran, dan menyajikannya secara real time kepada
pelanggan. Ketika pelanggan melihat penawaran yang dipersonalisasi yang telah mereka minati,
ADW membantu menghasilkan pengalaman pelanggan yang lebih baik. Pengalaman berbasis
data real-time meningkatkan tingkat konversi dan penjualan.
Konten data warehouse dapat dikirimkan ke pembuat keputusan di seluruh perusahaan melalui
cloud atau intranet milik perusahaan. Pengguna dapat melihat, meminta, dan menganalisis data
dan menghasilkan laporan menggunakan browser Web. Ini adalah metode pengiriman data
yang ekonomis dan efektif.
a. Tahap peta. MapReduce memecah dataset besar menjadi himpunan bagian yang lebih kecil; lalu
bagikan subset di antara beberapa server tempat sebagian diproses.
b. Kurangi panggung. sebagian hasil dari tahap peta kemudian digabungkan kembali dan tersedia
untuk alat analitik.
MEMBERIKAN NILAI DARI SENSOR D ATA
Splunk k (splunk.com) adalah platform untuk mengelola data mesin dari sensor, perangkat, dan sistem
mekanis. Pabrikan dan perusahaan perangkat dengan sejumlah besar perangkat yang terhubung
dan fasilitas industri menggunakan Splunk untuk mendapatkan tingkat baru Opera Intelligence dan nilai
yang lebih besar dari data mesin mereka. Mereka menggunakan Splunk dalam berbagai cara, termasuk
yang berikut:
Manajemen aplikasi perangkat. Meningkatkan wawasan tentang kinerja aplikasi dan layanan
dan mengurangi waktu henti layanan.
Pemecahan masalah dan manajemen perangkat dan jaringan. Waktu dan ketersediaan
perangkat manajemen yang lebih baik, termasuk status baterai dan konektivitas jaringan
Keamanan dan kepatuhan perangkat. Mengurangi insiden keamanan dan mencegah
pelanggaran data di berbagai perangkat, layanan, dan aplikasi.
Analisis bisnis data perangkat dan pengguna akhir. Lebih memahami aplikasi perangkat, dan
data layanan untuk memberikan wawasan bisnis baru
Untuk menyimpan data, Hadoop memiliki sistem file terdistribusi sendiri, HaDoop File Systems (HDFS),
yang berfungsi dalam tiga tahap sebagai berikut:
Memuat data ke dalam HDFS
Melakukan operasi MapReduce.
Mengambil hasil dari HDFS
Gambar 3.6 menunjukkan bagaimana Facebook menggunakan teknologi basis data dan Hadoop. IT at
Work 3.3 menjelaskan bagaimana First Wind telah menerapkan analitik data besar untuk meningkatkan
operasi ladang anginnya dan mendukung keberlanjutan planet ini dengan mengurangi emisi karbon
yang merusak lingkungan
PENAMBANGAN DATA DAN TEKS
Saat Anda membaca, DBMSS mendukung kueri untuk mengekstrak data atau mendapatkan jawaban
dari basis data yang sangat besar. Tetapi untuk melakukan kueri, Anda harus terlebih dahulu tahu apa
yang harus ditanyakan atau apa yang ingin Anda jawab. Dalam penambangan data dan penambangan
teks, itu sebaliknya. Penambangan data dan teks digunakan untuk menemukan pengetahuan yang Anda
tidak tahu ada di database. Penambangan data bukanlah metode atau teknik tunggal, tetapi kumpulan
teknik yang berbeda yang mencari pola dan hubungan dalam data. Teknologi penambangan teks
berupaya mengekstraksi informasi yang bermakna dari data tekstual yang tidak terstruktur, seringkali
dari media sosial.
Analitik bisnis menggambarkan seluruh fungsi penerapan teknologi, algoritma, keahlian manusia, dan
penilaian. Penambangan data dan teks adalah teknik analitik khusus. Perusahaan berinvestasi dalam alat
penambangan data untuk menambah nilai bisnis. Nilai bisnis terbagi dalam tiga kategori, seperti yang
ditunjukkan pada Gambar 3.7. Berikut ini adalah kasus singkat yang menggambarkan jenis nilai bisnis
yang dibuat oleh penambangan data dan teks
1. di Tesco, Inggris terkemuka. supermarket, kesuksesan pasar telah dikreditkan sebagian besar
untuk penambangan informasi pelanggan dari program loyalitas Clubcard. Tesco berekspansi ke
pasar baru di Eropa Tengah dan Timur, Cina, India, dan Amerika Serikat. Penambangan data
sangat efektif sehingga Tesco menghasilkan lebih dari 150 juta setahun laba dari penjualan
informasi tentang kebiasaan belanja semua pembeli, termasuk 16 juta anggota Clubcard .
2. Mega-retailer Walmart ingin pembeli online-nya menemukan apa yang mereka cari dengan
lebih cepat. Walmart menganalisis data clickstream dari 45 juta pembelanja online
bulanannya; kemudian menggabungkan data tersebut dengan skor popularitas relatif produk
dan kategori Skor popularitas telah dihasilkan oleh penambangan teks aliran media sosial
pengecer. Pelajaran yang diperoleh dari analisis diintegrasikan ke dalam mesin pencari Polaris
yang digunakan oleh pelanggan di situs web perusahaan. Polaris telah menghasilkan kenaikan
10-15% pada pembeli online yang menyelesaikan pembelian, yang sama dengan sekitar $ 1
miliar dalam penjualan online tambahan
3. Operasi toko roti McDonald's menggantikan peralatan manual dengan penganalisa foto
berkecepatan tinggi untuk memeriksa ribuan roti per menit untuk warna, ukuran, dan distribusi
biji wijen. Secara otomatis, oven dan proses memanggang menyesuaikan secara instan untuk
membuat roti yang seragam dan mengurangi ribuan pon limbah setiap tahun. Perusahaan
produk makanan lain juga menggunakan analisis foto untuk menyortir setiap kentang goreng
yang diproduksi untuk mengoptimalkan kualitas
4. Infinity Insurance menemukan wawasan baru yang diterapkan untuk meningkatkan
penyimpangan operasi penipuannya. Teks perusahaan asuransi menambang laporan adjuster
bertahun-tahun untuk mencari pendorong utama klaim penipuan. Sebagai hasilnya, perusahaan
mengurangi penipuan sebesar 75% dan melakukan kliminasi pemasaran kepada pelanggan
dengan kemungkinan besar klaim penipuan.
DATA DAN TEKS
Perangkat lunak penambangan data memungkinkan pengguna untuk menganalisis data dari berbagai
dimensi atau sudut, mengkategorikannya, dan menemukan korelasi atau pola di antara bidang dalam
bidang data. Hingga 75% dari data organisasi adalah dokumen pemrosesan kata yang tidak terstruktur,
media sosial, pesan teks, audio, video, gambar dan diagram, faks dan memo, pusat panggilan atau
catatan klaim, dan sebagainya. Penambangan teks adalah kategori luas yang melibatkan penafsiran kata
dan konsep dalam konteks. Setiap pelanggan menjadi advokat atau musuh merek dengan secara bebas
mengekspresikan pendapat dan sikap yang menjangkau jutaan pelanggan saat ini atau calon pelanggan
di media sosial. Penambangan teks membantu perusahaan memanfaatkan ledakan pendapat pelanggan
yang diungkapkan secara online. Komentar sosial dan media sosial sedang ditambang untuk analisis
sentimen atau untuk memahami niat konsumen. Dalam perusahaan yang inovatif tahu bahwa
mereka bisa lebih berhasil dalam memenuhi kebutuhan pelanggan mereka, jika mereka memahaminya
dengan lebih baik. Alat dan teknik untuk menganalisis teks, dokumen, dan konten tidak terstruktur
lainnya tersedia dari beberapa vendor.
MENGGABUNGKAN PENAMBANGAN DATA DAN TEKS
Menggabungkan penambangan data dan teks dapat menciptakan nilai yang lebih besar. Palomäki dan
Oksanen (2012) menunjukkan bahwa menambang teks atau data yang tidak terstruktur memungkinkan
organisasi untuk meramalkan masa depan, bukan hanya melaporkan masa lalu. Mereka juga mencatat
bahwa metode peramalan menggunakan data terstruktur yang ada dan teks tidak terstruktur dari
sumber internal dan eksternal memberikan pandangan terbaik tentang apa yang ada di depan.
PROSEDUR ANALISIS TEKS
Dengan analisis teks, informasi diekstraksi dari sejumlah besar jenis informasi tekstual. Langkah-langkah
dasar yang terlibat dalam analisis teks meliputi yang berikut:
1. Eksplorasi. Pertama, dokumen dieksplorasi. Ini mungkin terjadi dalam bentuk jumlah kata
yang sederhana dalam kumpulan dokumen, atau dengan secara manual membuat area topik
untuk mengelompokkan dokumen setelah membaca sampelnya. Misalnya, apa jenis masalah
utama (rem atau kerusakan mesin) yang telah diidentifikasi dalam klaim garansi mobil baru-
baru ini? Tantangan dari upaya eksplorasi adalah salah eja atau disingkat kata, akronim, atau
slang.
2. Pra-pemrosesan. Sebelum analisis atau pengkategorisasian konten secara otomatis, teks
perlu dipersiapkan terlebih dahulu untuk membakukannya sedapat mungkin. Seperti dalam
analisis tradisional, hingga 80% dari waktu preprocessing dapat dihabiskan sebelum
mengolah dan membakukan data. Kata-kata yang salah ejaan, singkatan, dan gaul mungkin
perlu diubah menjadi istilah yang konsisten. Misalnya, BTW akan distandarisasi menjadi
"omong-omong" dan "pesan suara kiri" dapat ditandai sebagai "Ivm."
3. Kategorisasi dan Pemodelan. Konten kemudian siap untuk dikategorikan. Mengkategorikan
pesan atau dokumen dari informasi yang terkandung di dalamnya dapat dicapai dengan
menggunakan model statistik dan aturan bisnis Seperti halnya pengembangan model
tradisional, sampel dokumen diperiksa untuk melatih model. Penambahan - dokumen
kemudian diproses untuk memvalidasi keakuratan dan ketepatan model, dan akhirnya
dokumen baru dievaluasi menggunakan model akhir (diberi skor). Model kemudian dapat
dimasukkan ke dalam produksi untuk pemrosesan otomatis dokumen baru saat mereka tiba
Analisis teks dapat membantu mengidentifikasi rasio pos positif / negatif yang berkaitan dengan
promosi. Ini bisa menjadi alat validasi yang kuat untuk melengkapi penelitian pelanggan dan inisiatif
umpan balik primer dan sekunder lainnya. Perusahaan yang meningkatkan kemampuan mereka untuk
menavigasi dan menambang papan dan blog yang relevan dengan industri mereka cenderung
mendapatkan keuntungan informasi yang cukup besar dibandingkan pesaing mereka.
KECERDASAN BISNIS
Quicken Loans, Inc. adalah pemberi pinjaman hipotek online terbesar dan pemberi pinjaman ritel over-
semua terbesar kedua di Amerika Serikat. Salah satu faktor kunci keberhasilan adalah BI. Lebih dari
hampir satu dekade, manajemen kinerja telah berevolusi dari proses manual pembuatan laporan
menjadi dashboard yang digerakkan oleh BI dan peringatan yang ditetapkan pengguna yang
memungkinkan para pemimpin bisnis untuk secara proaktif mengatasi hambatan dan mengidentifikasi
peluang untuk pertumbuhan dan peningkatan. Pada Penghargaan Praktik Terbaik 2013 Warehousing
Institute (TDWI) Data 2013 yang mengakui perusahaan untuk solusi BI kelas dunia dan pergudangan
data mereka, manajer Quicken menjelaskan
Pertumbuhan ini dapat dikaitkan dengan keberhasilan pelat pinjaman online kami. Platform pinjaman
kami yang terukur dan digerakkan oleh teknologi memungkinkan kami untuk menangani lonjakan besar
dalam aplikasi pinjaman sekaligus menjaga waktu penutupan untuk sebagian besar pinjaman kami
dalam 30 hari atau kurang. (TDWI, 2013)
Menggunakan BI, perusahaan telah meningkatkan kecepatan dari aplikasi Anda untuk menutup yang
memungkinkannya untuk memenuhi kebutuhan klien secara menyeluruh dan secepat mungkin.
Sejak 1980-an, perusahaan terkemuka seperti Quicken telah menyebarkan BI Apa yang dimulai sebagai
alat untuk mendukung penjualan, pemasaran, dan layanan pelanggan telah berkembang secara luas
menjadi platform strategis berskala enterprise Sistem BI digunakan untuk operasi dan proses bisnis dan
juga digunakan untuk mendukung pengambilan keputusan strategis . Perubahan terbaru dalam BI
adalah penggunaannya untuk intelijen operasional di berbagai sistem dan bisnis - memperluas
penggunaan BI di seluruh organisasi. Kondisi bisnis yang kompleks dan kompetitif tidak membuat
banyak kesalahan.