Anda di halaman 1dari 11

DATA DAN INFORMASI

MATA KULIAH BUSINESS ANALYTICS

Disusun Oleh :
1. Audira Fitri Novadoriz (2110522002)
2. Kevin Surya Triadinata Widjaya (CE221234)
3. Nabilla (2110522035)
4. Putri Septin Fadila (2110521036)
5. Saskia Salsabila (2110523006)
PEMBAHASAN
Data Growth
Banjir data menyapu hampir tak terlihat di seluruh planet ini. Hal ini disebabkan oleh maraknya
pendataan otomatis, instrumentasi elektronik, dan pemrosesan transaksi online (OLTP). Ada
pengakuan yang berkembang dari nilai yang belum dimanfaatkan dalam database ini, yang
sebagian mendorong pengembangan ilmu data. Data ini datang dalam berbagai bentuk. Beberapa
data akan terstruktur – yaitu, dalam bentuk tabel dengan kolom dan baris reguler, seperti pada
spreadsheet dan database relasional. Data lain akan tidak terstruktur, seperti email, dokumen teks,
rekaman audio, video, dan gambar. Data tidak terstruktur sedang dalam pengaruh dan akan
menimbulkan penyimpanan data serta tantangan analisis data bagi organisasi. Rizkullah (2017)
melaporkan perkiraan Gartner bahwa data tidak terstruktur terdiri dari sekitar 80% data perusahaan
dan selanjutnya berkomentar bahwa organisasi tidak siap untuk manajemen data tidak terstruktur
– mereka tidak tahu apa yang mereka miliki dan mereka tidak tahu bagaimana melindunginya.
Igneous (2018) melakukan jajak pendapat terhadap 200 organisasi dan menemukan bahwa
organisasi tipikal mengalami pertumbuhan tahunan sebesar 23% dari data tidak terstrukturnya
dengan sekitar seperempat organisasi melihat tingkat pertumbuhan lebih dari 40%. Mereka
menyamakan pertumbuhan data tidak terstruktur ini dengan tsunami dan menemukan bahwa
organisasi sedang berjuang untuk mengelola data ini, dengan masalah khusus seputar aksesibilitas,
tata kelola, dan wawasan. Konsekuensi dari banjir data untuk organisasi berarti bahwa
mendefinisikan protokol manajemen data sangat penting jika mereka ingin memaksimalkan
kesempatan untuk memperoleh data yang dapat menghasilkan informasi yang berguna. Oleh
karena itu, kita harus ingat bahwa (Truxillo 2015, hlm.1–6):
• setiapmasalahakan menghasilkan data pada akhirnya – mendefinisikan protokol pengumpulan
data secara proaktif akan menghasilkan informasi yang lebih berguna, yang mengarah ke analitik
yang lebih berguna
• setiapperusahaanakan membutuhkan analitik pada akhirnya – perusahaan analitik secara proaktif
akan bersaing lebih efektif
• setiapsatuakan membutuhkan analitik pada akhirnya – orang yang analitik secara proaktif akan
lebih mudah dipasarkan dan lebih sukses dalam pekerjaan mereka.
Ketika data menjadi lebih murah dan lebih banyak, perusahaan mulai memanfaatkan konten
informasi yang sebelumnya tidak mungkin diakses atau tidak layak. Dan perusahaan-perusahaan
yang menerapkan analitik kompetitif cenderung memiliki pengaruh yang lebih besar pada bentuk
dan masa depan industri mereka.

From Data to Wisdom


Dari data menjadi kebijaksanaan Melalui datalah kita berinteraksi, mengalami, dan memahami
dunia. Kita hanya bisa memikirkan pemahaman kita sehari-hari tentang dunia melalui data, apakah
itu persepsi kita tentang kota, kejahatan, perdagangan global, migrasi, atau penyakit. Kehidupan
kita hamper seluruhnya dimediasi melalui data – contohnya termasuk memeriksa waktu, membaca
email atau koran, memantau detak jantung kita, atau menghitung jumlah langkah yang telah kita
ambil hari ini. Istilah 'data' berasal dari bahasa Latindata, yang berarti 'yang diberikan'. Data dapat
berupa deskripsi (misalnya, saya sedang berolahraga), hitungan (misalnya, saya telah melakukan
10.000 langkah hari ini) atau ukuran (misalnya, berat badan saya 75 kilogram). Data dapat
dikumpulkan tentang apa saja – kebahagiaan, perdagangan, cuaca, transportasi, berat badan, tinggi
badan, aktivitas, ide, perilaku, ekonomi, dan sebagainya. Data juga bisa dalam banyak format –
misalnya, angka, kata, suara, gambar, atau video. Ketika data dianalisis menjadi informasi, yang
pada gilirannya dapat membangun pengetahuan, dan mungkin kebijaksanaan. Untuk mengambil
ilustrasi sederhana, kita mungkin melihat dalam file data dan melihat kode, '802981'. Mengingat
konteksnya (misalnya, organisasi tempat kami bekerja), kami dapat mengubahnya menjadi
informasi – ini adalah salah satu kode pelanggan kami. Arti dari informasi ini mungkin bahwa ini
bukan sembarang pelanggan tetapi pelanggan berharga yang berisiko kehilangan kita. Wawasan
kami dari pengetahuan kami tentang pelanggan adalah bahwa kami harus siap untuk mengambil
tindakan untuk mempertahankan pelanggan. Semua organisasi harus mampu memberikan konteks
pada data mentah mereka, mengubahnya menjadi informasi, memahami makna informasi mereka
untuk menciptakan pengetahuan, dan – diberikan wawasan – mereka harus mampu mengubah
pengetahuan menjadi kebijaksanaan untuk mengambil tindakan yang efektif.
Data Summarization

Data summarization atau ringkasan data adalah proses mencerna data menjadi ukuran ringkasan.
Ringkasan data dapat menghasilkan sejumlah ringkasan statistik seperti tabel frekuensi, jumlah
observasi yang kosong (missing value), mean, median, simpangan baku, dan lainnya. Beberapa
menu ringkasan data yang dapat digunakan pada menu Statistics/Summaries, antara lain:

1. Active data set

Membuat Ringkasan data berupa nilai min, max, kuartil 1, median, mean, dan kuartil 3 untuk jenis
data numeric. Sedangkan untuk jenis data factor atau character/string akan dihasilkan table
frekuensi.

2. Numerical summaries

Membuat ringkasan data spesifik untuk variable numeric, seperti mean, median, kuartil,
simpangan baku, kurtosis, dan lainnya. Baik untuk variable tunggal maupun agregat variabel
numeric berdasarkan variabel factor.

3. Frequency distributions

Membuat tabel distribusi frekuensi variabel factor atau character/string. Selain itu, menu ini
menyajikan opsi untuk menampilkan uji goodness-of-fit untuk melakukan uji apakah proporsi
frekuensi pada tiap kelompok kategori sesuai dengan ekspektasi yang kita harapkan. Dalam hal
ini kita dapat pula menguji apakah proporsi observasi pada tiap kelompok sama (tiap kelompok
homogen).

4. Count missing observations :

Menampilkan data terkait jumlah observasi kosong pada tiap variabel dataset.

5. Table of statistics

Menampilkan ringkasan data variabel numeric tunggal atau agregat berdasarkan satu fungsi
statistik tertentu.
6. Correlation matrix

Menampilkan matrix korelasi dua atau lebih variabel numeric. Menu ini juga menampilkan opsi
apakah nilai p-value dan adjusted p-value metode Holm setiap pasang korelasi variabel perlu
ditampilkan.

Data Quality

Data quality mengacu pada pengembangan dan implementasi kegiatan yang menerapkan teknik
manajemen kualitas pada data. Tujuannya adalah memastikan agar data sesuai untuk melayani
kebutuhan spesifik perusahaan dalam konteks tertentu. Nah, data yang dinilai sesuai untuk tujuan
yang dimaksud dapat dikatakan sebagai data berkualitas tinggi.
Data berkualitas tinggi tentu saja bebas dari masalah kualitas data, seperti data yang terduplikasi,
data yang tidak lengkap, data yang tidak konsisten, data yang salah, data yang tidak terdefinisi
dengan baik, data yang tidak terorganisir dengan baik, hingga keamanan data yang buruk.
Data quality itu sangat penting, karena data dengan kualitas buruk dapat menjadi sumber penipuan
operasional, analitik yang tidak akurat, dan strategi bisnis yang salah.

Dimensions of Data Quality

1. Accuracy
accuracy berarti informasi yang benar pada data. Untuk menentukan apakah data akurat
atau tidak, tanyakan pada diri Anda apakah informasi tersebut mencerminkan situasi dunia
nyata. Akurasi adalah karakteristik kualitas data yang penting karena informasi yang tidak
akurat dapat menyebabkan konsekuensi dan masalah signifikan.
2. Completeness (Kelengkapan)
Kelengkapan mengacu pada seberapa komprehensif informasi yang Anda miliki. Faktor
penting dalam kelengkapan data adalah memastikan semua data yang Anda butuhkan
tersedia. Nah, dimensi completeness menjadi penting karena jika informasi tidak lengkap,
data mungkin menjadi tidak dapat digunakan.
3. Integrity
Perjalanan dan transformasi data di seluruh sistem dapat memengaruhi hubungan
atributnya. Integritas menunjukkan bahwa atribut dipelihara dengan benar, bahkan ketika
data disimpan dan digunakan dalam sistem yang beragam. Integritas data memastikan
bahwa semua data perusahaan dapat dilacak dan dihubungkan. Integritas data
memengaruhi hubungan. Misalnya, profil pelanggan mencakup nama pelanggan dan satu
atau lebih alamat pelanggan. Jika satu alamat pelanggan kehilangan integritasnya pada
tahap tertentu dalam perjalanan data, profil pelanggan terkait dapat menjadi tidak lengkap
dan tidak valid.
4. Consistency
Dimensi ini menunjukkan jika informasi yang sama yang disimpan dan digunakan pada
beberapa kejadian cocok. Ini dinyatakan sebagai persentase nilai yang cocok di berbagai
catatan. Konsistensi data memastikan bahwa analitik menangkap dan memanfaatkan nilai
data dengan benar.
Konsistensi sulit untuk dinilai dan memerlukan pengujian terencana di beberapa set data.
Jika satu sistem perusahaan menggunakan nomor telepon pelanggan dengan kode
internasional secara terpisah, dan sistem lain menggunakan kode internasional awalan,
inkonsistensi pemformatan ini dapat diselesaikan dengan cepat. Namun, jika informasi
yang mendasari itu sendiri tidak konsisten, penyelesaian mungkin memerlukan verifikasi
dengan sumber lain. Misalnya, jika catatan pasien mencantumkan tanggal lahir sebagai 1
Mei, dan catatan lain menunjukkan tanggal 1 Juni, Anda mungkin perlu menilai keakuratan
data dari kedua sumber terlebih dahulu. Konsistensi data sering dikaitkan dengan akurasi
data, dan kumpulan data apa pun yang mendapat skor tinggi pada keduanya akan menjadi
kumpulan data berkualitas tinggi.
5. Timeliness (Ketepatan Waktu)
Ketepatan waktu mengacu pada seberapa up to date informasi yang Anda punya. Ketepatan
waktu informasi merupakan salah satu dimensi data quality yang penting karena informasi
yang tidak tepat waktu dapat menyebabkan orang mengambil keputusan yang salah.
Dampaknya adalah menghabiskan waktu, uang, dan merusak reputasi perusahaan.
6. Validity

Validitas berkaitan dengan sejauh mana data masuk akal. Validitas dapat diukur sebagai
persentase item data yang dianggap valid, atau tidak valid.
Karakteristik Data dan Informasi
Karakteristik data atau informasi menurut Alter (1992) :
1. Tipe Data
Masing-masing tipe data tentu saja memiliki kelebihan dan kekurangan masing-masing. Tipe data
terformat cocok untuk menyimpan informasi seperti tanggal transaksi dan jam masuk karyawan
(format tanggal dan format jam). Tipe data teks cocok untuk menyatakan data yang panjang
semacam biografi singkat sesorang. Tipe data suara dapat digunakan untuk menyatakan
bunyi-bunyian. Data video dapat digunakan untuk menekankan tentang suatu aktivitas aatau
kejadian.
2. Akurasi/Presisi
Istilah akurasi accuracy dan presisi precise sering kali tidak dibedakan. Bahkan dalam
kamus Oxford, kedua istilah ini dianggap sama. Akurasi menyatakan derajat kebenaran terhadap
informasi dan menentukan kehandalan atau reabilitas informasi. Informasi yang benar-benar bebas
kesalahan dikatakan sangat akurat. Adapun presisi berkaitan dengan tingkat kerincian suatu
informasi.
3. Usia dan Rentang Waktu
Karakteristik informasi yang berkaitan dengan waktu adalah usia informasi age, ketepatan waktu
timeliness, dan rentang waktu time horizon. Usia informasi menyatakan lama waktu sejak
informasi dihasilkan hingga saat sekarang. Usia informasi mudah deketahui jika informasi yaang
dihasilkan berdasarkan laporan internal. Namun, kalau informasi dihasilkan oleh pihak eksternal,
usia yang pasti ada kemungkinan sangat sulit diketahui.
Ketapatan waktu timeliness menyatakan usia data yang sesuai dengan upaya pengambilan
keputusan. Artinya, informasi tersebut tidak usang/kadaluarsa ketika sampai ke penerima,
sehingga masih ada waktu untuk menggunakan informasi tersebut sebagai bahan pengambilan
keputusan.
Rentang waktu atau kadang juga disebut kerangka waktu time framemenyatakan selang waktu
yang digunakan untuk mencakup data. Dalam hal ini, rentang waktu dapat beroprasi di masa lalu,
masa sekarang, atau masa mendatang.
4. Tingkat Keringkasan dan Kelengkapan
Kadangkala informasi yang terlalu detail tidak memberikan hasil yang lebih baik, tetapi malah
sebaliknya, karena informasi semakin sulit untuk diserap dan dipahami. Hal yang terpenting,
informasi harus diringkas agar sesuai dengan kebutuhan penerima informasi. Idealnya, informasi
yang penting bagi pengambilan keputusan haruslah lengkap (tak ada yang hilang)
sehingga dapat mengurangi faktor ketidakpastian. Namun, kenyataannya pada kondisi tertentu,
kelengkapan informasi terkadang tidak terpenuhi.
5. Kemudahan Akses
Agar informasi bisa diterima oleh pemakai denga lancar, kemudahan akses terhadap informasi
harus terjamin. Oleh karena itu, pihak-pihak yang berkompeten dengan informasi biasanya
dilengkapi dengan komputer pribadi (PC) yang terhubung ke komputer server, yang menyimpan
data, untuk memudahkan pengaksesan informasi.
6. Sumber
Sumber informasi dapat bersifat internal atau eksternal. Sumber internal berasal dari perusahaan
itu sendiri, misalnya diperoleh dari sistem informasi. Sumber data eksternal berasal dari
lingkungan.
Sumber informasi juga bisa bersifat formal dan informal. Sumber data formal diperoleh melalui
sistem informasi, dokumen-dokumen yang dipublikasikan, dan hasil pertemuan resmi, sedangkan
sumber informal diperoleh karena ada perbincangan tak resmi.
7. Relevansi/nilai
Relevansi berarti bahwa informasi benar-benar memberikan manfaat bagi pemakai. Tentu saja,
relevansi informasi untuk setiap pemakai berbeda-beda. Nilai informasi value of information
ditentukan oleh dua hal, yaitu manffat dan biaya untuk mendapatkannya (Jogiyanto, 200). Suatu
informasi masi dianggap bernilai kalau manfaatnya lebih efektif dibaningkan dengan biaya untuk
mendapatkannya.
Dengan dijabarannya karakteristik data dan informasi diatas bisa menjadi takaran suatu kualitas
dari informasi tersebut. Infomasi yang berkualitas adalah informasi yang berguna bagi
penerimanya dan berguna juga bagi penerima selanjutnya yang dapat mempertegas dan
memperjelas pekerjaan maupun data yang sedang diolah.

Data Type

Data types atau tipe data adalah sebuah pengklasifikasian data berdasarkan jenis data tersebut.
Tipe data dibutuhkan agar kompiler dapat mengetahui bagaimana sebuah data akan digunakan.
Untuk mengembangkan sebuah program, ada beberapa tipe data yang akan kita pelajari. Di
antaranya

1. Integer (bilangan bulat)

Integer (int.) merupakan data type berbentuk bilangan bulat atau numerik yang tidak memiliki
komponen pecahan. Bilangan ini juga mengenal nilai positif dan negatif (signed number).

Contoh: 1,45,77,110,dll

2. Floating (bilangan pecahan)

Jenis data type numerik yang digunakan untuk menyimpan angka yang mungkin memiliki
komponen pecahan.
Contoh: 1.6, 9.7, 12.1

3. Character (Char)

Character merupakan tipe data yang dimanfaatkan untuk menyimpan satu huruf, angka, tanda
baca, simbol, atau space kosong. Tipe data karakter biasanya didefinisikan dengan tanda petik (‘)
di awal dan di akhir karakternya.

Karakter yang di bisa di proses oleh char hanya karakter ASCII saja (American Standard Code For
Information Interchange) yang berjumlah 256 karakter, dimana karakter-karakter ini terdiri dari
huruf alfabet kecil (a-z), huruf alfabet kapital (A-Z), angka 0 - 9 dan karakter-karakter simbol
seperti titik, koma, kutip, sama dengan, dan simbol lainya.

4. Boolean
Jenis data type ini biasanya digunakan untuk mewakili nilai yang benar dan salah dalam data.
Umumnya, nilai yang salah (false) dan benar (true) direpresentasikan dengan angka 0 (false) dan
1 (true).

Contoh:
x=5

y=8

x<y

Dalam contoh tersebut diketahui bahwa nilai “x” memang lebih kecil daripada nilai “y”, maka
program tersebut akan menghasilkan nilai Boolean True.

5. Array

Array adalah tipe data berbentuk daftar yang mampu mengarsip sejumlah elemen dalam urutan
tertentu dari seluruh data yang serupa.

Contoh: array:

Jenis olahraga akan diindeks empat nilai berupa 0 (bola basket), 1 (renang), 3 (jogging), dan 4
(bersepeda). Berdasarkan hal tersebut, panjang array adalah 4 karena mencakup empat elemen
olahraga yang berbeda.
6. String

String adalah kumpulan dari urutan karakter dan data yang paling umum digunakan untuk
menyimpan teks.

Tipe data ini terdiri dari satu atau lebih karakter yang dapat mencakup huruf, angka, dan jenis
karakter lainnya seperti halnya teks biasa dan juga dapat berisi spasi.

Contoh:

print 'Welcome to Jakarta!'

address = 'Jalan Diponegoro 23'

Anda mungkin juga menyukai