M13-Foundations of Business
M13-Foundations of Business
Tujuan pembelajaran
Tujuan pembelajaran
Tujuan pembelajaran
Hierarki data
Pengorganisasian data dalam lingkungan file tradisional
Tujuan pembelajaran
Database vs dbms
• Database
– Melayani beberapa aplikasi dengan memusatkan data dan mengontrol
data yang redundan
• Database management system (DBMS)
– Antar muka antara aplikasi dan file data fisik
– Memisahkan logical and physical views of data
– Memecahkan masalah dari lingkungan file tradisional
• Mengontrol redundancy
• Mengeliminasi inconsistency
• Memisahkan program dan data
• Membolehkan organisasi untuk pemusatan pengelolaan data dan keamanan data
Pendekatan database untuk manajemen data
LV
LV
Common DBMS
• Relational DBMS
– Represent data as two-dimensional tables
Contoh DBMS
– Each table contains data on entity and attributes
• Table: grid of columns and rows
– Rows (tuples): Records for different entities
– Fields (columns): Represents attribute for entity
– Key field: Field used to uniquely identify each
record
– Primary key: Field in table used for key fields MS Access
– Foreign key: Primary key used in second table as Oracle dll……..
look-up field to identify records from original table
Pendekatan database untuk manajemen data
contoh
Pendekatan database untuk manajemen data
DBMS
Non-relational databases: “NoSQL”
More flexible data model
Data sets stored across distributed machines
Easier to scale
Handle large volumes of unstructured and structured
data (Web, social media, graphics)
Databases in the cloud
Typically, less functionality than on-premises DBs
Amazon Relational Database Service, Microsoft SQL Azure
Private clouds
Pendekatan database untuk manajemen data
Kapabilitas dbms
• merancang Databases
– Rancangan konseptual (logical) : model abstrak dari perspektif bisnis
– Rancangan fisik: bagaimana database disusun dalam peralatan
penyimpanan
• Merancang proses:
– Identifikasi hubungan antar elemen data, elemen database yang redundan
– Cara yang paling efektif untuk mengelompokkan elemen data sesuai
dengan kebutuhan bisnis, memerlukan program aplikasi
• Normalisasi
– Memperlancar pengelompokan data yang komplek untuk meminimalisasi
elemen data yang redundan dan mengurai relasi many to many
Pendekatan database untuk manajemen data
Proses normalisasi
Sesudah normalisasi
Pendekatan database untuk manajemen data
Rancangan database
Referential integrity rules
Digunakan oleh dbms untuk memastikan hubungan antar table tidak
melanggar konstrain
Entity-relationship diagram
Digunakan oleh perancang database untuk mendokumentasikan model
data
Menggambarkan hubungan antar entitas
– PERHATIAN: jika bisnis tidak memiliki model data yang tepat,
system tidak akan melayani bisnis dengan baik
Contoh ER-Diagram
outline
Tujuan pembelajaran
Big data
• Massive sets of unstructured/semi-structured data from Web traffic, social media, sensors,
and so on
• Petabytes, exabytes of data
• Volumes too great for typical DBMS
• Can reveal more patterns and anomalies
Database untuk meningkatkan performansi bisnis dan pengambilan
keputusan
• Data warehouse:
– Menyimpan current & historical data dari berbagai system transaksi operasi inti
– Mengkonsolidasi dan menstandarisasi informasi untuk digunakan antar
perusahaan, namun data tidak dapat ditambahkan
– Menyediakan kakas bantu untuk analisis dan pelaporan
• Data marts:
– Subset/Bagian dari data warehouse
– Ringkasan dari porsi data yang focus untuk digunakan oleh populasi khusus dari
pengguna
– Biasanya focus pada single subject atau line of business
Database untuk meningkatkan performansi bisnis dan pengambilan
keputusan
Komponen dari data warehouse
data warehouse menekstrak data dari
berbagai sumber baik internal maupun
eksternal, termasuk Hadoop cluster,
dan mentransformasikannya sebagai
kebutuhan untuk system data
warehouse
Analytic platform memiliki kakas bantu
untuk power users, termasuk reporting,
OLAP, & data mining, untuk mengekstrak
informasi dari data warehouse & Hadoop
cluster.
HadooP
Enables distributed parallel processing of big data across inexpensive computers
Layanan kunci
Hadoop Distributed File System (HDFS): data storage
MapReduce: breaks data into clusters for work
Hbase: NoSQL database
In-memory computing
Used in big data analysis
Use computers main memory (RAM) for data storage to avoid delays in retrieving data from disk
storage
Can reduce hours/days of processing to seconds
Requires optimized hardware
Analytic platforms
High-speed platforms using both relational and non-relational tools optimized for large datasets
Database untuk meningkatkan performansi bisnis dan pengambilan
keputusan
Analytical tools: Relationships, patterns,
trends
– Tools for consolidating, analyzing, and providing access to vast amounts of data to help
users make better business decisions
• Multidimensional data analysis (OLAP)
• Data mining
• Text mining
• Web mining
Database untuk meningkatkan performansi bisnis dan pengambilan
keputusan
Mengekstrak elemen kunci dari data set tidak terstuktur yang sangat besar
Stored e-mails
Call center transcripts
Legal cases
Patent descriptions
Service reports, and so on
Sentiment analysis software
Mines e-mails, blogs, social media to detect opinions
Database untuk meningkatkan performansi bisnis dan pengambilan
keputusan
Web mining
Tujuan pembelajaran
• Data cleansing
– Software to detect and correct data that are incorrect, incomplete, improperly formatted, or
redundant
– Enforces consistency among different sets of data from separate information systems
Tugas