Anda di halaman 1dari 5

Nama : Muhammad Reza Fachlevi

Nim : 16.01.107

Kelas : TI2C

MK : Data Mining dan Data Warehouse

1. Apa yang Anda ketahui tentang Data Warehouse dan Data Mining?

- Data warehouse adalah data-data yang beorientasi subjek, terintegrasi,


memiliki dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang
digunakan dalam mendukung proses pengambilan keputusan.

- Data mining merupakan prinsip dasar dalam mengurutkan data dalam


jumlah yang sangat banyak dan mengambil informasi – informasi yang
berkaitan dengan apa yang diperlukan seperti apa yang biasa dilakukan
oleh seorang analis.

2. Apa saja karakteristik Data Warehouse?

a. Subject Oriented (Berorientasi subject)


Data warehouse berorientasi subject artinya data warehouse didesain untuk
menganalisa data berdasarkan subject-subject tertentu dalam
organisasi,bukan pada proses atau fungsi aplikasi tertentu

b. Integrated (Terintegrasi)
Data Warehouse dapat menyimpan data-data yang berasal dari sumber-
sumber yang terpisah kedalam suatu format yang konsisten dan saling
terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-
pecah karena data yang ada merupakan suatu kesatuan yang menunjang
keseluruhan konsep data warehouse itu sendiri. Syarat integrasi sumber data
dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan
variable,konsisten dalam ukuran variable,konsisten dalam struktur
pengkodean dan konsisten dalam atribut fisik dari data.

c. Time-variant (Rentang Waktu)


Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada
rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam
mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara
antara lain :
> Cara yang paling sederhana adalah menyajikan data warehouse pada
rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.
> Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang
disajikan dalam data warehouse baik implicit maupun explicit secara explicit
dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya
pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga
bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
> Cara yang ketiga,variasi waktu yang disajikan data warehouse melalui
serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari
sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang
ada bersifat read-only.

d. Non-Volatile
Karakteristik keempat dari data warehouse adalah non-volatile,maksudnya
data pada data warehouse tidak di-update secara real time tetapi di refresh
dari sistem operasional secara reguler. Data yang baru selalu ditambahkan
sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah
perubahan. Database tersebut secara kontinyu menyerap data baru ini,
kemudian secara incremental disatukan dengan data sebelumnya.

3. Mengapa Data Warehouse disebut Berorientasi Subyek?

Data warehouse berorientasi subject artinya data warehouse didesain untuk


menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan
pada proses atau fungsi aplikasi tertentu. Data warehouse diorganisasikan
disekitar subjek-subjek utama dari perusahaan(customers,products dan sales)
dan tidak diorganisasikan pada area-area aplikasi utama(customer
invoicing,stock control dan product sales). Hal ini dikarenakan kebutuhan dari
data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang
suatu keputusan, dari pada aplikasi yang berorientasi terhadap data. Jadi data
yang disimpan adalah berorientasi kepada subjek bukan terhadap proses.

4. Apa hubungan Data Warehouse dengan Data Mining?

- Data Mining dan Data Warehousing mempunyai kaitan yang sangat erat
tetapi bukan merupakan objek yang sama.
- Data Warehousing merupakan database besar yang menyimpan raw data
yang biasanya langsung didapat dari responden
- Agar data di dalam Data Warehouse dapat digunakan untuk Data Mining,
data-data tersebut biasanya dipersiapkan terlebih dahulu dan biasanya
disimpan dalam bentuk data mining database atau data mart.

5. Lakukan proses Extract dan Transform dari sumber data di bawah ini untuk disatukan ke
dalam database MySQL sbb
-- phpMyAdmin SQL Dump
-- version 4.8.0
-- https://www.phpmyadmin.net/
--
-- Host: 127.0.0.1
-- Generation Time: Mar 20, 2019 at 03:21 AM
-- Server version: 10.1.31-MariaDB
-- PHP Version: 7.2.4

SET SQL_MODE = "NO_AUTO_VALUE_ON_ZERO";


SET AUTOCOMMIT = 0;
START TRANSACTION;
SET time_zone = "+00:00";

/*!40101 SET @OLD_CHARACTER_SET_CLIENT=@@CHARACTER_SET_CLIENT */;


/*!40101 SET @OLD_CHARACTER_SET_RESULTS=@@CHARACTER_SET_RESULTS */;
/*!40101 SET @OLD_COLLATION_CONNECTION=@@COLLATION_CONNECTION */;
/*!40101 SET NAMES utf8mb4 */;

--
-- Database: `dbquis`
--

-- --------------------------------------------------------

--
-- Table structure for table `mahasiswa`
--

CREATE TABLE `mahasiswa` (


`nim` int(10) NOT NULL,
`nama_lengkap` varchar(50) NOT NULL,
`tahun_masuk` varchar(4) NOT NULL,
`program_studi` varchar(50) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1;

--
-- Dumping data for table `mahasiswa`
--

INSERT INTO `mahasiswa` (`nim`, `nama_lengkap`, `tahun_masuk`,


`program_studi`) VALUES
(1501175, 'MUHAMMAD MA\'RUF HANAFI', '2015', 'Informatika - S1'),
(1601080, 'RIZKY FARERA', '2016', 'Informatika - S1'),
(1601116, 'MUTIARA TARAKANITA', '2016', 'Informatika - S2'),
(1703080, 'WIDYA MEGA MITA SARI', '2017', 'Manajemen Informatika -
D3'),
(1801004, 'SEILA DINA CAMELIA', '2018', 'Informatika - S3'),
(1801007, 'ANDI ISRA ANDRIYANI', '2018', 'Informatika - S1'),
(1801009, 'RIZKY RAMADHANA', '2018', 'Informatika - S4'),
(1801013, 'RIVAL HELMY AGUSTIAN KAWULUR', '2018', 'Informatika -
S5'),
(1801016, 'MUHAMMAD ZOSEL RIDHO PUTRA', '2018', 'Informatika - S6'),
(1801018, 'GIAN FELIX JAYA SIDOHI TANGGARA', '2018', 'Informatika -
S7'),
(1801020, 'MUHAMMAD FAISAL EFENDI', '2018', 'Informatika - S8'),
(1801023, 'NUR AZIZAH', '2018', 'Informatika - S9'),
(1801024, 'BETI SAMITA PRISILA', '2018', 'Informatika - S1'),
(1801027, 'BAYU CAESAR PUTRATAMA T', '2018', 'Informatika - S1'),
(1801036, 'DESI NUR INDAH SARI', '2018', 'Informatika - S1'),
(1801037, 'TAUFIK HIDAYAT', '2018', 'Informatika - S10'),
(1801040, 'HAMDAN FAJAR', '2018', 'Informatika - S11'),
(1801048, 'DELLA APRILLIANI', '2018', 'Informatika - S12'),
(1801051, 'MUHAMMAD AKRAM ABDITYA', '2018', 'Informatika - S1'),
(1801053, 'SUNG DARMAN FATNILIE SAPUTRA', '2018', 'Informatika -
S13'),
(1801054, 'MUHAMMAD FIQRI AL FHARABY', '2018', 'Informatika - S1'),
(1801056, 'KRIESNA RAFIE GERHANA', '2018', 'Informatika - S1'),
(1801062, 'BUDIONO JAYA PRATAMA', '2018', 'Informatika - S14'),
(1801063, 'ABDUL RAHMAN BAKTI', '2018', 'Informatika - S15'),
(1801064, 'ADJI WIRO KUSUMO', '2018', 'Informatika - S16'),
(1801068, 'ARIEF FARIED MAJDY', '2018', 'Informatika - S1'),
(1801073, 'TASYA ANANDA', '2018', 'Informatika - S1'),
(1801079, 'MUHAMMAD ABDA YURID NURKASIM', '2018', 'Informatika - S1'),
(1801080, 'KHORIYA WIDYA DININGRUM', '2018', 'Informatika - S1'),
(1801087, 'PANDU BAMBANG RACHMADI', '2018', 'Informatika - S1'),
(1801088, 'DEWI CAHYA LARASATI', '2018', 'Informatika - S1'),
(1801089, 'DINDA SARASMITA', '2018', 'Informatika - S17'),
(1801095, 'MOCHAMMAD HAIKAL NURRAHMAN', '2018', 'Informatika - S18'),
(1801126, 'DHANU ICHWANTO', '2018', 'Informatika - S1'),
(1801140, 'PITRI MELIANA', '2018', 'Informatika - S19'),
(1801149, 'GITA HARYATI', '2018', 'Informatika - S1'),
(1801158, 'NADIA EKA PUTRI', '2018', 'Informatika - S1'),
(1801159, 'REYNALD PERMA RAZAK', '2018', 'Informatika - S1'),
(1801161, 'ANISA RAHMANI KAIRUPAN', '2018', 'Informatika - S1'),
(1801162, 'ANDRI SETIAWAN', '2018', 'Informatika - S1'),
(1801167, 'WIRA YUDHA FADLIE', '2018', 'Informatika - S1'),
(1801168, 'MUHAMMAD NUR WINDARKO', '2018', 'Informatika - S1'),
(1801195, 'AZIS ABDILLAH', '2018', 'Informatika - S1'),
(1801200, 'NUR FATIMAH AZZAHRA', '2018', 'Informatika - S1'),
(1801203, 'ENJANG MINAYU SARASWATI', '2018', 'Informatika - S20'),
(1801205, 'ANWAR SOLEH', '2018', 'Informatika - S21'),
(1801246, 'RUSTANTI NOOR FADHILLAH', '2018', 'Informatika - S22'),
(1801268, 'DINDA AYU MARAETHA', '2018', 'Informatika - S23'),
(1801285, 'INDRA RAMADHAN NAIBAHAS', '2018', 'Informatika - S1'),
(1801299, 'ISLAMIYAH', '2018', 'Informatika - S1'),
(1801310, 'SATRIA PAMBUDI', '2018', 'Informatika - S1'),
(1801314, 'FIKRI RIDO HIDAYAT PUTRA', '2018', 'Informatika - S24'),
(1803001, 'ANGGA TRI SAPUTRA', '2018', 'Manajemen Informatika - D3'),
(1803002, 'AFINDA DEVIANA', '2018', 'Manajemen Informatika - D3'),
(1803003, 'RETNO GALEH BORNEO', '2018', 'Manajemen Informatika - D3'),
(1803007, 'NUZUL NASRUDDIN ZULHIJJAH', '2018', 'Manajemen Informatika
- D3'),
(1803008, 'TEGAR ANUGRAH', '2018', 'Manajemen Informatika - D3'),
(1803009, 'INDAH PURWANI', '2018', 'Manajemen Informatika - D3'),
(1803011, 'INDRI ABRIANI CAHYAHATI RIDOI', '2018', 'Manajemen
Informatika - D3'),
(1803012, 'ANISA DEWI RAHAYU', '2018', 'Manajemen Informatika - D3'),
(1803013, 'AINA ANNISA', '2018', 'Manajemen Informatika - D3'),
(1803014, 'SUPANDI', '2018', 'Manajemen Informatika - D3'),
(1803015, 'SURYA CIPTA WIJAYA', '2018', 'Manajemen Informatika - D3'),
(1803016, 'IVAN CHANDRA PRATIKYO', '2018', 'Manajemen Informatika -
D3'),
(1803017, 'ILHAM NAWINDAR LUBIS', '2018', 'Manajemen Informatika -
D3'),
(1803018, 'NOVI AGGINA', '2018', 'Manajemen Informatika - D3'),
(1803026, 'ALVIN TAUFIK NUR HIDAYAT', '2018', 'Manajemen Informatika -
D3'),
(1803030, 'IRVAN ARRASYD ACHSAN', '2018', 'Manajemen Informatika -
D3'),
(1803031, 'RIA AYU ANGGRAENI', '2018', 'Manajemen Informatika - D3'),
(1803033, 'ISTIQOMAH ANGGI SAPUTRI', '2018', 'Manajemen Informatika -
D3'),
(1803035, 'NUR ICA', '2018', 'Manajemen Informatika - D3'),
(1803037, 'TRISNA MELENIA DEWI', '2018', 'Manajemen Informatika -
D3'),
(1803041, 'TANIA NURSAFITRI', '2018', 'Manajemen Informatika - D3'),
(1803044, 'SARAH FA\'IZAH RACHMAN', '2018', 'Manajemen Informatika -
D3'),
(1803045, 'SARAH YULIANSYAH', '2018', 'Manajemen Informatika - D3'),
(1803046, 'JANIATI', '2018', 'Manajemen Informatika - D3'),
(1803049, 'YUNICHA DEVY PERMATA PUTRI', '2018', 'Manajemen Informatika
- D3'),
(1803050, 'MAYASARI GINTING', '2018', 'Manajemen Informatika - D3'),
(1803052, 'MARSEL ALEXANDRO MARPAUNG', '2018', 'Manajemen Informatika
- D3'),
(1803057, 'GHIA RYANDA KURNIAWAN', '2018', 'Manajemen Informatika -
D3');

--
-- Indexes for dumped tables
--

--
-- Indexes for table `mahasiswa`
--
ALTER TABLE `mahasiswa`
ADD PRIMARY KEY (`nim`);
COMMIT;

/*!40101 SET CHARACTER_SET_CLIENT=@OLD_CHARACTER_SET_CLIENT */;


/*!40101 SET CHARACTER_SET_RESULTS=@OLD_CHARACTER_SET_RESULTS */;
/*!40101 SET COLLATION_CONNECTION=@OLD_COLLATION_CONNECTION */;

5.

Anda mungkin juga menyukai