Anda di halaman 1dari 50

Aviana Nurrahmi 2012320012 And Ramadhani Dwinanto 2012320014

Gabungan antara database dan pengelolanya akan menghasilkan suatu sistem yang disebut SISTEM BASIS DATA (Database Management System).
adalah suatu sistem penyusunan dan pengelolaan record-record dengan menggunakan komputer, dengan tujuan untuk menyimpan atau merekam serta memelihara data operasional lengkap sebuah organisasi/perusahaan sehingga mampu menyediakan informasi yang diperlukan user untuk kepentingan proses pengambilan keputusan.

1. 2.

DMBS / Database Management System ada 2 jenis yaitu : DBMS Desktop VLDB (Very Large Database)

- Microsoft Access - Foxpro - Visual basic

Kelemahan DBMS desktop : - Security - Compatibilitas - Kapabilitas - Daya tampung

Oracle Sql Server My sql Jaguar Informix Sybase Pgsql Postgresspl DB2

Apa sebenarnya yang memotivasi datamining dan mengapa data mining begitu penting ?

Alasan utama mengapa data mining sangat menarik perhatian industri informasi dalam beberapa tahun belakangan ini adalah dan dan

Data

mining

adalah (Davies, 2004). juga disebut

Data

mining

sebagai

(Pramudiono, 2007).

Data Mining juga dapat didefinisikan sebagai

Data mining, sering juga disebut sebagai


KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar.

Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui sebelumnya. Data mining biasa menggunakan data yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil lebih dipercaya. Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi (Davies, 2004).

Bidang ilmu yang berkaitan :


Database High performance computing Information science (ilmu informasi) Information retrieval Information extraction Machine learning Neural networks (jaringan saraf tiruan) Pemodelan matematika Pengenalan pola Statistik Visualisasi

Pembersihan data (Data Cleaning) Pembersihan data merupakan

Pada umumnya data yang diperoleh, memiliki isi yang tidak sempurna seperti data yang hilang, tidak valid atau salah ketik. Selain itu, ada juga atribut-atribut data yang tidak relevan.

Integrasi Data (Data Integration) Integrasi data merupakan

Integrasi data perlu dilakukan secara cermat karena kesalahan pada integrasi data bisa menghasilkan hasil yang menyimpang dan bahkan menyesatkan pengambilan aksi nantinya.

Seleksi Data (Data Selection) Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu untuk dianalisis yang akan diambil dari database.

Transformasi data (Data Transformation) Data

untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan.

Proses mining Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.

Evaluasi Pola (Pattern Evaluation) Untuk

yang ditemukan. Dalam tahap ini hasil dari data mining berupa pola-pola yang khas maupun model prediksi dievaluasi apakah hipotesa yang ada tercapai. Bila hasil yang diperoleh tidak sesuai hipotesa ada beberapa alternatif yang diambil.

Presentasi pengetahuan (knowledge presentation) Merupakan

mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.

1. Konsep/Class Description Data dapat diasosiasikan dengan . Deskripsi suatu class atau konsep seperti itu disebut class/concept descripition. 2. Association Analysis Association analysis adalah penemuan association rules yang menunjukkan nilai kondisi suatu attribute yang terjadi bersama-sama secara terusmenerus dalam memmberikan set data. Association analysis secara luas dipakai untuk market basket atau analisa data transaksi.

3. Klasifikasi dan Predikasi Klasifikasi dan prediksi mungkin perlu diproses oleh analisis relevan, yang berusaha untuk yang tidak ditambahkan pada proses klasifikasi dan prediksi. Atribut-atribut ini kemudian dapat dikeluarkan.

4. Cluster Analysis Tidak seperti klasifikasi dan prediksi, yang menganalisis objek data dengan kelas yang terlabel, clustering menganalisis objek data tanpa mencari keterangan pada label kelas yang diketahui. Clustering dapat digunakan untuk menghasilkan label-label.

5. Outlier Analysis Outlier dapat dideteksi menggunakan test yang bersifat statistik yang mengambil sebuah distribusi atau , atau menggunakan langkah-langkah jarak jauh di mana objek yang penting jauh dari cluster lainnya dianggap outlier.

6. Evolution Analysis Data analisa evolusi

menggambarkan

Meskipun ini mungkin termasuk karakteristik, diskriminasi, asosiasi, klasifikasi, atau clustering data berdasarkan waktu, kelebihan yang jelas seperti analisa termasuk analisa data time-series, urutan atau pencocokan pola secara berkala, dan kesamaan berdasarkan analisa data.

IBM, Microsoft, SAS, SGI, dan SPSS terus gencar melakukan penelitian-penelitian di bidang data mining dan telah menghasilkan berbagai software untuk melakukan data mining : dari IBM. Berjalan di atas sistem operasi AIX, OS/390, OS/400, Solaris dan Windows NT. Dijual dengan harga sekitar US$60.000.

3.

juga telah menambahkan fasilitas data mining di Microsoft SQL Server 2000, 2005, 2008, 2012. Enterprise Miner dari SAS. Berjalan di atas sistem operasi AIX/6000, CMS, Compaq Tru64 UNIX, HP-UX, IRIX, Intel ABI, MVS, OS/2, Open VMS Alpha, Open VMS Vax, Solaris, dan Windows. dari Silicon Graphics. Berjalan di atas sistem operasi Windows 9x/NT dan IRIX. Dijual per seat seharga US$995, server (Windows NT) seharga US$35.000 dan untuk IRIX dijual US$50.000.

dari SPSS. Berjalan di atas sistem operasi UNIX dan Windows NT.

Selain aplikasi-aplikasi yang disebutkan di atas, banyak sekali software-software yang digunakan perusahaan untuk melakukan proses data mining perusahaan mereka. Contohnya : 1. Statistica 2. Weka 3. Estard

Statistica Data Miner Statistica Data Miner banyak digunakan dalam perusahaan besar, lembaga pemerintahan, dan universitas di seluruh dunia. Salah satu perusahaan yang menggunakan Statistica adalah The Coca-Cola Company.

Weka 3 Weka adalah mesin yang terdiri dari kumpulan algoritma untuk menyelesaikan pengerjaan data mining. Algoritma tersebut di terjemahkan kedalam Java code. Weka 3 ini dibuat oleh University of Waikato, dan merupakan program open source.

ESTARD Data Miner Estard merupakan data mining yang memiliki tool yang simple, yang di desain untuk data mining lanjutan dan pengguna yang umum. Tool yang tersedia mencangkup :

insurance industry banking finances marketing campaigns accounting & inventory management healthcare scientific researches military sphere.

Definisi :

Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung DSS (Decision Suport System) dan EIS (Executive Information System). Salinan dari transaksi data yang terstruktur secara spesifik pada query dan analisa. Salinan dari transaksi data yang terstruktur spesifik untuk query dan laporan Data warehouse adalah sebuah sistem yang mengambil dan menggabungkan data secara periodik dari sistem sumber data ke penyimpanan data bentuk dimensional atau normal arsitektur, pembangunan dan penyatuan data dari bermacam macam sumber data yang berbeda untuk mendukung strukturdan atau query tertentu, laporan analisis, dan pembuatan keputusan

Meningkatkan

kualitas dan akurasi informasi bisnis dan mengirimkan informasi ke pemakai dalam bentuk yang dimengerti dan dapat diakses dengan mudah. untuk menyatukan data yang beragam ke dalam sebuah tempat penyimpanan dimana user dapat dengan mudah menjalankan query (pencarian data), menghasilkan laporan, dan melakukan analisis.

Terdapat 4 karateristik data warehouse :


1. Subject Oriented Data yang disusun menurut yang berisi hanya informasi penting bagi pemprosesan decision support. semua informasi yang tersimpan di kelompokkan berdasarkan subyek tertentu. Data-data di setiap subyek dirangkum ke dalam dimensi, misalnya : periode waktu, produk, wilayah, dsb, sehingga dapat memberikan nilai sejarah untuk bahan analisa.

2. Integrated Data warehouse biasanya dibangun dari bermacam-macam sumber yang berbeda, seperti database relasional, flat files, dan on-line transaction records. diterapkan untuk menjamin konsistensi dalam penamaan, struktur kode, ukuran atribut, dan yang lainnya.

3. Time-variant

Data disimpan untuk menyajikan dari sudut pandang (misal 5 10 tahun yang lalu). Setiap struktur kunci dalam data warehouse mempunyai elemen waktu baik secara implisit maupun eksplisit

4. Non volatile

Tidak dapat tetapi hanya dapat ditambah dan dilihat. sebuah data warehouse secara fisik selalu disimpan terpisah dari data aplikasi operasional.

Data cube adalah presentasi data multidimensi seperti jenis barang, waktu, lokasi dsb

Data cube mendukung beberapa feature seperti : Rotation/Pivoting Dengan kemampuan OLAP rotation/pivoting, kita dapat melihat data dari berbagai sudut pandang (view point). kita dapat memutar-mutar sumbu pada cube sehingga kita memperoleh data yang kita inginkan sesuai dengan sudut pandang analisa yang kita perlukan.

Slicing dan dicing Pemilahan data dapat kita lakukan dengan proses slicing dan dicing. Slicing merupakan pemotongan sisi dari cube, artinya data yang kita potong berdasarkan kategori tertentu. Sedangkan dicing merupakan penyaringan subset data dari proses slicing.

Drill down dan consolidation Agregasi data bisa kita lakukan dengan drill down dan consolidation. Penampilan data yang lebih detil dapat dilakukan dengan drill down dan sebaliknya untuk menyatukan data ke dalam hieraki yang lebih tinggi dapat dilakukan dengan consolidation.

OLAP (Online Analitycal Processing) adalah

OLAP juga merupakan suatu sistem atau teknologi yang dirancang untuk mendukung proses analisis kompleks dalam rangka mengungkapkan kecenderungan pasar dan faktor-faktor penting dalam bisnis OLAP ditandai dengan kemampuannya menaikkan atau menurunkan dimensi data sehingga kita dapat menggali data sampai pada level yang sangat detail dan memperoleh pandangan yang lebih luas mengenai objek yang sedang kita analisis.

OLAP secara khusus memfokuskan pada pembuatan data agar dapat diakses pada saat pendefinisian kembali dimensi. OLAP dapat digunakan membuat rangkuman dari multidimensi data yang berbeda, rangkuman baru dan mendapatkan respon secara online, dan memberikan view dua dimensi pada data cube multidimensi secara interaktif.

Adapun karakteristik dari OLAP , yaitu : Mengijinkan user melihat data dari sudut pandang logical dan multidimensional pada datawarehouse. Memfasilitasi query yang komplek dan analisa bagi user. Mengijinkan user melakukan Drill down untuk menampilkan data pada level yang lebih detil atau roll up untuk agregasi dari satu dimensi atau beberapa dimensi. Menyediakan proses kalkulasi dan perbandingan data. Menampilkan hasil dalam bentuk number termasuk dalam tabel dan grafik.

On-Line Transaction Processing (OLTP) adalah sebuah istilah dalam data warehouse OLTP sendiri adalah suatu kegiatan atau sebuah proses database dalam menyimpan data dalam kegiatan yang dilakukan setiap hari. Tujuan OLTP adalah memelihara basis data dalam bentuk yang

Karakteristik OLTP adalah seperti berikut : transaksi singkat dan sederhana, pemutakhiran relatif sering dilakukan, dan transaksi hanya mengakses sebagian kecil basis data.

OLTP memberikan manfaat dalam data warehouse, diantaranya adalah sebagai berikut : 1. waktu karena data transaksi disimpan setiap hari,sehingga tidak ada penumpukan data yang belum disimpan. 2. Data ke dalam warehouse karena data-data tersebut disimpan setiap tanggal transaksi dilaksanakan.

Davies, and Paul Beynon, 2004, Database Systems Third Edition. New York: Palgrave Macmillan. Pramudiono, I., 2007, Algoritma Apriori, http://datamining.japati.net/cgibin/indodm.cgi?baca arsip&1172210143 Pramudiono, I. 2007. Pengantar Data Mining : Menambang Permata Pengetahuan di Gunung Data. http://www.ilmukomputer.org/wpcontent/uploads/2006/08/iko-datamining.zip Ilmuti.org/2012/07/olap-data-warehouse/ http://www.gudangmateri.com/2010/04/datamultidimensi.html http://bosstambang.com/Tambang/pengantar-datamining.html

http://www.statsoft.com/ http://www.cs.waikato.ac.nz/ml/weka/inde x.html http://www.estard.com/