Sandania Khodilla - UTS DATMIN

Nama : Sandania Khodilla Waktu : 120 Menit
NPM : 022118226 Dosen Penguji : Fajar Delli M.M., M.Kom.

Mata Ujian : Data Mining Kode Dosen : 450
Semester : 6 (Enam) No Urut :-
Hari,Tanggal : Rabu, 14 April 2021 Tanda Tangan : Sandania Khodilla
UJIAN TENGAH SEMESTER GENAP
SOAL 1 - Buatlah data dalam bentuk tabel sesuai dengan 1 digit akhir NPM untuk setiap
kasus, diketahui digit akhir NPM 6 maka data yang digunakan adalah nomor 7,8,9,10,1.
KASUS I – Data hasil pengujian kualitas jaringan di 2 lokasi yang berbeda dengan 10 provider.
No Provider LOKASI A LOKASI B

Urut
7 OXYGEN Sangat Kurang Baik Kurang Baik
8 Biznet Baik Baik
9 Telkomsel Cukup Baik
10 MNC Kurang baik Sangat Kurang baik
1 TELKOM Sangat Baik Sangat Baik
KASUS II – Data history pengguna web untuk sebanyak 5 aktivitas ke depan.
No Aktifitas I Aktifitas II Aktifitas III Aktifitas IV Aktifitas V

Urut
7 Home Mail Searching Verification Home
8 Home Drive Login Upload Share
9 Home Searching Verification Searching1 Searching2
10 Drive Login Upload Share
KASUS III – Data hasil pengujian web.
No Alamat Kategori Durasi update Respon Admin Web

Urut Konten
7 viva.com Baik Setiap hari Kurang dari 24 Jam
8 myrepublic.co.id Rendah Setiap hari Tidak ada respon
9 Liputan6.com Baik Setiap hari Kurang dari 24 Jam
10 tempo.com Kurang 3 hari Tidak ada respon
1 tes.com Baik Setiap hari Kurang dari 24 Jam
SOAL 2 - Lakukan praproses data untuk seluruh kasus berdasarkan data yang diperoleh dari
soal 1.
Sebelum dilakukan praproses data :

Urut
8 Biznet Baik Baik
Setelah dilakukan praproses data :

No PROVIDER LOKASI A LOKASI B
Urut
1 OXYGEN 1 2
2 BIZNET 4 4
3 TELKOMSEL 3 4
4 MNC 2 1
5 TELKOM 5 5
Penjelasan tahapan yang dilakukan dalam praproses data :

1) Mengurutkan nomor urut data sesuai barisannya
2) Menyeragamkan semua data menjadi uppercase.
3) Merubah data dalam kolom “LOKASI A” dan “LOKASI B” kedalam bentuk angka, dengan
ketentuan:
 Sangat Baik =5
 Baik =4
 Cukup =3
 Kurang Baik =2
 Sangat Kurang Baik = 1

No Aktifitas I Aktifitas II Aktifitas III Aktifitas IV Aktifitas V
Urut
7 Home Mail Searching Verification Home
8 Home Drive Login Upload Share
10 Drive Login Upload Share

No AKTIFITAS 1 AKTIFITAS 2 AKTIFITAS 3 AKTIFITAS 4 AKTIFITAS 5
Urut
1 HOME MAIL SEARCHING VERIFICATION HOME
2 HOME DRIVE LOGIN UPLOAD SHARE
3 HOME SEARCHING VERIFICATION SEARCHING 1 SEARCHING 2

2) Merubah angka romawi dalam baris judul menjadi angka biasa.
3) Menyeragamkan semua data menjadi uppercase.
4) Data kosong dalam AKTIVITAS 1 diisi dengan “HOME” , karena dalam kolom AKTIVITAS 1
semua datanya berisi “HOME” sehingga saya memutuskan untuk menyeragamkannya.
5) Merubah penulisan data “SEARCHING1” dan “SEARCHING2” dalam aktivitas 4 dan 5
menjadi “SEARCHING 1” dan “SEARCHING 2”

No Alamat Kategori Durasi update Respon Admin Web
Urut Konten
7 viva.com Baik Setiap hari Kurang dari 24 Jam
8 myrepublic.co.id Rendah Setiap hari Tidak ada respon
9 Liputan6.com Baik Setiap hari Kurang dari 24 Jam
10 tempo.com Kurang 3 hari Tidak ada respon
1 tes.com Baik Setiap hari Kurang dari 24 Jam
No ALAMAT DURASI UPDATE RESPON ADMIN WEB BOBOT
Urut KONTEN
1 viva.com SETIAP HARI KURANG DARI 24 JAM 4
2 myrepublic.co.id SETIAP HARI TIDAK ADA RESPON 1
3 liputan6.com SETIAP HARI KURANG DARI 24 JAM 4
4 tempo.com 3 HARI TIDAK ADA RESPON 2
5 tes.com SETIAP HARI KURANG DARI 24 JAM 4

5) Merubah semua data menjadi uppercase kecuali isi dalam kolom alamat yang
diseragamkan menjadi lowercase.
6) Memindahkan kolom kategori kesebelah kanan dan merubahnya dari “KATEGORI”
menjadi “BOBOT” dengan ketentuan:
 Tinggi =5
 Baik =4
 Cukup =3
 Kurang =2
 Rendah =1
SOAL 3 – Lakukan Proses Mining berdasarkan hasil praproses pada soal 2. Dengan ketentuan :
(1) Jika menggunakan teknik asosiasi, selesaikan hingga seluruh iterasi. Ditentukan minsup
= 40% dan minconf = 40%.
(2) Jika menggunakan teknik klasifikasi, selesaikan hingga mendapatkan tree.
(3) Jika menggunakan teknik clustering, jumlah kluster ditentukan sebanyak 2 bagian.
No PROVIDER LOKASI A LOKASI B
Urut
1 OXYGEN 1 2
2 BIZNET 4 4
3 TELKOMSEL 3 4
4 MNC 2 1
5 TELKOM 5 5
Kasus ini dapat diselesaikan dengan teknik klasifikasi, namun tidak ditemukan perhitungan yang
cocok dengan data yang disajikan dalam tabel kasus 1 tersebut. Sehingga saya tidak dapat
menemukan penyelesaiannya
No AKTIFITAS 1 AKTIFITAS 2 AKTIFITAS 3 AKTIFITAS 4 AKTIFITAS 5

Urut
1 HOME MAIL SEARCHING VERIFICATION HOME
Saya mencoba menyelesaikan kasus ini dengan teknik asosasi, diketahui telah ditentukan
minsup = 40% dan minconf = 40%.
Iterasi 1 : k-itemset (k=1)

NO AKTIVITAS JUMLAH NILAI MINIMUM SUPPORT
URUT AKTIVITAS (JUMLAH AKTIVITAS / JUMLAH DATA AKTIVITAS)
1 HOME 6 60%
2 MAIL 1 10%
3 DRIVE 2 20%
4 SEARCHING 3 30%
5 LOGIN 2 20%
6 VERIFICATION 3 30%
7 UPLOAD 2 20%
8 SEARCHING 1 2 20%
9 SHARE 2 20%
10 SEARCHING 2 2 20%
Aktvitas yang tidak memenuhi ketentuan minsup 40% akan dieliminasi. Maka data aktivitas
yang tersisa yaitu:
AKTIVITAS JUMLAH NILAI MINIMUM SUPPORT
AKTIVITAS (JUMLAH AKTIVITAS / JUMLAH DATA AKTIVITAS)
HOME 6 60%
Iterasi 2 : k-itemset (k=2)

AKTIVITAS JUMLAH NILAI MINIMUM SUPPORT
AKTIVITAS (JUMLAH AKTIVITAS / JUMLAH DATA AKTIVITAS)
(HOME, MAIL) 1 0.003623 = 0.36%
(HOME, DRIVE) 2 0.007246 = 0.72%
(HOME, SEARCHING) 2 0.007246 = 0.72%
(MAIL, SEARCHING) 1 0.003623 = 0.36%
(DRIVE, LOGIN) 2 0.007246 = 0.72%
(SEARCHING, VERIFICATION) 3 0.01087=1.09%
(LOGIN, UPLOAD) 2 0.007246 = 0.72%
(VERIFICATION, SERACHING 1) 2 0.007246 = 0.72%
(VERIFICATION, HOME) 1 0.003623 = 0.36%
(UPLOAD, SHARE) 2 0.007246 = 0.72%
(SEARCHING 1, SEARCHING 2) 2 0.007246 = 0.72%
Saya hanya memasukan iterasi yang terjadi dalam aktivitas, dan saya mencobamengitung
jumlah seluruh aktivitas yang terjadi dengan rumus kombinasi berikut:
( )
( )
Diketahui, n = 24 dan r = 2  ( )
( )
Dengan melihat tabel iterasi 2 dapat disimpulkan bahwa semua aktivitas dieliminasi karena
tidak ada yang memenuhi ketentuan misup = 40%.
No ALAMAT DURASI UPDATE RESPON ADMIN WEB BOBOT

Urut KONTEN
1 viva.com SETIAP HARI KURANG DARI 24 JAM 4
2 myrepublic.co.id SETIAP HARI TIDAK ADA RESPON 1
3 liputan6.com SETIAP HARI KURANG DARI 24 JAM 4
4 tempo.com 3 HARI TIDAK ADA RESPON 2
5 tes.com SETIAP HARI KURANG DARI 24 JAM 4
Saya mencoba menyelesaikannya dengan teknik klasifikasi – algoritma decision tree. Dengan
menggunakan teknik ini langkah pertama yang harus dilakukan adalah menghitung average
entropy dengan rumus :
∑( ) [∑ ( ) ( )]
DURASI UPDATE KONTEN

B1  “Setiap Hari” terdapat 3(4) dan 1(1)
B2  “3 Hari” terdapat 1(2)
Average entropy = 4/5 { (- 3/4 log2 (3/4 ) – 1/4 log2 1/4)} + 1/5 (-log2 1)
= 0.6490 + 0
= 0.6490
RESPON ADMIN WEB
B1  “Kurang dari 24 jam” terdapat 3(4)
B2  “Tidak ada respon” terdapat 1(1) dan 1(2)
Average entropy = 3/5 (- log2 1 ) + 2/5 { (- 1/2 log2 (1/2) – 1/2 log2 1/2)}
= 0 + 0.4
= 0.4
TABEL HASIL PERHITUNGAN AVERAGE ENTROPY

ATRIBUT AVERAGE ENTROPY
DURASI UPDATE KONTEN 0.6490
RESPON ADMIN WEB 0.4
Nilai entropi terkecil akan dipilih menjadi root node. Dari tabel diatas dapat dilihat bahwa
atribut “RESPON ADMIN WEB” memiliki nilai yang lebih kecil yaitu sebesar 0.4, Jadi dapat
dibuat tree nya sebagai berikut:
RESPON ADMIN WEB
KURANG DARI 24 TIDAK ADA RESPON

JAM
BAIK KURANG RENDAH

SOAL 4 - Jelaskan perbedaan data, informasi dan pengetahuan dan berikan contoh kasusnya
sesuai soal No 3.
DATA dapat diartikan sebagai sesuatu yang belum memiliki arti bagi penerimanya sebelum
sesuatu tersebut diolah. Suatu data dapat berwujud suatu keadaa, gambar, suara, huruf, angka,
ataupun simbol lain yang bisa kita gunakan sebagai bahan untuk melihat lingkungan, objek atau
suatu kejadian tertentu.
INFORMASI merupakan sekumpulan data atau fakta yang diolah dengan cara tertentu sehingga
mempunyai arti bagi penerimanya. Data yang telah diolah ini dapat memberikan keterangan
atau pengetahuan bagi penerimanya.
PENGETAHUAN yaitu informasi yang diketahui atau disadari oleh seseorang. Pengetahuan
muncul ketika seseorang menggunakan akal nya untuk mengenali suatu kejadian atau sesuatu
yang lain yang belum pernahdilihat atau dirasakan sebelumnya.
Jadi dapat disimpulkan bahwa informasi adalah data yang diolah, dan pengetahuan adalah
informasi yang telah dikelola untuk diterapkan dalam memahami suatu konsep.
CONTOH

Urut
8 Biznet Baik Baik
Tabel yang disajikan diatas merupakan data pengujian kualitas provider di dua lokasi tertentu. Data
tersebut kemudian diolah untuk menjadi infomasi, diketahui bahwa kualitas jaringan OXYGEN sangat
kurang baik di lokasi A dan kurang baik di lokasi B, sedangkan TELKOM sangat baik dikedua lokasi
tersebut. Berdasarkan informasi tersebut maka diperoleh pengetahuan bahwa apabila kita tinggal di
lokasi B lebih baik menggunakan TELKOM dan jangan menggunakan MNC karena kulitas jaringannya
sangat kurang baik di lokasi tersebut.

Sandania Khodilla - UTS DATMIN

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Sandania Khodilla - UTS DATMIN

Diunggah oleh

Hak Cipta:

Format Tersedia

Nama : Sandania Khodilla Waktu : 120 Menit

NPM : 022118226 Dosen Penguji : Fajar Delli M.M., M.Kom.

UJIAN TENGAH SEMESTER GENAP

No Provider LOKASI A LOKASI B

KASUS II – Data history pengguna web untuk sebanyak 5 aktivitas ke depan.

No Aktifitas I Aktifitas II Aktifitas III Aktifitas IV Aktifitas V

KASUS III – Data hasil pengujian web.

No Alamat Kategori Durasi update Respon Admin Web

Sebelum dilakukan praproses data :

Setelah dilakukan praproses data :

Penjelasan tahapan yang dilakukan dalam praproses data :

Sebelum dilakukan praproses data :

Setelah dilakukan praproses data :

Penjelasan tahapan yang dilakukan dalam praproses data :

KASUS III – Data hasil pengujian web.

Sebelum dilakukan praproses data :

Penjelasan tahapan yang dilakukan dalam praproses data :

No AKTIFITAS 1 AKTIFITAS 2 AKTIFITAS 3 AKTIFITAS 4 AKTIFITAS 5

Iterasi 1 : k-itemset (k=1)

Iterasi 2 : k-itemset (k=2)

KASUS III – Data hasil pengujian web.

No ALAMAT DURASI UPDATE RESPON ADMIN WEB BOBOT

DURASI UPDATE KONTEN

TABEL HASIL PERHITUNGAN AVERAGE ENTROPY

RESPON ADMIN WEB

KURANG DARI 24 TIDAK ADA RESPON

BAIK KURANG RENDAH

No Provider LOKASI A LOKASI B

Anda mungkin juga menyukai