Anda di halaman 1dari 8

Nama : Sandania Khodilla Waktu : 120 Menit

NPM : 022118226 Dosen Penguji : Fajar Delli M.M., M.Kom.


Mata Ujian : Data Mining Kode Dosen : 450
Semester : 6 (Enam) No Urut :-
Hari,Tanggal : Rabu, 14 April 2021 Tanda Tangan : Sandania Khodilla

UJIAN TENGAH SEMESTER GENAP

SOAL 1 - Buatlah data dalam bentuk tabel sesuai dengan 1 digit akhir NPM untuk setiap
kasus, diketahui digit akhir NPM 6 maka data yang digunakan adalah nomor 7,8,9,10,1.

KASUS I – Data hasil pengujian kualitas jaringan di 2 lokasi yang berbeda dengan 10 provider.

No Provider LOKASI A LOKASI B


Urut
7 OXYGEN Sangat Kurang Baik Kurang Baik
8 Biznet Baik Baik
9 Telkomsel Cukup Baik
10 MNC Kurang baik Sangat Kurang baik
1 TELKOM Sangat Baik Sangat Baik

KASUS II – Data history pengguna web untuk sebanyak 5 aktivitas ke depan.

No Aktifitas I Aktifitas II Aktifitas III Aktifitas IV Aktifitas V


Urut
7 Home Mail Searching Verification Home
8 Home Drive Login Upload Share
9 Home Searching Verification Searching1 Searching2
10 Drive Login Upload Share
1 Home Searching Verification Searching1 Searching2

KASUS III – Data hasil pengujian web.

No Alamat Kategori Durasi update Respon Admin Web


Urut Konten
7 viva.com Baik Setiap hari Kurang dari 24 Jam
8 myrepublic.co.id Rendah Setiap hari Tidak ada respon
9 Liputan6.com Baik Setiap hari Kurang dari 24 Jam
10 tempo.com Kurang 3 hari Tidak ada respon
1 tes.com Baik Setiap hari Kurang dari 24 Jam
SOAL 2 - Lakukan praproses data untuk seluruh kasus berdasarkan data yang diperoleh dari
soal 1.

KASUS I – Data hasil pengujian kualitas jaringan di 2 lokasi yang berbeda dengan 10 provider.

Sebelum dilakukan praproses data :


No Provider LOKASI A LOKASI B
Urut
7 OXYGEN Sangat Kurang Baik Kurang Baik
8 Biznet Baik Baik
9 Telkomsel Cukup Baik
10 MNC Kurang baik Sangat Kurang baik
1 TELKOM Sangat Baik Sangat Baik

Setelah dilakukan praproses data :


No PROVIDER LOKASI A LOKASI B
Urut
1 OXYGEN 1 2
2 BIZNET 4 4
3 TELKOMSEL 3 4
4 MNC 2 1
5 TELKOM 5 5

Penjelasan tahapan yang dilakukan dalam praproses data :


1) Mengurutkan nomor urut data sesuai barisannya
2) Menyeragamkan semua data menjadi uppercase.
3) Merubah data dalam kolom “LOKASI A” dan “LOKASI B” kedalam bentuk angka, dengan
ketentuan:
 Sangat Baik =5
 Baik =4
 Cukup =3
 Kurang Baik =2
 Sangat Kurang Baik = 1
KASUS II – Data history pengguna web untuk sebanyak 5 aktivitas ke depan.

Sebelum dilakukan praproses data :


No Aktifitas I Aktifitas II Aktifitas III Aktifitas IV Aktifitas V
Urut
7 Home Mail Searching Verification Home
8 Home Drive Login Upload Share
9 Home Searching Verification Searching1 Searching2
10 Drive Login Upload Share
1 Home Searching Verification Searching1 Searching2

Setelah dilakukan praproses data :


No AKTIFITAS 1 AKTIFITAS 2 AKTIFITAS 3 AKTIFITAS 4 AKTIFITAS 5
Urut
1 HOME MAIL SEARCHING VERIFICATION HOME
2 HOME DRIVE LOGIN UPLOAD SHARE
3 HOME SEARCHING VERIFICATION SEARCHING 1 SEARCHING 2
4 HOME DRIVE LOGIN UPLOAD SHARE
5 HOME SEARCHING VERIFICATION SEARCHING 1 SEARCHING 2

Penjelasan tahapan yang dilakukan dalam praproses data :


1) Mengurutkan nomor urut data sesuai barisannya
2) Merubah angka romawi dalam baris judul menjadi angka biasa.
3) Menyeragamkan semua data menjadi uppercase.
4) Data kosong dalam AKTIVITAS 1 diisi dengan “HOME” , karena dalam kolom AKTIVITAS 1
semua datanya berisi “HOME” sehingga saya memutuskan untuk menyeragamkannya.
5) Merubah penulisan data “SEARCHING1” dan “SEARCHING2” dalam aktivitas 4 dan 5
menjadi “SEARCHING 1” dan “SEARCHING 2”

KASUS III – Data hasil pengujian web.

Sebelum dilakukan praproses data :


No Alamat Kategori Durasi update Respon Admin Web
Urut Konten
7 viva.com Baik Setiap hari Kurang dari 24 Jam
8 myrepublic.co.id Rendah Setiap hari Tidak ada respon
9 Liputan6.com Baik Setiap hari Kurang dari 24 Jam
10 tempo.com Kurang 3 hari Tidak ada respon
1 tes.com Baik Setiap hari Kurang dari 24 Jam
Setelah dilakukan praproses data :
No ALAMAT DURASI UPDATE RESPON ADMIN WEB BOBOT
Urut KONTEN
1 viva.com SETIAP HARI KURANG DARI 24 JAM 4
2 myrepublic.co.id SETIAP HARI TIDAK ADA RESPON 1
3 liputan6.com SETIAP HARI KURANG DARI 24 JAM 4
4 tempo.com 3 HARI TIDAK ADA RESPON 2
5 tes.com SETIAP HARI KURANG DARI 24 JAM 4

Penjelasan tahapan yang dilakukan dalam praproses data :


4) Mengurutkan nomor urut data sesuai barisannya
5) Merubah semua data menjadi uppercase kecuali isi dalam kolom alamat yang
diseragamkan menjadi lowercase.
6) Memindahkan kolom kategori kesebelah kanan dan merubahnya dari “KATEGORI”
menjadi “BOBOT” dengan ketentuan:
 Tinggi =5
 Baik =4
 Cukup =3
 Kurang =2
 Rendah =1

SOAL 3 – Lakukan Proses Mining berdasarkan hasil praproses pada soal 2. Dengan ketentuan :
(1) Jika menggunakan teknik asosiasi, selesaikan hingga seluruh iterasi. Ditentukan minsup
= 40% dan minconf = 40%.
(2) Jika menggunakan teknik klasifikasi, selesaikan hingga mendapatkan tree.
(3) Jika menggunakan teknik clustering, jumlah kluster ditentukan sebanyak 2 bagian.

KASUS I – Data hasil pengujian kualitas jaringan di 2 lokasi yang berbeda dengan 10 provider.
No PROVIDER LOKASI A LOKASI B
Urut
1 OXYGEN 1 2
2 BIZNET 4 4
3 TELKOMSEL 3 4
4 MNC 2 1
5 TELKOM 5 5

Kasus ini dapat diselesaikan dengan teknik klasifikasi, namun tidak ditemukan perhitungan yang
cocok dengan data yang disajikan dalam tabel kasus 1 tersebut. Sehingga saya tidak dapat
menemukan penyelesaiannya
KASUS II – Data history pengguna web untuk sebanyak 5 aktivitas ke depan.

No AKTIFITAS 1 AKTIFITAS 2 AKTIFITAS 3 AKTIFITAS 4 AKTIFITAS 5


Urut
1 HOME MAIL SEARCHING VERIFICATION HOME
2 HOME DRIVE LOGIN UPLOAD SHARE
3 HOME SEARCHING VERIFICATION SEARCHING 1 SEARCHING 2
4 HOME DRIVE LOGIN UPLOAD SHARE
5 HOME SEARCHING VERIFICATION SEARCHING 1 SEARCHING 2

Saya mencoba menyelesaikan kasus ini dengan teknik asosasi, diketahui telah ditentukan
minsup = 40% dan minconf = 40%.

Iterasi 1 : k-itemset (k=1)


NO AKTIVITAS JUMLAH NILAI MINIMUM SUPPORT
URUT AKTIVITAS (JUMLAH AKTIVITAS / JUMLAH DATA AKTIVITAS)
1 HOME 6 60%
2 MAIL 1 10%
3 DRIVE 2 20%
4 SEARCHING 3 30%
5 LOGIN 2 20%
6 VERIFICATION 3 30%
7 UPLOAD 2 20%
8 SEARCHING 1 2 20%
9 SHARE 2 20%
10 SEARCHING 2 2 20%

Aktvitas yang tidak memenuhi ketentuan minsup 40% akan dieliminasi. Maka data aktivitas
yang tersisa yaitu:
AKTIVITAS JUMLAH NILAI MINIMUM SUPPORT
AKTIVITAS (JUMLAH AKTIVITAS / JUMLAH DATA AKTIVITAS)
HOME 6 60%

Iterasi 2 : k-itemset (k=2)


AKTIVITAS JUMLAH NILAI MINIMUM SUPPORT
AKTIVITAS (JUMLAH AKTIVITAS / JUMLAH DATA AKTIVITAS)
(HOME, MAIL) 1 0.003623 = 0.36%
(HOME, DRIVE) 2 0.007246 = 0.72%
(HOME, SEARCHING) 2 0.007246 = 0.72%
(MAIL, SEARCHING) 1 0.003623 = 0.36%
(DRIVE, LOGIN) 2 0.007246 = 0.72%
(SEARCHING, VERIFICATION) 3 0.01087=1.09%
(LOGIN, UPLOAD) 2 0.007246 = 0.72%
(VERIFICATION, SERACHING 1) 2 0.007246 = 0.72%
(VERIFICATION, HOME) 1 0.003623 = 0.36%
(UPLOAD, SHARE) 2 0.007246 = 0.72%
(SEARCHING 1, SEARCHING 2) 2 0.007246 = 0.72%

Saya hanya memasukan iterasi yang terjadi dalam aktivitas, dan saya mencobamengitung
jumlah seluruh aktivitas yang terjadi dengan rumus kombinasi berikut:
( )
( )

Diketahui, n = 24 dan r = 2  ( )
( )

Dengan melihat tabel iterasi 2 dapat disimpulkan bahwa semua aktivitas dieliminasi karena
tidak ada yang memenuhi ketentuan misup = 40%.

KASUS III – Data hasil pengujian web.

No ALAMAT DURASI UPDATE RESPON ADMIN WEB BOBOT


Urut KONTEN
1 viva.com SETIAP HARI KURANG DARI 24 JAM 4
2 myrepublic.co.id SETIAP HARI TIDAK ADA RESPON 1
3 liputan6.com SETIAP HARI KURANG DARI 24 JAM 4
4 tempo.com 3 HARI TIDAK ADA RESPON 2
5 tes.com SETIAP HARI KURANG DARI 24 JAM 4

Saya mencoba menyelesaikannya dengan teknik klasifikasi – algoritma decision tree. Dengan
menggunakan teknik ini langkah pertama yang harus dilakukan adalah menghitung average
entropy dengan rumus :

∑( ) [∑ ( ) ( )]

DURASI UPDATE KONTEN


B1  “Setiap Hari” terdapat 3(4) dan 1(1)
B2  “3 Hari” terdapat 1(2)
Average entropy = 4/5 { (- 3/4 log2 (3/4 ) – 1/4 log2 1/4)} + 1/5 (-log2 1)
= 0.6490 + 0
= 0.6490
RESPON ADMIN WEB
B1  “Kurang dari 24 jam” terdapat 3(4)
B2  “Tidak ada respon” terdapat 1(1) dan 1(2)

Average entropy = 3/5 (- log2 1 ) + 2/5 { (- 1/2 log2 (1/2) – 1/2 log2 1/2)}
= 0 + 0.4
= 0.4

TABEL HASIL PERHITUNGAN AVERAGE ENTROPY


ATRIBUT AVERAGE ENTROPY
DURASI UPDATE KONTEN 0.6490
RESPON ADMIN WEB 0.4

Nilai entropi terkecil akan dipilih menjadi root node. Dari tabel diatas dapat dilihat bahwa
atribut “RESPON ADMIN WEB” memiliki nilai yang lebih kecil yaitu sebesar 0.4, Jadi dapat
dibuat tree nya sebagai berikut:

RESPON ADMIN WEB

KURANG DARI 24 TIDAK ADA RESPON


JAM

BAIK KURANG RENDAH


SOAL 4 - Jelaskan perbedaan data, informasi dan pengetahuan dan berikan contoh kasusnya
sesuai soal No 3.

DATA dapat diartikan sebagai sesuatu yang belum memiliki arti bagi penerimanya sebelum
sesuatu tersebut diolah. Suatu data dapat berwujud suatu keadaa, gambar, suara, huruf, angka,
ataupun simbol lain yang bisa kita gunakan sebagai bahan untuk melihat lingkungan, objek atau
suatu kejadian tertentu.

INFORMASI merupakan sekumpulan data atau fakta yang diolah dengan cara tertentu sehingga
mempunyai arti bagi penerimanya. Data yang telah diolah ini dapat memberikan keterangan
atau pengetahuan bagi penerimanya.

PENGETAHUAN yaitu informasi yang diketahui atau disadari oleh seseorang. Pengetahuan
muncul ketika seseorang menggunakan akal nya untuk mengenali suatu kejadian atau sesuatu
yang lain yang belum pernahdilihat atau dirasakan sebelumnya.

Jadi dapat disimpulkan bahwa informasi adalah data yang diolah, dan pengetahuan adalah
informasi yang telah dikelola untuk diterapkan dalam memahami suatu konsep.

CONTOH

No Provider LOKASI A LOKASI B


Urut
7 OXYGEN Sangat Kurang Baik Kurang Baik
8 Biznet Baik Baik
9 Telkomsel Cukup Baik
10 MNC Kurang baik Sangat Kurang baik
1 TELKOM Sangat Baik Sangat Baik

Tabel yang disajikan diatas merupakan data pengujian kualitas provider di dua lokasi tertentu. Data
tersebut kemudian diolah untuk menjadi infomasi, diketahui bahwa kualitas jaringan OXYGEN sangat
kurang baik di lokasi A dan kurang baik di lokasi B, sedangkan TELKOM sangat baik dikedua lokasi
tersebut. Berdasarkan informasi tersebut maka diperoleh pengetahuan bahwa apabila kita tinggal di
lokasi B lebih baik menggunakan TELKOM dan jangan menggunakan MNC karena kulitas jaringannya
sangat kurang baik di lokasi tersebut.

Anda mungkin juga menyukai