Anda di halaman 1dari 8

Nama : SITI NURJANAH Waktu : 120 Menit

NPM : 022119046 Dosen Penguji : Fajar Delli M.M.,


Mata Ujian : Data Mining Kelas M.Kom. Kode Dosen : 450
: 6B Akuntansi No Urut :-
Hari,Tanggal : Jumat, 22 April Tanda Tangan : SITI NURJANAH
2022

PERBAIKAN UJIAN TENGAH SEMESTER GENAP

SOAL 1 - Buatlah data dalam bentuk tabel sesuai dengan 1 digit akhir NPM untuk setiap
kasus, diketahui digit akhir NPM 6 maka data yang digunakan adalah nomor 7,8,9,10,1.

KASUS I – Data hasil pengujian kualitas jaringan di 2 lokasi yang berbeda dengan 5 provider.

No Provider LOKASI A LOKASI B


Urut
7 OXYGEN Sangat Kurang Baik Kurang Baik
8 Biznet Baik Baik
9 Telkomsel Cukup Baik
10 MNC Kurang baik Sangat Kurang baik
1 TELKOM Sangat Baik Sangat Baik

KASUS II – Data history pengguna web untuk sebanyak 5 aktivitas ke depan.

No Aktifitas I Aktifitas II Aktifitas III Aktifitas IV Aktifitas V


Urut
7 Home Mail Searching Verification Home
8 Home Drive Login Upload Share
9 Home Searching Verification Searching1 Searching2
10 Drive Login Upload Share
1 Home Searching Verification Searching1 Searching2

KASUS III – Data hasil pengujian web.

No Alamat Kategori Durasi update Respon Admin Web


Urut Konten
7 viva.com Baik Setiap hari Kurang dari 24 Jam
8 myrepublic.co.id Rendah Setiap hari Tidak ada respon
9 Liputan6.com Baik Setiap hari Kurang dari 24 Jam
10 tempo.com Kurang 3 hari Tidak ada respon
1 tes.com Baik Setiap hari Kurang dari 24 Jam
SOAL 2 - Lakukan praproses data untuk seluruh kasus berdasarkan data yang diperoleh
dari soal 1.

KASUS I – Data hasil pengujian kualitas jaringan di 2 lokasi yang berbeda dengan 5

provider. Sebelum dilakukan praproses data :


No Provider LOKASI A LOKASI B
Urut
7 OXYGEN Sangat Kurang Baik Kurang Baik
8 Biznet Baik Baik
9 Telkomsel Cukup Baik
10 MNC Kurang baik Sangat Kurang baik
1 TELKOM Sangat Baik Sangat Baik
Setelah dilakukan praproses data :
No PROVIDER LOKASI LOKASI
Urut A B
1 OXYGEN 1 2
2 BIZNET 4 4
3 TELKOMSEL 3 4
4 MNC 2 1
5 TELKOM 5 5

Penjelasan tahapan yang dilakukan dalam praproses data :


1) Mengurutkan nomor urut data sesuai barisannya
2) Menyeragamkan semua data menjadi uppercase.
3) Merubah data dalam kolom “LOKASI A” dan “LOKASI B” kedalam bentuk angka,
dengan ketentuan:
 Sangat Baik =5
 Baik =4
 Cukup =3
 Kurang Baik =2
 Sangat Kurang Baik = 1
KASUS II – Data history pengguna web untuk sebanyak 5 aktivitas ke

depan. Sebelum dilakukan praproses data :


No Aktifitas I Aktifitas II Aktifitas III Aktifitas IV Aktifitas V
Urut
7 Home Mail Searching Verification Home
8 Home Drive Login Upload Share
9 Home Searching Verification Searching1 Searching2
10 Drive Login Upload Share
1 Home Searching Verification Searching1 Searching2
Setelah dilakukan praproses data :
No AKTIFITAS 1 AKTIFITAS AKTIFITAS AKTIFITAS AKTIFITAS
Urut 2 3 4 5
1 HOME MAIL SEARCHING VERIFICATI HOME
ON
2 HOME DRIVE LOGIN UPLOAD SHARE
3 HOME SEARCHING VERIFICATIO SEARCHING SEARCHING
N 1 2
4 HOME DRIVE LOGIN UPLOAD SHARE
5 HOME SEARCHING VERIFICATIO SEARCHING SEARCHING
N 1 2

Penjelasan tahapan yang dilakukan dalam praproses data :


1) Mengurutkan nomor urut data sesuai barisannya
2) Merubah angka romawi dalam baris judul menjadi angka biasa.
3) Menyeragamkan semua data menjadi uppercase.
4) Data kosong dalam AKTIVITAS 1 diisi dengan “HOME” , karena dalam kolom
AKTIVITAS 1 semua datanya berisi “HOME” sehingga saya memutuskan untuk
menyeragamkannya.
5) Merubah penulisan data “SEARCHING1” dan “SEARCHING2” dalam aktivitas 4 dan 5
menjadi “SEARCHING 1” dan “SEARCHING 2”

KASUS III – Data hasil pengujian web. Sebelum dilakukan praproses data :

No Alamat Kategori Durasi Respon Admin Web


Urut update
Konten
7 viva.com Baik Setiap hari Kurang dari 24 Jam
8 myrepublic.co.id Rendah Setiap hari Tidak ada respon
9 Liputan6.com Baik Setiap hari Kurang dari 24 Jam
10 tempo.com Kurang 3 hari Tidak ada respon
1 tes.com Baik Setiap hari Kurang dari 24 Jam
Setelah dilakukan praproses data :
No ALAMAT DURASI RESPON ADMIN WEB BOBO
Urut UPDATE T
KONTEN
1 viva.com SETIAP HARI KURANG DARI 24 JAM 4
2 myrepublic.co.id SETIAP HARI TIDAK ADA RESPON 1
3 liputan6.com SETIAP HARI KURANG DARI 24 JAM 4
4 tempo.com 3 HARI TIDAK ADA RESPON 2
5 tes.com SETIAP HARI KURANG DARI 24 JAM 4

Penjelasan tahapan yang dilakukan dalam praproses data :


4) Mengurutkan nomor urut data sesuai barisannya
5) Merubah semua data menjadi uppercase kecuali isi dalam kolom alamat yang
diseragamkan menjadi lowercase.
6) Memindahkan kolom kategori kesebelah kanan dan merubahnya dari “KATEGORI”
menjadi “BOBOT” dengan ketentuan:
 Tinggi =5
 Baik =4
 Cukup =3
 Kurang =2
 Rendah =1

SOAL 3 – Lakukan Proses Mining berdasarkan hasil praproses pada soal 2. Dengan
ketentuan :
(1) Jika menggunakan teknik asosiasi, selesaikan hingga seluruh iterasi. Ditentukan minsup
= 40% dan minconf = 40%.
(2) Jika menggunakan teknik klasifikasi, selesaikan hingga mendapatkan tree.
(3) Jika menggunakan teknik clustering, jumlah kluster ditentukan sebanyak 2 bagian.

KASUS I – Data hasil pengujian kualitas jaringan di 2 lokasi yang berbeda dengan 5 provider.
No PROVIDER LOKASI LOKASI
Urut A B
1 OXYGEN 1 2
2 BIZNET 4 4
3 TELKOMSEL 3 4
4 MNC 2 1
5 TELKOM 5 5

Kasus ini dapat diselesaikan dengan teknik klasifikasi, namun tidak ditemukan perhitungan yang
cocok dengan data yang disajikan dalam tabel kasus 1 tersebut. Sehingga saya tidak dapat
menemukan penyelesaiannya
KASUS II – Data history pengguna web untuk sebanyak 5 aktivitas ke depan.

No AKTIFITAS 1 AKTIFITAS AKTIFITAS AKTIFITAS AKTIFITAS


Urut 2 3 4 5
1 HOME MAIL SEARCHING VERIFICATI HOME
ON
2 HOME DRIVE LOGIN UPLOAD SHARE
3 HOME SEARCHING VERIFICATIO SEARCHING SEARCHING
N 1 2
4 HOME DRIVE LOGIN UPLOAD SHARE
5 HOME SEARCHING VERIFICATIO SEARCHING SEARCHING
N 1 2

Saya mencoba menyelesaikan kasus ini dengan teknik asosasi, diketahui telah ditentukan minsup
= 40% dan minconf = 40%.

Iterasi 1 : k-itemset (k=1)


NO AKTIVITAS JUMLAH NILAI MINIMUM SUPPORT
URU AKTIVITA (JUMLAH AKTIVITAS / JUMLAH DATA
T S AKTIVITAS)
1 HOME 6 60%
2 MAIL 1 10%
3 DRIVE 2 20%
4 SEARCHING 3 30%
5 LOGIN 2 20%
6 VERIFICATION 3 30%
7 UPLOAD 2 20%
8 SEARCHING 1 2 20%
9 SHARE 2 20%
10 SEARCHING 2 2 20%

Aktvitas yang tidak memenuhi ketentuan minsup 40% akan dieliminasi. Maka data aktivitas
yang tersisa yaitu:
AKTIVITAS JUMLAH NILAI MINIMUM SUPPORT
AKTIVITAS (JUMLAH AKTIVITAS / JUMLAH DATA
AKTIVITAS)
HOME 6 60%

Iterasi 2 : k-itemset (k=2)


AKTI JUMLAH NILAI MINIMUM SUPPORT
VITA AKTIVITAS (JUMLAH AKTIVITAS / JUMLAH DATA
S AKTIVITAS)
(HOME, MAIL) 1 0.003623 = 0.36%
(HOME, DRIVE) 2 0.007246 = 0.72%
(HOME, SEARCHING) 2 0.007246 = 0.72%
(MAIL, SEARCHING) 1 0.003623 = 0.36%
(DRIVE, LOGIN) 2 0.007246 = 0.72%
(SEARCHING, 3 0.01087=1.09%
VERIFICATION)
(LOGIN, UPLOAD) 2 0.007246 = 0.72%
(VERIFICATION, 2 0.007246 = 0.72%
SERACHING 1)
(VERIFICATION, HOME) 1 0.003623 = 0.36%
(UPLOAD, SHARE) 2 0.007246 = 0.72%
(SEARCHING 1, 2 0.007246 = 0.72%
SEARCHING 2)

Saya hanya memasukan iterasi yang terjadi dalam aktivitas, dan saya mencobamengitung jumlah
seluruh aktivitas yang terjadi dengan rumus kombinasi berikut:

Diketahui, n = 24 dan r = 2 ( )
( )

Dengan melihat tabel iterasi 2 dapat disimpulkan bahwa semua aktivitas dieliminasi karena tidak
ada yang memenuhi ketentuan misup = 40%.

KASUS III – Data hasil pengujian web.

No ALAMAT DURASI RESPON ADMIN WEB BOBO


Urut UPDATE T
KONTEN
1 viva.com SETIAP HARI KURANG DARI 24 JAM 4
2 myrepublic.co.id SETIAP HARI TIDAK ADA RESPON 1
3 liputan6.com SETIAP HARI KURANG DARI 24 JAM 4
4 tempo.com 3 HARI TIDAK ADA RESPON 2
5 tes.com SETIAP HARI KURANG DARI 24 JAM 4

Saya mencoba menyelesaikannya dengan teknik klasifikasi – algoritma decision tree. Dengan
menggunakan teknik ini langkah pertama yang harus dilakukan adalah menghitung average
entropy dengan rumus :

DURASI UPDATE KONTEN


B1 “Setiap Hari” terdapat 3(4) dan 1(1)
B2 “3 Hari” terdapat 1(2)
Average entropy = 4/5 { (- 3/4 log2 (3/4 ) – 1/4 log2 1/4)} + 1/5 (-log2 1)
= 0.6490 + 0
= 0.6490
RESPON ADMIN WEB
B1 “Kurang dari 24 jam” terdapat 3(4)
B2 “Tidak ada respon” terdapat 1(1) dan 1(2)

Average entropy = 3/5 (- log2 1 ) + 2/5 { (- 1/2 log2 (1/2) – 1/2 log2 1/2)}
= 0 + 0.4
= 0.4

TABEL HASIL PERHITUNGAN AVERAGE ENTROPY


ATRIB AVERAGE ENTROPY
UT
DURASI UPDATE KONTEN 0.6490
RESPON ADMIN WEB 0.4

Nilai entropi terkecil akan dipilih menjadi root node. Dari tabel diatas dapat dilihat bahwa atribut
“RESPON ADMIN WEB” memiliki nilai yang lebih kecil yaitu sebesar 0.4, Jadi dapat dibuat
tree nya sebagai berikut:

RESPON ADMIN WEB

KURANG DARI TIDAK ADA


24 JAM RESPON

BAIK KURANG RENDAH


SOAL 4 - Jelaskan perbedaan data, informasi dan pengetahuan dan berikan contoh
kasusnya sesuai soal No 3.

DATA dapat diartikan sebagai sesuatu yang belum memiliki arti bagi penerimanya sebelum
sesuatu tersebut diolah. Suatu data dapat berwujud suatu keadan, gambar, suara, huruf, angka,
ataupun simbol lain yang bisa kita gunakan sebagai bahan untuk melihat lingkungan, objek atau
suatu kejadian tertentu.

INFORMASI merupakan sekumpulan data atau fakta yang diolah dengan cara tertentu sehingga
mempunyai arti bagi penerimanya. Data yang telah diolah ini dapat memberikan keterangan atau
pengetahuan bagi penerimanya.

PENGETAHUAN yaitu informasi yang diketahui atau disadari oleh seseorang. Pengetahuan
muncul ketika seseorang menggunakan akal nya untuk mengenali suatu kejadian atau sesuatu
yang lain yang belum pernahdilihat atau dirasakan sebelumnya.

Jadi dapat disimpulkan bahwa informasi adalah data yang diolah, dan pengetahuan adalah
informasi yang telah dikelola untuk diterapkan dalam memahami suatu konsep.

CONTOH :

No Provider LOKASI A LOKASI B


Urut
7 OXYGEN Sangat Kurang Baik Kurang Baik
8 Biznet Baik Baik
9 Telkomsel Cukup Baik
10 MNC Kurang baik Sangat Kurang baik
1 TELKOM Sangat Baik Sangat Baik

Tabel yang disajikan diatas merupakan data pengujian kualitas provider di dua lokasi tertentu. Data
tersebut kemudian diolah untuk menjadi infomasi, diketahui bahwa kualitas jaringan OXYGEN sangat
kurang baik di lokasi A dan kurang baik di lokasi B, sedangkan TELKOM sangat baik dikedua lokasi
tersebut. Berdasarkan informasi tersebut maka diperoleh pengetahuan bahwa apabila kita tinggal di lokasi
B lebih baik menggunakan TELKOM dan jangan menggunakan MNC karena kulitas jaringannya sangat
kurang baik di lokasi tersebut.

Anda mungkin juga menyukai