Personal 2

1.
Keberhasilan dalam sebuah iklan atau promosi yang sesuai dengan kebutuhan
masyarakat terhadap Informasi Layanan Pendidikan di jejaring sosial sangat
bergantung pada kemasan tampilan yang menarik dan berita yang disampaikan.
Pencapaian keberhasilan tujuan promosi tersebut akan membutuhkan tindakan yang
berkesinambungan dan tepat sasaran. Untuk mengetahui apakah Facebook Huma
Harati itu efektif atau tidak maka perlu adanya pengukuran terhadap Facebook itu
sendiri, salah satunya menggunakan metode EPIC (Empaty, Persuation, Impact, and
Communication). Hasil analisa menyatakan bahwa Fanpage Huma Harati merupakan
tempat yang efektif sebagai media promosi, hal ini terlihat dari nilai empaty,
persuasiona, impact and communication yang diperoleh. Nilai rata-rata pada EPIC
rate adalah 3,978, dimensi komunikasi mendapat nilai tertinggi dari dimensi lainnya
yaitu 4,02.
2. Konsep dari pohon keputusan adalah mengubah data menjadi decision tree dan aturan-
aturan keputusan. Manfaat utama dari penggunaan decision tree adalah
kemampuannya untuk mem-break down proses pengambilan keputusan yang
kompleks menjadi lebih simple, sehingga pengambil keputusan akan lebih
menginterpretasikan solusi dari permasalahan.
a. Nama lain dari decision tree adalah CART (Classification and Regression Tree).
Dimana metode ini merupakan gabungan dari dua jenis pohon, yaitu classification
tree dan juga regression tree. Untuk memudahkan, berikut ilustrasi dari keduanya.
Untuk gambar diatas merupakan contoh dari classification tree, sedangkan gambar dibawah
merupakan contoh dari regression tree.
b. Decision tree juga berguna untuk mengeksplorasi data, menemukan hubungan
tersembunyi antara sejumlah calon variabel input dengan sebuah variabel
target. Decision tree memadukan antara eksplorasi data dan pemodelan, sehingga
sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan
sebagai model akhir dari beberapa teknik lain.
Dalam beberapa aplikasi, akurasi dari sebuah klasifikasi atau prediksi adalah satu-satunya hal
yang ditonjolkan dalam metode ini, misalnya sebuah perusahaan direct mail membuat sebuah
model yang akurat untuk memprediksi anggota mana yang berpotensi untuk merespon
permintaan, tanpa memperhatikan bagaimana atau mengapa model tersebut bekerja.
c. Kelebihan lain dari metode ini adalah mampu mengeliminasi perhitungan atau data-
data yang kiranya tidak diperlukan. Sebab, sampel yang ada biasanya hanya diuji
berdasarkan kriteria atau kelas tertentu saja.
Meski memiliki banyak kelebihan, namun bukan berarti metode ini tidak memiliki
kekurangan. Decision tree ini bisa terjadi overlap, terutama ketika kelas dan kriteria yang
digunakan sangat banyak tentu saja dapat meningkatkan waktu pengambilan keputusan sesuai
dengan jumlah memori yang dibutuhkan.
Dalam hal akumulasi, decision tree juga seringkali mengalami kendala eror terutama dalam
jumlah besar. Selain itu, terdapat pula kesulitan dalam mendesain decision tree yang optimal.
Apalagi mengingat kualitas keputusan yang didapatkan dari metode decision tree sangat
tergantung pada bagaimana pohon tersebut didesain.
Terlepas dari kekurangan dan kelebihan dari decision tree, metode ini banyak digunakan lebih
lanjut dalam berbagai pengolahan data. Mulai dari data mining dan juga machine learning.
Dalam dunia kerja, decision tree sendiri sangat berguna untuk penilaian credit scoring. Jika
anda pernah mengajukan kredit yang diproses secara instan, nah anda sudah mempunyai
pengalaman dari decision tree.
3. Algoritma K-Nearest Neighbor (KNN) adalah algoritma yang digunakan untuk
melakukan klasifikasi terhadap suatu objek, berdasarkan k buah data latih yang
jaraknya paling dekat dengan objek tersebut. Syarat nilai k adalah tidak boleh lebih
besar dari jumlah data latih, dan nilai k harus ganjil dan lebih dari satu.
4. A. Metode partisi merupakan suatu metode yang melakukan optimasi pada

penempatan objek yang ditukar untuk cluster lainnya dengan pertimbangan optimasi.
Pada metode partisi terdapat beberapa metode antara lain metode K-Means
dan metode K-Medoids.
B. Metode hirarki (hierarchical methods) adalah metode pengklasteran yang

membentuk konstruksi hirarki berdasarkan tingkatan tertentu seperti struktur
pohon. Metode ini dibagi menjadi dua yaitu metode agglomeratif (pemusatan)
dan metode divisif (penyebaran).
C. Clustering adalah metode penganalisaan data, yang sering dimasukkan sebagai

salah satu metode Data Mining, yang tujuannya adalah untuk
mengelompokkan data dengan karakteristik yang sama ke suatu 'wilayah' yang sama
dan data dengan karakteristik yang berbeda ke 'wilayah' yang lain.
D. Metode berbasis grid (grid-based methods): Metode-metode berbasis

grid meng-kuantisasikan ruang object menjadi jumlah sel yang terbatas yang
membentuk suatu struktur grid. Semua pengerjaan clustering dilakukan pada
struktur grid (misanya, pada ruang yang sudah dikuantisasi).
5. Hasil clustering sangat dipengaruhi oleh metode clustering yang digunakan.

Terdapat banyak sekali metode clustering yang sudah diperkenalkan dalam berbagai
literatur. Pada peneliltian ini, penulis akan membandingkan dua metode clustering
yaitu metode k-means dengan metode DBSCAN untuk mengetahui karakteristik dari
metode k-Means dan DBSCAN. Selain pemilihan metode clustering, dimensi ruang
fitur yang tinggi juga merupakan salah satu masalah utama yang harus diperhatikan
dalam proses clustering. Oleh karena itu, diperlukan adanya proses reduksi dimensi
untuk memilih atau menyeleksi subfitur yang informatif. Pada penelitian ini, akan
digunakan metode reduksi hybrid dengan memadukan metode feature selection dan
metode feature extraction untuk memilih atau menyeleksi subfitur yang informatif.
Keefektifan metode yang diajukan diuji pada dataset berupa terjemahan hadits dalam
bahasa Inggris yang berjumlah 892 hadits. Kemudian, melakukan evaluasi clustering
dengan menggunakan metode Davies-Bouldin Index (DBI) dan silhoutte coefficient.
Hasil uji coba menunjukkan bahwa metode k-means mempunyai keunggulan untuk
mengatasi data yang mempunyai perbedaan kerapatan yang signifikan. Artinya, tidak
akan ada data yang menjadi derau/noise sehingga semua data masuk ke dalam cluster.
Pada algoritma DBSCAN, hal ini tidak dapat dilakukan. Metode DBSCAN sangat
bagus digunakan untuk mengelompokkan data-data dengan kerapatan yang tinggi.
Sedangkan kmeans hanya menemukan klaster yang terbentuk saja tanpa
memperhatikan kerapatan data klaster. DBSCAN juga mempunyai keunggulan untuk
mendeteksi derau/noise. Kemudian, dengan diterapkannya metode reduksi yang
memadukan metode feature selection dan metode feature extraction pada proses text
clustering dapat meningkatkan akurasi clustering.
6. Aturan Freedman-Diaconis sangat kuat dan bekerja dengan baik dalam praktiknya. Lebar

bin diatur ke . Jadi jumlah bin adalah , di mana adalah jumlah pengamatan, maks adalah nilai
maksimum dan min adalah nilai
minimum.h=2×IQR×n−1/3h=2×IQR×n−1/3(max−min)/h(max−min)/hnn
Di basis R, Anda dapat menggunakan:
hist(x, breaks="FD")
Untuk pustaka plot lain tanpa opsi ini (mis., ggplot2), Anda dapat menghitung binwidth
sebagai:
bw <- 2 * IQR(x) / length(x)^(1/3)
### for example #####

ggplot() + geom_histogram(aes(x), binwidth = bw)
7. Data mining adalah suatu proses ekstraksi atau penggalian data dan informasi yang
besar, yang belum diketahui sebelumnya, namun dapat dipahamidan berguna dari
database yang besar serta digunakan untuk membuat suatu keputusanbisnis yang
sangat penting.
rantai Markov homogen waktu diskrit maupun kontinu yang mempunyai state {0,
1, . . . , N, N + 1}. Kemudian state 0 dan N + 1 merupakan state menyerap.
Probabilitas terserap pada state 0 sebelum menuju ke state N + 1 maupun sebaliknya
dinamakan probabilitas ruin. Selanjutnya, digunakan metode bagi dua untuk
menghitung probabilitas ruin tersebut pada rantai Markov skip-free. Metode ini lebih
mudah dibandingkan menggunakan invers matriks dan metode iterasi.

Personal 2

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Personal 2

Diunggah oleh

Hak Cipta:

Format Tersedia

1.

4. A. Metode partisi merupakan suatu metode yang melakukan optimasi pada

B. Metode hirarki (hierarchical methods) adalah metode pengklasteran yang

C. Clustering adalah metode penganalisaan data, yang sering dimasukkan sebagai

D. Metode berbasis grid (grid-based methods): Metode-metode berbasis

5. Hasil clustering sangat dipengaruhi oleh metode clustering yang digunakan.

6. Aturan Freedman-Diaconis sangat kuat dan bekerja dengan baik dalam praktiknya. Lebar

Di basis R, Anda dapat menggunakan:

bw <- 2 * IQR(x) / length(x)^(1/3)

### for example #####

Anda mungkin juga menyukai