27 127 1 PB

JURNAL LENTERA ICT Vol.3 No.
1, Mei 2016 / ISSN 2338-3143
PENERAPAN DATA MINING

MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING
UNTUK MENENTUKAN STRATEGI PROMOSI
MAHASISWA BARU
(Studi Kasus : Politeknik LP3I Jakarta)
Oleh :
Rony Setiawan
Manajemen Informatika, Politeknik LP3I Jakarta

Gedung Sentra Kramat Jl. Kramat Raya No. 7-9 Jakarta Pusat 10450
Telp. 021-31904598 Fax. 021-31904599
Email : rony855185@yahoo.co.id
ABSTRAK
Proses penerimaan calon mahasiswa baru di Politeknik LP3I Jakarta setiap tahun,
menghasilkan data yang sangat banyak berupa profil calon mahasiswa. Kegiatan tersebut
menimbulkan penumpukan data dalam jumlah besar, hal ini menjadi kesulitan untuk
melakukan identifikasi terhadap calon mahasiswa. Penelitian ini membahas tentang
penerapan data mining, menggunakan algoritma K-Means Clustering untuk menghasilkan
profil yang memiliki kemiripan atribut yang sama. Metode yang digunakan adalah CRISP-
DM dengan melalui proses business understanding, data understanding, data preparation,
modeling, evaluation dan deployment. Implementasi proses K-Means Clustering
menggunakan Rapid Miner 7.0. Atribut yang digunakan usia, agama, status ujian,
kelulusan, registrasi, kelamin, gelombang pendaftaran, gelombang registrasi, Nilai Tes,
Jurusan, program studi, sumber informasi, asal kota, lokasi kampus, pekerjaan orang tua,
jenis sekolah, pembayaran uang registrasi. Menghasilkan jumlah kluster 4 (k=4) dengan
cluster pertama 17007 calon mahasiswa, cluster kedua sebanyak 83 calon mahasiswa,
cluster ketiga sebanyak 12919 calon mahasiswa dan cluster keempat sebanyak 356 calon
mahasiswa.
Kata Kunci : Data Mining, Algoritma, K-Means, Clustering, Strategi Promosi
PENDAHULUAN Politeknik LP3I Jakarta setiap tahun

melakukan penerimaan mahasiswa baru,
Perkembangan teknologi informasi hal ini akan berdampak terhadap
sekarang ini sangat pesat, hal ini menuntut pertumbuhan jumlah data yang sangat
setiap perusahaan untuk dapat saling pesat dan menimbulkan tumpukan data
bersaing. Dalam dunia bisnis yang yang berjumlah besar dalam basis data.
dinamis dan penuh persaingan, perusahaan Dengan jumlah data yang sangat besar
tidak lagi bisa unggul secara kompetitif Politeknik LP3I kesulitan untuk
hanya dengan memanfaatkan teknologi mendapatkan identifikasi terhadap calon-
yang ada, karena teknologi tersebut calon mahasiswa (calon mahasiswa) yang
digunakan hanya untuk mendukung mendaftar ke Politeknik LP3I Jakarta.
kegiatan sehari–hari perusahaan. Penggunaan metode tradisional untuk
76
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
melakukan identifikasi konsumen dari data suatu yang diketahui/dianggap. Dengan

membutuhkan kemampuan manusia untuk demikian, data dapat memberi gambaran
menganalisa dan menginterpretasikan data. tentang suatu keadaan atau persoalan.
Dengan volume data yang berkembang Sedangkan, data menurut kamus Oxford
sangat pesat, baik dari jumlah record dan Dictionary adalah The Facts. Jadi, dapat
jumlah field, analisa terhadap data tidak disimpulkan bahwa data adalah sesuatu
mungkin dilakukan secara manual oleh yang nyata diketahui atau dianggap yang
manusia. Penerapan data mining dapat dipakai untuk keperluan suatu analisa,
membantu untuk menganalisa data yang diskusi, presentasi ilmiah atau tes statistik
diperoleh dari transaksi pada sistem (Supranto, 2000).
informasi sehingga dapat menggali pola- Data kualitatif secara sederhana
pola yang dapat dijadikan pengetahuan dapat disebut data yang bukan berupa
baru untuk proses identifikasi calon angka. Ciri utama data kualitatif didapat
mahasiswa di Politeknik LP3I Jakarta. dengan cara menghitung, sehingga tidak
Untuk dapat melakukan promosi memiliki nilai desimal. Selain itu data
yang lebih efektif dan effisien, maka kualitatif memiliki ciri-ciri tidak bisa
dalam penelitian ini dilakukan dengan cara dilakukan operasi matematika, seperti
mengolahan data-data untuk mengetahui penambahan, pengurangan, perkalian dan
pola dari data-data tersebut sehingga kita pembagian. Contoh data kualitatif adalah
dapat mengambil informasi-informasi data gender, data golongan darah, data
yang tersembunyi dari data-data tersebut. tempat tinggal atau data jenis pekerjaan.
Metode pengolahan data seperti ini sering Agar dapat dilakukan proses pada data
disebut sebagai data mining. Pada kualitatif atau non metric, data tersebut
penelitian ini analisa data mining harus diubah ke dalam bentuk angka,
dilakukan dengan menggunakan metode proses ini dinamakan kategorisasi. Data
K-Means Clustering. Dengan kualitatif dibedakan menjadi dua jenis,
menggunakan metode ini, data yang telah yaitu data nominal dan data ordinal
didapatkan dapat dikelompokan kedalam (Santoso, 2010).
beberapa cluster berdasarkan kemiripan Data nominal merupakan data yang
dari data-data tersebut, sehingga data-data paling rendah dalam level pengukuran
yang memiliki karakteristik yang sama data. Semua data memiliki posisi setara
dikelompokan dalam satu cluster dan yang dalam arti tidak ada data yang memiliki
memliki karakteristik yang berbeda tingkat yang lebih atau kurang
dikelompokan dalam cluster yang lain dibandingkan dengan data yang lain. Jenis
yang memiliki karakteristik yang sama. data nominal ini tidak memiliki jarak,
Dengan adanya pengelompokan- urutan dan titik origin (Hidayat, 2011).
pengelompokan data seperti ini, Data Ordinal adalah jenis data
diharapkan bagian marketing dapat kualitatif namun memiliki level lebih
melakukan pemasaran dengan strategi tinggi dari data nominal. Data ordinal
yang tepat untuk mendapatkan calon memiliki karakteristik nominal tapi
mahasiswa baru. terdapat perbedaan derajat, urutan, atau
peringkat dalam objek tersebut (posisi data
tidak setara) (Hidayat, 2011).
LANDASAN TEORI
Data Mining
Data Data mining memiliki pengertian
Dalam Webster’s New World’s lain yaitu knowledge discovery ataupun
Dictionary tertulis bahwa datum: pattern recognition merupakan suatu
something known or assumed . Artinya, istilah yang digunakan untuk mendapatkan
datum (bentuk tunggal data) merupakan pengetahuan yang tersembunyi dari
77
kumpulan data yang berukuran sangat dipisahkan dalam tiga kategori, yaitu
besar. Tujuan utama data mining adalah pendapatan tinggi, sedang dan rendah.
untuk menemukan, menggali, atau 5. Pengklusteran
menambang pengetahuan dari data atau Pengklusteran merupakan
informasi yang kita miliki (Susanto, pengelompokkan record, pengamatan
2010:2) atau memperhatikan dan membentuk
Data mining merupakan bidang dari kelas objek-objek yang memiliki
beberapa bidang keilmuan yang kemiripan. Kluster adalah kumpulan
menyatukan teknik dari pembelajaran record yang memiliki kemiripan satu
mesin, pengenalan pola, statistik, database, dengan yang lainnya dan memiliki
dan visualisasi untuk pengenalan ketidakmiripan dengan record dalam
permasalahan pengambilan informasi dari kluster lain. Algoritma pengklusteran
database yang besar (Larose, 2005). Data mencoba untuk melakukan pembagian
mining adalah proses yang menggunakan terhadap keseluruhan data menjadi
teknik statistik, matematika, kecerdasan kelompok-kelompok yang memiliki
buatan, dan machine learning untuk kemiripan (homogen), yang mana
mengekstraksi dan mengidentifikasi kemiripan record dalam satu
informasi yang bermanfaat dan kelompok akan bernilai maksimal,
pengetahuan yang terkait dari database sedangkan kemiripan dengan record
yang besar. dalam kelompok lain akan bernilai
Menurut Larose, data mining dibagi minimal
menjadi beberapa kelompok berdasarkan 6. Asosiasi
tugas yang dapat dilakukan, yaitu (Larose, Tugas asosiasi dalam data mining
2005) : adalah menemukan atribut yang
1. Deskripsi muncul dalam suatu waktu. Dalam
Untuk mencari cara yang dunia bisnis lebih umum disebut
menggambarkan pola dan analisis keranjang belanja
kecenderungan yang terdapat dalam
data.Deskripsi dari pola dan Clustering merupakan salah satu
kecenderungan yang sering metode data mining yang bersifat tanpa
memberikan kemungkinan penjelasan arahan (unsupervised) yang memiliki arti
untuk suatu pola atau kecenderungan bahwa karakteristrik tiap kluster tidak
2. Estimasi ditentukan sebelumnya melainkan
Estimasi hampir sama dengan berdasarkan kemiripan atribut-atribut dari
klasifikasi, kecuali variabel target suatu kelompok atau cluster. Cluster
estimasi lebih kearah numerik membagi data menjadi kelompok-
daripada kearah kategori. Model kelompok atau cluster berdasarkan suatu
dibangun menggunakan record kemiripan atribut-atribut diantara
lengkap yang menyediakan nilai dari sekumpulan data, atribut-atribut yang
variabel target sebagai nilai prediksi. mirip tersebut dipresentasikan sebagai
3. Prediksi titik-titik dalam ruang multidimensi.
Prediksi hampir sama dengan Dalam data mining ada dua jenis metode
klasifikasi dan estimasi, kecuali Clustering yang digunakan dalam
bahwa dalam prediksi nilai dari hasil pengelompokan data, yaitu hierarchical
akan ada di masa mendatang. Clustering dan non-hierarchical
4. Klasifikasi Clustering (Santosa, 2007).
Dalam klasifikasi, terdapat target
variabel kategori.Sebagai contoh, Algoritma K-Means Clustering
penggolongan pendapatan dapat Salah satu lagoritma Clustering pada
data mining adalah algoritma K-Means
78
Clustering untuk dapat menghasilkan 5. Tugaskan lagi setiap objek memakai

kelompok yang memiliki kemiripan atribut pusat cluster yang baru. Jika pusat
yang sama. Algoritma pengelompokan K- cluster tidak berubah lagi maka proses
Means yang akan menghasilkan kelompok Clustering selesai. Atau, kembali ke
catatan sebanyak k buah. Algoritma K- langkah nomor 3 sampai pusat cluster
Means pertama kali digagas oleh J. tidak berubah lagi.
MacQueen (Larose, 2005 dan Susanto,
2010).
Rapidminer
Menurut Santosa (2007) dan Ong, Rapiminer merupakan aplikasi open
langkah-langkah melakukan Clustering source berlisensi AGPL (GNU Affero
dengan metode K-Means adalah sebagai General Public License) yang dapat
berikut: digunakan untuk mengolah data mining
1. Pilih jumlah cluster k. yang dikembangkan oleh Ralf
2. Inisialisasi k pusat cluster ini bisa Klinkenberg, Ingo Mierswa, dan Simon
dilakukan dengan berbagai cara. Fischer di Artificial Intelligence Unit dari
Namun yang paling sering dilakukan University of Dortmund (Satria
adalah dengan cara random. Pusat- Wahono,2015).
pusat cluster diberinilai awal dengan
angka-angka random,
CRISP-DM
3. Alokasikan semua data/ objek ke CRISP-DM (Cross-Industry
cluster terdekat. Kedekatan dua objek Standard Process for Data Mining)
ditentukan berdasarkan jarak kedua
merupakan suatu metodologi data mining
objek tersebut. Demikian juga yang disusun oleh konsorsium perusahaan
kedekatan suatu data ke cluster yang didirikan oleh Komisi Eropa pada
tertentu ditentukan jarak antara data tahun 1996 dan telah ditetapkan sebagai
dengan pusat cluster. Dalam tahap ini proses standar dalam data mining.
perlu dihitung jarak tiap data ke tiap Menurut Larose, data mining memiliki
pusat cluster. Jarak paling antara satu enam fase CRISP-DM, seperti yang tertera
data dengan satu cluster tertentu akan pada gambar 2-1. (Larose, 2006:6).
menentukan suatu data masuk dalam 1. Fase Pemahaman Bisnis (Business
cluster mana. Untuk menghiutng jarak Understanding Phase)
semua data ke setiap tiitk pusat cluster Fase pertama adalah memahami tujuan
dapat menggunakan teori jarak dan kebutuhan dari sudut pandang
Euclidean yang dirumuskan sebagai bisnis, kemudian menterjemakan
berikut: pengetahuan ini ke dalam pendefinisian
masalah dalam data mining.
Selanjutnya akan ditentukan rencana
dimana: dan strategi untuk mencapai tujuan
D(I,j) = Jarak data ke i ke pusat cluster j tersebut
Xki = Data ke i atribut data ke k 2. Fase Pemahaman Data (Data
Xkj = Titik pusat ke j pada atribut ke k
Understanding Phase)
4. Hitung kembali pusat cluster dengan
Fase ini dimulai dengan pengumpulan
keanggotaan cluster yang sekarang.
data yang kemudian akan dilanjutkan
Pusat cluster adalah rata-rata dari
dengan proses untuk mendapatkan
semua data/objek dalam cluster
pemahaman yang mendalam tentang
tertentu. Jika dikehendaki bisa juga
data, mengidentifikasi masalah kualitas
menggunakan median dari cluster
data, atau untuk mendeteksi adanya
tersebut. Jadi rata-rata (mean) bukan
bagian yang menarik dari data yang
satu-satunya ukuran yang bisa dipakai.
dapat digunakan untuk hipotesa untuk
informasi yang tersembunyi.
79
3. Fase Pengolahan Data (Data karena sangat penting bagi konsumen

Preparation Phase) untuk memahami tindakan apa yang
Fase ini meliputi semua kegiatan untuk harus dilakukan untuk menggunakan
membangun dataset akhir (data yang model yang telah dibuat.
akan diproses pada tahap
pemodelan/modeling) dari data mentah.
Tahap ini dapat diulang beberapa kali.
Pada tahap ini juga mencakup
pemilihan tabel, record, dan atribut-
atribut data, termasuk proses
pembersihan dan transformasi data
untuk kemudian dijadikan masukan
dalam tahap pemodelan (modeling).
4. Fase Pemodelan (Modeling Phase)
Dalam fase ini akan dilakukan
pemilihan dan penerapan berbagai
teknik pemodelan dan beberapa
parameternya akan disesuaikan untuk Gambar 1 Fase CRISP-DM (Larose, 2006)
mendapatkan nilai yang optimal.
Secara khusus, ada beberapa teknik Promosi
berbeda yang dapat diterapkan untuk Menurut Kotler, “promotion, the
masalah data mining yang sama. Di fourth marketing mix tools, stand for
pihak lain ada teknik pemodelan yang various activities, the company undertakes
membutuhan format data khusus. to communicate its products merits and to
Sehingga pada tahap ini masih persuade target customers to buy them”.
memungkinan kembali ke tahap Definisi tersebut mempunyai pengertian
sebelumnya. bahwa promosi meliputi semua alat yang
5. Fase Evaluasi (Evaluation Phase) terdapat dalam bauran promosi yang
Pada fase ini, model sudah terbentuk peranan utamanya adalah mengadakan
dan diharapkan memiliki kualitas baik komunikasi yang bersifat membujuk
jika dilihat dari sudut pandang analisa (Kotler, 1997). Strategi Promosi Menurut
data. Pada tahap ini akan dilakukan Kotler & Armstrong variable variabel yang
evaluasi terhadap keefektifan dan ada di dalam promotional mix ada lima,
kualitas model sebelum digunakan dan yaitu : (Kotler dan Armstrong, 2001)
menentukan apakah model dapat 1. Periklanan (advertising)
mencapat tujuan yang ditetapkan pada 2. Penjualan Personal (personal selling)
fase awal (Business Understanding). 3. Promosi penjualan (sales promotion)
6. Fase Penyebaran (Deployment Phase) 4. Hubungan masyarakat (public relation)
Pada tahap ini, pengetahuan atau 5. Pemasaran langsung (direct marketing).
informasi yang telah diperoleh akan
diatur dan dipresentasikan dalam
bentuk khusus sehingga dapat METODOLOGI PENELITIAN
digunakan oleh pengguna.
Tahap deployment dapat berupa Penelitian ini dimulai dari
pembuatan laporan sederhana atau melakukan pengamatan secara langsung
mengimplementasikan proses data pada Politeknik LP3I Jakarta untuk
mining yang berulang dalam mendapatkan informasi tentang
perusahaan. Dalam banyak kasus, penerimaan mahasiswa baru dan promosi
tahap deployment melibatkan yang berjalan kepada bagian marketing
konsumen, di samping analis data, dan melakukan seurvey kepada pengelola
80
data yaitu Unit Data dan Informasi (UDI) menentukan tabel-tabel yang
dan mendapatkan informasi tentang dipergunakan pada proses data
promosi yang digunakan dan sumber data mining.
yang dapat digunakan dalam penelitian b. Deskripsikan Data
sudah mendapat persetujuan dari bagian usia, agama, status ujian, status
UDI. kelulusan, status registrasi, jenis
kelamin, periode gelombang
Frame Work CRISP-DM pendaftaran, periode gelombang
Proses data mining yang dilakukan registrasi, Nilai tes TPA, Jurusan di
pada penelitian mengacu pada frame work sekolah, program studi, sumber
CRISP-DM (Cross Industry Standard informasi, asal kota, lokasi kampus,
Process for Data mining) pekerjaan orang tua, jenis sekolah
1. Tahap Pemahaman Bisnis (Business dan jumlah pembayaran uang
Understanding) registrasi, dengan jumlah record
a. Tujuan Bisnis sebanyak 30365.
(1) Meningkatkan jumlah aplikan c. Eksplorasi Data
yang mendaftar ke Politeknik Untuk mendapatkan sumber data
LP3I Jakarta yang digunakan pada proses data
(2) Meningkatkan jumlah mining, menggunakan database
mahasiswa yang melakukan aplikan dari calon mahasiswa 5
regitrasi penerimaan mahasiswa tahun terakhir yaitu dari tahun 2010
baru sampai tahun 2015.
b. Penilaian Situasi (Situation
Assesment)
Politeknik LP3I Jakarta merupakan d. Verifikasi Kualitas Data.
pendidikan tinggi yang memiliki 16 Memastika data yang digunakan
kampus yang tersebar di wilayah sebgai atribut pada proses data
Jadetabek, dengan 4 (empat) mining tidak ada kesalahan, maka
program studi yaitu Program studi yang diperlukan adalah:
Administrasi Bisnis, Komputerisasi (1) Memastikan semuar record
Akuntansi, Manajemen Informatika terisi dengan data, dan semua
dan Hubungam Masyarakat kolom terisi dengan data yang
c. Tujuan Data Mining benar jangan sampai ada data
tujuan data mining adalah untuk yang anomaly.Bila terjadi data
menentukan strategi promosi konong maka diisi sesuai
sehingga dapat menemukan profil dengan ketentuan yang berlaku
yang bertujuan untuk : atau record tersebut dihapus.
(1) Mengetahui profil calon (2) Tidak ada duplikasi data, jika
mahasiswa yang melakukan terjadi maka hapus salah satu
pendaftaran di Politeknik LP3I data.
Jakarta. 3. Pengolahan Data (Data
(2) Mengetahui strategi promosi Preparation)
berdasarkan pada profil dari Pada tahap ini menetapkan struktur
calon mahasiswa. basis data yang digunakan untuk
2. Pemahaman Data (Data Understanding) mempermudah dalam proses data
a. Pengumpulan Data Awal mining, Data preparation dibagi
Kegiatan ini digunakan unuk menjadi 3 tahapan, yaitu :
mempelajari database dan struktur a. Data Selection
data yang ada pada Smart Campus Memilih data dari struktur basis
Politeknik LP3I Jakarta, selanjutnya data yang dimiliki untuk
81
dijadikan data yang akan Ramadhani,2014). Untuk melakukan

digunakan pada data mining, inisialisasi dapat dilakukan dengan :
data tersebut yang nantinya akan 1. Untuk atribut agama terlebih dahulu
digunakan sebagai atribut data dilakukan perhitungan frekuensi calon
mining. mahasiswa berdasarkan agama
b. Data Processing selanjutnya diurutkan dari terbesar ke
Memastikan kualitas data yang terkecil seperti pada tabel 2.
dipilih untuk proses data
mining, tidak ada data yang Tabel 2
noisy data dan missing value Inisialisasi data agama
artinya data harus diyakinkan Agama Frekuensi Inisial
dulu data terisi dengan benar Islam 29099 1
tidak ada data-data yang Kristen 1227 2
anomaly yang dapat Hindu 23 3
memperngaruhi hasil Budha 16 4
Clustering. Untuk melakukan
pembersihan dapat dilakukan 2. Untuk atribut ujian terlebih dahulu
dengan perintah query dilakukan perhitungan frekuensi calon
sederhana. mahasiswa berdasarkan kepersertaan
b. Data Transformation ikut ujian selanjutnya diurutkan dari
Mengelompokan atribut-atribut terbesar ke terkecil seperti pada tabel 3.
yang telah terpilih dijadikan satu
tabel, seperti pada tabel 1 Tabel 3
Inisialisasi data ujian
Tabel 1. Ujian Frekuensi Inisial
Atribut terpilih
Ya 16510 1
Tidak 13855 2
3. Untuk atribut lulus terlebih dahulu

dilakukan perhitungan frekuensi calon
mahasiswa berdasarkan kelulusan hasil
tes selanjutnya diurutkan dari terbesar
ke terkecil seperti pada tabel 4.
Tabel 4
Inisialisasi data lulus
Lulus Frekuensi Inisial
Ya 16079 1
Tidak 14286 2
4. Untuk atribut registrasi terlebih dahulu

Data yang berjenis nominal seperti mahasiswa berdasarkan registrasi calon
agama, ujian, lulus, registrasi, sex, mahasiswa selanjutnya diurutkan dari
jurusan_sekolah, nama_jurusan, informasi, terbesar ke terkecil seperti pada tabel 5.
nama_kampus, asal_kota, pekerjaan dan
jenis_sekolah harus dilakukan proses Tabel 5
inisialisasi data terlebih dahulu ke dalam Inisialisasi data registrasi
bentuk angka/numerical (Ong, 2013 dan Registrasi Frekuensi Inisial
Ya 16083 1
82
Tidak 14282 2 Tabel 8

Inisialisasi data Prgram studi/konsentrasi LP3I
5. Untuk atribut sex terlebih dahulu
mahasiswa berdasarkan jenis kelamin
(sex) calon mahasiswa selanjutnya
diurutkan dari terbesar ke terkecil
seperti pada tabel 6.
Tabel 6
Inisialisasi data jenis kelamin
Sex Frekuensi Inisial
Perempuan 16258 1
Laki-laki 14107 2
8. Untuk atribut informasi terlebih dahulu
6. Untuk atribut Jurusan_sekolah terlebih mahasiswa berdasarkan informasi yang
dahulu dilakukan perhitungan frekuensi diketahui oleh calon mahasiswa
calon mahasiswa berdasarkan jurusan selanjutnya diurutkan dari terbesar ke
yang ada di masing-masing sekolah terkecil seperti pada tabel 9.
calon mahasiswa selanjutnya diurutkan
dari terbesar ke terkecil seperti pada Tabel 9
tabel 7. Inisialisasi data informasi
Tabel 7
Inisialisasi data Jurusan di sekolah
Jurusan_Sekolah Frekuensi Inisial
IPS 8413 1
IPA 4873 2
Administrasi Perkantoran 4314 3
Akuntansi 3718 4
Teknik 2115 5
Teknik Automotif 1128 6
Penjualan 729 7
Multimedia 718 8
Rekaya Perangkat Lunak 504 9
Sekertaris 502 10
Informatika Komputer 451 11
9. Untuk atribut nama_kampus terlebih
Administrasi Bisnis 366 12
dahulu dilakukan perhitungan frekuensi
Komputer Dan Jaringan 287 13 calon mahasiswa berdasarkan nama
Perhotelan 282 14 kampus yang dminati oleh calon
Mesin 242 15 mahasiswa selanjutnya diurutkan dari
terbesar ke terkecil seperti pada tabel
7. Untuk atribut nama_jurusan terlebih 10.
dahulu dilakukan perhitungan frekuensi
calon mahasiswa berdasarkan nama
jurusan/konsentrasi yang diminati oleh
calon mahasiswa selanjutnya diurutkan
dari terbesar ke terkecil seperti pada
tabel 8.
83
Tabel 10
Inisialisasi data Kampus
12. Untuk atribut jenissekolah terlebih

dahulu dilakukan perhitungan
frekuensi calon mahasiswa
berdasarkan jenis sekolah (SMK,
SMA, MA ) selanjutnya diurutkan
10. Untuk atribut asal_kota terlebih dari terbesar ke terkecil seperti pada
dahulu dilakukan perhitungan tabel 13.
frekuensi calon mahasiswa
Tabel 13
berdasarkan asal kota alamat Inisialisasi Data Jenis Sekolah
selanjutnya diurutkan dari terbesar ke
terkecil seperti pada tabel 11.
Tabel 11
Inisialisasi data Asal Kota/Wilayah
4. Pemodelan (Modeling)
Metode Clustering yang digunakan
adalah non-hierarchical Clustering dengan
menentukan jumlah jumlah K cluster
terlebih dahulu. Machine mining yang
digunakan dalam proses data mining
dengan Algoritma K-Means Clustering
adalah Rapidminer 7.0, seperti pada
gambar 2.
11. Untuk atribut pekerjaan terlebih

dahulu dilakukan perhitungan
frekuensi calon mahasiswa Gambar 2
berdasarkan pekerjaan orang tua Proses Model Clustering pada Rapidminer 7.0
selanjutnya diurutkan dari terbesar
ke terkecil seperti pada tabel 12. 5. Evaluasi (Evaluation)
Melakukan evaluasi hasil data
Tabel 12 mining terhadap algoritma K-Means
Inisialisasi Data Pekerjaan Orang Tua
Clustering apakah profil dari model yang
diterapkan sudah dapat memenuhi
84
pencapai tujuan pada fase pertama Tabel 14

(Business Understanding), Kunci dari Pusat kluster (centroid) jumlah kluster 2 (k=2)
tahap ini adalah menentukan apakah ada
masalah bisnis yang belum
dipertimbangkan.
6. Penyebaran (Deployment)
Profil yang dihasilkan dari proses
data mining, disampaikan kepada pihak
Politeknik LP3I Jakarta sebagai
rekomendasi untuk menentukan strategi
promosi yang digunakan pada penerimaan
calon mahasiswa.
HASIL DAN PEMBAHASAN
Proses Pengujian Jumlah Cluster

Proses pengujian untuk mencari
jumlah kluster yang tepat untuk
mendapatlkan profil calon mahasiswa Berdasarkan hasil Clustering dengan
dengan algoritma K-Means Clustering, jumlah kluster 2 (k=2) profil yang
untuk menentukan jarak antar data/atribut ditampilkan terlalu global dengan banyak
ke pusat cluster (Centroid) diukur dengan kemiripan antara kluster pertama dan
menggunakan Euclidean Distance. Proses kedua, karakteristik dari kedua kluster
pengujian dilakukan mulai dari jumlah tersebut didominasi calon mahasiswa yang
kluster 2 (k=2) sampai jumlah kluster 5 melakukan registrasi (registrasi=1),
(k=5), pengujian pertama dilakukan dengan rata-sata pembayaran uang
dengan jumlah kluster 2 (k=2), registrasi pada kluster pertama sebesar
menghasilkan nilai pusat kluster 1.750.011 dan rata-rata pembayaran uang
(centroid), seperti pada tabel 14. registrasi pada kluster kedua sebesar
6.317.326, kluster tersebut belum
menunjukan profil calon mahasiswa.
Jumlah kluster (k=2) menghasilkan profil
yang telalu sederhana hanya membagi
menjadi 2 kelompok yaitu kelompak
calon mahasiswa yang tidak diterima dan
calon mahasiswa yang mendaftar ke
Politeknik LP3I Jakarta, maka jumlah
kluster 2 (k=2) belum dapat digunakan
sebagai pengetahui untuk strategi
promosi.Pengujian dilanjutkan dengan
menggunakan nilai kluster sebanyak 3
(k=3) menghasilkan nilai pusat kluster
(centroid), seperti pada tabel 15.
85
Tabel 15 yaitu calon mahasiswa dengan ekonomi

Pusat kluster (centroid) jumlah kluster 3 (k=3) atas (10.028.866) dan rendah (3.991.137),
selisih antara ekonomi atas dan rendah
terlalu jauh jaraknya, maka pengujian
dilanjutkan dengan jumlah kluster 4
(K=4), menghasilkan nilai pusat kluster
(centroid), seperti pada tabel 16.
Tabel 16
Pusat kluster (centroid) jumlah kluster 4 (k=4)
Hasil dari Clustering dengan jumlah

kluster 3 (k=3), kluster pertama memiliki
karakteristik didominasi calon mahasiswa
yang tidak melakukan registrasi
(registrasi=2) dengan rata-rata pembayaran
uang registrasi sebesar 183.718, kluster Hasil Clustering dengan jumlah
kedua dengan karakteristik calom kluster 4 (k=4), pada kluster pertama
mahasiswa yang melakukan registrasi memiliki persamaan dengan kluster
(registrasi=1) dengan rata-rata pembayaran pertama pada Clustering dengan jumlah
uang registrasi sebesar 10.028.866, kluster kluster 3 (K=3) dapat dilihat pada tabel
ketiga memiliki karakteristrik calon 4.2. pada kluster kedua menunjukan
mahasiswa yang melakukan registrasi karateristik rata-rata jumlah pembayaran
(registrasi=1) dengan rata-rata besar uang registrasi (uang_regis) sebesar
pembayaran uang registrasi sebesar 12.823.831, kluster ketiga rata-rata
3.991.137, terlihat berbedaan karakteristik pembayaran uang registrasi (uang_regis)
jumlah kluster 2 (k=2) dengan jumlah sebesar 3.951.274 dan kluster keempat
kluster 3 (k=3), jumlah kluster 3 (k=3) memiliki rata-rata jumlah pembayaran
lebih baik dari jumlah kluster 2 (k=2). (uang_regis) sebesar 7.177.444.
Berdasarkan atribut jumlah pembayaran Berdasarkan atribut jumlah pembayaran
uang registrasi (uang_regis) dan calon uang registrasi (uang_regis) dan calon
mahasiswa yang melakukan regsitrasi mahasiswa yang melakukan regsitrasi
(registrasi=1) menjadi dua golongan yatu (registrasi=1) Clustering dengan jumlah
calon mahasiswa dengan rata-rata kluster 4 (k=4) memiliki tiga segmentasi
pembayaran uang registrasi sebesar calon mahasiswa berdasarkan rata-rata
10.028.866 dapat diartikan dari kalangan jumlah pembayaran uang registrasi
atas dan rata-rata sebesar 3.991.137. (uang_regis) yaitu calon mahasiswa dari
Jumlah kluster 3 (k=3) belum dapat masyarakat ekomoni atas (12.823.831),
dijadikan sebagai pengetahuan disebabkan rendah (3.951.274) dan menengah
kelompok calon mahasiswa yang diterima (7.177.444) Clustering tersebut sudah
kuliah dikelompokan menjadi dua bagian
86
dapat dijadikan sebagai pengetahuan untuk Hasil Data Mining

menentukan strategi promosi. Berdasarkan hasil uji coba jumlah
Uji coba selanjutkan dengan kluster yang dapat mewakili profil atau
menentukan jumlah kluster 5 (k=5), karakteristik calon mahasiswa di
dihasilkan pusat kluster(centroid), seperti Politeknik LP3I Jakarta, dipilih Clustering
pada tabel 17. dengan jumlah kluster 4 (k=4), memiliki
tiga segmentasi calon mahasiswa
Tabel 17 berdasarkan rata-rata jumlah pembayaran
Pusat kluster (centroid) jumlah kluster 5 (k=5) uang registrasi (uang_regis) yaitu calon
mahasiswa dari masyarakat ekomoni atas
(12.823.831), bawah (3.951.274) dan
menengah (7.177.444) dapat dilihat pada
tabel 4.3, yang dapat dijadikan untuk
menentukan strategi promosi.
Karakteristik dan keanggotaan dari
setiap kluster berdasarkan, jumlah kluser
sebanyak4 (K=4), dapa dilihap pada tabel
18.
Tabel 18
Karakteristik Keanggotaan Kluster
Clustering dengan jumlah kluster 3

(k=3),kluster 4 (k=4) dan kluster 5 untuk
kluster pertama memiliki karakteristik
yang sama, sedangkan kluster kedua
sampai ke kluster lima signifikan
perbedaanya pada atribut jumlah
pembayaran uang registrasi (uang_regis),
yaitu pada kluster kedua memiliki rata
jumlah pembayaran uang registrasi
(uang_regis) sebesar 13.645.268, kluster
ketiga sebesar 6.645.047, kluster kempat Strategi Promosi
sebesar 9.999.682, kluster kelima sebesar Berdasarkan pada pembahasan
3.948.634, pada Clustering tersebut terlalu atribut yang berdampak pada strategi
banyak katagori untuk menentukan promosi, seperti segmentasi tingkat
karakteristik calon mahasiswa. ekonomi orang tua/keluarga, peminatan
Berdasarkam pengamatan dan terhadap program studi/ konsentrasi serta
diinginkan segmentasi pasar berdasarkan sumber informasi yang didapatkan oleh
jumlah uang pembayaran registrasi dari calon mahasiswa, maka Politeknik LP3I
calon mahasiswa yang tidak lulus, dan Jakarta dapat melakukan strategi promosi
calon mahasiswa yang memiliki yang dapat diterapkan di semua kluster,
kemampuan membayar biaya registrasi sebagai berikut:
digolongkan menjadi tiga tingkatan yaitu 1. Strategi Promosi berdasarkan
tingkat ekonomi rendah, menengah dan kemampuan ekonomi rendah dan
tingkat atas. Maka kluster yang sesuai menengah
dengan kriteria berada pada kluster 4 a. Menerapkan biaya pendidikan yang
(k=4). dapat dijangkau oleh masyarakat
87
dengan ekonomi menengah ke akan mendapatkan insentif sebesar

bawah. Rp. 500.000 (lima ratus ribu rupiah
b. Memberikan banyak pilihan cara per mahasiswa registrasi) dan
melakukan pembayaran biaya kuliah apabila jumlah yang registrasi
yang dapat dicicil sesuai dengan mencapai 10 orang akan
kemampuan calon mahasiswa. mendapatkan hadiah Smartphone.
c. Memberikan Dana Pinjaman Belajar, e. Melakukan penataan tampak gedung
yang akan dikembalikan oleh calon sebagai sarana promosi dengan
mahasiswa setelah lulus dan memasang atribut promosi yang
ditempatkan kerja oleh Politeknik menarik perhatian.
LP3I Jakarta, diberikan kepada f. Membentuk dan melatih tim promosi
calon mahasiswa yang yang tidak yang tangguh memahami product
mampu secara ekonomi tetapi knowledge
memiliki nilai akademis yang g. Untuk meningkatkan kerjasasam
baik/sangat baik. dengan sekolah binaan,
2. Strategi Peminatan Program menyelenggarakan Try Out gratis,
Studi/Konsentrasi menyelenggarakan doa bersama
a. Melakukan promosi ke sekolah- menjelang ujian nasional, donator
sekolah yang linier dengan program kegiatan OSIS dan acara pelepasan
studi/konsentrasi di Politeknik LP3I kelas 12.
Jakarta. 4. Strategi Promosi Berorientasi Pada
b. Memberikan harga khusus untuk Daerah asal calon mahasiswa hasil
program studi/konsentrasi yang Clustering
kurang diminati oleh calon a. Melakukan promosi dengan
mahasiswa, seperti program memasang spanduk yang
Hubungan Masyarakat, sekretaris, disesuaikan dengan tema disesuaikan
perbankan syariah, bisnis dengan kalender kegiatan nasional
internasional. pada daerah-daerah yang
3. Strategi Promosi Berorientasi Pada mendominasi pada setiap kluster.
Sumber Informasi b. Meningkatkan jumlah Sekolah SMK
a. Menyusun Tool Multimedia Binaan untuk daerah-daerah yang
Presentasi ke Sekolah yang dapat memiliki potensi sesuai dengan hasil
menarik perhatian dan tertarik untuk kluster.
kuliah di Politeknik LP3I Jakarta c. Membuka counter pendaftaran dan
b. Menyusun tim presentasi sekolah informasi di tempat-tempat pusat
yang memiliki kemampuan kegiatan masyarakat seperti Mall,
komuniskasi station bis/kereta di masing-masing
c. Promosi yang paling efektif bagi daerah potensi sesuai hasil
Politeknik LP3I Jakarta adalah Clustering.
melalui pemasaran langsung (direct
marketing) seperti presentasi ke Dari data hasil Clusteringdapat
sekolah, sekolah binaan, kunjungan diterapkan bauran pemasaran/marketing
ke rumah calon mahasiswa (Home mix, untuk menentukan strategi promosi
Visit). yang sesuai dengan masing-masing cluster
d. Membuat program Member Get berdasarkan karakteristik keanggotaan
Member untuk keluarga/Teman dan sumber informasi yang mendekati ke pusat
diinformasikan kepada kluster/centroid dan besarnya kontribusi
mahasiswa/keluarganya, apabila sumber informasi dari setiap kluster
membawa temannya untuk masuk (Tabel 4.6).
kuliah di Politeknik LP3I Jakarta
88
1. Brosur menjadi bagian dari strategi promosi yang memberikan

karakteristik anggota atribut sumber kontribusi pada setiap kluster, pada
informasi yang besarnya kontribusi kluster pertama .76%, kluster kedua
pada setiap kluster sebesar 10.87% sebesar 27.71%, kluster ketiga sebesar
pada kluster pertama, 6.02% pada 23.84%, 27.52%.
kluster kedua, 11.34% pada kluster 9. Strategi potongan biaya pendidikan
ketiga dan sebesar 8.71% pada kluster diberikan kepada calon mahasiswa
keempat. yang melakukan registrasi pada
2. Spanduk di jalan memiliki konstribusi gelombang pertama untuk menarik
sebesar 9.73% pada kluster pertama, calon mahasiswa agar melakukan
8.43% pada kluster kedua, 6.53% pendaftaran dan registrasi lebih awal,
pada kluster ketiga dan 8,43% pada potongan biaya pendidikan menjadi
kluster keempat. kebijakan Politeknik LP3I Jakarta
3. Media Cetak Koran, Majalah, Poster, dapat diberlakukan untu semua
memiliki kontribusi cukup kecil, tetapi kluster.
dapat digunakan untuk 10. Strategi Dana Pinjaman dapat
menginformasikan kepada masysrakat diberlakukan untuk calon mahasiswa
pada sedang dilaksanakan penerimaan pada kluster pertama dan ketiga yaitu
mahasiswa baru, pada kluster pertama untuk calon mahasiswa dengan
sebesar 3.38% (Koran, Majalah), pembayaran 0 (nol) atau dari
kluster kedua 3.61%, kluster ketiga kelompok ekonomi rendah.
2.11% dank luster keempat sebesar 11. Strategi harga khusus (Potongan
1.12% Biaya Pendidikan) untuk Program
4. Televisi, memiliki kontribusi sedikit Studi/ Konsentrasi yang kurang
terhadap sumber informasi, tetapi diminati dan dapat diberikan kepada
masih dapat digunakan untuk semua kluster.
pencitraan lembaga, besar kontribusi 12. Untuk menjalin hubungan antara
televisi sebesar 1.56% kluster sekolah dengan LP3I, maka perlu
pertama, 1.2% pada kluster kedua, adanya kerjasama antara Sekolah
0.91% pada kluster ketiga, 2.81% dengan Politeknik LP3I Jakarta untuk
pada kluster keempat. dapat memberikan keuntungan bagi
5. Sosial Media, berada pada kluster sekolah dan Politeknik LP3I Jakarta
pertama 2.6%, kluster kedua 1.2% dapat diberlakukan pada pada semua
dank luster 4 sebesar 3.09%. cluster.
6. Website, diperlukan sebagai identitas 13. Sebagai wujud membangun hubungan
pendidikan tinggi pendidikan wajib dengan pihak sekolah, maka
memiliki website official, pada kluster Politeknik LP3I Jakarta
pertama 1.42%, kluster 2 1.2%, menyelenggarakan Semianr,
kluster ketiga 1.18% dank kluster Trainining untuk para guru dan siswa
keempat 0.56%. dapat diterapkan pada semua kluster.
7. Tampak Gedung Kampus, menjadi 14. Presentasi di Sekolah, merupakan
salah satu sumber informasi yang sumber informasi yang ada di setiap
memberikan kontribusi sebesar 6.2% kluster dan memberikan kontribusi
pada kluster pertama, 4.82% pada terhadap penerimaan calon
kluster kedua, 6.14% pada kluster 3 mahasiswa, kluster pertama sebesar
dan sebesar 9.83% pada kluster 22.28%, kluster kedua sebesar 24.1%,
keempat. kluster ketiga sebesar 20.6% dank
8. Member Get Membet (MGM) teridri luster keempat sebesar 18.54%
dari informasi keluarga, orang tua, 15. Tele selling, memiliki kontribusi kecil
teman, alumni dapat dijadikan sebagai terhadap perolehan calon mahaiswa
89
baru sebesar 2.23% pada kluster dan identik dengan social media
pertama, 1.2% pada kluster kedua, (facebook, tweeter, Instagram)
1.22% pada kluster 3 dan 1.69% pada Bauran penjualan personal dengan
kluster kedua, maka diperlukan untuk melaksanakan member get member dapat
melakukan seleksi terlebih dahulu diterapkan semua kluster kecuali kluster
kelengkapan data calon mahasiswa satu dikarenakan pada kluster satu
seperti nomor telepon rumah persentasi MGM dibawah 1%, sedangkan
handphone. penjualan personal dengan melibatkan
16. Strategi langsung berkunjung ke teman/keluarga menjadi sangat efektif
rumah orang tua calon mahasiswa untuk semua kluster semua kluster
(Hunting, home Visit) kontribusinya memiliki persentase diatas 2%.
yang besar apda cluster pertama Bauran promosi penjualan dengan
sebesar 1.69%, kluster kedua tidak memberikan potongan biaya pada
ada, kluster ketiga sebesar 3.72%, gelombang pertama dapat diterapkan pada
sedangkan pada kluster keempat semua kluster untuk memberikan daya
1.12%. tarik biaya lebih murah apabila melakukan
pendaftaran pada gelombang pertama.
Dari uraian sumber media informasi Dana pinjaman diterapkan pada kluster
diatas, dapat disimpulkan strategi promosi satu dan tiga merupakan kelompok
yang dapat diterapkan pada setiap kluster pendapat orang tua yang rendah, hal ini
berdasarkan pada bauran untuk memberikan kesempatan kepada
pemasaran/Marketing mix, seperti pada calon mahasiswa yang berprestasi secara
tabel 19. akademik tetapi kurang mampu dari faktor
ekonomi. Harga khusus diterapkan
Tabel 19 disemua kluster untuk jurusan/konsentrasi
Strategi Promosi berdasarkan bauran yang kurang diminati oleh calon
pemasaran/Marketing mix
mahasiswa, sehingga jurusan/ konsentrasi
yang kurang diminai oleh calon mahasiswa
menjadi banyak peminatnya.
Hubungan masyarakat dapat
diterapkan disemua kluster seperti
kerjasama dengan sekolah binaan,
memberikan seminar siswa/guru, training
guru, try out untuk memberikan wawasan
kepada guru dan mempersiapkan siswa
untuk lulus ujian sekolah dan nasional,
sebagai bentuk win-win solution antara
Politeknik LP3I Jakarta dengan sekolah
dan akhirnya dapat menyampaikan pesan
promosi/presentasi produk Politeknik LP3I
Strategi bauran promosi periklanan kepada siswa.
dapat diterapkan disemua kluster seperti Pemasaran langsung dengan
brosur, spanduk, media cetak, televisi, melakukan presentasi sekolah dan Tele
tampak gedung, sosial media dan Internet, Selling diterapkan pada semua kluster,
berdasarkan jarak kluster memdekati ke rata-rata persentasi pada keempat kluster
pusat kluster, sedangkan iklan pada minimal 20%. Sedangkan kunjungan ke
website dan social media menjadi mutlak rumah calon mahasiswa dapat diterapkan
harus diterapkan disemua kluster, disemua kluster kecuali kluster dua, karena
dikalangan generasi muda sekarang kluster dua merupakan kelompok
internet sudah menjadi sebuah kebutuhan pendapatan orang tua dengan ekomoni
90
atas, dan kesibukan dari orang tua calon satu persentasi MGM dibawah 1%,
mahasiswa dan sensitive untuk dikunjungi sedangkan penjualan personal dengan
langsung ke rumah. melibatkan teman/keluarga menjadi
sangat efektif untuk semua kluster
semua kluster memiliki persentase
PENUTUP diatas 2%.
Bauran promosi penjualan dengan
Kesimpulan memberikan potongan biaya pada
Dari penelitian yang telah dilakukan, gelombang pertama dapat diterapkan
maka dapat ditarik kesimpulan sebagai pada semua kluster untuk memberikan
berikut : daya tarik biaya lebih murah apabila
1. Profil calon mahasiswa yang melakukan pendaftaran pada
dihasilkan dari data mining dengan gelombang pertama. Dana pinjaman
algoritma K-Means Clustering, jumlah diterapkan pada kluster satu dan tiga
cluster terbentuk sebanyak 4 cluster merupakan kelompok pendapat orang
(k=4) yaitu cluster 1 dengan jumlah tua yang rendah. Harga khusus
17007 calon mahasiswa merupakan diterapkan disemua kluster untuk
kelompok calon mahasiswa yang tidak jurusan/konsentrasi yang kurang
lulus dengan rata-rata pembayaran diminati oleh calon mahasiswa,
uang registrasi sebesar Rp. 1.837.718, sehingga jurusan/ konsentrasi yang
cluster 2 dengan jumlah calon kurang diminai oleh calon mahasiswa
mahasiswa sebanyak 83 merupakan menjadi banyak peminatnya.
kelompok calon mahasiswa yang lulus Bauran hubungan masyarakat dapat
dan melakukan registrasi dengan rata- diterapkan disemua kluster seperti
rata pembayaran uang registrasi kerjasama dengan sekolah binaan,
sebesar Rp. 12.823.831 dikatagorikan memberikan seminar siswa/guru,
sebagai golongan masyarakat ekonomi training guru, try out untuk
atas, cluster 3 sebanyak 12919 calon memberikan wawasan kepada guru dan
mahasiswa baru dengan rata-rata mempersiapkan siswa untuk lulus ujian
pembayaran uang registrasi sebesar sekolah dan nasional.
Rp. 3.951.274 dikatagorikan sebagai 3. Bauran pemasaran langsung dengan
golongan masyarakat ekonomi rendah, melakukan presentasi sekolah dan Tele
sedangkan cluster 4 sebanyak 356 Selling diterapkan pada semua kluster,
calon mahasiswa baru dengan rata-rata rata-rata persentasi pada keempat
pembayaran registrasi sebesar Rp. kluster minimal 20%. Sedangkan
7.177.444 digolongkan sebagai kunjungan ke rumah calon mahasiswa
masyarakat ekonomi menengah. dapat diterapkan disemua kluster
2. Profil yang dihasilkan dari data mining kecuali kluster dua.
dengan algoritma K-Means Clustering
dapat memberikan pengetahuan untuk
menentukan strategi promosi di DAFTAR PUSTAKA
Politeknik LP3I Jakarta. Pengetahuan
yang didapat dari hasil clustering yaitu Hidayat, T., dan N. Istiadah. 2011 .
calon mahasiwa didominasi dari Panduan Lengkap Menguasai SPSS
masyarakat ekonomi rendah dan 19 untuk Mengolah Data Statistik
menengah. Penelitian. Jakarta: Media Kita.
Bauran penjualan personal dengan
melaksanakan member get member Kotler, Philip. 1997. Manajemen
dapat diterapkan semua kluster kecuali Pemasaran: Analisis, Perencanaan,
kluster satu dikarenakan pada kluster
91
Implementasi dan Kontrol. Jakarta:

Prenhallindo.
Kotler, Philip, dan Armstrong Gary. 2001.

Prinsip-Prinsip Pemasaran. Alih
Bahasa Imam Nurmawan. Jakarta:
Salemba Empat.
Larose, Daniel T. 2006. Data mining

Methods and Models. Hoboken New
Jersey: Jhon Wiley & Sons Inc.
Larose, Daniel T. 2005. Discovering

Knowledge in Data: An Introduction
to Data mining. John Willey &
Sons. Inc.
Santosa, B. 2007. Data mining: Teknik

Pemanfaatan Data untuk Keperluan
Bisnis. Yogyakarta: Graha Ilmu
Santoso, S. 2010. Statistik Multivariat.

Jakarta: Elex Media Komputindo
Supranto, J. M.A. 2000. Statistik: Teori

dan Aplikasi Edisi Keenam. Jakarta:
Erlangga
Susanto, Sani dan Dedy Suryadi. 2010.

Pengantar Data mining menggali
pengetahuan dari bongkahan data.
Yogyakarta: Andi.
92

27 127 1 PB

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

27 127 1 PB

Diunggah oleh

Hak Cipta:

Format Tersedia

JURNAL LENTERA ICT Vol.3 No.

1, Mei 2016 / ISSN 2338-3143

PENERAPAN DATA MINING

Manajemen Informatika, Politeknik LP3I Jakarta

Kata Kunci : Data Mining, Algoritma, K-Means, Clustering, Strategi Promosi

PENDAHULUAN Politeknik LP3I Jakarta setiap tahun

melakukan identifikasi konsumen dari data suatu yang diketahui/dianggap. Dengan

Clustering untuk dapat menghasilkan 5. Tugaskan lagi setiap objek memakai

3. Fase Pengolahan Data (Data karena sangat penting bagi konsumen

dijadikan data yang akan Ramadhani,2014). Untuk melakukan

3. Untuk atribut lulus terlebih dahulu

4. Untuk atribut registrasi terlebih dahulu

Tidak 14282 2 Tabel 8

12. Untuk atribut jenissekolah terlebih

11. Untuk atribut pekerjaan terlebih

pencapai tujuan pada fase pertama Tabel 14

HASIL DAN PEMBAHASAN

Proses Pengujian Jumlah Cluster

Tabel 15 yaitu calon mahasiswa dengan ekonomi

Hasil dari Clustering dengan jumlah

dapat dijadikan sebagai pengetahuan untuk Hasil Data Mining

Clustering dengan jumlah kluster 3

dengan ekonomi menengah ke akan mendapatkan insentif sebesar

1. Brosur menjadi bagian dari strategi promosi yang memberikan

Implementasi dan Kontrol. Jakarta:

Kotler, Philip, dan Armstrong Gary. 2001.

Larose, Daniel T. 2006. Data mining

Larose, Daniel T. 2005. Discovering

Santosa, B. 2007. Data mining: Teknik

Santoso, S. 2010. Statistik Multivariat.

Supranto, J. M.A. 2000. Statistik: Teori

Susanto, Sani dan Dedy Suryadi. 2010.

Anda mungkin juga menyukai