Oleh :
Rony Setiawan
Email : rony855185@yahoo.co.id
ABSTRAK
Proses penerimaan calon mahasiswa baru di Politeknik LP3I Jakarta setiap tahun,
menghasilkan data yang sangat banyak berupa profil calon mahasiswa. Kegiatan tersebut
menimbulkan penumpukan data dalam jumlah besar, hal ini menjadi kesulitan untuk
melakukan identifikasi terhadap calon mahasiswa. Penelitian ini membahas tentang
penerapan data mining, menggunakan algoritma K-Means Clustering untuk menghasilkan
profil yang memiliki kemiripan atribut yang sama. Metode yang digunakan adalah CRISP-
DM dengan melalui proses business understanding, data understanding, data preparation,
modeling, evaluation dan deployment. Implementasi proses K-Means Clustering
menggunakan Rapid Miner 7.0. Atribut yang digunakan usia, agama, status ujian,
kelulusan, registrasi, kelamin, gelombang pendaftaran, gelombang registrasi, Nilai Tes,
Jurusan, program studi, sumber informasi, asal kota, lokasi kampus, pekerjaan orang tua,
jenis sekolah, pembayaran uang registrasi. Menghasilkan jumlah kluster 4 (k=4) dengan
cluster pertama 17007 calon mahasiswa, cluster kedua sebanyak 83 calon mahasiswa,
cluster ketiga sebanyak 12919 calon mahasiswa dan cluster keempat sebanyak 356 calon
mahasiswa.
76
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
77
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
kumpulan data yang berukuran sangat dipisahkan dalam tiga kategori, yaitu
besar. Tujuan utama data mining adalah pendapatan tinggi, sedang dan rendah.
untuk menemukan, menggali, atau 5. Pengklusteran
menambang pengetahuan dari data atau Pengklusteran merupakan
informasi yang kita miliki (Susanto, pengelompokkan record, pengamatan
2010:2) atau memperhatikan dan membentuk
Data mining merupakan bidang dari kelas objek-objek yang memiliki
beberapa bidang keilmuan yang kemiripan. Kluster adalah kumpulan
menyatukan teknik dari pembelajaran record yang memiliki kemiripan satu
mesin, pengenalan pola, statistik, database, dengan yang lainnya dan memiliki
dan visualisasi untuk pengenalan ketidakmiripan dengan record dalam
permasalahan pengambilan informasi dari kluster lain. Algoritma pengklusteran
database yang besar (Larose, 2005). Data mencoba untuk melakukan pembagian
mining adalah proses yang menggunakan terhadap keseluruhan data menjadi
teknik statistik, matematika, kecerdasan kelompok-kelompok yang memiliki
buatan, dan machine learning untuk kemiripan (homogen), yang mana
mengekstraksi dan mengidentifikasi kemiripan record dalam satu
informasi yang bermanfaat dan kelompok akan bernilai maksimal,
pengetahuan yang terkait dari database sedangkan kemiripan dengan record
yang besar. dalam kelompok lain akan bernilai
Menurut Larose, data mining dibagi minimal
menjadi beberapa kelompok berdasarkan 6. Asosiasi
tugas yang dapat dilakukan, yaitu (Larose, Tugas asosiasi dalam data mining
2005) : adalah menemukan atribut yang
1. Deskripsi muncul dalam suatu waktu. Dalam
Untuk mencari cara yang dunia bisnis lebih umum disebut
menggambarkan pola dan analisis keranjang belanja
kecenderungan yang terdapat dalam
data.Deskripsi dari pola dan Clustering merupakan salah satu
kecenderungan yang sering metode data mining yang bersifat tanpa
memberikan kemungkinan penjelasan arahan (unsupervised) yang memiliki arti
untuk suatu pola atau kecenderungan bahwa karakteristrik tiap kluster tidak
2. Estimasi ditentukan sebelumnya melainkan
Estimasi hampir sama dengan berdasarkan kemiripan atribut-atribut dari
klasifikasi, kecuali variabel target suatu kelompok atau cluster. Cluster
estimasi lebih kearah numerik membagi data menjadi kelompok-
daripada kearah kategori. Model kelompok atau cluster berdasarkan suatu
dibangun menggunakan record kemiripan atribut-atribut diantara
lengkap yang menyediakan nilai dari sekumpulan data, atribut-atribut yang
variabel target sebagai nilai prediksi. mirip tersebut dipresentasikan sebagai
3. Prediksi titik-titik dalam ruang multidimensi.
Prediksi hampir sama dengan Dalam data mining ada dua jenis metode
klasifikasi dan estimasi, kecuali Clustering yang digunakan dalam
bahwa dalam prediksi nilai dari hasil pengelompokan data, yaitu hierarchical
akan ada di masa mendatang. Clustering dan non-hierarchical
4. Klasifikasi Clustering (Santosa, 2007).
Dalam klasifikasi, terdapat target
variabel kategori.Sebagai contoh, Algoritma K-Means Clustering
penggolongan pendapatan dapat Salah satu lagoritma Clustering pada
data mining adalah algoritma K-Means
78
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
79
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
80
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
data yaitu Unit Data dan Informasi (UDI) menentukan tabel-tabel yang
dan mendapatkan informasi tentang dipergunakan pada proses data
promosi yang digunakan dan sumber data mining.
yang dapat digunakan dalam penelitian b. Deskripsikan Data
sudah mendapat persetujuan dari bagian usia, agama, status ujian, status
UDI. kelulusan, status registrasi, jenis
kelamin, periode gelombang
Frame Work CRISP-DM pendaftaran, periode gelombang
Proses data mining yang dilakukan registrasi, Nilai tes TPA, Jurusan di
pada penelitian mengacu pada frame work sekolah, program studi, sumber
CRISP-DM (Cross Industry Standard informasi, asal kota, lokasi kampus,
Process for Data mining) pekerjaan orang tua, jenis sekolah
1. Tahap Pemahaman Bisnis (Business dan jumlah pembayaran uang
Understanding) registrasi, dengan jumlah record
a. Tujuan Bisnis sebanyak 30365.
(1) Meningkatkan jumlah aplikan c. Eksplorasi Data
yang mendaftar ke Politeknik Untuk mendapatkan sumber data
LP3I Jakarta yang digunakan pada proses data
(2) Meningkatkan jumlah mining, menggunakan database
mahasiswa yang melakukan aplikan dari calon mahasiswa 5
regitrasi penerimaan mahasiswa tahun terakhir yaitu dari tahun 2010
baru sampai tahun 2015.
b. Penilaian Situasi (Situation
Assesment)
Politeknik LP3I Jakarta merupakan d. Verifikasi Kualitas Data.
pendidikan tinggi yang memiliki 16 Memastika data yang digunakan
kampus yang tersebar di wilayah sebgai atribut pada proses data
Jadetabek, dengan 4 (empat) mining tidak ada kesalahan, maka
program studi yaitu Program studi yang diperlukan adalah:
Administrasi Bisnis, Komputerisasi (1) Memastikan semuar record
Akuntansi, Manajemen Informatika terisi dengan data, dan semua
dan Hubungam Masyarakat kolom terisi dengan data yang
c. Tujuan Data Mining benar jangan sampai ada data
tujuan data mining adalah untuk yang anomaly.Bila terjadi data
menentukan strategi promosi konong maka diisi sesuai
sehingga dapat menemukan profil dengan ketentuan yang berlaku
yang bertujuan untuk : atau record tersebut dihapus.
(1) Mengetahui profil calon (2) Tidak ada duplikasi data, jika
mahasiswa yang melakukan terjadi maka hapus salah satu
pendaftaran di Politeknik LP3I data.
Jakarta. 3. Pengolahan Data (Data
(2) Mengetahui strategi promosi Preparation)
berdasarkan pada profil dari Pada tahap ini menetapkan struktur
calon mahasiswa. basis data yang digunakan untuk
2. Pemahaman Data (Data Understanding) mempermudah dalam proses data
a. Pengumpulan Data Awal mining, Data preparation dibagi
Kegiatan ini digunakan unuk menjadi 3 tahapan, yaitu :
mempelajari database dan struktur a. Data Selection
data yang ada pada Smart Campus Memilih data dari struktur basis
Politeknik LP3I Jakarta, selanjutnya data yang dimiliki untuk
81
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
Tabel 4
Inisialisasi data lulus
Lulus Frekuensi Inisial
Ya 16079 1
Tidak 14286 2
82
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
83
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
Tabel 10
Inisialisasi data Kampus
Tabel 11
Inisialisasi data Asal Kota/Wilayah
4. Pemodelan (Modeling)
Metode Clustering yang digunakan
adalah non-hierarchical Clustering dengan
menentukan jumlah jumlah K cluster
terlebih dahulu. Machine mining yang
digunakan dalam proses data mining
dengan Algoritma K-Means Clustering
adalah Rapidminer 7.0, seperti pada
gambar 2.
84
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
6. Penyebaran (Deployment)
Profil yang dihasilkan dari proses
data mining, disampaikan kepada pihak
Politeknik LP3I Jakarta sebagai
rekomendasi untuk menentukan strategi
promosi yang digunakan pada penerimaan
calon mahasiswa.
85
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
Tabel 16
Pusat kluster (centroid) jumlah kluster 4 (k=4)
86
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
Tabel 18
Karakteristik Keanggotaan Kluster
87
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
88
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
89
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
baru sebesar 2.23% pada kluster dan identik dengan social media
pertama, 1.2% pada kluster kedua, (facebook, tweeter, Instagram)
1.22% pada kluster 3 dan 1.69% pada Bauran penjualan personal dengan
kluster kedua, maka diperlukan untuk melaksanakan member get member dapat
melakukan seleksi terlebih dahulu diterapkan semua kluster kecuali kluster
kelengkapan data calon mahasiswa satu dikarenakan pada kluster satu
seperti nomor telepon rumah persentasi MGM dibawah 1%, sedangkan
handphone. penjualan personal dengan melibatkan
16. Strategi langsung berkunjung ke teman/keluarga menjadi sangat efektif
rumah orang tua calon mahasiswa untuk semua kluster semua kluster
(Hunting, home Visit) kontribusinya memiliki persentase diatas 2%.
yang besar apda cluster pertama Bauran promosi penjualan dengan
sebesar 1.69%, kluster kedua tidak memberikan potongan biaya pada
ada, kluster ketiga sebesar 3.72%, gelombang pertama dapat diterapkan pada
sedangkan pada kluster keempat semua kluster untuk memberikan daya
1.12%. tarik biaya lebih murah apabila melakukan
pendaftaran pada gelombang pertama.
Dari uraian sumber media informasi Dana pinjaman diterapkan pada kluster
diatas, dapat disimpulkan strategi promosi satu dan tiga merupakan kelompok
yang dapat diterapkan pada setiap kluster pendapat orang tua yang rendah, hal ini
berdasarkan pada bauran untuk memberikan kesempatan kepada
pemasaran/Marketing mix, seperti pada calon mahasiswa yang berprestasi secara
tabel 19. akademik tetapi kurang mampu dari faktor
ekonomi. Harga khusus diterapkan
Tabel 19 disemua kluster untuk jurusan/konsentrasi
Strategi Promosi berdasarkan bauran yang kurang diminati oleh calon
pemasaran/Marketing mix
mahasiswa, sehingga jurusan/ konsentrasi
yang kurang diminai oleh calon mahasiswa
menjadi banyak peminatnya.
Hubungan masyarakat dapat
diterapkan disemua kluster seperti
kerjasama dengan sekolah binaan,
memberikan seminar siswa/guru, training
guru, try out untuk memberikan wawasan
kepada guru dan mempersiapkan siswa
untuk lulus ujian sekolah dan nasional,
sebagai bentuk win-win solution antara
Politeknik LP3I Jakarta dengan sekolah
dan akhirnya dapat menyampaikan pesan
promosi/presentasi produk Politeknik LP3I
Strategi bauran promosi periklanan kepada siswa.
dapat diterapkan disemua kluster seperti Pemasaran langsung dengan
brosur, spanduk, media cetak, televisi, melakukan presentasi sekolah dan Tele
tampak gedung, sosial media dan Internet, Selling diterapkan pada semua kluster,
berdasarkan jarak kluster memdekati ke rata-rata persentasi pada keempat kluster
pusat kluster, sedangkan iklan pada minimal 20%. Sedangkan kunjungan ke
website dan social media menjadi mutlak rumah calon mahasiswa dapat diterapkan
harus diterapkan disemua kluster, disemua kluster kecuali kluster dua, karena
dikalangan generasi muda sekarang kluster dua merupakan kelompok
internet sudah menjadi sebuah kebutuhan pendapatan orang tua dengan ekomoni
90
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
atas, dan kesibukan dari orang tua calon satu persentasi MGM dibawah 1%,
mahasiswa dan sensitive untuk dikunjungi sedangkan penjualan personal dengan
langsung ke rumah. melibatkan teman/keluarga menjadi
sangat efektif untuk semua kluster
semua kluster memiliki persentase
PENUTUP diatas 2%.
Bauran promosi penjualan dengan
Kesimpulan memberikan potongan biaya pada
Dari penelitian yang telah dilakukan, gelombang pertama dapat diterapkan
maka dapat ditarik kesimpulan sebagai pada semua kluster untuk memberikan
berikut : daya tarik biaya lebih murah apabila
1. Profil calon mahasiswa yang melakukan pendaftaran pada
dihasilkan dari data mining dengan gelombang pertama. Dana pinjaman
algoritma K-Means Clustering, jumlah diterapkan pada kluster satu dan tiga
cluster terbentuk sebanyak 4 cluster merupakan kelompok pendapat orang
(k=4) yaitu cluster 1 dengan jumlah tua yang rendah. Harga khusus
17007 calon mahasiswa merupakan diterapkan disemua kluster untuk
kelompok calon mahasiswa yang tidak jurusan/konsentrasi yang kurang
lulus dengan rata-rata pembayaran diminati oleh calon mahasiswa,
uang registrasi sebesar Rp. 1.837.718, sehingga jurusan/ konsentrasi yang
cluster 2 dengan jumlah calon kurang diminai oleh calon mahasiswa
mahasiswa sebanyak 83 merupakan menjadi banyak peminatnya.
kelompok calon mahasiswa yang lulus Bauran hubungan masyarakat dapat
dan melakukan registrasi dengan rata- diterapkan disemua kluster seperti
rata pembayaran uang registrasi kerjasama dengan sekolah binaan,
sebesar Rp. 12.823.831 dikatagorikan memberikan seminar siswa/guru,
sebagai golongan masyarakat ekonomi training guru, try out untuk
atas, cluster 3 sebanyak 12919 calon memberikan wawasan kepada guru dan
mahasiswa baru dengan rata-rata mempersiapkan siswa untuk lulus ujian
pembayaran uang registrasi sebesar sekolah dan nasional.
Rp. 3.951.274 dikatagorikan sebagai 3. Bauran pemasaran langsung dengan
golongan masyarakat ekonomi rendah, melakukan presentasi sekolah dan Tele
sedangkan cluster 4 sebanyak 356 Selling diterapkan pada semua kluster,
calon mahasiswa baru dengan rata-rata rata-rata persentasi pada keempat
pembayaran registrasi sebesar Rp. kluster minimal 20%. Sedangkan
7.177.444 digolongkan sebagai kunjungan ke rumah calon mahasiswa
masyarakat ekonomi menengah. dapat diterapkan disemua kluster
2. Profil yang dihasilkan dari data mining kecuali kluster dua.
dengan algoritma K-Means Clustering
dapat memberikan pengetahuan untuk
menentukan strategi promosi di DAFTAR PUSTAKA
Politeknik LP3I Jakarta. Pengetahuan
yang didapat dari hasil clustering yaitu Hidayat, T., dan N. Istiadah. 2011 .
calon mahasiwa didominasi dari Panduan Lengkap Menguasai SPSS
masyarakat ekonomi rendah dan 19 untuk Mengolah Data Statistik
menengah. Penelitian. Jakarta: Media Kita.
Bauran penjualan personal dengan
melaksanakan member get member Kotler, Philip. 1997. Manajemen
dapat diterapkan semua kluster kecuali Pemasaran: Analisis, Perencanaan,
kluster satu dikarenakan pada kluster
91
JURNAL LENTERA ICT Vol.3 No.1, Mei 2016 / ISSN 2338-3143
92