Anda di halaman 1dari 10

Peran Bussines Intelligence Dalam Menentukan Strategi

Promosi Penerimaan Mahasiswa Baru

Ika Kurniawati1,Richardus Eko Indrajit2 , Muh. Fauzi3


1
STMIK Nusa Mandiri, 2ABFI Institut Perbanas, STMIK Bumigora Mataram3
Jakarta1,2, Mataram3 - Indonesia
contact.ikakurniawati@yahoo.com1, indrajit@post.harvard.edu2, mr.vawzy@gmail.com3

ABSTRAK
Institut Sains dan Teknologi Al-Kamal (ISTA) menggunakan sistem penerimaan mahasiswa baru online
berusaha untuk menarik siswa-siswi SMA dan sederajat untuk menjadi mahasiswa di ISTA. Permasalahan yang
terjadi adalah masih besarnya persentase calon mahasiswa yang tidak melakukan registrasi ulang padahal sudah
dinyatakan lulus seleksi sehingga target kuota mahasiswa baru tidak tercapai. Penelitian ini bertujuan untuk
melakukan mengelompokan data mahasiswa ke dalam beberapa cluster berdasarkan kemiripan dari data tersebut.
Sehingga data mahasiswa yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster dan yang
memiliki karakteristik berbeda dikelompokkan dalam cluster yang lain, dengan memanfaatkan proses data mining
yaitu metode smart clustering k-means. Sistem Bussines inteligence pada penelitian ini berperan untuk
meningkatkan keunggulan kompetitif institusi melalui pendayagunaan berbagai data, informasi dan pengetahuan
yang dimiliki oleh institusi sebagai bahan dalam proses pengambilan keputusan. Metode yang digunakan adalah
CRISP-DM dengan proses business understanding, data understanding, data preparation, modeling, evaluation
dan deployment. Pengujian dilakukan menggunakan tool RapidMiner 7.3 untuk membantu menemukan hasil yang
akurat untuk memecahkan masalah tersebut. Hasil dari penelitian ini digunakan sebagai salah satu dasar
pengambilan keputusan untuk menentukan strategi promosi berdasarkan cluster yang terbentuk oleh pihak
marketing ISTA.

Kata Kunci: Bussines intelligence, clustering, k-means, strategi promosi

1. PENDAHULUAN kemampuan akademik dan keahlian (profesional),


siswa-siswi sekolah menengah (SMA, SMK, dan
Pendidikan merupakan salah satu aspek MA) dapat melanjutkan ke perguruan tinggi untuk
yang penting dalam pembangunan bangsa, meningkatkan kemampuan akademik dan keahlian
keberhasilan pembangunan negara adalah dengan mereka. Perguruan tinggi terbagi menjadi dua, yaitu
tersedianya penduduk yang terdidik dalam jumlah, Perguruan Tinggi Negeri (PTN) dan Perguruan
jenis, dan tingkat yang memadai. Dengan pendidikan Tinggi Swasta (PTS). Perguruan tinggi negeri
seseorang menjadi cerdas, memiliki kemampuan, dikelola oleh pemerintah sedangkan perguruan tinggi
sikap hidup yang lebih baik dan pada akhirnya dapat swasta dikelola oleh instansi tertentu (yayasan).
meningkatkan taraf hidupnya ke jenjang yang lebih Institut Sains dan Teknologi Al-Kamal (ISTA)
tinggi. Dalam upaya meningkatkan kualitas suatu Salah satu perguruan tinggi swasta yang dikelola oleh
bangsa, menurut UNESCO (United Nations, Yayasan Pondok Pesantren Al-Kamal Jakarta berdiri
Educational, Scientific and Cultural Organization) sejak tahun 1989 yang terletak di Jakarta Barat, ISTA
tidak ada cara lain kecuali melalui peningkatan mutu memiliki 2 fakultas dan 8 program studi. Untuk
pendidikan. Untuk mencapai tujuan pendidikan yang masuk menjadi civitas akademika ISTA, siswa-siswi
terarah, diperlukan suatu lembaga pendidikan yang sekolah menengah (SMA, SMK, dan MA) dapat
berjenjang dimulai dari pendidikan tingkat dasar, mengikuti seleksi masuk yang diselenggarakan oleh
pendidikan menengah dan pendidikan tinggi. ISTA.
Penyelenggaraan pendidikan tinggi melalui Seleksi masuk mahasiswa di ISTA lebih dikenal
perguruan tinggi dimaksudkan untuk meningkatkan dengan istilah Penerimaan Mahasiswa Baru (PMB),

70 IKRAITH-INFORMATIKA, VOL. 1, NO. 2, NOVEMBER 2017


kegiatan PMB adalah salah satu kegiatan rutin 2. LANDASAN TEORI
tahunan sebagai media untuk merekrut calon
mahasiswa baru sesuai dengan kriteria yang Bussines Intelligence
ditetapkan oleh ISTA dengan tujuan agar calon Business Intelligence (BI) adalah sebuah proses
mahasiswa yang lulus seleksi atau diterima menjadi untuk meningkatkan keunggulan kompetitif
mahasiswa dapat menyelesaikan studi tepat waktu perusahaan melalui pendayagunaan berbagai data,
sesuai dengan program studi yang mereka tempuh. informasi, dan pengetahuan (knowledge) yang
Permasalahan yang terjadi dalam perekrutan dimiliki oleh perusahaan sebagai bahan baku dalam
mahasiswa adalah banyaknya jumlah calon proses pengambilan keputusan. Berbeda dengan
mahasiswa yang tidak melakukan registrasi ulang sejumlah aplikasi lain dengan tujuan serupa yang
untuk setiap tahunnya padahal peserta seleksi telah lebih dahulu diperkenalkan sebelumnya, konsep BI
dinyatakan lulus. Hal ini menjadi masalah yang harus menekankan pada penerapan 5 pendayagunaan
diselesaikan oleh pihak kampus, yang berarti kuota informasi untuk keperluan spesifik bisnis, masing-
mahasiswa baru untuk setiap program studi belum masing adalah sebagai berikut.
tercapai. Salah satu penyebab terjadinya penurunan Pertama, data sourcing. Berkaitan dengan
jumlah mahasiswa baru pada tahun ini adalah kurang kemampuan sistem untuk mengakses berbagai data
dilakukannya pengolahan data mahasiswa secara dan informasi dari sejumlah sumber dengan format
tepat berdasarkan data historis oleh pihak admisi yang berbeda. Kedua, data analysis. Berkaitan
ISTA. Hal tersebut dapat mempengaruhi dengan kemampuan sistem untuk membantu proses
pengambilan keputusan dalam menentukan wilayah penciptaan pengetahuan (knowledge) melalui
promosi yang tepat sasaran. Pengolahan data aktivitas pengkajian data dan informasi yang dimiliki
mahasiswa seharusnya dilakukan agar dapat oleh perusahaan. Ketiga, situation awareness.
menentukan wilayah promosi yang tepat sasaran Berkaitan dengan kemampuan sistem untuk mencari
sehingga tidak terjadi penurunan jumlah mahasiswa dan menyediakan data dan informasi terkait dengan
pada tahun berikutnya. kebutuhan atau konteks bisnis pada saat tertentu,
Dalam mengatasi permasalahan tersebut, peran misalnya ketika perusahaan berhadapan dengan
Bisnis Intelligence (BI) dapat membantu suatu peristiwa darurat dan mendesak. Keempat, risk
organisasi atau perusahaan mendapatkan analysis. Berkaitan dengan kemampuan sistem untuk
pengetahuan yang jelas mengenai faktor-faktor yang melakukan kalkulasi rasio yang akan dihadapi
mempengaruhi kinerja organisasi sehingga dapat perusahaan terhadap berbagai kecenderungan atau
membantu organisasi dalam pengambilan keputusan kemungkinan yang dapat terjadi sehubungan dengan
serta sekaligus meningkatkan keunggulannya kondisi tertentu. Kelima, decission support. Berkaitan
(competitive advantage). Dengan kegiatan BI dengan kemampuan sistem untuk secara aktif
tersebut maka sebuah organisasi atau perusahaan membantu manajemen dalam memberikan
akan dengan mudah dalam mengambil keputusan pertimbangan keputusan-keputusan yang berkualitas
secara cepat dan tepat. berdasarkan sejumlah kalkulasi dan pengolahan
Dalam penelitian ini BI digunakan untuk terhadap data atau informasi internal maupun
mengelompokan data mahasiswa dengan eksternal yang dimiliki.
memanfaatkan proses data mining menggunakan Business Modelling menggambarkan gambaran
metode smart clustering yaitu k-means. K-means keseluruhan proses bisnis dan masalah-masalah yang
merupakan salah satu metode data non-hierarchical harus diselesikan dan diatasinya, dan juga
clustering yang dapat mengelompokkan data menggambarkan bagaimana informasi mengalir pada
mahasiswa ke dalam beberapa cluster berdasarkan proses-proses bisnis dari sumber informasi ke tujuan.
kemiripan dari data tersebut, sehingga data Dalam membuat business modelling digunakan
mahasiswa yang memiliki karakteristik yang sama business model dan diagram yang memberikan
dikelompokkan dalam satu cluster dan yang memiliki informasi secara grafis bagi anggota suatu organisasi
karakteristik berbeda dikelompokkan dalam cluster atau perusahaan memahami dan mengkomunikasikan
yang lain. Atribut yang digunakan dalam menentukan business rule dan proses-proses bisnisnya.
pengelompokkan wilayah untuk melakukan promosi Business process modelling, process flow
di ISTA adalah nama mahasiswa, NIM, kota asal, modelling dan data flow modelling adalah sub-bagian
nilai IPK dan program studi.. dari suatu business modelling. Business modelling
Hasil penelitian dengan menerapkan metode k- strategy dan business model suatu organisasi atau
means diharapkan mampu membantu pihak Admisi perusahaan berbeda satu dengan yang lainnya, hal ini
ISTA untuk mengambil keputusan dalam tergantung pada kebutuhan dan tujaun perusahaan
menentukan wilayah promosi yang tepat sasaran
sehingga tidak terjadi penurunan jumlah mahasiswa
pada tahun berikutnya dan juga untuk mendapatkan
nilai akurasi dari kinerja metode k-means.

IKRAITH-INFORMATIKA, VOL. 1, NO. 2, NOVEMBER 2017 71


atau organisasi tersebut. (Barberg, B. 2007). pengelompokan berbeda terhadap data. Mirip
dengan klasifikasi, namun pengelompokan belum
didefinisikan sebelum dijalankannya tool data
mining. Biasanya menggunakan metode neural
network atau statistik. Clustering membagi item
menjadi kelompok-kelompok berdasarkan yang
ditemukan tool data mining.

5. Regression (forecasting), menggunakan nilai dari


data yang diketahui untuk memperkirakan nilai di
Gambar 2.1. Business Intelligence Environment masa depan atau kejadian masa depan
Sumber: www.learnbi.com (2007) berdasarkan kecenderungan sejarah dan statistik.
Seorang kepala biro marketing, dia dapat melakukan
kampanye pemasaran dengan segmentasi target yang 6. Time series (forecasting), perbedaan dengan
jelas dan dapat diperhitungkan dalam menyumbang
penerimaan mahasiswa baru bagi institusinya dengan regresi adalah bahwa time series hanya
mencari strategi yang tepat dalam melakukan memperkirakan data yang bergantung pada
promosi, dan masih banyak lagi evaluasi kinerja waktu.
manajemen dari setiap divisi yang dilakukan pada
suatu organisasi atau perusahaan. Jelas sekali bahwa Clusterring
Business Intelligence diperlukan di setiap lini dalam
suatu organisasi yang harusnya sudah tertanam dalam Pada dasarnya clustering merupakan suatu
setiap langkah bisnis, guna mencapai tujuan metode untuk mencari dan mengelompokkan data
perusahaan yang lebih baik, lebih efisien dan efektif yang memiliki kemiripan karakteriktik (similarity)
sehingga mendapat profit yang optimal. antara satu data dengan data yang lain. Clustering
merupakan salah satu metode data mining yang
bersifat tanpa arahan (unsupervised), maksudnya
Data Mining metode ini diterapkan tanpa adanya latihan (taining)
dan tanpa ada guru (teacher) serta tidak memerlukan
Data mining adalah proses analisis terhadap data target output. Dalam data mining ada dua jenis
dengan penekanan menemukan informasi yang metode clustering yang digunakan dalam
tersembunyi pada sejumlah besar data yang disimpan pengelompokan data, yaitu hierarchical clustering
ketika menjalankan bisnis perusahaan.Teknik data dan non-hierarchical clustering (Santosa, 2007).
mining merupakan implementasi yang khusus dengan
algoritma, yang digunakan pada operasi data mining. Hierarchical clustering adalah suatu metode
Ada 6 (enam) teknik umum data mining, antara lain pengelompokan data yang dimulai dengan
sebagai berikut. mengelompokkan dua atau lebih objek yang memiliki
kesamaan paling dekat. Kemudian proses diteruskan
1. Association, digunakan untuk mengenali ke objek lain yang memiliki kedekatan kedua.
kelakuan dari kejadian-kejadian khusus atau Demikian seterusnya sehingga cluster akan
proses. Link asosiasi muncul pada setiap kejadian. membentuk semacam pohon dimana ada hierarki
(tingkatan) yang jelas antar objek, dari yang paling
2. Sequence, mirip dengan asosiasi namun mirip sampai yang paling tidak mirip. Secara logika
menghubungkan kejadian-kejadian sepanjang semua objek pada akhirnya hanya akan membentuk
waktu dan menentukan keterhubungan antar item sebuah cluster. Dendogram biasanya digunakan
untuk sepanjang waktu. untuk membantu memperjelas proses hierarki
tersebut (Santoso, 2010).
3. Classification, melihat pada kelakuan dan atribut
dari kelompok yang telah didefinisikan. Tool data
Berbeda dengan metode hierarchical clustering,
mining dapat memberikan klasifikasi pada data
metode non-hierarchical clustering justru dimulai
baru dengan memanipulasi data yang ada, yang
dengan menentukan terlebih dahulu jumlah cluster
telah diklasifikasi dan dengan menggunakan
yang diinginkan (dua cluster, tiga cluster, atau lain
hasilnya untuk memberikan sejumlah aturan.
sebagainya). Setelah jumlah cluster diketahui, baru
Aturan-aturan tersebut digunakan pada data-data
proses cluster dilakukan tanpa mengikuti proses
baru untuk diklasifikasi. Teknik ini menggunakan
hierarki. Metode ini biasa disebut dengan K-Means
supervised induction, yang memanfaatkan
Clustering (Santoso, 2010).
kumpulan pengujian dari record yang
terklasifikasi untuk menentukan kelas-kelas
Algoritma K-means Clustering
tambahan.
K-means clustering merupakan salah satu metode
4. Cluster, dapat digunakan untuk menganalisis
data clustering non-hirarki yang mengelompokan

72 IKRAITH-INFORMATIKA, VOL. 1, NO. 2, NOVEMBER 2017


data dalam bentuk satu atau lebih cluster/kelompok. c. Promosi penjualan (sales promotion)
Data-data yang memiliki karakteristik yang sama d. Hubungan masyarakat (public relation)
dikelompokan dalam satu cluster/kelompok dan data e. Pemasaran langsung (direct marketing)
yang memiliki karakteristik yang berbeda
dikelompokan dengan cluster/kelompok yang lain Promosi adalah salah satu bagian dari marketing
sehingga data yang berada dalam satu mix yang besar peranannya. Promosi merupakan
cluster/kelompok memiliki tingkat variasi yang kecil suatu ungkapan dalam arti luas tentang kegiatan-
(Agusta, 2007). kegiatan yang secara aktif dilakukan oleh perusahaan
(penjual) untuk mendorong konsumen untuk
Menurut Santosa (2007), langkah-langkah membeli produk yang ditawarkan.
melakukan clustering dengan metode K-Means Dalam promosi dikenal istilah bauran promosi.
adalah sebagai berikut: Bauran promosi adalah kombinasi strategi yang
paling baik dari variabel-variabel periklanan,
a. Pilih jumlah cluster k. personal selling, dan alat promosi lain, yang
b. Inisialisasi k pusat cluster ini bisa dilakukan semuanya direncanakan untuk mencapai tujuan
dengan berbagai cara. Namun yang paling sering program penjualan. Promosi adalah salah satu faktor
dilakukan adalah dengan cara random. Pusat- penentu keberhasilan suatu program pemasaran.
pusat cluster diberiduberi nilai awal dengan Betapapun berkualitasnya suatu produk, bila
angka-angka random, konsumen belum pernah mengenal ataupun
c. Alokasikan semua data/ objek ke cluster mendengarnya dan tidak yakin bahwa produk
terdekat. Kedekatan dua objek ditentukan tersebut akan berguna bagi mereka, maka mereka
berdasarkan jarak kedua objek tersebut. tidak akan pernah membelinya. (Basu Swastha, 2000)
Demikian juga kedekatan suatu data ke cluster Demi tercapainya tujuan perusahaan, masing-
tertentu ditentukan jarak antara data dengan masing perusahaan perlu menyadari faktor-faktor
pusat cluster. Dalam tahap ini perlu dihitung yang menentukan keberhasilan dan kegagalan dalam
jarak tiap data ke tiap pusat cluster. Jarak paling perjalanannya terhadap persaingan bisnis. Faktor-
antara satu data dengan satu cluster tertentu akan faktor tersebut bisa bersumber dari dalam perusahaan
menentukan suatu data masuk dalam cluster (interen) ataupun dari luar perusahaan (exteren).
mana. Untuk menghitung jarak semua data ke Dalam menyusun strategi pemasaran hendaknya
setiap tiitk pusat cluster dapat menggunakan teori memperhatikan lingkungan pemasaran. Lingkungan
jarak Euclidean yang dirumuskan sebagai internal meliputi sumber daya yang dimiliki oleh
berikut: masing-masing perusahaan baik dari kemampuan
sumber daya manusia, peralatan mesin, kebijakan
D(i,j)= perusahaan dan sebagainya. Lingkungan eksternal
( x1i − x1 j 2 + ( x 2i − x 2 j )2 + .... + ( xki − xkj)2.....(1) mencakup kondisi konsumen, kebijakan pemerintah,
persaingan antar perusahaan. Lingkungan-
Dimana : lingkungan tersebut secara berangsur akan selalu
D (i,j) = Jarak antara ke i ke pusat cluster j mengalami perubahan, sehingga perusahaan harus
Xki = Data ke i pada atribut data ke k dapat mengambil sikap dari setiap perubahan pada
Xkj = Titik pusat ke j pada atribut ke k elemen lingkungannya.

d. Hitung kembali pusat cluster dengan 3. METODE PENELITIAN


keanggotaan cluster yang sekarang. Pusat cluster
adalah rata-rata dari semua data/ objek dalam Metode Data Mining
cluster tertentu. Jika dikehendaki bisa juga Metode data mining yang digunakan dalam
menggunakan median dari cluster tersebut. Jadi eksperimen ini menggunakan model Cross-Standard
rata-rata (mean) bukan satu-satunya ukuran yang Industry for Data Mining (CRISP-DM) yang terdiri
bisa dipakai. dari 6 fase, yaitu: (Sumathi, 2006)
e. Tugaskan lagi setiap objek memakai pusat 1. Fase pemahaman bisnis (Business
cluster yang baru. Jika pusat cluster tidak Understanding)
berubah lagi maka proses clustering selesai. 2. Fase pemahaman data (Data Understanding)
Atau, kembali ke langkah nomor 3 sampai pusat 3. Fase pengolahan data (Data Preparation)
cluster tidak berubah lagi.
4. Fase pemodelan (Modelling)
Strategi Promosi 5. Fase Evaluasi (Evaluation)
6. Fase Penyebaran (Deployment)
Menurut Kotler & Armstrong variabel-variabel
yang ada di dalam promotion mix ada lima, yaitu :
a. Periklanan (advertising)
b. Penjualan Personal (personal selling)

IKRAITH-INFORMATIKA, VOL. 1, NO. 2, NOVEMBER 2017 73


Modeling
Pada tahap ini dilakukan penentuan terhadap
teknik data mining, alat bantu data mining, dan
algoritma data mining yang akan diterapkan. Lalu
selanjutnya adalah melakukan penerapan teknik dan
algoritma data mining tersebut kepada data dengan
bantuan alat bantu. Jika diperlukan penyesuaian
data terhadap teknik data mining tertentu, dapat
kembali ke tahap persiapan data.

Evaluation
Gambar 3.1. Tahapan Metodologi CRISP-DM Pada tahap ini dilakukan pengujian terhadap
model-model yang dikomparasi untuk
mendapatkan informasi model yang paling akurat.
Business Understanding Evaluasi dan validasi menggunakan metode
Pada tahap ini berfokus pada pemahaman confusion matrix dan kurva ROC.
mengenai tujuan dari proyek dan kebutuhan secara
persepktif bisnis, kemudian mengubah hal tersebut Deployment
menjadi sebuah permasalahan data mining dan Setelah pembentukan model dan dilakukan
rencana awal untuk mencapai tujuan tersebut. analisa dan pengukuran pada tahap sebelumnya,
Kegiatan yang dilakukan antara lain: menentukan selanjutnya pada tahap ini diterapkan model yang
tujuan dan persyaratan dengan jelas secara paling akurat dengan memakai data baru diluar data
keseluruhan, menerjemahkan tujuan tersebut serta training dan data testing.
menentukan pembatasan dalam perumusan
masalah data mining, dan selanjutnya
mempersiapkan strategi awal untuk mencapai 4. HASIL DAN PEMBAHASAN
tujuan tersebut.
Pemahaman Bisnis (Business Understanding)
Data Understanding Pada tahap ini dilakukan pemahaman dari objek
Pada tahap ini dilakukan pengumpulan penelitian yang dituju, pemahaman ini mencakup
terhadap data, lalu kemudian mempelajari data antara lain tinjauan objek penelitian yaitu sistem
tersebut dengan tujuan untuk mengenal data, penerimaan mahasiswa baru dan sistem akademik
melakukan identifikasi dan mengetahui kualitas ISTA terutama sub sistem registrasi ulang, tujuan
dari data, serta mendeteksi subset yang menarik dari sistem diterapkan, identifikasi permasalahan yang
data yang dapat dijadikan hipotesa bagi informasi timbul, alternatif pemecahan masalah yang ada dan
yang tersembunyi. tujuan diadakannya penelitian ini.

Data Preparation Pemahaman Data (Data Understanding)


Pada tahap ini dilakukan persiapan mengenai Pada tahap Data Understanding yang dilakukan
data yang akan digunakan pada tahap berikutnya. adalah mengambil data mentah yang berasal dari
Kegiatan yang dilakukan antara lain: memilih kasus sistem informasi akademik ISTA, sumber data ini
dan parameter yang akan dianalisis (Select Data), dikelola oleh Biro layanan teknologi informasi ISTA.
melakukan transformasi terhadap parameter Data-data yang digunakan pada penelitian ini didapat
tertentu (Transformation), dan melakukan dari bagian akademik yang berupa data mahasiswa
pembersihan data agar data siap untuk tahap yang telah lulus dari Universitas tersebut pada tahun
modeling(Cleaning). 2016. Data yang digunakan adalah sebanyak 332 data
Data preprocessing bertujuan untuk mahasiswa yang berisi data diri dari mahasiswa yang
mendapatkan data yang bersih dan siap untuk telah lulus tersebut, namun dalam penelitian ini hanya
digunakan dalam penelitian. Tahapan yang beberapa atribut data saja yang digunakan, seperti
dikerjakan adalah melakukan pengabaian atribut nama mahasiswa, NIM, kota asal, nilai IPK dan
pada data mentah yang dianggap tidak relevan program studi.
dengan hasil pengujian dan perubahan terhadap Data-data yang telah didapatkan pada tahap
nilai data bahkan tipe data pada atribut dataset pengumpulan data kemudian dilakukan transformasi
dengan tujuan untuk mempermudah pemahaman pada data-data yang berjenis data nominal, yaitu
terhadap isi record dengan memperhatikan seperti kota asal dan jurusan. Data-data yang berjenis
konsistensi data, missing value, dan redundancy data nominal tersebut diinisialisasikan ke dalam
pada data. bentuk angka melalui beberapa langkah agar data-
data yang berjenis data nominal dapat diolah dengan
menggunakan algoritma K-means Clustering.

74 IKRAITH-INFORMATIKA, VOL. 1, NO. 2, NOVEMBER 2017


a. Wilayah Sumatera yang terdiri dari kota
Persiapan Data (Data Preparation) Aceh Besar, Ambarita Samosir, Banda
Tahap ini dilakukan penyiapan data atau Aceh, Lhokseumawe, Medan, Padang,
preprocessing bertujuan untuk mendapatkan data Palembang, Bengkulu, Jambi, Bandar
yang bersih dan siap untuk digunakan dalam Lampung, dan Pangkal Pinang.
penelitian. Tahapan yang dikerjakan adalah b. Wilayah DKI Jakarta yang terdiri dari kota
melakukan pengabaian atribut pada data mentah yang Jakarta.
dianggap tidak relevan dengan hasil pengujian dan c. Wilayah Jawa Barat yang terdiri dari kota,
perubahan terhadap nilai data bahkan tipe data pada Bandung, Bekasi, Bogor, Tasikmalaya,
atribut dataset dengan tujuan untuk mempermudah Cikarang, Depok, Garut, Karawang,
pemahaman terhadap isi record dengan Pandeglang, Sukabumi, dan Tangerang.
memperhatikan konsistensi data, missing value, dan d. Wilayah Jawa Tengah yang terdiri dari kota
redundancy pada data. Semarang, Solo, Tegal, Yogyakarta,
Berikut ini adalah data mahasiswa yang telah Purworejo, Kudus.
lulus pada tahun 2016. e. Wilayah Jawa Timur yang tediri dari kota
Bojonegoro, Blitar, Lumajang, Magetan,
Tabel 1. Data Mahasiswa yang telah lulus dari dan Surabaya.
ISTA Tahun 2016
PROGRAM
2. Kemudian wilayah-wilayah tersebut diurutkan
NO NIM NAMA KOTA IPK dari yang terbesar berdasarkan frekuensi
STUDI
mahasiswa yang berasal dari wilayah tersebut.
M.Imam Khasan
Desain 3. Setelah itu wilayah yang memiliki frekuensi
1 201291001
Taufik
Tegal Komunikasi terbesar diberi inisial dengan angka 1 dan
3.26 Visual
wilayah yang memiliki frekuensi terbesar kedua
diberi inisial dengan angka 2, begitu seterusnya
Teknik
2 200922016 Iswail Cilacap
2.86 Informatika
hingga wilayah dengan frekuensi paling sedikit.
Hasil dari inisialisasi kota asal dapat dilihat pada
3 201126016 Adi Fandika Jakarta 3.61 Sistem Informasi tabel 2.

4 201224041 Sujarno Jakarta 3.17 Teknik Industri Tabel 2. Inisialisasi Data Wilayah Kota Asal

5 201125052 Yessi Anggraini Bogor 2.99 Teknik Kimia


Wilayah Frekuensi Insial
Taufiq Dwi
6 201423032 Solo Teknik Mesin DKI Jakarta 116 1
Setiawan 3.22
Jawa Barat 142 2
7 201231032 Hidayah Tasikmalaya 3.63 Teknik Sipil Jawa Tengah 31 3
Jawa Timur 6 4
8 201551094
Muhammad
Bengkulu Farmasi
Sumatera 4 5
Faizon Nopisenle 3.60

Adelia Roselina
9 201026010
Rinjani
Tangerang
3.12
Farmasi B. Inisialisasi Program Studi
Selain kota asal, jurusan juga termasuk ke dalam
Dewi Lolyta
10 201251028
Natalia M.
Jakarta
3.68
Farmasi jenis data nominal sehingga perlu
diinisialisasikan ke dalam bentuk angka. Seperti
pada kota asal, pada program studi juga
Transformasi Data diberikan inisialisasi berdasarkan frekuensi
jumlah mahasiswa pada program studi. Hasil
Data yang berjenis nominal seperti kota asal dan dari inisialisasi tersebut dapat dilihat pada tabel
program studi harus dilakukan proses inisialisasi data
berikut.
terlebih dahulu ke dalam bentuk angka/numerikal.
Untuk melakukan inisialisasi kota asal dapat
dilakukan dengan langkah-langkah sebagai berikut: Tabel 3. Inisialisasi Data Program Studi
Program Studi Frekuensi Insial
A. Inisialisasi Kota Asal
Farmasi 232 1
1. Pada data kota asal terlebih dulu dilakukan Teknik Kimia 26 2
pembagian wilayah yang menjadi beberapa Teknik Mesin 20 3
bagian wilayah, yaitu: Teknik Sipil 14 4
Teknik Informatika 13 5

IKRAITH-INFORMATIKA, VOL. 1, NO. 2, NOVEMBER 2017 75


Teknik Industri 12 6
Sistem Informasi 11 7
Desain Komunikasi
Visual 4 8

Berikut ini adalah contoh dataset mahasiswa yang


telah dilakukan inisialisasi dan akan diolah dengan
Rapid Miner.
Tabel 4. Dataset Mahasiswa yang Telah
dilakukan Inisialisasi

PROGRAM
NO NIM KOTA IPK
STUDI

1 201291001 3 3.26 8

2 200922016 3 2.86 5

3 201126016 1 3.61 7

4 201224041 1 3.17 6
Gambar 4.2. Result Overview k-means pada
5 201125052 2 2.99 2 Rapid Miner
6 201423032 3 3.22 3 Dengan menggunakan pemodelan k-means
clustering seperti gambar 4.1 diatas, dengan
7 201231032 2 3.63 4 inisialisasi jumlah cluster sebanyak 3 cluster, maka
didapatkan hasil dengan cluster yang terbentuk
8 201551094 5 3.60 1 adalah 3, sesuai dengan pendefinisian nilai k dengan
jumlah cluster_0 ada 10 item, cluster_1 ada 147
9 201026010 2 3.12 1 item, cluster_2 ada 175 item, dengan total item
sejumlah 332 item.
10 201251028 1 3.68 1
Tabel 5. Hasil cluster K-Means dalam
implementasi Rapid Miner

Pemodelan (Modeling)
Pemodelan adalah fase yang secara langsung Model Cluster
melibatkan teknik data mining dengan melakukan
pemilihan teknik data mining dan menentukan
Cluster 0 10 items
algoritma yang akan digunakan yaitu algoritma k- Cluster 1 147 items
means yang akan diolah dengan frame work Rapid Cluster 2 175 items
Miner versi 7.3. Total number of 332 items
Berikut ini adalah implementasi pengolahan data items
menggunakan metode k-means dengan Rapid Miner.
Berikut ini hasil perhitungan antara jarak
cluster dengan centroid menggunakan
RapidMiner

Gambar 4.1. Pemodelan k-means pada Rapid


Miner

76 IKRAITH-INFORMATIKA, VOL. 1, NO. 2, NOVEMBER 2017


Gambar 4.3. Hasil Perhitungan Antara Jarak Tabel 7. Hasil Analisis Cluster 2
cluster dengan centroid menggunakan Rapid Miner
Hasil Cluster 2
Evaluasi (Evaluation) Cluster 2 terdiri dari 147 mahasiswa yang berasal dari :
Program Studi : Wilayah Kota Asal :
Berdasarkan hasil pengolahan data dengan a. Farmasi : 68 a. Jawa Barat : 66
metode k-means clustering menggunakan Rapid
b. Teknik Kimia : 26 b. DKI Jakarta : 52
Miner dapat dilakukan pengelompokan data dari hasil
c. Teknik Mesin : 20 c. Jawa Tengah : 25
cluster yang diperoleh yaitu sebagai berikut.
1. Hasil Cluster 1 d. Teknik Sipil : 14 d. Sumatera : 3
e. Teknik Informatika : 12 e. Jawa Timur : 1
Hasil cluster 1 terdiri dari 10 mahasiswa, dapat f. Teknik Industri : 3
dilihat pada tabel 6, bahwa karakteristik mahasiswa g. Sistem Informasi : 3
pada cluster 1 didominasi mahasiswa dari program h. Desain Komunikasi Visual : 1
studi Farmasi sebanyak 6 mahasiswa. Sedangkan Dengan rata-rata nilai IPK 3.27
berdasarkan wilayah kota asal, didominasi oleh
mahasiswa dari wilayah kota asal DKI Jakarta dan 3. Hasil Cluster 3
Jawa Barat. Sehingga dapat disimpulkan bahwa rata-
rata mahasiswa pada cluster 1 berasal dari wilayah Hasil cluster 3 terdiri dari 175 mahasiswa, dapat
kota asal DKI Jakarta dan Jawa Barat, peminatan dilihat pada tabel 8. Karakteristik mahasiswa pada
program studi Farmasi, dengan rata-rata IPK 3,26. cluster 3 didominasi mahasiswa dari program studi
Farmasi sebanyak 158 mahasiswa. Sedangkan
Tabel 6. Hasil Analisis Cluster 1 berdasarkan wilayah kota asal, didominasi oleh
mahasiswa dari wilayah kota asal Jawa Barat dan
Hasil Cluster 1 DKI Jakarta. Sehingga dapat disimpulkan bahwa
rata-rata mahasiswa pada cluster 3 berasal dari
Cluster 1 terdiri dari 10 mahasiswa yang berasal dari : wilayah kota asal Jawa Barat dan DKI Jakarta,
peminatan program studi Farmasi, dengan rata-rata
Program Studi : Wilayah Kota Asal :
IPK 3,26.
a. Farmasi : 6 a. DKI Jakarta : 4
Tabel 8. Hasil Analisis Cluster 3
b. Desain Komunikasi Visual : 3 b. Jawa Barat : 4
c. Teknik Industri : 1 c. Jawa Tengah : 2
Hasil Cluster 3

Cluster 3 terdiri dari 175 mahasiswa yang berasal dari :

Program Studi : Wilayah Kota


Dengan rata-rata nilai IPK 3.26
a. Farmasi : 158 Asal :
a. Jawa Barat : 89
b. Sistem Informasi : 9
b. DKI Jakarta : 76
2. Hasil Cluster 2 c. Teknik Industri : 8
c. Jawa Tengah : 4
Hasil cluster 2 terdiri dari 147 mahasiswa, dapat
dilihat pada tabel 7. Karakteristik mahasiswa pada d. Jawa Timur : 3
cluster 2 didominasi mahasiswa dari program studi
Farmasi sebanyak 68 dan Teknik Kimia 26 e. Sumatera : 3
mahasiswa. Sedangkan berdasarkan wilayah kota
asal, didominasi oleh mahasiswa dari wilayah kota Dengan rata-rata nilai IPK 3,26
asal Jawa Barat dan DKI Jakarta. Sehingga dapat
disimpulkan bahwa rata-rata mahasiswa pada cluster
2 berasal dari wilayah kota asal Jawa Barat dan DKI Penyebaran (Deployment)
Jakarta, peminatan program studi Farmasi dan Teknik Dari data hasil clustering yang telah dilakukan di
Kimia, dengan rata-rata IPK 3,27. atas, maka dapat diterapkan pada beberapa strategi
promosi yang dapat dilakukan oleh pihak marketing
ISTA agar promosi yang dilakukan lebih efektif dan
effisien, yaitu:
a. Promosi dengan mengirim tim marketing yang
sesuai dengan program studi yang paling banyak
diminati.

IKRAITH-INFORMATIKA, VOL. 1, NO. 2, NOVEMBER 2017 77


b. Promosi pada persebaran wilayah kota asal dengan melakukan penyelarasan menggunakan
berdasarkan tingkat akademik calon mahasiswa. strategi promotion mix.

Selanjutnya dilakukan analisis strategi promosi pada DAFTAR PUSTAKA


tabel 9, berdasarkan promotion mix pada masing-
masing cluster yang terbentuk. Diharapkan dengan Arifin.Muhammad. (2014). “Bussiness Intelligence
strategi yang diberikan pada masing-masing cluster Untuk Prediksi Customer Churn
dapat sesuai dengan tujuan bisnis. Telekomunikasi”, Prosiding SNATIF, Vol.1,
Agusta, Y., K-means - Penerapan,
Tabel 9. Strategi Promosi berdasarkan Promotion Permasalahan dan Metode Terkait. Jurnal
Mix Sistem dan Informatika Vol. 3: 47-60.
No Strategi Cluster Cluster Cluster Bryan L. Garton, James E. Dyer, James E. Dyer.
Promosi 1 2 3 (2000). “The Use Of Learning Styles And
1 Periklanan √ √ √ Admission Criteria In Predicting
2 Penjualan √ √ √ Academic Performance And Retention
Personal Of College Freshmen”, Journal of
3 Promosi √ √ √ Agricultural Education, Vol. 41 Issue
Penjualan 2.
4 Hubungan √ Han. Jiawei, Micheline Kamber, Jian Pei.(2012).
Masyarakat
Data Mining Concept and Techniques, San
5 Pemasaran √
Fransisco: Morgan Kauffman.USA,
Langsung
Institut Sains dan Teknologi Al-Kamal. (2014).Buku
5. KESIMPULAN Panduan Akademik dan Kemahasiswaan.
Jakarta.
Dari hasil penelitian yang telah dilakukan dapat Irwan Budiman, Toni Prahasto, and Yuli Christyono.
disimpulkan sebagai berikut : (2012). Data Clustering Menggunakan
1. Setelah dilakukan pengelompokan data Metodologi Crisp-Dm Untuk
mahasiswa melalui persebaran wilayah kota Pengenalan Pola Proporsi Pelaksanaan
asal, peminatan program studi dan potensi Tridharma, SNATI, Yogyakarta.
akademik menggunakan K-Means clustering Kusrini,&Luthfi, E.T. (2009). Algoritma Data
dan diolah dengan Rapid Miner, terbentuk 3 Mining. Yogyakarta: Andi Publishing.
Larose, Daniel T. (2005). Discovering Knowledge in
(tiga) cluster yaitu : Data. New Jersey: John Willey & Sons, Inc.
Larose, Daniel T,.(2006). Data Mining Methods and
a. Cluster 1 dengan jumlah 10 mahasiswa Models. Hoboken New Jersey: Jhon Wiley &
berasal dari wilayah kota asal DKI Jakarta Sons, Inc,
dan Jawa Barat dengan peminatan program Miranda. Eka. (2008). Pengembangan Bussiness
studi Farmasi dan rata-rata IPK 3,26. Intelligence Bagi Perkembangan Bisnis
Perusahaan, Comm IT, Vol.2, No. 2.
b. Cluster 2 dengan jumlah 147 mahasiswa Mustafid. (2013). Sistem Bussiness Intelligence
berasal dari wilayah kota asal Jawa Barat Untuk Mendukung Perguruan Tinggi Yang
dan DKI Jakarta dengan peminatan Kompetitif, Jurnal Sistem Informasi Bisnis,
Vol.1, No.1.
program studi Farmasi dan Teknik Kimia
Philip dan Gary Armstrong Kotler. (2001). Prinsip-
dan rata-rata IPK 3,27. Prinsip Pemasaran, Alih Bahasa Imam
Nurmawan, Ed. Jakarta: Salemba Empat.
c. Cluster 3 dengan jumlah 175 mahasiswa
berasal dari wilayah kota asal Jawa Barat Ong. Johan Oscar. (2013). Implementasi Algoritma
dan DKI Jakarta, peminatan program studi K-Means Clustering Untuk Menentukan
Farmasi, dengan rata-rata IPK 3,26. Stategi Marketing President University,
Jurnal Ilmiah Teknik Industri, Vol. 12,No. 1.
2. Strategi promosi bagi calon mahasiswa baru Rajagopal. Sankar. (2011). Customer Data
yang tepat sasaran untuk setiap wilayah Clustering Using Data Mining Technique,
International Journal of Database
berdasarkan cluster yang terbentuk adalah
Management Systems, Vol.3, No.4.
dengan mengirim tim admisi marketing ISTA Ranjan.Jayanthi.(2009).BusinessIntelligence:
yang sesuai dengan program studi yang paling Concepts, Components, Techniques And
banyak diminati dan melakukan promosi Benefits, Journal of Theoretical and Applied
berdasarkan potensi akademik mahasiswa Information Technology.

78 IKRAITH-INFORMATIKA, VOL. 1, NO. 2, NOVEMBER 2017


Suprihatin, (2011). Klastering K-Means Untuk
Penentuan Nilai Ujian, JUSI, Vol. 1, No. 1.
Santosa, B. (2007). Data Mining: Teknik
Pemanfaatan Data untuk Keperluan Bisni
Yogyakarta: Graha Ilmu.
Safuan, Wahono, R.S., Catur S. (2015).
PenangananFitur Kontinyu dengan Feature
Discretization Berbasis xpectation
Maximization Clustering untuk
Klasifikasi Spam Email
Menggunakan Algoritma ID3,
Journal of Intelligent Systems, Vol.1,No.2.
Turban, E. dkk. (2005). Decicion Support Systems
and Intelligent Systems.: Andi Offset.
Wahono, R.S., Herman, N.S., Ahmad, S. (2014). A
Comparison Framework of Classification
Models for Software Defect
Prediction, Advanced Science Letters,
20(10-12).

IKRAITH-INFORMATIKA, VOL. 1, NO. 2, NOVEMBER 2017 79

Anda mungkin juga menyukai