Anda di halaman 1dari 12

LAPORAN MATAKULIAH PEMROGRAM DATA ANALISIS

ANALISIS SEGMENTASI PELANGGAN MALL

Disusun oleh :
Aria Witjaksono ( 0651 16 101 )

UNIVERSITAS PAKUAN BOGOR


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
JURUSAN ILMU KOMPUTER
PRODI S1 PENDIDIKAN ILMU KOMPUTER 2019
KATA PENGANTAR

Segala puji bagi Allah SWT yang telah memberikan saya kekuatan dan petunjuk untuk menyelesaikan
tugas laporan ini. Tanpa pertolongan-Nya saya tidak akan bisa menyelesaikan laporan ini dengan baik.

Sehingga akhirnya tersusunlah materi laporan mengenai “Analisis Segmentasi Pelanggan Mall”. Hal ini
kami lakukan untuk memenuhi tugas akhir Pemrograman Data Analisis. Walaupun waktunya cukup singkat, tapi
kegiatan ini menghasilkan sesuatu yang berharga dalam mengaplikasikan metode clustering dari perkuliahan
yang sedang kami jalani menggunakan data dari internet.

Dengan selesainya laporan tugas akhir secara resmi ini, maka tidak lupa kami ucapkan terima kasih
kepada semua orang yang sudah membantu dan terima kasih juga untuk para pihak yang sudah terlibat
langsung. Khususnya kami ucapkan kepada :

1. Bapak. Fajar Delli Wihartika, M.Kom selaku dosen Pemrograman Data Analisis
2. Orang Tua kami atas doa dan dukungannya sehingga tugas akhir ini berjalan lancar.
3. Kepada seluruh teman yang sudah menjawab pertanyaan saya mengenai pembuatan laporan.

Kami mohon saran dan kritiknya apabila terdapat kekurangan pada hasil laporan “Analisis Segmentasi
Pelanggan Mall” yang sudah saya buat. Semoga laporan ini memberi banyak kegunaan pada semua pihak .
Terima kasih.
DAFTAR ISI

KATA PENGANTAR .................................................................................................................................................. 2


DAFTAR ISI .............................................................................................................................................................. 3
BAB I. PENDAHULUAN ............................................................................................................................................ 4
1.1 Latar Belakang Masalah ........................................................................................................................ 4
1.2 Tujuan Penulis ....................................................................................................................................... 4
BAB 2. METODE PENELITIAN .................................................................................................................................. 5
2.1 Waktu dan Tempat Penelitian............................................................................................................... 5
2.2 Metode Pengambilan Data ................................................................................................................... 5
2.3 Metode Penelitian ................................................................................................................................. 5
2.4 Teknik Analisa Data ............................................................................................................................... 5
BAB 3. DATA, ANALISIS DAN PEMBAHASAN ........................................................................................................... 7
3.1 Data Penelitian ...................................................................................................................................... 7
3.2 Data Praproses ...................................................................................................................................... 7
3.3 Analisis Data .......................................................................................................................................... 8
BAB 4. KESIMPULAN DAN SARAN ......................................................................................................................... 11
4.1 Kesimpulan .......................................................................................................................................... 11
4.2 Saran ................................................................................................................................................... 11
BAB 5. REFERENSI ................................................................................................................................................. 12
BAB I.
PENDAHULUAN

1.1 Latar Belakang Masalah

Teknologi informasi dewasa ini semakin berkembang pesat disegala bidang. Berbagai macam data
dihasilkan oleh teknologi informasi yang canggih, mulai dari bidang pendidikan, industri, ekonomi, ilmu dan
teknologi serta berbagai bidang kehidupan lainnya. Dalam era globalisasi, perkembangan kecanggihan
teknologi yang semakin pesat merupakan aspek yang dapat dimanfaatkan untuk mencapai kemudahan-
kemudahan, tidak terkecuali dalam arus informasi. Kecanggihan teknologi tersebut terlihat semakin marak
dengan penggunaan komputer yang memang sudah sangat luas diberbagai bidang kehidupan misalnya di
bidang pendidikan, kesehatan, hiburan, terlebih pada bidang bisnis yang semuanya itu menuntut
penggunaan dari komputer.

Setiap orang memiliki kebutuhannya masing-masing dan tempat untuk mendapatkannya salah
satunya adalah Mall. Mall merupakan tempat yang memiliki kelengkapan kebutuhan bagi semua orang dan
semua umur. Untuk meningkatkan pendapatan dan untuk memuaskan pelanggan, maka tim pemasaran dan
tim perencanaan membutuhkan data pelanggan yang lengkap. Maka pihak manajemen memutuskan untuk
menganalisis segmentasi data pelanggannya.

1.2 Tujuan Penulis

Tujuan mengalisis segmentasi data pelanggan adalah :

1. Mengetahui cluster Annual Income dan Spending Score


2. Mengetahui gender agar tim pemasaran dan perencanaan dapat memberikan yang terbaik
3. Mengetahui umur bertujuan memahami kebutuhan pelanggan
BAB 2.
METODE PENELITIAN

2.1 Waktu dan Tempat Penelitian

Penelitian ini dilakukan pada semester 6 (enam) tahun ajaran 2016. Peneliti akan menggunakan
waktu penelitian selama 1 semester yaitu pertengahan bulan. Penelitian ini dilaksanakan di Universitas
Pakuan.

2.2 Metode Pengambilan Data

Penelitian yang dilakukan adalah penelitian segmentasi pelanggan di mall berdasarkan Annual
Income dan Spending Score dengan metode analisis clustering. Data penelitian didapat dari
https://www.kaggle.com/vjchoudhary7/customer-segmentation-tutorial-in-python. Hasil ini diharapkan
dapat memudahkan tim pemasaran dan tim perencaan dalam menargetkan pendapatan tahunan dan bobot
pengeluaran pelanggan.

2.3 Metode Penelitian

Metode penelitian menggunakan pendekatan algoritma K-Means. Algoritma K-Means


merupakan salah satu algoritma dalam fungsi clustering atau pengelompokan. Clustering mengacu pada
pengelompokkan atas data, observasi atau kasus berdasarkan kemiripan objek yang diteliti. Sebuah cluster
adalah suatu kumpulan data yang mirip dengan lainnya atau ketidakmiripan data pada kelompok lain .
Clustering didefinisikan dengan membagi objek data dalam bentuk, entitas, contoh, ketaatan, unit ke dalam
beberapa jumlah kelompok (grup, bagian atau kategori) . Proses clustering bertujuan untuk
meminimalkan terjadinya objective function yang diset dalam proses clustering yang pada umumnya
digunakan untuk meminimalisasikan variasi dalam suatu cluster dan memaksimalkan variasi antar cluster
atau dengan kata lain data yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster
yang sama dan data yang memiliki karakteristik berbeda dikelompokkan ke dalam kelompok lain . Proses
clustering dengan algoritma K-Means adalah sebagai berikut:

1. Tentukan banyaknya cluster yang diinginkan


2. Alokasikan data sesuai dengan jumlah cluster yang telah ditentukan
3. Tentukan nilai centroid pada tiap-tiap cluster
4. Tampilkan hasil berdasarkan jarak terendah dari hasil perhitungan. Jika belum didapatkan hasil
yang sesuai, iterasi kembali dilanjutkan.
5. Menentukan jumlah cluster dapat menggunakan metode elbow dengan cara mencari Jumlah
internal rata-rata kuadrat adalah jarak rata-rata antara titik-titik di dalam sebuah cluster Secara
matematis

2.4 Teknik Analisa Data

Teknik analisa data merupakan suatu langkah yang paling menentukan dari suatu penelitian,
karena analisa data berfungsi untuk menyimpulkan hasil penelitian. Analisis data dapat dilakukan melalui
tahap berikut ini :
1. Data selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian
informasi dalam KDD dimulai. Data hasil seleksi yang digunakan untuk proses data mining, disimpan
dalam suatu berkas, terpisah dari basis data operasional.

2. Pre-processing / cleaning

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang
menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data
yang inkonsisten, dan memperbaiki kesalahan pada data.

3. Transformation

Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk
proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada
jenis atau pola informasi yang akan dicari dalam basis data.

4. Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan
menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat
bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD
secara keseluruhan.

5. Interpretation / evalution

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah
dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut
interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan
bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
BAB 3.
DATA, ANALISIS DAN PEMBAHASAN

3.1 Data Penelitian

Data ini diambil dari 200 data pelanggan di Mall dan tidak ada data null atau data yang kosong.
Format data yang digunakan adalah .csv. Dengan atribut-atribut yang digunakan sebagai berikut :

• Customer ID : ID pelanggan
• Gender : Jenis kelamin
• Age : Umur
• Annual Income : Pendapat tahunan
• Spending Score : Nilai atau bobot pengeluaran

3.2 Data Praproses

Sebelum melakukan data mining harus dilakukan data preprocessing yang mana agar data yang
akan diproses valid semuanya. Untuk itu dapat dilakukan pengecekan apakah ada data yang kosong (null)
atau tidak dan karakter atau tipe data sudah sesuai atau belum. Berikut hasil pengecekan :
Dan dapat dilihat apakah data sudah sesuai untuk di proses atau belum dengan mendescribe (menghitung
dengan statistika deskriptif) data.

3.3 Analisis Data

Data yang telah melalui tahapan preprocessing data dapat dilakukan analisis data. Analisis data
deskriptif dapat digunakan sebagai informasi awal dalam pembacaan data. Untuk mencari nilai cluster yang
optimum, maka menggunakan metode Elbow Method untuk mencari nilai Kmeans.
Setelah mendapatkan nilai K optimal. Dapat melakukan visulisasi cluster.

# Penjelasan Grafik

• Cluster 1 (Merah) ->


Penghasilan tinggi tetapi pengeluaran lebih sedikit

• Cluster 2 (Biru) ->


Rata-rata dalam hal penghasilan dan pengeluaran

• Cluster 3 (Hijau) -> [SET TARGET]


Berpenghasilan tinggi dan juga pengeluaran banyak

• Cluster 4 (Biru Muda) ->


Mendapat penghasilan lebih sedikit tetapi menghabiskan
lebih banyak

• Cluster 5 (Ungu) ->


Menghasilkan lebih sedikit, pengeluaran lebih sedikit

Data Gender :
Data Umur :

Data Spendscore atau pengeluaran :


BAB 4.
KESIMPULAN DAN SARAN

4.1 Kesimpulan

Konsep data mining mengunakan K-Means guna mengelompokkan data Annual Income dan
Spending Score untuk mengetahui data yang memiliki kesamaan sifat (dalam hal ini adalah gender) dengan
melakukan proses pengelompokan data menjadi beberapa bagian / klaster. Hasil ini dapat digunakan untuk
memberikan saran pertimbangan dalam menentukan stratregi pemasaran selanjutnya mengenai penjualan
barang, penjadwalan event, pendistribusian pemasaran dan lain-lain

4.2 Saran

Konsep data mining clustering K-Means dapat dilakukan pengembangan lebih lanjut dengan
mengcluster produk berdasarkan varian dari tiap-tiap modelnya dan cluster pelanggan berdasarkan umur
dan gender
BAB 5.
REFERENSI

https://www.kaggle.com/vjchoudhary7/kmeans-clustering-in-customer-segmentation

https://www.kaggle.com/vjchoudhary7/customer-segmentation-tutorial-in-python

https://www.kaggle.com/roshansharma/mall-customers-clustering-analysis

https://www.geeksforgeeks.org/python-delete-rows-columns-from-dataframe-using-pandas-drop/

https://www.academia.edu/35658340/LAPORAN_DATA_MINING_METODE_KLASTERING_MENGGU
NAKAN_ALGORITMA_K-MEANS

https://www.kaggle.com/

Anda mungkin juga menyukai