BAB 1

PENDAHULUAN
1.1. Latar Belakang
Pengumpulan data yang dilakukan melalui penyebaran kuesioner telah
menghasilkan sejumlah data. Sebelum hasil data survei tersebut dianalisis,
pengolahan data awal perlu dilakukan untuk mengetahui kualitas dari hasil
data yang diperoleh. Kualitas dari hasil data ini akan mempengaruhi
keputusan yang akan diambil oleh suatu perusahaan. Dewasa ini, banyak
perusahaan yang telah mendirikan divisi analis data untuk mengetahui kualitas
data yang diperoleh. Setiap keputusan yang diambil oleh perusahaan
dilakukan berdasarkan data. Oleh karena itu, setiap data yang diperoleh perlu
dilakukan pengolahan data awal agar dapat menghasilkan data yang
berkualitas. Hasil pengolahan data ini akan diberikan kepada manajer untuk
pengambilan keputusan atau perumusan strategi yang tepat. Berdasarkan hal
tersebut, PT. Sanford perlu melakukan pengolahan data awal untuk
mengetahui kualitas data sehingga dapat diinterpretasikan dengan tepat dan
tidak ada hasil yang bias. Hasil data yang tidak bias ini mempengaruhi
keputusan yang akan dilakukan. Dengan demikian, perusahaan dapat
memenuhi kebutuhan dan keinginan konsumen yang sesuai.
Semakin banyak bertambahnya perusahaan dalam bidang perdagangan
sekarang ini membuat persaingan pasar semakin ketat. Termasuk diantaranya
perusahaan perdagangan aksesoris pintu dan jendela semakin banyak
pesaingnya, pemesanan setiap hari dari berbagai macam pelanggan. Hal
dalam basis data, baik data transaksi pemesanan maupun data pelanggan.
Dengan banyaknya pelanggan pada perusahaan perlu dilakukan pengolahan
data untuk dilakukan strategi bisnis dalam menjaga hubungan yang baik
dengan pelanggan terutama pelanggan yang loyal terhadap perusahaan. Hal
tersebut dapat dilakukan proses segmentasi dengan mengelompokkan
pelanggan ini diterapkan metode clustering yang merupakan salah satu
kelompok-kelompok tertentu.

1.2. Rumusan Masalah

1. Bagaimana cara membuat data statistika deskriptif ?
2. Bagaimana penyelesaian dalam segmentasi konsumen dengan
mengabung analisis cluster?
3. Bagaimana menginterprestasikan hasil analisis cluster?

1.3. Tujuan
awal dan segementasi konsumen dengan analisis cluster antara lain:
1. Dapat mendokumentasikan data hasil survei dan melakukan proses
pemeriksaan data awal untuk menjamin kualitas data.
2. Membuat pengolahan data awal untuk memberikan gambaran mengenai
data berupa statistika deskriptif.
3. Membuat segmentasi konsumen dan menggabungkan cluster berdasarkan
data preferensi.
4. Melakukan interpretasi atas hasil analisis cluster dalam konteks
pengembangan produk.

1.4. Manfaat
Manfaat dari praktikum pada modul III mengenai pengolahan data awal
dan segementasi konsumen dengan analisis cluster antara lain:
1. Memudahkan saat mendokumentasikan data hasil survei dan melakukan
proses pemeriksaan data awal untuk menjamin kualitas data.
2. Dapat mengolah data awal menjadi data berupa statistika deskriptif .
3. Dapat membuat segmentasi konsumen dan menggabungkan cluster
berdasarkan data preferensi.
4. Dapat menyimpulkan atau menginterpretasikan hasil analisi cluster dalam
konteks pengembangan produk.

1.5. Batasan Masalah

Batasan masalah pada parktikum modul 3 mengenai pengolahan data
awal dan segementasi konsumen dengan analisis cluster agar tidak
menimbulkan masalah baru maka,diperlukan untuk membatasi masalah
praktikum ini meliputi hasil akhir data dan kesimpulan pada analisis cluster
data dengan penggunaan software sebagai pemecah masalah.

BAB II

LANDASAN TEORI
2.1. Proses Pemeriksaan Data Awal
Pemeriksaan data awal ini perlu dilakukan untuk menyaring data yang
awal juga meyakinkan bahwa data yang akan diolah tidak akan menghasilkan
bias. Dengan demikian, pemeriksaan data awal akan menghasilkan data yang
berkualitas yang dapat diproses lebih lanjut. Proses-proses pemeriksaan data
awal yang dibutuhkan untuk memastikan kualitas dara adalah sebagai berikut:

2.3.1 Outlier
Outlier merupakan data yang memiliki karakteristik yang berbeda dari
data lainnya. Menurut Hawkins (1980), outlier merupakan hasil penelitian
yang menyimpang jauh dari hasil penelitian lainnya sehingga menimbulkan
kecurigaan bahwa hal tersebut dihasilkan oleh mekanisme yang berbeda.
Outlier juga diketahui sebagai abnormal, penyimpangan, dan
ketidakharmonisan dalam pengolahan data atau ilmu statistika. Outlier dapat
berisi informasi yang berguna tentang karakteristik abnormal sistem dan
entitas, yang berdampak pada proses generalisasi data. Oleh karena itu, tidak
boleh tergesa-gesa dalam menghilangkan outlier karena akan mengurangi
tingkat generalisasi data. Sehingga, identifikasi data outlier perlu dilakukan
untuk mengetahui apakah seharusnya data outlier dihilangkan atau tidak.

2.3.2 Missing Data

survei. Kejadian ini dapat diakibatkan oleh kesalahan atau kesengajaan
responden dalam mengisi kuesioner. Pengabaian missing data dapat
mempengaruhi hasil data survei secara signifikan. Tipe missing data terbagi
menjadi dua, yaitu ignorable missing data dan non-ignorable missing data.
Karena pengabaian missing data dapat mempengaruhi hasil data, identifikasi
missing data perlu dilakukan untuk mengetahui perbaikan yang tepat untuk
mengatasi missing data. (Malhotra, N. K. 2007)

2.3.3 Asumsi dalam Statistika

Dalam statistika terdapat asumsi penting yang perlu dipenuhi.
Pengujian asumsi dapat dilakukan secara pada variabel atau variate.
variate-nya. Berikut asumsi penting dalam statistika. 1. Normalitas Normalitas
dapat diuji dengan menggunakan normal probability plot dan uji hipotesis
dengan pengujian skewness, kurtosis, shapiro-wilk, dan lain-lain. Kurtosis dan
skewness mendeskripsikan bentuk distribusi dan bersifat empiris. Kurtosis
menggambarkan peakness dan flatness pada distribusi normal, sedangkan

skewness menggambarkan keseimbangan data pada distribusi normal. Uji

shapiro-wilk menghitung perbedaan dari level of significance pada distribusi
normal, dan uji ini tergolong sensitif pada sampel besar. Perbaikan yang dapat
dilakukan untuk pelanggaran asumsi ini adalah melakukan transformasi data.
2. Linearitas Linearitas dapat diuji dengan menggunakan grafik pada scatter
plot atau menggunakan linear regression dan nilai residualnya. Scatter plot
merupakan grafik dua dimensi yang menggambarkan variabel dengan bentuk
titik-titik pada sumbu x dan sumbu y. Pengujian menggunakan scatter plot
tidak dapat mendeteksi non-linearitas, sehingga harus diuji dengan regresi
linear. Perbaikan atas pelanggaran asumsi ini adalah transformasi data.(
NIST.2012)

2.2. Analisis Statistika Deskriptif

Statistika deskriptif merupakan salah satu tipe pengolahan data pada
ilmu statistika. Statistika deskriptif memberi gambaran mengenai hasil data
yang diperoleh secara kuantitatif. Statistika deskriptif disampaikan melalui
ukuran pemusatan, ukuran penyebaran, dan ukuran bentuk. Berikut penjelasan
masing-masing ukuran. a. Ukuran Pemusatan Menjelaskan hasil data terkait
lokasi dalam suatu set data. Misal mean (nilai rata-rata), median (nilai tengah),
dan modus. b. Ukuran Penyebaran Menjelaskan hasil data terkait pola
persebaran data dan variasi data. Misal range (jangkauan), deviasi standar,
variasi, dan interkuartil. c. Ukuran Bentuk Menjelaskan hasil data sebagai
tambahan bagi ukuran penyebaran. Ukuran bentuk digunakan untuk
memahami pola dari distribusi. Ukuran terdiri dari skewness (ukuran
kemiringan) dan kurtosis (ukuran keruncingan). Penyampaian statistika
deskriptif tidak hanya dalam bentuk tertulis, tetapi juga dalam bentuk grafis.
Beberapa jenis grafis yang digunakan adalah peta, pie chart, line chart,
histogram dan bar chart. (Varmuza, K. & Filzmoser, P. 2009)

2.3. Analisis Cluster

Analisis cluster merupakan proses yang digunakan untuk
mengelompokkan objek berdasarkan karakteristik yang sama (homogen).
Beberapa data yang memiliki karakteristik yang berbeda akan dikelompokkan
dalam satu atau lebih cluster. Pada setiap cluster tersebut akan berisi data
yang memiliki karakteristik yang sama (homogen) dan antar cluster berisi data
yang berlainan (heterogen).( Hidayat, Anwar. 2014)

Analisis cluster juga bertujuan untuk mempartisi data kedalam

kelompok yang lebih homogen.Analisis cluster seringkali digunakan sebagai
data mining yaitu suatu metode untuk mencari informasi yang terselubung
dalam data. Tahapan analisis cluster dibagi menjadi tiga tahapan yaitu tahap
pemebentukan partisi,tahap kedua adalah tahap interpretasi yaitu tahap
menetukan kategori dan pelabelan untuk menggambarkan karateristik

klaster.Selanjutnya tahap ketigaadalah tahap validasi dan pembentukan profil.

K- Means cluster adalah salah satu metoda cluster non hirarki yang digunakan
untuk mengelompokkan data dengan ukuran besar.Proses pengelompokkan
dengan K-means adalah menetukan banyaknya cluster dan menetukan rata-
rata tiap cluster,menghitung jarak rataan (centroid) dan melakukan
pengulangan sampai ditemukan pengelompokkan terdekat.Secara umum,
cluster analisis memiliki dua metode, yaitu Metode hierarki dan metode tak
hierarki. Metode hierarki digunakan untuk mencari struktur pengelompokkan
dari objek-objek. Jadi, hasil pengelompokkannya disajikan secara hierarki
atau berjenjang. (aeli, Sofya. 2014)

2.4. Tahapan Analisis Cluster

validitas,realibilitas dan uji analisis cluster saat ini dimudahkan dengan
aplikasi maupun program apa saja sehingga dapat mempermudah serta
mempercepat hasil data yang sudah diolah sebelumnya.Langkah untuk
menganalisis cluster pada data menggunakan software SPSS sebagai berikut:

1. Klik Analyze, kemudian pilih Classifi, lalu klik Hierarchical Cluster,

maka diperoleh Gambar Hierarchical Cluster Analisis

2. Klik Statistics, maka muncul Gambar Hierarchical Cluster Analisis

Statistics, centang Agglomeration schedule, kemudian klik Range of
solution, ketik pada kotak Minimum number of clusters angka 3 dan
Maximum number of clusters angka 4 dan Maximum

3. Klik Statistics, maka muncul Gambar Hierarchical Cluster Analisis Statistics,

centang Agglomeration schedule, kemudian klik Range of solution, ketik
pada kotak Minimum number of clusters angka 3 dan Maximum number of
clusters angka 4 dan Maximum lalu Okay. (De Amorim.2014)

BAB III

METODOLOGI PENELITIAN
3.1. Flowchart
Flowchart parktikum modul III sebagai penyelesaian masalah mengenai
pengolahan data awal dan segementasi konsumen dengan analisis cluster.

Mulai

Perumusan Masalah

Pengolahan Data
(Mean),(Modus), (Standar
Deviasi)

Analisis Kluster

Analisis Data

Selesai

3.2. Penjelasan Flowchart

1. Mulai
2. Perumusan masalah
Tahap perumusan masalah yaitu menjawab tiga persoalan dengan batasan
masalah tidak melewati hasil dari analisis cluster yang telah dismpulkan
dengan jawaban yang diperoleh dari software SPSS menggunakan data
primer sebelumnya.
3. Pengumpulan Data
Data yang telah terkumpul sebanyak 30 responden dengan menggunakan
metode wawancara,kuesioner online dan kuesioner tertulis,masing-
masing setiap responden dilatar belakangi usia,jenis kelamin dan
pekerjaan yang berbeda.Maka dari itu data responden perlu
diklasifikasikan agar mudah pada tahap pengolahan data.
4. Pengolahan Data
Data primer yang diperoleh dari jawaban responden secara random,maka
data perlu dianalisa terlebih dahulu mengenai modus,rata-rata dan juga
standar deviasi.Sebagai jawaban yang paling mendekati atau nilai yang
paling tinggi dari responden maka membuat hipotesa sebelum lanjut pada
analisa cluster. Pengolahan data yang dibantu dengan MS.Excel dengan
rumus yang sudah ada,maka hasil perhitungan data tersebut kecil
meliputi usia,kelamin dan pekerjaan masing-masing responden setiap
pernyataan 1 sampai dengan 16 .
5. Analisis Cluster
Pada tahap ini merupakan pengelompokkan variabel berdasarkan hipotesa
sebelumnya dari rata-rata,modus dan juga standar deviasi. Penyelesaian
diperlukan software SPSS berdasarkan rumus yang sudah ada. Tujuan
dari analisis cluster adalah untuk mendapatkan informasi yang
terselubung serta memprediksi pernyataan diantara pernyataan 1 sampai
dengan 16 sebagai jawaban yang paling utama sebagai penentuan
segmentasi pasar terhadap konsumen mengenai produk mineral sanford.
6. Analisis Data
Analisis data ketika semua data sudah seratus persen lengkap langkah
selanjutnya mencari jawaban serta perbandingan dari setiap pernyataan
mengenai jawaban responden terhdap produk mineral sanford. Fungsi
data tersebut maka dijadikan sebagai acuan untuk menambhakan
informasi baik dari segi kekurangan maupun kelebihan produk dipasar
maupun tindakan perusahaan agar produk tersebut tetap bertahan dengan
kompetitor produk mineral lainnya.

7. Kesimpulan dan saran

Kesimpulan dan saran berisikan mengenai penjelasan data secara
keseluruhan dengan singkat,jelas dan padat serta saran yang membangun
untuk pemebelajaran praktikum maupun mengenai produk di segmentasi
konsumen.

BAB IV

PENGUMPULAN DAN PENGOLAHAN DATA

4.1. Pengumpulan Data
Berdasarkan jawaban responden sebanyak 30 orang setelah
diklasifikasi dan diidentifikasi,masing-masing responden memiliki latar
belakang yang berbeda terutama pada usia,jenis kelamin,pekerjaan serta
jawaban pertanyaan dari setiap pernyataan yang berjumlah enam belas
pernyataan.Berikut adalah data responden serta jawaban responden setelah
diklasifikasikan. Data dapat dilihat pada lampiran halaman belakang.

4.2. Pengolahan Data Statistika Deskriptif

Data responden yang telah diklasifikasikan berdasarkan usia dan jenis
kelamin, jawaban responden dari setiap pernyataan diolah untuk mencari nilai
rata-rata,modus dan standar defiasi.Setelah nilai yang diperoleh dari setiap
pernyataan 1-16 maka semua hasil dari jumlah responden akan dilanjutkan
melihat perbandingan dan membuat hipotesa dari pernyataan mengenai
delapan quality of dimention terhadap produk mineral sanford sebagai
kesimpulan mengenai produk mineral sanford seperti keunggulan,perbaikan
maupun ketahanan produk terhadap kompetitor produk mineral lainnya.Hasil
dari perhitungan berdasarkan analisis deskriptif dapat dilihat pada lampiran
halaman paling belakang.

4.3. Pengolahan Data Analisis Cluster

Pengelompokkan responden berdasarkan jenis kelamin dan usia
memperoleh nilai rata-rata,modus dan standar deviasi sebagai berikut:
A. Usia
1. Usia <18 Tahun
Nilai rata-rata pada usia <18 tahun jumlah responden sebanyak
satu orang,maka jawaban responden tidak dapat digunakan atau
kurang tepat untuk membuat hipotesa dikarenakan tidak memilki
perbandingan usia yang sama dengan responden lain.

2. Usia 18-25 Tahun

Pada Usia 18-25 tahun jumlah responden sebanyak 19 orang.
Hasil nilai rata-rata yang tertinggi pada setiap pernyataan terdapat
pada pernyataan nomor 2 dengan nilai 4.79 dengan modus nilai 5
yang mengindikasikan jawaban responden sangat setuju pada
keberadaan air minum sanford mudah di temukan di Kepulauan
Riau.

3. Usia >25 Tahun

Pada Usia >25 Tahun jumlah responden sebanyak 10 orang. Hasil
pernyataan nomor 16 dengan nilai 4.70 dan modus nilai 5 yang
mengindikasikan jawaban responden sangat setuju pada harga
terjangkau dan mudah ditemukan dimana saja produk Mineral
Sanford.

B. Jenis Kelamin
1. Perempuan
Pada klasifikasi jenis kelamin jumlah responden perempuan
sebanyak 20 orang.Hasil nilai rata-rata yang tertinggi pada setiap
pernyataan terdapat pada pernyataan nomor 2 dengan nilai 4.80
dan modus 5 yang mengindikasikan jawaban responden sangat
setuju pada harga terjangkau dan mudah ditemukan dimana saja
produk Mineral Sanford.
2. Laki-Laki
Pada klasifikasi jenis kelamin jumlah responden perempuan
sebanyak 10 orang.Hasil nilai rata-rata yang tertinggi pada setiap
pernyataan terdapat pada pernyataan nomor 2 dengan nilai 4.60
dan modus 5 yang mengindikasikan jawaban responden sangat
setuju pada harga terjangkau dan mudah ditemukan dimana saja
produk Mineral Sanford.

4.4. Hasil Analisis Cluster

Berdasarkan pengelompokkan analisis kluster pada dendogram
terbagi menjadi dua kelompok yaitu responden yang bernama dwiyana sampai
dengan wirdya merupakan kelompok pertama dan responden jacky sampai
dengan Kim taer merupakan kelompok kedua. Hasil dari tabel analisis
dendogram dapat dilihat pada lampiran halaman paling belakang.

BAB V

Produk Mineral sanford merupakan kebutuhan primer untuk menghilangkan

rasa dehidrasi,kesehatan tubuh dan sebagainya. Kebutuhan air minum mineral tidak
dapat terkecualikan mulai dari anak-anak,remaja,dewasa dan lansia setiap hari akan
mengonsumsi air minum mineral. Produk mineral sanford sangat berupaya untuk
menjaga kualitas dan kuantitas terhadap konsumen agar produk tersebut tetap terjaga
dan bertahan di pasar yang sama dengan kompetitor perusahaan mineral lainnya.
Penduduk Kepualuan Riau mayoritas menjadi konsumen produk mineral sanford
karena mudah didapatkan dan juga harga yang relatif membuat konsumen produk
tidak ragu dan juga tanpa dampak terhadap kesehatan. Berdasarkan data responden
yang dijadikan sampel sebanyak 30 orang dari 2.064.504 jiwa pernah mengonsumsi
produk tersebut dari 16 pernyataan responden wajib menjawab poin yang akan
dipilih dari 1-5 yaitu skala yang menunjukkan dari Sangat Tidak Setuju,Kurang
Setuju,Netral,Setuju dan Sangat Setuju. Setelah mendapatkan sampel secara random
maka mengklasifikasikan jawaban responden menjadi dua kempok yaitu berdasarkan
jenis kelamin terbagi menjadi laki-laki dan perempuan dan bagian usia yaitu terbagi
menjadi tiga bagian mulai dari usia <18 tahun,18-25 tahun dan >25 tahun.
Berdasarkan data responden pada jenis kelamin perempuan alasan
mengonsumsi mineral sanford adalah mudah ditemukan di Kepulauan riau seperti
warung,minimarket maupun usaha ritel lainnya dengan nilai rata-rata sebesar 4.80
yang dominan memilih skala 5 dari 20 responden. Sedangkan Pada nilai rata-rata
terendah terdapat pada pernyataan nomor 11 yaitu mineral sanford dapat sebagai
hasil tambahan atau usaha dengan modus skala 4 yang mengindikatorkan setuju.
Pada jenis kelamin laki-laki jawaban terbanyak memilih mengonsumsi mineral
sanford adalah mudah di temuakan di Kepualauan Riau (Pernyataan no 2) sedangkan
rata-rata nilai terendah pada pernyataan nomor 11 denngan modus skala 3 pada
indikator produk sanford dapat sebagai penghasilan tambahan dan pernyataan nomor
12 mengindikasikan mineral sanford mendukung keramahan lingkungan serta Modus
yang terpilih skala 4 setuju dari 10 responden.
Pada data responden berdasarkan usia 18-25 tahun rata-rata nilai tertinggi
pada pernyataan nomor 2 dengan nilai 4.79 dan modus skala 5 yaitu sangat setuju
dengan jumlah responden 19 orang. Sedangkan rata-rata terendah pada pernyataan
nomor 11 dan 12 senilai 3.26 dan modus skala 3 netral. Usia >25 tahun rata-rata nilai
tertinggi pada pernyataan nomor 16 dengan nilai 4.79 dan modus skala 5 sangat
setuju bahwa produk sanford harga terjangkau dan miudah ditemukan dimana saja
dari 10 responden.

BAB VI

KESIMPULAN DAN SARAN

6.1 Kesimpulan
1. Analisis kluster berdasarkan informasi responden mengenai air Minum
Sanford dikelompokkan berdasarkan Usia meliputi usia <18 tahun,18-25
tahun dan > 25 tahun dan jenis kelamin yaitu prempuan dan laki-laki.
2. Berdasarkan jawaban 30 responden yang dikelompokkan kedalam usia dan
jenis kelamin rata-rata responden menjawab sangat setuju pada pernyataan
nomor 2 yaitu mineral sanford mudah ditemukan di Kepulauan Riau dengan
nilai 4.80 dan skala 5 yaitu sangat setuju serta pernyataan nomor 16 yaitu
harga terjangkau dan ditemukan dimana saja dengan nilai 4.79 dan skala 5
sangat setuju.
3.Nilai rata-rata terendah pada pernyataan nomor 11 dan pernyataaan nomor
12 pada indikator servicebility yaitu produk mineral sanford dapat sebagai
penghasilan tambahan dan ramah terhadap lingkungan dari setiap jawaban
responden berdasarkan kelompok usia dan jenis kelamin.

6.2 Saran
Produk mineral sanford sangat umum dan dikenali oleh seluruh
penduduk Kepulauan Riau mulai dari mengonsumsi mineral bentuk produk
galon,botol dan gelas laris di pasar. Agar masyarakat dapat mengambil
peluang pada produk sebagai agen minuman sanford,perusahaan sanford dapat
mensosialisasikan cara untuk menjadi agen sanford disetiap wilayah
Kepulauan Riau dengan cara melalui media sosial ataupun berkunjung
langsung yang dapat mengumpulkan masyarakat.Selain menguntungkan
perusahaan, masyarakat penduduk Kepulauan Riau mampu menghasilkan
pendapatan sampingan. Selain itu karena kemasan yang pada umumnya
berbahan plastik memicu pencemaran lingkungan,perusahaan sebaiknya
mengalihkan kemasan selain bahan dari plastik ataupun mendaur ulang
sampah kemasan sanford kedalam bnetuk lain seperti pembuatan lemari,kursi
dan sebagainya.

