Anda di halaman 1dari 126

LAPORAN LENGKAP

PRAKTIKUM STATISTIK INDUSTRI

DISUSUN OLEH :

QATRUNADA NAFIAH (22TIA940)

SRI DEVI ASTUTI (22TIA944)

MUH FIRMAN FAJAR (22TIA933)

ULVA RAMADANI (22TIA947)

KHUSNUL KHATIMAH (22TIA925)

MUH ZULKIFLY PANE (22TIA928)

POLITEKNIK ATI MAKASSAR

KEMENTRIAN PERINDUSTRIAN

2023
LEMBAR PENGESAHAN

JUDUL : LAPORAN LENGKAP PRAKTIKUM STATISTIK INDUSTRI

NAMA : QATRUNADA NAFIAH (22TIA940)

SRI DEVI ASTUTI (22TIA944)

MUH FIRMAN FAJAR (22TIA933)

ULVA RAMADANI (22TIA947)

KHUSNUL KHATIMAH (22TIA925)

MUH ZULKIFLY PANE (22TIA928)

KELAS :1C

JURUSAN : TEKNIK INDUSTRI AGRO

Makassar, 2023

Mengesahkan :

Pranata Laboratorium Asisten Dosen

Dian Dwi Wahyudi, S.T Rizky Hidayah Ilyas, A.Md,T


Nip. 19831228 201901 1 001

Dosen Mata Kuliah Praktikum Dosen Mata Kuliah Praktikum

Andi Velahyati B, ST., MT, M.Sc A. Dian Sry Rezki Natsir,MSM


Nip. .19890329 202012 2 001 Nip. .19850821 202012 2 001

ii
KATA PENGANTAR

Segala puji kita panjatkan kehadirat Allah Subhana Wa Ta’Ala yang telah
memberikan rahmat, nikmat, karunia, dan anugerah-Nya sehingga laporan lengkap
ini dapat terselesaikan dengan baik. Walaupun masih jauh dari kata sempurna.
Laporan ini penulis buat guna menyelesaikan Praktek Statistik Industri pada saat
menempuh pendidikan di Politeknik ATI Makassar.

Penulis mengucapkan banyak terima kasih kepada semua pihak yang telah
membantu dalam proses pembuatan laporan lengkap Ini, terkhusus kepada :

1. Kepada dosen pembimbing pada Praktikum Statistik dan Rekayasa


Industri yang telah memberikan dukungan dan motivasi.
2. Kepada segenap asisten laboratorium Statistik dan Rekaya Industri yang
tetap sabar melayani dalam berlangsungnya kegiatan praktikum.
3. Kepada orang tua yang tak pernah putus mendoakan agar kuliah kami
berjalan dengan baik.
4. Dan seluruh teman - teman yang berkenan membantu dan memberi
dukungan hingga Laporan Lengkap Statistik dan Rekayasa Industri ini
dapat selesai.
Demikianlah Laporan Lengkap Statistik dan Rekayasa Industri ini penulis
buat dengan sepenuh hati. Tidak lupa kritik dan saran diharapkan agar laporan ini
dapat menjadi lebih baik lagi. Semoga laporan ini bisa bermanfaat bagi semua
orang terkhusus bagi penulis sendiri, aamiin.

Makassar, Agustus 2023

Penyusun,

Kelompok 2

iii
DAFTAR ISI

LEMBAR PENGESAHAN .................................................................................... ii


KATA PENGANTAR ........................................................................................... iii
DAFTAR ISI .......................................................................................................... iv
MODUL 1 “VISUALISASI DATA, UKURAN PEMUSATAN DATA DAN
PENYEBARAN DATA” ..................................................................................... viii
BAB I PENDAHULUAN ....................................................................................... 1
1.1 Latar Belakang ......................................................................................... 1
1.2 Tujuan Praktikum ..................................................................................... 2
1.3 Alat Dan Bahan Yang Digunakan ............................................................ 2
1.4 Prosedur Praktikum .................................................................................. 2
BAB II LANDASAN TEORI ................................................................................. 5
2.1 Visualisasi Data ........................................................................................ 5
2.2 Jenis-jenis Visualisasi Data ...................................................................... 5
2.3 Ukuran Pemusatan Data ........................................................................... 9
2.4 Ukuran Penyebaran Data ........................................................................ 11
BAB III PENGUMPULAN DAN PENGOLAHAN DATA ................................ 15
3.1 Pengumpulan Data ................................................................................. 15
3.2 Pengolahan Data ..................................................................................... 17
BAB IV PEMBAHASAN ..................................................................................... 29
4.1 Visualisasi Data ...................................................................................... 29
4.2 Visualisasi Data Kelompok .................................................................... 32
4.3 Ukuran Pemusatan dan Penyebaran Data Tunggal ................................ 34
4.4 Ukuran Pemusatan dan Penyebaran Data Kelompok ............................. 35
BAB V PENUTUP................................................................................................ 36
5.1 Kesimpulan ............................................................................................. 36
5.2 Saran ....................................................................................................... 36
DAFTAR PUSTAKA ........................................................................................... 37
MODUL 2 “UJI VALIDITAS DAN REALIBILITAS”....................................... 38
BAB I PENDAHULUAN ..................................................................................... 39
1.1 Latar Belakang ....................................................................................... 39

iv
1.2 Tujuan Praktikum ................................................................................... 40
1.3 Alat dan Bahan Yang Digunakan ........................................................... 40
1.4 Prosedur Praktikum ................................................................................ 40
BAB II LANDASAN TEORI ............................................................................... 42
2.1 Pengertian Validitas ............................................................................... 42
2.2 Kegunaan Validitas ................................................................................ 43
2.3 Pengertian Reliabilitas ............................................................................ 44
2.4 Cara – Cara Mencari Besarnya Reabilitas .............................................. 46
BAB III PENGUMPULAN DAN PENGOLAHAN DATA ................................ 49
3.1 Pengumpulan Data ................................................................................. 49
3.2 Pengolahan Data ..................................................................................... 50
BAB IV PEMBAHASAN ..................................................................................... 55
4.1 Uji Validasi............................................................................................. 55
4.2 Uji Reliabilitas ........................................................................................ 61
BAB V PENUTUP................................................................................................ 65
5.1 Kesimpulan ............................................................................................. 65
5.2 Saran ....................................................................................................... 67
DAFTAR PUSTAKA ........................................................................................... 68
MODUL 3 “KORELASI DAN REGRESI” ......................................................... 69
BAB I PENDAHULUAN .................................................................................... 70
1.1 Latar Belakang ....................................................................................... 70
1.2 Tujuan Pratikum ..................................................................................... 70
1.3 Alat yang digunakan ............................................................................... 71
1.4 Prosedur praktikum ................................................................................ 71
BAB II LANDASAN TEORI .............................................................................. 72
2.1 Pengertian korelasi ................................................................................. 72
2.2 Pengertian regresi ................................................................................... 74
2.3 Definisi Uji Hipotesis ............................................................................. 76
BAB III PENGUMPULAN DAN PENGOLAHAN DATA ................................ 77
3.1 Pengumpulan Data ................................................................................. 77
3.2 Pengolahan Data ..................................................................................... 79
BAB IV PEMBAHASAN ..................................................................................... 81

v
4.1 Korelasi .................................................................................................. 81
4.2 Regresi .................................................................................................... 82
BAB V PENUTUP................................................................................................ 84
5.1 Kesimpulan ............................................................................................. 84
5.2 Saran ....................................................................................................... 84
DAFTAR PUSTAKA ........................................................................................... 85
MODUL IV “ANALISIS CLUSTER” ................................................................. 86
BAB I PENDAHULUAN ..................................................................................... 87
1.1 Latar belakang ........................................................................................ 87
1.2 Tujuan Praktikum ................................................................................... 89
1.3 Alat yang Digunakan .............................................................................. 89
1.4 Prosedur Praktikum ................................................................................ 89
BAB II LANDASAN TEORI ............................................................................... 92
2.1 Definisi Uji Cluster ................................................................................ 92
2.2 Tujuan Uji Cluster .................................................................................. 92
2.3 Ciri-ciri Cluster yang baik ...................................................................... 93
2.4 Metode Analisis Cluster ......................................................................... 93
2.5 SPSS (Statistical Product And Service Solutions) ................................. 94
2.6 WEKA (Waikato Environment for Knowledge Analysis) ...................... 94
BAB III PENGUMPULAN DAN PENGOLAHAN DATA ................................ 97
3.1 Pengumpulan Data ..................................................................................... 97
3.2 Pengolahan Data......................................................................................... 98
BAB IV PEMBAHASAN ................................................................................... 103
Data SPSS ....................................................................................................... 103
Data WEKA ..................................................................................................... 109
BAB V PENUTUP.............................................................................................. 115
5.1 Kesimpulan ........................................................................................... 115
5.2 Saran ..................................................................................................... 115
DAFTAR PUSTAKA ......................................................................................... 116

vi
vii
MODUL 1
“VISUALISASI DATA, UKURAN PEMUSATAN
DATA DAN PENYEBARAN DATA”

viii
BAB I
PENDAHULUAN

1.1 Latar Belakang

Statistika masa sekarang dapat dikatakan telah menyentuh semua


bidang ilmu pengetahuan, statistika secara prinsip mula-mula hanya mengurus
data yang dipakai lembaga-lembaga administratif dan pemerintahan. Statistik
memegang peranan yang penting dalam penelitian terutama metode penelitian
kuantitatif, statistik berperan baik dalam penyusunan model, perumusan
hipotesa, dalam pengembangan alat dan instrumen pengumpulan data, dalam
penyusunan desain penelitian, dalam penentuan sampel dan dalam analisa data.
Statistika menjadi alat yang penting untuk mengetahui seberapa besar maupun
tidak, sehingga industri dapat mengatur besarnya kebutuhan mereka. Aspek
penting agar mudah dalam memutuskan sebuah keputusan dibutuhkan data
yang mudah dipahami. Akan sangat menghabiskan waktu jika harus
memahami dan mencerna sebuah data yang diterima.
Visualisasi data dipakai untuk mempresentasikan data yang terstruktur
ataupun tidak dengan grafik atau bagan untuk menampilkan info yang
tersembunyi didalam data. Aplikasi pembuat data visual tidak hanya mengubah
data menjadi grafik, tapi juga melihat dunia dari sudut pandang data. Dengan
kata lain, objek data visual adalah data, dan yang sebenarnya kita mau ialah
menggunakan data sebagai suatu alat, dan menvisualisasi data tersebut untuk
menjelajah dunia.
Dalam konteks inilah, dibutuhkan sebuah penyajian data yang mudah
dipahami, dengan visualisasi data penyajian data sangat berkontribusi,
dengan sebuah syarat bahwa validitas data sudah tidak diragukan lagi.
Penyajian data biasanya dalam bentuk tabel memang cukup banyak dipakai,
namun terkadang tidak memudahkan pembaca untuk mengetahui segera apa
poin penting yang dapat disimpulkan dari kumpulan data yang
tersaji.Dibutuhkan sebuah visualisasi data dalam bentuk/format lainnya

1
seperti dalam bentuk sebuah gambar dari sebuah data dengan berbagai format
penyajian yang sesuai.
Alasan utama kenapa data visual sangatlah penting dikarenakan oleh
data yang ditampilkan secara visual memungkinkan banyak orang untuk
memahami data dengan lebih cepat. Mencari informasi dari data yang
bergunung-gunung tidaklah mudah, tetapi bagan dan grafik dapat
mempermudah pencarian informasi dengan cepat dan tepat.

1.2 Tujuan Praktikum


A. Visualisasi data
1. Mendeskripsikan data-data hasil observasi secara matematis dalam
bentuk tabel distribusi frekuensi atau pengelompokan data.
2. Menvisualisasikan tabel distribusi frekuensi, statistic lokasi dan statistic
sebaran dalam bentuk grafik dan histogram
B. Ukuran Pemusatan Dan Penyebaran Data
1. Mendeskripsikan data menggunakan ukuran pemusatan dan penyebaran
2. Menentukan ukuran pemusatan dan penyebaran kelompok data.

1.3 Alat Dan Bahan Yang Digunakan


A. Alat Yang Digunakan
1. Perangkat computer
2. Perangkat lunak pendukung komputasi Microsoft Excel
B. Bahan Yang Digunakan
1. Data hasil observasi tunggal dan kelompok
2. Kertas
3. Pulpen

1.4 Prosedur Praktikum


A. Visualisasi Data
1. Data Tunggal
a. Melakukan observasi
b. Membuat tabel distribusi frekuensi

2
1) Mengurutkan data dari nilai terkecil ke terbesar
2) Menentukan frekuensi masing-masing data
3) Menentukan persentase masing-masing data
c. Membuat Histogram
d. Membuat Bar Chart
e. Membuat Line Chart
f. Membuat Pareto Chart
g. Membuat Pie Chart
2. Data Kelompok
a. Melakukan observasi
b. Membuat tabel distribusi frekuensi
c. Membuat Histogram
d. Membuat Bar Chart
e. Membuat Line Chart
f. Membuat Pareto Chart
g. Membuat Pie Chart
B. Ukuran Pemusatan dan Penyebaran Data
1. Data Tunggal
a) Klik Menu Data – Data Analysis
b) Pilih Descriptive Statistik
c) Isi data Input Range (data mentah hasil observasi) pilih output range
dan ceklis Summary Statistik
2. Data Kelompok
a) Membuat tabel distribusi frekuensi
b) Mencari mean dengan cara membagi jumlah perkalian frekuensi
dengan nilai tengah lalu membaginya dengan jumlah frekuensi
c) Mencari median dengan cara mencari letak kelas median lalu
menghitung dengan menggunakan rumus median data kelompok
d) Mencari modus dengan cara melihat data yang memiliki frekuensi
tertinggi lalu dihitung dengan menggunakan rumus modus data
kelompok

3
e) Mencari kuartil dengan cara mencari letak kuartil yang ingin dicari
lalu dihitung dengan menggunakan rumus kuartil data kelompok
f) Mencari desil dengan cara mencari letak desil yang ingin dicari lalu
dihitung dengan menggunakan rumus desil data kelompok
g) Mencari persentil dengan cara mencari letak persentil yang ingin
dicari lalu dihitung dengan menggunakan rumus persentil data
kelompok
h) Mencari simpangan baku rata-rata dengan menggunakan rumus
simpangan baku rata-rata data kelompok
i) Mencari standar deviasi dengan menggunakan rumus standar deviasi
data kelompok.

4
BAB II
LANDASAN TEORI

2.1 Visualisasi Data


Visualisasi data adalah proses menggunakan elemen visual seperti
diagram, grafik, atau peta untuk merepresentasikan data. Visualisasi data
menerjemahkan yang kompleks, bervolume tinggi, atau numerik menjadi
representasi visual yang lebih mudah diproses. Alat visualisasi data
meningkatkan dan mengotomatiskan proses komunikasi visual untuk
mendapatkan akurasi dan detail. Anda dapat menggunakan representasi visual
untuk mengekstraksi wawasan yang dapat ditindak lanjuti dari data mentah.
Ketika suatu data telah dikumpulkan, maka data akan sulit digunakan
hingga data tersebut telah terorganisir dan ditampilkan dalam bentuk yang
membantu kita memahami informasi yang terkandung di dalamnya. Pada studi
ini, kita akan membahas bagaimana data mentah dikonversi ke distribusi
frekuensi dan menampilkannya secara visual sehingga memberikan kita
"gambaran besar" dari informasi dikumpulkan.
Dengan data yang terorganisasi, maka kita dapat mengidentifikasi
tren,pola,dan karakteristik lainnya yang tidak akan terlihat jelas pada data
mentah,atau kuesioner atau bentuk pengumpulan data lainnya. Peringkasan
data juga akan membantu kita membandingkan data yang telah dikumpulkan
di berbagai titik waktu dan peneliti yang berbeda, atau dari sumber yang
berbeda.Metode yang tepat untuk mewakili data akan tergantung pada apakah
variabel tersebut adalah bersifat kuantitatif atau kualitatif. Distribusi
frekuensi,histogram, tampilan stem-and-leaf, dotplot, dan diagram pencar yang
digunakan pada studi ini berlaku untuk data kuantitatif, sedangkan table
kontingensi digunakan terutama untuk jumlah yang melibatkan data kualitatif.

2.2 Jenis-jenis Visualisasi Data


a. Distribusi Frekuensi
Distribusi frekuensi merupakan rangkaian data angka menurut
kuantitasnya dan atau kualitasnya. Rangkaian data angka menurut

5
kuantitasnya disebut distribusi frekuensi kuantitatif, sebaliknya data yang
disusun menurut kualitasnya disebut distribusi frekuensi kualitatif. Data
mentah berarti data yang belum dimanipulasi atau diperlakukan dengan
carat tertentu melebihi keaslian mereka. Seperti kita ketahui, bahwa data
jenis tersebut tidak akan banyak memberikan arti.Untuk menyusun sebuah
distribusi frekuensi dari sebuah data mentah,maka dilakukan dengan cara
berikut:
1. Jangkauan data (range) sebanyak jarak nilai terendah dan tertinggi dari
Data.
𝑅 = 𝑛𝑖𝑙𝑎𝑖 𝑚𝑎𝑘𝑠𝑖𝑚𝑢𝑚 − 𝑛𝑖𝑙𝑎𝑖 𝑚𝑖𝑛𝑖𝑚𝑢𝑚
2. Kelas, merupakan tiap-tiap kategori dalam distribusi frekuensi.Tiap-tiap
kelas memiliki batas (atas dan bawah) nilai data. Batas atau rentang
kelas ini digunakan untuk menentukan nilai data yang masuk dalam
kategori kelas tersebut.
3. Jumlah kelas (Σ𝑘) yang dapat dibuat dari sejumlah data (𝑁) .Jumlah
kelas berhubungan erat dengan besarnya interval kelas, sifat data kasar
dan jumlah angka-angka yang ingin dikelompokkan ke dalam kelas-
kelas tersebut. Jumlah kelas tidak boleh terlalu banyak atau sedikit,
karena dapat menyebabkan distribusi frekuensi yang terbentuk tidak
mewakili gambaran data sebenarnya Sturges, memberikan pedoman
penentuan jumlah kelas menggunakan formulasi berikut:
∑ 𝑘 = 1 + 3.3 log 𝑁
4. Interval kelas (𝐶𝑖), merupakan lebar atau jangkauan tiap kelas. Besarnya
interval kelas bagi tiap-tiap kelas berhubungan erat dengan penentuan
jumlah kelas dan sebaiknya diusahakan agar sama semua dan
menggunakan bilangan yang praktis. Batas kelas adalah nilai-nilai yang
membatasi kelas yang satu dengan kelas yang lain. Batas bawah adalah
nilai-nilai yang terletak pada sebelah kiri dari masing- masing kelasnya,
sedangkan batas atas adalah sebelah kanan dari masing-masing
kelasnya.
𝑅
Ci=Σ𝑘

6
5. Distribusi Frekuensi Relatif, merupakan pendekatan untuk
mendeskripsikan proposi atau prosentase pada nilai data yang masuk
pada setiap kategori. Frekuansi relatif dapat berguna untuk
membandingkan dua buah kelompok kelas yang berbeda
ukurannya,dimana frekuensi actualnya akan cenderung lebih besar
untuk setiap kelas dengan jumlah yang lebih besar.
6. Distribusi Frekuensi Kumulatif, merupakan kumulatif dari nilai
distribusi frekuensi relatif (relative)
b. Histogram
Pada bidang statistik, histogram adalah tampilan grafis dari tabulasi
frekuensi yang digambarkan dengan grafis batangan sebagai manifestasi
data binning. Tiap tampilan batang menunjukkan proporsi frekuensi pada
masing-masing deret kategori yang berdampingan dengan interval yang
tidak tumpang tindih. Histogram menggambarkan distribusi frekuensi
dengan menggunakan rangkaian persegi panjang yang berdekatan, yang
masing-masing memiliki panjang sebanding dengan baik frekuensi atau
frekuensi relatif dari kelas yang diwakilinya.
c. Bar chart atau Diagram Batang
Bagan batang atau grafik batang adalah bagan atau grafik yang
menyajikan data kategorikal dengan batang persegi panjang dengan tinggi
atau panjang yang sebanding dengan nilai yang diwakilinya. Batang dapat
diplot secara vertikal atau horizontal. Bagan batang vertikal kadang-kadang
disebut bagan kolom.Seperti histogram, diagram batang mewakili frekuensi
sesuai dengan panjang relatif dari serangkaian persegi panjang. Hanya saja
terdapat dua hal yang membedakan dengan histogram:
1. Histogram digunakan dalam merepresentasikan data kuantitatif,
sedangkan bar chart adalah data kualitatif.
2. Ada histogram, persegi panjang yang terbentuk mewakili kelas saling
berdekatan atau tidak ada jeda diantara mereka, sedangkan pada bar
chart memiliki jarak di antara mereka.Bar chart digunakan untuk

7
memvisualisasikan data yang bersitaf deskrit,dimana antara satu data
dengan data yang lain tidak saling berhububungan secara urut dalam
lini waktu.
d. Diagram Garis (Line chart)
Grafik garis atau diagram garis merupakan suatu grafik yang
berupa garis lurus yang menghubungkan titik tengah suatu data dengan
data yang lainnya. Grafik garis biasanya digunakan untuk menunjukan
data yang berkesinambungan,Dalam diagram garis waktu biasanya
ditempatkan pada sumbu datar (sumbu X) dan nilai data pada sumbu
tegak (sumbu Y) sehingga diperoleh titik-titik koordinat. Jika titik-titik
yang berturutan dihubungkan oleh garis lurus, maka akan diperoleh
diagram garis.Line chart mampu secara simultan menunjukkan nilai-
nilai dari dua variabel kuantitatif (variabel 𝑦, atau sumbu vertikal, dan
variabel 𝑥 atau sumbu horizontal) dimana terdiri dari segmen linier
menghubungkan titiktitik yang diamati atau diukur untuk masing-
masing variable.Kelebihan Diagram garis biasanya digunakan untuk
menaksir atau memperkirakan data berdasarkan pola-pola yang telah
diperoleh.Diagram garis ada yang tunggal dan majemuk, diagram garis
majemuk yaitu dalam satu gambar terdapat lebih dari satu garis.
Diagram garis majemuk biasanya digunakan untuk membandingkan
dua keadaan atau lebih yang mempunyai hubungan. Dan Kekurangan
Hanya digunakan untuk data yang berkala,tidak bisa data yang
lainnya.Harus sangat teliti dalam membaca diagram ini.
e. Pareto chart
Diagram Pareto merupakan salah satu dari tujuh alat gugus mutu
yang sering digunakan dalam hal pengendalian Mutu. Pada dasarnya,
Diagram Pareto adalah grafik batang yang menunjukkan masalah
berdasarkan urutan banyaknya jumlah kejadian. Urutannya mulai dari
jumlah permasalahan yang paling banyak terjadi sampai yang paling
sedikit terjadi. Dalam Grafik, ditunjukkan dengan batang grafik
tertinggi (paling kiri) hingga grafik terendah (paling kanan).Terkait

8
erat dengan histogram, poligon frekuensi terdiri dari segmen garis yang
menghubungkan titik-titik yang dibentuk oleh perpotongan tanda kelas
dengan frekuensi kelas. Frekuensi relatif atau persentase juga dapat
digunakan untuk membuat grafik. Kelas kosong disertakan di setiap
akhir kelas sehingga kurva akan memotong sumbu horisontal.
f. Pie chart atau Diagram Pie
Diagram lingkaran adalah sebuah diagram berbentuk lingkaran yang
dibagi menjadi irisan-irisan untuk menggambarkan proporsi numerik.
Dalam sebuah diagram lingkaran, panjang busur setiap irisan, proporsional
dengan kuantitas yang diwakilinya.Seperti namanya, pie chart digunakan
untuk merepresentasi data dengan menggambarkannya menyerupai kue pie
yang berbentu bundar. Pie chart memiliki tampilan melingkar yang terbagi
atau dipotong-potong menjadi beberapa bagian berdasarkan baik jumlah
observasi atau nilai-nilai relatif dari segmen.

2.3 Ukuran Pemusatan Data


Ukuran pemusatan data adalah sembarang ukuran yang menunjukkan
pusat segugus data, yang telah diurutkan dari yang terkecil sampai yang
terbesar atau sebaliknya dari yang terbesar sampai yang terkecil.Ukuran
Pemusatan Data merupakan salah satu pengukuran data dalam statistika.
Ukuran Pemusatan data teridiri dari penghitungan rata-rata (Mean), nilai
tengah (Median), dan nilai yang sering muncul (Modus). Untuk memudahkan
dalam memahami materi ukuran pemusatan data ini, sebaiknya kita membaca
dulu materi "Statistika Secara Umum" dan materi "Statistika: Penyajian Data".
Berikut penjelasan masing-masing. Ada beberapa jenis-jenis ukuran
pemusatan data antara lain :
a. Rata-rata hitung / Mean
Ada beberapa macam mean dalam matematika, khususnya dalam
statistika. Setiap rata-rata berfungsi untuk meringkas kelompok data
tertentu, seringkali untuk lebih memahami nilai keseluruhan dari kumpulan
data tertentu. Rata-rata Pythagoras terdiri dari rata-rata aritmatika, rata-rata

9
geometris, dan rata-rata harmonik. Dalam kegiatan penelitian, rata-rata
(mean) mempunyai kedudukan yang penting dibandingkan ukuran gejala
pusat lainnya. Hampir setiap kegiatan penelitian ilmiah selalu menggunakan
rata-rata (mean).
1. Data tunggal dengan seluruh skornya berfrekuensi satu
Σ𝑥𝑖
𝑥̅ =
𝑛
Dimana Xi = Data ke-i
n = jumlah data
2. Data kelompok (dalam distribusi frekuensi)
Σ𝑓𝑖𝑋𝑖 Σ𝑓𝑖𝑋𝑖
𝑥̅ = =
𝑁 Σ𝑓𝑖

b. Modus (Mo)
Modus adalah nilai yang paling sering muncul dalam suatu data
statistika. Modus juga merupakan nilai mayoritas atau nilai dengan
frekuensi paling tinggi. Modus dapat digunakan untuk menentukan sampel
dari suatu populasi dalam statistika.Modus tidak harus tunggal, artinya
nilainya bisa lebih dari satu. Adapun cara mencari modus untuk data tunggal
tinggal dilihat frekuensinya. Untuk data dalam daftar distribusi frekuensi.
𝐷1
Mo = Tb + (𝐷1+𝐷2) x Ι

Keterangan :
B = Batas bawah kelas modus sebanyak kelas interval dengan frekuens
terbanyak
I = Panjang interval kelas modus
D1 = Frekuensi kelas modus dikurangi frekuensi kelas sebelum kelas modus
D2 = Frekuensi kelas modus dikurangi frekuensi kelas sesudah kelas modus

c. Median (Me)

10
Median adalah nilai yang dapat membagi data menjadi dua bagian yang
sama. Dengan catatan, bahwa data harus diurutkan terlebih dahulu dari yang
terkecil ke yang terbesar.
1. Data tunggal
𝑁+1
M= 2

Keterangan :
N = Jumlah frekuensi
2. Data kelompok
1
𝑛−𝐹𝐾𝑆
2
Me = B + 𝑓𝑀𝑒

Keterangan :
B = batas bawah kelas median
I = panjang kelas median
N = jumlah frekuensi
FKS = jumlah frekuensi kumulatif sebelum kelas median
fMe= frekuensi kelas median

2.4 Ukuran Penyebaran Data


Dengan menentukan pemusatan data dan ukuran letak data ternyata belum
cukup untuk memberikan gambaran yang jelas dari suatu data. Pada
pengukuran statistika, selain ukuran pemusatan dan ukuran letak, juga ada
Ukuran Penyebaran Data. Ukuran penyebaran data adalah ukuran yang
menunjukkan seberapa jauh data suatu menyebar dari rata- ratanya. Pada
ukuran penyebaran data, kita akan mempelajari materi Jangkauan (Range),
Simpangan, Ragam (Variance), ukuran penyebaran pada nilai kuartil, dan
Pencilan (Outlier).
Ukuran penyebaran data adalah suatu ukuran yang menyatakan seberapa
besar nilai-nilai data berbeda atau bervariasi dengan nilai ukuran pusatnya atau
seberapa besar penyimpangan nilai-nilai data dengan nilai pusatnya.

11
a. Jangkauan (range)
Range adalah salah satu ukuran statistik yang menunjukan jarak
penyebaran data antara nilai terendah (Xmin) dengan nilai tertinggi (Xmax).
Ukuran ini sudah digunakan pada pembahasan daftar distribusi frekuensi.
Range = nilai maksimum - nilai minimum.

b. Simpangan Rata-rata (mean deviation)


Simpangan rata-rata merupakan penyimpangan nilai-nilai individu dari
nilai rata-ratanya. Rata-rata bisa berupa mean atau median. Untuk data
mentah simpangan rata-rata dari median cukup kecil sehingga simpangan
ini dianggap paling sesuai untuk data mentah. Namun pada umumnya,
simpangan rata-rata yang dihitung dari mean yang sering digunakan untuk
nilai simpangan rata-rata.
1. Data tunggal dengan seluruh skornya berfrekuensi lebih dari satu
∑𝑛
𝑖 =1𝑓|𝑋𝑖 − 𝑥̅ |
SR = 𝑛

Dimana xi merupakan nilai data

2. Data tunggal sebagian atau seluluh skornya berfrekuensi lebih dari satu
Σ𝑛 ̅ |𝑖
𝑖=1𝑓|𝑥𝑖 − 𝑥
SR = Σ𝑛
𝑖=1𝑓𝑖

Dimana xi merupakan nilai data


3. Data kelompok (dalam distribusi frekuensi)
Σ𝑛 ̅|
𝑖=1𝑓𝑖|𝑥𝑖 − 𝑥
SR = Σ𝑛
𝑖=1𝑓𝑖

Dimana xi merupakan tanda kelas dari interval ke-i dan fi merupakan


frekuensi interval ke-i.

c. Simpangan baku (Standard deviation)


Standar deviasi merupakan ukuran penyebaran yang paling banyak
digunakan. Semua gugus data dipertimbangkan sehingga lebih stabil
dibandingkan dengan ukuran lainnya. Namun, apabila dalam gugus data

12
tersebut terdapat nilai ekstrem, standar deviasi menjadi tidak sensitif lagi,
sama halnya seperti mean.Standar Deviasi memiliki beberapa karakteristik
khusus lainnya. SD tidak berubah apabila setiap unsur pada gugus datanya
di tambahkan atau dikurangkan dengan nilai konstan tertentu. SD berubah
apabila setiap unsur pada gugus datanya dikali/dibagi dengan nilai konstan
tertentu.Bila dikalikan dengan nilai konstan, standar deviasi yang dihasilkan
akan setara dengan hasil kali dari nilai standar deviasi aktual dengan
konstan.
S = √𝑆 2

d. Varians (variance)
Dalam teori probabilitas dan statistika, varians atau ragam suatu
peubah acak adalah ukuran seberapa jauh sebuah kumpulan bilangan
tersebar. Varians nol mengindikasikan bahwa semua nilai sama.Varians
dapat menggambarkan bagaimana berpencarnya suatu data kuantitatif.
Varians diberi symbol,σ2 (baca: sigma kuadrat) untuk populasi dan untuk
s2 sampel.Selanjutnya kita akan menggunakan simbol s2 untuk varians
karena umumnya kita hampir selalu berkutat dengan sampel dan jarang
sekali berkecimpung dengan populasi. teknik statistik yang digunakan untuk
menjelaskan homogenitas kelompok Varians merupakan jumlah kuadrat
semua deviasi nilai-nilai individual terhadap rata-rata kelompok. Akar
varians = standar deviasi atau simpangan baku.

1
𝑆 2 =𝑁−1 Σ𝐹𝑖(𝑀𝑖 − 𝑥̅ )2

Keterangan :
N = jumlah frekuensi
Fi = frekuensi kelas
Mi = nilai tengah kelas
𝑥̅ = nilai rata-rata

e. Koefisien variasi (coefficient of variation)

13
Dalam teori dan statistik probabilitas, koefisien variasi, juga dikenal
sebagai deviasi standar relatif, adalah ukuran dispersi standar dari distribusi
probabilitas atau distribusi frekuensi. Ini sering dinyatakan sebagai
persentase, dan didefinisikan sebagai rasio simpangan baku \sigma terhadap
rata-rata \mu. digunakan untuk membandingkan suatu distribusi data yang
mempunyai satuan yang berbeda. Kalau kita membandingkan berbagai
variansi atau dua variabel yang mempunyai satuan yang berbeda maka tidak
dapat dilakukan dengan menghitung ukuran penyebaran yang sifatnya
absolut.Besarnya koefisien variasi akan berpengaruh terhadap kualitas
sebaran data.

𝑠𝑖𝑚𝑝𝑎𝑛𝑔𝑎𝑛 𝑏𝑎𝑘𝑢
KV = x 100 %
𝑟𝑎𝑡𝑎−𝑟𝑎𝑡𝑎

14
BAB III
PENGUMPULAN DAN PENGOLAHAN DATA

3.1 Pengumpulan Data


a. Melakukan Observasi
Berikut adalah hasil observasi data Suhu udara 2 minggu pertama di bulan
Februari 2020 di Labuan Bajo Pulau Flores (C0)
Tabel 3.1 Hasil Observasi Data Suhu Udara 2 Minggu Pertama Dibulan Februari
2020 Di Labuan Bajo Pulau Flores (C0)

Hari Labuan Bajo

1 27,3
2 26,8
3 27,3
4 27,3
5 27
6 26,8
7 26
8 25,9
9 26,8
10 27,3
11 28,5
12 28,5
13 20,4
14 20,4
15 20,4
16 26
17 20,4
18 20,4
19 27
20 27
21 20,4
22 26
23 26
24 25,9

15
b. Data Kelompok
Berikut ini adalah data Frekuensi dan Produksi Padi Sawah di
Kecamatan Barru pada Tahun 2010-2023 (Kg).
Tabel 3.2 Produksi Padi Di Kecamatan Barru Pada Tahun 2010-2023
Panen Produksi Padi
1 68,56
2 68,56
3 63,53
4 68,56
5 63,53
6 68,56
7 63,53
8 68,53
9 70,05
10 65,04
11 68,56
12 65,04
13 70,05
14 70,05
15 78,65
16 65,04
17 65,04
18 78,65
19 70,05
20 58,49
21 58,49
22 77,19
23 77,19
24 78,65
25 85,04
26 85,04
27 78,65
28 70,05
29 58,49
30 58,49

16
3.2 Pengolahan Data
A. Visualisasi Data
1. Data Tunggal
a. Distribusi frekuensi

Table 3.3 distribusi frekuensi data tunggal


Nilai Suhu Frekuensi Persentase
20,4 6 25%
25,9 2 8%
26 4 17%
26,8 3 13%
27 3 13%
27,3 4 17%
28,5 2 8%
N 24

b. Histogram

Data Frekuensi dari Suhu udara 2 minggu


pertama di bulan Februari 2023 di Labuan Bajo
Pulau Flores (CO)
10
Frekuensi

0
28,5 27,3 27 26,8 26 25,9 20,4
Suhu Udara

Gambar 3.1 Histogram Data Tunggal

17
c. Bar Chart
Data Frekuensi dari Suhu udara 2 minggu pertama
di bulan Februari 2023 di Labuan Bajo Pulau
Flores (CO)

7 6 20,4
2 25,9
5 4 26
3 26,8
3 3 27
4 27,3
1 2 28,5
0 5 10 15 20 25 30

Frekuensi Nilai Suhu

Gambar 3.2 Bar Chart Data Tunggal


d. Line Chart

Data Frekuensi dari Suhu udara 2 minggu


pertama di bulan Februari 2023 di Labuan Bajo
Pulau Flores (CO)
8

6 6

4 4 4
3 3 Frekuensi
2 2 2

0
20,4 25,9 26 26,8 27 27,3 28,5

Gambar 3.3 Line Chart Data Tunggal

18
e. Pareto Chart

Data Frekuensi dari Suhu udara 2 minggu


pertama di bulan Februari 2023 di Labuan Bajo
Pulau Flores (CO)
30

20
Nilai Suhu
10 Frekuensi
0
20,4 25,9 26 26,8 27 27,3 28,5
Gambar 3.4 Pareto Chart Data Tunggal

f. Pie Chart

Data Frekuensi dari Suhu udara 2 minggu pertama


di bulan Februari 2023 di Labuan Bajo Pulau Flores
(CO)
8% 20,4
25,9
17% 25%
26
13% 8% 26,8
13% 17% 27
27,3

Gambar 3.5 Pie Chart Data Tunggal


2. Data Kelompok
a. Distribusi Kelompok
Tabel 3.4 Distribusi frekuensi data kelompok
KELAS INTERVAL NILAI TENGAH TEPI KELAS FREKUENSI FREKUENSI KUMULATIF PERSENTASE PERSENTASE KUMULATIF
KELAS 1 58,49-62,49 60,49 58,49-62,49-60,49 4 4 13% 13%
KELAS 2 63,49-67,49 65,49 63,49-67,49-65,49 7 11 23% 37%
KELAS 3 68,49-72,49 70,49 68,49-72,49-70,49 11 22 37% 73%
KELAS 4 73,49-77,49 75,49 73,49-77,49-75,49 2 24 7% 80%
KELAS 5 78,49-82,49 80,49 78,49-82,49-80,49 4 28 13% 93%
KELAS 6 83,49-87,49 85,49 83,49-87,49-85,49 2 30 7% 100%
N 30

19
b. Histogram
DATA FREKUENSI DAN PRODUKSI PADI SAWAH
DI KECAMATAN BARRU PADA TAHUN 2010-2023
(KG)
12 11 120%

FREQUENCY
10 100% 100%
93%
8 7 80% 80%
73% Frequency
6 4 4 60%
4 37% 2 2 40%
FREKUENSI
2 0 20% KUMULATIF
13%
0 0%

Gambar 3.6 Histogram Data Kelompok


c. Bar Chart

DATA FREKUENSI DAN PRODUKSI PADI


SAWAH DI KECAMATAN BARRU PADA TAHUN
2010-2023 (KG)

4 60,49
5 7 65,49
11 70,49
3 2 75,49
4 80,49
1 2 85,49
0 20 40 60 80 100

FREKUENSI NILAI TENGAH

Gambar 3.7 Bar Chart Data Kelompok

20
d. Line Chart

DATA FREKUENSI DAN PRODUKSI PADI


SAWAH DI KECAMATAN BARRU PADA
TAHUN 2010-2023 (KG)
20 11
7
10 4 2 4 2
0
60,49 65,49 70,49 75,49 80,49 85,49

FREKUENSI

Gambar 3.8 Line Chart Data Kelompok

e. Pareto Chart

DATA FREKUENSI DAN PRODUKSI PADI SAWAH


DI KECAMATAN BARRU PADA TAHUN 2010-2023
(KG)
100

50

0
85,49 80,49 75,49 70,49 65,49 60,49

NILAI TENGAH FREKUENSI

Gambar 3.9 Pareto Chart Data Kelompok


f. Pie Chart

DATA FREKUENSI DAN PRODUKSI PADI SAWAH DI


KECAMATAN BARRU PADA TAHUN 2010-2023 (KG)

7%

13%
13%
7% 23%

37%

60,49 65,49 70,49 75,49 80,49 85,49

Gambar 3.10 Pie Chart Data Kelompok

21
B. Ukuran Pemutusan Dan Penyebaran Data
1. Data Tunggal

Tabel 3.5 Ukuran pemusatan dan penyebaran data tunggal


Labuan bajo
Mean 25,24166667
Standard Error 0,599755888
Median 26,4
Mode 20,4
Standard Deviation 2,938191793
Sample Variance 8,632971014
Kurtosis -0,675460253
Skewness -1,022723003
Range 8,1
Minimum 20,4
Maximum 28,5
Sum 605,8
Count 24

Berdasarkan Hasil Pengolahan Data,Di Dapat Nilai Mean Pada


Data Tunggal yaitu 25,24166667, Nilai Median Pada Data Tunggal
yaitu 26,4; Nilai Modus Pada Data Tunggal yaitu 20,4, Range Pada
Data Tunggal yaitu 8,1; Nilai Maksimum Pada Data Tunggal yaitu
28,5 dan Nilai Minimum Pada Data Tunggal yaitu 20,4.

22
2. Data Kelompok

Tabel 3.6 Ukuran pemusatan dan penyebaran data kelompok


produksi padi
Mean 69,51166667
Standard Error 1,362208407
Median 68,56
Mode 68,56
Standard Deviation 7,461122724
Sample Variance 55,6683523
Kurtosis -0,386047285
Skewness 0,452482368
Range 26,55
Minimum 58,49
Maximum 85,04
Sum 2085,35
Count 30

Berdasarkan Hasil Pengolahan Data,Di Dapat Nilai Mean Pada Data


Kelompok = 69,51166667,Nilai Median Pada Data Kelompok =
68,55,Nilai Modus Pada Data Kelompok = 68,56,Range Pada Data
Kelompok = 26,55,Nilai Maksimum Pada Data Kelompok = 85,04,Dan
Nilai Minimum Pada Data Kelompok = 58,49.

a. Nilai maksimun
Nilai maksimum atau nilai tetinggi untuk data kelompok berdasarkan
data mentah ialah = 85,04.
b. Nilai minimum
Nilai manimum atau nilai terendah untuk data kelompok berdasarkan
data mentah ialah = 58,49
c. Range
R = Xmax – Xmin
= 85,04 – 58,49
=26,55
d. Jumlah kelas

23
K = 1 + 3,33 Log n
= 1 + 3,33 Log 30
=6
e. Interval
𝑅 26,55
𝐼= = =5
𝐾 6

f. Distribusi Frekuensi

Tabel 3.7 Distribusi frekuensi data kelompok untuk ukuran


pemusatan dan penyebaran data
Interval (Mi) Tepi Kelas (Fi) FK Fi x Mi 𝑀𝑖 − 𝑋̅ (Mi -x ̅)^2 Fi (Mi-x)^2
58,49-62,49 60,49 57,99-62,99 4 4 241,96 -10,17 103,36 413,44
63,49-67,49 65,49 62,99-67,99 7 11 458,43 -5,17 26,69 186,86
68,49-72,49 70,49 67,99-72,99 11 22 775,39 -0,17 0,03 0,31
73,49-77,49 75,49 72,99-77,99 2 24 150,98 4,83 23,36 46,72
78,49-82,49 80,49 77,99-82,99 4 28 321,96 9,83 96,69 386,78
83,49-87,49 85,49 82,99-87,99 2 30 170,98 14,83 220,03 440,06
Σ 30 2119,7 1474,17

g. Mean
∑ 𝐹𝑖𝑀𝑖
𝑥̅ = 𝑁
2119,7
𝑥̅ = 30

𝑥̅ = 70,66
h. Modus
Letak modus berada pada kelas ke 3 dengan jumlah frekuensi 11
𝑑1
Mo = B +𝑑 I
2−𝑑1

4
Mo = 67,99 +9+45

Mo = 69,53
i. Median
𝑛 30
Letak Median = 2 = = 15 maka median berada pada kelas ke -3
2
1
𝑛−𝐹𝐾𝑆
2
Me = B + I
𝑓𝑚𝑒
15−11
Me = 67,99 + 11
5

24
Me = 69,81
j. Kuartil
1) Kuartil 1
𝑛 30
Letak kelas Q1 = 4 = = 7,5, maka kuarti 1 berada pada kelas
4

ke-3
𝑛
−𝐹𝐾𝑆
4
𝑄𝑖= 𝐵 + I
𝑓
30
−4
4
𝑄1 = 67,99 + 5
11
7,5−4
𝑄1 = 67,99 + 5
11

𝑄1 = 69,58
2) Kuartil 3

3𝑛 3(30)
Letak kelas 𝑄3 = = = 22,5, maka kuarti 3 berada pada kelas
4 4

ke-4
3𝑛
−𝐹𝐾𝑆
4
𝑄𝑖 = 𝐵 + I
𝑓
3(30)
−22
4
𝑄1 = 72,99 + 5
2
22,5−22
𝑄1 = 72,99 + 5
2

𝑄1 = 74,24
k. Desil
1) Desil 3
𝑖𝑥𝑛 3 𝑥 30
Letak kelas 𝐷3 = = = 9, maka desil 3 berada pada kelas
10 10

ke-2

3𝑛
−𝐹𝐾𝑆
10
𝐷𝑖 = 𝐵 + I
𝑓
3(30)
−4
10
𝐷3 = 57,99 + 5
7
9−4
𝐷3 = 72,99 + 5
7

25
𝐷3 = 66,56
2) Desil 5
𝑖𝑥𝑛 5 𝑥 30
Letak kelas 𝐷5 = = = 15, maka desil 5 berada pada kelas
10 10

ke-3

5𝑛
−𝐹𝐾𝑆
10
𝐷𝑖 = 𝐵 + I
𝑓
5(30)
−11
10
𝐷5 = 67,99 + 5
11
9−11
𝐷5 = 62,99 + 5
11

𝐷5 = 69,81
3) Desil 9
𝑖𝑥𝑛 9 𝑥 30
Letak kelas 𝐷9 = = = 27, maka desil 9 berada pada kelas
10 10

ke-4

9𝑛
−𝐹𝐾𝑆
10
𝐷𝑖 = 𝐵 + I
𝑓
9(30)
−24
10
𝐷9 = 77,99 + 5
4
27−24
𝐷9 = 77,99 + 5
4

𝐷9 = 81,74
l. Persentil 33
𝑖𝑥𝑛 33 𝑋 30
1) Letak kelas P33 = = = 9,9, maka persentil 33 berada
100 100

pada kelas ke-2


33𝑛
−𝐹𝐾𝑆
100
𝑃𝑖 = 𝐵 + I
𝑓
33(30)
−4
100
𝑃33 = 62,99 + 5
7
9,9−4
𝑃33 = 62,99 + 5
7

𝑃33 = 67,20
2) Persentil 66

26
𝑖𝑥𝑛 66 𝑋 30
Letak kelas P66 = = = 19,8, maka persentil 66 berada
100 100

pada kelas ke-3


66𝑛
−𝐹𝐾𝑆
100
𝑃𝑖 = 𝐵 + I
𝑓
66(30)
−11
100
𝑃66 = 67,99 + 5
11
19,8−11
𝑃66 = 67,99 + 5
11

𝑃66 = 71,99
3) Persentil 89
𝑖𝑥𝑛 89 𝑋 30
Letak kelas P89 = = = 26,7, maka persentil 89 berada
100 100

pada kelas ke-4


89𝑛
−𝐹𝐾𝑆
100
𝑃𝑖 = 𝐵 + I
𝑓
89(30)
−24
100
𝑃89 = 77,99 + 5
4
26,7−24
𝑃89 = 77,99 + 5
4

𝑃89 = 81,37
m. Simpangan Rata-rata (Variansi)
∑ 𝑓𝑖 (𝑀𝑖− 𝑥̅ )2
𝑆2 = 𝑁
1474,17
𝑆2 =
30
𝑆 2 = 43,14
n. Simpangan Baku (Standar Deviation)

𝑆 = √𝑆 2
𝑆 = √7,461122724 x 7,461122724
𝑆 = √55,668
𝑆 = 7,46
Berdasarkan pengolahan data, diperoleh nilai mean pada data
kelompok = 70,66; nilai median pada data kelompok = 69,81; nilai
modus pada data kelompok = 69,53; nilai kuartil 1 pada data kelompok

27
= 69,58; nilai kuartil 3 pada data kelompok = 74,24; nilai desil 3 pada
data kelompok = 66,56; nilai desil 5 pada data kelompok = 69,81; nilai
desil 9 pada data kelompok = 81,74; nilai persentil 33 pada data
kelompok = 67,20; nilai persentil 66 pada data kelompok = 71,29; nilai
persentil 89 pada data kelompok = 81,37; nilai simpangan rata-rata
(variansi) pada data kelompok = 43,14;nilai simpangan baku pada data
kelompok = 7,46.

28
BAB IV
PEMBAHASAN

4.1 Visualisasi Data


A. Analisis metode Visualisasi Data
1. Distribusi Frekuensi
Distribusi frekuensi merupakan gambaran data kuantitatif atau
pengelompokkan data suhu udara 2 minggu pertama di bulan Februari
2023 di labuan bajo pulau flores (CO) didominasi oleh suhu 20,4
dengan presentase 25% terjadi sebanyak 6 kali,lalu dilanjutkan dengan
suhu 26 dengan presentase 8% terjadi sebanyak 4 kali,dan seterusnya.

2. Histogram
Histogram merupakan gambaran grafik yang menampilkan kelas
pada sumbu horizontal dan frekuensi kelas pada sumbu vertikal. Dari
hasil visualisasi data dengan menggunakan metode histogram dapat
disimpulkan bahwa Suhu udara 2 minggu pertama di bulan Februari
2023 di labuan bajo pulau flores (CO) didominasi oleh suhu 20,4
dengan presentase 25% terjadi sebanyak 6 kali,lalu dilanjutkan dengan
suhu 26 dengan presentase 8% terjadi sebanyak 4 kali,dan seterusnya.

3. Bart Chart
Bart Chart merupakan sebuah diagram yang menunjukkan data
spesifik dengan perbandingan jumlah, waktu, atau nama elemen yang
dibandingkan. Dari hasil visualisasi data dengan menggunakan metode
bart chart dapat disimpulkan bahwa Suhu udara 2 minggu pertama di
bulan Februari 2023 dilabuan bajo pulau flores (CO) didominasi oleh
suhu 20,4 dengan presentase 25% terjadi sebanyak 6 kali,lalu
dilanjutkan dengan suhu 26 dengan presentase 8% terjadi sebanyak 4
kali,dan seterusnya.

29
4. Line Chart
Line chart adalah grafik berbentuk garis. Line chart
merupakan grafik garis yang menampilkan kurs penutupan saja, tanpa
melibatkan kurs tertinggi, terendah, dan pembukaan. Satu nilai kurs
penutupan mewakili satu periode. Dari hasil visualisasi data dengan
menggunakan metode Line chart dapat disimpulkan bahwa suhu
udara 2 minggu pertama di bulan Februari 2023 dilabuan bajo pulau
flores (CO) didominasi oleh suhu 20,4 dengan presentase 25% terjadi
sebanyak 6 kali,lalu dilanjutkan dengan suhu 26 dengan presentase
8% terjadi sebanyak 4 kali,dan seterusnya.

5. Pareto Chart
Pareto Chart adalah sebuah diagram batang yang dipadukan
dengan diagram garis untuk merepresentasikan suatu parameter yang
di ukur (bisa berupa frekuensi kejadian atau nilai tertentu) sehingga
dapat diketahui parameter dominan. Diagram batang menunjukan
nilai aktual sedangkan diagram garis menunjukkan nilai prosentase
kumulatif dari setiap parameter yang ditinjau. Dari hasil visualisasi
data dengan menggunakan metode Pareto chart dapat disimpulkan
bahwa Suhu udara 2 minggu pertama di bulan Februari 2023 dilabuan
bajo pulau flores (CO) didominasi oleh suhu 20,4 dengan presentase
25% terjadi sebanyak 6 kali,lalu dilanjutkan dengan suhu 26 dengan
presentase 8% terjadi sebanyak 4 kali,dan seterusnya.

6. Pie Chart
Pie chart atau diagram lingkaran merupakan grafik statistik
berbentuk lingkaran yang dibagi menjadi beberapa irisan dan luasnya
bergantung kepada proporsi numerik atau kuantitas dari data yang
dimiliki. Satu lingkaran menunjukkan bagian utuh atau seratus persen.
Setengah lingkaran menunjukkan proporsi setengah dari total atau
lima puluh persennya, dan seterusnya. Dari hasil visualisasi data

30
dengan menggunakan metode Pie chart dapat disimpulkan bahwa
Suhu udara 2 minggu pertama di bulan Februari 2023 dilabuan bajo
pulau flores (CO) didominasi oleh suhu 20,4 dengan presentase 25%
terjadi sebanyak 6 kali,lalu dilanjutkan dengan suhu 26 dengan
presentase 8% terjadi sebanyak 4 kali,dan seterusnya.

B. Hasil Analisis Perbedaan Penggunaan Metode Visualisasi


Distibusi data mengambarkan tentang sebuah tabel yang
menunjukkan nilai atau suhu udara yang terjadi di labuan bajo pulau flores
(CO) pada 2 minggu pertama di bulan Februari 2023, lalu ada juga nilai
frekuensi atau suhu udara yang sama nilainya, dan yang terakhir adalah
persentase dari suhu udara tersebut. Visualisasi data tunggal dengan
metode Histogram memberikan gambaran peningkatan frekuensi suhu
udara selama 2 minggu pertama di bulan Februari 2023 dan dengan
histogram kita bisa menentukan prioritas frekuensi dari data Suhu Udara 2
minggu pertama di labuan bajo pulau flores (CO), Sedangkan Bar Chart
memberikan dua gambaran secara langsung dengan Bar Chart dapat
dilihat perbedaan nilai suhu serta peningkatannya yang diikuti dengan
frekuensi masing-masing nilai suhu. Line Chart memberikan gambarkan
naik turunya frekuensi yang terjadi pada suhu udara di Larantuka Pulau
Flores selama dua minggu di bulan februari. Pareto Chart mengambarkan
tentang Suhu Udara yang paling besar atau tinggi dari beberapa suhu udara
dan memperlihatkan juga naik turunya frekuensi yang ada di labuan bajo
pulau flores (CO) selama 2 minggu pertama dibulan februari 2023, Pie
Chart memberi gammbaran perentase yang terjadi pada suhu udara di
labuan bajo pulau flores (CO) di 2 minggu pertama dibulan februari 2023
yang berbentuk lingkaran.

31
4.2 Visualisasi Data Kelompok
A. Analisis metode Visualisasi data
1. Distribusi Frekuensi
Distribusi frekuensi pengelompokkan data Produksi padi sawah
dikecamatan barru pada tahun 2010-2023 (Kg), Memiliki jumlah
kelas yaitu 6 dan interval yang disimbolkan Ci yaitu 5, nilai
maximumnya yaitu 85,04, sedangkan nilai minimum yaitu 58,49 dan
nilai R yaitu 26,65.
2. Histogram
Histogram menggambarkan distribusi frekuensi dengan
menggunakan rangakian persegi panjang yang berdekatan. Dari
hasil visualisasi data menggunakan metode ini dapat disimpulkan
bahwa Produksi padi sawah dikecamatan barru pada tahun 2010-
2023 (Kg) didominasi oleh jumlah produksi sebesar 72,49 terjadi
sebanyak 11 kali selama tahun 2010-2023, dan jumlah produk sawah
terendah berjumlah 87,49 terjadi sebanyak 2 kali.
3. Bart Chart
Dari hasil visualisasi data dengan menggunakan metode bart
chart dapat disimpulkan bahwa Produksi padi sawah dikecamatan
barru pada tahun 2010-2023 (Kg) memiliki jumlah frekuensi
sebanyak 30, yang dimana produksi padi tertinggi berjumlah 85,49
terjadi sebanyak 2 kali.
4. Line Chart
Grafik garis atau line Chart adalah grafik yang menggunakan
titik sebagai poin data dan kemudian titik tersebut disambung
dengan titik berikutnya. Grafik ini merupakan salah satu grafik yang
paling sering digunakan setelah grafik batang. Dari hasil visualisasi
data dengan menggunakan metode Line chart dapat disimpulkan
bahwa Produksi padi sawah dikecamatan barru pada tahun 2010-
2023 (Kg) Pada produksi padi sawah yang berjumlah 70,49 dapat di

32
lihat pada gambar bahwa frekuensi padi sawah sangat tinggi yaitu 11
di bandingkan produksi padi lainnya.
5. Pareto Chart
Diagram Pareto adalah grafik batang yang menunjukkan
masalah berdasarkan urutan banyaknya jumlah kejadian. Urutannya
mulai dari jumlah permasalahan yang paling banyak terjadi sampai
yang paling sedikit terjadi. Dari hasil visualisasi data dengan
menggunakan metode Pareto chart dapat disimpulkan disimpulkan
bahwa Produksi padi sawah dikecamatan barru pada tahun 2010-
2023 (Kg) dapat di lihat pada gambar pareto chart nya yaitu pada
line pertama produksi padi memiliki jumlah produksi tertinggi
hingga sampai ke line ke 6 maka dapat dilihat produksi padi
menurun yaitu berjumlah 60,49.
6. Pie Chart
Pie chart digunakan digunakan untuk menampilkan total
persentase yang harus mencapai 100%, dimana setiap potongan pie
akan menampilkan ukuran tertentu. Bentuk lingkaran dengan cepat
mengaktifkan intuisi kita sebagai pembaca untuk memahami bahwa
kita dapat membagi-bagi pie menjadi beberapa potongan.Dari hasil
visualisasi data dengan menggunakan metode Pie chart dapat
disimpulkan bahwa Produksi padi sawah dikecamatan barru pada
tahun 2010-2023 (Kg), Persentase yang paling rendah yang dilihat
berjumlah 7% dari produksi padi sawah yang berjumlah 75,49 dan
85,49, sedangan persentase padi sawah paling tinggi yaitu berjumlah
37% dari produksi padi sawah sebanyak 70,49.
B. Hasil Analisis Perbedaan Penggunaa metode Visualisasi
Visualisasi data dengan menggunakan metode histogram
memberikan gambaran peningkatan frekuensi suhu udara selama 2
minggu pertama dalam tabel dari diagram ini lebih banyak dibandingkan
pada data tunggal yaitu di tambahkan persentase kumulatif yang dapat
kita lihat bahwa persentase kumulatif ini meningkat. Adapun visualisasi

33
data dengan menggunakan metode Bar Chart dapat dilihat hasilnya
bahwa produksi padi sawah ini tinggi dengan frekuensi yg baik pada
frekuensi yang paling banyak yaitu 11 kali dengan produksi padi sawah
sebanyak 70,49; Selanjutnya, visualisai data dengan menggunakan
metode Line chart memberikan gambaran grafik lebih mudah untuk
melihat arah pergerakan kurs.
Selanjutnya, visualisasi data dengan menggunakan metode Pareto
Chart dapat mengatasi masalah dengan signifikan karena Cuma ada 1
garis yg kita dapat untuk lebih mudah melihat hasilnya, Pareto chart atau
diagram pareto sendiri sering digunakan untuk mencari penyebab atau
faktor dominan dari suatu masalah Hampir sama dengan histogram pada
data kelompok ini namun perbedaanya pada diagram batangnya memiliki
jarak yang memudahkan kita melihat kelompoknya pada masing masing
hasil produksi padi. Sedangkan visualisasi data dengan menggunakan
metode Pie Chart dapat dilihat persentase kumulatifnya sama dengan
pada histogram tapi yang membedakan diagramnya yaitu pada pie chart
diagramnya seperti potongan pizza dan lebih menarik untuk di
persentasekan.

4.3 Ukuran Pemusatan dan Penyebaran Data Tunggal


A. Ukuran pemusatan
Berdasarkan observasi suhu udara 2 minggu pertama di bulan
Februari 2023 dilabuan bajo pulau flores (CO), suhu udara rata-rata
(mean) yang diperoleh yaitu 25,241666667 Nilai suhu tengahnya
(median) terdapat pada 26,4 serta suhu udara yang paling banyak terjadi
yaitu 20,4.
B. Ukuran Penyebab Data
Berdasarkan observasi suhu udara 2 minggu pertama di Bulan
Februari 2023 dilabuan bajo pulau flores (CO), nilai maksimum yang
diperoleh yaitu 28,5. Nilai minimum yang diperoleh yaitu 20,4. Standar
deviationnya yaitu 2,938191793 serta standard error suhu yaitu

34
0,599755888. Sampel variansi sebanyak 8,632971014. Kurtosis
sebanyak -0,675460253. Skewness sebanyak -1,022723003. Adapun
Range (jarak) sebanyak 8,1. SUM (Jumlah) sebanyak 605,8 serta count
(total) sebanyak 24 data.

4.4 Ukuran Pemusatan dan Penyebaran Data Kelompok

A. Ukuran pemusatan
Berdasarkan observasi Produksi padi sawah dikecamatan barru
pada tahun 2010-2023 (Kg), rata-rata (mean) produksi padi sawah yang
diperoleh yaitu 69,51166667. Nilai tengah (median) dari produksi padi
sawah terdapat pada 68,56 serta produksi padi sawah yang paling banyak
yaitu 68,56.
B. Ukuran penyebaran data
Berdasarkan observasi Produksi padi sawah dikecamatan barru
pada tahun 2010-2023 (Kg),nilai maksimum yang diperoleh yaitu 85,04.
nilai minimum yang diperoleh yaitu 58,49, Standar deviationnya yaitu
7,461122724 serta standard error yaitu 1,362208407, sample variance
yaitu 55,6683523,kurtosis sebanyak -0,386047285,skewness sebanyak
0,452482368,adapun range (jarak) sebanyak 26,55,SUM (Jumlah)
sebanyak 2085,35,serta count (total) sebanyak 30 data.

35
BAB V
PENUTUP

5.1 Kesimpulan
Kesimpulannya adalah pada visualisasi data tunggal dan data kelompok
menggunakan 5 gambar grafik yaitu Histogram, Bart chart, Line chart, Pareto
chart, dan Pie chart. Adapun perbedaan hasil analisis perbedaan antara data
tunggal dan data kelompok terdapat pada tabel distribusi frekuensi yang
dimana pada data tunggal terdiri dari nilai, frekuensi, serta persentase
sedangkan pada tabel distribusi frekuensi data kelompok terdiri dari kelas,
interval, nilai tengah, tepi kelas, frekuensi, frekuensi kumulatif, persentase, dan
persentase kumulatif.
Adapun Berdasarkan Hasil Pengolahan Data, di dapat Nilai Mean Pada
Data Tunggal yaitu 25,24166667,Nilai Median Pada Data Tunggal yaitu 26,4;
Nilai Modus Pada Data Tunggal =20,4; Range Pada Data Tunggal yaitu
8,1;Nilai Maksimum Pada Data Tunggal yaitu 28,5; dan Nilai Minimum Pada
Data Tunggal yaitu 20,4.

5.2 Saran
Dalam melakukan praktikum kita harus benar-benar teliti dalam
penyajian data baik data tunggal maupun data kelompok supaya mendapatkan
hasil dari data sesuai yang kita inginkan dan juga harus Mengikuti arahan dari
dosen/asisten dosen supaya praktikum berjalan dengan lancar. Diharapkan
dalam data yang disajikan berisi data yang jelas dan dijelaskan serinci rincinya
agar dapat dimengerti dengan mudah oleh pembaca.

36
DAFTAR PUSTAKA

Aisyah, R.R. 2018. Makalah Statistik Deskriptif. Jurnal STIKES YAYASAN


RS.DR.Soetomo, Jl.Karang menjangan NO.12 Surabaya

Bina, Nuraini Sri.Menentukan Ukuran Penyebaran dengan Menggunakan


excel.jamaika: Jurnal Abdi Masyarakat 1.2 (2020): 96-104.

Dyah, N.A. 2019. Statitistik Deskriptif dan Regresi Liner Berganda dengan SPSS.
Jurnal Jurusan Akuntansi Fakultas Ekonomi Universitas Semarang.

Kusuma, A.C dan Rakhman, A. 2018. Peningkatan Keterampilan Olah Data


(SPSS) Pada Mahasiswa DIII Akuntansi Politeknik Harapan Bersama
Tegal. Jurnal Abdimas PHB, Vol. 1, No. 1. Politeknik Tegal.

Rahmita sholihat (2013) tugas kelompok Ukuran pemusatan data

Wahyudi, S. T. 2017. Statistika Ekonomi: Konsep, Teori, Dan Penerapan.


Universitas Brawijaya Press.

Widyadhari, Asri. 2019. Makalah Statistik (SPSS). Sumatera Utara : Universitas Of


Sumatera Utara

37
MODUL 2
“UJI VALIDITAS DAN REALIBILITAS”

38
BAB I
PENDAHULUAN
1.1 Latar Belakang
Instrumen memegang peranan yang sangat penting dalam menentukan
mutu suatu penelitian, karena validitas atau kesahihan data yang diperoleh akan
sangat ditentukan oleh kualitas atau validitas instrumen yang digunakan, di
samping prosedur pengumpulan data yang di tempu. Hal ini mudah dipahami
karena instrumen berfungsi mengungkapkan fakta menjadi data, sehigga jika
instrumen yang digunakan mempunyai kualitas yang memadai dalam arti valid
dan reliable maka data yang diperoleh akan sesuai dengan fakta atau keadaan
sesungguhnya di lapangan.
Untuk mengukur kesesuaian, efisiensi dan kemantapan (consistenc) suatu
alat atau penilaian atau tes dipergunakan macam-macam alat seperti validitas,
keandalan, obyektivitas, dan kepraktisan (practicability). Validitas adalah
kualitas yang menunjukkan hubungan antara suatu pengukuran atau diagnosis
dengan arti atau tujuan kriteria belajar atau tingkah laku. Beberapa kriteria dapat
dipilih untuk memperlihatkan keefektifan terhadap peramalan performance
yang akan datang (yang akan terjadi) kriteria yang lain lagi untuk menunjukkan
status yang muncul, kriteria yang lain lagi untuk menimbulkan sifat-sifat yang
refresentatif dariluasnya isi atau tingkah laku, dan kriteria yang lain lagi untuk
melengkapi penyediaan lagi untuk menunjang atau menolak beberapa ikon
psikologis.
Reliabilitas adalah sama dengan konsistensi atau keajengan. Suatu
instrumen evaluasi dikatakan mempunyai nilai reliabilitas tinggi, apabila tes
yang dibuat mempunyai hasil yang konsisten dalam mengukur yang hendak
diukur. Instrumen evaluasi dikatakan memiliki reliabilitas tinggi, berarti hasil
interpretasi instrumen menunjukkan konsistensi yang lebih baik, menunjukkan
betapa yakinnya evaluator atau guru menempatkan sebagai hasil evaluasi, dan
menjadi perhatian para guru agar hasil interpretasi instrumen evaluasi dapat
dioperasionalkan dikelas atau sekolah. Hubungan antara validitas dan

39
reliabilitas sering membingungkan, terutama bagi mereka yang baru pertama
kali bertemu dengan dua Batasan konteks instrumen evaluasi maupun instrumen
penelitian. reliabilitas pengukuran instrumen evaluasi diperlukan untuk
mencapai hasil pengukuran yang valid. Dalam kaitannya dengan posisi
konsistensi, para guru bisa memiliki instrument evaluasi yang reliabel tanpa
valid, sebaliknya kita mempunyai instrumen valid dengan
reliabilitas yang baik.

1.2 Tujuan Praktikum


Mahasiswa mampu menerapkan pengolahan data kuesioner dengan uji
validitas dan uji realibilitas dengan menggunakan software SPSS.

1.3 Alat dan Bahan Yang Digunakan


a. Alat yang Digunakan
1. Perangkat computer
2. Perangkat lunak pendukung komputasi Microsoft Excel
b. Bahan Yang Digunakan
1. Data hasil observasi tunggal dan kelompok
2. Kertas
3. Tinta

1.4 Prosedur Praktikum


a. Uji Validitas
1. Memasukkan skor kuesioner ke tabel bantu dengan program excel
2. Mendefinisikan variabel dalam SPSS
3. Memasukkan data ke dalam SPSS
4. Menganalisis data klik Analyze-Coorrelate-Bivariate
5. Memasukkan item X kekotak variables, kemudian lanjutkan dengan
cara yang sama untuk Y
6. Klik OK dan tampilkan hasil analisis.
b. Uji Reliabitas
1. Membuka data pada hasil skor kuesioner pada SPSS (sama pada
pengujian validitas)

40
2. Menganalisis : Analysis – Scale – Reliability Analysis
3. Memasukkan seluruh item variabel X yang valid (dari hasil pengujian
validitas) ke kotak items tanpa skor total (kemudian dengan cara yang
sama untuk Y)
4. Klik statistic, pada Deskriptives For Klik Scale If Item Deleted, klik
Continue.
5. Klik OK dan keluar hasil analisis.

41
BAB II
LANDASAN TEORI

2.1 Pengertian Validitas


Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi.
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan
dan kecermatan suatu intrumen pengukuran dalam melaksanakan fungsi
ukurnya. Suatu alat evaluasi dikatakan mempunyai validitas yang tinggi
(disebut valid) jika alat evaluasi atau tes itu dapat mengukur apa yang
sebenarnya akan diukur atau memberikan hasil ukur yang tepat dan akurat
sesuai dengan maksud dikenakannya tes tersebut. Sedangkan suatu tes yang
menghasilkan data yang tidak relevan dengan tujuan diadakannya pengukuran
dikatakan sebagai tes yang memiliki validitas rendah.
Sisi lain yang sangat penting dalam konsep validitas adalah kecermatan
pengukuran. Suatu tes yang validitasnya tinggi tidak saja akan menjalankan
fungsi ukurnya dengan Tepat akan tetapi juga dengan kecermatan tinggi, yaitu
kecermatan dalam mendeteksi perbedaan perbedaan yang ada pada atribut yang
diukurnya. Pengertian validitas sangat erat berkaitan dengan tujuan
pengukuran. Tidak ada validitas yang berlaku secara umum untuk semua tujuan
pengukuran. Suatu teks hanya menghasilkan ukuran yang sangat valid untuk
satu tujuan pengukuran saja yang spesifik. Oleh karena itu, suatu tes yang valid
guna pengambilan suatu keputusan dapat saja tidak valid sama sekali guna
mengambil keputusan yang lain.
Validitas adalah suatu ukuran yang menunjukkan kevalidan atau
kesahihan suatu instrument. Jadi pengujian validitas itu mengacu pada sejauh
mana suatu instrument dalam menjalankan fungsi. Dalam sebuah penelitian
memiliki tujuan yakni suatu kebenaran, dalam usaha soal validitas merupakan
aspek yang sangat penting. Kebenaran hanya bisa diperoleh dengan instrument
yang valid. Maka dikatakan validitas merupakan esensi kebenaran hasil dari
penelitian. Validitas dipandang sebagai konsep yang paling penting dalam
sebuah penelitian. Dalam tiap penelitian selalu dipertanyakan validitas alat

42
yang digunakan. Oleh karena itu membuat instrument yang valid harus
mendapat perhatian setiap peneliti.
Dalam pengujian validitas terhadap kuesioner, dibedakan menjadi 2,
yaitu validitas faktor dan validitas item. Validitas faktor diukur bila item yang
disusun menggunakan lebih dari satu faktor (antara faktor satu dengan yang
lain ada kesamaan). Pengukuran validitas faktor ini dengan cara
mengkorelasikan antara skor faktor (penjumlahan item dalam satu faktor)
dengan skor total faktor (total keseluruhan faktor). Sedangkan Validitas item
ditunjukkan dengan adanya korelasi atau dukungan terhadap item total (skor
total), perhitungan dilakukan dengan cara mengkorelasikan antara skor item
dengan skor total item. Bila kita menggunakan lebih dari satu faktor berarti
pengujian validitas item dengan cara mengkorelasikan antara skor item dengan
skor faktor, kemudian dilanjutkan mengkorelasikan antara skor item dengan
skor total faktor (penjumlahan dari beberapa faktor).
Dari hasil perhitungan korelasi akan didapat suatu koefisien korelasi
yang digunakan untuk mengukur tingkat validitas suatu item dan untuk
menentukan apakah suatu item layak digunakan atau tidak. Dalam penentuan
layak atau tidaknya suatu item yang akan digunakan, biasanya dilakukan uji
signifikansi koefisien korelasi pada taraf signifikansi 0,05; artinya suatu item
dianggap valid jika berkorelasi signifikan terhadap skor total.
2.2 Kegunaan Validitas
a. Untuk menghindari pertanyaan yang kurang jelas.
b. Untuk meniadakan kata-kata yang terlalu asing atau kata-kata yang
menimbulkan kecurigaan.
c. Untuk memperbaiki pertanyaan-pertanyaan yang kurang jelas.
d. Untuk menambah item yang diperlukan atau meniadakan item yang
dianggap tidak relevan.
e. Untuk mengetahui validitas kuesioner tersebut.

Test-retest Dilakukan dengan cara mencobakan instrument beberapa kali


pada responden. Jadi dalam hal ini instrumenya sama, respondenya sama, dan

43
waktunya yang berbeda. Reliabilitas diukur dari koefisien korelasi antara
percobaan pertama dengan yang berikutnya. Bila koefisien korelasi positif dan
signifikan maka instrument tersebut sudah dinyatakan reliable. Pengujian cara
ini sering juga disebut stability.

2.3 Pengertian Reliabilitas


Reliabilitas mengarah kepada keakuratan dan ketepatan dari suatu alat
ukur dalam suatu prosedur pengukuran. Koefisien reliabilitas mengindikasikan
adanya stabilitas skor yang didapatkan oleh individu, yang merefleksikan
adanya proses reproduksi skor. Skor disebut stabil bila skor yang didapat pada
suatu waktu dan pada waktu yang lain hasilnya relatif sama. Makna lain
reliabilitas dalam terminologi stabilitas adalah subjek yang dikenai pengukuran
akan menempati ranking yang relatif sama pada testing yang terpisah dengan
alat tes yang ekuivalen.
Dari segi bahasa, reliabilitas merupakan penerjemahan dari kata reliabilit
yang mempunyai asal kata rely dan ability. Bila digabungkan, kedua kata
tersebut akan mengerucut kepada pemahaman tentang kemampuan alat ukur
untuk dapat dipercaya dan menjadi sandaran pengambilan keputusan. Dalam
konteks ini reliabilitas alat tes akan menunjuk kepada sejauh mana perbedaan-
perbedaan individual dalam skor tes dapat dianggap disebabkan oleh
perbedaan-perbedaan sesungguhnya dalam karakteristik yang
dipertimbangkan dan sejauh mana dapat dianggap disebabkan oleh kesalahan
peluang. Senada dengan pendapat tersebut, Suryabrata menyatakan bahwa
dalam arti yang paling luas, reliabilitas alat ukur menunjuk kepada sejauh mana
perbedaan-perbedaan skor perolehan mencerminkan perbedaan atribut yang
sebenarnya.
Reliabilitas alat ukur yang juga menunjukkan derajat kekeliruan
pengukuran tidak dapat ditentukan dengan pasti melainkan hanya dapat
diestimasi. Estimasi reliabilitas alat ukur dapat dicapai dengan menggunakan
tiga metode. Ketiga metode yang dimaksud adalah, metode “retest” atau tes
ulang, metode “alternate form” atau tes paralel dan metode “split-half” atau
metode konsistensi.

44
Metode konsistensi internal dilakukan dengan cara memberikan satu
bentuk tes yang hanya diberikan sekali kepada sekelompok subjek (single trial
administration) dengan tujuan untuk menghindari kelemahan pada dua metode
terdahulu. Untuk estimasi reliabilitas, dapat dilihat melalui konsistensi antar
item atau antar bagian tes itu sendiri yang sudah dibelah sebelumnya, dengan
menggunakan teknik komputasi tertentu. Konsep reliabilitas dalam Teori Skor
murni Klasik dapat dipahami dari beberapa interpretasi. Suatu tes dikatakan
sebagai memiliki reliabilitas yang tinggi apabila, misalnya skr tampak tes itu
berkorelasi tinggi dengan skor murninya sendiri. Reliabilitas dapat pula
ditafsirkan sebagai seberapa tingginya korelasi antara tampak pada dua
tes yang paralel.
Dibawah ini adalah berbagai jenis reliabilitas yang biasanya
digunakandalam tes acuan norma (TAN) antara lain adalah sebagai berikut:
a. Reliabilitas antar-pemeriksa (inter rate reliability) Reliabilitas jenis ini
terlihat jika pemeriksa yang berbeda memeriksa hasil tes yang hasilnya
mirip atau sedikit berbeda variasinya. Dua cara terkait
penggunaanreliabilitas antar pemeriksa adalah, a) menguki bagaimana
kemiripan pemeriksa dalam mengkategorisasikan butir soal. b) menguji
bagaimana kemiripan pemeriksa dalam memberi skor butir soal.
Reliabilitas jenis ini juga disebut inter observaser reliability atau intrcoder.
b. Reliabilitas tes-tes ulang (test-retest reliabiity) Reliabilitas jenis ini terlihat
jika pemeriksa yang sama pada saat yang berlainan memperoleh hasil tes
yang mirip. Reliabiitas dapat bervariasi karena pengaruh berbagai faktor,
antara lain disebabkan bagaimana tanggapan seseorang terhadap suasana
hatinya, adanya interupsi. Waktu pengambilan tes dan sebagainya. Pada
umumnya, semakin lama penundaan pemberian tes yang kedua. Semakin
besar variasi hasil tes. Suatu tes yang baik dapat menangani masalah seperti
itu sehingga hanya menghasilkan sedikit perbedaan pada hasilnya. Dengan
kata lain, selang waktu pemberian tes tidak berpengaruh pada hasil tes.
c. Reliabilitas bentuk paralel (paralel form reliability) Reliabilitas bentuk
paralel dapat dilihat tatkala pada saat yang sama, pemeriksaan-pemeriksaan

45
yang berbeda melaksanakan pengujian tes yang berbeda, dengan hasil yang
mirip. Jenis-jenis pertanyaan pada tes berbeda tetapi memiliki konstruksi
tes yang sama. Reliabilitas jenis ini digunakan untuk menilai hasil dari dua
buah tes yang memiiki kosntruksi yang sama. Penilaian bentuk paralel ini
dapat dilaksanakan dalam kombinasi dengan metode lain misalanya
metode belah dua. metode belah dua membagi dua sejumlah butir- butir
soal yang konstruksinya sama dan dilaksanakan pada kelompok siswa
yang sama.
2.4 Cara – Cara Mencari Besarnya Reabilitas
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada
subjek yang sama untuk mengetahui ketetapan ini pada dasarnya dilihat
kesejajaran hasil Seperti halnya beberapa teknik juga menggunakan rumus
korelasi product momen untuk mengetahui validitas, kesejajaran hasil dalam
reliabitas les. Kriterium yang digunakan untuk mengetahui ketetapan ada yang
berada di luar tes (consistency external) dan pada tes itu sendiri (consistency
Internal).
a. Metode bentuk paralel (equivalent)
Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran. dan susunan. tetapi butir-bulir
soalnya berbeda. Dalam Istilah bahasa Inggris disebut alternate-forms
method (parallel forms).
Dengan metode bentuk paralel ini, dua buah tes yang paralel, misalnya
Matematika Seri A yang akan dicari reliabilitasnya dan tes Seri B diteskan
kepada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan.
Koefisien korelasi dari kedua hasil tes inilah yang menunjukkan koefisien
reliabilitas tes seri A. Jika koefisiennya tinggi maka tes tersebut sudah
reliabel dan dapat digunakan sebagai alat pengetes yang terandalkan.
Dalam menggunakan metode tes paralel ini pengetes harus
menyiapkankan dua buah tes, dan masing-masing dicobakan pada
kelompok siswa yang sama. Oleh karena itu, ada orang menyebutkan
sebagai double testdouble-trial-metodh. Penggunaan metode ini baik

46
karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor
"masih ingat soalnya" yang dalam evaluasi dlsebut adanya practice-effect
dan carry-over effect , artinya ada faktor yang dibawa oleh pengikut tes
karena sudah mengerjakan soal tersebut. Kelemahan dan metode ini
adalah bahwa pengetes pekerjaannya beratkarena harus menyusun dua seri
tes. Lagi pula harus tersedia waktu yang lamauntuk mencobakan dua kali
tes.
b. Metode tes ulang (test retest method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan
dua series. Dalam menggunakan teknik atau metode ini pengetes hanya
memiliki satu seri tes tetapi dicobakan dua kali. Oleh karena tesnya hanya
satu dan dicobakan dua kali, maka metode ini dapat disebut dengan single-
test-double trial method. Kemudian hasil dari kedua kali tes tersebut
dihitung korelasinya. Untuk tes yang banyak mengungkap pengetahuan
(ingatan) dan pemahaman. Oleh karena itu, tenggang waktu antara
pemberian tes pertama dengan kedua menjadi pemasalahan tersendiri. Jika
tenggang waktu terlalu sempit, siswa masih banyak ingat materi.
Sebaliknya kalau tenggang waktu terlalu lama, maka faktor-faktor atau
kondsi tes sudah akan berbeda, dan siswa sendiri barangkali sudah
mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula
terhadap reliabilitas.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan
pemahaman, cara ini kurang mengena karena tercoba akan masih ingat
akan butir- butir soalnya. Oleh karena tenggang waktu akan pemberian tes
pertama dengan kedua menjadi permasalahan tersendiri. jika tenggang
waktu terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalau
tenggang waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah
akan berbeda, dan siswa sendiri barangkali sudah mempelajari sesuatu.
Tentu saja faktor-faktor ini akan berpengaruh pula terhadap reliabilitas.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil
tes pertama. Hal ini tidak mengapa karena pengetes harus sadar akan

47
adanya pragtice effect dan carry over effect. Yang penting adalah adanya
kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh koefisien
korelasi yang tinggi.
c. Metode belah dua atau spilt-half metodh
Kelemahan penggunaan metode dua tes dua kali percobaan dan satu
tesdua kali percobaan diatasi dengan motode ketiga ini yaitu metode belah
dua. Dalam menggunakan metode ini pengetes hanya menggunakan
sebuah tes yang dicobakan satu kali. Oleh karena itu juga disebut singel
test singel trial metodh. Berbeda dengan metode bentuk paralel dan tes
ulang, metode belah duahanya menggunakan sebuah tes dan dicobakan
satu kali. Metode ini disebut juga single-test-trial-method.
Ada dua cara membelah butir soal, yaitu:
a. Membelah item-item genap dan item-item ganjil yang selanjutnya
disebut belahan ganjil-genap.
b. Membelah item-item awal dan item-item akhir yaitu separuh jumlah
padanomor-nomor awal dan separuh jumlah nomor-nomor akhir.

48
BAB III
PENGUMPULAN DAN PENGOLAHAN DATA

3.1 Pengumpulan Data


Berikut rekap data responden Pengaruh Computer Anxiety dan Computer
Attitude terhadap keahlian mahasiswa dalam penggunaan Komputer pada
penelitian Tugas.

Tabel 3.1 Rekap Data Responden Pengaruh Computer Axienty

Tabel 3.2 Rekap Data Responden Pengaruh Computer Atitude

49
Tabel 3.3 Rekap Data Responden Keahlian Komputer

3.2 Pengolahan Data


3.2.1 Uji Validasi
a. Uji Validasi untuk X1
Tabel 3.2 Correlation Untuk X1

50
b. Validasi Untuk X2
Tabel 3.3 Correlation Untuk X2

c. Uji Validasi Untuk Y


Tabel 3.4 Correlation Untuk Y

51
3.2.1 Uji Realibilitas
a. Uji Reliabilitas X1

Tabel 3.5 Reliabilty X1

Tabel 3.6 Total Statistic X1

52
b. Uji Reliabilitas Untuk X2

Tabel 3.7 Realibilty X2

Tabel 3.8 Total Statistic X2

53
c. Uji Reliabilitas Untuk Y

Tabel 3.9 Reliability Y

Tabel 3.10 Total Statistics Y

54
BAB IV
PEMBAHASAN

4.1 Uji Validasi


4.1.1 Hasil Analisis Untuk X1
a. Perbandingan Nilai r Hitung dengan r Tabel
4.1 Perbandingan r Hitung dan r Tabel X1 Computer Anxiety
Sig 5%
VARIABEL No. Atribut Keputusan
r Hitung r Tabel
COMPUTER X1.1 0,524 0,361 Valid
ANXIETY X1.2 0,268 0,361 Tidak Valid
(X1) X1.3 0,227 0,361 Tidak Valid
X1.4 0,162 0,361 Tidak Valid
X1.5 0,474 0,361 Valid
X1.6 0,666 0,361 Valid
X1.7 0,753 0,361 Valid
X1.8 0,746 0,361 Valid
X1.9 0,519 0,361 Valid
X1.10 0,393 0,361 Valid
X1.11 0,39 0,361 Valid
X1.12 0,621 0,361 Valid
X1.13 0,253 0,361 Tidak Valid
X1.14 0,611 0,361 Valid
X1.15 0,033 0,361 Tidak Valid
X1.16 0,182 0,361 Tidak Valid
X1.17 0,422 0,361 Valid
X1.18 0,385 0,361 Valid
X1.19 0,398 0,361 Valid

Untuk perbandingan nilai r variabel dengan nilai r hitung dimana X1


memiliki 19 data yang dimana keputusannya menunjukkan 13 data valid

55
karena nilai r hitungnya lebih besar dari nilai r table sedangkan 6 data
Tidak Valid karena nilai r hitungnya lebih kecil dari nilai r tabel.

b. Nilai Signifikansi (Sig.) Untuk X1

Tabel 4.2 Perbandingan Signifikansi Tabel X1 Computer Anxiety

Sig 5%
Variabel No. Atribut Keputusan
Sig. Sig 0,05
X1.1 0,003 0,05 Valid
X1.2 0,152 0,05 Tidak Valid
X1.3 0,228 0,05 Tidak Valid
X1.4 0,394 0,05 Tidak Valid
X1.5 0,008 0,05 Valid
X1.6 0 0,05 Valid
X1.7 0 0,05 Valid
X1.8 0 0,05 Valid
COMPUTER X1.9 0,003 0,05 Valid
AXIETY X1.10 0,032 0,05 Valid
(X1) X1.11 0,033 0,05 Valid
X1.12 0 0,05 Valid
X1.13 0,177 0,05 Tidak Valid
X1.14 0 0,05 Valid
X1.15 0,863 0,05 Tidak Valid
X1.16 0,337 0,05 Tidak Valid
X1.17 0,02 0,05 Valid
X1.18 0,036 0,05 Valid
X1.19 0,029 0,05 Valid

Untuk nilai Signifikan pada 19 data tersebut memiliki 13 data


valid karena nilai sig lebih kecil dari 0,05; Sedangkan 6 data tidak valid
karena nilai sig lebih besar dari 0,05.

56
4.1.2 Hasil Analisis Untuk X2
a. Perbandingan Nilai r Hitung dengan r tabel
Tabel 4.3 Perbandingan Nilai r Tabel X2 Computer Attitude
Sig 5%
No.
VARIABEL r r Keputusan
Atribut
Hitung Tabel
COMPUTER X2.1 0,187 0,361 Tidak Valid
ATTITUDE X2.2 0,626 0,361 Valid
(X2) X2.3 0,006 0,361 Tidak Valid
X2.4 0,286 0,361 Tidak Valid
X2.5 0,413 0,361 Valid
X2.6 0,659 0,361 Valid
X2.7 0,409 0,361 Valid
X2.8 0,626 0,361 Valid
X2.9 0,299 0,361 Tidak Valid
X2.10 0,288 0,361 Tidak Valid
X2.11 0,659 0,361 Valid
X2.12 0,188 0,361 Tidak Valid
X2.13 0,04 0,361 Tidak Valid
X2.14 0,24 0,361 Tidak Valid
X2.15 0,512 0,361 Valid
X2.16 0,01 0,361 Tidak Valid

Untuk perbandingan nilai r variabel dengan nilai r hitung dimana


X2 memiliki 16 data yang dimana keputusannya menunjukkan 7 data
Valid karena nilai r hitungnya lebih besar dari nilai r table sedangkan 9
data Tidak Valid karena nilai r hitungnya lebih kecil dari nilai r tabel.

57
b. Nilai Signifikansi (Sig.) Untuk X2

Tabel 4.4 Perbandingan Signifikan Tabel X2 Computer Attitude

No. Sig 5%
Variabel Keputusan
Atribut Sig. Sig 0,05
COMPUTER X2.1 0,322 0,05 Tidak Valid
ATTITUDE X2.2 0 0,05 Valid
(X2) X2.3 0,975 0,05 Tidak Valid
X2.4 0,125 0,05 Tidak Valid
X2.5 0,023 0,05 Valid
X2.6 0 0,05 Valid
X2.7 0,025 0,05 Valid
X2.8 0 0,05 Valid
X2.9 0,109 0,05 Tidak Valid
X2.10 0,122 0,05 Tidak Valid
X2.11 0 0,05 Valid
X2.12 0,321 0,05 Tidak Valid
X2.13 0,839 0,05 Tidak Valid
X2.14 0,202 0,05 Tidak Valid
X2.15 0,004 0,05 Valid
X2.16 0,96 0,05 Tidak Valid

Untuk nilai Signifikan pada 16 data tersebut memiliki 7 data valid


karena nilai sig lebih kecil dari 0,05. Sedangkan 9 data tidak valid karena
nilai sig lebih besar dari 0,05.

58
4.1.3 Hasil Analisis Untuk Y

a. Perbandingan Nilai r Hitung dengan r tabel


4.5 Tabel Perbandingan Nilai r dan Tabel Y Keahlian

Sig 5%
No.
VARIABEL r r Keputusan
Atribut
Hitung Tabel
KEAHLIAN Y1 0,431 0,361 Valid
(Y) Y2 0,16 0,361 Tidak Valid
Y3 0,317 0,361 Tidak Valid
Y4 0,505 0,361 Valid
Y5 0,367 0,361 Valid
Y6 0,395 0,361 Valid
Y7 0,547 0,361 Valid
Y8 0,43 0,361 Valid
Y9 0,613 0,361 Valid
Y10 0,344 0,361 Tidak Valid
Y11 0,08 0,361 Tidak Valid
Y12 0,521 0,361 Valid
Y13 0,105 0,361 Tidak Valid
Y14 0,197 0,361 Tidak Valid
Y15 0,505 0,361 Valid
Y16 0,466 0,361 Valid
Y17 0,062 0,361 Tidak Valid
Y18 0,291 0,361 Tidak Valid
Y19 0,206 0,361 Tidak Valid
Y20 0,316 0,361 Tidak Valid
Y21 0,505 0,361 Valid
Y22 0,225 0,361 Tidak Valid
Y23 0,282 0,361 Tidak Valid
Y24 0,196 0,361 Tidak Valid
Y25 0,559 0,361 Valid
Y26 0,543 0,361 Valid
Y27 0,531 0,361 Valid
Y28 0,505 0,361 Valid
Y29 0,307 0,361 Tidak Valid

59
Untuk perbandingan nilai r variabel dengan nilai r hitung dimana Y
memiliki 29 data yang dimana keputusannya menunjukkan 15 data valid
karena nilai r hitungnya lebih besar dari nilai r table sedangkan 14 data
Tidak Valid karena nilai r hitungnya lebih kecil dari nilai r.

b. Nilai Signifikansi (Sig.) Untuk Y


4.6 Perbandingan Signifikan Tabel Y Keahlian
Sig 5%
Variabel No. Atribut Keputusan
Sig. Sig 0,05
KEAHLIAN Y1 0,018 0,05 Valid
Y Y2 0,4 0,05 Tidak Valid
Y3 0,088 0,05 Tidak Valid
Y4 0,004 0,05 Valid
Y5 0,046 0,05 Valid
Y6 0,031 0,05 Valid
Y7 0,001 0,05 Valid
Y8 0,018 0,05 Valid
Y9 0 0,05 Valid
Y10 0,062 0,05 Tidak Valid
Y11 0,673 0,05 Tidak Valid
Y12 0,003 0,05 Valid
Y13 0,582 0,05 Tidak Valid
Y14 0,296 0,05 Tidak Valid
Y15 0,004 0,05 Valid
Y16 0,009 0,05 Valid
Y17 0,746 0,05 Tidak Valid
Y18 0,119 0,05 Tidak Valid
Y19 0,274 0,05 Tidak Valid
Y20 0,089 0,05 Tidak Valid
Y21 0,004 0,05 Valid
Y22 0,231 0,05 Tidak Valid
Y23 0,132 0,05 Tidak Valid
Y24 0,3 0,05 Tidak Valid
Y25 0,001 0,05 Valid
Y26 0,002 0,05 Valid

60
Y27 0,003 0,05 Valid
Y28 0,004 0,05 Valid
Y29 0,099 0,05 Tidak Valid

Untuk nilai Signifikan pada 29 data tersebut memiliki 15 data valid


karena nilai sig lebih kecil dari 0,05. Sedangkan 14 data tidak valid karena
nilai sig lebih besar dari 0,05.

4.2 Uji Reliabilitas


4.2.1 Hasil Analisis Untuk X1
4.7 Perbandingan Nilai Cronbatch Alpha Tabel X1 Kualitas Pelayanan

Nilai Cronbatch' Alpha


No.
Variabel Cronbatch Cronbatch Keputusan
Atribut
Alpha Alpha > 0,6
COMPUTER X1.1 0,721 0,06 Reliable
AXIETY X1.2 0,737 0,06 Reliable
(X1) X1.3 0,739 0,06 Reliable
X1.4 0,748 0,06 Reliable
X1.5 0,724 0,06 Reliable
X1.6 0,703 0,06 Reliable
X1.7 0,694 0,06 Reliable
X1.8 0,695 0,06 Reliable
X1.9 0,719 0,06 Reliable
X1.10 0,731 0,06 Reliable
X1.11 0,729 0,06 Reliable
X1.12 0,712 0,06 Reliable
X1.13 0,739 0,06 Reliable
X1.14 0,71 0,06 Reliable
X1.15 0,771 0,06 Reliable
X1.16 0,752 0,06 Reliable
X1.17 0,729 0,06 Reliable
X1.18 0,735 0,06 Reliable
X1.19 0,731 0,06 Reliable

61
Untuk uji reliabilitas X1 yang mempunyai 19 data dengan
Cronbach Aslpha > 0,6 dengan semua keputusan nya yang reliable karena
Nilai Cronbatch Alpha lebih besar dari 0,6.

4.2.2 Hasil Analisis Untuk X2


4.8 Perbandingan Nilai Cronbatch Alpha Tabel X2 Computer Attitude

Nilai Cronbatch' Alpha


No.
Variabel Cronbatch Cronbatch Keputusan
Atribut
Alpha Alpha > 0,6
COMPUTER X2.1 0,589 0,06 Reliable
ATTITUDE X2.2 0,47 0,06 Reliable
(X2) X2.3 0,586 0,06 Reliable
X2.4 0,55 0,06 Reliable
X2.5 0,529 0,06 Reliable
X2.6 0,45 0,06 Reliable
X2.7 0,525 0,06 Reliable
X2.8 0,47 0,06 Reliable
X2.9 0,537 0,06 Reliable
X2.10 0,538 0,06 Reliable
X2.11 0,45 0,06 Reliable
X2.12 0,551 0,06 Reliable
X2.13 0,572 0,06 Reliable
X2.14 0,546 0,06 Reliable
X2.15 0,509 0,06 Reliable
X2.16 0,56 0,06 Reliable

Untuk uji reliabilitas X2 yang mempunyai 16 data dengan Cronbach


Alpha > 0,6 dengan 16 keputusan nya yang reliable karena Nilai Cronbatch
Alpha lebih besar dari 0,6.

62
4.2.3 Hasil Analisis Untuk Y
4.8 Perbandingan Nilai Cronbatch Alpha Tabel Y Keahlian
Nilai Cronbatch' Alpha
No.
Variabel Cronbatch Cronbatch Keputusan
Atribut
Alpha Alpha > 0,6
KEAHLIAN Y1 0,734 0,06 Reliable
(Y) Y2 0,75 0,06 Reliable
Y3 0,734 0,06 Reliable
Y4 0,73 0,06 Reliable
Y5 0,735 0,06 Reliable
Y6 0,734 0,06 Reliable
Y7 0,721 0,06 Reliable
Y8 0,732 0,06 Reliable
Y9 0,719 0,06 Reliable
Y10 0,737 0,06 Reliable
Y11 0,752 0,06 Reliable
Y12 0,727 0,06 Reliable
Y13 0,76 0,06 Reliable
Y14 0,745 0,06 Reliable
Y15 0,73 0,06 Reliable
Y16 0,73 0,06 Reliable
Y17 0,757 0,06 Reliable
Y18 0,74 0,06 Reliable
Y19 0,742 0,06 Reliable
Y20 0,738 0,06 Reliable
Y21 0,73 0,06 Reliable
Y22 0,746 0,06 Reliable
Y23 0,744 0,06 Reliable
Y24 0,749 0,06 Reliable
Y25 0,723 0,06 Reliable
Y26 0,724 0,06 Reliable
Y27 0,724 0,06 Reliable
Y28 0,73 0,06 Reliable
Y29 0,743 0,06 Reliable

63
Untuk uji reliabilitas Y yang mempunyai 29 data dengan Cronbach
Alpha > 0,6 dengan semua keputusan nya yang reliable karena Nilai
Cronbatch Alpha lebih besar dari 0,6.

64
BAB V
PENUTUP
5.1 Kesimpulan
Pada Validitas terdapat instrumen yang dapat mengukur apa yang
seharusnya diukur. Jadi, validitas lebih menekankan pada alat pengukuran atau
pengamatan. Untuk menguji validitas setiap butir soal maka skor-skor yang ada
pada butir yang dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir
soal dinyatakan skor X dan skor total dinyatakan sebagai skor Y, dengan
diperolehnya indeks validitas setiap butir soal, dapat diketahui butir-butir soal
manakah yang memenuhi syarat dilihat dari indeks validitasnya. Sedangkan
pada reliabilitas mengarah kepada keakuratan dan ketepatan dari suatu alat
ukur dalam suatu prosedur pengukuran. Koefisien reliabilitas mengindikasikan
adanya stabilitas skor yang didapatkan oleh individu, yang merefleksikan
adanya proses reproduksi skor. Skor disebut stabil bila skor yang didapat pada
suatu waktu dan pada waktu yang lain hasilnya relatif sama.
Berdasarkan analisis yang telah dilakukan mengenai uji validitas
Computer Axiety (X1), Computer Attitude (X2), dan Keahlian (Y). Maka dapat
diambil beberapa kesimpulan sebagai berikut yaitu hasil uji validitas yang
dilakukan menunjukan bahwa semua item dinyatakan valid dengan
membandingkan nilai rhitung dengan rtabel pada setiap item menunjukkan
nilai yang lebih besar dari rtabel. Adapun hasil uji realibilitas yang telah
dilakukan terhadap semua item variabel dinyatakan reliable karena nilai
crombach’s alpha (hitung) lebih besar dari nilai crombach’s (tabel) yaitu 0,6.
Karena hasil data analisis X1 (Computer Axiety) Untuk perbandingan
nilai r variabel dengan nilai r hitung dimana X1 (Computer Axiety) memiliki
19 data yang dimana keputusannya menunjukkan 13 data valid karena nilai r
hitungnya lebih besar dari nilai r tabel sedangkan 6 data Tidak Valid karena
nilai r hitungnya lebih kecil dari nilai r tabel. Untuk nilai Signifikan pada X1
(Computer Axiety) memiliki 19 data yang dimana 13 data valid karena nilai
sig lebih kecil dari 0,05 dan 6 data tidak valid karena nilai sig lebih besar dari

65
0,05. Sedangkan untuk analisis hasil data X2 (Computer Attitude) Untuk
perbandingan nilai r variabel dengan nilai r hitung dimana X2 (Computer
attitude) memiliki 16 data yang dimana keputusannya menunjukkan 7 data
Valid karena nilai r hitungnya lebih besar dari nilai r tabel dan 9 data tidak valid
karena nilai r hitungnya lebih kecil dari nilai r tabel. Untuk nilai Signifikan
pada X2 (Computer Attitude) memiliki 16 data yang dimana keputusannya
menunjukkan 7 data valid karena nilai sig lebih kecil dari 0,05 dan 9 data tidak
valid karena nilai sig lebih besar dari 0,05. Sedangkan untuk analisis hasil data
Y (Keahlian) Untuk perbandingan nilai r variabel dengan nilai r hitung dimana
Y (Keahlian) memiliki 29 data yang dimana keputusannya menunjukkan 15
data Valid karena nilai r hitungnya lebih besar dari nilai r tabel dan 14 data
tidak valid karena nilai r hitungnya lebih kecil dari nilai r tabel. Untuk nilai
Signifikan pada Y (Keahlian) memiliki 29 data yang dimana keputusannya
menunjukkan 15 data valid karena nilai sig lebih kecil dari 0,05 dan 14 data
tidak valid karena nilai sig lebih besar dari 0,05. r hitungnya lebih kecil dari
nilai r tabel.
Hasil uji reliabilitas yang telah dilakukan terhadap semua item variabel
dinyatakan reliable karena nilai cronbach’s alpha (hitung) lebih besar dari nilai
cronbach’s (tabel) yaitu 0,6. Hasil analisis data Nilai Cronbatch Alpha X1
(Computer Axiety) adalah Untuk Uji Reliabilitas X1 (Computer Axiety) yang
mempunyai 19 data dengan Cronbach Alpha > 0,6 dengan semua keputusan
nya yang Reliable karena Nilai Cronbatch Alpha lebih besar dari 0,6. Hasil
analisis data Nilai Cronbatch Alpha X2 (Computer Attitude) adalah Untuk Uji
Reliabilitas X2 (Computer Attitude) yang mempunyai 16 data dengan
Cronbach Alpha > 0,6 dengan semua keputusan nya yang Reliable karena Nilai
Cronbatch Alpha lebih besar dari 0,6. Hasil analisis data Nilai Cronbatch Alpha
Y (Keahlian) adalah Untuk Uji Reliabilitas Y (Keahlian) yang mempunyai 29
data dengan Cronbach Alpha > 0,6 dengan semua keputusan nya yang Reliable
karena Nilai Cronbatch Alpha lebih besar dari 0,6.

66
5.2 Saran
Dalam melakukan praktikum kita harus benar-benar teliti dalam penyajian
data supaya mendapatkan hasil dari data sesuai yang kita inginkan dan juga
harus mengikuti arahan dari dosen/asisten dosen supaya praktikum berjalan
dengan lancar.

67
DAFTAR PUSTAKA

Azwar, S. (2018). Reliabilitas dan Validitas. Yogyakarta: Pustaka


Pelajar.Diponegoro, U. (2016).

Budiwanto, Setyo.2017. Metode Statistika, Untuk Pengolahan data


Keolahragaan.Universitas Negeri Malang

Evaluasi Pendidikan. Malang: UIN-Maliki Press. Sukardi. (2017). Evaluasi


Pendidikan Prinsip dan Operasionalnya. Jakarta: Bumi Aksara

Yusup, Febrinawati. "Uji validitas dan reliabilitas instrumen penelitian


kuantitatif." Tarbiyah: Jurnal Ilmiah Kependidikan 7.1 (2018).

68
MODUL 3
“KORELASI DAN REGRESI”

69
BAB I
PENDAHULUAN
1.1 Latar Belakang
Dalam suatu penelitian, terkadang diperlukan analisis mengenai
hubungan antara beberapa variabel penelitian. Analisis yang dilakukan untuk
meneliti variabel-variabel penelitian dapat dilakukan dengan bantuan
statistik. Salah satu cara untuk menganalisis variabel penelitian adalah dengan
menggunakan teknik analisis korelasi dan regresi linear. Karena pentingnya
pemahaman dan pengaplikasian teknik analisis korelasi dan regresi linear,
analisis korelasi dan regresi dilakukan untuk mengetahui hubungan antar
variabel pada studi kasus yang akan dianalisa agar nantinya praktikan dapat
menguasai teknik ini dan dapat memanfaatkan sebagai salah satu teknik
analisa hubungan. Penyelesaian masalah pada regresi dan korelasi linear
membutuhkan kecermatan yang tinggi dalam perhitungannya. Kesalahan
pada perhitungan menyebabkan terjadinya kesalahan penyelesaian
selanjutnya dapat mempengaruhi pengambilan keputusan.
Untuk mengurangi kesalahan pada perhitungan dapat menggunakan
tools atau software seperti excel guna mempercepat proses pengolahan data.
Microsoft Excel berfungsi sebagai software pengolahan angka dan berguna
untuk membuat, mengedit, mengurutkan, menganalisa, serta meringkas data.
Selain itu, Microsoft Excel juga berfungsi untuk melakukan perhitungan
aritmatika dan statistika sehingga dapat membantu menyelesaikan
permasalahan-permasalahan yang berbau logika dan matematika. Regresi
merupakan salah satu analisis yang bertujuan untuk mengetahui pengaruh
suatu variabel terhadap variabel lain. Dalam analisis regresi, variabel yang
mempengaruhi disebut independent variabel (variable bebas) dan variabel
yang dipengaruhi disebut dependent variabel (variabel terikat).

1.2 Tujuan Pratikum


Mahasiswa mampu menerapkan pengolahan data kuesioner dengan uji
korelasi dan regresi dengan menggunakan software SPSS.

70
1.3 Alat yang digunakan
A. Alat yang Digunakan
1. Perangkat komputer
2. Perangkat lunak pendukung komputasi Microsoft Excel
3. Aplikasi SPSS
B. Bahan yang digunakan
1. Data hasil observasi kuesioner
2. Kertas dan Tinta

1.4 Prosedur praktikum


1. Memasukkan skor ke tabel bantu dengan program excel
2. Mendefinisikan variabel dalam SPSS
3. Memasukkan data ke dalam SPSS
4. Menganalisis data klik Analyze-Regression-Linear
5. Masukkan variabel X ke kotak Independent (s) dan variabel Y ke kotak
dependent.
6. Klik Statistics dan pastikan kotak R squared change tercentang
7. Klik OK dan tampilkan hasil analisis

71
BAB II
LANDASAN TEORI

2.1 Pengertian korelasi


Korelasi dapat diartikan sebagai hubungan. Namun, jika dikembangkan
lebih lanjut, korelasi tidak hanya dapat dipahami dalam pengertian ini.
Korelasi adalah salah satu teknik analisis statistik yang digunakan untuk
menemukan hubungan antara dua variabel kuantitatif. Hubungan antara
kedua variabel tersebut dapat terjadi karena adanya hubungan sebab akibat
atau dapat juga terjadi secara tidak sengaja. Dua variabel dikatakan
berkorelasi jika perubahan satu variabel secara teratur diikuti oleh perubahan
variabel lainnya dalam arah yang sama (korelasi positif) atau berlawanan arah
(korelasi negatif).
Kedua variabel yang saling berkorelasi dapat dibedakan menjadi
variabel bebas dan variabel terikat. Seperti namanya, variabel bebas adalah
variabel yang perubahannya cenderung berada di luar kendali manusia.
Sedangkan variabel terikat adalah variabel yang dapat berubah karena adanya
perubahan variabel bebas. Hubungan ini dapat dicontohkan dengan ilustrasi
pertumbuhan tanaman dengan variabel sinar matahari dan tinggi tanaman.
Sinar matahari merupakan variabel bebas karena intensitas cahaya yang
dihasilkan matahari tidak dapat diatur oleh manusia. Sedangkan tinggi
tanaman merupakan variabel terikat, karena perubahan tinggi tanaman
dipengaruhi langsung oleh intensitas sinar matahari sebagai variabel bebas.
Hubungan baik tidaknya antar variabel dalam regresi (antara variabel x
dan y) diterangkan dengan menggunakan koefisien yang disebut dengan
koefisien korelasi dan koefisien determinan.
Rumus umum korelasi :

𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√(𝑛 ∑ 𝑥 2 ) − (∑ 𝑥)2 (𝑛 ∑ 𝑦 2 ) − (∑ 𝑦)2

72
Keterangan :
n = Banyaknya Pasangan data X dan Y
Ʃx = Total Jumlah dari Variabel X
Ʃy = Total Jumlah dari Variabel Y
Ʃ𝑥2 = Kuadrat dari Total Jumlah Variabel X
Ʃ𝑦2 = Kuadrat dari Total Jumlah Variabel Y
Ʃxy = Hasil Perkalian dari Total Jumlah Variabel X dan Y
Diantara sekian banyak teknik-teknik pengukuran asosiasi terdapat dua
teknik korelasi yang sangat popular sampai sekarang, yaitu Korelasi Pearson
Product Moment dan Korelasi Rank Spearman. Pengukuran asosiasi
mengenakan nilai numerik untuk mengetahui tingkatan asosiasi atau
kekuatan hubungan antara variabel. Dua variabel dikatakan berasosiasi jika
perilaku variabel yang satu mempengaruhi variabel yang lain. Jika tidak
terjadi pengaruh, maka kedua variabel tersebut disebut independen. Korelasi
bermanfaat untuk mengukur kekuatan hubungan antara dua variabel atau
lebih dengan skala-skala tertentu, misanya pearson data harus bersekala
interval atau rasio. Spearman dan Kendal menggunakan skala ordinal. Kuat
lemahnya hubungan di ukur menggunakan jarak (range) 0 sampai dengan 1.
Korelasi mempunyai kemungkinan pengujian hipotesis dua arah (two
tailed). Dikatakan korelasi searah jika koefesien korelasi ditemukan positif,
sebalikanya jika koefisien korelasinya ditemukan negatif maka di katakana
korelasi tidak searah. Yang dimaksud koefesien korelasi ialah suatu
pengukuran statistic kovariasi atau asosiasi antara dua variabel. Jika koefesian
korelasi diketemukan tidak Sama dengan nol (0), maka terdapat hubungan
antara dua variabel tersebut. Jika koefesien diketemukan +1, maka hubungan
tersebut disebut hubungan korelasi sempurna atau hubungan linear sempurna
dengan kemiringan (slope) positif.
Sebalikanya, jika koefesien diketemukan -1, maka hubungan tersebut
disebut hubungan korelasi sempurna atau hubungan linear sempurna dengan
kemiringan (slope) negatif. Dalam korelasi sempurna tidak diperlukan lagi
pengujian hipotesis mengenai signifikasi antara variabel yang dikorelasikan,

73
karena kedua variabel mempunyai dua hubungan linear yang sempurna.
Artinya variabel X mempunyai hubungan sangat kuat dengan variabel Y. Jika
korelasi Sama dengan nol (0), maka tidak terdapat hubungan antara kedua
variabel.
Pengukuran asosiasi berguna untuk mengukur kekuatan (strength) dan
arah hubungan-hubungan antar dua variabel atau lebih. Contoh: mengukur
hubungan antar dua variabel: Motivasi kerja dengan produktifitas; Kualitas
layanan dengan kepuasan pelanggan; Tingkat inflasi dengan IHSG.

2.2 Pengertian regresi


Model regresi yang digunakan untuk mengestimasi variabel dependen
disebut persamaan regresi estimasi, yaitu suatu rumus matematika yang
menunjukkan hubungan antara satu atau lebih variabel yang nilainya
diketahui dengan variabel yang nilainya tidak diketahui. Saat menggunakan
model regresi, pertama-tama perlu diyakini bahwa variabel yang digunakan
dalam membangun model memiliki hubungan teoritis atau dapat diestimasi
terlebih dahulu. Hal ini dikarenakan hubungan antar variabel dalam model
regresi merupakan hubungan sebab akibat (causal relationship). Variabel
dalam model regresi dibagi menjadi dua, yaitu variabel bebas (independent
variable) dan variabel terikat (dependent variable). Variabel bebas adalah
variabel yang nilainya mempengaruhi variabel lain, dan variabel terikat
adalah variabel yang nilainya dipengaruhi oleh variabel lain.
Regresi linear adalah teknik analisis data yang memprediksi nilai data
yang tidak diketahui dengan menggunakan nilai data lain yang terkait dan
diketahui. Secara matematis memodelkan variabel yang tidak diketahui atau
tergantung dan variabel yang dikenal atau independen sebagai persamaan
linier. Teknik regresi linier menganalisis data ini dan menentukan bahwa
pengeluaran adalah setengah dari penghasilan. Mereka kemudian menghitung
biaya masa depan yang tidak diketahui dengan mengurangi separuh
pendapatan yang diketahui di masa depan. Dalam Statistik regresi
linear merupakan pendekatan untuk memodelkan hubungan antara suatu

74
(satu atau lebih) variabel dependen dengan satu (regresi linear sederhana) atau
lebih variabel independen (regresi linier banyak). Salah satu aplikasi dari
regresi linier adalah untuk melakukan prediksi berdasarkan data-data yang
telah dimiliki sebelumnya. Dengan asumsi hubungan di antara variabel-
variabel tersebut dapat didekati oleh suatu persamaan garis lurus, maka model
yang mendekati hubungan antar variabel di data tersebut disebut sebagai
model regresi linear.
Dalam perkembangannya, regresi linier dibagi menjadi dua bagian,
yaitu regresi linier sederhana dan regresi linier berganda. Regresi linier
sederhana adalah model regresi yang digunakan untuk menggambarkan
hubungan antara variabel bebas dan variabel terikat Analisis regresi adalah
metode statistik yang mengamati hubungan antara variabel terikat Y dan
serangkaian variabel bebas X1.....Xn. Tujuan dari metode ini adalah untuk
memprediksi nilai Y untuk nilai X tertentu. Model regresi linier sederhana
adalah model regresi paling sederhana dengan hanya satu variabel bebas X
Analisis regresi memiliki beberapa kegunaan salah satunya untuk
memprediksi variabel terikat Y. Persamaan untuk model regresi linier
sederhana adalah sebagai berikut:
𝑦 = 𝑎 + 𝑏𝑖𝑥𝑖
Dimana :
Y = Variabel terikat
a = Intercept
b = Koefisien variabel
X = Variabel bebas

Prinsip dasar yang harus dipenuhi dalam membangun suatu persamaan


regresi adalah bahwa antara variabel dependen dengan variabel
independennya mempunyai sifat hubungan sebab akibat (hubungan
kausalitas), baik yang didasarkan pada teori, hasil penelitian sebelumnya,
ataupun yang didasarkan pada penjelasan logis tertentu. Syarat-syarat regresi
antara lain data harus berbentuk interval atau rasio, data berdistribusi normal,

75
adanya korelasi (hubungan) antar variabel, dan tidak terdapat korelasi
antarvariabel bebasnya (multikolinearitas) untuk regresi ganda.

2.3 Definisi Uji Hipotesis


Banyak pendapat yang menjelaskan arti dari pengujian hipotesis
tersebut. Berikut akan dijabarkan beberapa pengertian dari berbagai referensi
yang ada. Sutrisno Hadi (1981), dalam bukunya yang berjudul "Statistika"
istilah hipotesa sebenarnya adalah kata majemuk, terdiri dari kata-kata hipo
dan tesa. Hipo berasal dari bahasa yunani hupo. yang berarti dibawah, kurang
atau lemah. Tesa berasal dari bahasa yunani thesis, yang berarti teori atau
proposisi yang disajikan sebagai bukti. Jadi hipotesis adalah pernyataan yang
masih lemah kebenarannya dan masih perlu dibuktikan kenyataannya.
Hipotesis pada dasarnya merupakan suatu proposisi atau anggapan yang
mungkin benar dan sering dipergunakan untuk dasar pembuatan keputusan
atau pemecahan persoalan atau untuk dasar penelitian yang lebih lanjut.
Sebelum menerima atau menolak sebuah hipotesis, seorang peneliti
harus menguji keabsahan hipotesis tersebut untuk menentukan apakah
hipotesis itu benar atau salah. Pengujian Hipotesis adalah suatu prosedur
Pengamatan Waktu Pelayanan Operator Pintu Tol Dengan Uji yang dilakukan
dengan tujuan memutuskan apakah menerima atau menolak hipotesis
mengenai parameter populasi. Ciri-ciri Hipotesis yang baik adalah sebagai
berikut:
1. Hipotesis harus menyatakan hubungan
2. Hipotesis harus sesuai fakta
3. Hipotesis harus sesuai dengan ilmu
4. Hipotesis harus dapat diuji
5. Hipotesis harus sederhana
6. Hipotesis harus dapat menerangkan fakta

76
BAB III
PENGUMPULAN DAN PENGOLAHAN DATA

3.1 Pengumpulan Data


Berdasarkan hasil pembagian kuesioner, diperoleh skor jawaban
responden dengan variabel X1 yaitu (Computer anxiety), X2 (Computer
atitude), dan variabel Y yaitu keahlian komputer, Jumlah pernyataan di
Variabel X1 sebanyak 13 pernyataan, Jumlah pernyataan di Variabel X2
sebanyak 7 pernyataan, dan jumlah pernyataan di Variabel Y sebanyak 15
pernyataan.
Tabel 3.1 Rekap data responden X1 (computer anxiety)
COMPUTER ANXIETY (X1)
PENGARUH KOMPUTER
RESPONDEDX1.1 X1.5 X1.6 X1.7 X1.8 X1.9 X1.10 X1.11 X1.12 X1.14 X1.17 X1.18 X1.19 X1TOTAL
1 5 5 5 5 5 3 3 5 4 4 5 5 4 58
2 5 4 4 4 3 2 3 4 4 4 4 4 4 49
3 3 4 4 3 3 3 3 3 4 3 3 4 2 42
4 2 3 3 2 3 4 5 5 3 4 5 3 2 44
5 2 2 4 4 4 4 4 4 4 4 3 2 5 46
6 4 4 4 4 4 4 5 4 3 2 4 4 2 48
7 2 4 5 4 4 4 4 4 5 4 5 5 5 55
8 4 4 5 5 4 5 5 4 5 4 4 5 4 58
9 5 4 5 4 5 4 5 4 5 5 4 5 3 58
10 4 4 4 3 3 3 4 4 3 4 4 5 4 49
11 4 4 3 4 4 4 4 4 4 4 4 5 3 51
12 2 4 4 3 4 4 4 3 4 4 5 3 4 48
13 5 4 4 4 4 4 4 4 4 5 4 5 3 54
14 4 4 4 3 3 3 4 4 4 4 3 4 4 48
15 4 3 4 4 4 3 3 3 4 4 3 5 4 48
16 4 4 3 4 4 4 4 4 3 4 3 3 4 48
17 4 4 4 4 4 4 4 4 5 4 3 4 3 51
18 3 4 4 3 3 4 3 4 4 4 4 3 4 47
19 5 4 4 4 4 4 4 4 5 4 4 3 4 53
20 3 5 4 5 5 5 4 5 4 5 5 3 3 56
21 5 4 5 5 5 5 5 5 5 5 5 5 4 63
22 5 2 5 3 4 4 4 4 4 4 5 5 4 53
23 4 2 3 2 3 4 5 4 4 3 3 5 3 45
24 5 3 4 4 4 4 4 4 4 4 4 5 4 53
25 3 4 2 3 2 3 3 5 4 2 3 5 4 43
26 5 4 5 4 5 4 4 4 4 5 3 3 5 55
27 5 4 5 4 5 4 4 4 4 5 3 5 4 56
28 5 5 5 5 5 5 5 5 5 5 5 5 5 65
29 3 4 5 3 5 4 3 3 4 4 5 5 4 52
30 3 2 2 4 4 2 2 3 3 5 5 5 3 43

77
Tabel 3.2 Rekap data responden X2 (computer attitude)
COMPUTER ATTITUDE (X2)
PENGARUH KOMPUTER
X2.2 X2.5 X2.6 X2.7 X2.8 X2.11 X2.15 X2TOTAL
4 3 2 4 5 3 4 25
4 3 4 3 5 5 4 28
4 3 4 3 5 3 4 26
4 3 5 3 5 5 3 28
4 4 3 5 5 3 4 28
4 4 4 5 5 4 5 31
5 5 3 5 3 5 4 30
2 5 5 5 3 5 4 29
4 5 4 5 3 5 4 30
3 5 3 3 3 5 4 26
4 5 4 5 4 5 4 31
2 5 5 5 3 5 4 29
4 5 4 5 5 3 4 30
3 5 5 5 3 4 4 29
4 5 4 5 5 5 4 32
4 5 5 5 3 5 4 31
4 5 5 5 4 5 4 32
4 5 4 5 5 4 4 31
5 5 4 5 5 3 3 30
4 2 3 5 3 2 4 23
5 4 3 5 5 4 4 30
4 5 3 5 5 5 3 30
4 5 3 3 5 5 2 27
4 3 4 4 5 3 4 27
4 4 5 3 5 4 4 29
4 5 2 3 3 5 4 26
4 4 4 3 5 4 4 28
5 4 4 5 5 4 4 31
4 4 3 5 5 4 3 28
3 5 5 5 5 5 4 32

78
3.3 Tabel Rekap responden Y1 (keahlian komputer)
KEAHLIAN (Y1)
KEAHLIAN KOMPUTER
Y1.1 Y1.4 Y1.5 Y1.6 Y1.7 Y1.8 Y1.9 Y1.12 Y1.15 Y1.16 Y1.21 Y1.25 Y1.26 Y1.27 Y1.28 Y1TOTAL
5 4 5 3 3 3 4 4 4 3 5 5 4 5 3 60
4 4 5 4 5 4 4 4 4 4 5 5 5 5 5 67
5 4 5 5 5 5 3 4 4 4 4 5 4 3 5 65
5 4 4 4 4 3 2 4 5 4 5 4 2 2 5 57
3 4 4 4 3 3 3 4 5 3 4 4 4 2 4 54
2 4 3 3 2 3 4 3 5 3 3 3 3 4 4 49
2 5 2 4 4 4 4 4 4 4 4 4 3 2 5 55
4 5 4 4 4 4 4 3 3 5 4 4 4 4 5 61
2 3 4 5 4 4 4 5 2 3 4 4 4 5 5 58
4 4 4 5 5 4 5 5 4 4 4 5 4 4 4 65
5 4 4 5 4 5 4 5 5 4 4 5 3 4 4 65
4 3 4 4 3 3 3 3 5 4 5 3 4 2 4 54
4 4 4 3 4 4 4 4 4 4 5 5 4 5 4 62
2 3 4 4 3 4 4 4 4 4 4 5 4 4 4 57
5 4 4 4 4 4 4 4 4 3 3 5 5 4 4 61
5 5 5 5 5 4 5 5 4 4 4 5 5 4 4 69
5 4 4 4 4 4 4 5 4 4 2 5 5 4 4 62
3 4 5 4 4 4 3 3 3 3 5 3 5 3 4 56
4 4 4 4 5 4 5 4 4 4 5 4 3 4 4 62
5 5 3 4 5 4 5 4 4 4 5 5 5 4 4 66
5 4 4 5 2 3 5 4 3 4 3 3 3 4 5 57
3 5 4 5 4 3 5 4 4 5 5 3 5 5 4 64
3 4 4 4 5 3 5 4 4 5 5 4 5 4 4 63
4 4 4 3 5 3 3 5 4 4 5 3 3 3 5 58
4 4 4 4 3 4 4 4 4 3 5 4 4 2 3 56
4 4 4 2 4 5 3 5 4 4 5 4 4 4 3 59
3 4 4 5 5 2 3 4 4 2 4 4 4 5 3 56
5 4 4 5 4 4 3 5 4 5 2 5 4 5 3 62
5 5 5 5 5 5 5 5 4 5 2 5 5 3 4 68
3 4 4 5 3 5 4 5 4 5 5 5 4 5 5 66

3.2 Pengolahan Data


1. Korelasi
a. Descriptive Statistics
Tabel 3.4 Descriptive Statistics

b. Correlations
Tabel 3.5 Correlations

79
2. Regresi
a. Descriptive Statistics
Tabel 3.6 Descriptive Statistics

b. Anova
Tabel 3.7 Anova

c. Coefficients
Tabel 3.8 Coefficients

d. Model Summary
Tabel 3.9 Model Summary

80
BAB IV
PEMBAHASAN

4.1 Korelasi
a. Descriptive Statistics
1) Computer Anxiety (X1)
Dari tabel Descriptive Statistics rata-rata dari Computer Anxiety (X1)
adalah 51,30 yang dapat diartikan bahwa Computer Anxiety (X1) rata-
rata responden setuju dan sangat setuju terhadap Keahlian komputer
dan standar deviation adalah 5,802 dimana rata-rata data responden
untuk Keahlian komputer diatas antara setuju dan sangat setuju yang
dimana memiliki jumlah data yaitu 30.
2) Computer Attitude (X2)
Dari tabel Descriptive Statistics rata-rata dari Computer Attitude (X2)
adalah 28,90 yang dapat diartikan bahwa Computer Attitude (X2) rata-
rata responden berada diantara setuju dan sangat setuju terhadap
keahlian komputer dan standar deviation adalah 2,234 dimana rata-
rata data responden untuk keahlian komputer diatas sangat tidak
setuju yang dimana memiliki jumlah data yaitu 30.
3) Keahlian komputer (Y)
Dari tabel Descriptive Statistics rata-rata dari Keahlian komputer (Y)
adalah 60,47 yang dapat diartikan bahwa Keahlian komputer (Y) rata-
rata responden setuju dan sangat setuju dipengaruhi terhadap
Computer Anxiety (X1) dan Computer Attitude (X2), standar
deviation adalah 4,480 dimana rata-rata data responden untuk
Keahlian komputer (Y) diatas antara kurang setuju dan setuju yang
dimana memiliki jumlah data yaitu 30.
b. Correlations
1) Membandingkan nilai signifikansi variabel Computer Anxiety (X1)
dan Computer Attitude (X2) dengan variabel keahlian komputer (Y).

81
Variabel (X1) tidak berkolerasi dengan variabel (Y) karena memiliki
nilai signifikansi lebih besar dari 0,05 yaitu 0,456. Sedangkan
Variabel (X2) tidak berkolerasi dengan variabel (Y) karena memiliki
nilai signifikansi lebih dari 0,05 yaitu sebesar 0,258.
2) Berdasarkan Nilai pearson correlation dari variabel Computer
Anxiety (X1) dan Computer Attitude (X2) dengan variabel keahlian
komputer (Y). Dengan nilai r tabel 0,3610, maka variabel X1 tidak
berkolerasi dengan variabel y karena memiliki nilai kurang dari r tabel
yaitu -0,21. Sedangkan Variabel X2 tidak berkolerasi dengan variabel
Y dengan nilai pearson correlation nya sebesar -0,123 lebih kecil dari
nilai r tabel.
3) Nilai person Correlation 0,21 sampai dengan 0,123 berarti derajat
hubungan antara variabel X1dan X2, dengan Y Tidak ada kolerasi.

4.2 Regresi
a. Anova
Berdasarkan output diatas diketahui nilai signifikansi untuk
pengaruh X1 dan X2 secara simultan terhadap Y adalah sebesar 0,806 >
0,05 dan nilai Fhitung 0,217 < Ftabel 3,34, sehingga disimpulkan tidak
terdapat pengaruh Variabel X1 dan X2 secara simultan terhadap variabel
Y.
b. Coefficients
1) Pengujian hipotesis pertama (H1)
Diketehui nilai Sig. untuk pengaruh X1 terhadap Y adalah sebesar
0,892 > 0,05 dan nilai Thitung -0,137 < Ttabel 1,70113, sehingga
dapat disimpulkan bahwa H1 tidak diterima yang berarti tidak terdapat
pengaruh X1 dan Y.
2) Pengujian hipotesis Kedua (H2)
Diketehui nilai Sig. untuk pengaruh X2 terhadap Y adalah sebesar
0,521 > 0,05 dan nilai Thitung -0,650 < Ttabel 1,70113, sehingga

82
dapat disimpulkan bahwa H2 tidak diterima yang berarti tidak terdapat
pengaruh X2 dan Y.
Rumus persamaman Regresi
Y = a + 𝑏𝑖 + 𝑥𝑖
= 69,359 – 0,022𝑥1 – 0,269𝑥2

c. Model Summary
Nilai 𝑅 2 = 0,016 (1,6%) mengartikan bahwa Computer Anxiety (X1)
dan Computer Attitude (X2) memiliki pengaruh sebesar 1,6% terhadap
Keahlian komputer (Y). Sisanya sebesar 98,4% dipengaruhi oleh faktor
lain yang tidak dilibatkan dalam penelitian ini.

83
BAB V
PENUTUP

5.1 Kesimpulan
Berdasarkan hasil praktikum diatas dapat disimpulkan sebagai berikut :
1. Korelasi
Untuk Computer Anxiety (X1) dan Computer Attitude (X2) dengan
variabel Keahlian komputer (Y). Variabel X1 tidak berkorelasi dengan
variabel Y karena memiliki nilai signifikansi lebih besar dari 0,05 yaitu
0,456. Sedangkan variabel X2 tidak berkorelasi dengan variabel Y karena
memiliki nilai signifikansi lebih dari 0,05 yaitu sebesar 0,258.
2. Regresi
Pada uji t diketahui nilai t hitung untuk pengaruh X1 terhadap Y
adalah 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 -0,137 < 𝑡𝑡𝑎𝑏𝑒𝑙 1,70113; sehingga dapat disimpulkan bahwa
H1 tidak diterima yang berarti tidak terdapat pengaruh X1 dan Y.
Sedangkan pada uji t diketehui untuk pengaruh X2 terhadap Y adalah
Thitung -0,650 < Ttabel 1,70113; sehingga dapat disimpulkan bahwa H2
tidak diterima yang berarti tidak terdapat pengaruh X2 dan Y.
Pada uji f, Berdasarkan output diatas diketahui nilai signifikansi
untuk pengaruh X1 dan X2 secara sumultan terhadap Y adalah sebesar
0,806>0,05 dan nilai 𝑓ℎ𝑖𝑡𝑢𝑛𝑔 0,217 < 𝑓𝑡𝑎𝑏𝑒𝑙 3,34; sehingga dapat
disimpulkan bahwa tidak terdapat pengaruh X1 dan X2 secara simultan terhadap
Y.

5.2 Saran
Dalam melakukan praktikum kita harus benar-benar teliti dalam
penyajian data supaya mendapatkan hasil dari data sesuai yang kita inginkan
dan juga harus mengikuti arahan dari dosen/asisten dosen supaya praktikum
berjalan dengan lancar.

84
DAFTAR PUSTAKA

Abdurahman, Maman dan Sambas Ali Muhidin. 2017. Analisis Korelasi, Regresi,
dan Jalur Dalam Penelitian. Bandung: CV Pustaka Setia

Dyah, N.A. 2019. Statitistik Deskriptif dan Regresi Liner Berganda dengan SPSS.
Jurnal Jurusan Akuntansi Fakultas Ekonomi Universitas Semarang.

Gunawan, C. 2019. Regresi Linear: Tutorial SPSS Lengkap.

Kusuma, A.C dan Rakhman, A. 2018. Peningkatan Keterampilan Olah Data


(SPSS) Pada Mahasiswa DIII Akuntansi Politeknik Harapan Bersama
Tegal. Jurnal Abdimas PHB, Vol. 1, No. 1. Politeknik Tegal.

Santoso, S. 2017. Menguasai statistik dengan SPSS 24. Elex Media Komputindo.

85
MODUL IV
“ANALISIS CLUSTER”

86
BAB I
PENDAHULUAN

1.1 Latar belakang


Analisis cluster merupakan salah satu alat yang penting dalam pengolahan
data statistik untuk melakukan analisis data. Analisis cluster merupakan
seperangkat metodologi yang secara otomatis mengelompokkan pola atau
objek ke dalam sebuah cluster berdasarkan kemiripannya. Secara intuitif, pola
atau objek yang berada pada satu cluster lebih memiliki kemiripan antar satu
sama lain dibandingkan pola atau objek cluster lain. Analisis cluster memiliki
aplikasi yang luas seperti data mining (penambangan data), pencarian
informasi, biologi, kesehatan, marketing dan segmentasi gambar. Analisis
cluster dapat digunakan sebagai sebuah alat untuk mendapatkan pengetahuan
mengenai penyebaran atau pola data atau dapat digunakan sebagai langkah pra
proses untuk algoritma lain. Analisis cluster juga dapat digunakan untuk
menyimpulkan data sehingga menemukan kelompok yang “natural” atau
“real”. Secara umum terdapat dua jenis data dalam analisis cluster yang
digunakan yakni data metric dan non metric atau kombinasi dari kedua jenis
data tersebut sehingga akan menambah kerumitan data dalam analisis cluster.
Analisis cluster dapat diaplikasikan pada berbagai masalah, salah satu
diantaranya adalah riset pasar. Dalam riset pasar, analisis cluster dapat
membantu bagian marketing untuk menemukan perbedaan antar konsumen
berdasarkan kebiasaan membeli. Informasi perbedaan ini dapat digunakan
sebagai bahan pertimbangan dalam membuat sistem rekomendasi untuk
melakukan kegiatan promosi. Selain itu, analisis cluster juga dapat digunakan
untuk mendeteksi adanya penyimpangan data yang ekstrim dari sekelompok
data.
Saat ini terdapat sebuah software yang digunakan sebagai alat bantu dalam
melakukan analisis cluster. Software SPSS merupakan salah satu tools analisis
cluster yang sangat terkenal. Kelemahan dari software ini adalah hanya dapat
melakukan analisis cluster dengan data yag bersifat metric atau merupakan

87
data hasil kombinasi antara metric dan non metric. Hal ini dikarenakan hanya
terdapat tiga metode yang dapat digunakan pada software ini. Secara garis
besar, metode dalam analisis cluster terbagi menjadi dua yakni metode hirarki
dan metode non hirarki. Diantara kedua metode tersebut, metode yang paling
terkenal dan sering digunakan adalah metode non hirarki yakni K-Means. Pada
software SPSS, hanya terdapat tiga metode analisis cluster yang dapat
digunakan yakni K-Means, Two-Step Cluster dan metode hirarki. K-Means
merupakan salah satu metode data clustering non hirarki yang berusaha
mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok.
Bahwa metode Two-Step Cluster merupakan suatu metode penggerombolan
yang dapat mengatasi masalah skala pengukuran, data berukuran besar dengan
peubah yang memiliki tipe data kategorik dan kontinyu serta mengetahui
gerombol optimal yang terbentuk. Dapat disimpulkan metode Two-Step
Cluster merupakan metode analisis cluster yang digunakan untuk menangani
data yang bersifat campuran.
WEKA adalah sebuah paket tools machine learning praktis. “WEKA”
merupakan singkatan dari Waikato Environment for Knowledge Analysis, yang
dibuat di Universitas Waikato, New Zealand untuk penelitian, pendidikan dan
berbagai aplikasi. WEKA mampu menyelesaikan masalah-masalah data
mining di dunia-nyata, khususnya klasifikasi yang mendasari pendekatan-
pendekatan machine learning. Perangkat lunak ini ditulis dalam hirarki class
Java dengan metode berorientasi objek dan dapat berjalan hampir di semua
platform. WEKA mudah digunakan dan diterapkan pada beberapa tingkatan
yang berbeda. Tersedia implementasi algoritma-algoritma pembelajaran state-
of-the-art yang dapat diterapkan pada dataset dari command line. WEKA
mengandung tools untuk pre-processing data, klasifikasi, regresi, clustering,
aturan asosiasi, dan visualisasi. User dapat melakukan preprocess pada data,
memasukkannya dalam sebuah skema pembelajaran, dan menganalisa
classifier yang dihasilkan dan performansinya – semua itu tanpa menulis kode
program sama sekali. Contoh penggunaan WEKA adalah dengan menerapkan
sebuah metode pembelajaran ke dataset dan menganalisa hasilnya untuk

88
memperoleh informasi tentang data, atau menerapkan beberapa metode dan
membandingkan performansinya untuk dipilih. Tools yang dapat digunakan
untuk pre-processing data set membuat user dapat berfokus pada algoritma
yang digunakan tanpa terlalu memperhatikan detail seperti pembacaan data
dari file-file, implementasi algoritma filtering, dan penyediaan kode untuk
evaluasi hasil.
1.2 Tujuan Praktikum
a. Mahasiswa mampu mengenali analisis cluster
b. Mahasiswa memahami kegunaan analisis cluster
c. Mahasiswa mengetahui asumsi dari analisis cluster dan mampu
menginterpretasikan output dari model analisis cluster
d. Mahasiswa mampu menggunakan SPSS dan WEKA dalam pengolahan
analisis cluster

1.3 Alat yang Digunakan


A. Alat yang digunakan
1. Perangkat komputer / laptop
2. Perangkat lunak pendukung komputasi Microsoft Excel
3. Aplikasi SPSS dan aplikasi WEKA
B. Bahan yang digunakan
1. Data random
2. Data dari Kaggle Eustock Markets
3. Kertas

1.4 Prosedur Praktikum


A. Prosedur praktikum SPSS
1. Mengelola data random di Microsoft Excel
2. Mendefinisikan variabel dalam SPSS
3. Memasukkan data ke dalam SPSS
4. Menganalisis data klik Analyze-Desriptives Statistics-Descriptives
5. Memasukkan kedalam kotak variabel kemudian aktifkan bagian “Save
Standardizes value as variables” lalu ok

89
6. Menganalisis data untuk analisis cluster klik analyze-classify-
kemudian pilih K-Means Cluster
7. Memasukkan seluruh variabel Z-Score kedalam kotak variables.
Kemudian variabel string dimasukkan kedalam kota “label cases by”
Number of Clusters, kemudian save
8. Aktifkan kedua kotak dalam menu save, yaitu “Cluster membership”
dan “Distance from cluster center” selanjutnya tekan tombol
“Continue” untuk kembali ke menu utama
9. Kemudian klik pada kotak “Options” kemudian pada bagian Statistics
aktifkan “Intial cluster centers” dan “ANOVA table” lalu tekan
continue lalu ok
B. Prosedur praktikum WEKA
1. Cari big data di kaggle.com
2. Download data yang di dapatkan dari kaggle
3. Data yang di download akan tersimpan sebagai file Microsoft excel
kemudian save as
4. Data tersebut dengan format cvs
5. Buka aplikasi WEKA, kemudian pilih menu Explorer
6. Setelah itu akan muncul tamilan menu Explorer
7. Lalu pada tab Preprocess, pilih open file dan pilih directory/tempat
8. penyimpanan dataset, kemudian cari tipe file/data yang kita gunakan
dengan format (cvs, Arff, Json, C.45 atau libsvm), lalu pilih data yang
ingin kita proses. Selajutnya pilih open
9. Setelah itu akan muncul setiap Atribut yang ada di dalam dataset, lalu
pilih/centang kolom (Atribut) yang tidak ingin digunakan.
10. Ketika Atribut yang tidak ingin digunakan telah dicentang, kemudian
pilih Remove
11. Setelah itu pilih Tab Cluster dan pilih algoritma yang ingin digunakan
untuk melakukan clustering
12. Lalu pilih algoritma yang ingin digunakan untuk melakukan clustering,
ada beberapa algoritma seperti yang dilihat pada gambar di bawah.

90
Pada percobaan kali ini kita akan mencoba menggunakan algoritma
Simple K-Means
13. Setelah memilih algoritma yang ingin digunakan, selanjutnya kita dapat
mengubah parameter dari algoritma yang dipilih, yaitu dengan cara klik
kiri pada algoritma yang telah dipilih. Lalu kita dapat menentukan
jumlah Cluster yang diinginkan pada option num Clusters terhadap
dataset Mall Customers yang ingin kita teliti
14. Kemudian pilih Start untuk mulai melakukan clustering
15. Lalu untuk melihat visualisasi hasil clustering, klik kanan pada result
list
16. kemudian pilih Visualize Cluster Assigments
17. Kemudian pilih Atribut X dan Y yang ingin di visualisasikan, atribut
yang dipilih ialah Annual Income pada sumbu X dan Spending Score
pada sumbu Y.
18. Hasil clustering berdasarkan atribut Annual Income pada sumbu X &
Spending Score pada sumbu Y akan tampil.

91
BAB II
LANDASAN TEORI

2.1 Definisi Uji Cluster


Analisis klaster adalah metode statistik dalam penelitian yang
memungkinkan peneliti untuk mengelompokkan atau mengelompokkan
sekumpulan objek ke dalam kluster-kluster kecil namun berbeda yang berbeda
karakteristiknya dari kluster-kluster lain yang berbeda. Tema yang mendasari
dalam analisis data eksplorasi membantu merek, organisasi, dan peneliti
memperoleh wawasan dari data visual untuk melihat tren dan memvalidasi
hipotesis dan asumsi eksplisit. Metode analisis dalam penelitian ini umumnya
didasarkan pada analisis data statistik yang digunakan di berbagai bidang,
termasuk pengenalan pola, pembelajaran mesin, manajemen wawasan dalam
riset pasar, scrubbing data, bioinformatika, dan banyak lagi.
Tujuan dari analisis klaster adalah untuk menemukan kelompok objek
dengan perubahan perilaku yang berbeda tetapi di mana karakteristik yang
mendasari dan hal-hal tersebut berada dalam kelompok kontrol yang sama.
Contoh yang sangat baik dari metode penelitian ini adalah bank yang
menggunakan data kualitatif dan kuantitatif untuk memplot tren dalam
pemrosesan klaim di antara klien. Menggunakan analisis klaster membantu
mereka menyimpulkan klaim penipuan dan lebih memahami perilaku
konsumen.

2.2 Tujuan Uji Cluster


1. Memudahkan identifikasi data
Tujuan dilakukannya cluster analysis adalah memudahkan ilmuwan data
dalam pengidentifikasian data-data yang didapatnya ke dalam klaster-
klaster yang memiliki kesamaan atau kemiripan karakteristik antar data atau
objek.

92
2. Membantu mengolah data mentah
Kemudian tujuan lain dari cluster analysis adalah mengolah data mentah
yang didapat dengan cara mengelompokkannya berdasarkan kemiripan
karakteristik. Data yang didapatkan pertama kali biasanya tercampur dan
tidak identik sehingga menyulitkan proses pengolahan data ke tahapan
selanjutnya.
3. Membantu bisnis membuat segmentasi
Dalam ekosistem bisnis, teknik cluster analysis harus dilakukan untuk
mengetahui segmentasi-segmentasi yang ada di pasar. Tidak mungkin
sebuah produk yang diluncurkan dapat mengatasi permasalahan semua jenis
segmentasi. Klasterisasi ini penting agar brand juga dapat menargetkan
produknya ke segmentasi yang tepat sasaran.
2.3 Ciri-ciri Cluster yang baik
Ciri- ciri suatu cluster yang baik yaitu mempunyai:
1. Homogenitas (within-cluster), yaitu kesamaan yang tinggi antar anggota
dalam satu cluster.
2. Heterogenitas (between-cluster), yaitu perbedaan tinggi antar cluster yang
satu dengan cluster yang lain.

2.4 Metode Analisis Cluster


Metode Cluster menggunakan 2 metode diantaranya:
1. Metode Hierarki
Metode hierarki adalah suatu metode analisis cluster yang membentuk
tingkatan tertentu seperti pada struktur pohon karena proses pengklusteran
dilakukan secara bertingkat atau bertahap. Metode ini biasa digunakan
untuk individu yang tidak terlalu banyak, dan jumlah kelompok yang akan
dibentuk belum diketahui. Hasil dari pengklusteran dengan metode hierarki
adalah dengan bentuk dendogram. Dalam metode hierarki terdapat dua
prosedur yang digunakan untuk pengclusteran yaitu metode agglomeratif
(agglomerative method) dan metode divisif (devisive method). Hasil

93
pengelompokan biasanya ditampilkan dalam bentuk diagram dendogram.
Dendogram digunakan untuk memperjelas pegelompokan dalam metode
hierarki.
2. Metode Non Hierarki
xPerbedaan dasar dalam metode non-hierarki dan metode hierarki ini
adalah ditentukan terlebih dahulu jumlah kelompok sebelum
pengelompokan dilakukan. Metode mengelompokan individu atau objek
dalam kelompok sedemikian rupa sehingga jarak antar individu ke pusat
kelompok minimum. Metode non-herarki yang paling banyak digunakan
adalah metode K-means. Metode non-hierarki ini dimulai dengan memilih
sejumlah nilai cluster awal sesuai yang diinginkan. Selanjutnya objek-objek
penelitian digabungkan dalam cluster-cluster tersebut.

2.5 SPSS (Statistical Product And Service Solutions)


SPSS merupakan salah satu program aplikasi yang paling banyak
digunakan untuk analisis statistik dalam ilmu sosial. Hal ini digunakan oleh
peneliti pasar, perusahaan survei, peneliti kesehatan, pemerintah, peneliti
pendidikan, organisasi pemasaran dan lain-lain. SPSS adalah sebuah program
aplikasi yang memiliki kemampuan untuk analisis statistik cukup tinggi serta
sistem manajemen data pada lingkungan grafis dengan menggunakan menu-
menu deskriptif dan kotak-kotak dialog yang sederhana sehingga mudah
dipahami untuk cara pengoperasiannya. SPSS dapat membaca berbagai jenis
data atau memasukkan data secara langsung ke dalam SPSS Data Editor.
Bagaimana pun struktur dari file data mentahnya, maka data dalam Data Editor
SPSS harus dibentuk dalam bentuk baris (cases) dan kolom (variables). Case
berisi informasi untuk satu unit analisis, sedangkan variabel adalah informasi
yang dikumpulkan dari masing-masing kasus.

2.6 WEKA (Waikato Environment for Knowledge Analysis)


WEKA adalah sebuah paket tools machine learning praktis. WEKA
merupakan singkatan dari Waikato Environment for Knowledge Analysis, yang

94
dibuat di Universitas Waikato, New Zealand untuk penelitian, pendidikan dan
berbagai aplikasi. WEKA mampu menyelesaikan masalah-masalah data
mining di dunia-nyata, khususnya klasifikasi yang mendasari pendekatan-
pendekatan machine learning. Perangkat lunak ini ditulis dalam hirarki class
Java dengan metode berorientasi objek dan dapat berjalan hampir di semua
platform.
WEKA mudah digunakan dan diterapkan pada beberapa tingkatan yang
berbeda. Tersedia implementasi algoritma-algoritma pembelajaran state- of-
theart yang dapat diterapkan pada dataset dari command line. WEKA
mengandung tools untuk pre-processing data, klasifikasi, regresi, clustering,
aturan asosiasi, dan visualisasi. User dapat melakukan preprocess pada data,
memasukkannya dalam sebuah skema pembelajaran, dan menganalisa
classifier yang dihasilkan dan performansinya semua itu tanpa menulis kode
program sama sekali. Contoh penggunaan WEKA adalah dengan menerapkan
sebuah metode pembelajaran ke dataset dan menganalisa hasilnya untuk
memperoleh informasi tentang data, atau menerapkan beberapa metode dan
membandingkan performansinya untuk dipilih. Tools yang dapat digunakan
untuk pre-processing dataset membuat user dapat berfokus pada algoritma
yang digunakan tanpa terlalu memperhatikan detail seperti pembacaan data
dari file-file, implementasi algoritma filtering, dan penyediaan kode untuk
evaluasi hasil. WEKA menyediakan tiga interface untuk mengolah dataset,
yaitu :
a. Explorer
Digunakan untuk mencari algoritma yang paling cocok untuk data. Semua
data diload ke memori sehingga dapat cepat diproses, tapi hanya dapat
digunakan untuk data dengan jumlah terbatas.
b. Eksperimenter
Digunakan untuk mencari parameter yang cocok. Mirip dengan explorer
tetapi prosesnya dapat diautomatisasi. Eksperimen ukuran besar (multi
machine dengan RMI) dapat dilakukan dengan interface ini.

95
C. Knowledgeflow
Digunakan untuk memproses data stream. Konfigurasi proses dapat diatur
dengan mudah dan dapat menangani data berukuran besar. Mendukung
incremental learning.

96
BAB III
PENGUMPULAN DAN PENGOLAHAN DATA

3.1 Pengumpulan Data


Tabel 3.1 Rekap Data Responden
Respoden X1 X2 X3 X4 Y Respoden X1 X2 X3 X4 Y
1 4 5 3 1 1 101 2 3 5 3 5
2 4 5 5 4 4 102 5 1 5 5 2
3 4 1 3 3 3 103 5 3 1 5 1
4 2 5 4 1 5 104 5 5 2 3 1
5 3 5 4 2 1 105 5 3 4 5 3
6 5 3 5 1 5 106 1 5 5 4 5
7 5 3 4 1 2 107 3 4 5 5 2
8 1 5 1 2 5 108 2 3 2 1 2
9 5 1 4 4 3 109 2 3 4 4 5
10 4 5 2 4 1 110 5 1 1 4 2
11 5 4 1 4 5 111 5 5 5 1 1
12 5 5 3 1 5 112 3 1 2 3 2
13 3 2 5 5 4 113 4 4 1 5 1
14 5 1 2 4 1 114 2 3 1 4 1
15 4 1 4 2 1 115 1 1 4 5 2
16 4 3 1 2 3 116 2 4 2 5 2
17 4 4 4 5 2 117 4 1 5 2 5
18 1 5 2 5 1 118 5 2 1 2 3
19 2 3 1 1 3 119 5 5 1 1 1
20 5 3 4 1 4 120 5 5 3 2 5
21 2 3 1 1 4 121 5 1 2 3 2
22 2 3 1 2 4 122 2 2 4 4 4
23 1 5 3 1 5 123 5 2 1 5 1
24 5 5 3 4 3 124 3 2 2 5 5
25 4 5 1 3 3 125 5 4 2 1 3
26 2 4 5 1 3 126 3 3 2 4 1
27 1 4 1 1 5 127 4 5 3 5 4
28 3 2 5 2 5 128 4 4 3 4 5
29 3 4 4 3 5 129 3 2 1 1 2
30 4 5 4 4 1 130 2 2 1 4 4
31 4 4 5 2 3 131 3 3 1 5 1
32 4 4 2 4 5 132 1 1 3 1 2
33 2 2 4 3 3 133 5 1 5 4 5
34 4 4 4 3 2 134 1 3 4 5 5
35 3 1 4 4 1 135 3 2 2 5 5
36 1 5 3 3 3 136 3 4 2 4 4
37 4 1 5 2 5 137 5 5 4 3 5
38 4 1 5 5 1 138 5 1 3 3 1
39 5 2 1 1 5 139 3 2 3 3 3
40 2 1 3 2 3 140 1 5 2 3 1
41 5 3 5 4 4 141 2 2 4 5 4
42 3 4 3 1 4 142 1 4 4 2 2
43 1 2 1 2 2 143 3 3 4 4 2
44 1 1 3 1 3 144 1 2 2 5 5
45 5 5 4 1 5 145 1 1 4 2 4
46 4 1 2 5 1 146 4 1 4 5 1
47 5 5 5 2 1 147 2 3 2 1 3
48 1 2 3 2 2 148 5 3 4 2 4
49 4 5 4 3 2 149 5 2 1 1 1
50 3 5 3 1 2 150 3 2 4 1 4
51 2 5 5 4 2 151 4 3 4 1 1
52 4 4 5 5 2 152 2 4 4 3 3
53 5 2 4 1 1 153 2 1 5 5 3
54 2 4 1 5 1 154 2 4 3 3 4
55 4 1 1 2 5 155 1 3 4 4 4
56 3 5 1 3 4 156 3 5 1 3 3
57 2 1 1 2 1 157 4 1 1 1 1
58 3 5 4 3 2 158 2 3 5 1 4
59 5 4 5 2 1 159 2 4 5 4 5
60 3 5 4 3 5 160 2 2 4 2 2
61 3 2 1 2 2 161 5 2 4 2 2
62 2 1 1 2 4 162 4 1 3 4 3
63 3 5 5 1 2 163 4 3 5 1 2
64 2 3 4 5 5 164 1 1 1 3 5
65 5 3 5 4 2 165 2 2 5 5 3
66 1 1 5 2 5 166 4 2 1 1 1
67 3 3 5 2 4 167 2 1 1 5 1
68 5 4 2 3 1 168 5 3 3 2 2
69 3 3 5 4 1 169 4 3 2 4 4
70 5 3 2 4 3 170 4 3 4 3 1
71 3 5 3 1 2 171 1 4 1 1 5
72 5 4 3 3 5 172 4 1 3 2 3
73 4 4 4 1 2 173 1 3 5 1 4
74 2 4 2 3 1 174 2 2 2 4 3
75 1 1 5 3 3 175 4 5 4 5 4
76 2 4 2 4 5 176 2 5 4 2 5
77 4 4 1 3 3 177 5 5 4 5 5
78 5 3 5 3 1 178 2 2 5 1 4
79 4 1 1 3 5 179 5 4 2 2 1
80 1 4 5 1 5 180 3 4 3 4 2
81 2 2 5 2 3 181 4 5 1 4 3
82 1 3 5 3 1 182 3 2 1 3 4
83 2 5 1 5 3 183 1 3 1 4 1
84 4 1 5 2 4 184 3 5 3 2 4
85 2 5 1 4 2 185 4 5 1 4 5
86 3 3 3 3 3 186 5 3 2 3 2
87 1 2 5 3 4 187 4 5 5 5 1
88 4 2 2 1 2 188 3 2 5 4 5
89 4 4 1 3 1 189 5 3 5 5 2
90 1 1 3 1 5 190 3 5 4 4 4
91 2 2 3 2 4 191 2 4 1 1 2
92 3 4 1 3 3 192 3 5 2 2 5
93 3 2 2 3 4 193 5 2 3 3 4
94 1 3 5 1 1 194 4 2 1 4 3
95 3 2 2 2 2 195 5 1 3 4 4
96 5 4 1 3 1 196 5 5 3 5 4
97 5 4 2 3 4 197 4 3 2 1 5
98 3 1 3 3 2 198 3 1 2 4 1
99 5 2 3 1 3 199 3 3 3 4 5
100 1 5 5 3 4 200 2 3 2 4 2

97
Tabel 3.2 Bigdata superstore
Id,Year_Birth,Education,Marital_Status,Income,Kidhome,Teenhome,Dt_Customer,Recency,MntWines,MntFruits,MntMeatProducts,MntFishProducts,MntSweetProducts,MntGoldProds,NumDealsPurchases,NumWebPurchases,NumCatalogPurchases,NumStorePurchases,NumWebVisitsMonth,Response,Complain
1826,1970,Graduation,Divorced,84835,0,0,6/16/2014,0,189,104,379,111,189,218,1,4,4,6,1,1,0
1,1961,Graduation,Single,57091,0,0,6/15/2014,0,464,5,64,7,0,37,1,7,3,7,5,1,0
10476,1958,Graduation,Married,67267,0,1,5/13/2014,0,134,11,59,15,2,30,1,3,2,5,2,0,0
1386,1967,Graduation,Together,32474,1,1,11/5/2014,0,10,0,1,0,0,0,1,1,0,2,7,0,0
5371,1989,Graduation,Single,21474,1,0,8/4/2014,0,6,16,24,11,0,34,2,3,1,2,7,1,0
7348,1958,PhD,Single,71691,0,0,3/17/2014,0,336,130,411,240,32,43,1,4,7,5,2,1,0
4073,1954,2n Cycle,Married,63564,0,0,1/29/2014,0,769,80,252,15,34,65,1,10,10,7,6,1,0
1991,1967,Graduation,Together,44931,0,1,1/18/2014,0,78,0,11,0,0,7,1,2,1,3,5,0,0
4047,1954,PhD,Married,65324,0,1,11/1/2014,0,384,0,102,21,32,5,3,6,2,9,4,0,0
9477,1954,PhD,Married,65324,0,1,11/1/2014,0,384,0,102,21,32,5,3,6,2,9,4,0,0
2079,1947,2n Cycle,Married,81044,0,0,12/27/2013,0,450,26,535,73,98,26,1,5,6,10,1,0,0
5642,1979,Master,Together,62499,1,0,9/12/2013,0,140,4,61,0,13,4,2,3,1,6,4,0,0
10530,1959,PhD,Widow,67786,0,0,7/12/2013,0,431,82,441,80,20,102,1,3,6,6,1,1,0
2964,1981,Graduation,Married,26872,0,0,10/16/2013,0,3,10,8,3,16,32,1,1,1,2,6,0,0
10311,1969,Graduation,Married,4428,0,1,5/10/2013,0,16,4,12,2,4,321,0,25,0,0,1,0,0
837,1977,Graduation,Married,54809,1,1,11/9/2013,0,63,6,57,13,13,22,4,2,1,5,4,0,0
10521,1977,Graduation,Married,54809,1,1,11/9/2013,0,63,6,57,13,13,22,4,2,1,5,4,1,0
10175,1958,PhD,Divorced,32173,0,1,1/8/2013,0,18,0,2,0,0,2,1,1,0,3,4,0,0
1473,1960,2n Cycle,Single,47823,0,1,7/23/2013,0,53,1,5,2,1,10,2,2,0,3,8,0,0
2795,1958,Master,Single,30523,2,1,1/7/2013,0,5,0,3,0,0,5,1,1,0,2,7,0,0
2285,1954,Master,Together,36634,0,1,5/28/2013,0,213,9,76,4,3,30,3,5,2,5,7,0,0
115,1966,Master,Single,43456,0,1,3/26/2013,0,275,11,68,25,7,7,3,5,1,8,5,0,0
10470,1979,Master,Married,40662,1,0,3/15/2013,0,40,2,23,0,4,23,2,2,1,3,4,0,0
4065,1976,PhD,Married,49544,1,0,12/2/2013,0,308,0,73,0,0,23,2,5,1,8,7,0,0
10968,1969,Graduation,Single,57731,0,1,11/23/2012,0,266,21,300,65,8,44,4,8,8,6,6,0,0
5985,1965,Master,Single,33168,0,1,10/13/2012,0,80,1,37,0,1,3,3,2,1,4,7,0,0
5430,1956,Graduation,Together,54450,1,1,9/14/2012,0,454,0,171,8,19,32,12,9,2,8,8,0,0
8432,1956,Graduation,Together,54450,1,1,9/14/2012,0,454,0,171,8,19,32,12,9,2,8,8,0,0
453,1956,PhD,Widow,35340,1,1,6/29/2014,1,27,0,12,0,1,5,2,2,0,3,5,0,0

Adapun data yang kita olah adalah data yang diperoleh dari web
kaggel.com yaitu superstore marketing campaign Dataset.

3.2 Pengolahan Data


3.2.1 Pengolahan Data SPSS
Tabel 3.3 Descriptive Statistics

98
Tabel 3.4 Intial Cluster Centers

Tabel 3.5 Iteration History

99
Tabel 3.6 Final Cluster Centers

Tabel 3.7 ANOVA

Tabel 3.8 Number of Cases in each Cluster

100
3.2.2 Pengolahan data WEKA

Gambar 3.1 Tab Preproccess

Gambar 3.2 Tab Clasift

101
Gambar 3.3 Tab Cluster

Gambar 3.4 Visualize Cluster Assigments

Gambar 3.5 Visualize Cluster Assigment

102
BAB IV
PEMBAHASAN
Data SPSS
4.1.1 Descriptive Statistics
Tabel 4.1 Descriptive Statistics

1. Variabel X1
Pada tabel Descriptive Statistics rata rata respoden untuk X1 adalah
3,21 yang dapat diartikan bahwa X1 rata-rata responden antara kurang
setuju dan setuju terhadap Y dan standar deviation adalah 1,387.
Dengan nilai minimum 1 dan nilai maximum 5 dengan total responden
yaitu 200.
2. Variabel X2
Pada tabel Descriptive Statistics rata rata responden untuk X2 adalah
3,07 yang dapat diartikan bahwa X2 rata-rata responden antara
kurang setuju dan setuju terhadap Y dan standar deviation adalah
1,427. Dengan nilai minimum 1 dan nilai maximum 5 dengan total
responden yaitu 200.
3. Variabel X3
Pada tabel Descriptive Statistics rata rata responden untuk X3 adalah
3,02 yang dapat diartikan bahwa X3 rata-rata responden antara
kurang setuju dan setuju terhadap Y dan standar deviation adalah
1,480. Dengan nilai minimum 1 dan nilai maximum 5 dengan total
responden yaitu 200.

103
4. Variabel X4
Pada tabel Descriptive Statistics rata rata responden untuk X4 adalah
2,92 yang dapat diartikan bahwa X4 rata-rata responden antara tidak
setuju dan kurang setuju terhadap Y dan standar deviation adalah
1,394. Dengan nilai minimum 1 dan nilai maximum 5 dengan total
responden yaitu 200.
5. Variabel Y
Pada tabel Descriptive Statistics rata rata responden untuk Y adalah
2,98 yang dapat diartikan bahwa Y rata-rata responden antara tidak
setuju dan kurang setuju terhadap X1, X2, X3, dan X4. Standar
deviation adalah 1,322. Dengan nilai minimum 1 dan nilai maximum
5 dengan total responden yaitu 200.

4.1.2 Intial Cluster Centers


Tabel 4.2 Intial Cluster Centers

1. Variabel X1
Pada tabel intial Cluster Centers untuk rata-rata responden X1
diperoleh cluster 1 adalah -1,59025 yang berarti rata rata responden
X1 antara sangat tidak setuju dan tidak setuju terhadap variable Y.
Untuk rata-rata responden X1 diperoleh cluster 2 adalah -0,86905
yang berarti rata rata responden X1 sangat tidak setuju terhadap
variable Y. Untuk rata-rata responden X1 diperoleh cluster 3 adalah

104
1,29456 yang berarti rata rata responden X1 antara sangat tidak setuju
dan tidak setuju terhadap variable Y.
2. Variabel X2
Pada tabel intial Cluster Centers untuk rata-rata responden X2
diperoleh cluster 1 adalah 0,65189 yang berarti rata rata responden X2
sangat tidak setuju terhadap variable Y. Untuk rata-rata responden X2
diperoleh cluster 2 adalah -1,45097 yang berarti rata rata responden
X2 antara sangat tidak setuju dan tidak setuju terhadap variable Y.
Untuk rata-rata responden X2 diperoleh cluster 3 adalah 1,35284 yang
berarti rata rata responden X2 antara sangat tidak setuju dan tidak
setuju terhadap variable Y.
3. Variabel X3
Pada tabel intial Cluster Centers untuk rata-rata responden X3
diperoleh cluster 1 adalah -1,36482 yang berarti rata rata responden
X3 antara sangat tidak setuju dan tidak setuju terhadap variable Y.
Untuk rata-rata responden X3 diperoleh cluster 2 adalah 1,33779 yang
berarti rata rata responden X3 antara sangat tidak setuju dan tidak
setuju terhadap variabel Y. Untuk rata-rata responden X3 diperoleh
cluster 3 adalah 1,33779 yang berarti rata rata responden X3 antara
sangat tidak setuju dan tidak setuju terhadap variable Y.
4. Variabel X4
Pada tabel intial Cluster Centers untuk rata-rata responden X4
diperoleh cluster 1 adalah -1,59025 yang berarti rata rata responden
X4 antara sangat tidak setuju dan tidak setuju terhadap variable Y.
Untuk rata-rata responden X4 diperoleh cluster 2 adalah 1,49208 yang
berarti rata rata responden X4 antara sangat tidak setuju dan tidak
setuju terhadap variabel Y. Untuk rata-rata responden X4 diperoleh
cluster 3 adalah -1,37730 yang berarti rata rata responden X4 antara
sangat tidak setuju dan tidak setuju terhadap variable Y.
5. Variabel Y

105
Pada tabel intial Cluster Centers untuk rata-rata resonden Y diperoleh
cluster 1 adalah 1,37300 dan cluster 3 adalah -1,33910 yang berarti
rata-rata responden Y antara sangat tidak setuju dan kurang setuju
terhadap variabel X1, X2, X3, dan X4. Sedangkan untuk cluster 2
adalah 0,01695 yang berarti rata-rata responden Y sangat tidak setuju
terhadap variabel X1, X2, X3, dan X4.

4.1.3 Iteration History


Tabel 4.3 Iteration History

Dari tabel interation history yang dilakukan melalui 10 tahapan


iterasi untuk mendapatkan cluster yang tepat. Dari tabel diatas
disebutkan bahwa jarak minimum antar pusat cluster yang terjadi dari
hasil iterasi adalah 4.724.

106
4.1.4 Final Cluster Centers
Tabel 4.4 Final Cluster Centers

1. Cluster 1
Dalam Cluster 1 yang dimana variabel X1, X2, dan X4, yang kurang
dari rata rata para responden. Hal ini terbukti dari nilai negatif (-)
yang terdapat pada tabel final Cluster Centers. Sedangkan variabel
X3 dan Y, yang lebih dari rata rata para responden. Hal ini terbukti
dari nilai positif (+) yang terdapat pada tabel final Cluster Centers.
2. Cluster 2
Dalam Cluster 2 yang dimana variabel X1 dan X4, yang lebih dari
rata rata para responden. Hal ini terbukti dari nilai positif (+) yang
terdapat pada tabel final Cluster Centers. Sedangkan variabel X2,
X3 dan Y, yang kurang dari rata rata para responden. Hal ini terbukti
dari nilai negatif (-) yang terdapat pada tabel final Cluster Centers.
3. Cluster 3
Dalam Cluster 3 yang dimana variabel X1 dan X2, yang lebih dari
rata rata para responden. Hal ini terbukti dari nilai positif (+) yang
terdapat pada tabel final Cluster Centers. Sedangkan variabel X3,
X4, dan Y, yang kurang dari rata rata para responden. Hal ini terbukti
dari nilai negatif (-) yang terdapat pada tabel final Cluster Centers.

107
4.1.5 Anova
Tabel 4.5 Anova

1. Variabel X1
Berdasarkan output diatas diperoleh nilai signifikansi untuk
pengaruh X1 terhadap Y adalah 0,000 < 0,05 dengan nilai Fhitung
95,272 > Ftabel 2,42, yang berarti bahwa terdapat pengaruh variabel
X1 secara simultan terhadap variabel Y karena nilai F hitung lebih
besar dari pada nilai F tabel.
2. Variabel X2
Berdasarkan output diatas diperoleh nilai signifikansi untuk
pengaruh X2 terhadap Y adalah 0,011 < 0,05 dan nilai Fhitung 4,580
> Ftabel 2,42, yang berarti bahwa terdapat pengaruh variabel X2
secara simultan terdapat pengaruh Variabel Y karena nilai F hitung
lebih besar dari pada nilai F tabel.
3. Variabel X3
Berdasarkan output diatas diketahui nilai signifikansi untuk
pengaruh X3 terhadap Y adalah 0,158 > 0,05 dan nilai Fhitung 1,860
< Ftabel 2,42, yang berarti bahwa tidak terdapat pengaruh variabel
X2 secara simultan terdapat pengaruh Variabel Y karena nilai F
hitung lebih kecil dari pada nilai F tabel.
4. Variabel X4
Berdasarkan output diatas diketahui nilai signifikansi untuk
pengaruh X4 terhadap Y adalah sebesar 0,000 < 0,05 dan nilai

108
Fhitung 150,578 > Ftabel 2,42, yang berarti bahwa terdapat
pengaruh variabel X2 secara simultan terdapat pengaruh Variabel Y
karena nilai F hitung lebih besar dari pada nilai F tabel.
4.1.6 Number of Cases in each Cluster
Tabel 4.6 Number of Cases in each Cluster

Berdasarkan output Number Of cases in each Cluster dengan total


responden sebanyak 200 responden diperoleh klaster 1 beranggotakan 64
reponden, klaster 2 beranggotakan 77 responden, dan klaster 3
beranggotakan 59 responden.

Data WEKA
4.2.1 Tab Preprocess

Gambar 4.2 Tab Preprocess


Gambar tab preprocess menunjukkan sebuah dataset dengan
intances 2240 dan 6 atribut, yaitu Recency, Num Deals Purchases, Num
Web Purchases, Num Catalog Purchases, Num Store Purchases, dan
Num Web Visits Month. Pada bagian kanan terdapat selected attribute,

109
hal ini menujukkan keterangan label terhadap atribut yang kita pilih
berdasarkan tipe data yang ada seperti real, boolean (yes, no) atau
sesuai dengan data yang kita diinginkan oleh user. Misal, bila kita pilih
Recency maka keterangan yang akan muncul adalah:
a. Nilai minimum: 0
b. Nilai maksimum: 99
c. Rata-rata (Mean): 49,109
d. Standar deviasinya: 28,962
Hal tersebut muncul karena atrribute Recency mempunyai tipe data
real. Begitupula dengan attribute Num Deals Purchases, Num Web
Purchases, Num Catalog Purchases, Num Store Purchases, dan Num
Web Visits Month, maka akan muncul berapa jumlah yang ada pada
datanya. Visualisasi tiap atribut dapat dilihat dengan meng-klik tombol
visualize. Visualisasi ini menggunakan diagram batang, yang
mengilustrasikan jumlah dari masing-masing tipe pada atribut yang
ada.

4.2.2 Tab Classift

Gambar 4.3 Tab Classift

Pada tab classift didapatkan hubungan Superstore dengan instances


sebanyak 2240 pada 6 attributes yaitu Recency, Num Deals Purchases,
Num Web Purchases, Num Catalog Purchases, Num Store Purchases,
dan Num Web Visits Month dengan modus uji validasi silang 10 kali
lipat ZeroR memeprediksi nilai kelas sebanyak 5.316517857142857

110
dengan waktu yang dibutuhkan untuk membangun model yaitu 0 detik.
Dapat dilihat pada performan data, pengklasifikasiannya yaitu dari
2240; -0,0526 coefficient diklasifikasikan dengan benar adapun untuk
rata-rata kesalahan absolut yaitu sebesar 2.0005 dan Root Mean
Squuared Error sebesar 2.4269 serta Relatif Absolut Error dan Root
Relatif Squared Error dengan nilai 100%.

4.2.3 Tab Cluster

Gambar 4.4 Tab Cluster


Berdasarkan hasil pengolahan data clustering menggunakan
algoritma simplekmeans diperoleh keterangan sebagai berikut:
a. Initial starting points (random)
1) Cluster 0: 10, 1, 1, 0, 2, 7 dilihat dari nilai rata-rata (mean) nilai
cluster 0 tidak memenuhi nilai mean karena > 49,109.
2) Cluster 1: 54, 3, 3, 0, 3, 8 dilihat dari nilai rata-rata (mean) nilai
cluster 1 memenuhi nilai mean karena > 49,109.
3) Cluster 2: 91, 1, 2, 3, 13, 6 dilihat dari nilai ratarata (mean) nilai
cluster 2 memenuhi nilai mean karena > 49,109.
b. Time token to build model (full training data) : 0.9 seconds
c. Clusetered instances
1) Cluster 0 sebanyak 817 (36%)
2) Cluster 1 sebanyak 823 (37%)
3) Cluster 2 sebanyak 600 (27%)

111
d. Final cluster cendroids :
1) Recency
Full data : 49.1094
Cluster 0 : 21.2326 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 49.1094
Cluster 1 : 73.8967 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 49.1094
Cluster 2 : 53.0683 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 49.1094
2) Num Deals Purchases
Full data : 2.325
Cluster 0 : 2.3819 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 2.325
Cluster 1 : 2.373 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 2.325
Cluster 2 : 2.1817 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 2.325
3) Num Web Purchases
Full data : 4.0848
Cluster 0 : 3.6548 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 4.0848
Cluster 1 : 3.367 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 4.0848
Cluster 2 : 5.655 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 4.0848
4) Num Catalog Purchases
Full data : 2.6621
Cluster 0 : 1.9315 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 2.6621
Cluster 1 : 1.7728 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 2.6621

112
Cluster 2 : 4.8767 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 2.6621
5) Num Store Purchses
Full data : 5.7902
Cluster 0 : 4.3696 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 5.7902
Cluster 1 : 3.966 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 5.7902
Cluster 2 : 10.2267 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 5.7902
6) Num Web Visit Month
Full data : 5.3165
Cluster 0 : 5.8311 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 5.3165
Cluster 1 : 5.9271 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 5.3165
Cluster 2 : 5.7783 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 5.3165

4.2.4 Visualize Cluster Assigment

Gambar 4.5 Visualize Cluster Assigments

113
Gambar 4.6 Visualize Cluster Assigment

Berdasarkan grafik Visualize Cluster Assigment dapat dilihat


bahwa hasil pengolahan data yang dipilih atribut x (Instance-Number
Num) dan y (Num Store Purchases) yang ingin divisualisasikan. Hasil
clustering berdasarkan atribut atribut x (Instance-Number Num) dan y
(Num Store Purchases) dari grafik tersebut kita dapat melihat ada 3
cluster yang terbentuk. Cluster 0 ditandai dengan warna biru, Cluster 1
ditandai dengan warna merah, dan cluster 2 ditandai dengan warna
hijau. Untuk cluster 0 berada diatas nilai 0 sampai dibawah nilai rata-
rata y (Num Store Purchases). Cluster 1 berada disekitar nilai rata-rata
y (Num Store Purchases). Dan cluster 2 berada diatas nilai rata-rata y
(Num Store Purchases).

114
BAB V
PENUTUP
5.1 Kesimpulan
Dari data SuperStore yang telah diolah menggunakan WEKA, maka
diperoleh dataset dengan intances sebanyak 2240 dengan 6 atribut yang
tersedia yaitu Recency, Num Deals Purchases, Num Web Purchases, Num
Catalog Purchases, Num Store Purchases, dan Num Web Visits Month yang
memperoleh hasil minimum sejumlah 0 dengan data maksimum sebanyak 99
dengan nilai Rata-rata (Mean) 49,109 yang dapat disimpulkan bahwa rata-rata
tersebut merupakan rata-rata atribut recency yang apabila diatas nilai rata-rata
maka respon pelanggan tersebut termasuk kategori respon positif dan jika
dibawah nilai rata-rata maka respon pelanggan termasuk kategori respon
negatif.
Pada Final clusterternya untuk Recency, Num Deals Purchases, Num Web
Purchases, Num Catalog Purchases, Num Store Purchases, dan Num Web
Visits Month cluster 0, cluster 1 dan cluster 2 memenuhi respon positif
pelanggan atau dapat disimpulkan bawa Recency, Num Deals Purchases, Num
Web Purchases, Num Catalog Purchases, Num Store Purchases, dan Num Web
Visits Month dapat dikategorikan sebagai respon positif para pelanggan.

5.2 Saran
Diharapkan untuk mencari data yang dapat diolah pada aplikasi WEKA
dan dapat terbaca pada hasil cluster pastikan bahwa data yang di dapatkan
disusun/dirapikan terlebih dahulu pada kolom Ms. excel dan menyimpan
dengan file csv agar dapat mendukung data pada pengclasteran.

115
DAFTAR PUSTAKA

Attha, L., (2011), Analisis Cluster Untuk Mengidentifikasikan Pemerataan IPM


Jawa Timur Tahun 2008., Skripsi, Fakultas Sains dan Teknologi, Universitas
Negeri Maulana Malik Ibrahim, Malang.
Florin Gorunescu. (2011). Data Mining Concepts, Models and Techniques. In The
British Journal of Psychiatry.
Gudono. (2011). Analisis Data Multivarat (Edisi Pertama). Yogyakarta: BPFE.
Jiawei Han, Micheline Kamber, J. P. (2011). Data Mining: Concepts and
Techniques (The Morgan Kaufmann Series in Data Management Systems).
Jusia, P. A. (2016). Face Recognition Menggunakan Metode Algoritma Viola Jones
Dalam Penerapan Computer Vision. Jurnal Ilmiah Media Processor.
Jusia, P. A. (2017). Decision Support System for Supplier Selection using Analytical
Hierarchy Process (AHP) Method. Scientific Journal of Informatics.
Larose, D. T., & Larose, C. D. (2014). DISCOVERING KNOWLEDGE IN DATA
An Introduction to Data Mining Second Edition Wiley Series on Methods and
Applications in Data Mining.

116
117
118

Anda mungkin juga menyukai