Laporan Lengkap Statistik Kelompok 2-1c
Laporan Lengkap Statistik Kelompok 2-1c
DISUSUN OLEH :
KEMENTRIAN PERINDUSTRIAN
2023
LEMBAR PENGESAHAN
KELAS :1C
Makassar, 2023
Mengesahkan :
ii
KATA PENGANTAR
Segala puji kita panjatkan kehadirat Allah Subhana Wa Ta’Ala yang telah
memberikan rahmat, nikmat, karunia, dan anugerah-Nya sehingga laporan lengkap
ini dapat terselesaikan dengan baik. Walaupun masih jauh dari kata sempurna.
Laporan ini penulis buat guna menyelesaikan Praktek Statistik Industri pada saat
menempuh pendidikan di Politeknik ATI Makassar.
Penulis mengucapkan banyak terima kasih kepada semua pihak yang telah
membantu dalam proses pembuatan laporan lengkap Ini, terkhusus kepada :
Penyusun,
Kelompok 2
iii
DAFTAR ISI
iv
1.2 Tujuan Praktikum ................................................................................... 40
1.3 Alat dan Bahan Yang Digunakan ........................................................... 40
1.4 Prosedur Praktikum ................................................................................ 40
BAB II LANDASAN TEORI ............................................................................... 42
2.1 Pengertian Validitas ............................................................................... 42
2.2 Kegunaan Validitas ................................................................................ 43
2.3 Pengertian Reliabilitas ............................................................................ 44
2.4 Cara – Cara Mencari Besarnya Reabilitas .............................................. 46
BAB III PENGUMPULAN DAN PENGOLAHAN DATA ................................ 49
3.1 Pengumpulan Data ................................................................................. 49
3.2 Pengolahan Data ..................................................................................... 50
BAB IV PEMBAHASAN ..................................................................................... 55
4.1 Uji Validasi............................................................................................. 55
4.2 Uji Reliabilitas ........................................................................................ 61
BAB V PENUTUP................................................................................................ 65
5.1 Kesimpulan ............................................................................................. 65
5.2 Saran ....................................................................................................... 67
DAFTAR PUSTAKA ........................................................................................... 68
MODUL 3 “KORELASI DAN REGRESI” ......................................................... 69
BAB I PENDAHULUAN .................................................................................... 70
1.1 Latar Belakang ....................................................................................... 70
1.2 Tujuan Pratikum ..................................................................................... 70
1.3 Alat yang digunakan ............................................................................... 71
1.4 Prosedur praktikum ................................................................................ 71
BAB II LANDASAN TEORI .............................................................................. 72
2.1 Pengertian korelasi ................................................................................. 72
2.2 Pengertian regresi ................................................................................... 74
2.3 Definisi Uji Hipotesis ............................................................................. 76
BAB III PENGUMPULAN DAN PENGOLAHAN DATA ................................ 77
3.1 Pengumpulan Data ................................................................................. 77
3.2 Pengolahan Data ..................................................................................... 79
BAB IV PEMBAHASAN ..................................................................................... 81
v
4.1 Korelasi .................................................................................................. 81
4.2 Regresi .................................................................................................... 82
BAB V PENUTUP................................................................................................ 84
5.1 Kesimpulan ............................................................................................. 84
5.2 Saran ....................................................................................................... 84
DAFTAR PUSTAKA ........................................................................................... 85
MODUL IV “ANALISIS CLUSTER” ................................................................. 86
BAB I PENDAHULUAN ..................................................................................... 87
1.1 Latar belakang ........................................................................................ 87
1.2 Tujuan Praktikum ................................................................................... 89
1.3 Alat yang Digunakan .............................................................................. 89
1.4 Prosedur Praktikum ................................................................................ 89
BAB II LANDASAN TEORI ............................................................................... 92
2.1 Definisi Uji Cluster ................................................................................ 92
2.2 Tujuan Uji Cluster .................................................................................. 92
2.3 Ciri-ciri Cluster yang baik ...................................................................... 93
2.4 Metode Analisis Cluster ......................................................................... 93
2.5 SPSS (Statistical Product And Service Solutions) ................................. 94
2.6 WEKA (Waikato Environment for Knowledge Analysis) ...................... 94
BAB III PENGUMPULAN DAN PENGOLAHAN DATA ................................ 97
3.1 Pengumpulan Data ..................................................................................... 97
3.2 Pengolahan Data......................................................................................... 98
BAB IV PEMBAHASAN ................................................................................... 103
Data SPSS ....................................................................................................... 103
Data WEKA ..................................................................................................... 109
BAB V PENUTUP.............................................................................................. 115
5.1 Kesimpulan ........................................................................................... 115
5.2 Saran ..................................................................................................... 115
DAFTAR PUSTAKA ......................................................................................... 116
vi
vii
MODUL 1
“VISUALISASI DATA, UKURAN PEMUSATAN
DATA DAN PENYEBARAN DATA”
viii
BAB I
PENDAHULUAN
1
seperti dalam bentuk sebuah gambar dari sebuah data dengan berbagai format
penyajian yang sesuai.
Alasan utama kenapa data visual sangatlah penting dikarenakan oleh
data yang ditampilkan secara visual memungkinkan banyak orang untuk
memahami data dengan lebih cepat. Mencari informasi dari data yang
bergunung-gunung tidaklah mudah, tetapi bagan dan grafik dapat
mempermudah pencarian informasi dengan cepat dan tepat.
2
1) Mengurutkan data dari nilai terkecil ke terbesar
2) Menentukan frekuensi masing-masing data
3) Menentukan persentase masing-masing data
c. Membuat Histogram
d. Membuat Bar Chart
e. Membuat Line Chart
f. Membuat Pareto Chart
g. Membuat Pie Chart
2. Data Kelompok
a. Melakukan observasi
b. Membuat tabel distribusi frekuensi
c. Membuat Histogram
d. Membuat Bar Chart
e. Membuat Line Chart
f. Membuat Pareto Chart
g. Membuat Pie Chart
B. Ukuran Pemusatan dan Penyebaran Data
1. Data Tunggal
a) Klik Menu Data – Data Analysis
b) Pilih Descriptive Statistik
c) Isi data Input Range (data mentah hasil observasi) pilih output range
dan ceklis Summary Statistik
2. Data Kelompok
a) Membuat tabel distribusi frekuensi
b) Mencari mean dengan cara membagi jumlah perkalian frekuensi
dengan nilai tengah lalu membaginya dengan jumlah frekuensi
c) Mencari median dengan cara mencari letak kelas median lalu
menghitung dengan menggunakan rumus median data kelompok
d) Mencari modus dengan cara melihat data yang memiliki frekuensi
tertinggi lalu dihitung dengan menggunakan rumus modus data
kelompok
3
e) Mencari kuartil dengan cara mencari letak kuartil yang ingin dicari
lalu dihitung dengan menggunakan rumus kuartil data kelompok
f) Mencari desil dengan cara mencari letak desil yang ingin dicari lalu
dihitung dengan menggunakan rumus desil data kelompok
g) Mencari persentil dengan cara mencari letak persentil yang ingin
dicari lalu dihitung dengan menggunakan rumus persentil data
kelompok
h) Mencari simpangan baku rata-rata dengan menggunakan rumus
simpangan baku rata-rata data kelompok
i) Mencari standar deviasi dengan menggunakan rumus standar deviasi
data kelompok.
4
BAB II
LANDASAN TEORI
5
kuantitasnya disebut distribusi frekuensi kuantitatif, sebaliknya data yang
disusun menurut kualitasnya disebut distribusi frekuensi kualitatif. Data
mentah berarti data yang belum dimanipulasi atau diperlakukan dengan
carat tertentu melebihi keaslian mereka. Seperti kita ketahui, bahwa data
jenis tersebut tidak akan banyak memberikan arti.Untuk menyusun sebuah
distribusi frekuensi dari sebuah data mentah,maka dilakukan dengan cara
berikut:
1. Jangkauan data (range) sebanyak jarak nilai terendah dan tertinggi dari
Data.
𝑅 = 𝑛𝑖𝑙𝑎𝑖 𝑚𝑎𝑘𝑠𝑖𝑚𝑢𝑚 − 𝑛𝑖𝑙𝑎𝑖 𝑚𝑖𝑛𝑖𝑚𝑢𝑚
2. Kelas, merupakan tiap-tiap kategori dalam distribusi frekuensi.Tiap-tiap
kelas memiliki batas (atas dan bawah) nilai data. Batas atau rentang
kelas ini digunakan untuk menentukan nilai data yang masuk dalam
kategori kelas tersebut.
3. Jumlah kelas (Σ𝑘) yang dapat dibuat dari sejumlah data (𝑁) .Jumlah
kelas berhubungan erat dengan besarnya interval kelas, sifat data kasar
dan jumlah angka-angka yang ingin dikelompokkan ke dalam kelas-
kelas tersebut. Jumlah kelas tidak boleh terlalu banyak atau sedikit,
karena dapat menyebabkan distribusi frekuensi yang terbentuk tidak
mewakili gambaran data sebenarnya Sturges, memberikan pedoman
penentuan jumlah kelas menggunakan formulasi berikut:
∑ 𝑘 = 1 + 3.3 log 𝑁
4. Interval kelas (𝐶𝑖), merupakan lebar atau jangkauan tiap kelas. Besarnya
interval kelas bagi tiap-tiap kelas berhubungan erat dengan penentuan
jumlah kelas dan sebaiknya diusahakan agar sama semua dan
menggunakan bilangan yang praktis. Batas kelas adalah nilai-nilai yang
membatasi kelas yang satu dengan kelas yang lain. Batas bawah adalah
nilai-nilai yang terletak pada sebelah kiri dari masing- masing kelasnya,
sedangkan batas atas adalah sebelah kanan dari masing-masing
kelasnya.
𝑅
Ci=Σ𝑘
6
5. Distribusi Frekuensi Relatif, merupakan pendekatan untuk
mendeskripsikan proposi atau prosentase pada nilai data yang masuk
pada setiap kategori. Frekuansi relatif dapat berguna untuk
membandingkan dua buah kelompok kelas yang berbeda
ukurannya,dimana frekuensi actualnya akan cenderung lebih besar
untuk setiap kelas dengan jumlah yang lebih besar.
6. Distribusi Frekuensi Kumulatif, merupakan kumulatif dari nilai
distribusi frekuensi relatif (relative)
b. Histogram
Pada bidang statistik, histogram adalah tampilan grafis dari tabulasi
frekuensi yang digambarkan dengan grafis batangan sebagai manifestasi
data binning. Tiap tampilan batang menunjukkan proporsi frekuensi pada
masing-masing deret kategori yang berdampingan dengan interval yang
tidak tumpang tindih. Histogram menggambarkan distribusi frekuensi
dengan menggunakan rangkaian persegi panjang yang berdekatan, yang
masing-masing memiliki panjang sebanding dengan baik frekuensi atau
frekuensi relatif dari kelas yang diwakilinya.
c. Bar chart atau Diagram Batang
Bagan batang atau grafik batang adalah bagan atau grafik yang
menyajikan data kategorikal dengan batang persegi panjang dengan tinggi
atau panjang yang sebanding dengan nilai yang diwakilinya. Batang dapat
diplot secara vertikal atau horizontal. Bagan batang vertikal kadang-kadang
disebut bagan kolom.Seperti histogram, diagram batang mewakili frekuensi
sesuai dengan panjang relatif dari serangkaian persegi panjang. Hanya saja
terdapat dua hal yang membedakan dengan histogram:
1. Histogram digunakan dalam merepresentasikan data kuantitatif,
sedangkan bar chart adalah data kualitatif.
2. Ada histogram, persegi panjang yang terbentuk mewakili kelas saling
berdekatan atau tidak ada jeda diantara mereka, sedangkan pada bar
chart memiliki jarak di antara mereka.Bar chart digunakan untuk
7
memvisualisasikan data yang bersitaf deskrit,dimana antara satu data
dengan data yang lain tidak saling berhububungan secara urut dalam
lini waktu.
d. Diagram Garis (Line chart)
Grafik garis atau diagram garis merupakan suatu grafik yang
berupa garis lurus yang menghubungkan titik tengah suatu data dengan
data yang lainnya. Grafik garis biasanya digunakan untuk menunjukan
data yang berkesinambungan,Dalam diagram garis waktu biasanya
ditempatkan pada sumbu datar (sumbu X) dan nilai data pada sumbu
tegak (sumbu Y) sehingga diperoleh titik-titik koordinat. Jika titik-titik
yang berturutan dihubungkan oleh garis lurus, maka akan diperoleh
diagram garis.Line chart mampu secara simultan menunjukkan nilai-
nilai dari dua variabel kuantitatif (variabel 𝑦, atau sumbu vertikal, dan
variabel 𝑥 atau sumbu horizontal) dimana terdiri dari segmen linier
menghubungkan titiktitik yang diamati atau diukur untuk masing-
masing variable.Kelebihan Diagram garis biasanya digunakan untuk
menaksir atau memperkirakan data berdasarkan pola-pola yang telah
diperoleh.Diagram garis ada yang tunggal dan majemuk, diagram garis
majemuk yaitu dalam satu gambar terdapat lebih dari satu garis.
Diagram garis majemuk biasanya digunakan untuk membandingkan
dua keadaan atau lebih yang mempunyai hubungan. Dan Kekurangan
Hanya digunakan untuk data yang berkala,tidak bisa data yang
lainnya.Harus sangat teliti dalam membaca diagram ini.
e. Pareto chart
Diagram Pareto merupakan salah satu dari tujuh alat gugus mutu
yang sering digunakan dalam hal pengendalian Mutu. Pada dasarnya,
Diagram Pareto adalah grafik batang yang menunjukkan masalah
berdasarkan urutan banyaknya jumlah kejadian. Urutannya mulai dari
jumlah permasalahan yang paling banyak terjadi sampai yang paling
sedikit terjadi. Dalam Grafik, ditunjukkan dengan batang grafik
tertinggi (paling kiri) hingga grafik terendah (paling kanan).Terkait
8
erat dengan histogram, poligon frekuensi terdiri dari segmen garis yang
menghubungkan titik-titik yang dibentuk oleh perpotongan tanda kelas
dengan frekuensi kelas. Frekuensi relatif atau persentase juga dapat
digunakan untuk membuat grafik. Kelas kosong disertakan di setiap
akhir kelas sehingga kurva akan memotong sumbu horisontal.
f. Pie chart atau Diagram Pie
Diagram lingkaran adalah sebuah diagram berbentuk lingkaran yang
dibagi menjadi irisan-irisan untuk menggambarkan proporsi numerik.
Dalam sebuah diagram lingkaran, panjang busur setiap irisan, proporsional
dengan kuantitas yang diwakilinya.Seperti namanya, pie chart digunakan
untuk merepresentasi data dengan menggambarkannya menyerupai kue pie
yang berbentu bundar. Pie chart memiliki tampilan melingkar yang terbagi
atau dipotong-potong menjadi beberapa bagian berdasarkan baik jumlah
observasi atau nilai-nilai relatif dari segmen.
9
geometris, dan rata-rata harmonik. Dalam kegiatan penelitian, rata-rata
(mean) mempunyai kedudukan yang penting dibandingkan ukuran gejala
pusat lainnya. Hampir setiap kegiatan penelitian ilmiah selalu menggunakan
rata-rata (mean).
1. Data tunggal dengan seluruh skornya berfrekuensi satu
Σ𝑥𝑖
𝑥̅ =
𝑛
Dimana Xi = Data ke-i
n = jumlah data
2. Data kelompok (dalam distribusi frekuensi)
Σ𝑓𝑖𝑋𝑖 Σ𝑓𝑖𝑋𝑖
𝑥̅ = =
𝑁 Σ𝑓𝑖
b. Modus (Mo)
Modus adalah nilai yang paling sering muncul dalam suatu data
statistika. Modus juga merupakan nilai mayoritas atau nilai dengan
frekuensi paling tinggi. Modus dapat digunakan untuk menentukan sampel
dari suatu populasi dalam statistika.Modus tidak harus tunggal, artinya
nilainya bisa lebih dari satu. Adapun cara mencari modus untuk data tunggal
tinggal dilihat frekuensinya. Untuk data dalam daftar distribusi frekuensi.
𝐷1
Mo = Tb + (𝐷1+𝐷2) x Ι
Keterangan :
B = Batas bawah kelas modus sebanyak kelas interval dengan frekuens
terbanyak
I = Panjang interval kelas modus
D1 = Frekuensi kelas modus dikurangi frekuensi kelas sebelum kelas modus
D2 = Frekuensi kelas modus dikurangi frekuensi kelas sesudah kelas modus
c. Median (Me)
10
Median adalah nilai yang dapat membagi data menjadi dua bagian yang
sama. Dengan catatan, bahwa data harus diurutkan terlebih dahulu dari yang
terkecil ke yang terbesar.
1. Data tunggal
𝑁+1
M= 2
Keterangan :
N = Jumlah frekuensi
2. Data kelompok
1
𝑛−𝐹𝐾𝑆
2
Me = B + 𝑓𝑀𝑒
Keterangan :
B = batas bawah kelas median
I = panjang kelas median
N = jumlah frekuensi
FKS = jumlah frekuensi kumulatif sebelum kelas median
fMe= frekuensi kelas median
11
a. Jangkauan (range)
Range adalah salah satu ukuran statistik yang menunjukan jarak
penyebaran data antara nilai terendah (Xmin) dengan nilai tertinggi (Xmax).
Ukuran ini sudah digunakan pada pembahasan daftar distribusi frekuensi.
Range = nilai maksimum - nilai minimum.
2. Data tunggal sebagian atau seluluh skornya berfrekuensi lebih dari satu
Σ𝑛 ̅ |𝑖
𝑖=1𝑓|𝑥𝑖 − 𝑥
SR = Σ𝑛
𝑖=1𝑓𝑖
12
tersebut terdapat nilai ekstrem, standar deviasi menjadi tidak sensitif lagi,
sama halnya seperti mean.Standar Deviasi memiliki beberapa karakteristik
khusus lainnya. SD tidak berubah apabila setiap unsur pada gugus datanya
di tambahkan atau dikurangkan dengan nilai konstan tertentu. SD berubah
apabila setiap unsur pada gugus datanya dikali/dibagi dengan nilai konstan
tertentu.Bila dikalikan dengan nilai konstan, standar deviasi yang dihasilkan
akan setara dengan hasil kali dari nilai standar deviasi aktual dengan
konstan.
S = √𝑆 2
d. Varians (variance)
Dalam teori probabilitas dan statistika, varians atau ragam suatu
peubah acak adalah ukuran seberapa jauh sebuah kumpulan bilangan
tersebar. Varians nol mengindikasikan bahwa semua nilai sama.Varians
dapat menggambarkan bagaimana berpencarnya suatu data kuantitatif.
Varians diberi symbol,σ2 (baca: sigma kuadrat) untuk populasi dan untuk
s2 sampel.Selanjutnya kita akan menggunakan simbol s2 untuk varians
karena umumnya kita hampir selalu berkutat dengan sampel dan jarang
sekali berkecimpung dengan populasi. teknik statistik yang digunakan untuk
menjelaskan homogenitas kelompok Varians merupakan jumlah kuadrat
semua deviasi nilai-nilai individual terhadap rata-rata kelompok. Akar
varians = standar deviasi atau simpangan baku.
1
𝑆 2 =𝑁−1 Σ𝐹𝑖(𝑀𝑖 − 𝑥̅ )2
Keterangan :
N = jumlah frekuensi
Fi = frekuensi kelas
Mi = nilai tengah kelas
𝑥̅ = nilai rata-rata
13
Dalam teori dan statistik probabilitas, koefisien variasi, juga dikenal
sebagai deviasi standar relatif, adalah ukuran dispersi standar dari distribusi
probabilitas atau distribusi frekuensi. Ini sering dinyatakan sebagai
persentase, dan didefinisikan sebagai rasio simpangan baku \sigma terhadap
rata-rata \mu. digunakan untuk membandingkan suatu distribusi data yang
mempunyai satuan yang berbeda. Kalau kita membandingkan berbagai
variansi atau dua variabel yang mempunyai satuan yang berbeda maka tidak
dapat dilakukan dengan menghitung ukuran penyebaran yang sifatnya
absolut.Besarnya koefisien variasi akan berpengaruh terhadap kualitas
sebaran data.
𝑠𝑖𝑚𝑝𝑎𝑛𝑔𝑎𝑛 𝑏𝑎𝑘𝑢
KV = x 100 %
𝑟𝑎𝑡𝑎−𝑟𝑎𝑡𝑎
14
BAB III
PENGUMPULAN DAN PENGOLAHAN DATA
1 27,3
2 26,8
3 27,3
4 27,3
5 27
6 26,8
7 26
8 25,9
9 26,8
10 27,3
11 28,5
12 28,5
13 20,4
14 20,4
15 20,4
16 26
17 20,4
18 20,4
19 27
20 27
21 20,4
22 26
23 26
24 25,9
15
b. Data Kelompok
Berikut ini adalah data Frekuensi dan Produksi Padi Sawah di
Kecamatan Barru pada Tahun 2010-2023 (Kg).
Tabel 3.2 Produksi Padi Di Kecamatan Barru Pada Tahun 2010-2023
Panen Produksi Padi
1 68,56
2 68,56
3 63,53
4 68,56
5 63,53
6 68,56
7 63,53
8 68,53
9 70,05
10 65,04
11 68,56
12 65,04
13 70,05
14 70,05
15 78,65
16 65,04
17 65,04
18 78,65
19 70,05
20 58,49
21 58,49
22 77,19
23 77,19
24 78,65
25 85,04
26 85,04
27 78,65
28 70,05
29 58,49
30 58,49
16
3.2 Pengolahan Data
A. Visualisasi Data
1. Data Tunggal
a. Distribusi frekuensi
b. Histogram
0
28,5 27,3 27 26,8 26 25,9 20,4
Suhu Udara
17
c. Bar Chart
Data Frekuensi dari Suhu udara 2 minggu pertama
di bulan Februari 2023 di Labuan Bajo Pulau
Flores (CO)
7 6 20,4
2 25,9
5 4 26
3 26,8
3 3 27
4 27,3
1 2 28,5
0 5 10 15 20 25 30
6 6
4 4 4
3 3 Frekuensi
2 2 2
0
20,4 25,9 26 26,8 27 27,3 28,5
18
e. Pareto Chart
20
Nilai Suhu
10 Frekuensi
0
20,4 25,9 26 26,8 27 27,3 28,5
Gambar 3.4 Pareto Chart Data Tunggal
f. Pie Chart
19
b. Histogram
DATA FREKUENSI DAN PRODUKSI PADI SAWAH
DI KECAMATAN BARRU PADA TAHUN 2010-2023
(KG)
12 11 120%
FREQUENCY
10 100% 100%
93%
8 7 80% 80%
73% Frequency
6 4 4 60%
4 37% 2 2 40%
FREKUENSI
2 0 20% KUMULATIF
13%
0 0%
4 60,49
5 7 65,49
11 70,49
3 2 75,49
4 80,49
1 2 85,49
0 20 40 60 80 100
20
d. Line Chart
FREKUENSI
e. Pareto Chart
50
0
85,49 80,49 75,49 70,49 65,49 60,49
7%
13%
13%
7% 23%
37%
21
B. Ukuran Pemutusan Dan Penyebaran Data
1. Data Tunggal
22
2. Data Kelompok
a. Nilai maksimun
Nilai maksimum atau nilai tetinggi untuk data kelompok berdasarkan
data mentah ialah = 85,04.
b. Nilai minimum
Nilai manimum atau nilai terendah untuk data kelompok berdasarkan
data mentah ialah = 58,49
c. Range
R = Xmax – Xmin
= 85,04 – 58,49
=26,55
d. Jumlah kelas
23
K = 1 + 3,33 Log n
= 1 + 3,33 Log 30
=6
e. Interval
𝑅 26,55
𝐼= = =5
𝐾 6
f. Distribusi Frekuensi
g. Mean
∑ 𝐹𝑖𝑀𝑖
𝑥̅ = 𝑁
2119,7
𝑥̅ = 30
𝑥̅ = 70,66
h. Modus
Letak modus berada pada kelas ke 3 dengan jumlah frekuensi 11
𝑑1
Mo = B +𝑑 I
2−𝑑1
4
Mo = 67,99 +9+45
Mo = 69,53
i. Median
𝑛 30
Letak Median = 2 = = 15 maka median berada pada kelas ke -3
2
1
𝑛−𝐹𝐾𝑆
2
Me = B + I
𝑓𝑚𝑒
15−11
Me = 67,99 + 11
5
24
Me = 69,81
j. Kuartil
1) Kuartil 1
𝑛 30
Letak kelas Q1 = 4 = = 7,5, maka kuarti 1 berada pada kelas
4
ke-3
𝑛
−𝐹𝐾𝑆
4
𝑄𝑖= 𝐵 + I
𝑓
30
−4
4
𝑄1 = 67,99 + 5
11
7,5−4
𝑄1 = 67,99 + 5
11
𝑄1 = 69,58
2) Kuartil 3
3𝑛 3(30)
Letak kelas 𝑄3 = = = 22,5, maka kuarti 3 berada pada kelas
4 4
ke-4
3𝑛
−𝐹𝐾𝑆
4
𝑄𝑖 = 𝐵 + I
𝑓
3(30)
−22
4
𝑄1 = 72,99 + 5
2
22,5−22
𝑄1 = 72,99 + 5
2
𝑄1 = 74,24
k. Desil
1) Desil 3
𝑖𝑥𝑛 3 𝑥 30
Letak kelas 𝐷3 = = = 9, maka desil 3 berada pada kelas
10 10
ke-2
3𝑛
−𝐹𝐾𝑆
10
𝐷𝑖 = 𝐵 + I
𝑓
3(30)
−4
10
𝐷3 = 57,99 + 5
7
9−4
𝐷3 = 72,99 + 5
7
25
𝐷3 = 66,56
2) Desil 5
𝑖𝑥𝑛 5 𝑥 30
Letak kelas 𝐷5 = = = 15, maka desil 5 berada pada kelas
10 10
ke-3
5𝑛
−𝐹𝐾𝑆
10
𝐷𝑖 = 𝐵 + I
𝑓
5(30)
−11
10
𝐷5 = 67,99 + 5
11
9−11
𝐷5 = 62,99 + 5
11
𝐷5 = 69,81
3) Desil 9
𝑖𝑥𝑛 9 𝑥 30
Letak kelas 𝐷9 = = = 27, maka desil 9 berada pada kelas
10 10
ke-4
9𝑛
−𝐹𝐾𝑆
10
𝐷𝑖 = 𝐵 + I
𝑓
9(30)
−24
10
𝐷9 = 77,99 + 5
4
27−24
𝐷9 = 77,99 + 5
4
𝐷9 = 81,74
l. Persentil 33
𝑖𝑥𝑛 33 𝑋 30
1) Letak kelas P33 = = = 9,9, maka persentil 33 berada
100 100
𝑃33 = 67,20
2) Persentil 66
26
𝑖𝑥𝑛 66 𝑋 30
Letak kelas P66 = = = 19,8, maka persentil 66 berada
100 100
𝑃66 = 71,99
3) Persentil 89
𝑖𝑥𝑛 89 𝑋 30
Letak kelas P89 = = = 26,7, maka persentil 89 berada
100 100
𝑃89 = 81,37
m. Simpangan Rata-rata (Variansi)
∑ 𝑓𝑖 (𝑀𝑖− 𝑥̅ )2
𝑆2 = 𝑁
1474,17
𝑆2 =
30
𝑆 2 = 43,14
n. Simpangan Baku (Standar Deviation)
𝑆 = √𝑆 2
𝑆 = √7,461122724 x 7,461122724
𝑆 = √55,668
𝑆 = 7,46
Berdasarkan pengolahan data, diperoleh nilai mean pada data
kelompok = 70,66; nilai median pada data kelompok = 69,81; nilai
modus pada data kelompok = 69,53; nilai kuartil 1 pada data kelompok
27
= 69,58; nilai kuartil 3 pada data kelompok = 74,24; nilai desil 3 pada
data kelompok = 66,56; nilai desil 5 pada data kelompok = 69,81; nilai
desil 9 pada data kelompok = 81,74; nilai persentil 33 pada data
kelompok = 67,20; nilai persentil 66 pada data kelompok = 71,29; nilai
persentil 89 pada data kelompok = 81,37; nilai simpangan rata-rata
(variansi) pada data kelompok = 43,14;nilai simpangan baku pada data
kelompok = 7,46.
28
BAB IV
PEMBAHASAN
2. Histogram
Histogram merupakan gambaran grafik yang menampilkan kelas
pada sumbu horizontal dan frekuensi kelas pada sumbu vertikal. Dari
hasil visualisasi data dengan menggunakan metode histogram dapat
disimpulkan bahwa Suhu udara 2 minggu pertama di bulan Februari
2023 di labuan bajo pulau flores (CO) didominasi oleh suhu 20,4
dengan presentase 25% terjadi sebanyak 6 kali,lalu dilanjutkan dengan
suhu 26 dengan presentase 8% terjadi sebanyak 4 kali,dan seterusnya.
3. Bart Chart
Bart Chart merupakan sebuah diagram yang menunjukkan data
spesifik dengan perbandingan jumlah, waktu, atau nama elemen yang
dibandingkan. Dari hasil visualisasi data dengan menggunakan metode
bart chart dapat disimpulkan bahwa Suhu udara 2 minggu pertama di
bulan Februari 2023 dilabuan bajo pulau flores (CO) didominasi oleh
suhu 20,4 dengan presentase 25% terjadi sebanyak 6 kali,lalu
dilanjutkan dengan suhu 26 dengan presentase 8% terjadi sebanyak 4
kali,dan seterusnya.
29
4. Line Chart
Line chart adalah grafik berbentuk garis. Line chart
merupakan grafik garis yang menampilkan kurs penutupan saja, tanpa
melibatkan kurs tertinggi, terendah, dan pembukaan. Satu nilai kurs
penutupan mewakili satu periode. Dari hasil visualisasi data dengan
menggunakan metode Line chart dapat disimpulkan bahwa suhu
udara 2 minggu pertama di bulan Februari 2023 dilabuan bajo pulau
flores (CO) didominasi oleh suhu 20,4 dengan presentase 25% terjadi
sebanyak 6 kali,lalu dilanjutkan dengan suhu 26 dengan presentase
8% terjadi sebanyak 4 kali,dan seterusnya.
5. Pareto Chart
Pareto Chart adalah sebuah diagram batang yang dipadukan
dengan diagram garis untuk merepresentasikan suatu parameter yang
di ukur (bisa berupa frekuensi kejadian atau nilai tertentu) sehingga
dapat diketahui parameter dominan. Diagram batang menunjukan
nilai aktual sedangkan diagram garis menunjukkan nilai prosentase
kumulatif dari setiap parameter yang ditinjau. Dari hasil visualisasi
data dengan menggunakan metode Pareto chart dapat disimpulkan
bahwa Suhu udara 2 minggu pertama di bulan Februari 2023 dilabuan
bajo pulau flores (CO) didominasi oleh suhu 20,4 dengan presentase
25% terjadi sebanyak 6 kali,lalu dilanjutkan dengan suhu 26 dengan
presentase 8% terjadi sebanyak 4 kali,dan seterusnya.
6. Pie Chart
Pie chart atau diagram lingkaran merupakan grafik statistik
berbentuk lingkaran yang dibagi menjadi beberapa irisan dan luasnya
bergantung kepada proporsi numerik atau kuantitas dari data yang
dimiliki. Satu lingkaran menunjukkan bagian utuh atau seratus persen.
Setengah lingkaran menunjukkan proporsi setengah dari total atau
lima puluh persennya, dan seterusnya. Dari hasil visualisasi data
30
dengan menggunakan metode Pie chart dapat disimpulkan bahwa
Suhu udara 2 minggu pertama di bulan Februari 2023 dilabuan bajo
pulau flores (CO) didominasi oleh suhu 20,4 dengan presentase 25%
terjadi sebanyak 6 kali,lalu dilanjutkan dengan suhu 26 dengan
presentase 8% terjadi sebanyak 4 kali,dan seterusnya.
31
4.2 Visualisasi Data Kelompok
A. Analisis metode Visualisasi data
1. Distribusi Frekuensi
Distribusi frekuensi pengelompokkan data Produksi padi sawah
dikecamatan barru pada tahun 2010-2023 (Kg), Memiliki jumlah
kelas yaitu 6 dan interval yang disimbolkan Ci yaitu 5, nilai
maximumnya yaitu 85,04, sedangkan nilai minimum yaitu 58,49 dan
nilai R yaitu 26,65.
2. Histogram
Histogram menggambarkan distribusi frekuensi dengan
menggunakan rangakian persegi panjang yang berdekatan. Dari
hasil visualisasi data menggunakan metode ini dapat disimpulkan
bahwa Produksi padi sawah dikecamatan barru pada tahun 2010-
2023 (Kg) didominasi oleh jumlah produksi sebesar 72,49 terjadi
sebanyak 11 kali selama tahun 2010-2023, dan jumlah produk sawah
terendah berjumlah 87,49 terjadi sebanyak 2 kali.
3. Bart Chart
Dari hasil visualisasi data dengan menggunakan metode bart
chart dapat disimpulkan bahwa Produksi padi sawah dikecamatan
barru pada tahun 2010-2023 (Kg) memiliki jumlah frekuensi
sebanyak 30, yang dimana produksi padi tertinggi berjumlah 85,49
terjadi sebanyak 2 kali.
4. Line Chart
Grafik garis atau line Chart adalah grafik yang menggunakan
titik sebagai poin data dan kemudian titik tersebut disambung
dengan titik berikutnya. Grafik ini merupakan salah satu grafik yang
paling sering digunakan setelah grafik batang. Dari hasil visualisasi
data dengan menggunakan metode Line chart dapat disimpulkan
bahwa Produksi padi sawah dikecamatan barru pada tahun 2010-
2023 (Kg) Pada produksi padi sawah yang berjumlah 70,49 dapat di
32
lihat pada gambar bahwa frekuensi padi sawah sangat tinggi yaitu 11
di bandingkan produksi padi lainnya.
5. Pareto Chart
Diagram Pareto adalah grafik batang yang menunjukkan
masalah berdasarkan urutan banyaknya jumlah kejadian. Urutannya
mulai dari jumlah permasalahan yang paling banyak terjadi sampai
yang paling sedikit terjadi. Dari hasil visualisasi data dengan
menggunakan metode Pareto chart dapat disimpulkan disimpulkan
bahwa Produksi padi sawah dikecamatan barru pada tahun 2010-
2023 (Kg) dapat di lihat pada gambar pareto chart nya yaitu pada
line pertama produksi padi memiliki jumlah produksi tertinggi
hingga sampai ke line ke 6 maka dapat dilihat produksi padi
menurun yaitu berjumlah 60,49.
6. Pie Chart
Pie chart digunakan digunakan untuk menampilkan total
persentase yang harus mencapai 100%, dimana setiap potongan pie
akan menampilkan ukuran tertentu. Bentuk lingkaran dengan cepat
mengaktifkan intuisi kita sebagai pembaca untuk memahami bahwa
kita dapat membagi-bagi pie menjadi beberapa potongan.Dari hasil
visualisasi data dengan menggunakan metode Pie chart dapat
disimpulkan bahwa Produksi padi sawah dikecamatan barru pada
tahun 2010-2023 (Kg), Persentase yang paling rendah yang dilihat
berjumlah 7% dari produksi padi sawah yang berjumlah 75,49 dan
85,49, sedangan persentase padi sawah paling tinggi yaitu berjumlah
37% dari produksi padi sawah sebanyak 70,49.
B. Hasil Analisis Perbedaan Penggunaa metode Visualisasi
Visualisasi data dengan menggunakan metode histogram
memberikan gambaran peningkatan frekuensi suhu udara selama 2
minggu pertama dalam tabel dari diagram ini lebih banyak dibandingkan
pada data tunggal yaitu di tambahkan persentase kumulatif yang dapat
kita lihat bahwa persentase kumulatif ini meningkat. Adapun visualisasi
33
data dengan menggunakan metode Bar Chart dapat dilihat hasilnya
bahwa produksi padi sawah ini tinggi dengan frekuensi yg baik pada
frekuensi yang paling banyak yaitu 11 kali dengan produksi padi sawah
sebanyak 70,49; Selanjutnya, visualisai data dengan menggunakan
metode Line chart memberikan gambaran grafik lebih mudah untuk
melihat arah pergerakan kurs.
Selanjutnya, visualisasi data dengan menggunakan metode Pareto
Chart dapat mengatasi masalah dengan signifikan karena Cuma ada 1
garis yg kita dapat untuk lebih mudah melihat hasilnya, Pareto chart atau
diagram pareto sendiri sering digunakan untuk mencari penyebab atau
faktor dominan dari suatu masalah Hampir sama dengan histogram pada
data kelompok ini namun perbedaanya pada diagram batangnya memiliki
jarak yang memudahkan kita melihat kelompoknya pada masing masing
hasil produksi padi. Sedangkan visualisasi data dengan menggunakan
metode Pie Chart dapat dilihat persentase kumulatifnya sama dengan
pada histogram tapi yang membedakan diagramnya yaitu pada pie chart
diagramnya seperti potongan pizza dan lebih menarik untuk di
persentasekan.
34
0,599755888. Sampel variansi sebanyak 8,632971014. Kurtosis
sebanyak -0,675460253. Skewness sebanyak -1,022723003. Adapun
Range (jarak) sebanyak 8,1. SUM (Jumlah) sebanyak 605,8 serta count
(total) sebanyak 24 data.
A. Ukuran pemusatan
Berdasarkan observasi Produksi padi sawah dikecamatan barru
pada tahun 2010-2023 (Kg), rata-rata (mean) produksi padi sawah yang
diperoleh yaitu 69,51166667. Nilai tengah (median) dari produksi padi
sawah terdapat pada 68,56 serta produksi padi sawah yang paling banyak
yaitu 68,56.
B. Ukuran penyebaran data
Berdasarkan observasi Produksi padi sawah dikecamatan barru
pada tahun 2010-2023 (Kg),nilai maksimum yang diperoleh yaitu 85,04.
nilai minimum yang diperoleh yaitu 58,49, Standar deviationnya yaitu
7,461122724 serta standard error yaitu 1,362208407, sample variance
yaitu 55,6683523,kurtosis sebanyak -0,386047285,skewness sebanyak
0,452482368,adapun range (jarak) sebanyak 26,55,SUM (Jumlah)
sebanyak 2085,35,serta count (total) sebanyak 30 data.
35
BAB V
PENUTUP
5.1 Kesimpulan
Kesimpulannya adalah pada visualisasi data tunggal dan data kelompok
menggunakan 5 gambar grafik yaitu Histogram, Bart chart, Line chart, Pareto
chart, dan Pie chart. Adapun perbedaan hasil analisis perbedaan antara data
tunggal dan data kelompok terdapat pada tabel distribusi frekuensi yang
dimana pada data tunggal terdiri dari nilai, frekuensi, serta persentase
sedangkan pada tabel distribusi frekuensi data kelompok terdiri dari kelas,
interval, nilai tengah, tepi kelas, frekuensi, frekuensi kumulatif, persentase, dan
persentase kumulatif.
Adapun Berdasarkan Hasil Pengolahan Data, di dapat Nilai Mean Pada
Data Tunggal yaitu 25,24166667,Nilai Median Pada Data Tunggal yaitu 26,4;
Nilai Modus Pada Data Tunggal =20,4; Range Pada Data Tunggal yaitu
8,1;Nilai Maksimum Pada Data Tunggal yaitu 28,5; dan Nilai Minimum Pada
Data Tunggal yaitu 20,4.
5.2 Saran
Dalam melakukan praktikum kita harus benar-benar teliti dalam
penyajian data baik data tunggal maupun data kelompok supaya mendapatkan
hasil dari data sesuai yang kita inginkan dan juga harus Mengikuti arahan dari
dosen/asisten dosen supaya praktikum berjalan dengan lancar. Diharapkan
dalam data yang disajikan berisi data yang jelas dan dijelaskan serinci rincinya
agar dapat dimengerti dengan mudah oleh pembaca.
36
DAFTAR PUSTAKA
Dyah, N.A. 2019. Statitistik Deskriptif dan Regresi Liner Berganda dengan SPSS.
Jurnal Jurusan Akuntansi Fakultas Ekonomi Universitas Semarang.
37
MODUL 2
“UJI VALIDITAS DAN REALIBILITAS”
38
BAB I
PENDAHULUAN
1.1 Latar Belakang
Instrumen memegang peranan yang sangat penting dalam menentukan
mutu suatu penelitian, karena validitas atau kesahihan data yang diperoleh akan
sangat ditentukan oleh kualitas atau validitas instrumen yang digunakan, di
samping prosedur pengumpulan data yang di tempu. Hal ini mudah dipahami
karena instrumen berfungsi mengungkapkan fakta menjadi data, sehigga jika
instrumen yang digunakan mempunyai kualitas yang memadai dalam arti valid
dan reliable maka data yang diperoleh akan sesuai dengan fakta atau keadaan
sesungguhnya di lapangan.
Untuk mengukur kesesuaian, efisiensi dan kemantapan (consistenc) suatu
alat atau penilaian atau tes dipergunakan macam-macam alat seperti validitas,
keandalan, obyektivitas, dan kepraktisan (practicability). Validitas adalah
kualitas yang menunjukkan hubungan antara suatu pengukuran atau diagnosis
dengan arti atau tujuan kriteria belajar atau tingkah laku. Beberapa kriteria dapat
dipilih untuk memperlihatkan keefektifan terhadap peramalan performance
yang akan datang (yang akan terjadi) kriteria yang lain lagi untuk menunjukkan
status yang muncul, kriteria yang lain lagi untuk menimbulkan sifat-sifat yang
refresentatif dariluasnya isi atau tingkah laku, dan kriteria yang lain lagi untuk
melengkapi penyediaan lagi untuk menunjang atau menolak beberapa ikon
psikologis.
Reliabilitas adalah sama dengan konsistensi atau keajengan. Suatu
instrumen evaluasi dikatakan mempunyai nilai reliabilitas tinggi, apabila tes
yang dibuat mempunyai hasil yang konsisten dalam mengukur yang hendak
diukur. Instrumen evaluasi dikatakan memiliki reliabilitas tinggi, berarti hasil
interpretasi instrumen menunjukkan konsistensi yang lebih baik, menunjukkan
betapa yakinnya evaluator atau guru menempatkan sebagai hasil evaluasi, dan
menjadi perhatian para guru agar hasil interpretasi instrumen evaluasi dapat
dioperasionalkan dikelas atau sekolah. Hubungan antara validitas dan
39
reliabilitas sering membingungkan, terutama bagi mereka yang baru pertama
kali bertemu dengan dua Batasan konteks instrumen evaluasi maupun instrumen
penelitian. reliabilitas pengukuran instrumen evaluasi diperlukan untuk
mencapai hasil pengukuran yang valid. Dalam kaitannya dengan posisi
konsistensi, para guru bisa memiliki instrument evaluasi yang reliabel tanpa
valid, sebaliknya kita mempunyai instrumen valid dengan
reliabilitas yang baik.
40
2. Menganalisis : Analysis – Scale – Reliability Analysis
3. Memasukkan seluruh item variabel X yang valid (dari hasil pengujian
validitas) ke kotak items tanpa skor total (kemudian dengan cara yang
sama untuk Y)
4. Klik statistic, pada Deskriptives For Klik Scale If Item Deleted, klik
Continue.
5. Klik OK dan keluar hasil analisis.
41
BAB II
LANDASAN TEORI
42
yang digunakan. Oleh karena itu membuat instrument yang valid harus
mendapat perhatian setiap peneliti.
Dalam pengujian validitas terhadap kuesioner, dibedakan menjadi 2,
yaitu validitas faktor dan validitas item. Validitas faktor diukur bila item yang
disusun menggunakan lebih dari satu faktor (antara faktor satu dengan yang
lain ada kesamaan). Pengukuran validitas faktor ini dengan cara
mengkorelasikan antara skor faktor (penjumlahan item dalam satu faktor)
dengan skor total faktor (total keseluruhan faktor). Sedangkan Validitas item
ditunjukkan dengan adanya korelasi atau dukungan terhadap item total (skor
total), perhitungan dilakukan dengan cara mengkorelasikan antara skor item
dengan skor total item. Bila kita menggunakan lebih dari satu faktor berarti
pengujian validitas item dengan cara mengkorelasikan antara skor item dengan
skor faktor, kemudian dilanjutkan mengkorelasikan antara skor item dengan
skor total faktor (penjumlahan dari beberapa faktor).
Dari hasil perhitungan korelasi akan didapat suatu koefisien korelasi
yang digunakan untuk mengukur tingkat validitas suatu item dan untuk
menentukan apakah suatu item layak digunakan atau tidak. Dalam penentuan
layak atau tidaknya suatu item yang akan digunakan, biasanya dilakukan uji
signifikansi koefisien korelasi pada taraf signifikansi 0,05; artinya suatu item
dianggap valid jika berkorelasi signifikan terhadap skor total.
2.2 Kegunaan Validitas
a. Untuk menghindari pertanyaan yang kurang jelas.
b. Untuk meniadakan kata-kata yang terlalu asing atau kata-kata yang
menimbulkan kecurigaan.
c. Untuk memperbaiki pertanyaan-pertanyaan yang kurang jelas.
d. Untuk menambah item yang diperlukan atau meniadakan item yang
dianggap tidak relevan.
e. Untuk mengetahui validitas kuesioner tersebut.
43
waktunya yang berbeda. Reliabilitas diukur dari koefisien korelasi antara
percobaan pertama dengan yang berikutnya. Bila koefisien korelasi positif dan
signifikan maka instrument tersebut sudah dinyatakan reliable. Pengujian cara
ini sering juga disebut stability.
44
Metode konsistensi internal dilakukan dengan cara memberikan satu
bentuk tes yang hanya diberikan sekali kepada sekelompok subjek (single trial
administration) dengan tujuan untuk menghindari kelemahan pada dua metode
terdahulu. Untuk estimasi reliabilitas, dapat dilihat melalui konsistensi antar
item atau antar bagian tes itu sendiri yang sudah dibelah sebelumnya, dengan
menggunakan teknik komputasi tertentu. Konsep reliabilitas dalam Teori Skor
murni Klasik dapat dipahami dari beberapa interpretasi. Suatu tes dikatakan
sebagai memiliki reliabilitas yang tinggi apabila, misalnya skr tampak tes itu
berkorelasi tinggi dengan skor murninya sendiri. Reliabilitas dapat pula
ditafsirkan sebagai seberapa tingginya korelasi antara tampak pada dua
tes yang paralel.
Dibawah ini adalah berbagai jenis reliabilitas yang biasanya
digunakandalam tes acuan norma (TAN) antara lain adalah sebagai berikut:
a. Reliabilitas antar-pemeriksa (inter rate reliability) Reliabilitas jenis ini
terlihat jika pemeriksa yang berbeda memeriksa hasil tes yang hasilnya
mirip atau sedikit berbeda variasinya. Dua cara terkait
penggunaanreliabilitas antar pemeriksa adalah, a) menguki bagaimana
kemiripan pemeriksa dalam mengkategorisasikan butir soal. b) menguji
bagaimana kemiripan pemeriksa dalam memberi skor butir soal.
Reliabilitas jenis ini juga disebut inter observaser reliability atau intrcoder.
b. Reliabilitas tes-tes ulang (test-retest reliabiity) Reliabilitas jenis ini terlihat
jika pemeriksa yang sama pada saat yang berlainan memperoleh hasil tes
yang mirip. Reliabiitas dapat bervariasi karena pengaruh berbagai faktor,
antara lain disebabkan bagaimana tanggapan seseorang terhadap suasana
hatinya, adanya interupsi. Waktu pengambilan tes dan sebagainya. Pada
umumnya, semakin lama penundaan pemberian tes yang kedua. Semakin
besar variasi hasil tes. Suatu tes yang baik dapat menangani masalah seperti
itu sehingga hanya menghasilkan sedikit perbedaan pada hasilnya. Dengan
kata lain, selang waktu pemberian tes tidak berpengaruh pada hasil tes.
c. Reliabilitas bentuk paralel (paralel form reliability) Reliabilitas bentuk
paralel dapat dilihat tatkala pada saat yang sama, pemeriksaan-pemeriksaan
45
yang berbeda melaksanakan pengujian tes yang berbeda, dengan hasil yang
mirip. Jenis-jenis pertanyaan pada tes berbeda tetapi memiliki konstruksi
tes yang sama. Reliabilitas jenis ini digunakan untuk menilai hasil dari dua
buah tes yang memiiki kosntruksi yang sama. Penilaian bentuk paralel ini
dapat dilaksanakan dalam kombinasi dengan metode lain misalanya
metode belah dua. metode belah dua membagi dua sejumlah butir- butir
soal yang konstruksinya sama dan dilaksanakan pada kelompok siswa
yang sama.
2.4 Cara – Cara Mencari Besarnya Reabilitas
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada
subjek yang sama untuk mengetahui ketetapan ini pada dasarnya dilihat
kesejajaran hasil Seperti halnya beberapa teknik juga menggunakan rumus
korelasi product momen untuk mengetahui validitas, kesejajaran hasil dalam
reliabitas les. Kriterium yang digunakan untuk mengetahui ketetapan ada yang
berada di luar tes (consistency external) dan pada tes itu sendiri (consistency
Internal).
a. Metode bentuk paralel (equivalent)
Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran. dan susunan. tetapi butir-bulir
soalnya berbeda. Dalam Istilah bahasa Inggris disebut alternate-forms
method (parallel forms).
Dengan metode bentuk paralel ini, dua buah tes yang paralel, misalnya
Matematika Seri A yang akan dicari reliabilitasnya dan tes Seri B diteskan
kepada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan.
Koefisien korelasi dari kedua hasil tes inilah yang menunjukkan koefisien
reliabilitas tes seri A. Jika koefisiennya tinggi maka tes tersebut sudah
reliabel dan dapat digunakan sebagai alat pengetes yang terandalkan.
Dalam menggunakan metode tes paralel ini pengetes harus
menyiapkankan dua buah tes, dan masing-masing dicobakan pada
kelompok siswa yang sama. Oleh karena itu, ada orang menyebutkan
sebagai double testdouble-trial-metodh. Penggunaan metode ini baik
46
karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor
"masih ingat soalnya" yang dalam evaluasi dlsebut adanya practice-effect
dan carry-over effect , artinya ada faktor yang dibawa oleh pengikut tes
karena sudah mengerjakan soal tersebut. Kelemahan dan metode ini
adalah bahwa pengetes pekerjaannya beratkarena harus menyusun dua seri
tes. Lagi pula harus tersedia waktu yang lamauntuk mencobakan dua kali
tes.
b. Metode tes ulang (test retest method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan
dua series. Dalam menggunakan teknik atau metode ini pengetes hanya
memiliki satu seri tes tetapi dicobakan dua kali. Oleh karena tesnya hanya
satu dan dicobakan dua kali, maka metode ini dapat disebut dengan single-
test-double trial method. Kemudian hasil dari kedua kali tes tersebut
dihitung korelasinya. Untuk tes yang banyak mengungkap pengetahuan
(ingatan) dan pemahaman. Oleh karena itu, tenggang waktu antara
pemberian tes pertama dengan kedua menjadi pemasalahan tersendiri. Jika
tenggang waktu terlalu sempit, siswa masih banyak ingat materi.
Sebaliknya kalau tenggang waktu terlalu lama, maka faktor-faktor atau
kondsi tes sudah akan berbeda, dan siswa sendiri barangkali sudah
mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula
terhadap reliabilitas.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan
pemahaman, cara ini kurang mengena karena tercoba akan masih ingat
akan butir- butir soalnya. Oleh karena tenggang waktu akan pemberian tes
pertama dengan kedua menjadi permasalahan tersendiri. jika tenggang
waktu terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalau
tenggang waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah
akan berbeda, dan siswa sendiri barangkali sudah mempelajari sesuatu.
Tentu saja faktor-faktor ini akan berpengaruh pula terhadap reliabilitas.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil
tes pertama. Hal ini tidak mengapa karena pengetes harus sadar akan
47
adanya pragtice effect dan carry over effect. Yang penting adalah adanya
kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh koefisien
korelasi yang tinggi.
c. Metode belah dua atau spilt-half metodh
Kelemahan penggunaan metode dua tes dua kali percobaan dan satu
tesdua kali percobaan diatasi dengan motode ketiga ini yaitu metode belah
dua. Dalam menggunakan metode ini pengetes hanya menggunakan
sebuah tes yang dicobakan satu kali. Oleh karena itu juga disebut singel
test singel trial metodh. Berbeda dengan metode bentuk paralel dan tes
ulang, metode belah duahanya menggunakan sebuah tes dan dicobakan
satu kali. Metode ini disebut juga single-test-trial-method.
Ada dua cara membelah butir soal, yaitu:
a. Membelah item-item genap dan item-item ganjil yang selanjutnya
disebut belahan ganjil-genap.
b. Membelah item-item awal dan item-item akhir yaitu separuh jumlah
padanomor-nomor awal dan separuh jumlah nomor-nomor akhir.
48
BAB III
PENGUMPULAN DAN PENGOLAHAN DATA
49
Tabel 3.3 Rekap Data Responden Keahlian Komputer
50
b. Validasi Untuk X2
Tabel 3.3 Correlation Untuk X2
51
3.2.1 Uji Realibilitas
a. Uji Reliabilitas X1
52
b. Uji Reliabilitas Untuk X2
53
c. Uji Reliabilitas Untuk Y
54
BAB IV
PEMBAHASAN
55
karena nilai r hitungnya lebih besar dari nilai r table sedangkan 6 data
Tidak Valid karena nilai r hitungnya lebih kecil dari nilai r tabel.
Sig 5%
Variabel No. Atribut Keputusan
Sig. Sig 0,05
X1.1 0,003 0,05 Valid
X1.2 0,152 0,05 Tidak Valid
X1.3 0,228 0,05 Tidak Valid
X1.4 0,394 0,05 Tidak Valid
X1.5 0,008 0,05 Valid
X1.6 0 0,05 Valid
X1.7 0 0,05 Valid
X1.8 0 0,05 Valid
COMPUTER X1.9 0,003 0,05 Valid
AXIETY X1.10 0,032 0,05 Valid
(X1) X1.11 0,033 0,05 Valid
X1.12 0 0,05 Valid
X1.13 0,177 0,05 Tidak Valid
X1.14 0 0,05 Valid
X1.15 0,863 0,05 Tidak Valid
X1.16 0,337 0,05 Tidak Valid
X1.17 0,02 0,05 Valid
X1.18 0,036 0,05 Valid
X1.19 0,029 0,05 Valid
56
4.1.2 Hasil Analisis Untuk X2
a. Perbandingan Nilai r Hitung dengan r tabel
Tabel 4.3 Perbandingan Nilai r Tabel X2 Computer Attitude
Sig 5%
No.
VARIABEL r r Keputusan
Atribut
Hitung Tabel
COMPUTER X2.1 0,187 0,361 Tidak Valid
ATTITUDE X2.2 0,626 0,361 Valid
(X2) X2.3 0,006 0,361 Tidak Valid
X2.4 0,286 0,361 Tidak Valid
X2.5 0,413 0,361 Valid
X2.6 0,659 0,361 Valid
X2.7 0,409 0,361 Valid
X2.8 0,626 0,361 Valid
X2.9 0,299 0,361 Tidak Valid
X2.10 0,288 0,361 Tidak Valid
X2.11 0,659 0,361 Valid
X2.12 0,188 0,361 Tidak Valid
X2.13 0,04 0,361 Tidak Valid
X2.14 0,24 0,361 Tidak Valid
X2.15 0,512 0,361 Valid
X2.16 0,01 0,361 Tidak Valid
57
b. Nilai Signifikansi (Sig.) Untuk X2
No. Sig 5%
Variabel Keputusan
Atribut Sig. Sig 0,05
COMPUTER X2.1 0,322 0,05 Tidak Valid
ATTITUDE X2.2 0 0,05 Valid
(X2) X2.3 0,975 0,05 Tidak Valid
X2.4 0,125 0,05 Tidak Valid
X2.5 0,023 0,05 Valid
X2.6 0 0,05 Valid
X2.7 0,025 0,05 Valid
X2.8 0 0,05 Valid
X2.9 0,109 0,05 Tidak Valid
X2.10 0,122 0,05 Tidak Valid
X2.11 0 0,05 Valid
X2.12 0,321 0,05 Tidak Valid
X2.13 0,839 0,05 Tidak Valid
X2.14 0,202 0,05 Tidak Valid
X2.15 0,004 0,05 Valid
X2.16 0,96 0,05 Tidak Valid
58
4.1.3 Hasil Analisis Untuk Y
Sig 5%
No.
VARIABEL r r Keputusan
Atribut
Hitung Tabel
KEAHLIAN Y1 0,431 0,361 Valid
(Y) Y2 0,16 0,361 Tidak Valid
Y3 0,317 0,361 Tidak Valid
Y4 0,505 0,361 Valid
Y5 0,367 0,361 Valid
Y6 0,395 0,361 Valid
Y7 0,547 0,361 Valid
Y8 0,43 0,361 Valid
Y9 0,613 0,361 Valid
Y10 0,344 0,361 Tidak Valid
Y11 0,08 0,361 Tidak Valid
Y12 0,521 0,361 Valid
Y13 0,105 0,361 Tidak Valid
Y14 0,197 0,361 Tidak Valid
Y15 0,505 0,361 Valid
Y16 0,466 0,361 Valid
Y17 0,062 0,361 Tidak Valid
Y18 0,291 0,361 Tidak Valid
Y19 0,206 0,361 Tidak Valid
Y20 0,316 0,361 Tidak Valid
Y21 0,505 0,361 Valid
Y22 0,225 0,361 Tidak Valid
Y23 0,282 0,361 Tidak Valid
Y24 0,196 0,361 Tidak Valid
Y25 0,559 0,361 Valid
Y26 0,543 0,361 Valid
Y27 0,531 0,361 Valid
Y28 0,505 0,361 Valid
Y29 0,307 0,361 Tidak Valid
59
Untuk perbandingan nilai r variabel dengan nilai r hitung dimana Y
memiliki 29 data yang dimana keputusannya menunjukkan 15 data valid
karena nilai r hitungnya lebih besar dari nilai r table sedangkan 14 data
Tidak Valid karena nilai r hitungnya lebih kecil dari nilai r.
60
Y27 0,003 0,05 Valid
Y28 0,004 0,05 Valid
Y29 0,099 0,05 Tidak Valid
61
Untuk uji reliabilitas X1 yang mempunyai 19 data dengan
Cronbach Aslpha > 0,6 dengan semua keputusan nya yang reliable karena
Nilai Cronbatch Alpha lebih besar dari 0,6.
62
4.2.3 Hasil Analisis Untuk Y
4.8 Perbandingan Nilai Cronbatch Alpha Tabel Y Keahlian
Nilai Cronbatch' Alpha
No.
Variabel Cronbatch Cronbatch Keputusan
Atribut
Alpha Alpha > 0,6
KEAHLIAN Y1 0,734 0,06 Reliable
(Y) Y2 0,75 0,06 Reliable
Y3 0,734 0,06 Reliable
Y4 0,73 0,06 Reliable
Y5 0,735 0,06 Reliable
Y6 0,734 0,06 Reliable
Y7 0,721 0,06 Reliable
Y8 0,732 0,06 Reliable
Y9 0,719 0,06 Reliable
Y10 0,737 0,06 Reliable
Y11 0,752 0,06 Reliable
Y12 0,727 0,06 Reliable
Y13 0,76 0,06 Reliable
Y14 0,745 0,06 Reliable
Y15 0,73 0,06 Reliable
Y16 0,73 0,06 Reliable
Y17 0,757 0,06 Reliable
Y18 0,74 0,06 Reliable
Y19 0,742 0,06 Reliable
Y20 0,738 0,06 Reliable
Y21 0,73 0,06 Reliable
Y22 0,746 0,06 Reliable
Y23 0,744 0,06 Reliable
Y24 0,749 0,06 Reliable
Y25 0,723 0,06 Reliable
Y26 0,724 0,06 Reliable
Y27 0,724 0,06 Reliable
Y28 0,73 0,06 Reliable
Y29 0,743 0,06 Reliable
63
Untuk uji reliabilitas Y yang mempunyai 29 data dengan Cronbach
Alpha > 0,6 dengan semua keputusan nya yang reliable karena Nilai
Cronbatch Alpha lebih besar dari 0,6.
64
BAB V
PENUTUP
5.1 Kesimpulan
Pada Validitas terdapat instrumen yang dapat mengukur apa yang
seharusnya diukur. Jadi, validitas lebih menekankan pada alat pengukuran atau
pengamatan. Untuk menguji validitas setiap butir soal maka skor-skor yang ada
pada butir yang dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir
soal dinyatakan skor X dan skor total dinyatakan sebagai skor Y, dengan
diperolehnya indeks validitas setiap butir soal, dapat diketahui butir-butir soal
manakah yang memenuhi syarat dilihat dari indeks validitasnya. Sedangkan
pada reliabilitas mengarah kepada keakuratan dan ketepatan dari suatu alat
ukur dalam suatu prosedur pengukuran. Koefisien reliabilitas mengindikasikan
adanya stabilitas skor yang didapatkan oleh individu, yang merefleksikan
adanya proses reproduksi skor. Skor disebut stabil bila skor yang didapat pada
suatu waktu dan pada waktu yang lain hasilnya relatif sama.
Berdasarkan analisis yang telah dilakukan mengenai uji validitas
Computer Axiety (X1), Computer Attitude (X2), dan Keahlian (Y). Maka dapat
diambil beberapa kesimpulan sebagai berikut yaitu hasil uji validitas yang
dilakukan menunjukan bahwa semua item dinyatakan valid dengan
membandingkan nilai rhitung dengan rtabel pada setiap item menunjukkan
nilai yang lebih besar dari rtabel. Adapun hasil uji realibilitas yang telah
dilakukan terhadap semua item variabel dinyatakan reliable karena nilai
crombach’s alpha (hitung) lebih besar dari nilai crombach’s (tabel) yaitu 0,6.
Karena hasil data analisis X1 (Computer Axiety) Untuk perbandingan
nilai r variabel dengan nilai r hitung dimana X1 (Computer Axiety) memiliki
19 data yang dimana keputusannya menunjukkan 13 data valid karena nilai r
hitungnya lebih besar dari nilai r tabel sedangkan 6 data Tidak Valid karena
nilai r hitungnya lebih kecil dari nilai r tabel. Untuk nilai Signifikan pada X1
(Computer Axiety) memiliki 19 data yang dimana 13 data valid karena nilai
sig lebih kecil dari 0,05 dan 6 data tidak valid karena nilai sig lebih besar dari
65
0,05. Sedangkan untuk analisis hasil data X2 (Computer Attitude) Untuk
perbandingan nilai r variabel dengan nilai r hitung dimana X2 (Computer
attitude) memiliki 16 data yang dimana keputusannya menunjukkan 7 data
Valid karena nilai r hitungnya lebih besar dari nilai r tabel dan 9 data tidak valid
karena nilai r hitungnya lebih kecil dari nilai r tabel. Untuk nilai Signifikan
pada X2 (Computer Attitude) memiliki 16 data yang dimana keputusannya
menunjukkan 7 data valid karena nilai sig lebih kecil dari 0,05 dan 9 data tidak
valid karena nilai sig lebih besar dari 0,05. Sedangkan untuk analisis hasil data
Y (Keahlian) Untuk perbandingan nilai r variabel dengan nilai r hitung dimana
Y (Keahlian) memiliki 29 data yang dimana keputusannya menunjukkan 15
data Valid karena nilai r hitungnya lebih besar dari nilai r tabel dan 14 data
tidak valid karena nilai r hitungnya lebih kecil dari nilai r tabel. Untuk nilai
Signifikan pada Y (Keahlian) memiliki 29 data yang dimana keputusannya
menunjukkan 15 data valid karena nilai sig lebih kecil dari 0,05 dan 14 data
tidak valid karena nilai sig lebih besar dari 0,05. r hitungnya lebih kecil dari
nilai r tabel.
Hasil uji reliabilitas yang telah dilakukan terhadap semua item variabel
dinyatakan reliable karena nilai cronbach’s alpha (hitung) lebih besar dari nilai
cronbach’s (tabel) yaitu 0,6. Hasil analisis data Nilai Cronbatch Alpha X1
(Computer Axiety) adalah Untuk Uji Reliabilitas X1 (Computer Axiety) yang
mempunyai 19 data dengan Cronbach Alpha > 0,6 dengan semua keputusan
nya yang Reliable karena Nilai Cronbatch Alpha lebih besar dari 0,6. Hasil
analisis data Nilai Cronbatch Alpha X2 (Computer Attitude) adalah Untuk Uji
Reliabilitas X2 (Computer Attitude) yang mempunyai 16 data dengan
Cronbach Alpha > 0,6 dengan semua keputusan nya yang Reliable karena Nilai
Cronbatch Alpha lebih besar dari 0,6. Hasil analisis data Nilai Cronbatch Alpha
Y (Keahlian) adalah Untuk Uji Reliabilitas Y (Keahlian) yang mempunyai 29
data dengan Cronbach Alpha > 0,6 dengan semua keputusan nya yang Reliable
karena Nilai Cronbatch Alpha lebih besar dari 0,6.
66
5.2 Saran
Dalam melakukan praktikum kita harus benar-benar teliti dalam penyajian
data supaya mendapatkan hasil dari data sesuai yang kita inginkan dan juga
harus mengikuti arahan dari dosen/asisten dosen supaya praktikum berjalan
dengan lancar.
67
DAFTAR PUSTAKA
68
MODUL 3
“KORELASI DAN REGRESI”
69
BAB I
PENDAHULUAN
1.1 Latar Belakang
Dalam suatu penelitian, terkadang diperlukan analisis mengenai
hubungan antara beberapa variabel penelitian. Analisis yang dilakukan untuk
meneliti variabel-variabel penelitian dapat dilakukan dengan bantuan
statistik. Salah satu cara untuk menganalisis variabel penelitian adalah dengan
menggunakan teknik analisis korelasi dan regresi linear. Karena pentingnya
pemahaman dan pengaplikasian teknik analisis korelasi dan regresi linear,
analisis korelasi dan regresi dilakukan untuk mengetahui hubungan antar
variabel pada studi kasus yang akan dianalisa agar nantinya praktikan dapat
menguasai teknik ini dan dapat memanfaatkan sebagai salah satu teknik
analisa hubungan. Penyelesaian masalah pada regresi dan korelasi linear
membutuhkan kecermatan yang tinggi dalam perhitungannya. Kesalahan
pada perhitungan menyebabkan terjadinya kesalahan penyelesaian
selanjutnya dapat mempengaruhi pengambilan keputusan.
Untuk mengurangi kesalahan pada perhitungan dapat menggunakan
tools atau software seperti excel guna mempercepat proses pengolahan data.
Microsoft Excel berfungsi sebagai software pengolahan angka dan berguna
untuk membuat, mengedit, mengurutkan, menganalisa, serta meringkas data.
Selain itu, Microsoft Excel juga berfungsi untuk melakukan perhitungan
aritmatika dan statistika sehingga dapat membantu menyelesaikan
permasalahan-permasalahan yang berbau logika dan matematika. Regresi
merupakan salah satu analisis yang bertujuan untuk mengetahui pengaruh
suatu variabel terhadap variabel lain. Dalam analisis regresi, variabel yang
mempengaruhi disebut independent variabel (variable bebas) dan variabel
yang dipengaruhi disebut dependent variabel (variabel terikat).
70
1.3 Alat yang digunakan
A. Alat yang Digunakan
1. Perangkat komputer
2. Perangkat lunak pendukung komputasi Microsoft Excel
3. Aplikasi SPSS
B. Bahan yang digunakan
1. Data hasil observasi kuesioner
2. Kertas dan Tinta
71
BAB II
LANDASAN TEORI
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√(𝑛 ∑ 𝑥 2 ) − (∑ 𝑥)2 (𝑛 ∑ 𝑦 2 ) − (∑ 𝑦)2
72
Keterangan :
n = Banyaknya Pasangan data X dan Y
Ʃx = Total Jumlah dari Variabel X
Ʃy = Total Jumlah dari Variabel Y
Ʃ𝑥2 = Kuadrat dari Total Jumlah Variabel X
Ʃ𝑦2 = Kuadrat dari Total Jumlah Variabel Y
Ʃxy = Hasil Perkalian dari Total Jumlah Variabel X dan Y
Diantara sekian banyak teknik-teknik pengukuran asosiasi terdapat dua
teknik korelasi yang sangat popular sampai sekarang, yaitu Korelasi Pearson
Product Moment dan Korelasi Rank Spearman. Pengukuran asosiasi
mengenakan nilai numerik untuk mengetahui tingkatan asosiasi atau
kekuatan hubungan antara variabel. Dua variabel dikatakan berasosiasi jika
perilaku variabel yang satu mempengaruhi variabel yang lain. Jika tidak
terjadi pengaruh, maka kedua variabel tersebut disebut independen. Korelasi
bermanfaat untuk mengukur kekuatan hubungan antara dua variabel atau
lebih dengan skala-skala tertentu, misanya pearson data harus bersekala
interval atau rasio. Spearman dan Kendal menggunakan skala ordinal. Kuat
lemahnya hubungan di ukur menggunakan jarak (range) 0 sampai dengan 1.
Korelasi mempunyai kemungkinan pengujian hipotesis dua arah (two
tailed). Dikatakan korelasi searah jika koefesien korelasi ditemukan positif,
sebalikanya jika koefisien korelasinya ditemukan negatif maka di katakana
korelasi tidak searah. Yang dimaksud koefesien korelasi ialah suatu
pengukuran statistic kovariasi atau asosiasi antara dua variabel. Jika koefesian
korelasi diketemukan tidak Sama dengan nol (0), maka terdapat hubungan
antara dua variabel tersebut. Jika koefesien diketemukan +1, maka hubungan
tersebut disebut hubungan korelasi sempurna atau hubungan linear sempurna
dengan kemiringan (slope) positif.
Sebalikanya, jika koefesien diketemukan -1, maka hubungan tersebut
disebut hubungan korelasi sempurna atau hubungan linear sempurna dengan
kemiringan (slope) negatif. Dalam korelasi sempurna tidak diperlukan lagi
pengujian hipotesis mengenai signifikasi antara variabel yang dikorelasikan,
73
karena kedua variabel mempunyai dua hubungan linear yang sempurna.
Artinya variabel X mempunyai hubungan sangat kuat dengan variabel Y. Jika
korelasi Sama dengan nol (0), maka tidak terdapat hubungan antara kedua
variabel.
Pengukuran asosiasi berguna untuk mengukur kekuatan (strength) dan
arah hubungan-hubungan antar dua variabel atau lebih. Contoh: mengukur
hubungan antar dua variabel: Motivasi kerja dengan produktifitas; Kualitas
layanan dengan kepuasan pelanggan; Tingkat inflasi dengan IHSG.
74
(satu atau lebih) variabel dependen dengan satu (regresi linear sederhana) atau
lebih variabel independen (regresi linier banyak). Salah satu aplikasi dari
regresi linier adalah untuk melakukan prediksi berdasarkan data-data yang
telah dimiliki sebelumnya. Dengan asumsi hubungan di antara variabel-
variabel tersebut dapat didekati oleh suatu persamaan garis lurus, maka model
yang mendekati hubungan antar variabel di data tersebut disebut sebagai
model regresi linear.
Dalam perkembangannya, regresi linier dibagi menjadi dua bagian,
yaitu regresi linier sederhana dan regresi linier berganda. Regresi linier
sederhana adalah model regresi yang digunakan untuk menggambarkan
hubungan antara variabel bebas dan variabel terikat Analisis regresi adalah
metode statistik yang mengamati hubungan antara variabel terikat Y dan
serangkaian variabel bebas X1.....Xn. Tujuan dari metode ini adalah untuk
memprediksi nilai Y untuk nilai X tertentu. Model regresi linier sederhana
adalah model regresi paling sederhana dengan hanya satu variabel bebas X
Analisis regresi memiliki beberapa kegunaan salah satunya untuk
memprediksi variabel terikat Y. Persamaan untuk model regresi linier
sederhana adalah sebagai berikut:
𝑦 = 𝑎 + 𝑏𝑖𝑥𝑖
Dimana :
Y = Variabel terikat
a = Intercept
b = Koefisien variabel
X = Variabel bebas
75
adanya korelasi (hubungan) antar variabel, dan tidak terdapat korelasi
antarvariabel bebasnya (multikolinearitas) untuk regresi ganda.
76
BAB III
PENGUMPULAN DAN PENGOLAHAN DATA
77
Tabel 3.2 Rekap data responden X2 (computer attitude)
COMPUTER ATTITUDE (X2)
PENGARUH KOMPUTER
X2.2 X2.5 X2.6 X2.7 X2.8 X2.11 X2.15 X2TOTAL
4 3 2 4 5 3 4 25
4 3 4 3 5 5 4 28
4 3 4 3 5 3 4 26
4 3 5 3 5 5 3 28
4 4 3 5 5 3 4 28
4 4 4 5 5 4 5 31
5 5 3 5 3 5 4 30
2 5 5 5 3 5 4 29
4 5 4 5 3 5 4 30
3 5 3 3 3 5 4 26
4 5 4 5 4 5 4 31
2 5 5 5 3 5 4 29
4 5 4 5 5 3 4 30
3 5 5 5 3 4 4 29
4 5 4 5 5 5 4 32
4 5 5 5 3 5 4 31
4 5 5 5 4 5 4 32
4 5 4 5 5 4 4 31
5 5 4 5 5 3 3 30
4 2 3 5 3 2 4 23
5 4 3 5 5 4 4 30
4 5 3 5 5 5 3 30
4 5 3 3 5 5 2 27
4 3 4 4 5 3 4 27
4 4 5 3 5 4 4 29
4 5 2 3 3 5 4 26
4 4 4 3 5 4 4 28
5 4 4 5 5 4 4 31
4 4 3 5 5 4 3 28
3 5 5 5 5 5 4 32
78
3.3 Tabel Rekap responden Y1 (keahlian komputer)
KEAHLIAN (Y1)
KEAHLIAN KOMPUTER
Y1.1 Y1.4 Y1.5 Y1.6 Y1.7 Y1.8 Y1.9 Y1.12 Y1.15 Y1.16 Y1.21 Y1.25 Y1.26 Y1.27 Y1.28 Y1TOTAL
5 4 5 3 3 3 4 4 4 3 5 5 4 5 3 60
4 4 5 4 5 4 4 4 4 4 5 5 5 5 5 67
5 4 5 5 5 5 3 4 4 4 4 5 4 3 5 65
5 4 4 4 4 3 2 4 5 4 5 4 2 2 5 57
3 4 4 4 3 3 3 4 5 3 4 4 4 2 4 54
2 4 3 3 2 3 4 3 5 3 3 3 3 4 4 49
2 5 2 4 4 4 4 4 4 4 4 4 3 2 5 55
4 5 4 4 4 4 4 3 3 5 4 4 4 4 5 61
2 3 4 5 4 4 4 5 2 3 4 4 4 5 5 58
4 4 4 5 5 4 5 5 4 4 4 5 4 4 4 65
5 4 4 5 4 5 4 5 5 4 4 5 3 4 4 65
4 3 4 4 3 3 3 3 5 4 5 3 4 2 4 54
4 4 4 3 4 4 4 4 4 4 5 5 4 5 4 62
2 3 4 4 3 4 4 4 4 4 4 5 4 4 4 57
5 4 4 4 4 4 4 4 4 3 3 5 5 4 4 61
5 5 5 5 5 4 5 5 4 4 4 5 5 4 4 69
5 4 4 4 4 4 4 5 4 4 2 5 5 4 4 62
3 4 5 4 4 4 3 3 3 3 5 3 5 3 4 56
4 4 4 4 5 4 5 4 4 4 5 4 3 4 4 62
5 5 3 4 5 4 5 4 4 4 5 5 5 4 4 66
5 4 4 5 2 3 5 4 3 4 3 3 3 4 5 57
3 5 4 5 4 3 5 4 4 5 5 3 5 5 4 64
3 4 4 4 5 3 5 4 4 5 5 4 5 4 4 63
4 4 4 3 5 3 3 5 4 4 5 3 3 3 5 58
4 4 4 4 3 4 4 4 4 3 5 4 4 2 3 56
4 4 4 2 4 5 3 5 4 4 5 4 4 4 3 59
3 4 4 5 5 2 3 4 4 2 4 4 4 5 3 56
5 4 4 5 4 4 3 5 4 5 2 5 4 5 3 62
5 5 5 5 5 5 5 5 4 5 2 5 5 3 4 68
3 4 4 5 3 5 4 5 4 5 5 5 4 5 5 66
b. Correlations
Tabel 3.5 Correlations
79
2. Regresi
a. Descriptive Statistics
Tabel 3.6 Descriptive Statistics
b. Anova
Tabel 3.7 Anova
c. Coefficients
Tabel 3.8 Coefficients
d. Model Summary
Tabel 3.9 Model Summary
80
BAB IV
PEMBAHASAN
4.1 Korelasi
a. Descriptive Statistics
1) Computer Anxiety (X1)
Dari tabel Descriptive Statistics rata-rata dari Computer Anxiety (X1)
adalah 51,30 yang dapat diartikan bahwa Computer Anxiety (X1) rata-
rata responden setuju dan sangat setuju terhadap Keahlian komputer
dan standar deviation adalah 5,802 dimana rata-rata data responden
untuk Keahlian komputer diatas antara setuju dan sangat setuju yang
dimana memiliki jumlah data yaitu 30.
2) Computer Attitude (X2)
Dari tabel Descriptive Statistics rata-rata dari Computer Attitude (X2)
adalah 28,90 yang dapat diartikan bahwa Computer Attitude (X2) rata-
rata responden berada diantara setuju dan sangat setuju terhadap
keahlian komputer dan standar deviation adalah 2,234 dimana rata-
rata data responden untuk keahlian komputer diatas sangat tidak
setuju yang dimana memiliki jumlah data yaitu 30.
3) Keahlian komputer (Y)
Dari tabel Descriptive Statistics rata-rata dari Keahlian komputer (Y)
adalah 60,47 yang dapat diartikan bahwa Keahlian komputer (Y) rata-
rata responden setuju dan sangat setuju dipengaruhi terhadap
Computer Anxiety (X1) dan Computer Attitude (X2), standar
deviation adalah 4,480 dimana rata-rata data responden untuk
Keahlian komputer (Y) diatas antara kurang setuju dan setuju yang
dimana memiliki jumlah data yaitu 30.
b. Correlations
1) Membandingkan nilai signifikansi variabel Computer Anxiety (X1)
dan Computer Attitude (X2) dengan variabel keahlian komputer (Y).
81
Variabel (X1) tidak berkolerasi dengan variabel (Y) karena memiliki
nilai signifikansi lebih besar dari 0,05 yaitu 0,456. Sedangkan
Variabel (X2) tidak berkolerasi dengan variabel (Y) karena memiliki
nilai signifikansi lebih dari 0,05 yaitu sebesar 0,258.
2) Berdasarkan Nilai pearson correlation dari variabel Computer
Anxiety (X1) dan Computer Attitude (X2) dengan variabel keahlian
komputer (Y). Dengan nilai r tabel 0,3610, maka variabel X1 tidak
berkolerasi dengan variabel y karena memiliki nilai kurang dari r tabel
yaitu -0,21. Sedangkan Variabel X2 tidak berkolerasi dengan variabel
Y dengan nilai pearson correlation nya sebesar -0,123 lebih kecil dari
nilai r tabel.
3) Nilai person Correlation 0,21 sampai dengan 0,123 berarti derajat
hubungan antara variabel X1dan X2, dengan Y Tidak ada kolerasi.
4.2 Regresi
a. Anova
Berdasarkan output diatas diketahui nilai signifikansi untuk
pengaruh X1 dan X2 secara simultan terhadap Y adalah sebesar 0,806 >
0,05 dan nilai Fhitung 0,217 < Ftabel 3,34, sehingga disimpulkan tidak
terdapat pengaruh Variabel X1 dan X2 secara simultan terhadap variabel
Y.
b. Coefficients
1) Pengujian hipotesis pertama (H1)
Diketehui nilai Sig. untuk pengaruh X1 terhadap Y adalah sebesar
0,892 > 0,05 dan nilai Thitung -0,137 < Ttabel 1,70113, sehingga
dapat disimpulkan bahwa H1 tidak diterima yang berarti tidak terdapat
pengaruh X1 dan Y.
2) Pengujian hipotesis Kedua (H2)
Diketehui nilai Sig. untuk pengaruh X2 terhadap Y adalah sebesar
0,521 > 0,05 dan nilai Thitung -0,650 < Ttabel 1,70113, sehingga
82
dapat disimpulkan bahwa H2 tidak diterima yang berarti tidak terdapat
pengaruh X2 dan Y.
Rumus persamaman Regresi
Y = a + 𝑏𝑖 + 𝑥𝑖
= 69,359 – 0,022𝑥1 – 0,269𝑥2
c. Model Summary
Nilai 𝑅 2 = 0,016 (1,6%) mengartikan bahwa Computer Anxiety (X1)
dan Computer Attitude (X2) memiliki pengaruh sebesar 1,6% terhadap
Keahlian komputer (Y). Sisanya sebesar 98,4% dipengaruhi oleh faktor
lain yang tidak dilibatkan dalam penelitian ini.
83
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan hasil praktikum diatas dapat disimpulkan sebagai berikut :
1. Korelasi
Untuk Computer Anxiety (X1) dan Computer Attitude (X2) dengan
variabel Keahlian komputer (Y). Variabel X1 tidak berkorelasi dengan
variabel Y karena memiliki nilai signifikansi lebih besar dari 0,05 yaitu
0,456. Sedangkan variabel X2 tidak berkorelasi dengan variabel Y karena
memiliki nilai signifikansi lebih dari 0,05 yaitu sebesar 0,258.
2. Regresi
Pada uji t diketahui nilai t hitung untuk pengaruh X1 terhadap Y
adalah 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 -0,137 < 𝑡𝑡𝑎𝑏𝑒𝑙 1,70113; sehingga dapat disimpulkan bahwa
H1 tidak diterima yang berarti tidak terdapat pengaruh X1 dan Y.
Sedangkan pada uji t diketehui untuk pengaruh X2 terhadap Y adalah
Thitung -0,650 < Ttabel 1,70113; sehingga dapat disimpulkan bahwa H2
tidak diterima yang berarti tidak terdapat pengaruh X2 dan Y.
Pada uji f, Berdasarkan output diatas diketahui nilai signifikansi
untuk pengaruh X1 dan X2 secara sumultan terhadap Y adalah sebesar
0,806>0,05 dan nilai 𝑓ℎ𝑖𝑡𝑢𝑛𝑔 0,217 < 𝑓𝑡𝑎𝑏𝑒𝑙 3,34; sehingga dapat
disimpulkan bahwa tidak terdapat pengaruh X1 dan X2 secara simultan terhadap
Y.
5.2 Saran
Dalam melakukan praktikum kita harus benar-benar teliti dalam
penyajian data supaya mendapatkan hasil dari data sesuai yang kita inginkan
dan juga harus mengikuti arahan dari dosen/asisten dosen supaya praktikum
berjalan dengan lancar.
84
DAFTAR PUSTAKA
Abdurahman, Maman dan Sambas Ali Muhidin. 2017. Analisis Korelasi, Regresi,
dan Jalur Dalam Penelitian. Bandung: CV Pustaka Setia
Dyah, N.A. 2019. Statitistik Deskriptif dan Regresi Liner Berganda dengan SPSS.
Jurnal Jurusan Akuntansi Fakultas Ekonomi Universitas Semarang.
Santoso, S. 2017. Menguasai statistik dengan SPSS 24. Elex Media Komputindo.
85
MODUL IV
“ANALISIS CLUSTER”
86
BAB I
PENDAHULUAN
87
data hasil kombinasi antara metric dan non metric. Hal ini dikarenakan hanya
terdapat tiga metode yang dapat digunakan pada software ini. Secara garis
besar, metode dalam analisis cluster terbagi menjadi dua yakni metode hirarki
dan metode non hirarki. Diantara kedua metode tersebut, metode yang paling
terkenal dan sering digunakan adalah metode non hirarki yakni K-Means. Pada
software SPSS, hanya terdapat tiga metode analisis cluster yang dapat
digunakan yakni K-Means, Two-Step Cluster dan metode hirarki. K-Means
merupakan salah satu metode data clustering non hirarki yang berusaha
mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok.
Bahwa metode Two-Step Cluster merupakan suatu metode penggerombolan
yang dapat mengatasi masalah skala pengukuran, data berukuran besar dengan
peubah yang memiliki tipe data kategorik dan kontinyu serta mengetahui
gerombol optimal yang terbentuk. Dapat disimpulkan metode Two-Step
Cluster merupakan metode analisis cluster yang digunakan untuk menangani
data yang bersifat campuran.
WEKA adalah sebuah paket tools machine learning praktis. “WEKA”
merupakan singkatan dari Waikato Environment for Knowledge Analysis, yang
dibuat di Universitas Waikato, New Zealand untuk penelitian, pendidikan dan
berbagai aplikasi. WEKA mampu menyelesaikan masalah-masalah data
mining di dunia-nyata, khususnya klasifikasi yang mendasari pendekatan-
pendekatan machine learning. Perangkat lunak ini ditulis dalam hirarki class
Java dengan metode berorientasi objek dan dapat berjalan hampir di semua
platform. WEKA mudah digunakan dan diterapkan pada beberapa tingkatan
yang berbeda. Tersedia implementasi algoritma-algoritma pembelajaran state-
of-the-art yang dapat diterapkan pada dataset dari command line. WEKA
mengandung tools untuk pre-processing data, klasifikasi, regresi, clustering,
aturan asosiasi, dan visualisasi. User dapat melakukan preprocess pada data,
memasukkannya dalam sebuah skema pembelajaran, dan menganalisa
classifier yang dihasilkan dan performansinya – semua itu tanpa menulis kode
program sama sekali. Contoh penggunaan WEKA adalah dengan menerapkan
sebuah metode pembelajaran ke dataset dan menganalisa hasilnya untuk
88
memperoleh informasi tentang data, atau menerapkan beberapa metode dan
membandingkan performansinya untuk dipilih. Tools yang dapat digunakan
untuk pre-processing data set membuat user dapat berfokus pada algoritma
yang digunakan tanpa terlalu memperhatikan detail seperti pembacaan data
dari file-file, implementasi algoritma filtering, dan penyediaan kode untuk
evaluasi hasil.
1.2 Tujuan Praktikum
a. Mahasiswa mampu mengenali analisis cluster
b. Mahasiswa memahami kegunaan analisis cluster
c. Mahasiswa mengetahui asumsi dari analisis cluster dan mampu
menginterpretasikan output dari model analisis cluster
d. Mahasiswa mampu menggunakan SPSS dan WEKA dalam pengolahan
analisis cluster
89
6. Menganalisis data untuk analisis cluster klik analyze-classify-
kemudian pilih K-Means Cluster
7. Memasukkan seluruh variabel Z-Score kedalam kotak variables.
Kemudian variabel string dimasukkan kedalam kota “label cases by”
Number of Clusters, kemudian save
8. Aktifkan kedua kotak dalam menu save, yaitu “Cluster membership”
dan “Distance from cluster center” selanjutnya tekan tombol
“Continue” untuk kembali ke menu utama
9. Kemudian klik pada kotak “Options” kemudian pada bagian Statistics
aktifkan “Intial cluster centers” dan “ANOVA table” lalu tekan
continue lalu ok
B. Prosedur praktikum WEKA
1. Cari big data di kaggle.com
2. Download data yang di dapatkan dari kaggle
3. Data yang di download akan tersimpan sebagai file Microsoft excel
kemudian save as
4. Data tersebut dengan format cvs
5. Buka aplikasi WEKA, kemudian pilih menu Explorer
6. Setelah itu akan muncul tamilan menu Explorer
7. Lalu pada tab Preprocess, pilih open file dan pilih directory/tempat
8. penyimpanan dataset, kemudian cari tipe file/data yang kita gunakan
dengan format (cvs, Arff, Json, C.45 atau libsvm), lalu pilih data yang
ingin kita proses. Selajutnya pilih open
9. Setelah itu akan muncul setiap Atribut yang ada di dalam dataset, lalu
pilih/centang kolom (Atribut) yang tidak ingin digunakan.
10. Ketika Atribut yang tidak ingin digunakan telah dicentang, kemudian
pilih Remove
11. Setelah itu pilih Tab Cluster dan pilih algoritma yang ingin digunakan
untuk melakukan clustering
12. Lalu pilih algoritma yang ingin digunakan untuk melakukan clustering,
ada beberapa algoritma seperti yang dilihat pada gambar di bawah.
90
Pada percobaan kali ini kita akan mencoba menggunakan algoritma
Simple K-Means
13. Setelah memilih algoritma yang ingin digunakan, selanjutnya kita dapat
mengubah parameter dari algoritma yang dipilih, yaitu dengan cara klik
kiri pada algoritma yang telah dipilih. Lalu kita dapat menentukan
jumlah Cluster yang diinginkan pada option num Clusters terhadap
dataset Mall Customers yang ingin kita teliti
14. Kemudian pilih Start untuk mulai melakukan clustering
15. Lalu untuk melihat visualisasi hasil clustering, klik kanan pada result
list
16. kemudian pilih Visualize Cluster Assigments
17. Kemudian pilih Atribut X dan Y yang ingin di visualisasikan, atribut
yang dipilih ialah Annual Income pada sumbu X dan Spending Score
pada sumbu Y.
18. Hasil clustering berdasarkan atribut Annual Income pada sumbu X &
Spending Score pada sumbu Y akan tampil.
91
BAB II
LANDASAN TEORI
92
2. Membantu mengolah data mentah
Kemudian tujuan lain dari cluster analysis adalah mengolah data mentah
yang didapat dengan cara mengelompokkannya berdasarkan kemiripan
karakteristik. Data yang didapatkan pertama kali biasanya tercampur dan
tidak identik sehingga menyulitkan proses pengolahan data ke tahapan
selanjutnya.
3. Membantu bisnis membuat segmentasi
Dalam ekosistem bisnis, teknik cluster analysis harus dilakukan untuk
mengetahui segmentasi-segmentasi yang ada di pasar. Tidak mungkin
sebuah produk yang diluncurkan dapat mengatasi permasalahan semua jenis
segmentasi. Klasterisasi ini penting agar brand juga dapat menargetkan
produknya ke segmentasi yang tepat sasaran.
2.3 Ciri-ciri Cluster yang baik
Ciri- ciri suatu cluster yang baik yaitu mempunyai:
1. Homogenitas (within-cluster), yaitu kesamaan yang tinggi antar anggota
dalam satu cluster.
2. Heterogenitas (between-cluster), yaitu perbedaan tinggi antar cluster yang
satu dengan cluster yang lain.
93
pengelompokan biasanya ditampilkan dalam bentuk diagram dendogram.
Dendogram digunakan untuk memperjelas pegelompokan dalam metode
hierarki.
2. Metode Non Hierarki
xPerbedaan dasar dalam metode non-hierarki dan metode hierarki ini
adalah ditentukan terlebih dahulu jumlah kelompok sebelum
pengelompokan dilakukan. Metode mengelompokan individu atau objek
dalam kelompok sedemikian rupa sehingga jarak antar individu ke pusat
kelompok minimum. Metode non-herarki yang paling banyak digunakan
adalah metode K-means. Metode non-hierarki ini dimulai dengan memilih
sejumlah nilai cluster awal sesuai yang diinginkan. Selanjutnya objek-objek
penelitian digabungkan dalam cluster-cluster tersebut.
94
dibuat di Universitas Waikato, New Zealand untuk penelitian, pendidikan dan
berbagai aplikasi. WEKA mampu menyelesaikan masalah-masalah data
mining di dunia-nyata, khususnya klasifikasi yang mendasari pendekatan-
pendekatan machine learning. Perangkat lunak ini ditulis dalam hirarki class
Java dengan metode berorientasi objek dan dapat berjalan hampir di semua
platform.
WEKA mudah digunakan dan diterapkan pada beberapa tingkatan yang
berbeda. Tersedia implementasi algoritma-algoritma pembelajaran state- of-
theart yang dapat diterapkan pada dataset dari command line. WEKA
mengandung tools untuk pre-processing data, klasifikasi, regresi, clustering,
aturan asosiasi, dan visualisasi. User dapat melakukan preprocess pada data,
memasukkannya dalam sebuah skema pembelajaran, dan menganalisa
classifier yang dihasilkan dan performansinya semua itu tanpa menulis kode
program sama sekali. Contoh penggunaan WEKA adalah dengan menerapkan
sebuah metode pembelajaran ke dataset dan menganalisa hasilnya untuk
memperoleh informasi tentang data, atau menerapkan beberapa metode dan
membandingkan performansinya untuk dipilih. Tools yang dapat digunakan
untuk pre-processing dataset membuat user dapat berfokus pada algoritma
yang digunakan tanpa terlalu memperhatikan detail seperti pembacaan data
dari file-file, implementasi algoritma filtering, dan penyediaan kode untuk
evaluasi hasil. WEKA menyediakan tiga interface untuk mengolah dataset,
yaitu :
a. Explorer
Digunakan untuk mencari algoritma yang paling cocok untuk data. Semua
data diload ke memori sehingga dapat cepat diproses, tapi hanya dapat
digunakan untuk data dengan jumlah terbatas.
b. Eksperimenter
Digunakan untuk mencari parameter yang cocok. Mirip dengan explorer
tetapi prosesnya dapat diautomatisasi. Eksperimen ukuran besar (multi
machine dengan RMI) dapat dilakukan dengan interface ini.
95
C. Knowledgeflow
Digunakan untuk memproses data stream. Konfigurasi proses dapat diatur
dengan mudah dan dapat menangani data berukuran besar. Mendukung
incremental learning.
96
BAB III
PENGUMPULAN DAN PENGOLAHAN DATA
97
Tabel 3.2 Bigdata superstore
Id,Year_Birth,Education,Marital_Status,Income,Kidhome,Teenhome,Dt_Customer,Recency,MntWines,MntFruits,MntMeatProducts,MntFishProducts,MntSweetProducts,MntGoldProds,NumDealsPurchases,NumWebPurchases,NumCatalogPurchases,NumStorePurchases,NumWebVisitsMonth,Response,Complain
1826,1970,Graduation,Divorced,84835,0,0,6/16/2014,0,189,104,379,111,189,218,1,4,4,6,1,1,0
1,1961,Graduation,Single,57091,0,0,6/15/2014,0,464,5,64,7,0,37,1,7,3,7,5,1,0
10476,1958,Graduation,Married,67267,0,1,5/13/2014,0,134,11,59,15,2,30,1,3,2,5,2,0,0
1386,1967,Graduation,Together,32474,1,1,11/5/2014,0,10,0,1,0,0,0,1,1,0,2,7,0,0
5371,1989,Graduation,Single,21474,1,0,8/4/2014,0,6,16,24,11,0,34,2,3,1,2,7,1,0
7348,1958,PhD,Single,71691,0,0,3/17/2014,0,336,130,411,240,32,43,1,4,7,5,2,1,0
4073,1954,2n Cycle,Married,63564,0,0,1/29/2014,0,769,80,252,15,34,65,1,10,10,7,6,1,0
1991,1967,Graduation,Together,44931,0,1,1/18/2014,0,78,0,11,0,0,7,1,2,1,3,5,0,0
4047,1954,PhD,Married,65324,0,1,11/1/2014,0,384,0,102,21,32,5,3,6,2,9,4,0,0
9477,1954,PhD,Married,65324,0,1,11/1/2014,0,384,0,102,21,32,5,3,6,2,9,4,0,0
2079,1947,2n Cycle,Married,81044,0,0,12/27/2013,0,450,26,535,73,98,26,1,5,6,10,1,0,0
5642,1979,Master,Together,62499,1,0,9/12/2013,0,140,4,61,0,13,4,2,3,1,6,4,0,0
10530,1959,PhD,Widow,67786,0,0,7/12/2013,0,431,82,441,80,20,102,1,3,6,6,1,1,0
2964,1981,Graduation,Married,26872,0,0,10/16/2013,0,3,10,8,3,16,32,1,1,1,2,6,0,0
10311,1969,Graduation,Married,4428,0,1,5/10/2013,0,16,4,12,2,4,321,0,25,0,0,1,0,0
837,1977,Graduation,Married,54809,1,1,11/9/2013,0,63,6,57,13,13,22,4,2,1,5,4,0,0
10521,1977,Graduation,Married,54809,1,1,11/9/2013,0,63,6,57,13,13,22,4,2,1,5,4,1,0
10175,1958,PhD,Divorced,32173,0,1,1/8/2013,0,18,0,2,0,0,2,1,1,0,3,4,0,0
1473,1960,2n Cycle,Single,47823,0,1,7/23/2013,0,53,1,5,2,1,10,2,2,0,3,8,0,0
2795,1958,Master,Single,30523,2,1,1/7/2013,0,5,0,3,0,0,5,1,1,0,2,7,0,0
2285,1954,Master,Together,36634,0,1,5/28/2013,0,213,9,76,4,3,30,3,5,2,5,7,0,0
115,1966,Master,Single,43456,0,1,3/26/2013,0,275,11,68,25,7,7,3,5,1,8,5,0,0
10470,1979,Master,Married,40662,1,0,3/15/2013,0,40,2,23,0,4,23,2,2,1,3,4,0,0
4065,1976,PhD,Married,49544,1,0,12/2/2013,0,308,0,73,0,0,23,2,5,1,8,7,0,0
10968,1969,Graduation,Single,57731,0,1,11/23/2012,0,266,21,300,65,8,44,4,8,8,6,6,0,0
5985,1965,Master,Single,33168,0,1,10/13/2012,0,80,1,37,0,1,3,3,2,1,4,7,0,0
5430,1956,Graduation,Together,54450,1,1,9/14/2012,0,454,0,171,8,19,32,12,9,2,8,8,0,0
8432,1956,Graduation,Together,54450,1,1,9/14/2012,0,454,0,171,8,19,32,12,9,2,8,8,0,0
453,1956,PhD,Widow,35340,1,1,6/29/2014,1,27,0,12,0,1,5,2,2,0,3,5,0,0
Adapun data yang kita olah adalah data yang diperoleh dari web
kaggel.com yaitu superstore marketing campaign Dataset.
98
Tabel 3.4 Intial Cluster Centers
99
Tabel 3.6 Final Cluster Centers
100
3.2.2 Pengolahan data WEKA
101
Gambar 3.3 Tab Cluster
102
BAB IV
PEMBAHASAN
Data SPSS
4.1.1 Descriptive Statistics
Tabel 4.1 Descriptive Statistics
1. Variabel X1
Pada tabel Descriptive Statistics rata rata respoden untuk X1 adalah
3,21 yang dapat diartikan bahwa X1 rata-rata responden antara kurang
setuju dan setuju terhadap Y dan standar deviation adalah 1,387.
Dengan nilai minimum 1 dan nilai maximum 5 dengan total responden
yaitu 200.
2. Variabel X2
Pada tabel Descriptive Statistics rata rata responden untuk X2 adalah
3,07 yang dapat diartikan bahwa X2 rata-rata responden antara
kurang setuju dan setuju terhadap Y dan standar deviation adalah
1,427. Dengan nilai minimum 1 dan nilai maximum 5 dengan total
responden yaitu 200.
3. Variabel X3
Pada tabel Descriptive Statistics rata rata responden untuk X3 adalah
3,02 yang dapat diartikan bahwa X3 rata-rata responden antara
kurang setuju dan setuju terhadap Y dan standar deviation adalah
1,480. Dengan nilai minimum 1 dan nilai maximum 5 dengan total
responden yaitu 200.
103
4. Variabel X4
Pada tabel Descriptive Statistics rata rata responden untuk X4 adalah
2,92 yang dapat diartikan bahwa X4 rata-rata responden antara tidak
setuju dan kurang setuju terhadap Y dan standar deviation adalah
1,394. Dengan nilai minimum 1 dan nilai maximum 5 dengan total
responden yaitu 200.
5. Variabel Y
Pada tabel Descriptive Statistics rata rata responden untuk Y adalah
2,98 yang dapat diartikan bahwa Y rata-rata responden antara tidak
setuju dan kurang setuju terhadap X1, X2, X3, dan X4. Standar
deviation adalah 1,322. Dengan nilai minimum 1 dan nilai maximum
5 dengan total responden yaitu 200.
1. Variabel X1
Pada tabel intial Cluster Centers untuk rata-rata responden X1
diperoleh cluster 1 adalah -1,59025 yang berarti rata rata responden
X1 antara sangat tidak setuju dan tidak setuju terhadap variable Y.
Untuk rata-rata responden X1 diperoleh cluster 2 adalah -0,86905
yang berarti rata rata responden X1 sangat tidak setuju terhadap
variable Y. Untuk rata-rata responden X1 diperoleh cluster 3 adalah
104
1,29456 yang berarti rata rata responden X1 antara sangat tidak setuju
dan tidak setuju terhadap variable Y.
2. Variabel X2
Pada tabel intial Cluster Centers untuk rata-rata responden X2
diperoleh cluster 1 adalah 0,65189 yang berarti rata rata responden X2
sangat tidak setuju terhadap variable Y. Untuk rata-rata responden X2
diperoleh cluster 2 adalah -1,45097 yang berarti rata rata responden
X2 antara sangat tidak setuju dan tidak setuju terhadap variable Y.
Untuk rata-rata responden X2 diperoleh cluster 3 adalah 1,35284 yang
berarti rata rata responden X2 antara sangat tidak setuju dan tidak
setuju terhadap variable Y.
3. Variabel X3
Pada tabel intial Cluster Centers untuk rata-rata responden X3
diperoleh cluster 1 adalah -1,36482 yang berarti rata rata responden
X3 antara sangat tidak setuju dan tidak setuju terhadap variable Y.
Untuk rata-rata responden X3 diperoleh cluster 2 adalah 1,33779 yang
berarti rata rata responden X3 antara sangat tidak setuju dan tidak
setuju terhadap variabel Y. Untuk rata-rata responden X3 diperoleh
cluster 3 adalah 1,33779 yang berarti rata rata responden X3 antara
sangat tidak setuju dan tidak setuju terhadap variable Y.
4. Variabel X4
Pada tabel intial Cluster Centers untuk rata-rata responden X4
diperoleh cluster 1 adalah -1,59025 yang berarti rata rata responden
X4 antara sangat tidak setuju dan tidak setuju terhadap variable Y.
Untuk rata-rata responden X4 diperoleh cluster 2 adalah 1,49208 yang
berarti rata rata responden X4 antara sangat tidak setuju dan tidak
setuju terhadap variabel Y. Untuk rata-rata responden X4 diperoleh
cluster 3 adalah -1,37730 yang berarti rata rata responden X4 antara
sangat tidak setuju dan tidak setuju terhadap variable Y.
5. Variabel Y
105
Pada tabel intial Cluster Centers untuk rata-rata resonden Y diperoleh
cluster 1 adalah 1,37300 dan cluster 3 adalah -1,33910 yang berarti
rata-rata responden Y antara sangat tidak setuju dan kurang setuju
terhadap variabel X1, X2, X3, dan X4. Sedangkan untuk cluster 2
adalah 0,01695 yang berarti rata-rata responden Y sangat tidak setuju
terhadap variabel X1, X2, X3, dan X4.
106
4.1.4 Final Cluster Centers
Tabel 4.4 Final Cluster Centers
1. Cluster 1
Dalam Cluster 1 yang dimana variabel X1, X2, dan X4, yang kurang
dari rata rata para responden. Hal ini terbukti dari nilai negatif (-)
yang terdapat pada tabel final Cluster Centers. Sedangkan variabel
X3 dan Y, yang lebih dari rata rata para responden. Hal ini terbukti
dari nilai positif (+) yang terdapat pada tabel final Cluster Centers.
2. Cluster 2
Dalam Cluster 2 yang dimana variabel X1 dan X4, yang lebih dari
rata rata para responden. Hal ini terbukti dari nilai positif (+) yang
terdapat pada tabel final Cluster Centers. Sedangkan variabel X2,
X3 dan Y, yang kurang dari rata rata para responden. Hal ini terbukti
dari nilai negatif (-) yang terdapat pada tabel final Cluster Centers.
3. Cluster 3
Dalam Cluster 3 yang dimana variabel X1 dan X2, yang lebih dari
rata rata para responden. Hal ini terbukti dari nilai positif (+) yang
terdapat pada tabel final Cluster Centers. Sedangkan variabel X3,
X4, dan Y, yang kurang dari rata rata para responden. Hal ini terbukti
dari nilai negatif (-) yang terdapat pada tabel final Cluster Centers.
107
4.1.5 Anova
Tabel 4.5 Anova
1. Variabel X1
Berdasarkan output diatas diperoleh nilai signifikansi untuk
pengaruh X1 terhadap Y adalah 0,000 < 0,05 dengan nilai Fhitung
95,272 > Ftabel 2,42, yang berarti bahwa terdapat pengaruh variabel
X1 secara simultan terhadap variabel Y karena nilai F hitung lebih
besar dari pada nilai F tabel.
2. Variabel X2
Berdasarkan output diatas diperoleh nilai signifikansi untuk
pengaruh X2 terhadap Y adalah 0,011 < 0,05 dan nilai Fhitung 4,580
> Ftabel 2,42, yang berarti bahwa terdapat pengaruh variabel X2
secara simultan terdapat pengaruh Variabel Y karena nilai F hitung
lebih besar dari pada nilai F tabel.
3. Variabel X3
Berdasarkan output diatas diketahui nilai signifikansi untuk
pengaruh X3 terhadap Y adalah 0,158 > 0,05 dan nilai Fhitung 1,860
< Ftabel 2,42, yang berarti bahwa tidak terdapat pengaruh variabel
X2 secara simultan terdapat pengaruh Variabel Y karena nilai F
hitung lebih kecil dari pada nilai F tabel.
4. Variabel X4
Berdasarkan output diatas diketahui nilai signifikansi untuk
pengaruh X4 terhadap Y adalah sebesar 0,000 < 0,05 dan nilai
108
Fhitung 150,578 > Ftabel 2,42, yang berarti bahwa terdapat
pengaruh variabel X2 secara simultan terdapat pengaruh Variabel Y
karena nilai F hitung lebih besar dari pada nilai F tabel.
4.1.6 Number of Cases in each Cluster
Tabel 4.6 Number of Cases in each Cluster
Data WEKA
4.2.1 Tab Preprocess
109
hal ini menujukkan keterangan label terhadap atribut yang kita pilih
berdasarkan tipe data yang ada seperti real, boolean (yes, no) atau
sesuai dengan data yang kita diinginkan oleh user. Misal, bila kita pilih
Recency maka keterangan yang akan muncul adalah:
a. Nilai minimum: 0
b. Nilai maksimum: 99
c. Rata-rata (Mean): 49,109
d. Standar deviasinya: 28,962
Hal tersebut muncul karena atrribute Recency mempunyai tipe data
real. Begitupula dengan attribute Num Deals Purchases, Num Web
Purchases, Num Catalog Purchases, Num Store Purchases, dan Num
Web Visits Month, maka akan muncul berapa jumlah yang ada pada
datanya. Visualisasi tiap atribut dapat dilihat dengan meng-klik tombol
visualize. Visualisasi ini menggunakan diagram batang, yang
mengilustrasikan jumlah dari masing-masing tipe pada atribut yang
ada.
110
dengan waktu yang dibutuhkan untuk membangun model yaitu 0 detik.
Dapat dilihat pada performan data, pengklasifikasiannya yaitu dari
2240; -0,0526 coefficient diklasifikasikan dengan benar adapun untuk
rata-rata kesalahan absolut yaitu sebesar 2.0005 dan Root Mean
Squuared Error sebesar 2.4269 serta Relatif Absolut Error dan Root
Relatif Squared Error dengan nilai 100%.
111
d. Final cluster cendroids :
1) Recency
Full data : 49.1094
Cluster 0 : 21.2326 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 49.1094
Cluster 1 : 73.8967 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 49.1094
Cluster 2 : 53.0683 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 49.1094
2) Num Deals Purchases
Full data : 2.325
Cluster 0 : 2.3819 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 2.325
Cluster 1 : 2.373 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 2.325
Cluster 2 : 2.1817 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 2.325
3) Num Web Purchases
Full data : 4.0848
Cluster 0 : 3.6548 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 4.0848
Cluster 1 : 3.367 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 4.0848
Cluster 2 : 5.655 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 4.0848
4) Num Catalog Purchases
Full data : 2.6621
Cluster 0 : 1.9315 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 2.6621
Cluster 1 : 1.7728 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 2.6621
112
Cluster 2 : 4.8767 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 2.6621
5) Num Store Purchses
Full data : 5.7902
Cluster 0 : 4.3696 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 5.7902
Cluster 1 : 3.966 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 5.7902
Cluster 2 : 10.2267 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 5.7902
6) Num Web Visit Month
Full data : 5.3165
Cluster 0 : 5.8311 dilihat dari nilai rata-rata (mean) nilai cluster
0 memenuhi nilai mean karena > 5.3165
Cluster 1 : 5.9271 dilihat dari nilai rata-rata (mean) nilai cluster
1 memenuhi nilai mean karena > 5.3165
Cluster 2 : 5.7783 dilihat dari nilai rata-rata (mean) nilai cluster
2 memenuhi nilai mean karena > 5.3165
113
Gambar 4.6 Visualize Cluster Assigment
114
BAB V
PENUTUP
5.1 Kesimpulan
Dari data SuperStore yang telah diolah menggunakan WEKA, maka
diperoleh dataset dengan intances sebanyak 2240 dengan 6 atribut yang
tersedia yaitu Recency, Num Deals Purchases, Num Web Purchases, Num
Catalog Purchases, Num Store Purchases, dan Num Web Visits Month yang
memperoleh hasil minimum sejumlah 0 dengan data maksimum sebanyak 99
dengan nilai Rata-rata (Mean) 49,109 yang dapat disimpulkan bahwa rata-rata
tersebut merupakan rata-rata atribut recency yang apabila diatas nilai rata-rata
maka respon pelanggan tersebut termasuk kategori respon positif dan jika
dibawah nilai rata-rata maka respon pelanggan termasuk kategori respon
negatif.
Pada Final clusterternya untuk Recency, Num Deals Purchases, Num Web
Purchases, Num Catalog Purchases, Num Store Purchases, dan Num Web
Visits Month cluster 0, cluster 1 dan cluster 2 memenuhi respon positif
pelanggan atau dapat disimpulkan bawa Recency, Num Deals Purchases, Num
Web Purchases, Num Catalog Purchases, Num Store Purchases, dan Num Web
Visits Month dapat dikategorikan sebagai respon positif para pelanggan.
5.2 Saran
Diharapkan untuk mencari data yang dapat diolah pada aplikasi WEKA
dan dapat terbaca pada hasil cluster pastikan bahwa data yang di dapatkan
disusun/dirapikan terlebih dahulu pada kolom Ms. excel dan menyimpan
dengan file csv agar dapat mendukung data pada pengclasteran.
115
DAFTAR PUSTAKA
116
117
118