Anda di halaman 1dari 238

Pedoman Dasar Mengolah Data dengan Program

Aplikasi Statistika

Disertai Perbandingan Hasil dengan SPSS & Minitab

Tulisan Ini Diupdate pada 5 September 2019

Download STATCAL di: www.statcal.org

Berbagai Artikel dan Video Pembelajaran Statistika: www.statcal2019.com

Prana Ugiana Gio (Founder STATCAL): www.pranaugi.com

Rezzy Eko Caraka (Co-Founder STATCAL): http://rezzyekocaraka.com/


KATA PENGANTAR

Alhamdulillah, puji syukur atas kehadirat Allah SWT, karena atas izin-Nya, penulis dapat terus mempertahankan
semangat untuk menulis, dan akhirnya dapat menyelesaikan tulisan ini. Hadirnya tulisan ini, tidak semata-mata atas
usaha penulis sendiri, melainkan atas izin-Nya. Sungguh suatu kebahagiaan bagi penulis bisa berbagi sebagian kecil
ilmu pengetahuan milik-Nya melalui tulisan yang berjudul “Pedoman Dasar Mengolah Data dengan Program
Aplikasi Statistika STATCAL”.

Ucapan terima kasih penulis sampaikan kepada semua pihak yang telah membantu dalam rangka penyelesaian tulisan
ini. Penulis menyadari bahwa tulisan ini tentunya masih perlu perbaikan, sehingga penulis mengharapkan kritik dan
saran yang membangun dari para pembaca agar tulisan ini dapat menjadi lebih baik. Kritik dan saran dapat ditujukan
ke alamat email gioprana89@gmail.com.

Medan, 3 September 2019

Prana Ugiana Gio


Rezzy Eko Caraka
DAFTAR ISI

Bab 1 STATCAL [1]


1.1 Sekilas STATCAL
1.2 Beberapa Contoh Software Statistik Berbayar (Commercial) dan Gratis
1.3 Menginstal STATCAL
1.4 Tim Inti STATCAL
1.5 Apa yang Membuat STATCAL Berbeda?

Bab 2 MENGINPUT DATA DI STATCAL [21]


2.1 Persiapan Data
2.2 Menginput Data Kategori di STATCAL
2.3 Menginput Data Numerik di STATCAL

Bab 3 DESKRIPTIF [30]


3.1 Distribusi Frekuensi Univariat (Menu Distribution of Frequency (Univariate))
3.2 Distribusi Frekuensi Bivariat (Menu Distribution of Frequency (Bivariate))
3.3 Berbagai Ukuran Deskriptif (Menu Descriptive-I (Min, Max, Mean, etc.))
3.4 Distribusi Frekuensi Data Berkelompok (Distribution of Frequency for Grouped Data-I)

Bab 4 MEMBUAT GRAFIK BATANG [43]


4.1 Membuat Grafik Batang Frekuensi (Bar: Frequency-I)
4.2 Membuat Grafik Batang Frekuensi (Bar: Frequency-II)
4.3 Membuat Grafik Batang Rata-Rata (Bar: Average-I)
4.4 Membuat Grafik Batang Rata-Rata (Bar: Average-II)
4.5 Membuat Grafik Batang Frekuensi (Bar: Other-I)
4.6 Membuat Grafik Batang Frekuensi (Bar: Other-II)

Bab 5 MEMBUAT GRAFIK GARIS [64]


5.1 Membuat Grafik Garis Rata-Rata (Line: Average-I)
5.2 Membuat Grafik Rata-Rata (Line: Other-I)
5.3 Membuat Grafik Frekuensi (Line: Other-II)

Bab 6 MEMBUAT GRAFIK LINGKARAN [73]


6.1 Membuat Grafik Lingkaran Frekuensi (Circle-I (Frequency))
6.2 Membuat Grafik Lingkaran Frekuensi (Circle-II (Frequency))

Bab 7 MEMBUAT GRAFIK BOXPLOT [79]


7.1 Membuat Grafik Boxplot (Boxplot-I)
7.2 Membuat Grafik Boxplot (Boxplot-II)

Bab 8 MEMBUAT GRAFIK SCATTER PLOT [84]


8.1 Membuat Grafik Scatter Plot (Scatter Plot-I)
8.2 Membuat Grafik Scatter Plot (Scatter Plot-I)
8.3 Membuat Grafik Scatter Plot (Scatter Plot-II)
8.4 Membuat Grafik Scatter Plot (Scatter Plot-III)
8.5 Membuat Grafik Scatter Plot (Scatter Plot-IV)

Bab 9 MEMBUAT GRAFIK TIME SERIES [102]


9.1 Membuat Grafik Time Series (Time Series-I)
9.2 Membuat Grafik Time Series (Time Series-II)

Bab 10 UJI ASUMSI NORMALITAS POPULASI [111]

Bab 11 UJI ASUMSI KESAMAAN VARIANS POPULASI [117]

Bab 12 UJI BEDA DUA SAMPEL BERPASANGAN [123]


12.1 Contoh Kasus Uji Beda 2 Sampel Berpasangan
12.2 Beberapa Kutipan Isi Buku Mengenai Uji t 2 Sampel Berpasangan dan Uji Wilcoxon
12.3 Uji t 2 Sampel Berpasangan dan Uji Wilcoxon
12.4 Contoh Kasus (Penyelesaian dengan SPSS)
12.5 Contoh Kasus (Penyelesaian dengan STATCAL)

vii
12.6 Contoh Kasus (Penyelesaian dengan Minitab)

Bab 13 UJI BEDA DUA SAMPEL INDEPENDEN [149]


13.1 Contoh Kasus Uji Beda 2 Sampel Independen
13.2 Beberapa Kutipan Isi Buku Mengenai Uji t 2 Sampel Independen dan Uji Mann-Whitney
13.3 Uji t 2 Sampel Independen dan Uji Mann-Whitney
13.4 Contoh Kasus (Penyelesaian dengan SPSS)
13.5 Contoh Kasus (Penyelesaian dengan STATCAL)
13.6 Contoh Kasus (Penyelesaian dengan Minitab)

Bab 14 KORELASI LINEAR PEARSON [172]


14.1 Sekilas Pengertian Korelasi Linear Pearson Berdasarkan Beberapa Buku
14.2 Korelasi Linear Pearson
14.3 Contoh Kurva Linear dan Nonlinear
14.4 Contoh Sebaran Data Linear Sempurna dan Cenderung Linear
14.5 Sebaran Data dari Dua Variabel (Sebaran Data Cenderung Naik/Positif; Turun/Negatif;
Linear Positif Sempurna; Linear Negatif Sempurna)
14.6 Mengukur Keeratan Hubungan Linear antara Dua Variabel dengan Korelasi Linear
Pearson
14.7 Ukuran Pengaruh (Size of an Effect)
14.8 Kapan Uji Asumsi Normalitas Perlu Diuji? Apa Akibatnya Jika Asumsi Normalitas Tidak
Dipenuhi? Pada Kondisi Bagaimana Uji Asumsi Normalitas Dapat Diabaikan? Menggunakan
Pendekatan Apakah Untuk Menguji Keakuratannya?
14.9 Korelasi Linear Pearson Digunakan untuk Pengujian Validitas
14.10 Ketika Akan Melakukan Uji Signifikansi Koefisien Korelasi Pearson, Kapan Uji Asumsi
Normalitas Harus Diuji? Adakah Metode Alternatif Selain dari Korelasi Linear Pearson, ketika
Asumsi Normalitas Tidak Dipenuhi?
14.11 Contoh Kasus Korelasi Linear Pearson dengan STATCAL
14.12 Contoh Kasus Korelasi Linear Pearson dengan STATCAL (Uji Validitas)
14.13 Contoh Kasus Korelasi Linear Pearson dengan STATCAL, SPSS dan Minitab

Bab 15 DATA KINERJA PERUSAHAAN INDONESIA [211]


15.1 Mengakses Data Kinerja Perusahaan Indonesia di STATCAL
15.2 Mencetak Data Kinerja Perusahaan Indonesia ke Microsoft Excel
15.3 Menu Descriptive
15.4 Menu Histogram
15.5 Menu Boxplot dan Outlier
15.6 Menu Correlation Matrix

viii
ix
BAB 1

STATCAL

1.1 Sekilas STATCAL

Saat ini terdapat beberapa software yang menyediakan berbagai metode statistik, mulai dari

yang berbayar (commercial software), maupun yang gratis (free software). Beberapa contoh

dari software statistik berbayar seperti SPSS, Minitab, EViews, SmartPLS, WarpPLS, Mplus,

SAS dan STATA. Gambar 1.1 merupakan logo untuk software statistik SPSS, Minitab,

EViews, SmartPLS, WarpPLS, Mplus, SAS dan STATA.

Gambar 1.1 Beberapa Contoh Software Statistik Berbayar

Sementara beberapa contoh dari software statistik gratis seperti R, Python, JASP, Jamovi,

PSPP, PAST, SOFA. Gambar 1.2 merupakan logo untuk software statistik R, Python, JASP,

Jamovi, PSPP, PAST, SOFA.

Gambar 1.2 Beberapa Contoh Software Statistik Gratis

Biasanya terdapat perbedaan di antara software-software statistik tersebut. Sebagai contoh

dalam hal ketersediaan metode statistik, ketersediaan fitur grafik dan cara mengoperasikan

1
software statistik tersebut. STATCAL juga merupakan software yang menyediakan berbagai

metode statistik. STATCAL bersifat gratis (free) yang dapat didownload di http://statcal.org/.

Gambar 1.3 Logo STATCAL

STATCAL mulai dibuat oleh Prana Ugiana Gio (Founder) dan Rezzy Eko Caraka (Co-

Founder) pada tahun 2017 dan kemudian dikembangkan oleh berbagai pihak, sesuai dengan

kebutuhan.

Gambar 1.4 Prana Ugiana Gio (Founder) & Rezzy Eko Caraka (Co-Founder)

STATCAL dibuat dengan menggunakan bahasa pemrograman R, di RStudio, dengan

menggunakan berbagai paket R (R packages), yang mana paket R shiny adalah paket utama.

STATCAL merupakan software statistik berbasis website. Berbasis website berarti proses

pengolahan dilakukan di browser, seperti Google Chrome, Mozilla Firefox, Internet Explore,

2
Opera dan sebagainya. Namun perlu diingat bahwa pada saat proses proses pengolahan

data tidak perlu terkoneksi internet. Di dalam STATCAL, Anda dapat mengakses secara

langsung berbagai tulisan dan video terkait penggunaan menu-menu di STATCAL. Tulisan

dan video tersebut akan memandu Anda bagaimana cara menggunakan suatu menu di

STATCAL. Di samping itu, beberapa menu di STATCAL dilengkapi bantuan interpretasi

dalam bahas Indonesia yang dapat memudahkan Anda pada saat melakukan interpretasi hasil

statistik.

1.2 Beberapa Contoh Software Statistik Berbayar (Commercial) dan Gratis

Berikut ini diberikan beberapa contoh software statistik komersial (commercial).

 SPSS termasuk software statistik komersial. Anda bisa melihat harganya pada alamat

https://www.ibm.com/products/spss-statistics/pricing.

Starting $99.00 USD per


month.

Gambar 1.5 Diakses Pada 30 Agustus 2019

 Minitab juga termasuk software statistik komersial. Anda bisa melihat harganya pada

alamat https://store.minitab.com/781/purl-minitab?hsCtaTracking=5154e918-0a27-

4888-a658-044191b68987%7Caa8bfed9-a52b-43f4-943b-e11c22d19f4a.

3
Unit price: IDR 28.389.640

Gambar 1.6 Diakses Pada 30 Agustus 2019

 EViews termasuk software statistik komersial. Anda bisa melihat harganya pada

alamat https://www.eviews.com/general/prices/prices.html.

$1.650

Gambar 1.7 Diakses Pada 30 Agustus 2019

4
 SmartPLS termasuk software statistik komersial. Anda bisa melihat harganya pada

alamat https://www.smartpls.com/purchase.

400.00 EUR

Gambar 1.8 Diakses Pada 30 Agustus 2019

 WarpPLS termasuk software statistik komersial. Anda bisa melihat harganya pada

alamat https://www.scriptwarp.com/buy/warppls.htm.

US$. 95

Gambar 1.9 Diakses Pada 30 Agustus 2019

5
 STATA termasuk software statistik komersial. Anda bisa melihat harganya pada

alamat https://www.stata.com/news/student-pricing/.

Gambar 1.10 Diakses Pada 30 Agustus 2019

 SAS termasuk software statistik komersial. Anda bisa melihat harganya pada alamat

https://www.sas.com/en_us/software/how-to-buy.html#mdd-software.

Gambar 1.11 Diakses Pada 30 Agustus 2019

6
Berikut ini diberikan beberapa contoh software statistik gratis.

 PSPP termasuk software statistik gratis. Anda bisa melihat pada alamat

https://www.gnu.org/software/pspp/.

Gambar 1.12 Diakses Pada 31 Agustus 2019

 JASP termasuk software statistik gratis. Anda bisa melihat pada alamat https://jasp-

stats.org/download/.

Gambar 1.13 Diakses Pada 31 Agustus 2019

 PAST termasuk software statistik gratis. Anda bisa melihat pada alamat

https://folk.uio.no/ohammer/past/.
7
Gambar 1.14 Diakses Pada 31 Agustus 2019

 JAMOVI termasuk software statistik gratis. Anda bisa melihat pada alamat

https://www.jamovi.org/.

Gambar 1.15 Diakses Pada 31 Agustus 2019

 SOFA termasuk software statistik gratis. Anda bisa melihat pada alamat

https://www.sofastatistics.com/home.php.

8
Gambar 1.16 Diakses Pada 31 Agustus 2019

 R termasuk software statistik gratis. Anda bisa melihat pada alamat https://www.r-

project.org/.

Gambar 1.17 Diakses Pada 31 Agustus 2019

 Python termasuk software statistik gratis. Anda bisa melihat pada alamat

https://www.python.org/.

9
Gambar 1.18 Diakses Pada 31 Agustus 2019

 STATCAL termasuk software statistik gratis. Anda bisa melihat pada alamat

http://statcal.org/.

Gambar 1.19 Diakses Pada 31 Agustus 2019

1.3 Menginstal STATCAL

STATCAL dapat didownload secara gratis di http://statcal.org/. Untuk menginstal

STATCAL, setidaknya terdapat 4 tahapan, yakni sebagai berikut.

 Tahap pertama adalah menginstal STATCAL.

10
Jalankan installer STATCAL.

Gambar 1.20 Installer STATCAL

Gambar 1.21 Menginstal STATCAL

Pada saat menginstal STATCAL, akan


dibentuk folder bernama “STATCAL” di
lokasi C:/. Biarkan saja!!! Jangan dirubah!!!

Gambar 1.22 Menginstal STATCAL

11
Gambar 1.23 Proses Menginstal STATCAL

 Tahap kedua adalah menginstal R.

Gambar 1.24 Menginstal R


12
Gambar 1.25 Proses Menginstal R

Gambar 1.26 Anda Telah Menginstal R

13
 Tahap ketiga adalah menginstal seluruh paket R yang diperlukan dalam STATCAL.

Copy 2 baris kode berikut

setwd("C:/STATCAL")
source("key.R")

dan pindahkan ke Rterm.

Gambar 1.27 Menginstal Paket R

Gambar 1.28 Proses Menginstal Paket R

14
Gambar 1.29 Proses Menginstal Paket R telah Selesai

 Tahap terakhir adalah memastikan apakah telah tuntas dalam hal menginstal seluruh

paket R yang diperlukan dalam STATCAL.

Gunakan perintah

Source(“check.R”)

untuk memastikan apakah telah tuntas


dalam hal menginstal seluruh paket R
yang diperlukan dalam STATCAL.

15
Gambar 1.30 Proses Menginstal Paket R telah Selesai

Setelah menuntaskan 4 tahapan proses menginstal STATCAL, maka silahkan jalankan

STATCAL.

Gambar 1.31 Selamat!!! Anda Telah Berhasil Menginstal STATCAL!!!

16
1.4 Tim Inti STATCAL

STATCAL memiliki 10 anggota tim inti, yakni:

 Prana Ugiana Gio (Founder).

 Rezzy Eko Caraka (Co-Founder).

 An Suci Azzahra (Secretary).

 Rizki Syahputra (Exchequer).

 Muhammad Ofie (Web Developer and Scientist).

o Meigia Nidya Sari (Member) and Dina Nazriani (Member).

 Mika Debora Br. Barus (Division of Relation and Cooperation Chairman).

o Anil Hakim (Vice Chairman) and Muhammad Khahfi Zuhanda (Member).

Gambar 1.32 Tim Inti STATCAL

17
1.5 Apa yang Membuat STATCAL Berbeda?

Ada beberapa hal yang membuat STATCAL berbeda dengan beberapa software statistik lain.

Dalam STATCAL terdapat menu Youtube (Gambar 1.33). Pada menu Youtube disediakan

berbagai video tutorial terkait penggunaan beberapa menu statistik dalam STATCAL. Video

tutorial tersebut akan memandu Anda bagaimana cara mengoperasikan beberapa menu

statistik dalam STATCAL. Pengguna STATCAL dapat mengaksesnya dengan syarat

terkoneksi internet.

Gambar 1.33 Menu Youtube

Gambar 1.34 Bantuan Interpretasi dalam STATCAL

18
Selain itu dalam STATCAL juga disediakan bantuan interpretasi dalam bahasa Indonesia

pada beberapa menu (Gambar 1.34).

Gambar 1.35 Menu Articles

Dalam STATCAL juga terdapat menu Articles (Gambar 1.35). Pada menu Articles

disediakan berbagai artikel terkait berbagai menu statistik dalam STATCAL. Pengguna

STATCAL dapat mengakses artikel tersebut dengan syarat terkoneksi internet.

Gambar 1.36 Menu Data

19
Terakhir, dalam STATCAL juga terdapat menu Data (Gambar 1.36). Sebagai contoh pada

menu Data disediakan data kinerja perusahaan di Indonesia, dari 9 sektor perusahaan, seperti

return on asset (ROA), return on equity (ROE) dan sebagainya. Pengguna STATCAL dapat

mengakses data tersebut secara offline, serta dapat melakukan analisis statistik secara

langsung pada menu tersebut.

20
BAB 2

MENGINPUT DATA DI STATCAL

Pada pembahasan sebelumnya telah dibahas sekilas mengenai STATCAL. Pada pembahasan

kali ini akan dibahas mengenai persiapan data dan bagaimana cara menginput data di

STATCAL.

2.1 Persiapan Data

Misalkan diberikan contoh data dari 15 siswa seperti pada Gambar 2.1.

Gambar 2.1 Contoh Data 15 Siswa (Data Fiktif)

Berdasarkan data pada Gambar 2.1, data dipersiapkan di Microsoft Excel. Alasan mengapa

data dipersiapkan dalam Microsoft Excel adalah nantinya data tersebut dapat dipindahkan ke

bagian input data di STATCAL, yakni Input Categorical Data dan Input Numeric Data. Di

samping itu STATCAL belum dapat menyimpan data, sehingga data disimpan di Microsoft

Excel. Terdapat 3 bagian warna, yakni:


21
 Bagian warna kuning menyatakan untuk data berjenis kategori.

 Bagian warna pink menyatakan untuk data berjenis numerik.

 Sementara bagian warna hijau menyatakan label untuk data kategori, pada bagian

warna kuning. Sebagai contoh, responden bernama C dengan jenis kelamin laki-laki

(angka 1), golongan darah AB (angka 3) dan hobi olahraga (angka 1).

Diketahui terdapat 3 variabel kategori, yakni jenis kelamin, golongan darah dan hobi.

Sementara terdapat 7 variabel numerik, yakni usia, berat badan, tinggi badan, matematika,

fisika, kimia dan biologi.

2.2 Menginput Data Kategori di STATCAL

Sekarang kita akan menginput data kategori pada Gambar 2.1 (bagian warna kuning) di

STATCAL. Masuk pada wilayah Input Categorical Data (Gambar 2.2).

Gambar 2.2 Wilayah Input Categorical Data

22
Ada beberapa bagian yang perlu diperhatikan, yakni

 Bagian Set Number of Column. Pada bagian ini bertujuan untuk menetapkan jumlah

variabel kategori. Diketahui jumlah variabel kategori sebanyak 3, yakni jenis kelamin,

gologan darah dan hobi, sehingga pada Set Number of Column dapat diisi dengan

bilangan 3 atau lebih dari 3, misalkan 4, 5, 10, 20, 100 dan sebagainya (yang

terpenting isi dengan bilangan ≥ 3).

 Bagian Set Number of Row. Pada bagian ini bertujuan untuk menetapkan jumlah

pengamatan/responden. Diketahui jumlah siswa sebanyak 15 siswa, sehingga pada Set

Number of Row dapat diisi dengan bilangan 15 atau lebih dari 15, misalkan 16, 17,

100, 300 dan sebagainya (yang terpenting isi dengan bilangan ≥ 15).

 Nama variabel kategori diinput pada bagian Name of Variable .

 Sementara label dari variabel kategori diinput pada bagian Label .

Misalkan untuk bagian Set Number


of Column diisi dengan bilangan 20,
sementara untuk bagian Set Number
of Row diisi dengan bilangan 100.

Gambar 2.3

23
Perhatikan Gambar 2.3. Pada Gambar 2.3, untuk bagian Set Number of Column diisi dengan

bilangan 20, sementara untuk bagian Set Number of Row diisi dengan bilangan 100.

Selanjutnya seluruh data variabel kategori, nama variabel kategori dan labelnya dipindahkan

ke STATCAL, seperti pada Gambar 2.4.

Gambar 2.4 Seluruh Data Variabel Kategori di Microsoft Excel


Telah Dipindahkan ke STATCAL

Untuk memastikan apakah Anda telah berhasil atau tidak dalam menginput data kategori di

STATCAL, perhatikan pada bagian Your Categorical Data (Gambar 2.5). Jika data kategori

Anda muncul, maka Anda telah berhasil menginput data kategori di STATCAL. Selamat!!!

24
Gambar 2.5 Memeriksa Keberhasilan Input Data Kategori di STATCAL

Gambar 2.6 adalah contoh ketika Anda gagal menginput data kategori di STATCAL.

Gambar 2.6 Contoh Kegagalan Menginput Data Kategori di STATCAL

2.3 Menginput Data Numerik di STATCAL

Pada pembahasan sebelumnya telah dijelaskan langkah demi langkah menginput data kategori

di STATCAL. Sekarang kita akan menginput data numerik pada Gambar 2.1 (bagian warna

pink) di STATCAL. Masuk pada wilayah Input Numeric Data (Gambar 2.7).

25
Gambar 2.7 Wilayah Input Numeric Data

Ada beberapa bagian yang perlu diperhatikan, yakni

 Bagian Set Number of Column. Pada bagian ini bertujuan untuk menetapkan jumlah

variabel numerik. Diketahui jumlah variabel numerik sebanyak 7, yakni usia, berat

badan, tinggi badan, matematika, fisika, kimia dan biologi, sehingga pada Set

Number of Column dapat diisi dengan bilangan 7 atau lebih dari 7, misalkan 8, 9, 10,

20, 100 dan sebagainya (yang terpenting isi dengan bilangan ≥ 7).

 Bagian Set Number of Row. Pada bagian ini bertujuan untuk menetapkan jumlah

pengamatan/responden. Diketahui jumlah siswa sebanyak 15 siswa, sehingga pada Set

Number of Row dapat diisi dengan bilangan 15 atau lebih dari 15, misalkan 16, 17,

100, 300 dan sebagainya (yang terpenting isi dengan bilangan ≥ 15).

 Nama variabel numerik diinput pada bagian Name of Variable.

26
Gambar 2.8

Perhatikan Gambar 2.8. Pada Gambar 2.8, untuk bagian Set Number of Column diisi dengan

bilangan 20, sementara untuk bagian Set Number of Row diisi dengan bilangan 100.

Selanjutnya seluruh data numerik dipindahkan ke STATCAL, seperti pada Gambar 2.9.

Gambar 2.9 Seluruh Data Numerik di Microsoft Excel


Telah Dipindahkan ke STATCAL

27
Untuk memastikan apakah Anda telah berhasil atau tidak dalam menginput data numerik di

STATCAL, perhatikan pada bagian Your Numeric Data. Jika data numerik Anda muncul,

maka Anda telah berhasil menginput data numerik di STATCAL. Selamat!!!

Gambar 2.9 Memeriksa Keberhasilan Input Data Numerik di STATCAL

Pada bagian Your Numeric Data, terdapat tulisan “Number of NA in Usia = 0” yang berarti

pada data usia tidak terdapat data yang kosong (data lengkap). Gambar 2.10 diberikan contoh

terdapat 2 cell kosong pada usia dan 1 cell kosong pada berat badan.

Terdapat 2 cell kosong pada


variabel usia dan terdapat 1 cell
kosong pada variabel berat
badan.

Gambar 2.10
28
Terdapat 2 cell kosong pada variabel
usia dan terdapat 1 cell kosong pada
variabel berat badan.

Gambar 2.11

29
BAB 3

DESKRIPTIF

Pada pembahasan sebelumnya telah dibahas bagaimana cara menginput data di STATCAL.

Pada pembahasan kali ini akan dibahas mengenai statistika deskriptif, seperti membuat

distribusi frekuensi dan persentase untuk data kategori dan menghitung berbagai ukuran

deskriptif, seperti rata-rata, standar deviasi dan sebagainya.

3.1 Distribusi Frekuensi Univariat (Menu Distribution of Frequency (Univariate))

Berdasarkan data kategori yang telah diinput pada Gambar 2.4, disajikan distribusi frekuensi

dan persentase berdasarkan variabel jenis kelamin, golongan darah dan hobi, seperti pada

Gambar 3.1.

Gambar 3.1 Distribusi Frekuensi dan Persentase berdasarkan


Jenis Kelamin, Golongan Darah dan Hobi

30
Diketahui jumlah pengamatan dengan jenis kelamin laki-laki sebanyak 9 (60%) dan

perempuan sebanyak 6 (40%). Sementara berdasarkan variabel golongan darah, jumlah

pengamatan dengan golongan darah A sebanyak 5 (33,33%), golongan darah B sebanyak 3

(20%), golongan darah AB sebanyak 4 (26.67%) dan golongan darah O sebanyak 3 (20.00%).

Untuk membuat distribusi frekuensi univariat dalam STATCAL, pilih Descriptive =>

Distribution of Frequency (Univariate) (Gambar 3.2).

Gambar 3.2 Menu Distribution of Frequency (Univariate)

Perhatikan Gambar 3.3. Pada kotak Choose Categorical Variable (Multiple Choices),

Multiple Choices berarti Anda dapat memasukkan variabel ke kotak sebelah kanan lebih dari

1 variabel. Pindahkan seluruh variabel kategori ke kotak sebelah kanan. Hasilnya dapat dilihat

pada bagian Result.

Gambar 3.3

31
Gambar 3.4 Bagian Result

Gambar 3.5 Bantuan Interpretasi dalam Bahasa Indonesia

Pada bagian Result juga terdapat bantuan interpretasi dalam bahasa Indonesia (Gambar 3.5).

Tombol Print This Result to Microsoft Excel berfungsi untuk mencetak hasil ke dalam

Microsoft Excel.

32
3.2 Distribusi Frekuensi Bivariat (Menu Distribution of Frequency (Bivariate))

Berdasarkan data kategori yang telah diinput pada Gambar 2.4, disajikan distribusi frekuensi

dan persentase:

 antara golongan darah dan jenis kelamin,

 antara Hobi dan jenis kelamin (Gambar 3.5).

Gambar 3.5 Distribusi Frekuensi Bivariat

Berdasarkan distribusi frekuensi pada Gambar 3.5 diketahui:

 Berdasarkan variabel golongan darah, dari 5 siswa dengan golongan darah A, 3 (60%)

siswa dengan jenis kelamin laki-laki, sementara 2 (40%) dengan jenis kelamin

perempuan. Dari 3 siswa dengan golongan darah B, 1 (33,33%) siswa dengan jenis

kelamin laki-laki, sementara 2 (66,67%) dengan jenis kelamin perempuan. Dari 4

siswa dengan golongan darah AB, 3 (75%) siswa dengan jenis kelamin laki-laki,

sementara 1 (25%) dengan jenis kelamin perempuan. Dari 3 siswa dengan golongan

darah O, 2 (66,67%) siswa dengan jenis kelamin laki-laki, sementara 1 (33,33%)

dengan jenis kelamin perempuan.

33
Untuk membuat distribusi frekuensi bivariat dalam STATCAL, pilih Descriptive =>

Distribution of Frequency (Bivariate) (Gambar 3.6).

Gambar 3.6 Menu Distribution of Frequency (Bivariate)

Gambar 3.7

Perhatikan Gambar 3.7.

 Pada kotak Choose Categorical Variable (Multiple Choices) (Row), pindahkan

variabel golongan darah dan hobi ke kotak sebelah kanan. Multiple Choices berarti

Anda dapat memasukkan lebih dari 1 variabel ke kotak sebelah kanan. Row berarti

variabel golongan darah dan hobi akan menempati posisi baris pada tabel.

 Pada kotak Choose Categorical Variable (Single Choice) (Column), pindahkan

variabel jenis ke kotak sebelah kanan. Single Choice berarti Anda harus memasukkan

34
1 variabel ke kotak sebelah kanan. Column berarti variabel jenis kelamin akan

menempati posisi kolom pada tabel. Hasilnya dapat dilihat pada bagian Result.

Gambar 3.8 Bagian Result

Tombol Print This Result to Microsoft Excel berfungsi untuk mencetak hasil ke dalam

Microsoft Excel.

35
3.3 Berbagai Ukuran Deskriptif (Menu Descriptive-I (Min, Max, Mean, etc.))

Berdasarkan data numerik yang telah diinput pada Gambar 2.9, disajikan beberapa ukuran

deskriptif, seperti minimum, maksimum, rata-rata dan standar deviasi berdasarkan variabel

usia, berat badan, tinggi badan, matematika, fisika, kimia dan biologi (Gambar 3.9).

Gambar 3.9 Beberapa Ukuran Deskriptif berdasarkan Variabel Numerik

Berdasarkan Gambar 3.10, diketahui:

 Diketahui usia minimum siswa adalah 15 tahun, sementara usia maksimum siswa

adalah 17 tahun. Rata-rata usia siswa adalah 15.8667, sementara nilai standar deviasi

dari usia adalah 0.8338.

 Diketahui berat badan minimum siswa adalah 49.12, sementara berat badan

maksimum adalah 71.23. Rata-rata dari berat badan siswa adalah 59.0967, sementara

nilai standar deviasi dari berat badan siswa adalah 5.5545, dan seterusnya.

Untuk menyajikan berbagai ukuran deskriptif seperti pada Gambar 3.9, pilih Descriptive =>

Descriptive-I (Min, Max, Mean, etc.) (Gambar 3.10).

36
Gambar 3.10 Menu Descriptive-I (Min, Max, Mean, etc.)

Perhatikan Gambar 3.11. Pada kotak Choose Numeric Variable (Multiple Choices),

pindahkan seluruh variabel numerik ke kotak sebelah kanan (Gambar 3.11). Hasilnya dapat

dilihat pada bagian Result. Pada bagian Result juga terdapat bantuan interpretasi dalam

bahasa Indonesia (Gambar 3.12).

Gambar 3.11

Gambar 3.12 Bagian Result


37
3.4 Distribusi Frekuensi Data Berkelompok (Distribution of Frequency for Grouped
Data-I)

Misalkan diberikan data nilai ujian matematika dari 25 siswa sebagai berikut (Tabel 3.1).

Tabel 3.1 Data Nilai Ujian Matematika Siswa (Data Fiktif)

No Nama Data Nilai Ujian Matematika Siswa


1 Andi 65
2 Ugi 43
3 Egi 75
4 Rina 78
5 Rini 84
6 Rudi 97
7 Agung 73
8 Tini 46
9 Deri 54
10 Dona 65
11 Danu 68
12 Wiwin 77
13 Cici 95
14 Cecep 64
15 Aan 63
16 Weni 56
17 Arma 66
18 Didi 63
19 Sani 55
20 Soni 56
21 Zeri 67
22 Aldo 89
23 Bima 75
24 Baba 66
25 Tari 78

Tabel 3.2 disajikan nilai minimum, maksimum, rata-rata dan standar deviasi berdasarkan data

pada Tabel 3.1.

38
Tabel 3.2 Statistik Deskriptif

Descriptive Measure Value


Minimum 43
Maximum 97
Mean 68.72
Standard Deviation 13.71
Number of Observation 25

Berdasarkan informasi pada Tabel 3.2, diketahui dari 25 siswa tersebut, nilai ujian

matematika paling rendah adalah 43 (minimum), sementara nilai ujian matematika paling

tinggi adalah 97 (maximum). Rata-rata ujian matematika adalah 68,72, dengan standar deviasi

13,71. Berdasarkan data pada Tabel 3.1, dibentuk tabel distribusi frekuensi dan persentase

data berkelompok seperti pada Tabel 3.3.

Tabel 3.3 Distribusi Frekuensi dan Persentase


berdasarkan Nilai Ujian Matematika Siswa

Kelas Interval Frekuensi Persentase (%)


40-49 2 8
50-59 4 16
60-69 9 36
70-79 6 24
80-89 2 8
90-99 2 8

Berdasarkan data pada Tabel 3.3 diketahui:

 Terdapat 2 (8%) siswa dengan nilai ujian matematika di antara 40 sampai dengan 49.

 Terdapat 4 (16%) siswa dengan nilai ujian matematika di antara 50 sampai dengan 59.

 Dan seterusnya.

39
Gambar 3.13 disajikan grafik batang frekuensi berdasarkan data pada Tabel 3.3.

Gambar 3.13 Grafik Batang Frekuensi

Berdasarkan grafik batang frekuensi pada Gambar 3.13, terlihat bahwa mayoritas siswa

banyak mendapat nilai ujian di antara 60 sampai 69, yakni sebanyak 9 (36%)

(kelas interval ke-3, yakni 60-69). Untuk membuat distribusi frekuensi data berkelompok

seperti pada Tabel 3.3, pilih Descriptive => Distribution of Frequency for Grouped

Data (Gambar 3.14).

Gambar 3.14 Menu Distribution of Frequency for Grouped Data

40
Kemudian pilih Distribution of Frequency for Grouped Data-I (Gambar 3.15).

Gambar 3.15

Kemudian pindahkan data pada Tabel 3.1 ke dalam kotak Give Your Data Below This Box

(Gambar 3.15). Lakukan pengaturan batas bawah dan batas atas kelas interval (Gambar 3.15).

Hasil dapat dilihat pada bagian Result.

41
Gambar 3.16 Result
42
BAB 4

MEMBUAT GRAFIK BATANG

4.1 Membuat Grafik Batang Frekuensi (Bar: Frequency-I)

Berdasarkan data kategori yang telah diinput pada Gambar 2.4, misalkan akan dibuat grafik

batang frekuensi seperti pada Gambar 4.1, berdasarkan variabel golongan darah.

Gambar 4.1 Grafik Batang Frekuensi berdasarkan Golongan Darah

Untuk membuat grafik batang frekuensi seperti pada Gambar 4.1, pilih Graph => Bar

(Gambar 4.2).
43
Gambar 4.2

Gambar 4.3 Menu Bar: Frequency-I

Pada Gambar 4.3, pilih Bar: Frequency-I, kemudian pindahkan variabel golongan darah ke

kotak sebelah kanan. Single Choice berarti Anda hanya dapat memasukkan 1 variabel ke

kotak sebelah kanan. Hasilnya dapat dilihat pada bagian Result (Gambar 4.4). Lakukan

pengaturan grafik sesuai yang Anda inginkan pada bagian Edit Graph.

44
Gambar 4.4 Result

4.2 Membuat Grafik Batang Frekuensi (Bar: Frequency-II)

Berdasarkan data kategori yang telah diinput pada Gambar 2.4, misalkan akan dibuat grafik

batang frekuensi seperti pada Gambar 4.5.

45
Gambar 4.5 Grafik Batang Frekuensi

Berdasarkan grafik batang frekuensi pada Gambar 4.5, diketahui:

 Berdasarkan golongan darah untuk siswa laki-laki, terdapat 3 siswa dengan golongan

darah A, 1 siswa dengan golongan darah B, 3 siswa dengan golongan darah AB dan 2

siswa dengan golongan darah O.

 Berdasarkan golongan darah untuk siswa perempuan, terdapat 2 siswa dengan

golongan darah A, 2 siswa dengan golongan darah B, 1 siswa dengan golongan darah

AB dan 1 siswa dengan golongan darah O.

Gambar 4.6 diperlihatkan grafik batang frekuensi dengan berbagai tampilan.

46
Gambar 4.6 Berbagai Grafik Batang Frekuensi

Untuk membuat grafik batang frekuensi seperti tersebut, pilih Graph => Bar (Gambar 4.7).

47
Gambar 4.7

Gambar 4.8 Bar: Frequency-II

Pada Gambar 4.8, pilih Bar: Frequency-II.

 Pada kotak Choose Categorical Variable (Multiple Choices) (Independent),

variabel golongan darah dan hobi dipindahkan ke kotak sebelah kanan. Multiple

Choices berarti Anda dapat memasukkan variabel lebih dari 1 ke kotak sebelah kanan.

 Pada kotak Choose Categorical Variable (Single Choice) (Dependent), variabel

jenis kelamin dipindahkan ke kotak sebelah kanan. Single Choices berarti Anda hanya

dapat memasukkan 1 variabel ke kotak sebelah kanan.

 Hasilnya dapat dilihat pada bagian Result. Lakukan pengaturan grafik sesuai yang

Anda inginkan pada bagian Result (Gambar 4.9).

48
Gambar 4.9 Result

4.3 Membuat Grafik Batang Rata-Rata (Bar: Average-I)

Berdasarkan data numerik yang telah diinput pada Gambar 2.9, misalkan akan dibuat grafik

batang rata-rata seperti pada Gambar 4.10, berdasarkan variabel matematika, fisika, kimia dan

biologi.

49
Gambar 4.10 Grafik Batang Rata-Rata berdasarkan
Matematika, Fisika, Kimia dan Biologi

Diketahui rata-rata ujian matematika adalah 70,2, dengan standar deviasi 8,28, rata-rata ujian

fisika adalah 69,67, dengan standar deviasi 9,84, dan seterusnya. Untuk membuat grafik

batang rata-rata seperti pada Gambar 4.10, pilih Graph => Bar (Gambar 4.11).
50
Gambar 4.11

Pada Gambar 4.12, pilih Bar: Average-I, kemudian pindahkan variabel matematika, fisika,

kimia dan biologi ke kotak sebelah kanan pada Choose Numeric Variable (Multiple

Choices). Maksud dari Multiple Choices adalah Anda dapat memasukkan lebih dari satu

variabel ke kotak sebelah kanan. Hasil dari grafik batang rata-rata dapat dilihat pada bagian

Result. Lakukan pengaturan grafik sesuai yang Anda inginkan pada bagian Result (Gambar

4.13).

Gambar 4.12 Bar: Average-I

51
Gambar 4.13 Result

4.4 Membuat Grafik Batang Rata-Rata (Bar: Average-II)

Berdasarkan data kategori dan data numerik yang telah diinput pada Gambar 2.4 dan Gambar

2.9, misalkan akan dibuat grafik batang rata-rata seperti pada Gambar 4.14 sampai Gambar

4.17.

52
Gambar 4.14 Grafik Batang Rata-Rata

Berdasarkan grafik batang rata-rata pada Gambar 4.14 diketahui rata-rata nilai matematika

pada laki-laki adalah 72,22 dengan standar deviasi 8,18, sementara rata-rata nilai matematika

pada perempuan adalah 67,17 dengan standar deviasi 8,16. Untuk membuat grafik batang

rata-rata seperti pada Gambar 4.14, pilih Graph => Bar (Gambar 4.15).

Gambar 4.15

Pada Gambar 4.16, pilih Bar: Average-II. Masukkan variabel matematika, fisika, kimia dan

biologi ke kotak sebelah kanan pada Choose Numeric Variable (Multiple Choices),

sementara variabel kategori jenis kelamin juga dipindahkan ke kotak sebelah kanan pada

Choose Categorical Variable (Single Choice). Hasil dari grafik batang rata-rata dapat dilihat
53
pada bagian Result. Lakukan pengaturan grafik sesuai yang Anda inginkan pada bagian

Result (Gamba 4.17).

Gambar 4.16 Bar: Average-II

Gambar 4.17 Result


54
4.5 Membuat Grafik Batang Frekuensi (Bar: Other-I)

Misalkan Tabel 4.1 merupakan data jawaban 10 responden berdasarkan 5 pertanyaan.

Berdasarkan data pada Tabel 4.1, misalkan angka 1 menyatakan sangat tidak setuju (STS),

angka 2 menyatakan tidak setuju (TS), angka 3 menyatakan kurang setuju (KS), angka 4

menyatakan setuju (S), dan angka 5 menyatakan sangat setuju (STS).

Tabel 4.1 Data Jawaban 10 Responden berdasarkan 5 Pertanyaan

Nama P1 P2 P3 P4 P5
A 1 3 4 5 4
B 4 4 5 5 4
C 4 4 5 5 4
D 3 3 4 5 4
E 2 4 5 5 4
F 3 4 4 5 4
G 5 4 3 5 4
H 4 4 2 5 4
I 3 3 3 5 4
J 1 3 4 5 4

Berdasarkan data pada Tabel 4.1, dibuat grafik batang frekuensi, seperti pada Gambar 4.18

dan Gambar 4.19.

Gambar 4.18 Grafik Batang Frekuensi

55
Gambar 4.19 Grafik Batang Frekuensi

Berdasarkan Gambar 4.18 dan Gambar 4.19, diketahui:

 Untuk pertanyaan ke-1 (P1), terdapat 2 (20%) responden menjawab sangat tidak setuju

(STS), responden menjawab tidak sejutu (TS) sebanyak 1 (10%), responden menjawab

kurang setuju (KS) sebanyak 3 (30%), responden menjawab setuju (S) sebanyak 3

(30%) dan responden menjawab sangat setuju (SS) sebanyak 1 (10%).

 Untuk pertanyaan ke-2 (P2), terdapat 4 (40%) responden menjawab kurang setuju

(KS) dan responden menjawab setuju (S) sebanyak 6 (60%).

 Dan seterusnya.

Untuk membuat grafik batang frekuensi seperti pada Gambar 4.28 dan Gambar 4.18, pilih

Graph => Bar (Gambar 4.20).

56
Gambar 4.20

Pada Gambar 4.21, pilih Bar: Other-I.

Gambar 4.21 Bar: Other-I

Pindahkan data pada Tabel 4.1 ke bagian Put Your Data (Gambar 4.22).

57
Gambar 4.22

Kemudian perhatikan bagian Value and Label (Gambar 4.22). Perhatikan bahwa:

 Value 1 menyatakan label sangat tidak setuju (STS).

 Value 2 menyatakan label tidak setuju (TS).

 Value 3 menyatakan label kurang setuju (KS).

 Value 4 menyatakan label setuju (S).

 Value 5 menyatakan label sangat setuju (SS).

Hasil dari grafik batang frekuensi dapat dilihat pada bagian Result (Gambar 4.23).

58
Gambar 4.23 Result

Pada bagian Result juga terdapat hasil tabel distribusi frekuensi dan persentase seperti pada

Gambar 4.24.

Gambar 4.24 Distribusi Frekuensi dan Persentase

Di samping itu, terdapat hasil bantuan interpretasi dalam bahasa Indonesia seperti berikut.

59
Untuk pertanyaan ke-1 (P1), terdapat 2 (20.00%) responden menjawab STS, responden
menjawab TS sebanyak 1 (10.00%), responden menjawab KS sebanyak 3 (30.00%), respon
den menjawab S sebanyak 3 (30.00%) dan responden menjawab SS sebanyak 1 (10.00%)

Untuk pertanyaan ke-2 (P2), terdapat 4 (40.00%) responden menjawab KS dan responde
n menjawab S sebanyak 6 (60.00%)

Untuk pertanyaan ke-3 (P3), terdapat 1 (10.00%) responden menjawab TS, responden m
enjawab KS sebanyak 2 (20.00%), responden menjawab S sebanyak 4 (40.00%) dan respo
nden menjawab SS sebanyak 3 (30.00%)

Untuk pertanyaan ke-4 (P4), seluruh responden menjawab SS.

Untuk pertanyaan ke-5 (P5), seluruh responden menjawab S.

4.6 Membuat Grafik Batang Frekuensi (Bar: Other-II)

Misalkan diberikan data jumlah penduduk berdasarkan 10 kecamatan sebagai berikut.

Tabel 4.2 Jumlah Penduduk berdasarkan 10 Kecamatan (Data Fiktif)

Kecamatan Jumlah Penduduk Jumlah Penduduk (%)


Kecamatan A 2345 6.32
Kecamatan B 3423 9.22
Kecamatan C 1235 3.33
Kecamatan D 5345 14.40
Kecamatan E 4123 11.11
Kecamatan F 7456 20.09
Kecamatan G 1342 3.62
Kecamatan H 5376 14.49
Kecamatan I 5234 14.10
Kecamatan J 1235 3.33
Total 37114 100%

Berdasarkan data pada Tabel 4.2, disajikan grafik batang frekuensi seperti pada Gambar 4.25.

60
Gambar 4.25

Berdasarkan grafik batang frekuensi pada Gambar 4.25, diketahui jumlah penduduk paling

banyak berada pada kecamatan F, dengan jumlah penduduk 7456 (20,09%), sementara jumlah

penduduk paling sedikit berada pada kecamatan J, dengan jumlah penduduk 1235 (3,33%).

Untuk membuat grafik batang frekuensi tersebut, pilih Graph => Bar (Gambar 4.26).

61
Gambar 4.26

Pada Gambar 4.27, pilih Bar: Other-II.

Gambar 4.27 Bar: Other-II

Selanjutnya masukkan data pada Tabel 4.2 ke bagian Input Label, Frequency/Mean &

Percentage/Standard Deviation (Gambar 4.28). Hasil dari grafik batang frekuensi dapat

dilihat pada bagian Result. Lakukan pengaturan grafik sesuai yang Anda inginkan pada

bagian Result (Gambar 4.29).

62
Gambar 4.28

Gambar 4.29 Result

63
BAB 5

MEMBUAT GRAFIK GARIS

5.1 Membuat Grafik Garis Rata-Rata (Line: Average-I)

Berdasarkan data kategori dan data numerik yang telah diinput pada Gambar 2.4 dan Gambar

2.9, misalkan akan dibuat grafik garis rata-rata seperti pada Gambar 5.1.

Gambar 5.1 Grafik Garis Rata-Rata

Grafik garis rata-rata pada Gambar 5.1 merupakan grafik garis rata-rata yang melibatkan 4

varaibel numerik, yakni matematika, fisika, kimia dan biologi, serta melibatkan 1 variabel

kategori, yakni jenis kelamin. Sebagai contoh, diketahui rata-rata nilai matematika pada laki-

laki adalah 72,22 dengan standar deviasi 8,18, sementara rata-rata nilai matematika pada

perempuan adalah 67,17 dengan standar deviasi 8,16. Untuk membuat grafik garis rata-rata

seperti pada Gambar 5.1, pilih Graph => Line (Gambar 5.2).

64
Gambar 5.2

Pada Gambar 5.3, pilih Line: Average-I. Masukkan variabel matematika, fisika, kimia dan

biologi ke kotak sebelah kanan pada Choose Numeric Variable (Multiple Choices),

sementara variabel kategori jenis kelamin juga dipindahkan ke kotak sebelah kanan pada

Choose Categorical Variable (Single Choice). Hasil dari grafik garis rata-rata dapat dilihat

pada bagian Result. Lakukan pengaturan grafik sesuai yang Anda inginkan pada bagian

Result (Gambar 5.4).

Gambar 5.3 Line: Average-I

65
Gambar 5.4 Result

5.2 Membuat Grafik Rata-Rata (Line: Other-I)

Misalkan diberikan data rata-rata tinggi badan berdasarkan siswa kelas I, kelas II dan kelas III

(Tabel 5.1).

Tabel 5.1 Rata-Rata Tinggi Badan berdasarkan Siswa Kelas I, Kelas II dan Kelas III

Kelas Rata-Rata Tinggi Badan


Kelas I 156.34
Kelas II 159.43
Kelas III 165.82

66
Secara rata-rata, tinggi badan siswa kelas III paling tinggi, dibandingkan siswa kelas I dan

kelas II. Data pada Tabel 5.1 disajikan ke dalam grafik garis rata-rata seperti pada Gambar

5.5.

Gambar 5.5 Grafik Garis Rata-Rata

Untuk membuat grafik garis rata-rata seperti pada Gambar 5.5, pilih Graph => Line (Gambar

5.6).

Gambar 5.6

Pada Gambar 5.7, pilih Line: Other-I. Pindahkan data pada Tabel 5.1 seperti pada Gambar

5.7. Hasil dari grafik garis rata-rata dapat dilihat pada bagian Result.

67
Gambar 5.7 Line: Other-I

5.3 Membuat Grafik Frekuensi (Line: Other-II)

Misalkan diberikan data penjualan 4 jenis merek mobil dari tahun 2015 sampai dengan tahun

2017 (Tabel 5.2).

68
Tabel 5.2 Data Penjualan 4 Jenis Mobil dari Tahun 2015 s/d Tahun 2017

Tahun Mobil Jumlah Mobil Terjual


1 1 14
1 2 17
1 3 18
1 4 12
2 1 17
2 2 21
2 3 19
2 4 14
3 1 24
3 2 25
3 3 26
3 4 27

Label
Angka
Tahun Mobil
1 2015 Merek A
2 2016 Merek B
3 2017 Merek C
4 Merek D

Berdasarkan data pada Tabel 5.2 diketahui pada tahun 2015, jumlah mobil yang terjual untuk

mobil merek A sebanyak 14 unit, mobil merek B sebanyak 17 unit, mobil merek C sebanyak

18 unit dan mobil merek D sebanyak 12 unit. Data pada Tabel 5.2 disajikan ke dalam grafik

garis frekuensi seperti pada Gambar 5.8.

Gambar 5.8 Grafik Frekuensi

69
Untuk membuat grafik garis rata-rata seperti pada Gambar 5.8, pilih Graph => Line (Gambar

5.9).

Gambar 5.9

Pada Gambar 5.10, pilih Line: Other-II.

Gambar 5.10 Line: Other-II

Input data pada Tabel 5.2 seperti pada Gambar 5.11.

70
Gambar 5.11

Lakukan pemilihan variabel seperti pada Gambar 5.12.

71
Gambar 5.12 Pemilihan Variabel

Hasil dari grafik garis frekuensi dapat dilihat pada bagian Result. Lakukan pengaturan grafik

sesuai yang Anda inginkan pada bagian Result (Gambar 5.13).

Gambar 5.13 Result

72
BAB 6

MEMBUAT GRAFIK LINGKARAN

6.1 Membuat Grafik Lingkaran Frekuensi (Circle-I (Frequency))

Berdasarkan data kategori yang telah diinput pada Gambar 2.4, misalkan akan dibuat grafik

lingkaran frekuensi seperti pada Gambar 6.1, berdasarkan variabel golongan darah.

Gambar 6.1 Grafik Lingkaran Frekuensi berdasarkan Golongan Darah

Berdasarkan Gambar 6.1, diketahui jumlah siswa dengan golongan darah A sebanyak 5

(33,33%) siswa, 3 (20%) siswa dengan golongan darah B, 4 (26,67%) siswa dengan golongan
73
darah AB dan 3 (20%) siswa dengan golongan darah O. Untuk membuat grafik lingkaran

frekuensi seperti pada Gambar 6.1, pilih Graph => Circle (Gambar 6.2).

Gambar 6.2

Pada Gambar 6.3, pilih Circle-I (Frequency), kemudian pindahkan variabel golongan darah

ke kotak sebelah kanan. Hasilnya dapat dilihat pada bagian Result. Lakukan pengaturan

grafik sesuai yang Anda inginkan pada bagian Result (Gambar 6.4).

Gambar 6.3

74
Gambar 6.4 Result

75
6.2 Membuat Grafik Lingkaran Frekuensi (Circle-II (Frequency))

Berdasarkan data kategori yang telah diinput pada Gambar 2.4, misalkan akan dibuat grafik

lingkaran frekuensi seperti pada Gambar 6.5, berdasarkan variabel golongan darah dan jenis

kelamin.

Gambar 6.5 Grafik Lingkaran Frekuensi berdasarkan Golongan Darah


dan Jenis Kelamin

Berdasarkan Gambar 6.5, diketahui:

 Untuk siswa laki-laki, terdapat 3 siswa dengan golongan darah A, 1 siswa golongan

darah B, 3 siswa golongah darah AB dan 2 siswa golongan darah O.

 Untuk siswa perempuan, terdapat 2 siswa dengan golongan darah A, 2 siswa golongan

darah B, 1 siswa golongah darah AB dan 1 siswa golongan darah O.

76
Untuk membuat grafik lingkaran frekuensi seperti pada Gambar 6.5, pilih Graph => Circle

(Gambar 6.6).

Gambar 6.6

Pada Gambar 6.7, pilih Circle-II (Frequency), kemudian pindahkan variabel golongan darah

ke kotak sebelah kanan. Begitu juga pindahkan variabel jenis kelamin ke kotak sebelah kanan.

Hasilnya dapat dilihat pada bagian Result. Lakukan pengaturan grafik sesuai yang Anda

inginkan pada bagian Result (Gambar 6.8).

Gambar 6.7 Circle-II (Frequency)


77
Gambar 6.8 Result

78
BAB 7

MEMBUAT GRAFIK BOXPLOT

7.1 Membuat Grafik Boxplot (Boxplot-I)

Grafix boxplot dapat digunakan untuk melihat sebaran data terhadap rata-ratanya. Apakah

suatu data menyebar cukup jauh atau dekat terhadap rata-ratanya dapat dilihat secara visual

melalui grafik boxplot. Gambar 7.1 merupakan grafik boxplot untuk nilai matematika, fisika,

kimia dan biologi.

Gambar 7.1 Grafik Boxplot berdasarkan Nilai Matematika,


Fisika, Kimia dan Biologi

Dari grafik boxplot tersebut, dapat dilihat sebaran data (titik-titik) berdasarkan nilai

matematika, fisika, kimia dan biologi. Perhatikan bahwa terdapat data ekstrim pada nilai

biologi, yakni ditandai dengan titik berwarna merah. Data esktrim tersebut menyebar cukup

jauh dari rata-ratanya.

79
Untuk membuat grafik boxplot seperti pada Gambar 7.1, pilih Graph => Boxplot (Gambar

7.2).

Gambar 7.2

Pada Gambar 7.3, pilih Boxplot-I, kemudian pindahkan variabel matematika, fisika, kimia

dan biologi ke kotak sebelah kanan. Hasilnya dapat dilihat pada bagian Result. Lakukan

pengaturan grafik sesuai yang Anda inginkan pada bagian Result (Gambar 7.4).

Gambar 7.3 Boxplot-I

80
Gambar 7.4 Result

7.2 Membuat Grafik Boxplot (Boxplot-II)

Grafix boxplot kali ini melibatkan 1 variabel kategori, yakni jenis kelamin dan 4 variabel

numerik, yakni nilai matematika, fisika, kimia dan biologi (Gambar 7.5).

Gambar 7.5 Grafik Boxplot


Melibatkan 1 Variabel Kategori dan 4 Variabel Numerik
(Jenis Kelamin; Matematika, Fisika, Kimia, Biologi)
81
Untuk membuat grafik boxplot seperti pada Gambar 7.5, pilih Graph => Boxplot (Gambar

7.6).

Gambar 7.6

Pada Gambar 7.7, pilih Boxplot-II, kemudian pindahkan variabel matematika, fisika, kimia

dan biologi ke kotak sebelah kanan pada Choose Numeric Variable (Multiple Choices).

Sementara pindahkan variabel jenis kelamin ke kotak sebelah kanan pada Choose

Categorical Variable (Single Choice). Hasilnya dapat dilihat pada bagian Result. Lakukan

pengaturan grafik sesuai yang Anda inginkan pada bagian Result (Gambar 7.8).

Gambar 7.7 Boxplot-II

82
Gambar 7.8 Result

83
BAB 8

MEMBUAT GRAFIK SCATTER PLOT

8.1 Membuat Grafik Scatter Plot (Scatter Plot-I)

Andaikan diberikan data tinggi badan dan berat badan dari 10 siswa sebagai berikut (Tabel

8.1).

Tabel 8.1 Data Tinggi dan Berat dari 10 Siswa

Nama Tinggi Badan Berat Badan


A 167.42 65.24
B 159.62 58.51
C 171.34 69.9
D 162.12 60.63
E 165.43 65.34
F 166.23 67.53
G 170.12 67.42
H 151.53 50.41
I 153.43 55.51
J 163.23 63

Berdasarkan data pada Tabel 8.1, disajikan grafik sebaran data antara tinggi badan dan berat

badan, seperti pada Gambar 8.1.

Gambar 8.1 Grafik Sebaran Data antara Tinggi dan Berat


84
Berdasarkan grafik sebaran data pada Gambar 8.1, terlihat bahwa sebaran data cenderung

menyebar dari kiri bawah, menuju kanan atas. Dengan kata lain, semakin meningkat tinggi

badan, terdapat kecenderungan, berat badan juga ikut meningkat. Diketahui juga bahwa nilai

korelasi Pearson sebesar 0,9754. Untuk membuat grafik sebaran seperti pada Gambar 8.1,

input data pada Tabel 8.1 ke dalam STATCAL, seperti pada Gambar 8.2.

Gambar 8.2 Input Data Numerik

Selanjutnya pilih Graph => Scatter Plot (Gambar 8.3).

Gambar 8.3

85
Perhatikan Gambar 8.4. Pilih Scatter Plot-I. Pada Gambar 8.4: Pindahkan variabel tinggi

badan dan berat badan ke kotak sebelah kanan pada bagian Choose Numeric Variable

(Multiple Choices). Hasil dari grafik sebaran data dapat dilihat pada bagian Result (Gambar

8.5). Lakukan pengaturan grafik seperti yang Anda inginkan.

Gambar 8.4 Scatter Plot-I

Gambar 8.5 Result

86
8.2 Membuat Grafik Scatter Plot (Scatter Plot-I)

Misalkan diberikan data mengenai pengeluaran per-bulan, pendapatan per-bulan dan jumlah

anak berdasarkan 10 keluarga (Tabel 8.2).

Tabel 8.2 Data Pengeluaran, Pendapatan dan Jumlah Anak


dari 10 Keluarga (Data Fiktif)

Pengeluaran Pendapatan
Responden (dalam jutaan) (dalam jutaan) Jumlah Anak
1 3.5 8.6 3
2 4.2 6.5 3
3 3.5 7.3 2
4 2.7 6.4 2
5 7.5 12.6 7
6 2.5 5.3 1
7 4.1 8.3 5
8 3.6 7.4 2
9 2.5 5.7 1
10 4.1 7.4 4

Berdasarkan data pada Tabel 8.2, disajikan grafik sebaran data sebagai berikut (Gambar 8.6).

Gambar 8.6 Grafik Sebaran Data

87
Perhatikan bahwa Gambar 8.6 merupakan grafik sebaran data antara pendapatan dan

pengeluaran (warna merah), serta antara jumlah anak dan pengeluaran (warna hijau). Terlihat

bahwa sebaran data antara pendapatan dan pengeluaran menyebar dari kiri bawah, menuju

kanan atas. Dengan kata lain, pendapatan yang semakin meningkat, cenderung, pengeluaran

juga meningkat. Begitu juga dengan jumlah anak. Jumlah anak yang semakin banyak,

cenderung, pengeluaran meningkat.

Untuk membuat grafik sebaran seperti pada Gambar 8.2, input data pada Tabel 8.2 ke dalam

STATCAL, seperti pada Gambar 8.7.

Gambar 8.7 Input Data Numerik

Selanjutnya pilih Graph => Scatter Plot (Gambar 8.8).

88
Gambar 8.8

Perhatikan Gambar 8.9. Pilih Scatter Plot-I. Pada Gambar 8.9. Pindahkan variabel

pengeluaran, pendapatan dan jumlah anak ke kotak sebelah kanan pada bagian Choose

Numeric Variable (Multiple Choices). Hasil dari grafik sebaran data dapat dilihat pada

bagian Result (Gambar 8.10). Lakukan pengaturan grafik seperti yang Anda inginkan.

Gambar 8.9 Scatter Plot-I

Gambar 8.10 Result

89
8.3 Membuat Grafik Scatter Plot (Scatter Plot-II)

Misalkan diberikan data mengenai berat badan dan tinggi badan berdasarkan kelas A, kelas B

dan kelas C (Tabel 8.3).

Tabel 8.3 Data Berat Badan dan Tinggi Badan dari 18 Siswa berdasarkan Kelas A,
Kelas B dan Kelas C

Nama Kelas Berat Badan (Kg) Tinggi Badan (Cm)


Andi 1 56.23 156.42
Ani 1 56.32 150.43
Suci 1 56.43 155.43
Widya 1 54.32 154.23
Sari 1 55.43 152.46
Putri 1 55.52 164.34
Intan 2 55.52 162.31
Ugi 2 54.26 160.74
Egi 2 55.18 163.17
Wawan 2 53.91 161.35
Sakti 2 55.84 163.15
Cici 2 55.15 180.43
Didi 3 67.53 163.31
Wiwid 3 66.24 163.35
Vivi 3 64.64 167.31
Amar 3 67.42 163.64
Odi 3 68.51 167.52
Oman 3 66.25 166.41

Value Label untuk Kelas


1 Kelas A
2 Kelas B
3 Kelas C

Berdasarkan data pada Tabel 8.3, diketahui Andi dari kelas A, memiliki berat badan 56,23 kg

dan tinggi badan 156,42 cm, Ugi dari kelas B, memiliki berat badan 54,26 kg dan tinggi

badan 160,74 cm, dan seterusnya. Berdasarkan data pada Tabel 8.3, disajikan grafik sebaran

data seperti pada Gambar 8.11.

90
Gambar 8.11 Sebaran Data Berat Badan dan Tinggi Badan
Berdasarkan Kelas A, Kelas B dan Kelas C

Berdasarkan sebaran data pada Gambar 8.11, terlihat bahwa mayoritas responden pada kelas

C memiliki berat badan yang lebih tinggi, dibandingkan responden pada kelas A dan kelas B.

Mayoritas responden pada kelas C juga memiliki tinggi badan yang lebih tinggi,

dibandingkan kelas A. Pada kelas B, terdapat satu responden yang tinggi badannya di atas

180. Untuk membuat grafik sebaran seperti pada Gambar 8.11, input data pada Tabel 8.3 ke

dalam STATCAL, seperti pada Gambar 8.12 dan Gambar 8.13.

Gambar 8.12 Input Data Numerik

91
Gambar 8.13 Input Data Kategori

Selanjutnya pilih Graph => Scatter Plot (Gambar 8.14).

Gambar 8.14

Perhatikan Gambar 8.15. Pilih Scatter Plot-II. Kemudian pindahkan variabel kelas ke kotak

sebelah kanan, pada bagian Choose Categorical Variable (Single Choice). Pindahkan

variabel berat badan ke kotak sebelah kanan pada bagian Choose Numeric Variable (Single

Choice) (X-Axis). Pindahkan variabel tinggi badan ke kotak sebelah kanan pada bagian

92
Choose Numeric Variable (Single Choice) (Y-Axis). Hasil dari grafik sebaran data dapat

dilihat pada bagian Result (Gambar 8.16). Lakukan pengaturan grafik seperti yang Anda

inginkan.

Gambar 8.15 Scatter Plot-II

Gambar 8.16 Result

93
8.4 Membuat Grafik Scatter Plot (Scatter Plot-III)

Misalkan diberikan data jumlah penduduk laki-laki dan perempuan berdasarkan 8 negara

(Tabel 8.4).

Tabel 8.4 Jumlah Penduduk Laki-Laki dan Perempuan


berdasarkan 8 Negara (Data Fiktif)

Negara (Value) Label Jumlah Laki-Laki Jumlah Perempuan


1 Wakanda Jaya 4523 4123
2 Prontera 1235 2323
3 Payon 5235 3352
4 Arabasta 4523 2356
5 Api 9875 9567
6 Wklandia 4526 2634
7 Timur Barat 5774 5223
8 Utara Selatan 1345 1344

Berdasarkan data pada Tabel 8.4, disajikan grafik sebaran data seperti pada Gambar 8.17

sampai Gambar 8.19.

Gambar 8.17 Jumlah Penduduk Laki-Laki dan Perempuan


Berdasarkan 8 Negara

94
Gambar 8.18 Jumlah Penduduk Laki-Laki dan Perempuan
Berdasarkan 8 Negara

Gambar 8.19 Jumlah Penduduk Laki-Laki dan Perempuan


Berdasarkan 8 Negara

Untuk membuat grafik sebaran seperti pada Gambar 8.17 sampai Gambar 8.19, input data

pada Tabel 8.4 ke dalam STATCAL, seperti pada Gambar 8.20 dan Gambar 8.21.

95
Gambar 8.20 Input Data Numerik

Gambar 8.21 Input Data Kategori

Selanjutnya pilih Graph => Scatter Plot (Gambar 8.22).

Gambar 8.22

Perhatikan Gambar 8.23. Pilih Scatter Plot-III. Kemudian:

96
 Pindahkan variabel negara ke kotak sebelah kanan, pada bagian Choose Categorical

Variable (Single Choice).

 Pindahkan variabel jumlah laki-laki ke kotak sebelah kanan pada bagian Choose

Numeric Variable (Single Choice) (X-Axis).

 Pindahkan variabel jumlah perempuan ke kotak sebelah kanan pada bagian Choose

Numeric Variable (Single Choice) (Y-Axis).

Hasil dari grafik sebaran data dapat dilihat pada bagian Result.

Gambar 8.23 Scatter Plot-III

97
8.5 Membuat Grafik Scatter Plot (Scatter Plot-IV)

Misalkan diberikan data mengenai total aset dan harga saham dari 4 perusahaan, tahun 2015

sampai dengan tahun 2018.

Tabel 8.5 Total Aset dan Harga Saham berdasarkan 4 Perusahaan


Tahun 2015 s/d Tahun 2018

Perusahaan Tahun Total Aset (Dalam Milyar) Harga Saham


1 1 1.41 123
1 2 1.43 124
1 3 1.45 131
1 4 1.44 128
2 1 1.71 231
2 2 1.72 233
2 3 1.71 243
2 4 1.7 238
3 1 2.12 341
3 2 2.22 346
3 3 2.31 339
3 4 2.32 352
4 1 3.21 456
4 2 3.33 458
4 3 3.34 472
4 4 3.35 462

Label
Angka
Perusahaan Tahun
1 A 2015
2 B 2016
3 C 2017
4 D 2018

Berdasarkan data pada Tabel 8.5 diketahui total aset pada perusahaan A tahun 2015 adalah

1,41 milyar dengan harga saham 123. Total aset pada perusahaan C pada tahun 2017 adalah

2,31 milyar dengan harga saham 339. Berdasarkan data pada Tabel 8.5 disajikan grafik

sebaran data seperti pada Gambar 8.24.

98
Gambar 8.24 Grafik Sebaran Data

Untuk membuat grafik sebaran seperti pada Gambar 8.24, input data pada Tabel 8.5 ke dalam

STATCAL, seperti pada Gambar 8.25 dan Gambar 8.26.

Gambar 8.25 Input Data Numerik

99
Gambar 8.26 Input Data Kategori

Selanjutnya pilih Graph => Scatter Plot (Gambar 8.7).

Gambar 8.27

Perhatikan Gambar 8.28. Pilih Scatter Plot-IV. Lakukan pemilihan variabel seperti pada

Gambar 8.28. Hasil dari grafik sebaran data dapat dilihat pada bagian Result (8.29).

100
Gambar 8.28 Scatter Plot-IV

Gambar 8.29 Result


101
BAB 9

MEMBUAT GRAFIK TIME SERIES

9.1 Membuat Grafik Time Series (Time Series-I)

Pada pembahasan kali ini, akan dipaparkan bagaimana membuat grafik time series dengan

STATCAL. Misalkan diberikan contoh data hasil penjualan mobil A, B dan C mulai dari

tahun 2010 sampai dengan tahun 2011 (Tabel 9.1).

Tabel 9.1 Jumlah Mobil A, B dan C yang Terjual dari Tahun 2010-2011

Waktu Mobil A Mobil B Mobil C


1-Jan-2010 12 16 21
1-Feb-2010 15 12 19
1-Mar-2010 17 15 12
1-Apr-2010 21 17 14
1-May-2010 32 21 20
1-Jun-2010 38 22 21
1-Jul-2010 24 25 15
1-Aug-2010 27 21 18
1-Sep-2010 19 23 11
1-Oct-2010 32 19 23
1-Nov-2010 33 28 32
1-Dec-2010 39 32 37
1-Jan-2011 14 18 24
1-Feb-2011 17 14 22
1-Mar-2011 19 17 15
1-Apr-2011 23 19 17
1-May-2011 34 23 23
1-Jun-2011 40 24 24
1-Jul-2011 26 27 18
1-Aug-2011 29 23 21
1-Sep-2011 21 25 14
1-Oct-2011 34 21 26
1-Nov-2011 35 30 35
1-Dec-2011 41 34 40

102
Berdasarkan data pada Tabel 9.1, diketahui pada 1 Januari 2010, mobil A terjual sebanyak 12

unit, mobil B terjual sebanyak 16 unit dan mobil C terjual sebanyak 21 unit. Gambar 9.1

disajikan berbagai grafik time series mengenai jumlah mobil A, B dan C yang terjual dari

tahun 2010 hingga tahun 2011.

Gambar 9.1 Berbagai Grafik Time Series

103
Untuk membuat grafik time series seperti pada Gambar 9.1, pilih Graph => Time Series

(Gambar 9.2).

Gambar 9.2 Menu Time Series

Perhatikan Gambar 9.3. Pilih Time Series-I. Kemudian input data seperti pada Gambar 9.3,

Gambar 9.4, dan Gambar 9.5. Pada Gambar 9.6, masukkan variabel mobil A, B dan C ke

kotak sebelah kanan Choose Numeric Variable (Multiple Choices), sementara masukkan

variabel waktu ke kotak sebelah kanan Choose Time (Single Choice).

Gambar 9.3 Menginput Data Waktu

104
Gambar 9.4 Menginput Data Penjualan Mobil A, B dan C

Gambar 9.5 Menginput Nama Variabel

Gambar 9.6 Pemilihan Variabel

105
Hasil grafik dapat dilihat pada bagian Result (Gambar 9.7).

Gambar 9.7 Result

106
9.2 Membuat Grafik Time Series (Time Series-II)

Misalkan diberikan contoh data hasil penjualan mobil A, B dan C mulai dari tahun 2010

sampai dengan tahun 2011 (Tabel 9.2).

Tabel 9.2 Jumlah Mobil A, B dan C yang Terjual dari Tahun 2010-2011

Waktu Mobil A Mobil B Mobil C


Januari 2010 12 16 21
Februari 2010 15 12 19
Maret 2010 17 15 12
April 2010 21 17 14
Mei 2010 32 21 20
Juni 2010 38 22 21
Juli 2010 24 25 15
Agustus 2010 27 21 18
September 2010 19 23 11
Oktober 2010 32 19 23
November 2010 33 28 32
Desember 2010 39 32 37
Januari 2011 14 18 24
Februari 2011 17 14 22
Maret 2011 19 17 15
April 2011 23 19 17
Mei 2011 34 23 23
Juni 2011 40 24 24
Juli 2011 26 27 18
Agustus 2011 29 23 21
September 2011 21 25 14
Oktober 2011 34 21 26
November 2011 35 30 35
Desember 2011 41 34 40

Berdasarkan data pada Tabel 9.2, diketahui pada Januari 2010, mobil A terjual sebanyak 12

unit, mobil B terjual sebanyak 16 unit dan mobil C terjual sebanyak 21 unit. Gambar 9.8

disajikan berbagai grafik time series mengenai jumlah mobil A, B dan C yang terjual dari

tahun 2010 hingga tahun 2011.

107
Gambar 9.8 Berbagai Grafik Time Series

Untuk membuat grafik seperti pada Gambar 9.8, pilih Graph => Time Series (Gambar 9.9).

108
Gambar 9.9 Menu Time Series

Perhatikan Gambar 9.10. Pada Gambar 9.10 pilih Time Series II. Input data seperti pada

Gambar 9.10, Gambar 9.11, dan Gambar 9.12. Pada Gambar 9.13, masukkan variabel mobil

A, B dan C ke kotak sebelah kanan Choose Numeric Variable (Multiple Choices),

sementara masukkan variabel waktu ke kotak sebelah kanan Choose Time (Single Choice).

Hasil grafik dapat dilihat pada bagian Result.

Gambar 9.10 Menginput Data Waktu

109
Gambar 9.11 Menginput Data Penjualan Mobil A, B dan C

Gambar 9.12 Menginput Nama Variabel

Gambar 9.13 Pemilihan Variabel

110
BAB 10

UJI ASUMSI NORMALITAS POPULASI

Gio dan Elly (2016:96) asumsi normalitas memiliki peranan penting dalam uji-uji parametrik,

seperti uji beda rata-rata dari dua populasi dengan uji t dan analisis varians. Hal ini karena uji-

uji parametrik akan bekerja dengan baik ketika asumsi normalitas dipenuhi. Conover

(1999:115) menyatakan sebagai berikut.

“Most parametric methods are based on the normality assumption because the theory behind
the test can be worked out with the normal population distribution. The resulting procedures
are efficient and powerful procedures for normally distributed data. Other parametric
procedures have been developed assuming the population has other distributions, such as the
exponential, Weibull, and soon.”

Dalam STATCAL disediakan beberapa uji asumsi normalitas, seperti uji Kolmogorov-

Smirnov, Shapiro-Wilk, Jarque-Bera dan Anderson-Darling. Gambar 10.1 merupakan menu

untuk melakukan uji asumsi normalitas.

Gambar 10.1 Menu Uji Asumsi Normalitas

Berdasarkan data numerik yang telah diinput pada Gambar 2.9, akan diuji apakah data usia,

berat badan, tinggi badan, matematika, fisika, kimia dan biologi berasal dari populasi yang

berdistribusi normal. Untuk melakukan uji asumsi normalitas, pilih Statistics => Test of

Normality (Gambar 10.1).

111
Gambar 10.2 Test of Normality (Assumption)

Perhatikan Gambar 10.2. Pada kotak Choose Numeric Variable (Multiple Choices),

pindahkan seluruh variabel ke kotak sebelah kanan. Hasil dari uji asumsi normalitas dapat

dilihat pada bagian Result.

Gambar 10.3 Hasil Uji Asumsi Normalitas dengan Uji Kolmogorov-Smirnov

Berdasarkan hasil uji asumsi normalitas Kolmogorov-Smirnov pada Gambar 10.3, asumsi

normalitas dipenuhi ketika nilai P-Value > tingkat signifikansi. Dalam contoh ini, tingkat

signifikansi yang digunakan adalah 5% atau 0,05. Diketahui asumsi normalitas untuk variabel

kimia tidak dipenuhi, dikarenakan nilai P-Value 0,03271 < tingkat signifikansi 0,05. Gambar
112
10.4 disajikan hasil uji asumsi normalitas dengan software SPSS. Hasil uji asumsi normalitas

dengan metode Kolmogorov-Smirnov antara STATCAL dan SPSS sama.

Gambar 10.4 Hasil Uji Asumsi Normalitas dengan


Uji Kolmogorov-Smirnov (Software SPSS)

Selain uji normalitas Kolmogorov-Smirnov, dalam STATCAL juga disediakan uji normalitas

Jarque-Bera. Gambar 10.5 disajikan hasil uji normalitas dengan uji Jarque-Bera.

Gambar 10.5 Hasil Uji Asumsi Normalitas dengan Uji Jarque-Bera

Berdasarkan hasil uji asumsi normalitas Jarque-Bera pada Gambar 10.5, asumsi normalitas

dipenuhi ketika nilai P-Value > tingkat signifikansi. Dalam contoh ini, tingkat signifikansi

yang digunakan adalah 5% atau 0,05. Diketahui asumsi normalitas untuk seluruh variabel
113
dipenuhi, dikarenakan seluruh nilai P-Value > tingkat signifikansi 0,05. Gambar 10.6

disajikan hasil uji asumsi normalitas dengan software EViews. Hasil uji asumsi normalitas

dengan metode Jarque-Bera antara STATCAL dan EViews sama.

Gambar 10.6 Hasil Uji Asumsi Normalitas dengan Uji Jarque-Bera

Pada menu Result untuk Test of Normality juga disisipkan grafik boxplot, seperti pada

Gambar 10.7.

Gambar 10.7 Grafik Boxplot

114
STATCAL juga menampilkan hasil uji normalitas dengan menggunakan uji Anderson-

Darling dan uji Shapiro-Wilk.

Gambar 10.8 Hasil Uji Asumsi Normalitas dengan Uji Anderson-Darling

Gambar 10.9 Hasil Uji Asumsi Normalitas dengan Uji Shapiro-Wilk

115
Gambar 10.10 Hasil Uji Asumsi Normalitas dengan Uji Shapiro-Wilk (SPSS)

116
BAB 11

UJI ASUMSI KESAMAAN VARIANS POPULASI

Uji asumsi kesamaan varians populasi menguji suatu asumsi, apakah dua atau lebih sampel

ditarik dari populasi-populasi dengan varians yang sama. Gio dan Elly (2016:107) metode

statistika yang dapat digunakan untuk menguji asumsi kesamaan varians populasi adalah uji

Levene, uji 𝐹 , uji Hartley, dan uji Bartlett. Varians populasi dilambangkan dengan 𝜎 2 ,

sedangkan varians sampel dilambangkan dengan 𝑠 2 .

(A) (B) (C)

𝜎𝐴2 = 𝜎𝐵2 = 𝜎𝐶2

Gambar 11.1

Pada Gambar 11.1, varians dari populasi A, B, dan C adalah sama, namun rata-ratanya

berbeda. Pada Gambar 11.2, varians dari populasi A dan B sama, namun berbeda dengan C.

(A) (B) (C)

Gambar 11.2

Gio dan Elly (2016:107) hipotesis nol menyatakan tidak terdapat perbedaan varians di antara

populasi, sedangkan hipotesis alternatif menyatakan terdapat paling tidak sepasang varians

populasi yang berbeda. Field (2009:150) menyatakan sebagai berikut.

117
“Levene's test tests null hypothesis that the variances in different groups are equal (i.e. the
difference between the variances is zero).”

Dalam STATCAL disediakan beberapa metode statistika untuk menguji asumsi kesamaan

varians populasi, seperti uji Levene dan uji Bartlett. Gambar 11.3 merupakan menu untuk

melakukan uji asumsi kesamaan varians populasi.

Gambar 11.3 Menu Uji Asumsi Kesamaan Varians Populasi

Berdasarkan data kategori dan numerik yang telah diinput pada Gambar 2.4 dan Gambar 2.9,

akan diuji suatu asumsi, apakah data nilai matematika laki-laki dan data nilai matematika

perempuan berasal dari populasi-populasi yang dengan varians yang sama, yakni

2 2
𝐻0 : 𝜎𝑀𝑎𝑡𝑒𝑚𝑎𝑡𝑖𝑘𝑎_𝐿𝑎𝑘𝑖−𝐿𝑎𝑘𝑖 = 𝜎𝑀𝑎𝑡𝑒𝑚𝑎𝑡𝑖𝑘𝑎_𝑃𝑒𝑟𝑒𝑚𝑝𝑢𝑎𝑛

Untuk melakukan uji asumsi kesamaan varians populasi, pilih Statistics => Test of

Homogeneity of Variance (Gambar 11.3). Perhatikan Gambar 11.4. Pada kotak Choose

Numeric Variable (Multiple Choices), pindahkan nilai matematika ke kotak sebelah kanan.

Multiple Choices berarti Anda dapat memasukkan lebih dari satu variabel ke kotak sebelah

kanan. Sementara pada kotak Choose Categorical Variable (Single Choice), pindahkan

variabel jenis kelamin ke kotak sebelah kanan. Single Choice berarti Anda hanya dapat

memasukkan satu variabel ke kotak sebelah kanan. Hasilnya dapat dilihat pada bagian Result.

118
Gambar 11.4

Gambar 11.5 disajikan beberapa hasil pada bagian Result.

Gambar 11.5 Beberapa Hasil pada Bagian Result

Pada bagian Result disajikan hasil grafik boxplot (Graph), seperti pada Gambar 11.6. Grafik

boxplot pada Gambar 11.6 menampilkan sebaran data untuk data nilai matematika laki-laki

dan data nilai matematika perempuan.

119
Gambar 11.6 Grafik Boxplot

Selanjutnya, pada bagian Result menampilkan hasil uji asumsi kesamaan varians populasi

dengan uji Levene, seperti pada Gambar 11.7. Berdasarkan hasil uji Levene pada Gambar

11.7, diketahui nilai statistik Levene adalah 0,0002 dengan P-Value 0,9904 > tingkat

signifikansi 0,05, maka asumsi bahwa data nilai matematika laki-laki dan data nilai

matematika perempuan berasal dari populasi-populasi dengan varians yang sama dipenuhi.

Gambar 11.7 Hasil Uji Asumsi Kesamaan Varians Populasi dengan Uji Levene

120
Gambar 11.8 diperlihatkan hasil uji asumsi kesamaan varians populasi dengan uji Levene

berdasarkan software SPSS.

Gambar 11.8 Hasil Uji Asumsi Kesamaan Varians Populasi dengan Uji Levene
berdasarkan Software SPSS

Selain uji Levene, pada bagian Result juga menampilkan hasil uji asumsi kesamaan varians

populasi dengan uji Bartlett, seperti pada Gambar 11.9. Berdasarkan hasil uji Bartlett pada

Gambar 11.9, diketahui nilai statistik Bartlett adalah 0 dengan P-Value 0,9946 > tingkat

signifikansi 0,05, maka asumsi bahwa data nilai matematika laki-laki dan data nilai

matematika perempuan berasal dari populasi-populasi dengan varians yang sama dipenuhi.

Gambar 11.9 Hasil Uji Asumsi Kesamaan Varians Populasi dengan Uji Bartlett

121
Pada bagian Result juga menampilkan hasil uji asumsi normalitas dengan uji Kolmogorov-

Smirnov, seperti pada Gambar 11.10. Berdasarkan hasil uji asumsi normalitas pada Gambar

11.10, diketahui nilai P-Value untuk baris laki-laki adalah 0,981 > tingkat signifikansi 0,05,

sehingga asumsi bahwa data nilai matematika laki-laki berasal dari populasi berdistribusi

normal dipenuhi. Sementara diketahui nilai P-Value untuk baris perempuan adalah 0,9124 >

tingkat signifikansi 0,05, sehingga asumsi bahwa data nilai matematika perempuan berasal

dari populasi berdistribusi normal dipenuhi.

Gambar 11.10 Hasil Uji Asumsi Normalitas Populasi dengan Uji Kolmogorov-Smirnov

122
BAB 12

UJI BEDA DUA SAMPEL BERPASANGAN

12.1 Contoh Kasus Uji Beda 2 Sampel Berpasangan

Misalkan diberikan data berat badan dari 6 responden, sebelum mengkonsumsi obat diet

ABCD dan setelah mengkonsumsi obat diet ABCD selama 1 bulan.

Tabel 12.1 Data Berat Badan Sebelum dan Setelah Mengkonsumsi


Obat Diet ABCD selama 1 Bulan

Berat Badan (Obat Diet ABCD)


Nama
Sebelum Sesudah
Ugi 85 84
Egi 79 74
Andi 83 80
Intan 77 76
Sari 85 83
Wati 78 77
Rata-Rata 81.167 79.000

Berdasarkan data pada Tabel 12.1, diketahui:

 Responden bernama Ugi, berat badan sebelum mengkonsumsi obat diet ABCD adalah

85 kg, berat badan setelah mengkonsumsi obat diet ABCD selama 1 bulan turun

menjadi 84 kg.

 Responden bernama Sari, berat badan sebelum mengkonsumsi obat diet ABCD adalah

85 kg, berat badan setelah mengkonsumsi obat diet ABCD selama 1 bulan turun

menjadi 83 kg.

 Rata-rata berat badan sebelum mengkonsumsi obat diet ABCD adalah 81,167,

sementara rata-rata berat badan setelah mengkonsumsi obat diet ABCD adalah 79.

123
 Secara rata-rata, terjadi penurunan berat badan setelah mengkonsumsi obat diet ABCD

selama 1 bulan. Apakah penurunan tersebut signifikan secara statistika (berdasarkan

hasil uji statistika)?

 Uji t 2 sampel berpasangan (paired-samples t test) atau uji Wilcoxon dapat digunakan

untuk menguji hipotesis apakah terdapat perbedaan berat badan yang signifikan

(secara statistika / berdasarkan pengujian statistika), sebelum dan sesudah

mengkonsumsi obat diet ABCD selama 1 bulan.

Data pada Tabel 12.1 jika diinput dalam SPSS seperti pada Gambar 12.1.

Gambar 12.1 Data Tabel 12.1 Diinput dalam SPSS

Misalkan diberikan data nilai ujian matematika dari 6 responden, sebelum mengikuti kursus

dan setelah mengikuti kegiatan kursus matematika selama 1 bulan.

Tabel 12.2 Data Nilai Ujian Matematika Sebelum dan Sesudah


Mengikuti Kurus Matematika selama 1 Bulan

Nilai Matematika
Nama
Sebelum Ikut Kursus Sesudah Ikut Kursus 1 Bulan
Ugi 65 87
Egi 54 89
Udin 67 95
Rina 70 90
Ricis 55 89
Suci 67 86
Didin 56 85
124
Anto 56 85
Ani 61 96
Rata-Rata 61.222 89.111

Berdasarkan data pada Tabel 12.2, diketahui:

 Responden bernama Ugi, nilai ujian matematika sebelum mengikuti kegiatan kurus

adalah 65, setelah mengikuti kegiatan kursus selama 1 bulan, nilai ujian

matematikanya meningkat menjadi 87.

 Responden bernama Ani, nilai ujian matematika sebelum mengikuti kegiatan kurus

adalah 61, setelah mengikuti kegiatan kursus selama 1 bulan, nilai ujian

matematikanya meningkat menjadi 96.

 Secara rata-rata, terjadi peningkatan nilai ujian matematika setelah mengikuti kegiatan

kursus selama 1 bulan. Apakah peningkatan tersebut signifikan secara statistika

(berdasarkan hasil uji statistika)?

 Uji t 2 sampel berpasangan (paired-samples t test) atau uji Wilcoxon dapat digunakan

untuk menguji hipotesis apakah terdapat perbedaan nilai ujian matematika yang

signifikan (secara statistika / berdasarkan pengujian statistika), sebelum dan

sesudah mengikuti kegiatan kursus selama 1 bulan.

Data pada Tabel 12.2 jika diinput dalam SPSS seperti pada Gambar 12.2.

Gambar 12.2 Data Tabel 12.2 Diinput dalam SPSS

125
12.2 Beberapa Kutipan Isi Buku Mengenai Uji t 2 Sampel Berpasangan dan Uji
Wilcoxon

Andy Field (2009:329) dalam bukunya yang berjudul “Discovering Statistics Using SPSS, 3rd

Edition” menyatakan sebagai berikut.

“9.4.3. The dependent t-test and the assumption of normality


We talked about the assumption of normality in Chapter 5 and discovered that parametric tests (like
the dependent t-test) assume that the sampling distribution is normal. This should be true in
large samples, but in small samples people often check the normality of their data because if
the data themselves are normal then the sampling distribution is likley to be also. With the
dependent t-test we analyse the differences between scores because we’re interested in the
sampling distribution of these differences (not the raw data). Therefore, if you want to test for
normality before a dependent t-test then what you should do is compute the differences
between scores, and then check if this new variable is normally distributed (or use a big
sample and not worry about normality!). It is possible to have two measures that are highly non-
normal that produce beautifully distributed differences!”

Dalam konteks ini, kapan ukuran sampel dikatakan besar? Ukuran sampel dikatakan cukup

besar ketika di atas 30. Murray R. Spiegel dan Larry J. Stephens (2008:275-276) dalam

bukunya yang berjudul “Statistics 4th Edition” menyatakan sebagai berikut.

“In previous chapters we often made use of the fact that for samples of size N > 30, called large
samples, the sampling distributions of many statistics are approximately normal, the approximation
becoming better with increasing N. For samples of size N < 30, called small samples, this
approximation is not good and becomes worse with decreasing N, so that appropriate modifications
must be made. A study of sampling distributions of statistics for small samples is called small
sampling theory. However, a more suitable name would be exact sampling theory, since the results
obtained hold for large as well as for small samples. In this chapter we study three important
distributions: Student’s t distribution, the chi-square distribution, and the F distribution.

For large values of 𝑣 or 𝑁 (certainly 𝑁 ≥ 30) the curves (2) closely approximately the standardized
normal curve

1 1 2
𝑌= 𝑒 −(2)𝑡
√2𝜋

Andy Field (2009:552) dalam bukunya yang berjudul “Discovering Statistics Using SPSS, 3rd

Edition” menyatakan sebagai berikut.

“The Wilcoxon signed-rank test (Wilcoxon, 1945), not to be confused with the rank-sum test in the
previous section, is used in situations in which there are two sets of scores to compare, but
these scores come from the same participants. As such, think of it as the non-parametric
equivalent of the dependent t-test (or a Mann–Whitney test for repeatedmeasures data).

The Wilcoxon signed-rank test works in a fairly similar way to the dependent t-test (Chapter 9)
in that it is based on the differences between scores in the two conditions you’re comparing. Once
these differences have been calculated they are ranked (just like in section 15.3.1) but the sign of the
difference (positive or negative) is assigned to the rank. If we use the same data as before we can
compare depression scores on Sunday to those on Wednesday for the two drugs separately.”

126
Andy Field (2009:558) dalam bukunya yang berjudul “Discovering Statistics Using SPSS, 3rd

Edition” menyatakan sebagai berikut.

“The Wilcoxon signed-rank test compares two conditions when the same participants take part in each
condition and the resulting data violate an assumption of the dependent t-test.”

12.3 Uji t 2 Sampel Berpasangan dan Uji Wilcoxon

Berdasarkan uraian pada Bagian 12.2, maka dapat ditarik informasi sebagai berikut.

 Uji t 2 sampel berpasangan (paired-samples t test / dependent t-test) dan uji Wilcoxon

digunakan untuk menguji apakah terdapat perbedaan yang signifikan (secara

statistika) berdasarkan 2 sampel berpasangan.

 Asumsi normalitas dikenakan pada uji t 2 sampel berpasangan, yakni populasi dari

data selisih pasangan pengamatan diasumsikan berdistribusi normal (Andy Field,

2009:326).

 Pada penggunaan uji t 2 sampel berpasangan, asumsi normalitas dapat diabaikan,

apabila jumlah sampel cukup besar (Andy Field, 2009:329). Hal ini karena

berdasarkan sifat teorema limit sentral (central limit theorem), ketika jumlah sampel

besar (N > 30), maka distribusi sampling dari statistik t akan mendekati normal

(Murray R. Spiegel dan Larry J. Stephens, 2008:275-276).

 Jumlah sampel dipandang cukup besar apabila > 30 (Murray R. Spiegel dan Larry J.

Stephens, 2008:275-276).

 Pada penggunaan uji t 2 sampel berpasangan, apabila jumlah sampel < 30 dan asumsi

normalitas tidak dipenuhi, uji Wilcoxon dapat digunakan sebagai pendekatan

nonparametrik (Andy Field, 2009:558).

12.4 Contoh Kasus (Penyelesaian dengan SPSS)

Input data Tabel 12.1 dalam SPSS seperti pada Gambar 12.1. Pertama akan dilakukan uji

asumsi normalitas untuk data selisih antara berat badan sebelum dan berat badan sesudah.
127
Maka terlebih dahulu akan dihitung data selisih antara berat badan sebelum dan berat badan

sesudah. Pilih Transform => Compute Variable (Gambar 12.3).

Gambar 12.3

Perhatikan Gambar 12.4 (kotak Compute Variable). Pada kotak Target Variable, isi dengan

selisih. Pada kotak Numeric Expression, data berat badan sebelum dikurang dengan data

berat badan sesudah. Kemudian pilih OK.

Gambar 12.4

Data selisih dapat dilihat pada Gambar 12.5.

128
Gambar 12.5

Data selisih pada Gambar 12.5, selanjutnya akan diuji asumsi normalitasnya. Perhatikan

Gambar 12.6. Pilih Analyze => Nonparametric Tests => 1-Sample K-S.

Gambar 12.6

Perhatikan Gambar 12.7 (kotak One-Sample Kolmogorov-Smirnov Test). Pindahkan

variabel selisih ke kotak sebelah kanan Test Variable List. Pada Test Distribution, pilih

Normal. Kemudian pilih OK.

129
Gambar 12.7

Tabel 12.3 disajikan hasil uji asumsi normalitas dengan uji Kolmogorov-Smirnov untuk data

selisih. Diketahui nilai probabilitas / p-value / Asymp. Sig. (2-tailed) adalah 0,787 > tingkat

signifikansi 0,05, maka asumsi normalitas untuk data selisih dipenuhi.

Tabel 12.3 Hasil Uji Asumsi Normalitas dengan Uji Kolmogorov-Smirnov


untuk Data Selisih
One-Sample Kolmogorov-Smirnov Test

selisih
N 6
Normal Parametersa,,b Mean 2.1667
Std. Deviation 1.60208
Most Extreme Differences Absolute .267
Positive .267
Negative -.233
Kolmogorov-Smirnov Z .653
Asymp. Sig. (2-tailed) .787
a. Test distribution is Normal.
b. Calculated from data.

Diketahui jumlah sampel < 30 dan asumsi normalitas untuk data selisih dipenuhi, maka akan

digunakan uji t 2 sampel berpasangan untuk menguji apakah terdapat perbedaan berat badan

yang signifikan (secara statistika / berdasarkan pengujian statistika), sebelum dan sesudah

mengkonsumsi obat diet ABCD selama 1 bulan. Perhatikan Gambar 12.8. Pilih Analyze =>

Compare Means => Paired-Samples T Test.


130
Gambar 12.8

Perhatikan Gambar 12.9 (kotak Paired-Samples T Test). Pindahkan variabel berat badan

sebelum ke kotak Variable1 dan pindahkan variabel berat badan sesudah ke kotak Variable2.

Kemudian pilih OK.

Gambar 12.9

Tabel 12.4 disajikan nilai rata-rata dan standar deviasi untuk masing-masing variabel.

Diketahui rata-rata berat badan sebelum mengkonsumsi obat diet ABCD adalah 81,1667,

dengan standar deviasi 3,60093. Sementara rata-rata berat badan sesudah mengkonsumsi obat

diet ABCD selama 1 bulan adalah 79, dengan standar deviasi 4.

Tabel 12.4 Statistik Deskriptif


Paired Samples Statistics

Mean N Std. Deviation Std. Error Mean


Pair 1 Berat_Badan_Sebelum 81.1667 6 3.60093 1.47007
Berat_Badan_Sesudah 79.0000 6 4.00000 1.63299

131
Secara rata-rata, terjadi penurunan berat badan setelah mengkonsumsi obat diet ABCD selama

1 bulan. Dengan kata lain, terdapat perbedaan rata-rata berat badan, sebelum dan sesudah

mengkonsumsi obat diet ABCD selama 1 bulan. Apakah perbedaan rata-rata tersebut

signifikan secara statistika? Untuk menjawab pertanyaan ini, maka perhatikan hasil dari uji

t 2 sampel berpasangan pada Tabel 12.5.

Tabel 12.5 Uji t 2 Sampel Berpasangan


Paired Samples Test

Paired Differences
95% Confidence
Interval of the
Difference
Std. Std. Error Sig. (2-
Mean Deviation Mean Lower Upper t df tailed)
Pair Berat_Badan_Sebelum 2.16667 1.60208 .65405 .48538 3.84795 3.313 5 .021
1 -
Berat_Badan_Sesudah

Berdasarkan hasil dari uji t 2 sampel berpasangan pada Tabel 12.5, diperoleh hasil sebagai

berikut.

 Nilai statistik t (t hitung) adalah 3,313.

 Nilai derajat bebas (df / degree of freedom) adalah 5.

 Nilai kritis t (t tabel) dengan derajat bebas 5 dan tingkat signifikansi 5% adalah 2,57

(Gambar 12.10).

Gambar 12.10 Menghitung Nilai Kritis t (t Tabel) dengan Microsoft Excel

132
𝐻0

𝐻1 𝐻1

𝑡𝑡𝑎𝑏𝑒𝑙 = −2,57 𝑡𝑡𝑎𝑏𝑒𝑙 = +2,57

Gambar 12.11 Daerah Keputusan berdasarkan Uji t

 Diketahui nilai statistik t adalah 3,313, berada pada daerah 𝐻1 , yakni daerah penolakan

𝐻0 dan penerimaan 𝐻1 , maka terdapat perbedaan berat badan yang signifikan (secara

statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan.

 Cara lain dalam pengambilan keputusan terhadap hipotesis, diketahui nilai probabilitas

/ p-value / Sig. (2-tailed) adalah 0,021 < tingkat signifikansi 0,05, maka terdapat

perbedaan berat badan yang signifikan, sebelum dan sesudah mengkonsumsi obat diet

ABCD selama 1 bulan.

Apabila asumsi normalitas tidak dipenuhi dan ukuran sampel < 30, maka uji Wilcoxon dapat

digunakan sebagai pendekatan nonparametrik. Sebagai contoh saja, berikut akan digunakan

uji Wilcoxon untuk menguji apakah terdapat perbedaan berat badan yang signifikan (secara

statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Perhatikan

Gambar 12.12. Pilih Analyze => Nonparametric Tests => 2 Related Samples.

133
Gambar 12.12

Perhatikan Gambar 12.13 (kotak Two-Related-Samples Tests). Pindahkan variabel berat

badan sebelum ke kotak Variable1 dan pindahkan variabel berat badan sesudah ke kotak

Variable2. Pada Test Type pilih Wilcoxon. Kemudian pilih OK.

Gambar 12.13

Hasil dari uji Wilcoxon diperlihatkan pada Tabel 12.6.

134
Tabel 12.6 Hasil Uji Wilcoxon
Test Statisticsb
Berat_Badan_Se
sudah -
Berat_Badan_Se
belum
Z -2.226a
Asymp. Sig. (2-tailed) .026
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test

Berdasarkan hasil uji Wilcoxon pada Tabel 12.6, diketahui nilai probabilitas / p-value /

Asymp. Sig. (2-tailed) adalah 0,026 < tingkat signifikansi 0,05, maka terdapat perbedaan berat

badan yang signifikan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan.

12.5 Contoh Kasus (Penyelesaian dengan STATCAL)

Input data Tabel 12.1 dalam STATCAL seperti pada Gambar 12.14.

Gambar 12.14 Input Data Numerik dalam STATCAL

Perhatikan Gambar 12.15. Pilih Statistics => T-Test (Paired Populations), Wilcoxon and

Sign Test (Gambar 12.15).

135
Gambar 12.15

Perhatikan Gambar 12.16. Pada kotak Choose Numeric Variable (Multiple Choices)

(Before), pindahkan variabel Berat Sebelum ke kotak sebelah kanan. Pada kotak Choose

Numeric Variable (Multiple Choices) (After), pindahkan variabel Berat Sesudah ke kotak

sebelah kanan. Hasilnya dapat dilihat pada bagian Result.

Gambar 12.16

136
Gambar 12.17 merupakan beberapa hasil yang tersedia dalam STATCAL.

Gambar 12.17 Beberapa Hasil dalam STATCAL

Gambar 12.18 Hasil STATCAL (Data Selected)

Perhatikan Gambar 12.18. Pada hasil STATCAL Data Selected menampilkan kembali data

yang telah Anda pilih. Perhatikan Gambar 12.19. Pada hasil STATCAL bagian Descriptive

disajikan beberapa ukuran deskriptif seperti nilai minimum, maksimum, rata-rata, standar

deviasi dan sebagainya. Sebagai contoh diketahui nilai minimum berat badan sebelum adalah

77, sementara nilai maksimum berat sebelum adalah 85. Rata-rata berat badan sebelum adalah

81,6667, dengan standar deviasi 3,6009.

137
Gambar 12.19 Hasil STATCAL (Descriptive)

Gambar 12.20 Hasil STATCAL (Difference Data)

Perhatikan Gambar 12.20. Pada hasil STATCAL bagian Difference Data menampilkan nilai

selisih data beserta tanda positif (+), negatif (-) atau netral (0).

138
Gambar 12.21 Hasil STATCAL (Normality (Difference Data))

Perhatikan Gambar 12.21. Pada hasil STATCAL bagian Normality (Difference Data)

menampilkan hasil STATCAL untuk uji asumsi normalitas dengan uji Kolmogorov-Smirnov

berdasarkan data selisih. Diketahui nilai probabilitas / P-Value of KS adalah 0,787 > tingkat

signifikansi 0,05, maka asumsi normalitas untuk data selisih dipenuhi.

Diketahui jumlah sampel < 30 dan asumsi normalitas untuk data selisih dipenuhi, maka akan

digunakan uji t 2 sampel berpasangan untuk menguji apakah terdapat perbedaan berat badan

yang signifikan (secara statistika / berdasarkan pengujian statistika), sebelum dan sesudah

mengkonsumsi obat diet ABCD selama 1 bulan. Gambar 12.22 disajikan hasil uji t 2 sampel

berpasangan dengan STATCAL.

139
Gambar 12.22 Hasil STATCAL (T-Test (Paired Populations))

Berdasarkan hasil uji t 2 sampel berpasangan pada Gambar 12.22, diperoleh hasil sebagai

berikut.

 Nilai statistik t (t hitung / t statistic) adalah -3,313.

 Nilai derajat bebas (degree of freedom) adalah 5.

 Nilai kritis t (t tabel) / t Critical Value (5%) dengan derajat bebas 5 dan tingkat

signifikansi 5% adalah 2,571.

𝐻0

𝐻1 𝐻1
𝑡𝑡𝑎𝑏𝑒𝑙 = −2,571 𝑡𝑡𝑎𝑏𝑒𝑙 = +2,571

Gambar 12.23 Daerah Keputusan berdasarkan Uji t

 Diketahui nilai statistik t adalah -3,313, berada pada daerah 𝐻1 , yakni daerah

penolakan 𝐻0 dan penerimaan 𝐻1 , maka terdapat perbedaan berat badan yang


140
signifikan (secara statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD

selama 1 bulan.

 Cara lain dalam pengambilan keputusan terhadap hipotesis, diketahui nilai probabilitas

/ P-Value adalah 0,021 < tingkat signifikansi 0,05, maka terdapat perbedaan berat

badan yang signifikan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1

bulan.

Apabila asumsi normalitas tidak dipenuhi dan ukuran sampel < 30, maka uji tanda (sign test)

atau uji Wilcoxon dapat digunakan sebagai pendekatan nonparametrik. Sebagai contoh saja,

berikut akan digunakan uji Wilcoxon untuk menguji apakah terdapat perbedaan berat badan

yang signifikan (secara statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD

selama 1 bulan. Gambar 12.24 merupakan hasil berdasarkan uji Wilcoxon.

Gambar 12.24 Hasil STATCAL (Wilcoxon Test)

Berdasarkan hasil uji Wilcoxon pada Gambar 12.24, diketahui nilai probabilitas / p-value

adalah 0,026 < tingkat signifikansi 0,05, maka terdapat perbedaan berat badan yang

signifikan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan.

141
Gambar 12.25 Hasil STATCAL (Sign Test)

Perhatikan Gambar 12.25. Pada hasil STATCAL Sign Test menampilkan menampilkan hasil

berdasarkan uji tanda. Berdasarkan hasil uji tanda pada Gambar 12.25, diketahui nilai

probabilitas / p-value adalah 0,031 < tingkat signifikansi 0,05, maka terdapat perbedaan berat

badan yang signifikan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan.

Gambar 12.26 Hasil STATCAL (T, F and Chi-Square Distribution)

Perhatikan Gambar 12.26. Pada hasil STATCAL T, F and Chi-Square Distribution

menampilkan menampilkan nilai-nilai distribusi T, F dan Chi-Square. Perhatikan Gambar

12.27 sampai dengan Gambar 12.29.

142
Gambar 12.27 Hasil STATCAL (Distribusi T)

143
Gambar 12.28 Hasil STATCAL (Distribusi F)

144
Gambar 12.29 Hasil STATCAL (Distribusi Chi-Square)

145
Gambar 12.30 Hasil STATCAL (Graph: Bar (Average))

Perhatikan Gambar 12.30. Pada hasil STATCAL Graph: Bar (Average) menampilkan grafik

batang rata-rata berat badan sebelum dan sesudah. Secara rata-rata lebih tinggi berat badan

sebelum (rata-rata 81,17) dibandingkan berat badan sesudah (rata-rata 79).

146
12.6 Contoh Kasus (Penyelesaian dengan Minitab)

Input data Tabel 12.1 dalam Minitab seperti pada Gambar 12.31.

Gambar 12.31 Input Data dalam Minitab

Perhatikan Gambar 12.32. Pilih Stat => Basic Statistics => Paired t, sehingga muncul kotak

Paired t (Test and Confidence Interval) (Gambar 12.33).

Gambar 12.32

Gambar 12.33
147
Pada Gambar 12.33, pada kotak First sample, isi dengan variabel Sebelum, sementara pada

kotak Second sample, isi dengan variabel Sesudah. Kemudian pilih OK. Gambar 12.34

disajikan hasil uji t 2 sampel berpasangan.

Gambar 12.34 Hasil Uji t 2 Sampel Berpasangan

Berdasarkan hasil uji t 2 sampel berpasangan pada Gambar 12.34, diperoleh hasil sebagai

berikut.

 Diketahui nilai statistik t / T-Value adalah 3,31, berada pada daerah 𝐻1 , yakni daerah

penolakan 𝐻0 dan penerimaan 𝐻1 , maka terdapat perbedaan berat badan yang

signifikan (secara statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD

selama 1 bulan (lihat Gambar 12.11).

 Cara lain dalam pengambilan keputusan terhadap hipotesis, diketahui nilai probabilitas

/ P-Value adalah 0,021 < tingkat signifikansi 0,05, maka terdapat perbedaan berat

badan yang signifikan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1

bulan.

148
BAB 13

UJI BEDA DUA SAMPEL INDEPENDEN

13.1 Contoh Kasus Uji Beda 2 Sampel Independen

Misalkan diberikan data tinggi badan dari 7 responden laki-laki dan 5 responden perempuan

(Tabel 13.1).

Tabel 13.1 Data Tinggi Badan

Jenis
Nama Kelamin Tinggi Rata-Rata
Ugi 1 175.43
Egi 1 178.54
Andi 1 169.85
Budi 1 179.65 176.58
Doni 1 176.54
Roy 1 178.43
Roki 1 177.65
Intan 2 170.31
Rini 2 171.31
Suci 2 167.31 168.67
Sari 2 169.32
Riri 2 165.12

Berdasarkan data Pada Tabel 13.1:

 Terdapat 2 variabel, yakni jenis kelamin dan tinggi.

 Terdapat 2 sampel independen, yakni sampel tinggi badan untuk laki-laki dan sampel

tinggi badan untuk perempuan.

 Variabel jenis kelamin merupakan variabel kategori, sementara variabel tinggi

merupakan variabel numerik atau rasio.

 Untuk variabel jenis kelamin, misalkan angka 1 menyatakan laki-laki, sementara

angka 2 menyatakan perempuan.

149
 Secara rata-rata, tinggi laki-laki lebih tinggi (176,58) dibandingkan tinggi perempuan

(168,67).

 Uji t independen (independent t test) atau uji Mann-Whitney dapat digunakan untuk

menguji hipotesis apakah terdapat perbedaan tinggi badan yang signifikan antara

laki-laki dan perempuan.

Data pada Tabel 13.1 jika diinput dalam SPSS seperti pada Gambar 13.1.

Gambar 13.1 Data Tabel 13.1 Diinput dalam SPSS

Misalkan diberikan data hasil produksi jagung antara bibit jenis A dan bibit jenis B (Tabel

13.2).

Tabel 13.2 Data Hasil Produksi Jagung

Jenis Bibit Sampel (Bibit Jagung) Jenis Bibit Hasil (Dalam Kg) Rata-Rata
Bibit Jagung Ke-1 (Jenis A) 1 21.23
Bibit Jagung Ke-2 (Jenis A) 1 20.23
Bibit Jagung Ke-3 (Jenis A) 1 20.12
Jenis A Bibit Jagung Ke-4 (Jenis A) 1 21.25 21.11
Bibit Jagung Ke-5 (Jenis A) 1 22.31
Bibit Jagung Ke-6 (Jenis A) 1 20.21
Bibit Jagung Ke-7 (Jenis A) 1 22.42
Bibit Jagung Ke-1 (Jenis B) 2 16.31
Jenis B 18.34
Bibit Jagung Ke-2 (Jenis B) 2 19.34
150
Bibit Jagung Ke-3 (Jenis B) 2 20.21
Bibit Jagung Ke-4 (Jenis B) 2 16.23
Bibit Jagung Ke-5 (Jenis B) 2 20.23
Bibit Jagung Ke-6 (Jenis B) 2 17.54
Bibit Jagung Ke-7 (Jenis B) 2 18.53

Berdasarkan data Pada Tabel 13.2:

 Terdapat 2 variabel, yakni jenis bibit dan hasil produksi.

 Terdapat 2 sampel independen, yakni sampel hasil produksi jagung untuk jenis bibit A

dan sampel hasil produksi jagung untuk jenis bibit B.

 Variabel jenis bibit merupakan variabel kategori, sementara variabel hasil produksi

merupakan variabel numerik atau rasio.

 Untuk variabel jenis bibit, misalkan angka 1 menyatakan jenis bibit A, sementara

angka 2 menyatakan jenis bibit B.

 Secara rata-rata, hasil produksi jagung untuk jenis bibit A lebih tinggi (21,11)

dibandingkan hasil produksi jagung untuk jenis bibit B (18,34).

 Uji t independen (independent t test) atau uji Mann-Whitney untuk menguji hipotesis

apakah terdapat perbedaan yang signifikan dari hasil produksi jagung antara

jenis bibit A dan jenis bibit B.

Data pada Tabel 13.2 jika diinput dalam SPSS seperti pada Gambar 13.2.

Gambar 13.2 Data Tabel 13.2 Diinput dalam SPSS

151
13.2 Beberapa Kutipan Isi Buku Mengenai Uji t 2 Sampel Independen dan Uji Mann-
Whitney

Prem S. Mann (2013:470-471) dalam bukunya yang berjudul “Introductory Statistics, 8th

Edition” menyatakan sebagai berikut.

“Inferences About the Difference Between Two Population Means for Independent Samples: 𝝈𝟏
and 𝝈𝟐 Unknown but Equal

This section discusses making a confidence interval and testing a hypothesis about the difference
between the means of two populations, 𝜇1 − 𝜇2 , assuming that the standard deviations, 𝜎1 and 𝜎2 , of
these populations are not known but are assumed to be equal. There are some other conditions,
explained below, that must be fulfilled to use the procedures discussed in this section.

If the following conditions are satisfied,


1. The two samples are independent
2. The standard deviations 𝜎1 and 𝜎2 of the two populations are unknown, but they can be assumed
to be equal, that is, 𝜎1 = 𝜎2

3. At least one of the following two conditions is fulfilled:


i. Both samples are large (i.e., 𝑛1 ≥ 30 and 𝑛2 ≥ 30)
ii. If either one or both sample sizes are small, then both populations from which the samples are
drawn are normally distributed

then we use the t distribution to make a confidence interval and test a hypothesis about the difference
between the means of two populations, 𝜇1 − 𝜇2 .

When the standard deviations of the two populations are equal, we can use 𝜎 for both 𝜎1 and 𝜎2 .
Because 𝜎 is unknown, we replace it by its point estimator 𝑠𝑝 , which is called the pooled sample
standard deviation (hence, the subscri 𝑝.”

Prem S. Mann (2013:480-481) dalam bukunya yang berjudul “Introductory Statistics, 8th

Edition” menyatakan sebagai berikut.

“Inferences About the Difference Between Two Population Means for Independent Samples: 𝝈𝟏
and 𝝈𝟐 Unknown and Unequal

Section 10.2 explained how to make inferences about the difference between two population means
using the t distribution when the standard deviations of the two populations are unknown but equal
and certain other assumptions hold true. Now, what if all other assumptions of Section 10.2 hold true,
but the population standard deviations are not only unknown but also unequal? In this case, the
procedures used to make confidence intervals and to test hypotheses about 𝜇1 − 𝜇2 remain similar to
the ones we learned in Sections 10.2.1 and 10.2.2, except for two differences. When the population
standard deviations are unknown and not equal, the degrees of freedom are no longer given by
𝑛1 + 𝑛2 − 2, and the standard deviation of 𝑥̅1 − 𝑥̅2 is not calculated using the pooled standard deviation
𝑠𝑝 .

Degrees of Freedom If
1. The two samples are independent
2. The standard deviations 𝜎1 and 𝜎2 of the two populations are unknown and unequal, that is 𝜎1 ≠ 𝜎2 ,
3. At least one of the following two conditions is fulfilled:
i. Both samples are large (i.e., 𝑛1 ≥ 30 and 𝑛2 ≥ 30)
ii. If either one or both sample sizes are small, then both populations from which the samples are
drawn are normally distributed

152
then the t distribution is used to make inferences about 𝜇1 − 𝜇2 , and the degrees of freedom for the t
distribution are given by
2
𝑠2 𝑠2
( 1 + 2)
𝑛1 𝑛2
𝑑𝑓 = 2 2
𝑠2 𝑠2
( 1) ( 2)
𝑛1 𝑛2
+
(𝑛1 − 1) (𝑛2 − 1)

The number given by this formula is always rounded down for df.”

Murray R. Spiegel dan Larry J. Stephens (2008:447-448) dalam bukunya yang berjudul

"Statistics, Fourth Edition" menyatakan sebagai berikut.

“Consider Table 17.2, which shows the strengths of cables made from two different alloys, I and II. In
this table we have two samples: 8 cables of alloy I and 10 cables of alloy II. We would like to decide
whether or not there is a difference between the samples or, equivalently, whether or not they
come from the same population. Although this problem can be worked by using the t test of
Chapter 11, a nonparametric test called the Mann–Whitney U test, or briefly the U test, is useful.

If 𝑁1 and 𝑁2 are both at least equal to 8, it turns out that the distribution of U is nearly normal, so that
𝑈−𝜇𝑈
𝑧= is normally distributed with mean 0 and variance 1”.
𝜎𝑈

Paul H. Kvam dan Brani Vidakociv (2007:131) dalam bukunya yang berjudul

“Nonparametric Statistics with Applications to Science and Engineering” menyatakan sebagai

berikut.

“Like the Wilcoxon test above. The Mann-Whitney test is applied to find differences in two populations,
and does not assume tlhat the populations are normally distributed.”

Andy Field (2009:540) dalam bukunya yang berjudul “Discovering Statistics Using SPSS, 3rd

Edition” menyatakan sebagai berikut.

“When you want to test differences between two conditions and different participants have been used
in each condition then you have two choices: the Mann–Whitney test (Mann & Whitney, 1947) and
the Wilcoxon rank-sum test (Wilcoxon, 1945; Figure 15.2). These tests are the non-parametric
equivalent of the independent t-test. In fact both tests are equivalent, and there’s another, more
famous, Wilcoxon test, so it gets extremely confusing for most of us.”.

13.3 Uji t 2 Sampel Independen dan Uji Mann-Whitney

Berdasarkan uraian pada Bagian 13.2, maka dapat ditarik informasi sebagai berikut.

153
 Uji t 2 sampel independen dan uji Mann-Whitney digunakan untuk menguji apakah

terdapat perbedaan yang signifikan (secara statistika) berdasarkan 2 sampel

independen.

 Asumsi normalitas dikenakan pada uji t 2 sampel independen, yakni sampel pertama

dan sampel kedua diasumsikan ditarik dari populasi-populasi berdistribusi normal

(Prem S. Mann, 2013:470-471).

 Asumsi normalitas pada uji t 2 sampel independen dapat diabaikan, ketika ukuran

sampel pertama dan kedua ≥ 30 (Prem S. Mann, 2013:470-471). Hal ini karena

berdasarkan sifat teorema limit sentral (central limit theorem), ketika jumlah sampel

besar, maka distribusi sampling dari statistik t akan mendekati normal (Murray R.

Spiegel dan Larry J. Stephens, 2008:275-276).

 Apabila jumlah sampel pada salah satu / kedua sampel < 30 dan asumsi normalitas

tidak dipenuhi, maka uji Mann-Whitney dapat digunakan sebagai pendekatan

nonparametrik.

 Uji t 2 sampel independen juga dikenai asumsi kesamaan varians populasi. Untuk

menguji asumsi kesamaan varians dari dua populasi dapat digunakan uji Levene.

13.4 Contoh Kasus (Penyelesaian dengan SPSS)

Input data Tabel 13.1 dalam SPSS seperti pada Gambar 13.1. Pertama, akan dilakukan

pengujian asumsi normalitas untuk data tinggi badan laki-laki dan perempuan. Dalam SPSS,

uji Shapiro-Wilk dapat digunakan untuk melakukan uji asumsi normalitas. Perhatikan

Gambar 13.3. Pilih Analyze => Descriptive Statistics => Explore.

Gambar 13.3

154
Perhatikan Gambar 13.4 (kotak Explore). Masukkan variabel Tinggi ke kotak Dependent

List. Sementara masukkan variabel Jenis Kelamin ke kotak Factor List. Pilih Plots,

sehingga muncul kotak Explore: Plots. Pilih Normality plots with tests. Kemudian pilih

Continue dan OK. Hasil uji asumsi normalitas dengan uji Shapiro-Wilk diperlihatkan pada

Tabel 13.3.

Gambar 13.4

Tabel 13.3 Hasil Uji Asumsi Normalitas dengan Uji Shapiro-Wilk


Tests of Normality

Kolmogorov-Smirnova Shapiro-Wilk

Jenis Kelamin Statistic df Sig. Statistic df Sig.


Tinggi Laki-Laki .219 7 .200* .830 7 .081
Perempuan .203 5 .200* .954 5 .767
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.

Berdasarkan hasil uji asumsi normalitas dengan uji Shapiro-Wilk pada Tabel 13.3, diketahui:

 Asumsi normalitas populasi dipenuhi untuk data tinggi badan laki-laki (probabilitas /

p-value / Sig. 0,081 > tingkat signifikansi 0,05).

 Asumsi normalitas populasi dipenuhi untuk data tinggi badan perempuan (probabilitas

/ p-value / Sig. 0,767 > tingkat signifikansi 0,05).

155
Diketahui asumsi normalitas untuk kedua populasi dipenuhi, maka pengujian dilanjutkan

dengan menggunakan uji t 2 sampel independen. Perhatikan Gambar 13.5. Pilih Analyze =>

Compare Means => Independent-Samples T Test.

Gambar 13.5

Gambar 13.6

Perhatikan Gambar 13.6 (kotak Independent-Samples T Test). Masukkan variabel Tinggi ke

kotak Test Variable(s), sementara masukkan variabel Jenis_Kelamin ke kotak Grouping

Variable. Pilih Define Groups, sehingga muncul kotak Define Groups. Pada Group 1, isi

dengan angka 1 (angka 1 menyatakan laki-laki), sementara pada Group 2, isi dengan angka 2

(angka 2 menyatakan perempuan). Kemudian pilih Continue dan OK.

Tabel 13.4 disajikan nilai rata-rata dan standar deviasi dari variabel tinggi badan antara laki-

laki dan perempuan. Diketahui rata-rata tinggi badan laki-laki adalah 176,5843, dengan

standar deviasi 3,27747. Sementara rata-rata tinggi badan perempuan adalah 168,6740,

156
dengan standar deviasi 2,47658. Secara rata-rata, tinggi badan laki-laki lebih tinggi

dibandingkan perempuan.

Tabel 13.4 Statistik Deskriptif


Group Statistics

Jenis Kelamin N Mean Std. Deviation Std. Error Mean


Tinggi Laki-Laki 7 176.5843 3.27747 1.23877
Perempuan 5 168.6740 2.47658 1.10756

Tabel 13.5 disajikan hasil uji t 2 sampel independen untuk menguji apakah terdapat perbedaan

yang signifikan antara tinggi badan laki-laki dan perempuan.

Tabel 13.5 Hasil Uji t 2 Sampel Independen


Independent Samples Test
Levene's Test for
Equality of
Variances t-test for Equality of Means
95% Confidence
Interval of the
Difference
Sig. (2- Mean Std. Error
F Sig. t df tailed) Difference Difference Lower Upper
Tinggi Equal variances .078 .786 4.529 10 .001 7.91029 1.74668 4.01844 11.80214
assumed
Equal variances 4.760 9.919 .001 7.91029 1.66169 4.20370 11.61687
not assumed

Berdasarkan Tabel 13.5, diperoleh hasil sebagai berikut.

 Pertama, periksa terlebih dahulu, apakah asumsi kesamaan varians dua populasi

dipenuhi atau tidak. Pengujian asumsi kesamaan varians dua populasi dalam SPSS

menggunakan uji Levene. Perhatikan bahwa nilai p-value / Sig. pada kolom Levene’s

Test for Equality of Variances adalah 0,786 > tingkat signifikansi 0,05, maka asumsi

kesamaan varians dua populasi dipenuhi.

157
 Karena asumsi kesamaan varians dua populasi dipenuhi, perhatikan hasil-hasil pada

baris Equal variances assumed. Jika asumsi kesamaan varians dua populasi tidak

dipenuhi, perhatikan hasil-hasil pada baris Equal variances not assumed.

 Diketahui nilai p-value / Sig. pada kolom Sig. (2-tailed) adalah 0,001 < tingkat

signifikansi 0,05, maka terdapat perbedaan tinggi badan yang signifikan antara laki-

laki dan perempuan.

Gambar 13.7 Menghitung Nilai Kritis t (t Tabel) dengan Microsoft Excel

𝐻0

𝐻1 𝐻1
𝑡𝑡𝑎𝑏𝑒𝑙 = −2,228 𝑡𝑡𝑎𝑏𝑒𝑙 = +2,228

Gambar 13.8 Daerah Keputusan berdasarkan Uji t

 Cara lain, diketahui nilai statistik t (t hitung) adalah 4,529 dan derajat bebas (df) 10.

Nilai kritis t (t tabel) dengan derajat bebas 10 dan tingkat signifikansi 5% adalah 2,228

(Gambar 13.7). Berdasarkan Gambar 13.8, diketahui nilai statistik t adalah 4,529,

berada pada daerah 𝐻1 , yakni daerah penolakan 𝐻0 dan penerimaan 𝐻1 , maka terdapat

perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan.

158
Apabila asumsi normalitas tidak dipenuhi dan ukuran sampel < 30, maka uji Mann-Whitney

dapat digunakan sebagai pendekatan nonparametrik. Sebagai contoh saja, berikut akan

digunakan uji Mann-Whitney untuk menguji apakah terdapat perbedaan tinggi badan yang

signifikan antara laki-laki dan perempuan. Perhatikan Gambar 13.9. Pilih Analyze =>

Nonparametric Tests => 2 Independent Samples.

Gambar 13.9

Perhatikan Gambar 13.10 (kotak Two-Independent-Samples Tests). Masukkan variabel

Tinggi ke kotak Test Variable Lists dan masukkan variabel Jenis_Kelamin ke kotak

Grouping Variable. Kemudian pilih Define Groups, sehingga muncul kotak Two

Independent Samples: Define Groups. Pada kotak Group 1, isi angka 1 (angka 1

menyatakan laki-laki), sementara pada kotak Group 2, isi angka 2 (angka 2 menyatakan

perempuan). Pilih Continue dan OK.

159
Gambar 13.10

Tabel 13.6 Hasil Uji Mann-Whitney


Test Statisticsb

Tinggi
Mann-Whitney U 2.000
Wilcoxon W 17.000
Z -2.517
Asymp. Sig. (2-tailed) .012
Exact Sig. [2*(1-tailed Sig.)] .010a
a. Not corrected for ties.
b. Grouping Variable: Jenis Kelamin

Berdasarkan hasil uji Mann-Whitney pada Tabel 13.6, diketahui nilai p-value / Asymp. Sig.

(2-tailed) adalah 0,012 < tingkat signifikansi 0,05, maka terdapat perbedaan tinggi badan

yang signifikan antara laki-laki dan perempuan.

13.5 Contoh Kasus (Penyelesaian dengan STATCAL)

Input data Tabel 13.1 dalam STATCAL seperti pada Gambar 13.11 dan Gambar 13.12.

160
Gambar 13.11 Input Data Numerik di STATCAL

Gambar 13.12 Input Data Kategori di STATCAL

Perhatikan Gambar 13.13. Pilih Statistics => T-Test (Independen Populations) and Mann-

Whitney Test.

161
Gambar 13.13 T-Test (Independen Populations) and Mann-Whitney Test

Perhatikan Gambar 13.14. Pada kotak Choose Numeric Variable (Multiple Choices),

pindahkan variabel Tinggi Badan ke kotak sebelah kanan. Sementara pada kotak Choose

Categorical Variable (Single Choice), pindahkan variabel Jenis Kelamin ke kotak sebelah

kanan. Pada bagian Choose Group:, isi angka 1 pada kotak First Group dan isi angka 2 pada

kotak Second Group. Perhatikan bahwa angka 1 untuk jenis kelamin laki-laki, sementara

angka 2 untuk jenis kelamin perempuan. Hasil dari uji t 2 sampel independen dapat dilihat

pada bagian Result.

Gambar 13.14

162
Gambar 13.15 merupakan beberapa hasil yang tersedia dalam STATCAL.

Gambar 13.15 Beberapa Hasil dalam STATCAL

Gambar 13.16 Hasil STATCAL (Data Selected)

Perhatikan Gambar 13.16. Pada hasil STATCAL Data Selected menampilkan kembali data

yang telah Anda pilih. Perhatikan Gambar 13.17. Pada hasil STATCAL bagian Descriptive

disajikan beberapa ukuran deskriptif seperti nilai minimum, maksimum, rata-rata dan standar

deviasi. Sebagai contoh diketahui tinggi badan minimum pada laki-laki adalah 169,85,

sementara tinggi badan maksimum pada laki-laki adalah 179,65. Rata-rata tinggi badan laki-

laki adalah 176,584, dengan standar deviasi 3,277.

163
Gambar 13.17 Hasil STATCAL (Descriptive)

Gambar 13.18 Hasil STATCAL (Normality)

Berdasarkan hasil uji asumsi normalitas dengan uji Kolmogorov-Smirnov pada Gambar

13.18, diketahui:

164
 Asumsi normalitas populasi dipenuhi untuk data tinggi badan laki-laki (probabilitas /

P-Value of KS 0,889 > tingkat signifikansi 0,05).

 Asumsi normalitas populasi dipenuhi untuk data tinggi badan perempuan (probabilitas

/ P-Value of KS 0,986 > tingkat signifikansi 0,05).

Gambar 13.19 Hasil STATCAL (Homogeneity of Variance)

Gambar 13.19 disajikan hasil uji asumsi kesamaan varians dua populasi dengan uji Levene.

Diketahui P-Value bernilai 0,786 > tingkat signifikansi 0,05, maka asumsi kesamaan varians

dua populasi dipenuhi.

165
Gambar 13.20 Hasil STATCAL (T-Test (Independent Populations))

Gambar 13.20 merupakan hasil dari uji t 2 sampel independen. Diketahui asumsi kesamaan

varians dipenuhi, maka perhatikan hasil pada “When Assumption of Equal Variances is

Satisfied”. Diketahui:

 Nilai statistik t (t hitung / t statistic) adalah 4,5288.

 Derajat bebas (degree of freedom) 10.

Gambar 13.21 Menghitung Nilai Kritis t (t Tabel) dengan Microsoft Excel

166
𝐻0

𝐻1 𝐻1

𝑡𝑡𝑎𝑏𝑒𝑙 = −2,228 𝑡𝑡𝑎𝑏𝑒𝑙 = +2,228

Gambar 13.22 Daerah Keputusan berdasarkan Uji t

 Nilai kritis t (t tabel) dengan derajat bebas 10 dan tingkat signifikansi 5% adalah 2,228

(Gambar 13.22). Berdasarkan Gambar 13.20, diketahui nilai statistik t adalah 4,5288,

berada pada daerah 𝐻1 , yakni daerah penolakan 𝐻0 dan penerimaan 𝐻1 , maka terdapat

perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan.

 Cara lain, diketahui nilai P-Value 0,0011 < tingkat signifikansi 0,05, maka terdapat

perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan.

Gambar 13.23 Hasil STATCAL (Mann-Whitney Test)

167
Apabila asumsi normalitas tidak dipenuhi dan ukuran sampel < 30, maka uji Mann-Whitney

dapat digunakan sebagai pendekatan nonparametrik. Sebagai contoh saja, berikut akan

digunakan uji Mann-Whitney untuk menguji apakah terdapat perbedaan tinggi badan yang

signifikan antara laki-laki dan perempuan. Berdasarkan hasil uji Mann-Whitney pada Gambar

13.23, diketahui nilai P-Value with Continuity Correction adalah 0,01 < tingkat signifikansi

0,05, maka terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan.

Gambar 13.24 Hasil STATCAL (Bar (Average))

Gambar 13.24 merupakan hasil dari grafik batang rata-rata berdasarkan jenis kelamin.

Diketahui rata-rata tinggi badan laki-laki lebih tinggi dibandingkan rata-rata tinggi badan

pada perempuan.

168
13.6 Contoh Kasus (Penyelesaian dengan Minitab)

Input data Tabel 13.1 dalam Minitab seperti pada Gambar 13.25.

Gambar 13.25

Perhatikan Gambar 13.26. Pilih Stat => basic Statistics => 2-Sample t.

Gambar 13.26

Perhatikan Gambar 13.27. Pada kotak Samples:, isi dengan variabel Tinggi Badan,

sementara pada kotak Subscripts:, isi dengan Jenis Kelamin. Diketahui pada hasil

sebelumnya (Bagian 13.6 dan Bagian 13.7), asumsi kesamaan varians dari dua populasi

dipenuhi. Sehingga pilih Assume equal variances. Kemudian pilih OK.

169
Gambar 13.27

Gambar 13.28 disajikan hasil Minitab untuk uji t 2 sampel independen. Diketahui:

 Rata-rata tinggi badan laki-laki adalah 176,58, dengan standar deviasi 3,28.

 Rata-rata tinggi badan perempuan adalah 168,67, dengan standar deviasi 2,48.

 Nilai statistik t (t hitung / T-Value) adalah 4,53.

 Nilai derajat bebas (degree of freedom / DF) adalah 10.

Gambar 13.28

Gambar 13.29 Menghitung Nilai Kritis t (t Tabel) dengan Microsoft Excel

170
𝐻0

𝐻1 𝐻1

𝑡𝑡𝑎𝑏𝑒𝑙 = −2,228 𝑡𝑡𝑎𝑏𝑒𝑙 = +2,228

Gambar 13.30 Daerah Keputusan berdasarkan Uji t

 Nilai kritis t (t tabel) dengan derajat bebas 10 dan tingkat signifikansi 5% adalah 2,228

(Gambar 13.27). Berdasarkan Gambar 13.28, diketahui nilai statistik t adalah 4,53,

berada pada daerah 𝐻1 , yakni daerah penolakan 𝐻0 dan penerimaan 𝐻1 , maka terdapat

perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan.

Cara lain, diketahui nilai P-Value 0,001 < tingkat signifikansi 0,05, maka terdapat perbedaan

tinggi badan yang signifikan antara laki-laki dan perempuan.

171
BAB 14

KORELASI LINEAR PEARSON

14.1 Sekilas Pengertian Korelasi Linear Pearson Berdasarkan Beberapa Buku

Berikut diberikan beberapa kutipan penjelasan mengenai korelasi linear Pearson dari beberapa

buku.

 John Maindonald dan W. John Braun (2010:67) dalam bukunya yang berjudul “Data

Analysis and Graphics Using R, An Example-Based Approach 3rd Edition” menyatakan

sebagai berikut.

“The usual Pearson or product–moment correlation is a summary measure of linear


relationship. Calculation of a correlation should always be accompanied by a check that the relevant
scatterplot shows a linear relationship. Often the addition of a smooth trend line helps the assessment.
Check also that the marginal distributions of the two variables are roughly normal, or at least not highly
skew. If the relationship is monotonic, but is not linear and/or has asymmetric marginal distributions, it
may be appropriate to use a Spearman rank correlation.”

 Gareth James, Daniela Witten, Trevor Hastie dan Robert Tibshirani (2014:70) dalam

bukunya yang berjudul “An Introduction to Statistical Learning with Applications in R”

menyatakan sebagai berikut.

“Recall that correlation, defined as

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)


𝐶𝑜𝑟(𝑋, 𝑌) = [1.1]
√∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ ) √∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)

is also a measure of the linear relationship between 𝑋 and 𝑌. This suggests that we might be able to
use 𝑟 = 𝐶𝑜𝑟(𝑋, 𝑌) instead of 𝑅2 in order to assess the fit of the linear model.”

 Peter Dalgaard (2008:120-122) dalam bukunya yang berjudul “Introductory Statistics with

R, 2nd Edition” menyatakan sebagai berikut.

“A correlation coefficient is a symmetric, scale-invariant measure of association between two random


variables. It ranges from −1 to +1, where the extremes indicate perfect correlation and 0 means no
correlation. The Pearson correlation is rooted in the two-dimensional normal distribution where the
theoretical correlation describes the contour ellipses for the density. The empirical correlation
coefficient is

172
∑ (𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝐶𝑜𝑟(𝑋, 𝑌) = [1.2]
√∑(𝑥𝑖 − 𝑥̅ )2 ∑(𝑦𝑖 − 𝑦̅)2

It can be shown that |𝑟| will be less than 1 unless there is a perfect linear relation between 𝑥𝑖 and 𝑦𝑖 ,
and for that reason the Pearson correlation is sometimes called the “linear correlation”.”

 Michael J. Crawley (2015:108) dalam bukunya yang berjudul “Statistics, An Introduction

Using R, 2nd Edition” menyatakan sebagai berikut.

“With two continuous variables, x and y, the question naturally arises as to whether their values are
correlated with each other (remembering, of course, that correlation does not imply causation).
Correlation is defined in terms of the variance of x, the variance of y, and the covariance of x and y
(the way the two vary together; the way they co-vary) on the assumption that both variables are
normally distributed. We have symbols already for the two variances, 𝑠𝑥2 and 𝑠𝑦2 . We denote the
covariance of 𝑥 and 𝑦 by cov(x, y), after which the correlation coefficient r is defined as

𝑐𝑜𝑣(𝑥,𝑦)
𝑟= [1.3]
√𝑠𝑥2 𝑠𝑦
2

 Sanders & Smidth (2000:522-524) dalam bukunya yang berjudul “Statistics, A First

Course, 6th Edition” menyatakan sebagai berikut.

“In correlation analysis, the purpose is to measure the strength or closeness of the relationship
between the variables. In other words, regression analysis asks, “What is the pattern of the existing
relationship?” and correlation analysis asks, “How strong is the relationship described in the
regression equation?” Although it is possible to be concerned only with regression analysis or only
with an analysis of correlation, the two are typically considered together.

…As you’ll notice in Figure 12.1, the eight points form a path that can be approximated by a straight
line. Thus, there appears to be a linear relationship between variables. And a high degree of
relationship is indicated by the fact that the points are all close to this straight-line path. You’ll also
notice there’s a positive (or direct) relationship between variables, that is, as aptitude test results
increase, output also increases. Of course, it’s quite possible for variables to have a negative (or
inverse) relationship (as the 𝑥 value increases, the 𝑦 value decreases).”

14.2 Korelasi Linear Pearson

Berdasarkan uraian pada Bagian 1, diperoleh informasi sebagai berikut:

 Korelasi linear Pearson dapat diartikan suatu nilai yang mengukur seberapa erat

hubungan linear antara dua variabel (linear relationship) dan dapat diketahui arah

hubungannya (direction) (John Maindonald dan W. John Braun, 2010:67; Sanders dan

Smidth, 2000:524).

173
 Korelasi linear Pearson sering juga disebut dengan Pearson product-moment

correlation (John Maindonald dan W. John Braun, 2010:67).

 Notasi korelasi linear Pearson untuk sampel adalah “𝑟”, sementara untuk populasi

adalah “𝜌” (dibaca: rho) (Douglas C. Montgomery dan George C. Runger, 2014:459;

Damodar N Gujarati, 2003:85; Prem S. Mann, 2013:611).

 Nilai korelasi linear Pearson berkisar dari −1 sampai dengan +1 (Peter Dalgaard,

2008:120-122; Andy Field, 2009:173).

 Nilai korelasi linear Pearson yang semakin dekat dengan −1 atau +1 menandakan

sebaran data dari dua variabel tersebut semakin linear. Dengan kata lain hubungan

linear antara dua variabel tersebut semakin kuat (Peter Dalgaard, 2008:120-122; Andy

Field, 2009:173).

 Nilai korelasi linear Pearson yang bernilai −1 atau +1 menandakan sebaran data dari

dua variabel tersebut linear sempurna. Dengan kata lain hubungan linear antara dua

variabel tersebut sempurna (Peter Dalgaard, 2008:120-122; Andy Field, 2009:173).

 Nilai korelasi linear Pearson yang bernilai mendekati 0 menandakan sebaran data dari

dua variabel tersebut semakin tidak linear. Dengan kata lain hubungan linear antara

dua variabel tersebut semakin lemah, mungkin saja terdapat hubungan lain yang

bersifat nonlinear (Peter Dalgaard, 2008:120-122; Andy Field, 2009:173).

 Skala data yang dipersyaratkan dalam penggunaan korelasi linear Pearson adalah

continuous atau kontinu atau numerik (Michael J. Crawley, 2015:108).

 Nilai koefisien korelasi linear Pearson bersifat simetri, maksudnya nilai korelasi linear

Pearson antara 𝑋 dan 𝑌 (𝑟𝑥𝑦 ) akan sama dengan nilai korelasi linear Pearson antara 𝑌

dan 𝑋 (𝑟𝑦𝑥 ) (Peter Dalgaard, 2008:120-122; Gujarati N Damodar, 2003:85).

Pembahasan selanjutnya akan dijelaskan lebih detail mengenai pernyataan-pernyataan di atas.

174
14.3 Contoh Kurva Linear dan Nonlinear

Misalkan diberikan data seperti pada Tabel 14.1.

Tabel 14.1 Contoh Data

No 𝑋 𝑌1 𝑌2 𝑌3 𝑌4 𝑌5
1 -5 25 -125 2 0.038462 8
2 -4 16 -64 3 0.058824 7
3 -3 9 -27 4 0.1 6
4 -2 4 -8 5 0.2 5
5 -1 1 -1 6 0.5 4
6 0 0 0 7 1 3
7 1 1 1 8 0.5 2
8 2 4 8 9 0.2 1
9 3 9 27 10 0.1 0
10 4 16 64 11 0.058824 -1

Berdasarkan data pada Tabel 14.1:

 Akan disajikan grafik sebaran data antara 𝑋 dan 𝑌1 , dengan 𝑋 menempati sumbu-x dan

𝑌1 menempati sumbu-y (Gambar 14.1).

 Akan disajikan grafik sebaran data antara 𝑋 dan 𝑌2 , dengan 𝑋 menempati sumbu-x dan

𝑌2 menempati sumbu-y (Gambar 14.2).

 Akan disajikan grafik sebaran data antara 𝑋 dan 𝑌3 , dengan 𝑋 menempati sumbu-x dan

𝑌3 menempati sumbu-y (Gambar 14.3).

 Akan disajikan grafik sebaran data antara 𝑋 dan 𝑌4 , dengan 𝑋 menempati sumbu-x dan

𝑌4 menempati sumbu-y (Gambar 14.4).

 Akan disajikan grafik sebaran data antara 𝑋 dan 𝑌5 , dengan 𝑋 menempati sumbu-x dan

𝑌4 menempati sumbu-y (Gambar 14.5).

175
Gambar 14.1 Grafik Sebaran Data antara 𝑿 dan 𝒀𝟏

Gambar 14.2 Grafik Sebaran Data antara 𝑿 dan 𝒀𝟐

Gambar 14.3 Grafik Sebaran Data antara 𝑿 dan 𝒀𝟑

Gambar 14.4 Grafik Sebaran Data antara 𝑿 dan 𝒀𝟒

176
Gambar 14.5 Grafik Sebaran Data antara 𝑿 dan 𝒀𝟓

Berdasarkan grafik sebaran data di atas, diketahui:

 Kurva pada Gambar 14.1, Gambar 14.2, dan Gambar 14.4 merupakan kurva

nonlinear (titik-titik tepat pada kurva nonlinear).

 Sementara kurva pada Gambar 14.3 dan Gambar 14.5 merupakan kurva linear (titik-

titik tepat pada kurva linear) (Sanders dan Smidth, 2000:524).

14.4 Contoh Sebaran Data Linear Sempurna dan Cenderung Linear

Misalkan diberikan data seperti pada Tabel 14.2.

Tabel 14.2 Contoh Data

𝑌 𝑋1 𝑋2 𝑋3
1 7.8 9 1
2 6.5 8 7
3 8.2 7 9
4 7.5 6 2
5 6.2 5 3
6 8.4 4 5
7 3.5 3 12
8 3.3 2 2
9 4.2 1 4
10 2 0 4

Berdasarkan data pada Tabel 14.2, disajikan grafik sebaran data antara 𝑋1 dan 𝑌, 𝑋2 dan 𝑌, 𝑋3

dan 𝑌 (Gambar 14.6).

177
Gambar 14.6 Sebaran Data antara 𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 terhadap 𝒀

Berdasarkan grafik sebaran data pada Gambar 14.6, diketahui:

 Sebaran data antara 𝑋1 dan 𝑌 cenderung linear. Titik-titik cenderung dekat dengan

garis linear (nilai korelasi linear Pearson -0,81, mendekati -1). Dengan kata lain

hubungan antara variabel 𝑋1 dan 𝑌 cenderung linear (Sanders dan Smidth, 2000:524).

 Sebaran data antara 𝑋2 dan 𝑌 linear sempurna. Titik-titik tepat pada garis linear (nilai

korelasi linear Pearson -1). Hubungan antara 𝑋2 dan 𝑌 bersifat linear sempurna.

 Sebaran data antara 𝑋3 dan 𝑌 cenderung tidak linear. Titik-titik cukup jauh dari garis

linear (nilai korelasi Pearson 0,016, cenderung dekat dengan 0, yang berarti sebaran

data cenderung tidak linear). Hubungan antara variabel 𝑋3 dan 𝑌 cenderung tidak

bersifat linear.

14.5 Sebaran Data dari Dua Variabel (Sebaran Data Cenderung Naik/Positif;
Turun/Negatif; Linear Positif Sempurna; Linear Negatif Sempurna)

Misalkan diberikan contoh data seperti pada Tabel 14.3.

178
Tabel 14.3 Contoh Data

𝑋1 𝑋2 𝑋3 𝑋4 𝑋5 𝑌
1 5.4 9 7.8 5 1
2 4.2 8 6.5 4 2
3 3.3 7 8.2 3 3
4 3.5 6 7.5 2 4
5 8.4 5 6.2 12 5
6 6.2 4 8.4 2 6
7 7.5 3 3.5 3 7
8 8.2 2 3.3 4 8
9 6.5 1 4.2 5 9
10 7.8 0 2 6 10

Gambar 14.7 Sebaran Data antara 𝑿𝟏 , 𝑿𝟐 , 𝑿𝟑 , 𝑿𝟒 , 𝑿𝟓 terhadap 𝒀

Berdasarkan sebaran data pada Gambar 14.7, diperoleh informasi sebagai berikut.

 Sebaran data antara 𝑋1 dan 𝑌 linear sempurna (titik-titik tepat pada garis). 𝑋1

meningkat, 𝑌 juga pasti meningkat. 𝑋1 dan 𝑌 berkorelasi positif sempurna (nilai

korelasi linear Pearson 1) (Sanders dan Smidth, 2000:524).

 Sebaran data antara 𝑋2 dan 𝑌 cenderung naik atau positif. Terdapat kecenderungan 𝑋2

yang semakin meningkat, 𝑌 juga meningkat. 𝑋2 dan 𝑌 berkorelasi positif namun tidak

179
sempurna (titik-titik tidak tepat di garis) (nilai korelasi linear Pearson 0,686) (Sanders

dan Smidth, 2000:524).

 Sebaran data antara 𝑋3 dan 𝑌 linear sempurna (titik-titik tepat di garis). 𝑋3 meningkat,

𝑌 pasti turun. 𝑋3 dan 𝑌 berkorelasi negatif sempurna (nilai korelasi linear Pearson -1)

(Sanders dan Smidth, 2000:524).

 Sebaran data antara 𝑋4 dan 𝑌 cenderung turun atau negatif. Terdapat kecenderungan

𝑋4 yang semakin meningkat, 𝑌 menurun. 𝑋4 dan 𝑌 berkorelasi negatif namun tidak

sempurna (titik-titik tidak tepat di garis) (nilai korelasi linear Pearson -0,81) (Sanders

dan Smidth, 2000:524).

 Sebaran data antara 𝑋5 dan 𝑌 cenderung tidak linear. Titik-titik cukup jauh dari garis

linear (nilai korelasi Pearson 0,088, cenderung dekat dengan 0, yang berarti sebaran

data cenderung tidak linear). Hubungan antara variabel 𝑋5 dan 𝑌 cenderung tidak

bersifat linear.

14.6 Mengukur Keeratan Hubungan Linear antara Dua Variabel dengan Korelasi
Linear Pearson

Misalkan diberikan contoh data seperti pada Tabel 14.4.

Tabel 14.4 Contoh Data

No Kinerja Motivasi Stres Gaji Berat Badan


1 75 71 45 74 55.34
2 65 60 65 67 65.34
3 72 78 55 70 45.45
4 84 79 55 80 71.21
5 74 69 54 74 54.45
6 59 55 76 59 48.53
7 83 80 37 80 76.45
8 55 45 75 52 76.45
9 65 78 68 67 56.43
10 73 77 54 70 63.34

180
Berdasarkan data pada Tabel 14.4, ingin diketahui:

 Faktor manakah yang memiliki korelasi/hubungan linear paling erat terhadap kinerja?

Apakah motivasi, stres, gaji atau berat badan?

Gambar 14.8 disajikan sebaran data antara motivasi, stres, gaji dan berat badan terhadap

kinerja. Sementara Gambar 14.9 merupakan nilai-nilai korelasinya (korelasi linear Pearson).

Gambar 14.8 Sebaran Data antara Motivasi, Stres, Gaji dan Berat Badan
terhadap Kinerja

Gambar 14.9 Korelasi Linear Pearson antar Variabel

181
Berdasarkan grafik sebaran data Gambar 14.8 dan nilai korelasi linear Pearson Gambar 14.9,

diperoleh hasil sebagai berikut.

 Korelasi atau hubungan linear paling kuat pertama adalah antara gaji dan kinerja,

dengan nilai korelasi linear Pearson 0,976. Nilai korelasi bernilai positif, yakni 0,976,

dapat diartikan terdapat kecenderungan, gaji yang semakin meningkat, kinerjanya juga

meningkat. Hubungan yang dimaksud di sini adalah hubungan linear.

 Sementara korelasi atau hubungan terkuat kuat kedua adalah antara stres dan kinerja,

dengan nilai korelasi linear Pearson -0,888. Nilai korelasi bernilai negatif, yakni -

0,888, dapat diartikan terdapat kecenderungan, stres yang semakin meningkat,

kinerjanya menurun.

 Korelasi atau hubungan terkuat ketiga adalah antara motivasi dan kinerja, dengan nilai

korelasi linear Pearson 0,824. Nilai korelasi bernilai positif, yakni 0,824, dapat

diartikan terdapat kecenderungan, motivasi yang semakin meningkat, kinerjanya

meningkat.

 Dan yang terakhir adalah antara berat badan dan kinerja, dengan nilai korelasi linear

Pearson 0,18. Nilai korelasi linear Pearson bernilai positif, yakni 0,18, dapat diartikan

terdapat kecenderungan, berat badan yang semakin meningkat, kinerjanya meningkat.

14.7 Ukuran Pengaruh (Size of an Effect)

Andy Field (2009:170) dalam bukunya yang berjudul “Discovering Statistics Using SPSS, 3rd

Edition” menyatakan sebagai berikut.

“We also saw in section 2.6.4 that because the correlation coefficient is a standardized measure of an
observed effect, it is a commonly used measure of the size of an effect and that values of ±.1
represent a small effect, ±.3 is a medium effect and ±.5 is a large effect (although I re-emphasize my
caveat that these canned effect sizes are no substitute for interpreting the effect size within the context
of the research literature).”

Berdasarkan uraian di atas:

 Nilai korelasi linear Pearson ±0,1 menyatakan small effect (pengaruh lemah).

182
 Nilai korelasi linear Pearson ±0,3 menyatakan medium effect (pengaruh sedang).

 Nilai korelasi linear Pearson ±0,5 menyatakan large effect (pengaruh besar).

Pada Bagian 14.6, diketahui nilai korelasi linear Pearson antara gaji dan kinerja adalah 0,976

> 0,5, yang berarti gaji dan kinerja berkorelasi kuat. Namun nilai korelasi Pearson antara berat

badan dan kinerja adalah 0,18 (di antara -0,3 dan +0,3), yang berarti berat badan dan kinerja

berkorelasi lemah.

Perhatikan bahwa aturan pengelompokkan korelasi lemah, sedang atau kuat di atas, bukan

aturan yang mutlak, dalam beberapa literatur lain, aturan pengelompokkan korelasi bisa

berbeda. Seperti pada: http://www.dummies.com/education/math/statistics/how-to- interpret-

a-correlation-coefficient-r/ dan https://www.slideshare.net/phannithrupp/ guideline-for-

interpreting-correlation-coefficient.

14.8 Kapan Uji Asumsi Normalitas Perlu Diuji? Apa Akibatnya Jika Asumsi Normalitas
Tidak Dipenuhi? Pada Kondisi Bagaimana Uji Asumsi Normalitas Dapat Diabaikan?
Menggunakan Pendekatan Apakah Untuk Menguji Keakuratannya?

Uji asumsi normalitas tidak perlu dilakukan apabila hanya sampai pada perhitungan nilai

korelasi linear Pearson. Mengapa demikian? Hal ini karena terpenuhinya atau tidak terpenuhi

asumsi normalitas tidak akan mempengaruhi hasil dari nilai korelasi linear Pearson. Alan

Agresti dan Barbara Finlay (2009:284) dalam bukunya yang berjudul “Statistical Methods for

the Social Sciences, 4th Edition” menyatakan sebagai berikut.

“The least squares line and 𝑟 and 𝑟 2 are valid descriptive statisics no matter what the shape of the
conditional distribution of y-values for each x-value.”

Asumi normalitas yang dimaksud adalah kedua sampel diasumsikan ditarik dari populasi

yang berdistribusi normal. Andy Field (2009:178) dalam bukunya “Discovering Statistics

Using SPSS, 3rd Edition” menyatakan sebagai berikut.

183
“However, if you want to establish whether the correlation coefficient is significant, then more
assumptions are required: for the test statistic to be valid the sampling distribution has to be normally
distributed and as we saw in Chapter 5 we assume that it is if our sample data are normally distributed
(or if we have a large sample). Although typically, to assume that the sampling distribution is normal,
we would want both variables to be normally distributed.”

Jadi pada saat kapan uji asumsi normalitas perlu diuji? Jawabannya adalah pada saat ketika

kita akan melakukan uji signifikansi korelasi linear Pearson. Mengapa demikian? Hal ini

karena, terpenuhinya atau tidak terpenuhinya asumsi normalitas akan mempengaruhi

distribusi sampling dari statistik korelasi linear Pearson. Jika asumsi normalitas dipenuhi,

maka distribusi sampling dari statistik korelasi linear Pearson ini akan berdistribusi 𝑡,

sehingga aturan distribusi 𝑡 dapat digunakan. Jika asumsi normalitas tidak dipenuhi, maka

distribusi sampling dari statistik korelasi linear Pearson akan semakin jauh dari distribusi 𝑡,

sehingga kesimpulan yang diperoleh menjadi tidak akurat.

Pada kondisi bagaimana uji asumsi normalitas dapat diabaikan? Uji asumsi normalitas dapat

diabaikan ketika jumlah sampel cukup besar. Mengapa demikian? Hal ini karena ketika

ukuran sampel besar, berdasarkan perluasan dari Teorema Limit Sentral (extended Central

Limit Theorem) menyatakan distribusi sampling dari statistik korelasi linear Pearson akan

mendekati normal. Dan juga distribusi 𝑡 akan mendekati distribusi normal ketika derajat

bebas dari distribusi 𝑡 semakin besar. Alan Agresti dan Barbara Finlay (2009:284) dalam

bukunya yang berjudul “Statistical Methods for the Social Sciences, 4th Edition” menyatakan

sebagai berikut.

“However, the statistical inferences in Section 9.5 also assume that the conditional distributions of y
are (1) normal, with (2) identical standard deviation tau for each x-value. These assumptions are also
not exactly satisfied in practice. For large samples, the normality assumption is relatively
unimportant, because an extended Central Limit Theorem implies that sample slopes and
correlations have approximately normal sampling distributions.”

Dalam konteks ini, kapan ukuran sampel dikatakan besar? Ukuran sampel dikatakan cukup

besar ketika di atas 30. Murray R. Spiegel dan Larry J. Stephens (275-276) dalam bukunya

yang berjudul “Statistics 4th Edition” menyatakan sebagai berikut.


184
“In previous chapters we often made use of the fact that for samples of size N > 30, called large
samples, the sampling distributions of many statistics are approximately normal, the approximation
becoming better with increasing N. For samples of size N < 30, called small samples, this
approximation is not good and becomes worse with decreasing N, so that appropriate modifications
must be made. A study of sampling distributions of statistics for small samples is called small
sampling theory. However, a more suitable name would be exact sampling theory, since the results
obtained hold for large as well as for small samples. In this chapter we study three important
distributions: Student’s t distribution, the chi-square distribution, and the F distribution.

For large values of 𝑣 or 𝑁 (certainly 𝑁 ≥ 30) the curves (2) closely approximately the standardized
normal curve

1 1 2
𝑌= 𝑒 −(2)𝑡
√2𝜋

Menggunakan pendekatan apakah untuk menguji keakuratannya terhadap perubahan asumsi

normalitas? Salah satu pendekatan untuk menguji keakuratannya adalah dengan

menggunakan pendekatan simulasi Monte Carlo.

14.9 Korelasi Linear Pearson Digunakan untuk Pengujian Validitas

Dalam beberapa literatur, sering ditemui korelasi linear Pearson digunakan untuk pengujian

validitas. Berikut kutipan isi dari beberapa buku mengenai korelasi linear Pearson digunakan

untuk pengujian validitas.

Sugiyono (2015:207-209) dalam bukunya yang berjudul “Metode Penelitian Manajemen”

menyatakan sebagai berikut.

“Setelah data ditabulasikan, maka pengujian validitas konstruksi dilakukan dengan analisis faktor, yaitu
mengkorelasikan antar skor item instrumen dalam suatu faktor dan mengkorelasikan skor faktor dengan skor
total.

Seperti telah dikemukakan bahwa, analisis faktor dilakukan dengan cara mengkorelasikan jumlah skor faktor
dengan skor total. Bila korelasi tiap faktor tersebut positif dan besarnya 0,3 ke atas maka faktor tersebut
merupakan konstrak yang kuat. Jadi berdasarkan analisis faktor itu dapat disimpulkan bahwa instrumen tersebut
memiliki validitas konstruksi yang baik.

Dari hasil perhitungan diketahui nilai korelasi ke tujuh butir instrumen dengan skor total ditunjukkan pada tabel 5.9
berikut:

Berdasarkan tabel 5.9 berikut dapat diketahui, bahwa butir no 3 (faktor 1) tidak valid, karena korelasi butir
tersebut dengan skor total hanya 0,22 (di bawah r kritis 0,3). Butir tersebut tidak selaras dengan butir yang lain.”

Yvonne Augustine dan Robert Kristaung (2013:70) dalam bukunya yang berjudul “Metode

Penelitian Bisnis dan Akuntansi” menyatakan sebagai berikut.


185
“Construct validity: validitas ini mengukur seberapa besar derajat tes mengukur konstruk yang dikehendaki untuk
diukur. Validitas konstruk merupakan hasil deduksi dari suatu teori yang kita bangun.

Analisis konfirmatori − merupakan metode terbaru yang digunakan untuk menguji validitas dan reliabilitas
instrumen pengumpulan data. Cara analisisnya dengan menghitung faktor loading yang serupa korelasi antara
indikator dan varaibel laten.

Validitas ini bersifat “judgmental”, demikian pendapat Hermawan, (2003:43), di mana suatu indikator dipandang
sahih sepanjang sesuai dengan telaah pustaka mengenai suatu konstruk yang diteliti. Nilai patokan untuk uji
validitas adalah koefisien korelasi yang mendapat nilai lebih besar dari 0,3 (Sekaran, 2000).”

Sebagi contoh kasus, misalkan akan dilakukan pengujian validitas dari 5 indikator untuk

variabel laten motivasi. Data disajikan pada Tabel 14.5.

Tabel 14.5 Data Jawaban 10 Responden untk 5 Indikator

Motivasi
Responden Total
P1 P2 P3 P4 P5
1 3 4 3 3 4 17
2 4 4 4 4 3 19
3 2 3 4 4 4 17
4 2 3 5 3 2 15
5 3 4 3 3 3 16
6 4 4 3 4 3 18
7 4 5 4 4 4 21
8 3 4 4 5 4 20
9 3 4 5 4 3 19
10 4 3 5 3 3 18

Berdasarkan data pada Tabel 14.5, selanjutnya akan dihitung nilai korelasi linear Pearson

antara setiap indikator terhadap skor total. Hasil diperoleh pada Tabel 14.6.

Tabel 14.6 Hasil Uji Validitas dengan Korelasi Linear Pearson

Indikator R Hitung (Korelasi Linear Pearson) R Kritis Keterangan


P1 0.617213 0.3 Valid
P2 0.673575 0.3 Valid
P3 0.074536 0.3 Tidak Valid
P4 0.721336 0.3 Valid
P5 0.541002 0.3 Valid

186
Berdasarkan hasil uji validitas pada Tabel 14.6, diketahui indikator P3 tidak valid dikarenakan

nilai korelasi linear Pearson 0,074 < 0,3 (Sugiyono, 2015:207-209).

14.10 Ketika Akan Melakukan Uji Signifikansi Koefisien Korelasi Pearson, Kapan Uji
Asumsi Normalitas Harus Diuji? Adakah Metode Alternatif Selain dari Korelasi Linear
Pearson, ketika Asumsi Normalitas Tidak Dipenuhi?

Berdasarkan uraian sebelumnya, uji asumsi normalitas harus diuji dan dipenuhi ketika akan

melakukan uji signifikansi koefisien korelasi linear Pearson (Alan Agresti dan Barbara Finlay,

2009:284; Andy Field, 2009:178), yang mana ukuran sampel kecil, yakni < 30 (Murray R.

Spiegel dan Larry J. Stephens, 2008:275-276).

Jika asumsi normalitas tidak dipenuhi, maka dapat digunakan pendekatan alternatif, yakni

pendekatan nonparametrik berupa korelasi Spearman. Peter Dalgaard (2008:123) dalam

bukunya yang berjudul “Introductory Statistics with R, 2nd Edition” menyatakan sebagai

berikut.

“As with the one- and two-sample problems, you may be interested in nonparametric variants. These
have the advantage of not depending on the normal distribution and, indeed, being invariant to
monotone transformations of the coordinates. The main disadvantage is that its interpretation is not
quite clear. A popular and simple choice is Spearman’s rank correlation coefficient ρ. This is obtained
quite simply by replacing the observations by their rank and computing the correlation. Under the null
hypothesis of independence between the two variables, the exact distribution of ρ can be calculated.”

14.11 Contoh Kasus Korelasi Linear Pearson dengan STATCAL

Contoh kasus pada 14.6 akan diselesaikan dengan STATCAL. Pertama, input data pada Tabel

14.4 dalam STATCAL (Gambar 14.10).

187
Gambar 14.10 Input Data Numerik

Kemudian pilih Statistics => Pearson and Spearman Correlation (Gambar 14.11). Pada

Gambar 14.12 (kotak Choose Numeric Variable (Multiple Choices)) pindahkan seluruh

variabel ke kotak sebelah kanan.

Gambar 14.11 Pearson and Spearman Correlation

188
Gambar 14.12 Pemilihan Variabel

Hasil STATCAL dapat dilihat pada bagian Result, seperti berikut.

Gambar 14.13 Beberapa Hasil pada Bagian Result

Gambar 14.14 Hasil STATCAL: Data Selected

189
Gambar 14.15 Hasil STATCAL: Descriptive

Gambar 14.16 Hasil STATCAL: Normality

190
Gambar 14.17 Hasil STATCAL: Graph: Scatter Plot

Gambar 14.18 Hasil STATCAL: Pearson Correlation

191
Gambar 14.19 Hasil STATCAL: Spearman Correlation

Pada hasil STATCAL bagian Data Selected (Gambar 14.14) menampilkan kembali data yang

Anda pilih. Hasil STATCAL pada bagian Descriptive (Gambar 14.15) menampilkan

beberapa ukuran deskriptif seperti nilai minimum, maksimum, rata-rata dan standar deviasi.

Sebagai contoh diketahui nilai minimum dari kinerja adalah 55, sementara nilai maksimum

dari kinerja adalah 84. Rata-rata kinerja adalah 70,5 dengan standar deviasi 9,501.

Selanjutnya hasil STATCAL pada bagian Normality (Gambar 14.16) bertujuan untuk

menguji asumsi apakah data motivasi dan data kinerja berasal dari populasi berdistribusi

normal atau tidak. Pengujian asumsi normalitas ini menggunakan uji Kolmogorov-Smirnov.

Diketahui berdasarkan hasil dari uji Kolmogorov-Smirnov, diketahui nilai P-Value untuk

motivasi adalah 0,604 > tingkat signifikansi 5%, maka asumsi normalitas untuk data motivasi

dipenuhi. Sementara nilai P-Value untuk kinerja adalah 0,954 > tingkat signifikansi 5%, maka

asumsi normalitas untuk data kinerja juga dipenuhi. Dikarenakan asumsi normalitas dipenuhi,

maka pengujian dilanjutkan dengan menggunakan korelasi linear Pearson.

192
Hasil STATCAL pada bagian Graph: Scatter Plot (Gambar 14.17) menampilkan sebaran

data antara motivasi dan kinerja. Terlihat bahwa sebaran data cenderung naik dari kiri bawah

ke kanan atas. Dengan kata lain terdapat kecenderungan ketika motivasi meningkat, kinerja

juga meningkat (korelasi positif).

Hasil STATCAL pada bagian Pearson Correlation menampilkan hasil korelasi Pearson

(Gambar 14.18). Berdasarkan hasil ini:

 Diketahui nilai korelasi linear Pearson antara motivasi dan kinerja adalah 0,824.

 Nilai korelasi linear Pearson antara motivasi dan kinerja adalah 0,824, yang mana >

0,5, maka motivasi dan kinerja berkorelasi kuat (Andy Field, 2009:170).

 Nilai statistik 𝑡 adalah 4,113, sementara nilai kritis 𝑡 dengan derajat bebas 8 dan

tingkat signifikansi 5% adalah 2,306.

 Nilai P-Value adalah 0,003 < tingkat signifikansi 5%, maka motivasi dan kinerja

berkorelasi signifikan.

Dengan pendekatan distribusi 𝑡:

𝐻0 ditolak, 𝐻1 diterima

𝐻0 ditolak, 𝐻1 diterima
𝐻0 diterima, 𝐻1 ditolak

−2,306 +2,306

Gambar 14.20 Daerah Keputusan Distribusi 𝒕

193
Diketahui nilai statistik 𝑡 adalah 4,113, terletak pada daerah 𝐻0 ditolak dan 𝐻1 diterima

(Gambar 14.20). Hal ini berarti terdapat korelasi yang signifikan antara motivasi dan

kinerja, pada tingkat signifikansi 5%.

Hasil STATCAL pada bagian Spearman Correlation (Gambar 14.19) menampilkan hasil

korelasi Spearman. Berdasarkan hasil ini diketahui nilai korelasi Spearman adalah 0,741.

Nilai korelasi Spearman antara motivasi dan kinerja adalah 0,741, yang mana > 0,5, maka

motivasi dan kinerja berkorelasi kuat (Andy Field, 2009:170). Nilai P-Value adalah 0,014 <

tingkat signifikansi 5%, maka motivasi dan kinerja berkorelasi signifikan.

Gambar 14.20 Korelasi Linear Pearson dengan SPSS (𝒓 = 𝟎, 𝟖𝟐𝟒)

Gambar 14.21 Korelasi Spearman dengan SPSS (𝒓 = 𝟎, 𝟕𝟒𝟏)

194
14.12 Contoh Kasus Korelasi Linear Pearson dengan STATCAL (Uji Validitas)

Contoh kasus pada Bagian 14.9 akan diselesaikan dengan STATCAL. Pertama pilih Statistics

=> Validity and Reliability (Gambar 14.22).

Gambar 14.22 Validity and Reliability

Gambar 14.23 Input Data

195
Input data pada Tabel 14.5 dalam STATCAL (Gambar 14.23). Pada Bagian Select

Indicator/Item, pindahkan seluruh item pertanyaan ke kotak sebelah kanan. Hasil dari

pengujian dapat dilihat pada bagian Result.

Gambar 14.24 Hasil STATCAL: Correlation Between Item and Total (SPSS) &
Corrected Item-Total Correlation (SPSS)

Gambar 14.25 Hasil STATCAL: Correlation Item and Total

196
Gambar 14.26 Hasil STATCAL: Corrected Item-Total Correlation

Gambar 14.27 Hasil STATCAL: Combined Loading

Gambar 14.28 Hasil STATCAL: Reliability

197
Hasil pada Gambar 14.24 menampilkan nilai Correlation Between Item and Total (SPSS)

& Corrected Item-Total Correlation (SPSS). Gambar 14.29 disajikan hasil SPSS untuk

Corrected Item-Total Correlation.

Gambar 14.29 Output SPSS: Corrected Item-Total Correlation

Hasil pada kolom Correlation Between Item and Total (SPSS) merupakan nilai korelasi

Pearson antara suatu item terhadap skor total. Diketahui untuk indikator P3, nilai korelasi

linear Pearson adalah 0,0745 < 0,3, maka indikator P3 tidak valid (Sugiyono, 2015:207-209).

Hasil pada Gambar 14.25 merupakan grafik yang mana titik-titiknya merupakan nilai korelasi

antara suatu item terhadap skor total. Terlihat bahwa untuk indikator P3 memiliki nilai

korelasi < 0,3 (di bawah batas garis 0,3) maka indikator P3 tidak valid (Sugiyono, 2015:207-

209).

Terakhir hasil pada Gambar 14.28 menampilkan nilai Cronbach’s Alpha (SPSS). Diketahui

nilai Cronbach’s Alpha (SPSS) adalah 0,275, yakni salah satu ukuran reliabilitas. Perhatikan

juga nilai Cronbach’s Alpha pada hasil SPSS Gambar 14.29, yakni sama bernilai 0,275.

198
14.13 Contoh Kasus Korelasi Linear Pearson dengan STATCAL, SPSS dan Minitab

Misalkan diberikan data tinggi badan dan berat badan dari 40 responden seperti pada Tabel

14.7.

Tabel 14.7 Data Tinggi Badan dan Berat Badan dari 40 Responden

Responden Berat Tinggi


1 58.64 155.43
2 54.34 153.53
3 55.12 155.43
4 50.64 150.63
5 51.23 151.23
6 55.43 152.23
7 50.53 150.53
8 55.54 150.63
9 52.34 151.53
10 53.45 174.34
11 51.64 155.54
12 52.43 152.43
13 53.43 154.34
14 54.34 154.34
15 57.64 150.53
16 51.23 146.54
17 59.34 169.53
18 54.34 154.34
19 98.65 198.65
20 43.32 140.32
21 56.45 151.23
22 54.24 154.34
23 53.23 160.43
24 50.54 149.12
25 50.53 152.23
26 55.33 151.3
27 53.34 151.35
28 55.44 154.34
29 52.24 155.15
30 55.34 174.11
31 51.54 152.13
32 55.34 152.2
33 55.34 154.11
34 54.24 154.11
35 57.54 150.3
36 51.13 156.34

199
37 59.24 169.3
38 54.24 154.11
39 98.55 178.32
40 43.22 140.09

Berdasarkan data pada Tabel 14.7:

 Buat grafik sebaran data antara tinggi badan dan berat badan, di mana tinggi badan

sebagai sumbu-x dan tinggi badan sebagai sumbu-y!

 Hitung nilai korelasi linear Pearson dan korelasi Spearman untuk mengetahui keeratan

hubungan antara tinggi badan dan berat badan!

 Tentukan apakah keeratan hubungan tersebut termasuk ke dalam kategori lemah,

sedang atau kuat, berdasarkan kriteria pada buku yang berjudul “Discovering Statistics

Using SPSS, 3rd Edition”.

 Lakukan uji signifikansi untuk menentukan apakah tinggi badan dan berat badan

berkorelasi signifikan pada tingkat signifikansi 5%!

Penyelesaian dengan STATCAL

Input data Tabel 14.7 dalam STATCAL seperti pada Gambar 14.30.

Gambar 14.30 Input Data Numerik


200
Kemudian pilih Statistics => Pearson and Spearman Correlation (Gambar 14.31). Pada

Gambar 14.32 (kotak Choose Numeric Variable (Multiple Choices)) pindahkan seluruh

variabel ke kotak sebelah kanan.

Gambar 14.31 Pearson and Spearman Correlation

Gambar 14.32 Pemilihan Variabel

Hasil STATCAL dapat dilihat pada bagian Result, seperti berikut.

201
Gambar 14.33 Hasil STATCAL: Data Selected

Gambar 14.34 Hasil STATCAL: Descriptive

202
Gambar 14.35 Hasil STATCAL: Normality

Gambar 14.36 Hasil STATCAL: Graph (Scatter Plot)

203
Gambar 14.37 Hasil STATCAL: Pearson Correlation

Gambar 14.38 Hasil STATCAL: Spearman Correlation

204
Pada hasil STATCAL bagian Data Selected (Gambar 14.33) menampilkan kembali data yang

Anda pilih. Hasil STATCAL pada bagian Descriptive (Gambar 14.34) menampilkan

beberapa ukuran deskriptif seperti nilai minimum, maksimum, rata-rata dan standar deviasi.

Sebagai contoh diketahui nilai minimum dari tinggi badan adalah 43,22, sementara nilai

maksimum dari tinggi badan adalah 98,65. Rata-rata tinggi badan adalah 55,767 dengan

standar deviasi 10,501.

Hasil STATCAL pada bagian Graph: Scatter Plot (Gambar 14.36) menampilkan sebaran

data antara tinggi badan dan berat badan. Terlihat bahwa sebaran data cenderung naik dari kiri

bawah ke kanan atas. Dengan kata lain terdapat kecenderungan ketika tinggi badan

meningkat, berat badan juga meningkat (korelasi positif).

Selanjutnya hasil STATCAL pada bagian Normality (Gambar 14.35) bertujuan untuk

menguji asumsi normalitas dengan uji Kolmogorov-Smirnov. Diketahui nilai p-value pada

tinggi adalah 0,001 < tingkat signifikansi 0,05, maka asumsi normalitas untuk data tinggi

tidak dipenuhi. Begitu juga nilai p-value pada berat adalah 0,001 < tingkat signifikansi 0,05,

maka asumsi normalitas untuk data berat tidak dipenuhi.

Meskipun asumsi normalitas tidak dipenuhi, uji signifikansi tetap dapat digunakan korelasi

linear Pearson dikarenakan jumlah sampel masing-masing dipandang cukup besar, yakni 40

(lebih dari 30) (Murray R. Spiegel dan Larry J. Stephens, 2008:275-276). Hal ini karena

ketika ukuran sampel besar, berdasarkan perluasan dari Teorema Limit Sentral (extended

Central Limit Theorem) menyatakan distribusi sampling dari statistik korelasi linear Pearson

akan mendekati normal. Dan juga distribusi 𝑡 akan mendekati distribusi normal ketika derajat

bebas dari distribusi 𝑡 semakin besar.

205
Perhatikan hasil uji signifikansi korelasi linear Pearson pada Gambar 14.37. Diketahui nilai

korelasi linear Pearson 0,797. Diketahui nilai korelasi linear Pearson bernilai positif, dengan

kata lain tinggi dan berat berkorelasi positif. Terdapat kecenderungan, semakin meningkat

tinggi badan, berat badan juga cenderung meningkat. Begitu juga nilai korelasi Spearman

bernilai positif, yakni 0,432 (Gambar 14.38). Diketahui nilai P-Value adalah 0,000 (Gambar

14.37) < 0,05, maka disimpulkan tinggi badan dan berat badan berkorelasi signifikan.

Penyelesaian dengan SPSS

Pertama, input data Tabel 14.7 dalam SPSS seperti pada Gambar 14.39. Selanjutnya pilih

Analyze => Correlate => Bivariate (Gambar 14.40). Perhatikan Gambar 14.41. Pindahkan

ke kotak sebelah kanan untuk variabel berat dan tinggi. Pilih Pearson dan Spearman. Pilih

OK. Nilai korelasi linear Pearson dan Spearman diperlihatkan pada Tabel 14.8 dan Tabel

14.9.

Gambar 14.39 Input Data dalam SPSS

Gambar 14.40 Menu Korelasi Linear Pearson dan Spearman


206
Gambar 14.41 Bivariate Correlations

Tabel 14.8 Korelasi Linear Pearson berdasarkan SPSS

Correlations

Berat Tinggi
Berat Pearson Correlation 1 .797**
Sig. (2-tailed) .000

N 40 40
Tinggi Pearson Correlation .797** 1
Sig. (2-tailed) .000
N 40 40
**. Correlation is significant at the 0.01 level (2-tailed).

Tabel 14.9 Korelasi Spearman berdasarkan SPSS


Correlations

Berat Tinggi
Spearman's rho Berat Correlation Coefficient 1.000 .432**
Sig. (2-tailed) . .005
N 40 40
Tinggi Correlation Coefficient .432** 1.000
Sig. (2-tailed) .005 .
N 40 40
**. Correlation is significant at the 0.01 level (2-tailed).

Berdasarkan Tabel 14.8 diketahui nilai korelasi linear Pearson adalah 0,797, dengan nilai p-

value 0,000. Nilai korelasi Spearman berdasarkan Tabel 14.9 adalah 0,432, dengan nilai p-

value 0,005. Untuk melakukan uji asumsi normalitas dalam SPSS dengan menggunakan uji

Kolmogorov-Smirnov, pilih Analyze => Nonparametric Tests => 1-Sample K-S (Gambar
207
14.42), sehingga muncul kotak One-Sample Kolmogorov-Smirnov Test (Gambar 14.43).

Pindahkan variabel berat dan tinggi ke kotak sebelah kanan. Pada Test Distribution pilih

Normal. Kemudian OK. Hasil dari uji normalitas diperlihatkan pada Tabel 14.10 dan

Gambar 14.44. Diketahui nilai p-value (Asymp. Sig. (2-tailed)) untuk variabel berat adalah

0,001 atau 0,00065049774 atau bisa dibulatkan 0,0007 (Gambar 14.44).

Gambar 14.42 Menu Uji Kolmogorov-Smirnov

Gambar 14.43 One-Sample Kolmogorov-Smirnov Test

208
Tabel 14.10 Hasil Uji Asumsi Normalitas dengan Uji Kolmogorov-Smirnov
One-Sample Kolmogorov-Smirnov Test

Berat Tinggi
N 40 40
Normal Parametersa,,b Mean 55.7670 155.9170
Std. Deviation 10.50144 10.57178
Most Extreme Differences Absolute .317 .314
Positive .317 .314
Negative -.259 -.198
Kolmogorov-Smirnov Z 2.004 1.987
Asymp. Sig. (2-tailed) .001 .001
a. Test distribution is Normal.
b. Calculated from data.

Gambar 14.44 Hasil Uji Asumsi Normalitas dengan Uji Kolmogorov-Smirnov

Penyelesaian dengan Minitab

Pertama, input data Tabel 14.7 dalam Minitab seperti pada Gambar 14.45. Selanjutnya pilih

Stat => Basic Statistics => Correlation (Gambar 14.46), sehingga muncul kotak

Correlation (Gambar 7.47).

Gambar 14.45 Input Data dalam SPSS

209
Gambar 14.46 Menu Korelasi Linear Pearson

Gambar 14.47 Korelasi Linear Pearson

Pada Gambar 14.47, pindahkan variabel tinggi dan berat ke kotak sebelah kanan, yakni kotak

Variables. Kemudian pilih OK. Hasil korelasi linear Pearson dapat dilihat pada Gambar

14.44. Diketahui nilai korelasi linear Pearson adalah 0,797 dengan P-Value 0,000.

Gambar 14.48 Korelasi Linear Pearson dengan Minitab

210
BAB 15

DATA KINERJA PERUSAHAAN INDONESIA

15.1 Mengakses Data Kinerja Perusahaan Indonesia di STATCAL

Dalam STATCAL terdapat menu Data: Indonesian Company Performance (9 Sectors)

(Source: www.idx.co.id). Gambar 15.1 diperlihatkan menu tersebut.

Gambar 15.1 Data: Indonesian Company Performance (9 Sectors)

Pada menu ini Anda bisa mengakses data kinerja berdasarkan sektor, tahun dan variabel-

variabel kinerja perusahaan. Beberapa contoh data kinerja perusahaan yang tersedia seperti

return on asset (ROA), return on equity (ROE), book value (BV) dan sebagainya. Adapun

sektor yang tersedia sebagai berikut (perhatikan Gambar 15.2).

 Agriculture.

 Basic Industry and Chemicals.

 Consumer Goods Industry.

 Finance.

211
 Infrastructure, Utilities and Transportation.

 Mining.

 Miscellaneous Industry.

 Property, Real Estate and Building Construction.

 Trade, Service and Investment.

Misalkan dipilih sektor Basic Industry


and Chemicals (kode angka 2) dan
sektor Finance (kode angka 4).

Gambar 15.2 Pemilihan Sektor

Pada Gambar 15.2 bagian Select Sector, Anda dapat memilih sektor yang Anda inginkan.

Misalkan dipilih sektor Basic Industry and Chemicals (kode angka 2) dan sektor Finance

(kode angka 4).

212
Misalkan tahun yang ingin ditampilkan adalah
tahun 2014 (kode angka 3), tahun 2015 (kode
angka 4), tahun 2016 (kode angka 5) dan
tahun 2017 (kode angka 6).

Gambar 15.3 Pemilihan Tahun

Selanjutnya Anda dapat memilih tahun yang ingin ditampilkan (Gambar 15.3). Misalkan

tahun yang ingin ditampilkan adalah tahun 2014 (kode angka 3), tahun 2015 (kode angka 4),

tahun 2016 (kode angka 5) dan tahun 2017 (kode angka 6).

213
Misalkan variabel yang ingin ditampilkan adalah
nama sektor (kode angka 1), nama subsektor (kode
angka 2), tahun (kode angka 3), PBV (X) (kode angka
15), total asset (kode angka 16) dan ROA (%) (kode
angka 27).

Gambar 15.4 Pemilihan Variabel Kinerja Perusahaan

Selanjutnya Anda dapat memilih variabel apa saja yang ingin ditampilkan. Misalkan variabel

yang ingin ditampilkan adalah nama sektor (kode angka 1), nama subsektor (kode angka 2),

tahun (kode angka 3), PBV (X) (kode angka 15), total asset (kode angka 16) dan ROA (%)

(kode angka 27). Gambar 15.5 disajikan data kinerja perusahaan yang telah dipilih. Pada

Gambar 15.5 terdapat pilihan Remove Empty Cell?. Jika Anda memilih Yes, maka jika

dalam suatu baris terdapat cell atau data yang kosong atau tidak lengkap, maka baris

tersebut akan dihapus atau dieliminasi. Berdasarkan Gambar 15.5 terdapat 563 baris data.

214
Gambar 15.5 Data Kinerja Perusahaan yang Dipilih

215
15.2 Mencetak Data Kinerja Perusahaan Indonesia ke Microsoft Excel

Pada bagian 15.1 telah dibahas langkah demi langkah bagaimana cara mengakses data kinerja

perusahaan indonesia di STATCAL. Data yang telah dipilih dapat dicetak ke dalam Microsoft

Excel dengan menekan tombol Print Data to Microsoft Excel.

Data yang telah dipilih dapat dicetak


ke dalam Microsoft Excel dengan
menekan tombol Print Data to
Microsoft Excel.

Gambar 15.6 Mencetak Data ke Microsoft Excel

Gambar 15.7 Data Dicetak ke Microsoft Excel

216
15.3 Menu Descriptive

Gambar 15.8 disajikan tampilan menu Descriptive. Pada menu Descriptive disajikan

beberapa nilai ukuran deskriptif seperti nilai minimum, maksimum, rata-rata, standar deviasi

dan sebagainya, berdasarkan data yang telah Anda pilih sebelumnya. Pada bagian Select

Variable, dipilih variabel PBV (X), total assets dan ROA (%).

Pada bagian Select Variable,


dipilih variabel PBV (X), total
assets dan ROA (%).

Gambar 15.8 Menu Descriptive

Diketahui nilai minimum PBV (X) adalah -2,21, sementara nilai PBV (X) maksimum adalah

4935,45. Rata-rata PBV (X) adalah 10,493, dengan standar deviasi 207,959.

217
15.4 Menu Histogram

Gambar 15.9 disajikan tampilan menu Histogram. Pada bagian Select One Variable,

misalkan dipilih variabel total asset (kode angka 5) untuk ditampilkan ke dalam histogram.

Pada bagian Select One Variable,


misalkan dipilih variabel total asset
(kode angka 5) untuk ditampilkan ke
dalam histogram.

Gambar 15.9 Menu Histogram (Histogram untuk Data Total Asset)

Berdasarkan Gambar 15.9 terlihat bahwa histogram untuk data total asset miring / menceng

ke kanan.

218
15.5 Menu Boxplot dan Outlier

Gambar 15.10 disajikan tampilan menu Boxplot dan Outlier. Pada bagian Select Variable,

misalkan dipilih variabel PBV (X), total assets dan ROA (%) untuk ditampilkan ke dalam

boxplot. Perhatikan Gambar 15.10.

Pada bagian Select Variable, misalkan


dipilih variabel PBV (X), total assets
dan ROA (%) untuk ditampilkan ke
dalam boxplot.

Gambar 15.10 Menu Boxplot & Outlier

Berdasarkan Gambar 15.10 terlihat bahwa pada data PBV (X), total asset dan ROA (%)

terdapat beberapa data ekstrim atau outlier yang ditandai dengan titik-titik berwarna merah.

STATCAL juga memberitahu data mana saja yang tergolong ke dalam data ekstrim.

219
########Variable: PBV (X)########

Row of Outlier Value


1 243 -2.21
2 498 3.86
3 207 3.90
4 21 3.96
5 519 3.98
6 463 4.05
7 216 4.07
8 310 4.07
9 190 4.08
10 33 4.09
11 48 4.10
12 251 4.10
13 270 4.11
14 49 4.15
15 191 4.16
16 192 4.21
17 267 4.33
18 517 4.39
19 403 4.63
20 541 4.69
21 516 4.70
22 316 4.72
23 97 4.75
24 67 4.81
25 166 5.07
26 208 5.17
27 39 5.34
28 309 5.45
29 430 5.59
30 1 5.68
31 518 6.29
32 47 7.51
33 486 7.72
34 509 8.16
35 563 8.97
36 27 9.08
37 429 9.13
38 28 11.05
39 156 11.13
40 542 12.02
41 487 13.08
42 488 18.52
43 543 21.49
44 157 22.14
45 244 64.43
46 96 4935.45

########Variable: Total Assets########

Row of Outlier Value


1 238 39337527
2 97 40471995
3 322 42803631

220
4 323 43032950
5 35 44226896
6 36 47290722
7 377 47305954
8 79 49354389
9 324 51518681
10 144 52893676
11 534 53820063
12 145 54247122
13 143 54262325
14 535 56778071
15 378 60839102
16 379 74745570
17 361 75014737
18 317 75836537
19 273 79051268
20 362 81039663
21 217 81073679
22 536 86966523
23 318 88697430
24 363 91371387
25 219 92423557
26 274 94366502
27 364 95489850
28 220 98252697
29 319 102318457
30 387 103123179
31 218 103162005
32 275 105406002
33 276 106442999
34 320 114980168
35 388 120480402
36 389 138196341
37 345 143318466
38 293 144582353
39 352 148328370
40 390 153773957
41 346 157619013
42 351 165527512
43 347 166678902
44 294 171807592
45 395 172581667
46 348 173253491
47 306 174685800
48 307 178257092
49 350 182689351
50 396 183120540
51 349 185349861
52 305 188057412
53 304 195708593
54 397 199175053
55 398 213541797
56 295 214168479
57 341 233162423
58 342 238849252
59 343 241571728
60 296 261365267
61 344 266305445
62 281 416573708
63 282 508595288
64 267 552423892
221
65 268 594372770
66 283 603031880
67 269 676738753
68 284 709330084
69 270 750319671
70 289 801955021
71 333 855039673
72 290 878426312
73 334 910063409
74 291 1003644426
75 335 1038706009
76 336 1124700847
77 292 1126248442

########Variable: ROA (%)########

Row of Outlier Value


1 53 -54.85
2 529 -51.16
3 8 -36.73
4 52 -27.92
5 7 -27.27
6 18 -16.11
7 60 -13.58
8 6 -13.23
9 359 -11.73
10 402 -11.23
11 226 -10.70
12 88 -10.68
13 180 -10.41
14 20 -10.35
15 437 -9.81
16 143 -8.82
17 135 -8.71
18 227 -8.13
19 59 -7.71
20 309 -7.71
21 121 -6.75
22 208 -6.64
23 438 -6.61
24 262 -6.40
25 228 -6.33
26 139 -6.05
27 142 -6.04
28 154 -5.88
29 71 -5.75
30 5 -5.50
31 140 -5.48
32 72 -5.40
33 70 -5.30
34 155 -5.29
35 300 -5.22
36 301 -5.13
37 51 -5.11
38 100 9.31
39 498 9.42
40 463 9.43
41 118 9.80
42 84 9.91
222
43 55 10.00
44 35 10.25
45 515 10.28
46 168 10.53
47 516 10.67
48 97 10.68
49 430 10.77
50 26 10.84
51 78 10.88
52 546 10.92
53 223 11.05
54 25 11.22
55 11 11.28
56 67 11.69
57 43 11.70
58 34 11.86
59 85 12.07
60 188 12.22
61 23 12.84
62 86 12.91
63 517 13.33
64 197 13.36
65 186 13.39
66 96 14.10
67 66 14.49
68 429 14.49
69 185 15.69
70 22 15.76
71 187 15.77
72 33 16.24
73 189 16.69
74 525 17.51
75 21 18.26
76 544 20.11
77 47 20.78
78 367 386.00

223
15.6 Menu Correlation Matrix

Gambar 15.11 disajikan tampilan menu Correlation Matrix. Pada bagian Select Variable,

misalkan dipilih variabel PBV (X), total assets dan ROA (%).

Pada bagian Select Variable, misalkan


dipilih variabel PBV (X), total assets
dan ROA (%).

Gambar 15.11 Menu Correlation Matrix

Berdasarkan Gambar 15.11 diketahui:

 Nilai korelasi Pearson antara PBV (X) dan ROA (%) adalah 0,03.

224
 Nilai korelasi Pearson antara ROA (%) dan total asset adalah -0,01.

 Nilai korelasi Pearson antara total asset dan PBV (X) adalah 0,00.

225
Referensi

[1] John Maindonald dan W. John Braun, 2010, Data Analysis and Graphics Using R, An
Example-Based Approach 3rd Edition, Cambridge University Press.

[2] Gareth James, Daniela Witten, Trevor Hastie dan Robert Tibshirani, 2014, An Introduction to
Statistical Learning with Applications in R, Springer.

[3] Peter Dalgaard, 2008, Introductory Statistics with R, 2nd Edition, Springer.

[4] Michael J. Crawley, 2015, Statistics, An Introduction Using R, 2nd Edition, John Wiley and
Sons, Ltd.

[5] Sanders & Smidth, 2000, Statistics, A First Course, 6th Edition, McGraw-Hill.

[6] Douglas C. Montgomery dan George C. Runger, 2014, Applied Statistics and Probability for
Engineers, 6th Edition, John Wiley & Sons.

[7] Alan Agresti dan Barbara Finlay, 2009, Statistical Methods for the Social Sciences, 4th
Edition, Prentice Hall.

[8] Andy Field, 2009, Discovering Statistics Using SPSS, 3rd Edition, Sage.

[9] Damodar N. Gujarati, 2003, Basic Econometrics, 4th Edition, McGraw-Hill.

[10] Prem S. Mann, 2013, Introductory Statistics, 8th Edition, John Wiley and Sons.

[11] Murray R. Spiegel dan Larry J. Stephens, 2008, Statistics 4th Edition, McGraw-Hill
Companies.

[12] Jim Albert, 2009, Bayesian Computation with R, 2nd Edition, Springer.

[13] Nick T. Thomopoulos, 2013, Essentials of Monte Carlo Simulation, Statistical Methods for
Building Simulation Models, Springer.

[14] Sugiyono, 2015, Metode Penelitian Manajemen, Penerbit ALFABETA.

[15] Yvonne Augustine dan Robert Kristaung, 2013, Metodologi Penelitian Bisnis dan
Akuntansi, Dian Rakyat.

[16] W. J. Conover, 1999, Practical Nonparametric Statistics 3rd Edition, John Wiley and Sons.

[17] Paul H. Kvam dan Brani Vidakovic, 2007, Nonparametric Statistics with Applications to
Science and Engineering, John Wiley and Sons.

226
[18] Baron, R. M dan Kenny, D. A., 1986. The Moderator-Mediator Variable Distinction in
Social Psychological Research: Conceptual, Strategic, and Statistical Considerations. Journal of
Personality and Social Psychology. Vol. 51, No. 6, 1173-1182. American Psychological
Association, Inc.

[19] Hair, J.F Jr., R.E. Anderson, B.J. Babin, dan W.C. Black. 2010. Multivariate Data Analysis, 7th
Edition. Pearson Prentice Hall.

[20] Hair, J.F Jr., G.T.M. Hult, C.M. Ringle, dan M. Sarstedt. 2014. A Primer on Partial Least Squares
Structural Equation Modeling (PLS-SEM). Sage.

[21] MacKinnon, D.P. 2008. Introduction to Statistical Mediation Analysis. Lawrence Erlbaum
Associates.

[22] Meyers, L.S., G. Gamst, dan A.J. Guarino. 2005. Applied Multivariate Research, Design
and Interpretation. Sage.

[23] Mindrila, D. 2010, Maximum Likelihood (ML) and Diagonally Weighted Least Squares
(DWLS) Estimation Procedures: A Comparison of Estimation Bias with Ordinal and
Multivariate Non-Normal Data, International Journal of Digital Society (IJDS), Volume 1, Issue
1.

[24] Preacher, K. J dan Hayes, A. F., 2004. SPSS and SAS Procedures for Estimating Indirect
Effects in Simple Mediation Models. Behavior Research Methods, Instruments, & Computers, 36
(4), 717-731. Psychonomic Society, Inc.

[25] Preacher, K. J dan Leonardelli, G. J., 2006. Calculation for the Sobel Test: An Interactive
Calculation Tool for Mediation Tests. www.psych.ku.edu/ preacher/sobel/sobel.htm.

[26] Schumacker, R.E. dan R.G. Lomax. 2010. A Beginner's Guide to Structural Equation
Modeling, 3rd Edition. Rouletdge.

[27] Sholihin, M. dan D. Ratmono. 2013. Analisis SEM-PLS dengan WarpPLS 3.0 untuk
Hubungan Nonlinear dalam Penelitian Sosial dan Bisnis. Penerbit ANDI.

[28] Gio, P.U. dan Elly, Rosmaini, 2016, Belajar Olah Data dengan SPSS, Minitab, R, Microsoft
Excel, EViews, LISREL, AMOS dan SmartPLS, USUpress.

[29] Rosseel, Yves, 2018, The lavaan tutorial

[30] Haryono, Siswoyo, 2017, Metode SEM untuk Penelitian Manajemen AMOS, LISREL PLS,
luxima.

227
[31] Ghozali, Imam, 2013, Aplikasi Analisis Multivariate dengan Program IBM SPSS 22 Update
PLS Regresi, Penerbit Universitas Diponegoro.

[32] Yves Rosseel (2012). lavaan: An R Package for Structural Equation Modeling. Journal of
Statistical Software, 48(2), 1-36. URL http://www.jstatsoft.org/v48/i02/.

http://www.sthda.com/english/wiki/ggplot2-quick-correlation-matrix-heatmap-r-software-and-data-
visualization

http://www.sthda.com/english/wiki/ggcorrplot-visualization-of-a-correlation-matrix-using-ggplot2

https://briatte.github.io/ggcorr/

http://jamesmarquezportfolio.com/correlation_matrices_in_r.html

http://a-little-book-of-r-for-time-series.readthedocs.io/en/latest/src/timeseries.html

https://www.r-bloggers.com/plotting-time-series-data-using-ggplot2/

https://www.statmethods.net/advstats/timeseries.html

https://plot.ly/r/time-series/

https://plot.ly/ggplot2/facet/

http://ggplot2.tidyverse.org/reference/facet_grid.html

http://cookbook-r.com/Graphs/Facets_(ggplot2)/

http://www.sthda.com/english/wiki/ggplot2-facet-split-a-plot-into-a-matrix-of-panels

https://www3.nd.edu/~steve/computing_with_data/13_Facets/facets.html

https://www3.nd.edu/~steve/computing_with_data/13_Facets/facets.html

http://sape.inf.usi.ch/quick-reference/ggplot2/facet

https://cran.r-project.org/web/packages/shinythemes/index.html

https://cran.r-project.org/web/packages/lavaan/index.html

https://cran.r-project.org/web/packages/plspm/index.html

https://cran.r-project.org/web/packages/ggplot2/index.html

https://cran.r-project.org/web/packages/reshape2/index.html

https://cran.r-project.org/web/packages/dplyr/index.html

https://cran.r-project.org/web/packages/shiny/index.html

228
https://cran.r-project.org/web/packages/plyr/index.html

https://cran.r-project.org/web/packages/DT/index.html

https://cran.r-project.org/web/packages/doBy/index.html

https://cran.r-project.org/web/packages/GGally/index.html

https://cran.r-project.org/web/packages/plotrix/index.html

https://cran.r-project.org/web/packages/tseries/index.html

https://cran.r-project.org/web/packages/nortest/index.html

https://cran.r-project.org/web/packages/car/index.html

https://cran.r-project.org/web/packages/RVAideMemoire/index.html

https://cran.r-project.org/web/packages/plm/index.html

https://cran.r-project.org/web/packages/colourpicker/index.html

https://cran.r-project.org/web/packages/psych/index.html

https://cran.r-project.org/web/packages/DescTools/index.html

https://cran.r-project.org/web/packages/semPlot/index.html

229

Anda mungkin juga menyukai