Anda di halaman 1dari 16

PENGOLAHAN DATA SISWA DAN MAHASISWA (SIMULASI

UTS) MENGGUNAKAN UJI KOLMOGOROV-SMIRNOV

Oleh :
Siti Nur Azizah
211810101026

LABORATORIUM MATEMATIKA DASAR

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS JEMBER

2022

1
BAB I
PENDAHULUAN

1.1 Latar Belakang


Uji Kolmogorov-Smirnov dapat digunakan untuk menguji suatu asumsi
apakah suatu data sampel berasal dari populasi yang berdistribusi normal atau
tidak. Pada pembahasan Bab 5 telah dibahas mengenai distribusi sampling dari
rata-rata 𝑋̅0 Apabila data sampel berasal dari populasi yang berdistribusi normal,
maka distribusi sampling dari rata-rata 𝑋̅ juga mengikuti distribusi normal.
Asumsi normalitas memiliki peranan penting dalam uji-uji parametrik, seperti uji
beda rata-rata dari dua populasi dengan uji 𝑡 dan analisis varians. Hal ini karena
uji-uji parametrik akan bekerja dengan baik ketika asumsi normalitas dipenuhi.
Uji Levene merupakan salah satu uji dalam statistika yang dapat digunakan
untuk menguji kesamaan varians dari dua atau lebih populasi. Selain uji Levene,
dapat juga digunakan uji 𝐹, uji Hartley, dan uji Bartlett untuk menguji kesamaan
varians populasi. Varians populasi dilambangkan dengan 𝜎2, sedangkan varians
sampel dilambangkan dengan 𝑠2. Pada uji Levene, hipotesis nol menyatakan
tidak terdapat perbedaan varians di antara populasi, sedangkan hipotesis alternatif
menyatakan terdapat paling tidak sepasang varians populasi yang berbeda. Untuk
pengambilan keputusan terhadap hipotesis dapat dilakukan dengan
membandingkan nilai statistik dari uji Levene ( 𝐿) terhadap nilai kritis dari tabel
distribusi 𝐹 (𝐹𝑘𝑟𝑖𝑡𝑖𝑠).
Uji kesamaan rata-rata dari dua populasi untuk data berpasangan dan saling
berhubungan dengan uji 𝑡, pengamatan-pengamatan dari dua populasi dinyatakan
dalam berpasangan. Sebagai contoh misalkan (𝑋1, 𝑌1), (𝑋2, 𝑌2), ... , (𝑋𝑘, 𝑌𝑘)
merupakan pengamatan- pengamatan dari dua populasi, yakni populasi 𝑋 dan 𝑌
yang dinyatakan dalam berpasangan. Dalam uji kesamaan rata-rata dari dua

2
populasi untuk data berpasangan dan saling berhubungan dengan uji 𝑡, hipotesis
nol menyatakan tidak terdapat pengaruh yang signifikan secara statistika, sesudah
dan sebelum perlakuan. Dengan kata lain, selisih rata-rata antara kelompok
sesudah dan sebelum perlakuan sama dengan nol ( 𝜇2 − 𝜇1 = 0). Hipotesis
alternatif menyatakan terdapat pengaruh yang signifikan secara statistika, sesudah
dan sebelum perlakuan. Dengan kata lain, selisih rata-rata antara kelompok
sesudah dan sebelum perlakuan berbeda dari nol (𝜇2 − 𝜇1 ≠ 0).
Uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan
asumsi varians yang sama, menguji ada tidaknya perbedaan rata-rata antara
populasi pertama dan populasi kedua. Dengan kata lain, menguji apakah selisih
rata-rata antara kelompok kedua dan pertama berbeda atau sama dengan nol.
Dalam uji ini, pengamatan-pengamatan pada populasi pertama saling bebas atau
independen dengan pengamatan-pengamatan pada populasi kedua (independent
populations). Uji ini didasarkan pada ketidaktahuan (unknown) mengenai nilai
varians dari dua populasi, namun diasumsikan varians dari dua populasi tersebut
sama. Untuk pengambilan keputusan terhadap hipotesis, dapat dibandingkan
antara nilai probabilitas dari uji Kolmogorov-Smirnov atau uji Jarque-Bera,
dengan tingkat signifikansi yang digunakan (𝛼).
Uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan
asumsi varians yang berbeda (tidak sama), menguji ada tidaknya perbedaan
rata-rata antara populasi pertama dan populasi kedua. Dengan kata lain, menguji
apakah selisih rata-rata antara kelompok kedua dan pertama berbeda atau sama
dengan nol. Dalam uji ini, pengamatan- pengamatan pada populasi pertama saling
bebas/independen (independent) dengan pengamatan-pengamatan pada populasi
kedua (independent populations). Uji ini didasarkan pada ketidaktahuan
(unknown) mengenai nilai varians dari dua populasi, namun diasumsikan varians
dari dua populasi tersebut tidak sama. Berikut aturan pengambilan keputusan

3
terhadap hipotesis berdasarkan uji 𝑡.
Pada makalah ini menggunakan uji pada bab 6 yaitu Uji Normalitas Populasi
dengan Uji Kolmogorov-Smirnov. Pengujian data Nilai Simulasi UTS sangat
cocok digunakan untuk metode Uji Kolmogorov-Smirnov. Maka di makalah ini
akan ditampilkan bagaimana cara pengolahan data tersebut.

1.2 Rumusan Masalah


Rumusan masalah yang akan dibahas dalam makalah ini adalah :
a. Bagaimana analisi penjelasan dari data Nilai Simulasi UTS yang di Kaggle?
b. Bagaimana pengolahan data Nilai Simulasi UTS menggunakan Uji Normalitas
dengan Uji Kolmogorov-Smirnov?
b. Bagaimana manfaat, fungsi serta pengaplikasiannya dalam kehidupan
sehari-hari?

1.3 Tujuan
Berikut ini adalah tujuan dibuatnya makalah :
a. Mengetahui analisi penjelasan dari data yang digunakan yaitu data Nilai
Simulasi UTS
b. Mengetahui pengolahan data Nilai Simulasi UTS menggunakan Uji Normalitas
dengan Uji Kolmogorov-Smirnov
c. Mengetahui manfaat, fungsi serta pengaplikasiannya dalam kehidupan
sehari-hario

4
1.4 Manfaat
Manfaat yang dapat diambil dari makalah ini yaitu :
a. Mengetahui tata cara penganalisisan data menggunakan uji normalitas
b. Mengaplikasikannya pada kehidupan sehari-hari
c. Menginformasikan beberapa data siswa dan mahasiswa dengan berbagai
klasifikasi nya

5
BAB II
TINJAUAN PUSTAKA
Uji normalitas adalah suatu prosedur yang digunakan untuk mengetahui
apakah data berasal dari populasi yang terdistribusi normal atau berada dalam
sebaran normal. Distribusi normal adalah distribusi simetris dengan modus, mean
dan median berada dipusat. Distribusi normal diartikan sebagai sebuah distribusi
tertentu yang memiliki karakteristik berbentuk seperti lonceng jika dibentuk
menjadi sebuah histogram. Uji normalitas digunakan untuk mengetahui apakah
data yang diperoleh terdistribusi normal atau tidak. Dasar pengambilan keputusan
adalah jika nilai L hitung > L tabel maka H0 ditolak, dan jika nilai Lhitung <
Ltabel maka H0 diterima (Murwani, 2001:20).

Hipotesis statistik yang digunakan:


H0 : sampel berdistribusi normal
H1 : sampel data berdistribusi tidak normal

Tes satu sampel Kolmogorov-Smirnov adalah suatu tes goodness-of-fit.


Artinya, yang diperhatikan adalah tingkat kesesuaian antara distribusi teoritis
tertentu. Tes ini menetapkan apakah sor-skor dalam sampel dapat secara masuk
akal dianggap berasal dari suatu populasi dengan distributive tertentu itu. Jadi, tes
mencakup perhitungan distribusi frekuensi kumulatif yang akan terjadi dibawah
distribusi teoritisnya, serta membandingan distribusi frekuensi itu dengan
distribusi frekuensi kumulatif hasil observasi. Distribusi teoriti tersebut
merupakan representasi dari apa yang diharapkan dibawah H0. Tes Ini
menerapkan suatu titik dimana kedua distribusi itu-yakni yang teoritis dan yang
terobservasi-memiliki perbedaan terbesar. Dengan melihat distribusi samplingnya
dapat kita ketahui apakah perbedaan yang besar itu mungkin terjadi hanya karena

6
kebetulan saja. Artinya distribusi sampling itu menunjukan apakah perbedaan
besar yang diamati itu mungkin terjadi apabila observasi-observasi itu benar-benar
suatu sampel random dari distribusi teoritis itu (Nuryadi. 2017).
Misalkan suatu F0(X) = suatu fungsi distribusi frekuensi kumulatif yang
sepenuhnya ditentukan, yakni distribusi kumulatif teoritis di bawah H0. Artinya
untuk harga N yang sembarang besarnya, Harga F0(X) adalah proporsi kasus yang
diharapkan mempunyai skor yang sama atau kurang daripada X. Misalkan SN(X)
= distribusi frekuensi kumulatif yang diobservasi dari suatu sampel random
dengan N observasi. Dimana X adalah sembarang skor yang mungkin, SN(X) =
k/N, dimana k = banyak observasi yang sama atau kurang dari X. Di bawah
Hopotesis-nol bahwa sampel itu telah ditarik dari distribusi teoritis tertentu, maka
diharapkan bahwa untuk setiap harga X, SN(X) harus jelas mendekati F0(X).
Artinya di bawah H0 kita akan mengharapkan selisis antara SN(X) dan F0(X)
adalah kecil, dan ada dalam batas-batas kesalahan random. Tes
Kolmogorov-Smirnov memusatkan perhatian pada penyimpangan (deviasi)
terbesar. Harga F0(X) -SN(X) terbesar dinamakan deviasi maksimum (Nuryadi.
2017).

D = maksimum |F0(X) - SN(X)|

Distribusi sampling D di bawah H0 diketahui. Tabel E pada lampiran memberikan


harga-harga kritis tertentu distribusi sampling itu. Perhatikanlah bahwa signifikasi
suatu harga D tertentu adalah bergantung pada N. Harga- harga kritis untuk tes-tes
satu sisi belum ditabelkan secara memadai. Berikut aturan pengambilan keputusan
terhadap hipotesis.

Jika nilai probabilitas ≥ tingkat signifikansi, 𝐻0 diterima dan 𝐻1 ditolak

7
Jika nilai probabilitas < tingkat signifikansi, 𝐻0 ditolak dan 𝐻1 diterima

Data yang akan digunakan adalah data Siswa atau Mahasiswa (Simulasi
UTS). Data ini diperoleh dari kaggle data sets, dan sudah jelas sumber terpercaya.
Data ini terdiri dari 160 observasi dan 7 variabel meliputi klasifikasi jk, kelas,
pengeluaran, jarak, organisasi, waktu belajar, dan nilai dari siswa atau mahasiswa
setempat.

8
BAB III
METODOLOGI PENELITIAN
3.1 Alat dan Bahan
Adapun alat dan bahan yang digunakan yaitu :
1. Laptop
2. Kaggle : Data Nilai Simulasi UTS
3. Rstudio

3.2 Prosedure
Prosedure pengujian data pada makalah ini sebagai berikut :
1. Memilih data dengan cara mencari di Kaggle
2. Ditentukan informasi pada data yang akan diuji
3. Melakukan pengujian dengan menggunakan Uji Normalitas dengan Uji Uji
Kolmogorov-Smirnov

9
BAB IV
HASIL DAN PEMBAHASAN

Hasil dan pembahasan yang didapatkan dari pengujian data Simulasi UTS
adalah sebagai berikut. Data Simulasi UTS adalah data yang berisi tentang Jenis
Kelamin, Kelas, Pengeluaran, Jarak, Organisasi, Waktu Belajar, dan Nilai pada
setiap anak. Pada Gambar 4.1. merupakan struktur dari data yang digunakan dan
di Gambar 4.2. adalah enam data teratas yang meliputi jk, kelas, pengeluaran,
jarak, organisasi, waktu belajar, dan nilai sebagai berikut

Gambar 4.1. Struktur Data


Simulasi UTS

Gambar 4.2 Enam Data Teratas

10
Rangkuman statistik dari data ini yaitu menggunakan syntak Summary dan
Library(Hmisc), didapatkan hasil pada Gambar 4.3. sebagai berikut ini

Gambar 4.3. Rangkuman Statistik

Kemudian pada data1 dilakukan kueri1 dari data siswa atau mahasiswa yang
mengikuti suatu organisasi dengan nilai diatas 70, dan dibawah ini bisa dilihat
nilai rata-rata dari siswa atau mahasiswa yang mengikuti organisasi dengan nilai
diatas 70 yaitu 84.14459.

11
Pada data2 dilakukan kueri2 dari dara siswa atau mahasiswa yang jarak tempat
tinggalnya diatas 5 km dengan menggunakan grafik ggplot sebagai berikut

Gambar 4.4. Grafik dan Density


Aturan pengambilan keputusan terhadap hipotesis berdasarkan uji
Kolmogorov-Smirnov.
𝐽𝑖𝑘𝑎 𝐷𝑚𝑎𝑥 ≤ 𝑛𝑖𝑙𝑎𝑖 𝑘𝑟𝑖𝑡𝑖𝑠, 𝑚𝑎𝑘𝑎 𝐻0 𝑑𝑖𝑡𝑒𝑟𝑖𝑚𝑎 𝑑𝑎𝑛 𝐻1 𝑑𝑖𝑡𝑜𝑙𝑎𝑘.
𝐽𝑖𝑘𝑎 𝐷𝑚𝑎𝑥 > 𝑛𝑖𝑙𝑎𝑖 𝑘𝑟𝑖𝑡𝑖𝑠, 𝑚𝑎𝑘𝑎 𝐻0 𝑑𝑖𝑡𝑜𝑙𝑎𝑘 𝑑𝑎𝑛 𝐻1 𝑑𝑖𝑡𝑒𝑟𝑖𝑚𝑎.
Berikut aturan pengambilan keputusan berdasarkan pendekatan nilai probabilitas.
𝐽𝑖𝑘𝑎 𝑛𝑖𝑙𝑎𝑖 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡𝑎𝑠 ≥ 𝑡𝑖𝑛𝑔𝑘𝑎𝑡 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑘𝑎𝑛𝑠𝑖, 𝑚𝑎𝑘𝑎 𝐻0 𝑑𝑖𝑡𝑒𝑟𝑖𝑚𝑎 𝑑𝑎𝑛 𝐻1
𝑑𝑖𝑡𝑜𝑙𝑎𝑘.
𝐽𝑖𝑘𝑎 𝑛𝑖𝑙𝑎𝑖 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡𝑎𝑠 < 𝑡𝑖𝑛𝑔𝑘𝑎𝑡 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑘𝑎𝑛𝑠𝑖, 𝑚𝑎𝑘𝑎 𝐻0 𝑑𝑖𝑡𝑜𝑙𝑎𝑘 𝑑𝑎𝑛 𝐻1
𝑑𝑖𝑡𝑒𝑟𝑖𝑚𝑎.

12
Prinsip dalam Uji Normalitas dalam perhitungan statistik adalah menguji Hipotesa
H0 : Data berdistribusi Normal
H1 : Data tidak berdistribusi Normal
Kemudian dilihat dari p-value pada hasil perhitungan
Bila p-value kurang dari 0.05 maka H0 ditolak, berarti data tidak berdistribusi
Normal
Bila p-value lebih dari 0.05 maka H0 diterima, berarti Data berdistribusi Normal
Pada data tersebut didapatkan hasil berikut ini

Pada hasil diatas diketahui bahwa p-value = 0.05675, sehingga dapat disimpulkan
bahwa H0 diterima, maka Data berdistribusi Normal.

13
BAB V
PENUTUP
4.1 Kesimpulan
Kesimpulan yang dapat diambil dari makalan ini adalah sebagai berikut :
1. Konsep dasar dari uji normalitas Kolmogorov Smirnov adalah
dengan membandingkan distribusi data (yang akan diuji normalitasnya) dengan
distribusi normal baku. Distribusi normal baku adalah data yang telah
ditransformasikan ke dalam bentuk Z-Score dan diasumsikan normal. Jadi
sebenarnya uji Kolmogorov Smirnov adalah uji beda antara data yang diuji
normalitasnya dengan data normal baku.

2. Seperti pada uji beda biasa, jika signifikansi di bawah 0,05 berarti terdapat
perbedaan yang signifikan, dan jika signifikansi di atas 0,05 maka tidak terjadi
perbedaan yang signifikan. Penerapan pada uji Kolmogorov Smirnov adalah
bahwa jika signifikansi di bawah 0,05 berarti data yang akan diuji mempunyai
perbedaan yang signifikan dengan data normal baku, berarti data tersebut tidak
normal.

3. Pada data yang digunakan diatas didapatkan hasil yaitu p-value = 0.05675,
sehingga dapat disimpulkan bahwa H0 diterima, maka Data berdistribusi Normal.
Dengan prinsip p-valiue yaitu :

Bila p-value kurang dari 0.05 maka H0 ditolak, berarti data tidak berdistribusi
Normal
Bila p-value lebih dari 0.05 maka H0 diterima, berarti Data berdistribusi Normal

14
4.2 Saran
Saran yang dapat penulis berikan kepada pembaca yaitu mengetahui
macam-macam uji yang terdapat pada metode statistik dan melakukan penerapan
dengan mencoba-coba serta mencari berbagai informasi terkait uji-uji yang akan
dicoba. Mereset data yang akan dikelola dari sumber yang terpercaya, dan lakukan
pengujian. Jika terdapat kesalahan jangan mudah kesal dan mengakhiri
pemograman, namun tetap lakukan dan cari referensi sebagai media pembantu.

15
DAFTAR PUSTAKA
Agresti, A. dan B. Finlay. 2009. Statistical Methods for the Social Sciences,
4th Edition. United States of America: Prentice Hall.
Montgomery, D.C. dan G.C. Runger. 2011. Applied Statistics and Probability
for Engineers, 5th Edition. United States of America: John Wiley & Sons, Inc.
Gio, U.P. Dan D.E. Irawan. 2016. Belajar Statistika dengan R. KDT: USU
Nuryadi., dkk. 2017.Dasar-Dasar Statistik Penelitian. Sibuku
Media :Yogyakarta

16

Anda mungkin juga menyukai