Dosen Pengampu
Samsul Amar, S.T., M.Sc.
Tim Penyusun:
Lintang Pramesti Batari Kirana (200421100054)
Risti Cahyani (200421100070)
Fajar Yahya Yazidiq (200421100140)
Siti Nurul Azizah (200421100165)
5. Lakukan analisis regresi linear untuk memprediksi IPK dengan variable bebas:
Jenis sekolah
Status sekolah
Nilai akreditasi
Index SBMPTN sesuai prodi
Nilai mata pelajaran
BAB IV
PEMBAHASAN DAN PENGOLAHAN DATA
Pembahasan dan pengolahan data pada bab ini meliputi rancangan syntax
untuk suatu analisa data berdasarkan kelompok program studi PGSD yang telah
direalisasikan dengan penggambaran dan penjelasan yang akan dijabarkan.
4.1 Pre-processing Data
Tahap awal melakukan mining atau proses data yang diperoleh sebelum
melanjutkan ke tahap pengolahan data dengan cara mengeleminasi atau
menseleksi data untuk diproses ke pengolahan data.
Output :
Output :
d. Data Tidak Sesuai dengan Format
Data tidak sesuai dengan format dalam python merupakan suatu data yang
tidak memenuhi syarat syntax dari python.
Gambar tersebut merupakan nilai rata-rata IPK dari jenis sekolah SMA
dan MA. Nilai rata-rata yang diperoleh oleh jenis sekolah SMA sebesar 3,54
sedangkan, nilai rata-rata oleh jenis sekolah MA sebesar 3,45. Demikian
maka nilai rata-rata pada jenis sekolah SMA lebih besar daripada nilai rata-
rata jenis sekolah MA.
b. Median
Syntax untuk mencari median atau nilai tengah pada data IPK
mahasiswa pada program studi PGSD.
Gambar tersebut merupakan nilai median IPK dari jenis sekolah SMA.
Nilai median yang diperoleh oleh jenis sekolah SMA sebesar 3,59. Demikian
maka nilai median atau nilai yang sering banyak muncul pada jenis sekolah
SMA bernilai 3,59.
c. Modus
Syntax untuk mencari modus atau nilai paling banyak muncul pada
data IPK mahasiswa pada program studi PGSD.
Input pada perhitungan atau mencari nilai modus atau nilai yang
paling banyak muncul yaitu dengan memasukan syntax print (‘modus
IPK:’,data[‘IPK].modus())) untuk memanggil data kemudian diproses
untuk mencari rata-rata pada data mahasiswa program studi PGSD dan
mendapatkan outputan nilai modus sebesar 3.529499.
d. Standar Deviasi
Syntax untuk mencari standar deviasi pada data IPK mahasiswa pada
program studi PGSD.
Input pada perhitungan atau mencari nilai standar deviasi yaitu dengan
memasukan syntax print (‘standar deviasi IPK:’,data[‘IPK].std())) untuk
memanggil data kemudian diproses untuk mencari standar deviasi pada
data mahasiswa program studi PGSD dan mendapatkan outputan nilai
standar devisi sebesar 3.529499.
e. Range
Syntax untuk mencari range pada data IPK mahasiswa pada program
studi PGSD.
2. Visualisasi Data
Visualisasi data pada python dengan menggunakan jupyter notebook
berbentuk diagram atau histogram.
Gambar menunjukan pie chart untuk nilai IPK berdasarkan jenis sekolah
SMA dan MA. pada pie chart terdapat warna sebagai pembeda yaitu warna
biru merupakan nilai IPK pada jenis sekolah SMA dan untuk warna orange
menunjukan nilai IPK pada jenis sekolah MA.Demikian nilai IPK pada
mahasiswa yang berasal dari jenis sekolah SMA lebih tinggi dengan jumlah
183 dibandingkan nilai mahasiswa dari jenis sekolah MA dengan jumlah 57.
Gambar menunjukan pie chart untuk presentase nilai IPK berdasarkan
jenis sekolah SMA dan MA. pada pie chart terdapat warna sebagai pembeda
yaitu warna biru merupakan nilai IPK pada jenis sekolah SMA dan untuk
warna orange menunjukan nilai IPK pada jenis sekolah MA.Demikian nilai
IPK pada mahasiswa yang berasal dari jenis sekolah SMA lebih tinggi
dengan presentase 76,25% dibandingkan nilai mahasiswa dari jenis sekolah
MA dengan presentase 23,75%.
Gambar diatas merupakan scatter plot dari nilai mata kuliah Biologi.
Titik-titik menunjukan bahwa nilai 70 hingga 100 dengan rentang nilai 2,9
sampai 4,0. Titik-titik juga menyebar pada rentang nilai 0,0 hingga 0,3,
rentang 1,3 hingga 2,3 dan rentang 3,1 hingga 3,8.
a. SMA vs MA
Hal ini bertujuan untuk mengetahui nilai IPK mahasiswa yang berasal dari
SMA dan MA.
Gambar diatas menunjukan perbandingan nilai IPK jenis sekolah SMA dan
MA. Berdasarkan data hasil diatas menunjukan nilai rata-rata IPK jenis sekolah
SMA sebesar 3,54 dan nilai rata-rata IPK jenis sekolah MA sebesar 3,45.
Pengujian menunjukan nilai P-Value sebesar 0,19, nilai t-test 1,29. Nilai P-Value
sebesar 0,19 menunjukan nilai lebih dari 0,05 maka H0 diterima maka rata-rata
nilai IPK SMA tidak berbeda signifikan dengan rata-rata IPK MA.
b. SMA vs SMK
Hal ini bertujuan untuk mengetahui nilai IPK mahasiswa yang berasal dari
SMA dan SMK.
Gambar diatas menunjukan uji ANOVA nilai IPK pada jenis sekolah.
Berdasarkan data hasil diperoleh nilai P-Values sebesar 0,19 dengan nilai
ANOVA sebesar 1,66. Artinya, nilai P-Values lebih besar dari nilai
signifikansi 0,05 maka H0 diterima dengan tidak ada perbedaan signifikan
IPK dengan jenis sekolah.
b. Akreditasi Sekolah
Uji anova pada akreditasi sekolah sebagai berikut.
4.5 Analisis Regresi Linier terhadap prediksi IPK pada variabel Bebas
Analisis regresi adalah salah satu analisis yang luas pemakaiannya. Analisis
regresi digunakan untuk melakukan prediksi dan ramalan. Analisis regresi juga
dapat digunakan untuk memahami variabel – variabel bebas mana saja yang dapat
berhubungan dengan variabel terikat, serta untuk mengetahui bentuk hubungan
tersebut.
Gambar diatas menunjukan pengujian nilai IPK dengan metode regresi linier
beserta faktor yang mempengaruhi. Pengujian dilakukan dengan menggunakan
dua variable yaitu variable bebas (X) dan variable terikat (Y), variable bebas
meliputi data umum yaitu jenis sekolah, status sekolah, akreditasi sekolah, nilai
index prodi dan seluruh mata kuliah pada program studi sedangkan, untuk
variable terikat meliputi nilai IPK. Nilai R-Squared sebesar 0,985 dimana nilai
tersebut mendekati nilai maka artinya semakin baik kemudian, karena nilai
tersebut lebih besar dari 0,05 maka terima H0 artinya tidak ada perbedaaan yang
signifikan terhadap nilai IPK.
BAB V
KESIMPULAN DAN SARAN
Bab lima tentang kesimpulan dan saran dari penyusunan laporan ini yaitu
sebagai berikut.
5.1 Kesimpulan
1. Tugas telah diselesaikan sebaik mungkin oleh kelompok 01 yang mana terdiri
dari beberapa tahapan dan prosedur pengujian dari beberapa variabel. Studi
kasus yang dilakukan kelompok 01 yaitu melakukan analisis data pada
mahasiswa program studi PGSD menggunakan software jupyter notebook.
Berbagai tahapan dilakukan yaitu prosesing data, exploratory data analysis
(EDA), uji perbedaan nilai IPK SMA dan MA, SMA dan SMK, MA dan
SMK dan juga antara negeri dan swasta. Selanjutnya uji ANOVA dengan
tujuan mengetahui perbedaan besar IPK berdasarkan jenis sekolah, akreditasi
sekolah dan ataupun keduanya. Proses terakhir yaitu analisis regresi linear
untuk memprediksi IPK dengan variabel bebas meliputi jenis sekolah, status
sekolah, nilai akreditasi, index SBMPTN sesuai prodi, serta nilai mata
pelajaran.
2. Hasil output pengujian software jupyter notebook dapat dilihat dari
pengolahan data yang ada pada bab empat mengenai hasil dan penyelesaian
studi kasus analisis data mahasiswa program studi PGSD yang menggunakan
software jupyter notebook. Contoh yaitu pengujian dilakukan dengan
menggunakan dua variable yaitu variable bebas (X) dan variable terikat (Y),
variable bebas yang dilambangkan X meliputi data umum yaitu jenis sekolah,
status sekolah, akreditasi sekolah, nilai index prodi dan seluruh mata kuliah
pada program studi sedangkan, untuk variable terikat dilambangkan dengan Y
meliputi nilai IPK. Nilai R-Squared sebesar 0,985 dimana nilai tersebut
mendekati nilai maka artinya semakin baik, karena nilai tersebut lebih besar
dari 0,05 maka terima H0 artinya tidak terdapat perbedaaan yang terlalu
signifikan terhadap nilai IPK.
5.2 Saran
Saran dalam pengujian harus runtut agar syntak dapat dijalan dan data dapat
diolah. Selain itu, penyusunan laporan harus tersusun rapi dan runtut, agar
memudahkan pembaca memahami isi dari laporan.
DAFTAR PUSTAKA