LAPORAN PRAKTIKUM
KOMPUTASI STATISTIKA
BAB 3 : FUNCTION
BAB 4 : VISUALISASI DATA
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2023
Daftar Isi
i
Daftar Tabel
ii
Daftar Gambar
iii
1. Pendahuluan
(Jones, Maillardet, & Robinson, 2009) mengatakan bahwa argumen dan variabel
yang didefiniskkan dalam suatu fungsi hanya ada dalam fungsi tersebut. Hal
tersebut berarti, jika suatu variabel fungsi didefinisikan dengan x di dalam fungsi,
maka x tidak akan berlaku di luar fungsi. Jika variabel dengan nama yang sama ada
di dalam dan di luar fungsi, maka keduanya terpisah dan tidak berinteraksi sama
sekali. Fungsi dapat dianggap sebagai suatu lingkungan terpisah yang hanya dapat
terhubung dengan lingkungan di luarnya melalui nilai-nilai pada argumen. Bagian
dari suatu fungsi dimana variabel didefinisikan disebut cakupan fungsi. Membatasi
1
cakupan variabel di dalam fungsi dapat memberikan jaminan bahwa, ketika fungsi
dijalankan, nilai variabel di luar fungsi tidak akan berubah, kecuali nilai tersebut
telah ditetapkan sebelumnya.
Mengutip dari (Jones, Maillardet, & Robinson, 2009), keunggulan utama
penggunaan fungsi adalah, ketika suatu fungsi dijalankan, ia dapat digunakan
berkali-kali tanpa perlu melakukan pengaturan dari awal. Keuntungan lainnya,
memecah suatu tugas pemrogramman menjadi unit yang lebih kecil. Program besar
biasanya terdiri dari sejumlah fungsi yang lebih kecil dan masing-masing
melakukan tugas sederhana yang terdefinisi dengan baik.
Ketika suatu fungsi dijalankan, komputer menyisihkan ruang untuk variabel
dari fungsi tersebut, membuat salinan kode fungsi, kemudian mentransfer kontrol
ke fungsi. Ketika selesai dijalankan, hasil dari fungsi dikembalikan ke program
utama, kemudian salinan fungsi dan seluruh variabelnya dihapus. Tahap inilah yang
menjadikan fungsi dapat digunakan berkali-kali tanpa perlu melakukan pengaturan
kembali (Jones, Maillardet, & Robinson, 2009).
Membangun fungsi dengan program R, terkadang membutuhkan beberapa
operator yang menjadi struktur perintah dalam fungsi, salah satunya adalah operator
matematis. Berdasarkan (Pace, 2012) terdapat 3 jenis operator pada R yaitu
operator matematis, operator komparasi, dan operator logika. Operator matematis
digunakan untuk operasi matematis dengan data numerik, dimana operator ini dapat
berfungsi secara independen tanpa terikat dengan fungsi apa pun (Pace, 2012).
Mengutip dari (Pace, 2012) argumen pada operator matematis ditunjukan pada
Tabel 1.1.
2
%% Modulus 2 %% 2 0
%/% Pembagian Bilangan Bulat 3 %/% 2 1
3
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑆2 = (1)
𝑛−1
dimana 𝑆 2 merupakan varians sampel, n merupakan jumlah sampel, 𝑥𝑖 merupakan
data sampel ke-i, dan 𝑥̅ merupakan rata-rata sampel.
If (A is TRUE) do C
Else do B
4
Pada Gambar 1.1. panah menggambarkan aliran kontrol program yang
diteruskan ke objek berikutnya. Bentuk objek persegi panjang menggambarkan
tugas/operasi, wajik atau belah ketupat menggambarkan keputusan, dan persegi
panjang dengan sudut bundar menggambarkan mulai/berhentinya proses.
5
Berdasarkan (Steele & Iliinsky, 2010), sebagian besar visualisasi data dibuat
menggunakan format standar dengan gaya presentasi dasar mencakup grafik
batang, grafik garis, diagram sebar, diagram pai, bagan alir dan bagan klasifikasi.
(Rendgen, 2012) mengemukakan, sejak dulu, diagram, sketsa, dan peta telah
digunakan untuk visualisasi data. Gambar 1.2. dan Gambar 1.3. merupakan salah
satu visualisasi yang baik, dimana keduanya mampu menggambarkan data dengan
baik tanpa menghilangkan elemen keindahan (Steele & Iliinsky, 2010).
(Steele & Iliinsky, 2010) mengatakan, tabel periodik unsur merupakan salah
satu contoh visualisasi yang sangat informatif, bahkan dapat dikatakan efisien,
dimana merupakan suatu solusi dengan pendekatan baru (dalam hal visualisasi) dari
permasalahan menampilkan data yang kompleks. Pada awalnya, tabel unsur
periodik belum memiliki warna dan tidak mengimplementasikan estetika dalam
visualisasinya, hanya menggunakan elemen grafis standar dan teks yang hanya bisa
6
dibuat dengan mesik tik. Desain grafik yang luar biasa belum tentu mampu
menghasilkan visualisasi data yang baik.
Peta bawah tanah London pada Gambar 1.3. atau juga dikenal dengan peta
tube sangat unggul dibidang visual tetapi kurang baik pada bagian tipografi. Hal
tersebut dikarenakan, penemu peta tube (Haryy Beck) yang merupakan seorang
pekerja dibidang sirkuit listrik, mengkonversi tata letak sirkuit listrik dengan garis
pada sudut 45° dan 95°. Pola tersebut mampu mencerminkan perjalanan kerata
bawah tanah tanpa terdistorsi oleh geografis. Pada saat pembaca melihat peta tube,
mereka akan lebih fokus untuk melihat rute jalan di bawah tanah tanpa harus
terganggu dengan akurasi geografis yang umumnya lebih mencerminkan tata letak
di permukaan (Steele & Iliinsky, 2010).
Menurut (Steele & Iliinsky, 2010), peta bawah tanah London (peta tube)
merupakan salah satu contoh yang baik dalam visualisasi karena berfokus pada
informasi penting (rute bawah tanah) dan menghilangkan banyak informasi yang
tidak relevan (pengaruh geografis) sehingga data tentang rute bawah tanah lebih
mudah diakses oleh pembaca dibandingkan dengan koordinat yang cenderung
7
hanya menuliskan garis lintang dan bujur (posisi) di atas permukaan tanah. Gaya
grafis yang khas menjadikan peta tersebut unik dan menampilkan mahakarya yang
indah.
8
2 Deskripsi Kerja
9
3. Masukkan nilai 1 hingga 20 sebagai nilai input pada fungsi.
10
7. Jalankan package tidyverse untuk mengaktifkan fungsi pipeline operator
menggunakan perintah library().
13. Tampilkan 10 data teratas untuk mengetahui nilai tiap unit data.
11
14. Lakukan pengecekan outlier pada variabel wage (gaji) untuk menentukan
ukuran pusat data yang akan digunakan dalam box plot.
15. Lakukan penyaringan terhadap data CPS85 yang akan digunakan sebagai
label pada box plot dengan mengelompokan variabel sector (sektor)
berdasarkan sex (jenis kelamin), kemudian lakukan perhitungan jumlah
individu berdasarkan variabel yang telah dikelompokan menggunakan
fungsi summarize() dan lakukan perhitungan terhadap nilai tengah
(median) variabel gaji yang akan digunakan sebagai nilai tengah pada box
plot. Gabungkan langkah-langkah tersebut menggunakan pipe operator
untuk mempersingkat penulisan syntax.
16. Lakukan manipulasi pada variabel sektor dalam data CPS85 dengan
mengurutkan faktor pada variabel sektor berdasarkan variabel gaji,
kemudian faktorkan data pada variabel sektor dengan level clerical,
const, manag, prof, sales, service, other. Setelah itu plot-kan data dengan
mengambil variabel jenis kelamin sebagai saturasi box plot, gaji sebagai
nilai pada ordinat y, dan variabel sektor sebagai pembagi ordinat x,
tambahkan variabel n yang diperoleh pada langkah kerja bagian 15
sebagai label. Gabungkan langkah-langkah tersebut menggunakan pipe
operator untuk mempersingkat penulisan syntax seperti tampak pada
Gambar 2.16.
12
Gambar 2.16. Pipe Operator Pembuatan Box Plot
19. Urutkan variabel salary (gaji) dari yang terkecil hingga terbesar,
kemudian lakukan pengelompokan gaji dengan membagi data menjadi 10
kelompok dan simpan rentang gaji dari hasil pengelompokan sebagai
variabel baru dengan nama salary_bin. Gabungkan langkah-langkah
tersebut menggunakan pipe operator untuk mempersingkat penulisan
syntax seperti tampak pada Gambar 2.19.
13
Gambar 2.19. Pipe Operator Menentukan Rentang Gaji
20. Buat data baru dengan nilai minimum pada tiap rentang gaji yang
diperoleh pada langkah kerja bagian 19 dengan tipe data vektor yang akan
digunakan sebagai batas nilai gaji pada tiap batang histogram.
21. Buat data baru dengan memasukkan rentang gaji yang diperoleh pada
langkah kerja bagian 19 dengan tipe data vektor yang akan digunakan
sebagai label pada histogram.
22. Lakukan manipulasi data gaji yang telah diurutkan pada langkah kerja
bagian 19 dengan membagi data berdasarkan nilai yang telah didefiniskan
pada langkah kerja bagian 20 dan menambahkan label yang telah
didefinisikan pada langkah kerja bagian 21.
14
23. Gabungkan data yang diperoleh pada langkah kerja bagian 22 dengan
variabel jenis kelamin pada data salary ke dalam tipe data frame.
24. Buat histogram dari data yang telah digabungkan pada langkah kerja
bagian 23.
25. Buat bagan gelembung (bubble chart) untuk melihat proporsi gaji dengan
menggunakan data Salaries yang belum dimanipulasi.
15
3 Pembahasan
Untuk memastikan akurasi hasil yang diperoleh dari perhitungan variansi data
melalui fungsi, praktikan melakukan perhitungan variansi secara manual
menggunakan persamaan (1) pada langkah kerja bagian 4, diperoleh hasil pada
Gambar 3.2.
Hasil perhitungan variansi secara manual menunjukkan jumlah yang sama dengan
hasil perhitungan variansi menggunakan fungsi yaitu sebesar 35. Fungsi matematis
untuk perhitungan variansi data terbukti keakuratannya.
16
3.2 Fungsi Pernyataan Bersyarat
Praktikan menggunakan fungsi pernyataan bersyarat untuk menyelesaikan
studi kasus bagian 2 karena terdapat beberapa kondisi yang harus dipenuhi oleh
bilangan x untuk mengeluarkan output yang telah didefisikan. Pada Gambar 2.5.
praktikkan menggunakan operator matematis yaitu modulus yang dinotasikan
dengan x%%y. Berdasarkan studi kasus bagian 2, terdapat 4 kondisi dalam fungsi
fizzbuzz yaitu, jika modulus bilangan x terhadap bilangan asli=3 dan bilangan asli=5
menghasilkan sisa sebesar 0, maka fungsi diperintahkan untuk mengeluarkan
output fizzbuzz, jika kondisi tersebut tidak terpenuhi fungsi akan meneruskan ke
kondisi kedua yaitu jika modulus bilangan x terhadap bilangan asli=3 menghasilkan
sisa sebesar 0, maka fungsi diperintahkan untuk mengeluarkan output fizz, jika
kondisi tersebut tidak terpenuhi fungsi akan meneruskan ke kondisi ketiga yaitu
jika modulus bilangan x terhadap bilangan asli=5 menghasilkan sisa sebesar 0,
maka fungsi diperintahkan untuk mengeluarkan output buzz, jika seluruh kondisi
pertama hingga ketiga tidak terpenuhi, maka fungsi diperintahkan untuk
mengeluarkan output berupa bilangan x yang dimasukkan. Untuk memunculkan
output yang telah didefinisikan berdasarkan kondisi yang terpenuhi, digunakan
perintah return().
17
Pada Gambar 3.3. tampak bahwa, ketika dimasukkan bilangan sebesar 135 pada x,
fungsi fizzbuzz mengeluarkan output “fizzbuzz”, begitupula dengan bilangan
sebesar 15. Hal tersebut menunjukkan bahwa bilangan 135 dan 15 memenuhi
kondisi pertama yaitu habis dibagi 3 & 5. Sedangkan untuk x = 10, fungsi
mengeluarkan output buzz yang berarti bilangan tersebut habis dibagi 5, memenuhi
kondisi ketiga. Ketika digunakan x = 9, fungsi mengeluarkan output fizz yang
berarti bilangan tersebut habis dibagi 3. Ketika digunakan bilangan x yang tidak
habis dibagi 3 atau 5 yaitu 28 & 1, maka fungsi akan menampilkan bilangan x yang
dimasukkan seperti pada Gambar 3.3.
3.3 Visualisasi Dustribusi Gaji Penduduk per Sektor & Jenis Kelamin
Sebelum melakukan visualisasi data, praktikkan melakukan analisis
deskriptif untuk mengetahui karakteristik data secara umum menggunakan perintah
pada langkah kerja bagian 12-14. Diperoleh hasil pada Gambar 3.4., Gambar 3.5.,
dan, Gambar 3.6.
Hasil ringkasan data CPS85 pada Gambar 3.4. menampilkan ukuran tendensi
sentral dan dispersi tiap variabel, melalui hal tersebut dapat diketahui bahwa
terdapat 4 variabel dengan tipe numerik yaitu variabel wage, educ, exper, dan age,
sedangkan 7 variabel lainnya merupakan variabel dengan tipe data non-numerik.
Variabel dengan tipe data numerik memiliki ukuran tendensi sentral dan dispersi
data yang cukup lengkap yaitu nilai minimum, median, rata-rata, nilai maksimum,
serta kuartil 1 & 2, sedangkan variabel dengan tipe data non-numerik hanya
18
memiliki nilai frekuensi data. Berdasarkan informasi tersebut, praktikan dapat
menyesuaikan elemen visualisasi yang tepat untuk menggambarkan data dengan
baik. Setelah informasi karakteristik data diperoleh, praktikan menampilkan 10 data
CPS85 teratas untuk melihat nilai pada tiap variabel, diperoleh hasil pada Gambar
3.5.
19
Karena terdapat outlier pada variabel gaji, maka tidak baik menggunakan nilai rata-
rata variabel sebagai ukuran kuantil 2 (tendensi sentral) karena akan menjadikan
box plot tidak proporsional, dimana variabel gaji akan dikelompokan berdasarkan
sektor dan jenis kelamin sehingga terdapat lebih dari satu box plot yang akan
ditampilkan. Oleh karena itu, ukuran kuantil 2 data yang pada umumnya
menggunakan nilai rata-rata dapat diganti dengan nilai tengah data (median).
Untuk menambahkan label pada box plot berupa jumlah individu per sektor
berdasarkan jenis kelamin, dilakukan kalkulasi dengan mengelompokan data
berdasarkan sektor dan jenis kelamin, kemudian menghitung jumlah individu per
kelompok pada langkah kerja bagian 15. Diperoleh hasil pada Gambar 3.7.
Variabel n pada Gambar 3.7. merupakan frekuensi pekerja, tampak bahwa sektor
dengan jumlah pekerja berjenis kelamin perempuan terbanyak adalah sektor
clerical, sedangkan dengan jenis kelamin laki-laki adalah sektor other. Sektor
dengan jumlah pekerja berjenis kelamin perempuan paling sedikit adalah sektor
const, tepatnya tidak terdapat pekerja perempuan pada sektor tersebut. Sedangkan
sektor dengan jumlah pekerja berjenis kelamin laki-laki paling sedikit juga
20
merupakan sektor yang sama, yaitu sektor const. Untuk mempermudah komparasi,
dilakukan visualisasi pada variabel gaji, diperoleh hasil pada Gambar 3.7.
Pada langkah kerja bagian 16, digunakan pipe operator untuk
menggabungkan fungsi visualisasi data pada R-studio dengan manipulasi data.
Setelah manipulasi data dilakukan pada langkah kerja bagian 16, pipe operator
menerusakan proses untuk visualisasi data. Pada tahapan visualisasi digunakan
fungsi ggplot() yang berfungsi untuk mengaktifkan objek-objek pada fungsi
tersebut. ggplot() digunakan untuk mendeskripsikan data yang akan
divisualisasikan dan mendeskripsikan pengaturan tampilan grafik. Fungsi
geom_boxplot() digunakan untuk membuat box plot yang menggambarkan
distribusi dari variabel kontinu dengan 5 ringkasan statistika (rata-rata, median,
nilai minimum, nilai maksimum, kuantil 1, dan kuantil 3), dimana didefinisikan
posisi box plot saling bersisian menggunakan position_dodge2 dan alpha=0.5
yang menunjukkan tingkat saturasi warna box plot. Fungsi geom_point()digunakan
untuk membuat gelembung-gelembung (sebagai data) yang bersisian dengan box
plot pada grafik dengan menggunakan alpha=0.7 yang menunjukkan tingkat
saturasi warna pada gelembung. Fungsi scale_fill_viridis() digunakan untuk
mendefiniskan penggunaan warna batang histogram yaitu menggunakan peta warna
viridis dengan skala diskrit dibenarkan yang berarti batang histogram tidak akan
memuat warna gradasi/hanya satu warna per jenisnya. Fungsi geom_text()
digunakan untuk menambahkan label pada box plot yang diambil dari variabel n
pada data dist_gaji. Fungsi theme_ipsum() digunakan untuk mengaktifkan
template grafis yang ada pada R. Fungsi ylab() digunakan untuk mendefinisikan
label pada ordinat y. Fungsi xlab() digunakan untuk mendefinisikan label pada
ordinat x . Fungsi ylim() digunakan untuk mendefinisikan batas minimum dan
maksimum pada ordinat y.
21
Gambar 3.8. Box Plot Gaji berdasarkan Sektor & Jenis Kelamin
Visualisasi pada Gambar 3.8. menunjukkan sebaran gaji berdasarkan sektor dan
jenis kelamin. Tampak bahwa, secara umum rata-rata gaji pekerja laki-laki lebih
tinggi dibandingkan pekerja perempuan. Terdapat ketimpangan gaji yang cukup
signifikan pada sektor manag, manuf, sales, dan other. Dimana rata-rata gaji
pekerka laki-laki jauh lebih tinggi jika dibandingkan dengan pekerja perempuan.
Sedangkan pada sektor lainnya, rata-rata gaji tidak berbeda terlalu jauh per jenis
kelaminnya. Jika dilihat berdasarkan sektor, terdapat 3 sektor dengan rata-rata gaji
yang hampir sama yaitu gaji pekerja laki-laki pada sektor const, gaji pekerja
perempuan pada sektor manag, dan gaji pekerja perempuan pada sektor prof.
Berdasarkan infromasi tersebut, perlu dilakukan evaluasi perlakuan perusahaan
terhadap pekerja dengan mempertimbangkan jabatan dan fungsi tiap individu,
karena data yang ada menunjukkan terdapat diskriminasi pemberian gaji terhadap
pekerja dengan jenis kelamin perempuan.
22
Gambar 3.9. Hasil Penyaringan Data
Pada Gambar 3.9. ditampilkan 10 data teratas yang telah disaring, dimana variabel
yang diambil hanya variabel salary dan sex. Tampak bahwa variabel salary (gaji)
belum diurutkan, maka perlu dilakukan pengurutan terlebih dahulu sebelum
memasuki tahap pengelompokan data dari variabel gaji. Untuk mengurutkan
variabel gaji dan membaginya menjadi 10 kelompok dilakukan langkah kerja
bagian 19, diperoleh hasil pada Gambar 3.10.
23
Variabel salary_bin yang frekuensinya akan digunakan untuk menentukan
frekuensi gaji pada histogram kemudian dipisahkan menjadi 10 kelompok
menggunakan perintah cut pada langkah kerja bagian 22, diperoleh hasil pada
Gambar 3.11.
Tampak terdapat 10 variansi pada data group_tags karena sebelumnya data pada
variabel gaji telah dibagi menjadi 10 kelompok. Gambar 3.11. menampilkan
sepuluh data teratas dari data gaji yang telah dikonversi berdasarkan rentang
kelompoknya. Rentang sepuluh data teratas pada data group_tags sama dengan
rentang data pada variabel salary_bin, dapat disimpulkan langkah kerja bagian 22
dilakukan dengan baik.
Untuk memperoleh rentang data gaji dengan variabel jenis kelamin, praktikan
melakukan penggabungan data antara data group_tags dan variabel sex (jenis
kelamin) pada data salary, diperoleh hasil pada Gambar 3.12.
24
jenis kelamin, data merged divisualisasikan dalam bentuk histogram, diperoleh
hasil pada Gambar 3.13.
Pada langkah kerja bagian 24 digunakan fungsi ggplot() yang berfungsi
untuk mengaktifkan objek-objek pada fungsi tersebut. ggplot() digunakan untuk
mendeskripsikan data yang akan divisualisasikan dan mendeskripsikan pengaturan
tampilan grafik. Fungsi as_tibble() untuk mengubah variabel group_tags pada
data merged yang awalnya berupa tipe data frame menjadi tipe data dengan level
atau kelas, sehingga tiap data pada variabel group_tags yang berupa rentang gaji
akan dikelompokan sehingga membentuk frekuensi pada histogram. Fungsi
mapping() digunakan untuk mendeskripsikan pemetaan estetika yang digunakan
pada grafik, dimana praktikan mendeskripsikan nilai pada variabel group_tags
sebagai ordinat x dan komparasi warna batang histogram berdasarkan variasi jenis
kelamin. Fungsi geom_bar digunakan untuk mendeskripsikan tinggi batang
histogram berdasarkan frekuensi tiap kelas dari variabel group_tags, dengan tingkat
saturasi warna 0.7, dan posisi batang saling bersisian (dodge). Fungsi
scale_fill_viridis() digunakan untuk mendefiniskan penggunaan warna
batang histogram yaitu menggunakan peta warna viridis dengan skala diskrit
dibenarkan yang berarti batang histogram tidak akan memuat warna gradasi/hanya
satu warna per jenisnya. Fungsi stat_count() digunakan untuk menghitung
frekuensi tiap rentang gaji yang muncul pada data group_tags yang telah melewati
proses manipulasi data. Fungsi labs() digunakan untuk mengatur label pada
ordinat grafik. Fungsi guides() digunakan untuk mengatur judul pada keterangan
warna grafik. Fungsi theme_minimal() digunakan untuk mengaktifkan template
grafis yang ada pada R.
25
Gambar 3.13. Histogram Gaji Pengajar berdasarkan Jenis kelamin
26
menerapkan sistem organisasi dengan fungsi jabatan, maka tidak mengherankan
terdapat distribusi gaji yang tidak merata karena jabatan pengajar yang bervariasi.
Visualisasi data gaji pengajar menggunakan bagan gelembung juga dibuat
untuk melihat proporsi jumlah karyawan berdasarkan rentang gaji dan masa kerja
per jenis kelamin. Praktikan menggunakan bagan gelembung karena dapat
menggambarkan proporsi data dengan baik, dimana terdapat dua variabel numerik
yang digunakan yaitu salary dan years of service sehingga tipe bagan gelembung
sangat cocok digunakan. Berdasarkan langkah kerja bagian 25 diperoleh hasil pada
Gambar 3.14.
Pada langkah kerja bagian 25 digunakan fungsi ggplot() yang berfungsi
untuk mengaktifkan objek-objek pada fungsi tersebut. ggplot() digunakan untuk
mendeskripsikan data yang akan divisualisasikan dan mendeskripsikan pengaturan
tampilan grafik. Fungsi geom_point() digunakan untuk membuat gelembung-
gelembung pada grafik dengan menggunakan alpha=0.7 yang menunjukkan
tingkat saturasi warna pada gelembung. Fungsi scale_size() digunakan untuk
mengatur ukuran gelembung dengan 0.1 satuan adalah diameter gelebung terkecil,
dan 20 satuan untuk diameter gelembung terbesar, name=”” pada fungsi tersebut
digunakan untuk mendefinisikan judul pada keterangan ukuran gelembung. Fungsi
scale_fill_viridis() digunakan untuk mendefiniskan penggunaan warna
batang histogram yaitu menggunakan peta warna viridis dengan skala diskrit
dibenarkan yang berarti batang histogram tidak akan memuat warna gradasi/hanya
satu warna per jenisnya. Fungsi theme_ipsum() digunakan untuk mengaktifkan
template grafis yang ada pada R. Fungsi ylab() digunakan untuk mendefinisikan
label pada ordinat y. Fungsi xlab() digunakan untuk mendefinisikan label pada
ordinat x. Fungsi scale_x_continuous() yang didefinisikan dengan n.breaks
digunakan untuk mengatur jumlah kelompok yang akan dibentuk pada variabel
gaji, dimana praktikkan menggunakan jumlah sebesar 10 untuk menyakan dengan
histogram yang telah dibuat sebelumnya untuk memudahkan komparasi.
27
Gambar 3.14. Diagram Gelembung Gaji Pengajar berdasarkan Masa Kerja per
Jenis Kelamin
28
tahun. Dapat diasumsikan terdapat variabel lain yang mempengaruhi gaji seorang
pengajar selain durasi masa kerja per tahun.
29
4 Penutup
4.1 Kesimpulan
1. Fungsi matematis (variance) untuk menghitung varians x = (1, 2, 3, 4, 5,
6, 7, 8, 9, 10, 11, 12, 12, 14, 15, 16, 17, 18, 19, 20) menghasilkan output
sebesar 35. Hasil perhitungan variansi secara manual menggunakan
persamaan (1) menunjukkan jumlah yang sama dengan hasil perhitungan
variansi menggunakan fungsi yaitu sebesar 35. Fungsi matematis untuk
perhitungan variansi data terbukti keakuratannya.
2. Fungsi pernyataan bersyarat fizzbuzz dengan x = 135, 15, 10, 9, 18, 1,
masing-masing menghasilkan output fizzbuzz, fizzbuzz, buzz, fizz, 18, 1.
Kesesuaian antara masing-masing x terhadap output-nya memenuhi
kondisi yang telah dideskripsikan dengan operator matematis (modulus)
di dalam fungsi. Fungsi pernyataan bersyarat fizzbuzz terbukti
keakuratannya.
3. Box plot gaji berdasarkan jenis kelamin menunjukkan rata-rata gaji
pekerja laki-laki lebih tinggi dibandingkan pekerja perempuan.
Berdasarkan jenis kelamin, terdapat ketimpangan gaji yang cukup
signifikan pada sektor manag, manuf, sales, dan other, sedangkan pada
sektor lainnya, rata-rata gaji tidak berbeda terlalu jauh per jenis
kelaminnya. Berdasarkan informasi tersebut, perlu dilakukan evaluasi
perlakuan perusahaan terhadap pekerja dengan mempertimbangkan
jabatan dan fungsi tiap individu, karena data yang ada menunjukkan
terdapat diskriminasi pemberian gaji terhadap pekerja dengan jenis
kelamin perempuan.
4. Histogram gaji asisten profesor, rekan profesor, dan profesor (pengajar)
menunjukkan sebagian besar pengajar di Universitas A pada masa kerja
2008-2009 berjenis kelamin laki-laki. Berdasarkan kelompok gaji,
terdapat ketimpangan jumlah pengajar per jenis kelamin. Jumlah pengajar
perempuan & laki-laki terbanyak berdasarkan kelompok gaji berada pada
kelompok yang sama yaitu pada rentang 92500$-110000$. Jika dilihat
30
berdasarkan distribusi data, kelompok gaji pengajar perempuan
cenderung mendekati distribusi normal, sedangkan kelompok gaji
pengajar laki-laki cenderung menceng kearah kanan. Sedangkan diagram
gelembung gaji pengajar berdasarkan masa kerja per jenis kelamin
menunjukkan sebagian besar pengajar memiliki masa kerja 15-30 tahun
dengan rentang gaji 63000$-170000$. Proporsi masa kerja pengajar laki-
laki lebih cenderung lebih lama dibandingkan proporsi masa kerja
perempuan. Jika hubungan antara rentang gaji dilihat berdasarkan masa
kerja, tampak bahwa bagan gelembung membentuk pola yang saling
berkorelasi positif tetapi tidak cukup kuat. Dapat diasumsikan bahwa
masa kerja mempengaruhi gaji pengajar, dimana jika masa kerja
meningkat maka gaji juga ikut meningkat.
31
5 Daftar Pustaka
32