Anda di halaman 1dari 13

MAKALAH DATA MINING

ESTIMASI PADA GAJI KARYAWAN TERHADAP


LAMA BEKERJA

Dosen : Pa Jasman Pardede


Mata Kuliah : Data Mining

Disusun Oleh Kelompok 8:


152021182 Bob Byan Handoko
152021199 Fadil Jaya Pratama
152021211 Henshammi Adha Fernandi
152021222 Rifqi Syahrizal Fadil Alba

INSTITUT TEKNOLOGI NASIONAL BANDUNG


FAKULTAS TEKNOLOGI INDUSTRI
INFORMATIKA
BANDUNG
2023

1
LATAR BELAKANG
Masalah gaji atau pendapatan merupakan hal yang penting karena berpengaruh langsung
pada produktivitas dan semangat kerja karyawan. Bagi perusahaan, sistem gaji tidak semata-mata
hanya untuk memenuhi peraturan pemerintah dalam kaitannya dengan Upah Minimum Regional
(UMR), tetapi untuk menciptakan keseimbangan antara apa yang telah diberikan karyawan pada
perusahaan dengan apa yang diberikan perusahaan untuk karyawan atau bisa disebut juga prinsip
keadilan.
Dalam praktiknya, masalah gaji atau pendapatan kerja merupakan hal yang sulit dalam
menentukan gaji setiap karyawan terlebih lagi bila perusahaan belum memiliki sistem gaji yang
mengacu pada obyektivitas beban kerja (workload) bagi para karyawannya. Apabila perusahaan
telah memiliki sistem gaji melalui pendekatan metode tertentu, maka akan sangat membantu
penyelenggaraan pemeliharaan SDM. Sehingga sangat bermanfaat jika perusahaan menerapkan
sistem gaji yang komprehensif, yaitu seimbang antara hak dan kewajiban karyawan dan
perusahaan.
Gaji merupakan kebutuhan utama bagi manusia terutama bagi karyawan yang bekerja di
perusahaan. Gaji diperlukan bagi karyawan untuk memenuhi 2 kebutuhan hidupnya. Kebutuhan
gaji juga penting bagi perusahaan dan kesesuaian gaji yang diberikan ke karyawan diharapkan
dapat memotivasi karyawan dan dapat meningkatkan kinerja karyawan. Gaji yang di berikan
kepada karyawan berbeda sesuai dengan jabatan dan tingkat golonganya.

2
DAFTAR ISI
LATAR BELAKANG ................................................................................................................... 2
DAFTAR ISI ................................................................................................................................. 3
BAB I DEFINISI DAN SEJARAH ............................................................................................... 4
1.1 Data Mining ......................................................................................................................... 4
1.2 Sejarah Data Mining ............................................................................................................ 4
1.3 Estimasi ................................................................................................................................ 4
1.4 Sejarah Estimasi ................................................................................................................... 4
BAB II FORMULA ..................................................................................................................... 6
2.1 Regresi Linear Sederhana .................................................................................................... 6
BAB III STUDI KASUS ............................................................................................................... 7
3.1 Gaji Karyawan Terhadap Lama Bekerja.............................................................................. 7
BAB IV IMPLEMENTASI ......................................................................................................... 10
BAB V PENUTUP ..................................................................................................................... 12
5.1 Kesimpulan ........................................................................................................................ 12
DAFTAR PUSTAKA .................................................................................................................. 13

3
BAB I
DEFINISI DAN SEJARAH
1.1 Data Mining

Data Mining adalah suatu proses yang memperkerjakan satu atau lebih teknik
pembelajaran computer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan
(knowledge) secara otomatis. Data mining merupakan proses iterative dan interaktif untuk
menemukan pola atau model baru yang sempurna, bermanfaat dan dapat dimengerti dalam suatu
database yang sangat besar.
Data mining berisi pencarian trend atau pola yang diinginkan dalam database besar untuk
membantu pengambilan keputusan di waktu yang akan datang. Pola-pola ini dikenali oleh
perangkat tertentu yang dapat memberikan suatu analisa data yang berguna dan berwawasan yang
kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja menggunakan perangkat
pendukung keputusan yang lainnya.

1.2 Sejarah Data Mining

Konsep estimasi telah ada selama berabad-abad, tetapi menjadi semakin penting dengan
perkembangan statistik modern pada abad ke-19 dan awal abad ke-20. Estimasi digunakan untuk
menghitung parameter dan mengambil kesimpulan dari sampel data. Awalnya, estimasi lebih
fokus pada statistik deskriptif seperti rata-rata, median, dan deviasi standar. Ini membantu dalam
pemahaman karakteristik data yang relevan.
Selama abad ke-20, pengembangan statistik dan metode analisis data semakin
berkembang. Ini melibatkan pengembangan teknik estimasi yang lebih canggih seperti regresi,
analisis deret waktu, dan inferensi statistik yang lebih kompleks. Estimasi menjadi kritis dalam
data mining ketika organisasi mulai mengumpulkan data dalam jumlah besar. Estimasi digunakan
untuk membuat prediksi, mengidentifikasi pola, dan memahami tren dari data ini.
Seiring dengan pertumbuhan big data, estimasi menjadi lebih penting daripada
sebelumnya. Metode seperti machine learning digunakan untuk melakukan estimasi yang
kompleks, membantu dalam pengambilan keputusan yang lebih akurat.

1.3 Estimasi

Estimasi adalah suatu metode dimana kita dapat memperkirakan nilai Populasi dengan
memakai nilai sampel. Estimasi biasanya diperlukan untuk mendukung keputusan yang
baik,menjadwalkan pekerjaan, menentukan berapa lama proyek perlu dilakukan dan berapa
biayanya, menentukan apakah proyek layak dikerjakan, mengembangkan kebutuhan arus kas,
menentukan seberapa baik kemajuan proyek, menyusun anggaran time phased dan menetapkan
baseline proyek.

1.4 Sejarah Estimasi

Konsep estimasi telah ada selama berabad-abad, tetapi menjadi semakin penting dengan
perkembangan statistik modern pada abad ke-19 dan awal abad ke-20. Estimasi digunakan untuk
menghitung parameter dan mengambil kesimpulan dari sampel data. Awalnya, estimasi lebih
fokus pada statistik deskriptif seperti rata-rata, median, dan deviasi standar. Ini membantu dalam
pemahaman karakteristik data yang relevan.
Selama abad ke-20, pengembangan statistik dan metode analisis data semakin
berkembang. Ini melibatkan pengembangan teknik estimasi yang lebih canggih seperti regresi,
analisis deret waktu, dan inferensi statistik yang lebih kompleks. Estimasi menjadi kritis dalam
4
data mining ketika organisasi mulai mengumpulkan data dalam jumlah besar. Estimasi digunakan
untuk membuat prediksi, mengidentifikasi pola, dan memahami tren dari data ini.
Seiring dengan pertumbuhan big data, estimasi menjadi lebih penting daripada
sebelumnya. Metode seperti machine learning digunakan untuk melakukan estimasi yang
kompleks, membantu dalam pengambilan keputusan yang lebih akurat.

5
BAB II
FORMULA
2.1 Regresi Linear Sederhana

Analisis regresi linier sederhana digunakan untuk mengembangkan suatu persamaan yang
menunjukkan bagaimana keterkaitan antara variabel independen (bebas) dengan variabel
dependen (terikat), dan untuk memprediksi nilai dari variabel dependen apabila nilai variabel
independen mengalami kenaikan atau penurunan.
Persamaan yang menjelaskan bagaimana keterkaitan antara variabel X dengan variabel Y
dan suatu model error disebut model regresi. Model regresi yang digunakan dalam regresi linear
sederhana adalah:

y = a + bx

● Y adalah variabel terikat (dependent)

● X adalah variabel bebas (independent)

● a adalah konstanta

● b adalah koefisien regresi Untuk menentukan nilai Konstanta rumusnya

● ΣX adalah jumlah nilai X

● ΣY adalah jumlah nilai Y

● n adalah jumlah data Untuk menentukan nilai koefisien regresinya rumusnya:

● ΣXY adalah jumlah XY

● ΣX^2 adalah jumlah X^2

6
BAB III
STUDI KASUS
3.1 Gaji Karyawan Terhadap Lama Bekerja

Dataset yang digunakan pada kasus ini adalah pengaruh gaji karyawan terhadap lama
bekerja karyawan tersebut pada perusahaan yang bersangkutan. Dataset diambil dari Kaggle.com
dan telah dipilah serta diubah ke dalam angka numerik dan bahasa indonesia untuk kemudahan
analisis, Sebagai Berikut :

No Tahun Bekerja (X) Gaji (Y)


1 1.1 39343
2 1.3 46205
3 1.5 37731
4 2 43525
5 2.2 39891
6 2.9 56642
7 3 60150
8 3.2 54445
9 3.2 64445
10 3.7 57189
11 3.9 63218
12 4 55794
13 4 56957
14 4.1 57081
15 4.5 61111

7
Jawab:

1. Hitung X2,Y2,XY dan total dari masing masingnya.

No Tahun Bekerja (X) Gaji (Y) X^2 Y^2 XY


1 1.1 39343 1.21 1547871649 43277.3
2 1.3 46205 1.69 2134902025 60066.5
3 1.5 37731 2.25 1423628361 56596.5
4 2 43525 4 1894425625 87050
5 2.2 39891 4.84 1591291881 87760.2
6 2.9 56642 8.41 3208316164 164261.8
7 3 60150 9 3618022500 180450
8 3.2 54445 10.24 2964258025 174224
9 3.2 64445 10.24 4153158025 206224
10 3.7 57189 13.69 3270581721 211599.3
11 3.9 63218 15.21 3996515524 246550.2
12 4 55794 16 3112970436 223176
13 4 56957 16 3244099849 227828
14 4.1 57081 16.81 3258240561 234032.1
15 4.5 61111 20.25 3734554321 274999.5
jumlah 13 793727 149.84 43152836667 2478095.4

2. Hitung a dan b berdasarkan persamaan yang sudah ditentukan.

a = (793727*149.84) − (13*2478095.4)/(15*149.84) − ((13)^2)


a = (118.932.054 – 32,215,240.2) / (2.247,6 – 169)
a = 86,716,813.8 / 2,078.6
a = 41,718.8558645

b = 15*2478095.4 – (13)*(793727) / 15*149.84 – ((13)^2)


b = 37171431 – 10318451 / 2247.6 – 169
b = 37,166,671.1248

3. Buat model persamaan Regresi sederhana


y=a+bx
y = 41,718.856+ 37,166,671 * x Tahun Bekerja

8
● Estimasi terhadap variabel terikat (Y)
jika tahun kerja yang diinginkan adalah 10, maka gaji adalah:
y = 41,718.856+ 37,166,671 * x

y = 41,718.85 6+ 37,166,671 * 10

y = 41,718.856 + 371666710

y = 371,708,428.856

● Estimasi terhadap variabel bebas (X)

jika gaji yang diinginkan adalah 380.000.000, maka tahun kerja yang harus dapatkan adalah:

y = 41,718.856+ 37,166,671 * x

x = y + 41,718.856 / 37,166,671

x = (380000000 + 41,718.856) / 37,166,671

x = 10.2 (dalam tahun)

9
BAB IV
IMPLEMENTASI

Penjelasan : berguna untuk mengimpor library yang dibutuhkan untuk menyelesaikan tugas
regresi linear sederhana. dataset = pd.read_csv(‘Daftar_gaji.csv’) digunakan untuk mengimpor
dataset. dataset.head() berguna untuk memunculkan 5 data teratas dari dataset.

Penjelasan : digunakan untuk mengetahui jumlah data pada dataset.

10
Penjelasan : berfungsi untuk melakukan analisis deskriptif secara otomatis terhadap dataset
yang dipilih.

11
BAB V
PENUTUP

5.1 Kesimpulan

Kesimpulan mengenai data mining metode estimasi adalah bahwa metode estimasi merupakan
salah satu aspek penting dalam proses analisis data mining. Metode ini digunakan untuk
mengestimasi nilai-nilai yang tidak diketahui dalam dataset berdasarkan informasi yang ada.
Beberapa hal penting yang dapat disimpulkan tentang metode estimasi dalam data mining adalah
sebagai berikut:

1. Metode estimasi adalah teknik yang digunakan untuk menghitung atau memprediksi nilai-
nilai yang tidak diketahui dalam dataset berdasarkan data yang ada.
2. Metode estimasi dapat digunakan dalam berbagai konteks, termasuk pengolahan data,
analisis statistik, dan pembuatan model prediksi.
3. Terdapat berbagai macam metode estimasi yang dapat digunakan, seperti regresi, clustering,
analisis deret waktu, dan lain sebagainya. Pemilihan metode yang tepat tergantung pada jenis
data dan tujuan analisis.
4. Tujuan utama dari metode estimasi adalah untuk menghasilkan perkiraan yang akurat atau
mendekati nilai sebenarnya untuk digunakan dalam pengambilan keputusan atau analisis
lebih lanjut.
5. Evaluasi kualitas estimasi sangat penting. Metode evaluasi dapat berupa pengukuran
kesalahan, validasi silang, atau pengujian statistik lainnya untuk menentukan sejauh mana
estimasi sesuai dengan data asli.
6. Data mining juga dapat digunakan dalam kombinasi dengan metode estimasi untuk
mengungkap pola-pola tersembunyi dalam data dan memperbaiki akurasi estimasi.
7. Penting untuk memahami keterbatasan dan asumsi yang mendasari metode estimasi yang
digunakan, serta mempertimbangkan kebijakan privasi dan etika dalam mengakses dan
menggunakan data.

Kesimpulan tersebut menggarisbawahi pentingnya metode estimasi dalam data mining dan
perlunya pemahaman yang baik tentang teknik-teknik ini untuk menghasilkan hasil analisis
yang berguna dan akurat.

12
DAFTAR PUSTAKA

Hayati, R. (2023, Juni 4). Pengertian Regresi Linier Sedehana, Cara Menghitung, dan Contohnya. From
PenelitianIlmiah: https://penelitianilmiah.com/regresi-linier-sedehana/
Riadi, M. (2017, September 21). Pengertian, Fungsi, Proses dan Tahapan Data Mining. From
KAJIANPUSTAKA: https://www.kajianpustaka.com/2017/09/data-mining.html

13

Anda mungkin juga menyukai