Anda di halaman 1dari 13

MAKALAH PRAKTIKUM STATISTIKA KOMPUTASI

“Disusun untuk memenuhi penilaian modul 4-5 praktikum Statistika komputasi”

DOSEN :

Dr. MAIYASTRI, M.Si

ASISTEN PEMERIKSA :

RIDHO SAPUTRA

DISUSUN OLEH :

NAMA : Alya Ramadhani

NIM : 2210433031

SHIFT : II (dua)

HARI, TANGGAL PRAKTIKUM : Kamis, 12 Oktober 2023

WAKTU PRAKTIKUM : 16.15 - 17.55 WIB

LABORATORIUM KOMPUTASI MATEMATIKA DAN SAINS DATA

DEPARTEMEN MATEMATIKA DAN SAINS DATA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS ANDALAS

2023
BAB I
PENDAHULUAN

1.1 Latar Belakang


Analisis regresi adalah suatu metode statistik yang digunakan untuk
memahami hubungan antara satu atau lebih variabel bebas (variabel
prediktor) dan satu variabel terikat (variabel yang ingin diprediksi atau
dijelaskan). Analisis regresi digunakan untuk mengidentifikasi dan
mengukur sejauh mana variabel independen memengaruhi variabel
dependen. Pada modul ini, diambil sebuah sampel data untuk
mengidentifikasi persamaan regresi dari data tersebut. Persamaan regresi
membantu kita memodelkan hubungan antara variabel terikat (y) dan
variabel bebas (x1, x2, x3, x4, dan x5). Dengan mengumpulkan data yang
mencakup 10 baris dan variabel-variabel yang relevan. Penyeleseian modul
ini bertujuan untuk menyelidiki hubungan antara variabel bebas dan
variabel terikat, serta memastikan bahwa data tersebut memenuhi asumsi
dasar dalam analisis regresi, seperti asumsi uji normalitas. Pada modul ini
juga dibahas mengenai pembangkitan data acak menggunakan beberapa
sebaran. Pembangkitan data acak dengan menggunakan sebaran uniform
dan gamma adalah suatu teknik yang sangat relevan dalam berbagai bidang,
seperti simulasi, pengujian statistik, dan pemodelan komputasi.

1.2 Rumusan Masalah


Rumusan masalah dari kasus ini adalah sebagai berikut :
1. Bagaimana menetukan persamaan regresi berdasarkan variabel terikat
dan variabel bebas?
2. Berapakah nilai 𝑒 = 𝑦̂ − 𝑦 dan apakah menyebar normal dengan uji
Kolmogrov smirnov dengan taraf nyata 5%?
3. Berapakah nilai FKP dan CDF dari kedua sebaran tersebut?
4. Bagaimana mengambil 50 data dengan pengembalian dan tanpa
pengembalian dari pembangkitan sebaran Uniform dan sebaran Gamma
tersebut?

1.3 Tujuan Penulisan


Tujuan dari penulisan makalah ini adalah sebagai berikut :
1. Mengetahui persamaan regresi dan nilai dari 𝑒 = 𝑦̂ − 𝑦.
2. Mengidentifikasi apakah nilai 𝑒 menyebar normal dengan uji
Kolmogrov smirnov dengan taraf nyata 5%.
3. Mengetahui FKP dan CDF dari 150 data yang dibangkitkan dengan
sebaran Uniform dan sebaran Gamma.
4. Mengetahui bagaimana mengambil 50 data secara acak dengan
pengambilan ataupun tanpa pengembalian dari pembangkitan sebaran.
BAB II
HASIL DAN PEMBAHASAN

2.1 Cari data yang minimal terdiri dari 10 baris dan 6 kolom (terdiri dari 5 variabel
bebas dan 1 variabel terikat serta cantumkan link sumber data)

Tabel 2.1 Jumlah penduduk miskin beberapa kabupaten dan kota di Provinsi
Sumatera Utara
y x1 x2 x3 x4 x5
24.99 23.28 22.21 24.53 24.11 24.88
48.38 40.69 39.68 47.79 47.67 48.30
29.91 30.77 29.38 31.20 30.84 29.48
49.61 52.00 49.86 52.20 51.77 53.05
33.09 33.75 32.23 33.37 33.20 33.75
16.64 16.96 16.51 18.31 18.20 18.49
42.08 38.14 37.35 41.63 41.94 42.35
72.32 80.54 76.97 85.16 84.35 83.67
83.09 87.72 86.25 92.89 92.19 91.35
25.49 24.00 23.35 25.33 24.94 24.98
36.71 36.93 35.36 37.52 38.74 40.02
91.19 91.97 90.92 95.65 100.09 97.09
99.27 104.31 100.63 114.19 115.79 114.41
56.94 56.96 54.46 58.97 57.75 57.95
17.25 17.94 17.14 18.04 18.04 18.35
https://sumut.bps.go.id/statictable/2018/08/30/988/jumlah-penduduk-miskin-
sumatera-utara-dan-kabupaten-kota-1993-2017.html
2.1.1 Persamaan regresi (𝑦̂)
(a) Rumus Persamaan regresi (𝑦̂)

𝑦̂ = 𝑎 + 𝑏𝑋
dimana,
𝑛 ∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑋𝑖 ∑ 𝑌𝑖
𝑏=
𝑛 ∑ 𝑋𝑖 2 − (∑ 𝑋𝑖 )2

𝑎 = 𝑌̅ − 𝑏𝑋̅

Keterangan :
𝑦 ∶ 𝑣𝑎𝑟𝑖𝑎𝑏𝑒𝑙 𝑡𝑒𝑟𝑖𝑘𝑎𝑡
𝑎 ∶ 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎
𝑏 ∶ 𝑘𝑜𝑒𝑓𝑖𝑠𝑖𝑒𝑛 𝑣𝑎𝑟𝑖𝑎𝑏𝑒𝑙 𝑏𝑒𝑏𝑎𝑠
𝑋 ∶ 𝑣𝑎𝑟𝑖𝑎𝑏𝑒𝑙 𝑏𝑒𝑏𝑎𝑠
(b) Bahasa Program
MTB > Set C7
DATA> 1(1)15
DATA> END.
MTB > COPY C7 'x1' 'x2' 'x3' 'x4' 'x5' M1;
SUBC> Varnames.
MTB > NAME M 'X'
MTB > PRINT M1

Data Display

Matrix X

1 23,28 22,21 24,53 24,11 24,88


1 40,69 39,68 47,79 47,67 48,30
1 30,77 29,38 31,20 30,84 29,48
1 52,00 49,86 52,20 51,77 53,05
1 33,75 32,23 33,37 33,20 33,75
1 16,96 16,51 18,31 18,20 18,49
1 38,14 37,35 41,63 41,94 42,35
1 80,54 76,97 85,16 84,35 83,67
1 87,72 86,25 92,89 92,19 91,35
1 24,00 23,35 25,33 24,94 24,98
1 36,93 35,36 37,52 38,74 40,02
1 91,97 90,92 95,65 100,09 97,09
1 104,31 100,63 114,19 115,79 114,41
1 56,96 54,46 58,97 57,75 57,95
1 17,94 17,14 18,04 18,04 18,35

MTB > COPY 'Y' M2;


SUBC> Varnames.
MTB > NAME M2 'Y'
* NOTE * Duplicate name(s) (y) made unique by adding _n.

MTB > PRINT M2

Data Display

Matrix y_1

24,99
48,38
29,91
49,61
33,09
16,64
42,08
72,32
83,09
25,49
36,71
91,19
99,27
56,94
17,25

MTB > Transpose 'X' M3.


MTB > NAME M3 'XT'
MTB > PRINT M3

Data Display
Matrix XT

1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00


1,00 1,00 1,00 1,00 1,00
23,28 40,69 30,77 52,00 33,75 16,96 38,14 80,54
87,72 24,00 36,93 91,97 104,31
22,21 39,68 29,38 49,86 32,23 16,51 37,35 76,97
86,25 23,35 35,36 90,92 100,63
24,53 47,79 31,20 52,20 33,37 18,31 41,63 85,16
92,89 25,33 37,52 95,65 114,19
24,11 47,67 30,84 51,77 33,20 18,20 41,94 84,35
92,19 24,94 38,74 100,09 115,79
24,88 48,30 29,48 53,05 33,75 18,49 42,35 83,67
91,35 24,98 40,02 97,09 114,41

1,00 1,00
56,96 17,94
54,46 17,14
58,97 18,04
57,75 18,04
57,95 18,35

MTB > Multiply 'XT' 'X' M4.


MTB > NAME M4 'XTX'
MTB > PRINT M4

Data Display

Matrix XTX

15,00 736,0 712,3 776,8 779,6 778,1


735,96 47756,4 46320,1 50605,9 50976,8 50601,1
712,30 46320,1 44934,9 49086,0 49453,7 49083,5
776,78 50605,9 49086,0 53687,1 54079,9 53680,0
779,62 50976,8 49453,7 54079,9 54499,9 54086,5
778,12 50601,1 49083,5 53680,0 54086,5 53691,9

MTB > Multiply 'XT' 'y_1' M5.


MTB > NAME M5 'XTY'
MTB > PRINT M5

Data Display

Matrix XTY

727,0
46429,5
45043,4
49235,5
49605,1
49253,1

MTB > Invert 'XTX' M6.


MTB > NAME M6 'INVXTX'
MTB > PRINT M6

Data Display

Matrix INVXTX
0,418704 -0,016581 -0,010307 0,0138755 0,115944 -
0,111688
-0,016581 0,200877 -0,194290 -0,0572351 0,082089 -
0,036930
-0,010307 -0,194290 0,208610 0,0435281 -0,094636
0,044362
0,013876 -0,057235 0,043528 0,0815105 -0,036068 -
0,031212
0,115944 0,082089 -0,094636 -0,0360684 0,141875 -
0,099389
-0,111688 -0,036930 0,044362 -0,0312117 -0,099389
0,127210

MTB > Multiply 'INVXTX' 'XTY' M7.


MTB > NAME M7 'b'
MTB > Print M7

Data Display

Matrix b

3,88630
-1,74690
1,93893
0,10211
-0,36605
1,00149

MTB > Multiply 'X' 'b' M8.


MTB > NAME M8 'Y_hat'
MTB > PRINT M8

Data Display

Matrix Y_Hat

24,878
45,544
28,521
49,231
32,475
19,996
40,990
74,044
85,106
25,709
37,664
89,875
100,637
52,895
19,396

2.1.2 Nilai 𝑒 = 𝑦̂ − 𝑦
 Bahasa Program
MTB > Copy 'Y_Hat' C8;
SUBC> Varnames.
MTB > Subtract 'y_1' 'Y_Hat' M9.
MTB > NAME M9 'e'
MTB > PRINT M9

Data Display
Matrix e

-0,11160
-2,83622
-1,38938
-0,37884
-0,61514
3,35564
-1,08974
1,72420
2,01562
0,21902
0,95375
-1,31536
1,36686
-4,04479
2,14598

2.1.3 Uji apakah e menyebar normal dengan uji kolmogrov smirnov dengan
taraf nyata 5% dan tampilkan plotnya
 Uji apakah data e menyebar normal atau tidak, uji dengan Uji
Kolmogorov Smirnov. Hipotesis Uji Kolmogorov Smirnov adalah :
𝐻0 ∶ Data menyebar normal
𝐻1 ∶ Data tidak menyebar normal
 Pengujian ini menggunakan tarif nyata 5% (𝛼 = 0,05)
MTB > NormTest 'e_1';
SUBC> KSTest.

Probability Plot of e_1

Gambar 2.1 Grafik hasil uji normalitas e

Karena p-value > 0,015 dan lebih (>) dari α = 0,05, maka terima H0.
Artinya data menyebar normal.
2.2 Bangkitkan 150 data dari sebaran Uniform dan Gamma
 Sebaran Uniform
MTB > Random 150 c1;
SUBC> Uniform 0.0 1.0.
MTB > Print UNIFORM

 Sebaran Gamma
MTB > Random 150 'GAMMA';
SUBC> Gamma 5 3.
MTB > Print GAMMA

2.2.1 FKP dan CDF dari sebaran Uniform dan Gamma


(a) Sebaran Uniform
 FKP (Fungsi Kepekatan Peluang)
MTB > PDF 'x' 'f(x)';
SUBC> Uniform 0.0 1.0.
MTB > Print C2
 CDF (Cummulative Distribution Function)
MTB > CDF 'x' 'Fx(x)';
SUBC> Uniform 0.0 1.0.
MTB > Print C3

(b) Sebaran Gamma


 FKP (Fungsi Kepekatan Peluang)
MTB > PDF 'x' 'f(x)';
SUBC> Gamma 5 3.
MTB > Print C6

 CDF (Cummulative Distribution Function)


MTB > CDF 'x' 'Fx(x)';
SUBC> Gamma 5 3.
MTB > Print C7
2.2.2 Plot FKP dan CDF dari sebaran Uniform dan Gamma
(a) Sebaran Uniform
 Plot FKP
MTB > Plot 'f(x)'*'x';
SUBC> Symbol;
SUBC> Connect.

Scatterplot of f(x) vs x

Gambar 2.2 Grafik diagram pencar FKP sebaran Uniform

 Plot CDF
MTB > Plot 'Fx(x)'*'x';
SUBC> Symbol;
SUBC> Connect.

Scatterplot of Fx(x) vs x
Gambar 2.3 Grafik diagram pencar CDF sebaran Uniform

(b) Sebaran Gamma


 Plot FKP
MTB > Plot 'f(x)'*'x';
SUBC> Symbol;
SUBC> Connect.

Scatterplot of f(x) vs x

Gambar 2.4 Grafik diagram pencar FKP sebaran Gamma

 Plot CDF
MTB > Plot 'Fx(x)'*'x';
SUBC> Symbol;
SUBC> Connect.

Scatterplot of Fx(x) vs x
Gambar 2.5 Grafik diagram pencar CDF sebaran Gamma

2.2.3 Ambil 50 data dengan pengembalian dari pembangkitan sebaran


Uniform terseut dan Ambil 50 data tanpa pengembalian dari
pembangkitan sebaran Gamma tersebut (Nilai parameter setiap
sebaran dibebaskan pemilihannya)
(a) Pembangkitan 50 data dengan pengembalian dari pembangkitan
sebaran Uniform
 Bahasa Program
MTB > Sample 50 'UNIFORM' c13;
SUBC> Replace.
MTB > Print C13

(b) Pembangkitan 50 data tanpa pengembalian dari pembangkitan


sebaran Gamma
 Bahasa Program
MTB > Sample 50 'GAMMA' c14.
MTB > Print C14
BAB III
KESIMPULAN

Pada pembahasan makalah kali ini, kita ingin memahami apakah data yang
kita miliki menyebar normal atau tidak. Data yang digunakan pada makalah ini
diambil dari data Badan Pusat Statistik Sumatera Utara. Hasil pengujian data
berdasarkan grafik pada gambar 2.1 menunjukkan bahwa data memiliki distribusi
yang cenderung menyebar secara normal. Hal ini didukung oleh dua aspek utama
dalam analisis ini. Pertama, analisis regresi mengindikasikan bahwa data memenuhi
asumsi-asumsi dasar dari regresi linear, seperti normalitas residual. Dengan
demikian, dapat disimpulkan bahwa data yang digunakan dalam analisis regresi ini
menerima asumsi dasar distribusi normal. Kedua, uji Kolmogorov-Smirnov (K-S)
yang dilakukan menunjukkan bahwa distribusi data tidak secara signifikan berbeda
dari distribusi normal. Ini berarti bahwa data cenderung mengikuti pola distribusi
yang serupa dengan distribusi normal. Oleh karena itu, interpretasi dan kesimpulan
yang diambil dari analisis data tersebut dapat diandalkan, dan hasilnya dapat
digunakan untuk membuat prediksi atau mengambil keputusan yang lebih lanjut.

Berdasarkan gambar 2.2, grafik diagram pencar yang menunjukkan fungsi


kepekatan peluang dengan nilai 1 untuk semua 150 data acak dari pembangkitan
data acak sebaran uniform menunjukkan bahwa peluang atau probabilitas memiliki
nilai konstan 1, yang mengindikasikan bahwa setiap titik data memiliki probabilitas
seratus persen untuk terjadi. Artinya, setiap titik data dalam sampel memiliki
kejadian yang pasti atau terjamin dalam distribusi data acak ini. Dan berdasarkan
grafik pada gambar 2.3 menunjukkan bahwa data acak tersebut tampaknya merata
terdistribusi di seluruh rentang antara 0 dan 1, sehingga menciptakan sebuah
sebaran kumulatif yang secara konstan meningkat seiring pertambahan jumlah data.
Ini mengindikasikan bahwa probabilitas atau peluang mengamati data di bawah
nilai tertentu di dalam rentang ini meningkat secara linear seiring bertambahnya
data yang diamati.

Pada grafik pada gambar 2.4 sebaran Gamma dengan shape parameter 5 dan
scale parameter 3 data acak sebaran gamma menunjukkan bahwa kebanyakan data
berkumpul di sekitar nilai yang lebih tinggi, tetapi ada beberapa data ekstrem yang
mungkin jauh lebih tinggi dari nilai-nilai pusat. Variabilitas yang besar dalam data
ini dapat dilihat dari sebaran yang luas dalam grafik, menggambarkan perbedaan
yang signifikan antara observasi tertinggi dan terendah dalam distribusi data acak
ini. Selanjutnya, grafik pada gambar 2.5 menunjukkan bahwa semakin tinggi nilai
yang diamati, semakin sedikit data yang mendekati nilai itu. Grafik ini memberikan
gambaran visual tentang bagaimana data terdistribusi dalam distribusi gamma
dengan parameter tertentu, dengan fokus pada akumulasi data di sekitar nilai-nilai
yang lebih rendah.

Anda mungkin juga menyukai