Anda di halaman 1dari 10

MAKALAH PRAKTIKUM STATISTIKA KOMPUTASI

“Disusun untuk memenuhi penilaian modul 6-7 praktikum Statistika komputasi”

DOSEN :

YUDIANTRI ASDI, M.Sc

ASISTEN PEMERIKSA :

RABIATUL HIDAYAH PUTRI

DISUSUN OLEH :

NAMA : Alya Ramadhani

NIM : 2210433031

SHIFT : II (dua)

HARI, TANGGAL PRAKTIKUM : Kamis, 16 November 2023

WAKTU PRAKTIKUM : 16.15 - 17.55 WIB

LABORATORIUM KOMPUTASI MATEMATIKA DAN SAINS DATA

DEPARTEMEN MATEMATIKA DAN SAINS DATA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS ANDALAS

2023
BAB I
PENDAHULUAN

1.1 Latar Belakang


Makalah ini mengangkat kasus yang berkaitan dengan analisis
banyaknya suatu brand berdasarkan biaya iklan. Pembahasan ini penting
karena promosi dan iklan merupakan faktor penting dalam memperkenalkan
dan mempromosikan suatu brand kepada konsumen. Tanpa adanya promosi
yang efektif, suatu brand mungkin tidak akan dikenal oleh masyarakat luas.
Dalam kasus ini, data yang diberikan mencakup informasi tentang biaya
iklan yang dikeluarkan dan banyaknya penjualan yang dihasilkan dari iklan
tersebut. Dengan menggunakan aplikasi RStudio, metode statistika
deskriptif, regresi linear, dan analisis sisaan vs nilai dugaan, kita dapat
menganalisis hubungan antara biaya iklan dan banyaknya penjualan seperti
rata-rata banyaknya penjualan, sebaran data, dan dapat memvisualisasikan
data yang tersedia dalam bentuk grafik atau plot. Selain itu, analisis sisaan
vs nilai dugaan akan membantu kita mengevaluasi sejauh mana model
regresi linear yang digunakan cocok dengan data yang ada. Dengan melihat
sisaan (residuals) dan nilai dugaan (predicted values), kita dapat
menentukan apakah model regresi linear yang digunakan memberikan
estimasi yang akurat atau tidak. Hasil analisis ini dapat memberikan
wawasan berharga bagi perusahaan dalam merencanakan strategi promosi
dan iklan yang efektif untuk meningkatkan penjualan brand mereka.

1.2 Rumusan Masalah


Rumusan masalah dari kasus ini adalah sebagai berikut :
1. Bagaimana statistika deskriptif/distribusi data dari biaya iklan dan
banyaknya penjualan?
2. Bagaimana hubungan antara biaya iklan terhadap banyaknya penjualan
dengan membandingkannya secara visual?
3. Bagaimana nilai regresi dan sisaan (residual) vs nilai dugaannya dari
data yang telah diperoleh?

1.3 Tujuan Penulisan


Tujuan dari penulisan makalah ini adalah sebagai berikut :
1. Mengetahui statistika deskriptif dari biaya iklan dan banyaknya
penjualan.
2. Mengidentifikasi hubungan antara biaya iklan terhadap banyaknya
penjualan secara visual.
3. Mengetahui nilai regresi dan sisaan (residual) vs nilai dugaannya dari
data yang telah diperoleh untuk menunjukkan hubungan antara
variabelnya.
BAB II
HASIL DAN PEMBAHASAN

Tabel 2.1 Banyaknya Penjualan Suatu Brand Berdasarkan Biaya Iklan


Biaya Banyak
Iklan Penjualan
1 3
2 4
3 8
4 4
5 8
6 12
7 20
8 23
9 20
10 26
11 35
12 40
13 45
14 54
15 49
16 59
17 60
18 62
19 63
20 68
21 72
22 70
23 78
24 80
25 75
26 82
27 90
28 83
29 88
30 96
2.1 Statistika deskriptif dari biaya iklan dan banyaknya penjualan
2.1.1 Rumus Analitik
 Rata-rata (Mean)
∑𝑛𝑖=1 𝑋𝑖 𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋𝑛
̅
𝑋= =
𝑛 𝑛
Keterangan :
𝑋̅ ∶ 𝑛𝑖𝑙𝑎𝑖 𝑟𝑎𝑡𝑎 − 𝑟𝑎𝑡𝑎
𝑋𝑖 ∶ 𝑛𝑖𝑙𝑎𝑖 𝑑𝑎𝑡𝑎 𝑘𝑒 − 𝑖
𝑛 ∶ 𝑏𝑎𝑛𝑦𝑎𝑘 𝑑𝑎𝑡𝑎
 Kuartil Data Tunggal
𝑖(𝑛 + 1)
𝑄𝑖 = 𝑁𝑖𝑙𝑎𝑖 𝐷𝑎𝑡𝑎 𝑘𝑒
4
Keterangan :
𝑄𝑖 = 𝑘𝑢𝑎𝑟𝑡𝑖𝑙 𝑘𝑒 − 𝑖
𝑛 = 𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑑𝑎𝑡𝑎 𝑝𝑒𝑛𝑔𝑎𝑚𝑎𝑡𝑎𝑛
𝑖 = 1, 2, 3

(a) Biaya Iklan


 Rata-rata
∑𝑛𝑖=1 𝑋𝑖 1 + 2 + 3 + 4 … + 30 465
𝑋̅ = = =
30 30 30

𝑋̅ = 15,50
1
 Kuartil Pertama 𝑄1 = 𝑁𝑖𝑙𝑎𝑖 𝐷𝑎𝑡𝑎 𝑘𝑒 4 (30 + 1) = 8,25
1
 Kuartil Kedua 𝑄2 = 𝑁𝑖𝑙𝑎𝑖 𝐷𝑎𝑡𝑎 𝑘𝑒 2 (30 + 1) = 15,50
3
 Kuartil Ketiga 𝑄3 = 𝑁𝑖𝑙𝑎 𝐷𝑎𝑡𝑎 𝑘𝑒 4 (30 + 1) = 22,75
 Max : 30
 Min : 1

(b) Banyak Penjualan


 Rata-rata
∑𝑛𝑖=1 𝑋𝑖 3 + 8 + 4 + 8 … + 96 1476,9
𝑋̅ = = =
30 30 30

𝑋̅ = 49,23
1
 Kuartil Pertama 𝑄1 = 𝑁𝑖𝑙𝑎𝑖 𝐷𝑎𝑡𝑎 𝑘𝑒 4 (30 + 1) = 20,75
1
 Kuartil Kedua 𝑄2 = 𝑁𝑖𝑙𝑎𝑖 𝐷𝑎𝑡𝑎 𝑘𝑒 2 (30 + 1) = 56,50
3
 Kuartil Ketiga 𝑄3 = 𝑁𝑖𝑙𝑎 𝐷𝑎𝑡𝑎 𝑘𝑒 4 (30 + 1) = 74,25
 Max : 96
 Min : 3
2.1.2 Bahasa Program
> x<-scan()
1: 1
2: 2
3: 3
4: 4
5: 5
6: 6
7: 7
8: 8
9: 9
10: 10
11: 11
12: 12
13: 13
14: 14
15: 15
16: 16
17: 17
18: 18
19: 19
20: 20
21: 21
22: 22
23: 23
24: 24
25: 25
26: 26
27: 27
28: 28
29: 29
30: 30
31:
Read 30 items
> y<-scan()
1: 3
2: 4
3: 8
4: 4
5: 8
6: 12
7: 20
8: 23
9: 20
10: 26
11: 35
12: 40
13: 45
14: 54
15: 49
16: 59
17: 60
18: 62
19: 63
20: 68
21: 72
22: 70
23: 78
24: 80
25: 75
26: 82
27: 90
28: 83
29: 88
30: 96
31:
Read 30 items
> summary(x,y)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.00 8.25 15.50 15.50 22.75 30.00
> summary(y,x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
3.00 20.75 56.50 49.23 74.25 96.00

2.1.3 Interpretasi
Penggunaan sintaks “summary()” yaitu untuk menampilkan
statistika deskriptif dari suatu variabel atau data dan memberikan
gambaran ringkas tentang distribusi data, seperti nilai minimum yaitu
nilai terendah, kuartil 1 yaitu 25% data terendah berada di bawah nilai
ini, median yaitu nilai tengah dari data tersebut, mean yaitu rata-rata dari
penjumlahan total data dibagi banyak data, kuartil 3 yaitu 75% data
terendah berada di bawah nilai ini, dan nilai maksimum yaitu nilai
tertinggi dari data tersebut.

2.2 Menampilkan 4 grafik/plot dan bandingkan antara satu dan lainnya serta
membuat interpretasinya
2.2.1 Diagram Pencar
> plot(x,y,xlab="Biaya Iklan",ylab="Banyak Penjualan"
,main="Banyak Penjualan Suatu Brand Berdasarkan Biaya
Iklan",col="Maroon")

Gambar 2.1 Grafik Diagram Pencar

2.2.2 Diagram Kotak Garis


>boxplot(y,ylab="Banyak Penjualan",main="Banyak Penju
alan Suatu Brand Berdasarkan Biaya Iklan",col="Pink")

Gambar 2.2 Grafik Diagram Kotak Garis


2.2.3 Histogram
> hist(y,xlab="Banyak Penjualan",main="Banyak Penjual
an Suatu Brand Berdasarkan Biaya Iklan",col="Purple")

Gambar 2.3 Grafik Histogram

2.2.4 Diagram Lingkaran


>pie(x,y,main="Banyak Penjualan Suatu Brand Berdasark
an Biaya Iklan")

Gambar 2.4 Grafik Diagram Lingkaran

2.2.5 Interpretasi
Secara umum, pemahaman grafik tergantung pada kebiasaan
dan pengalaman individu. Namun, diagram kotak garis dan
histogram sering dianggap lebih mudah dipahami karena
memberikan informasi yang lebih rinci tentang distribusi data.
Diagram pencar juga mudah dipahami karena dapat menunjukkan
hubungan antara variabel. Sementara itu, pemahaman diagram
lingkaran dapat bervariasi tergantung pada kompleksitas data yang
diwakili oleh proporsi kategori.

2.3 Menghitung nilai regresi dari data, menambahkan garis regresi, serta
menghitung dan memplotkan sisaan (residual) vs nilai dugaannya lalu
membuat interpretasinya
2.3.1 Analitik
 𝑌 = 𝑎 + 𝑏𝑋
(∑ 𝑌𝑖 )(∑ 𝑋𝑖 2 )−(∑ 𝑋𝑖 )(∑ 𝑋𝑖 𝑌𝑖 )
 𝑎= 𝑛 ∑ 𝑋𝑖 −(∑ 𝑋𝑖 )2
𝑛 ∑ 𝑋𝑖 𝑌𝑖 −(∑ 𝑋𝑖 )(∑ 𝑌𝑖 )
 𝑏= 𝑛 ∑ 𝑋𝑖 −(∑ 𝑋𝑖 )2
 𝑌𝑡 = −𝑏𝑥 − 𝑎
 𝑒 = 𝑌 − 𝑌𝑡

2.3.2 Bahasa Program


> a=(length(x)*sum(x*y)-sum(x)*sum(y))/(length(x)*sum(x
^2)-(sum(x))^2)
> b=(sum(y)*sum(x^2)-sum(x)*sum(x*y))/(length(x)*sum(x^
2)-(sum(x))^2)
> xx=seq(0,90,by=0.01)
> yy=a*xx+b
> line(xx,yy)

Call:
line(xx, yy)

Coefficients:
[1] -2.977 3.368

> lines(xx,yy)

Gambar 2.5 Grafik Garis Regresi Penjualan Brand


Berdasarkan Biaya Iklan
> yt = -b*x*a
> e=y-yt
> plot(e,yt,xlab="Sisaan/Residual (e)",ylab="Nilai Duga
an (Yt)",main="Sisaan (Residual) VS Nilai Dugaan",col="
Blue")
Gambar 2.6 Grafik Residual vs Nilai Dugaan

2.2.6 Interpretasi
Perolehan nilai dan grafik garis regresi dengan garis lurus
menaik ke atas kanan menunjukkan hubungan positif antara dua
variabel. Ini berarti bahwa ketika nilai satu variabel meningkat, nilai
variabel lainnya juga cenderung meningkat. Grafik garis regresi
yang menaik ke atas kanan menunjukkan bahwa ada kecenderungan
linier antara kedua variabel tersebut. Grafik sisaan (residual) vs nilai
dugaan yang terlihat sebaliknya, yaitu garisnya lurus dari atas
menurun ke bawah kanan, menunjukkan adanya pola yang tidak
terjelaskan oleh model regresi. Ini berarti bahwa ada variasi yang
tidak dapat dijelaskan oleh hubungan linier antara variabel tersebut.
Grafik ini dapat mengindikasikan adanya pola non-linier atau
adanya variabel lain yang mempengaruhi hubungan antara dua
variabel tersebut.
BAB III
KESIMPULAN

Pada pembahasan makalah kali ini, kita ingin memahami bagaimana


hubungan biaya iklan terhadap banyak penjualan pada sebuah brand. Banyak
penjualan memiliki rentang nilai yang cukup luas, mulai dari 3 hingga 96. Median
yang berada di tengah-tengah data menunjukkan bahwa setengah dari banyak
penjualan berada di atas 56,50. Biaya iklan juga memiliki rentang nilai yang cukup
luas, mulai dari 1 hingga 30. Median yang berada di tengah-tengah data
menunjukkan bahwa setengah dari biaya iklan berada di atas 15,50. Rata-rata
banyak penjualan adalah 49,23, sedangkan rata-rata biaya iklan adalah 15,50. Hal
ini menunjukkan bahwa secara keseluruhan, banyak penjualan cenderung lebih
tinggi daripada biaya iklan.

Berdasarkan grafik-grafik yang ditunjukkan pada gambar di atas dapat


disimpulkan bahwa diagram pencar menunjukkan hubungan antara biaya iklan dan
banyak penjualan. Terlihat bahwa ada kecenderungan positif antara kedua variabel
tersebut, di mana semakin tinggi biaya iklan, banyak penjualan juga cenderung
meningkat. Namun, terdapat juga variasi yang tidak dapat dijelaskan oleh hubungan
linier antara kedua variabel tersebut. Untuk grafik diagram kotak garis
menunjukkan distribusi data banyak penjualan dan biaya iklan. Rentang interkuartil
(IQR) untuk banyak penjualan adalah sekitar 53,5, sedangkan IQR untuk biaya
iklan adalah sekitar 14,5. Terdapat beberapa pencilan (outlier) pada kedua variabel
tersebut. Grafik histogram menunjukkan distribusi frekuensi banyak penjualan dan
biaya iklan. Terlihat bahwa banyak penjualan cenderung terkonsentrasi di sekitar
nilai median, dengan sedikit variasi di kedua sisi. Sedangkan biaya iklan memiliki
distribusi yang lebih merata, dengan frekuensi yang hampir seragam di setiap
interval. Dan grafik diagram lingkaran menunjukkan persentase banyak penjualan
berdasarkan biaya iklan. Terlihat bahwa sebagian besar banyak penjualan (lebih
dari setengahnya) terjadi pada biaya iklan yang lebih tinggi, sedangkan persentase
banyak penjualan pada biaya iklan yang lebih rendah relatif lebih kecil.

Interpretasi dari grafik sisaan yang menunjukkan garis lurus dari atas
menurun ke bawah kanan adalah bahwa model regresi tidak mampu menjelaskan
variasi yang ada. Hal ini menunjukkan bahwa ada faktor-faktor lain yang
mempengaruhi hubungan antara variabel tersebut dan model regresi yang
digunakan tidak cukup untuk menggambarkan hubungan yang sebenarnya. Dalam
hal ini, perlu dilakukan analisis lebih lanjut untuk memahami faktor-faktor lain
yang mempengaruhi hubungan antara variabel tersebut. Mungkin diperlukan model
regresi yang lebih kompleks atau penambahan variabel lain untuk menjelaskan
variasi yang tidak terjelaskan oleh model regresi awal.

Anda mungkin juga menyukai