Data yang saya dapatkan diatas telah saya simpan dalam file excel dengan
nama Sarniah_proyek.txt (lihat pada file)
>
penambahan_gula=c(40,40,40,40,40,40,50,50,50,50,50,50,60,6
0,60,60,60,60)
>
penambahan_tepungberas=c(5,5,10,10,15,15,5,5,10,10,15,15,5,
5,10,10,15,15)
>
kadar_air=c(24.36,24.35,28.13,28.15,32.26,32.24,20.34,20.31,2
3.56,23.54,26.92,26.89,16.41,16.39,20.21,20.17,24.23,24.27)
> data_hasil<data.frame(penambahan_gula=c(40,40,40,40,40,40,50,50,50,50,
50,50,60,60,60,60,60,60),penambahan_tepungberas=c(5,5,10,1
0,15,15,5,5,10,10,15,15,5,5,10,10,15,15),kadar_air=c(24.36,24.3
5,28.13,28.15,32.26,32.24,20.34,20.31,23.56,23.54,26.92,26.89,
16.41,16.39,20.21,20.17,24.23,24.27))
Hasilnya:
Nilai rata-rata
Setelah kita hasil seperti itu, maka kita carilah nilai rata-rata dari datanya.
Nilai Rata-rata untuk semua data
Sintaks beserta hasilnya :
3. Berapa nilai korelasi antara variabel dari data yang saudara dapatkan?
Setelah mencari nilai rata-ratanya, kita akan mencari nilai korelasinya, cara untuk
mencari nilai korelasinya, yaitu:
Sintaks:
> cor(data_hasil)
Dan hasilnya :
> data_sarniah<-lm(kadar_air~penambahan_gula+penambahan_tepungberas,data=data_hasil)
> data_sarniah
Hasilnya:
Hasilnya:
Setelah kita cari summarynya, kita akan analisis hasilnya, berikut analisisnya:
Analisis:
Bagian pertama dari hasil analisis dengan fungsi summary ini adalah ringkasan
lima angka (five number summary) dari residu, yaitu nilai minimum, kuartil pertama,
median, kuartil ketiga, dan nilai maximum. Tampilan ini menunjukan adanya
penyebaran residu yang mendekati normal. Pada bagian kedua ditampilkan nilai
estimasi dari intercept dan koefisien dari kedua variabel penambahan_gula (X1) dan
penambahan_tepungberas (X2) disertai dengan standard error, nilai statistik t (tvalue) dan Pr(>|t|) masing-masing. Dari tampilan ini dapat juga dilihat bahwa
persamaan regressi liniernya adalah :
Y =36.519720.39842 X 1+ 0.74417 X 2
Dari nilai statistik t, dan nilai Pr(>|t|) dari koefisien regressi X1 Pr(>|t|) = 5.25e-15 <
0.05, yang berarti koefisien regressi X1 bersifat nyata, sedangkan koefisien regressi
X2 mempunyai Pr(>|t|) = 1.44e-14 < 0.05 (taraf tidak nyata), ini berarti penambahan
tepung beras (X2) tidak berpengaruh nyata terhadap kadar air. Karenanya variabel
ini tidak dikeluarkan dari model regresi linier ganda. Bagian terakhir hasil ini
menunjukkan nilai standard error residu dari model adalah 0.446, nilai R squared
adalah 0.9917 yang artinya 99.17 % keragaman nilai kadar air ditentukan oleh
besarnya nilai penambahan gula (X1) dan nilai penambahan tepung beras ketan (X2)
dalam suatu penelitian itu, selebihnya 0.83% itu ditentukan oleh factor lain. Statistic
F= 896.5 lebih besar dari F0.05(2,16)=3.63 dengan peluang (p-value=2.463e-16) lebih
kecil dari taraf nyata 0.05. Dengan demikian dapat disimpulkan bahwa hubungan
antara variabel X1 dan X2 dengan nilai kadar air dalam persamaan Y=36.519720.39842X1 + 0.74417X2 bersifat tidak nyata.
c. Buatlah plot residu dengan variabel terkait dan analisislah
Setelah itu kita akan memplot nilai residu dengan variabel terkait serta akan dianalisis
hasil dari plot yang dihasilkan, namun sebelum itu, terlebih dahulu kita cari nilai
residunya, caranya yaitu:
Sintaks:
> nilai.residu<residuals(data_sarniah)
> nilai.residu
Hasilnya:
Hasilnya:
Sintaks:
> s<-summary(data_sarniah)$sigma
> h<-lm.influence(nilai.fit)$hat
> nilai.residu<-nilai.residu/(s*sqrt(1-h))
> nilai.residu
Hasilnya:
> par(mfrow=c(2,1))
Lalu
akan dilanjutkan dengan memplot nilai residu tersebut, yaitu:
>
Sintaks:
plot(data_hasil[,"penambahan_gula"],nilai.residu,xlab="Penam
bahan_gula(X1)",ylab="Residual Baku")
> abline(h=0,lty=2)
> title("Residu Baku Vs Penambahan gula (X1)")
>
plot(data_hasil[,"penambahan_tepungberas"],nilai.residu,xlab
="Penambahan tepung beras (X2)",ylab="Residual Baku")
> abline(h=0,lty=2)
> title("Residu Baku Vs Penambahan tepung beras (X2)")
Hasilnya:
1
-3
Residual Baku
40
45
50
55
60
Penambahan_gula(X1)
1
-3
Residual Baku
10
12
14
Analisis:
Plot residu baik dengan variabel Penambahan gula (X1), penambahan tepung
beras (X2) maupun kadar air (Y) diatas menunjukkan tidak adanya masalah yang
mendasar dari model, hal ini ditunjukkan dengan tidak adanya kenaikan/penurunan
variance maupun hubungan curvilinier antara residu dengan ketiga variabel terikat.
d. Buatlah plot residu dengan dengan nilai estimasi
Selanjutnya, kita akan memplot hasil nilai residu dengan nilai estimasinya,
berikut sintaks dan hasilnya:
Sintaks:
par(mfrow=c(1,1))
plot(nilai.prd,nilai.residu,xlab="Nilai Estimasi",ylab="Residu Baku")
abline(h=0,lty=2)
title("residu Baku Vs Nilai Estimasi")
0
-1
-2
-3
Residu Baku
20
25
30
Nilai Estimasi
>
>
>
>
Hasilnya:
Sintaksnya:
> par(mfrow=c(1,1))
> qqnorm(nilai.residu,ylab="Residu Baku")
Hasilnya:
0
-1
-2
-3
Residu Baku
-2
-1
Theoretical Quantiles
4
3
2
0
Frequency
Histogram of data_hasil$penambahan_gula
40
45
50
55
60
data_hasil$penambahan_gula
4
3
2
1
0
10
12
data_hasil$penambahan_tepungberas
> hist(data_hasil$kadar_air,col="green")
Frequency
Histogram of data_hasil$penambahan_tepungberas
Hasilnya:
14
16
2
0
Frequency
Histogram of data_hasil$kadar_air
20
25
30
data_hasil$kadar_air
g. Buatlah ukuran letak untuk semua variabel dari data yang saudara dapatkan
Setelah kita peroleh hasil histogramnya, maka kita akan lanjut dengan mencari
nilai ukuran letak untuk semua variabel dari data tersebut. Berikut sintaks serta
hasilnya:
Ukuran tata letak untuk variabel X1 (penambahan gula)
Sintaks dan hasilnya:
Y =36.519720.39842 X 1+ 0.74417 X 2
dimana sesungguhnya variabel X2 berpengaruh nyata secara statistik, karena variabel
ini tidak dapat dikeluarkan dari model. Namun persamaan di atas setelah dianalisis
akan memberikan kekurang tepatan hasil peramalan..