Anda di halaman 1dari 3

Tania Theodora / 163012100015

Soal:
Gunakan R / python / Minitab untuk membuat model matematis pengaruh dari
berbagai faktor terhadap insurance charge. Berapakah nilai R square yang bisa anda
dapatkan dan ujilah prediktor manakah yang berpengaruh

Jawab:
Berdasarkan data yang diperoleh, dilakuakn perhitungan yang diperoleh dengan
menggunakan R Studio. Perhitungan dimulai dengan menguji coba single variables terlebih
dahulu, lalu mengkombinasikan beberapa variabel. Berikut merupakan tabel rangkum an
hasil uji coba:
Dependent
No Independent variable (s) R-Squared Koefisien Signifikan
variable
1 Region Charges 0.0000385
2 Sex Charges 0.003282 *
3 Children Charges 0.004624 *
4 BMI Charges 0.03934 ***
5 Age Charges 0.08941 ***
6 Age, Children Charges 0.09247 Age ***, Children *
7 Age, Sex Charges 0.09344 Age ***, Sex *
8 Age, BMI Charges 0.1172 Age ***, BMI ***
9 Smoker Charges 0.6198 ***
Age ***, Smoker ***, BMI
10 Age, Smoker, BMI Charges 0.7475
***
Age, Sex, BMI, Smoker, Age ***, BMI ***, Smoker
11 Charges 0.7487
Region ***, Sex, Region*
Age, Sex, BMI,
Age ***, BMI ***, Smoker
12 Smoker, Children, Charges 0.7507
***, Sex, Region*, Children
Region
*Asumsi yang digunakan:
Sex >> Male = 1, Female = 0
Smoker >> Yes = 1, No = 0
Region >> Southwest = 1, Southeast = 2, Northwest = 3, Northeast = 4

Analisis hasil:
1) Tabel diurutkan berdasarkan independent variable yang mempunyai nilai R-squared
terkecil atau paling tidak berpengaruh terhadap charges.
2) Tanda bintang (*) menunjukkan untuk mengidentifiksi koefisien prediktor yang
signifikan. Dalam hal ini, semakin banyak jumlah bintang (*) menandakan semakin
signifikannya pengaruh koefisien tersebut.
Tania Theodora / 163012100015

3) Variabel independen yang paling tidak berpengaruh terhadap charges adalah region,
dengan nilai R-squared sebesar 0,0000385. Jadi, daerah tidak menjadi tolak ukur yang
signifikan untuk menentukan kenaikan / penurunan nominal premi asuransi.
4) Variabel age dengan nilai R-squared sebesar 0.08941 dengan plot yang dapat dilihat
pada gambar di bawah. Hal ini menunjukkan bawah usia memiliki pengaruh sebesar
8,941% dalam menentukan jumlah premi. Dari hasil plot dapat diketahui bahwa
semakin tingginya usia berbanding lurus dengan semakin tingginya charges.

5) Variabel independen tunggal yang memiliki pengaruh tertinggi ada smoker, dengan
nilai R-squared sebesar 0,6198. Perokok / tidak perokok memiliki pengaruh hampir
62% terhadap charges. Seorang perokok akan lebih beresiko terkena penyakit, sehingga
nilai premi cenderung lebih tinggi.
6) Pada nomor 11-13, terlihat bahwa penggabungan beberapa variabel menunjukkan hasil
yang berbeda tipis pada nilai R-squared-nya. Penambahan variabel children dan region
memiliki pengaruh yang tidak terlalu signifikan terhadap charges. Jadi, variabel yang
menghasilkan nilai R-squared terbesar (0,7507) adalah gabungan variabel age, sex,
BMI, smoker, children, dan region.
Tania Theodora / 163012100015

Contoh perhitungan persamaan regresi jika Male Smoker living in Southwest:

smoker(yes) = 1, sex(male = 1), region (southwest = 1)

Charge = -13230,01 (1) + 257,29 age + 332,57 BMI + 479,37 children + 23820,43 (1) –
131.11 (1) + 353,64 region
Charge = 224839,3 + + 257,29 age + 332,57 BMI + 479,37 children + 353,64 region

Kesimpulan:
Jadi, variabel prekdiktor yang dengan nilai R-squared sebesar 0,7507 atau memiliki pengaruh
75% terhadap charges adalah gabungan variabel age, sex, BMI, smoker, children, dan region

Anda mungkin juga menyukai