Nina Haryati - M0107040 PDF
Nina Haryati - M0107040 PDF
perpustakaan.uns.ac.id digilib.uns.ac.id
oleh
NINA HARYATI
M0107040
SKRIPSI
ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar
commit to user
i
SKRIPSI
ANALISIS T'AKTOR-FAKTOR YANG MEMPENGARUI{I
BERAT BADAI\I BAYI SAAT LAHIR DI KOTA ST]RAKARTA
MENGGUNAKAI\I METODE POHON REGRESI
yang disiapkan dan disusun oleh
NINA HARYATI
M0107040
perpustakaan.uns.ac.id digilib.uns.ac.id
dibimbing oleh
Pembimbing I,
fi
(/Jt^h
Winita Sulandari" M.Si
NIP. 19780814 200501 2 aaz NIP.
an Matematika
Di Surakarta, kita masih sering menjumpai bayi lahir dengan Berat Badan
Lahir Rendah (BBLR). Beberapa faktor yang mempengaruhi
perpustakaan.uns.ac.id digilib.uns.ac.idberat badan bayi saat
lahir adalah usia ibu hamil, jarak kehamilan, jumlah anak yang dilahirkan,
kenaikan berat badan ibu, penyakit saat kehamilan, kadar hemoglobin, frekuensi
pemeriksaan kehamilan, status pekerjaan ibu dan pendidikan ibu. Dalam
penelitian ini, kami membahas tentang pola hubungan antara variabel prediktor
dan variabel respon menggunakan metode pohon regresi. Metode ini dipilih
karena berat badan bayi saat lahir sebagai variabel respon bertipe kontinu
sedangkan faktor-faktor yang berpengaruh terhadap berat badan bayi saat lahir
sebagai variabel prediktor bertipe kategorik maupun kontinu.
Data secara random dibagi menjadi 2 bagian yaitu data pelatihan dan data uji
dengan proporsi data pelatihan sebesar 90% dan data uji sebesar 10%. Proses ini
diulang sebanyak 10 kali sehingga diperoleh 10 kelompok data percobaan.
Masing-masing kelompok data digunakan untuk membentuk pohon regresi.
Langkah pertama adalah penumbuhan pohon menggunakan data pelatihan.
Langkah kedua adalah proses pemberhentian pembentukan pohon. Langkah ketiga
adalah proses pemangkasan pohon. Langkah keempat adalah proses pemilihan
pohon regresi optimal menggunakan data uji. Langkah terakhir adalah pemilihan
pohon regresi optimal dari 10 kelompok data percobaan.
Berdasarkan pohon regresi optimal, terbentuk pola hubungan antara tiga
variabel prediktor terhadap berat badan bayi saat lahir. Adapun tiga variabel yang
membentuk pola hubungan adalah variabel usia ibu hamil, kenaikan berat badan
ibu, dan status pekerjaan ibu.
commit to user
iii
ABSTRACT
In Surakarta, we still often see babies born with Low Birth Weight (LBW).
Several factorsperpustakaan.uns.ac.id
that affect the newborn weight are maternal age, pregnancy
digilib.uns.ac.id
spacing, number of children born, maternal weight gain, illness during pregnancy,
hemoglobin level, frequency of prenatal care, maternal employment status and
maternal education. In this research, we discussed about patterns of relationships
between predictor and response variables using regression tree method. This
method was chosen because the newborn weight as response variable is
continuous and the factors that affect newborn weight as predictor variables are
categorical or continuous.
Data were randomly divided into two parts, namely training data and test
data with the proportion of 90% training data and test data by 10%. This process
was repeated 10 times to get 10 data sets. Each data sets is used to perform
regression tree. The first step is tree growing process using training data. The
second step is stopping the tree building process. The third step is pruning the
tree. The fourth step is selection of optimal regression tree using the test data. The
final step is the selection of optimal regression tree of 10 data sets.
Based on optimal regression tree we can find the relationship pattern
between three predictor variables and newborn weight. The three variables are
maternal age, maternal weight gain, and employment status mother.
commit to user
iv
MOTO
perpustakaan.uns.ac.id digilib.uns.ac.id
“Dan segala sesuatu telah Kami terangkan dengan jelas”
(Q.S. Al-Israa’: 12)
commit to user
v
PERSEMBAHAN
“Bapak, Ibu, Kakak dan Adik yang telah memberikan amanah, harapan dan
kepercayaan untuk mewujudkan cita-citaku.
Senyum dan kebahagiaan kalian adalah semangat hidupku”
commit to user
vi
KATA PENGANTAR
Segala puji bagi Allah atas limpahan rahmat, hidayah serta nikmat
kesehatan jasmani dan rohani sehingga penulis dapat menyelesaikan skripsi ini.
Keberhasilan penulisan skripsi ini tidak lepas dari bimbingan, kerjasama, serta
bantuan dari berbagai pihak sehingga dalam kesempatan ini penulis mengucapkan
perpustakaan.uns.ac.id digilib.uns.ac.id
Penulis
vii
DAFTAR ISI
viii
c. Pemberhentian Pemilahan Pohon .......................... 15
d. Pemangkasan Pohon Regresi ................................. 15
e. Penentuan Ukuran Pohon Regresi Optimal ........... 18
f. Penduga Kesalahan Standar................................... 18
2.2 Kerangka Pemikiran .............................................................. 23
BAB III METODE PENELITIAN ............................................................ 24
3.1 Sumber Data ..........................................................................
perpustakaan.uns.ac.id digilib.uns.ac.id 24
3.2 Analisis Data ......................................................................... 25
BAB IV HASIL DAN PEMBAHASAN ................................................... 27
4.1 Statistik Deskriptif ................................................................ 27
4.2 Analisis Pohon Regresi ......................................................... 31
4.2.1 Pembentukan Pohon Regresi Maksimal....................... 31
4.2.2 Pemangkasan Pohon Regresi Maksimal ...................... 37
4.2.3 Pohon Regresi Optimal ................................................ 40
4.2.4 Pemilihan Pohon Regresi dari Kelompok Data
Percobaan ..................................................................... 48
BAB V PENUTUP ................................................................................... 49
5.1 Kesimpulan ........................................................................... 49
5.2 Saran ...................................................................................... 50
DAFTAR PUSTAKA ...................................................................................... 51
LAMPIRAN ..................................................................................................... 53
commit to user
ix
DAFTAR TABEL
Tabel 3.1 Variabel Prediktor dari Berat Badan Bayi Saat Lahir ................. 21
Tabel 4.1 Statistik Deskriptif Berat Badan Bayi Saat Lahir, Umur Ibu
Hamil dan Kenaikan Berat Badan Ibu…. ................................... 24
Tabel 4.2 Selisih Jumlah Kuadrat Deviasi dari Semua Kemungkinan
Pemilahan ....................................................................................
perpustakaan.uns.ac.id digilib.uns.ac.id 30
Tabel 4.3 Data Berat Badan Bayi pada Simpul Terminal ........................... 34
Tabel 4.4 Selisih Jumlah Kuadrat Deviasi pada Proses Pemangkasan
Pertama ....................................................................................... 36
Tabel 4.5 Data Uji ...................................................................................... 37
Tabel 4.6 Nilai Kesalahan Relatif Penduga Sampel Uji ............................. 38
Tabel 4.7 Perhitungan ........................................................................... 39
Tabel 4.8 Perhitungan ........................................................................... 40
Tabel 4.9 Pohon Regresi dari Kelompok Data Percobaan .......................... 43
commit to user
x
DAFTAR GAMBAR
commit to user
xi
DAFTAR NOTASI
: variabel prediktor
: variabel respon
: ruang pengukuran variabel prediktor
: ruang pengukuran variabel respon
: simpul
perpustakaan.uns.ac.id digilib.uns.ac.id
: jumlah data
: penduga respon
: data pelatihan
: jumlah data uji
: harapan kuadrat kesalahan
: harapan kuadrat kesalahan relatif
: variansi dari dan harapan kuadrat kesalahan menggunakan
nilai
: kesalahan penduga sampel uji
: kesalahan relatif penduga sampel uji
: pohon (biner)
: cabang dari dengan simpul akar
: pohon maksimal
: jumlah kuadrat deviasi dan penduga pengganti pada simpul
: jumlah kuadrat pohon regresi dan penduga pengganti dari
: pemilah commit to user
xii
11
BAB I
PENDAHULUAN
1
2
Soni (2010) CART menghasilkan pohon klasifikasi jika variabel respon yang dimiliki
bertipe kategorik sedangkan jika variabel respon yang dimiliki bertipe kontinu maka
CART akan menghasilkan pohon regresi. Damayanti (2011) melakukan penelitian
tentang aplikasi algoritma CART yaitu metode pohon klasifikasi pada Asuransi
Bumiputera untuk mengklasifikasikan data nasabah. Berdasarkan uraian tersebut,
karena berat badan bayi saat lahir sebagai variabel respon yang bertipe kontinu
sedangkan faktor-faktor yang mempengaruhi berat badan bayi saat lahir sebagai
variabel prediktor mempunyai tipe variabel yang berbeda-beda sehingga peneliti akan
membentuk pohon regresi dari berat badan bayi saat lahir dengan menggunakan
metode pohon regresi untuk mengetahui pola hubungan antara variabel-variabel yang
berpengaruh terhadap berat badan bayi saat lahir di kota Surakarta.
Berdasarkan perumusan masalah maka tujuan dari penelitian ini adalah untuk
mengetahui pola hubungan antara variabel-variabel yang berpengaruh terhadap berat
badan bayi saat lahir di kota Surakarta.
3
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
444
BAB II
LANDASAN TEORI
4
5
2.1.1 Variabel yang berpengaruh terhadap Berat Badan Bayi Saat Lahir
Berat badan bayi saat lahir merupakan hasil interaksi dari berbagai faktor
melalui suatu proses yang berlangsung selama berada dalam kandungan. Menurut
Pudjiadi (Yuliana, 2007) pada umumnya bayi dilahirkan setelah dikandung kurang
lebih 40 minggu dalam rahim ibu. Secara umum berat badan bayi lahir yang normal
adalah antara 3000 sampai 4000 gram, dan bila di bawah atau kurang dari 2500 gram
dikatakan BBLR. perpustakaan.uns.ac.id
Menurut Jaya (2009) dan Siza (2008) terdapat faktor-faktor yang
digilib.uns.ac.id
b. Pendidikan ibu
Pendidikan mempengaruhi kehamilan khususnya terhadap kejadian bayi
dengan berat badan lahir rendah. Hal ini dikaitkan dengan pengetahuan ibu
dalam memelihara kondisi kehamilan serta upaya mendapatkan pelayanan dan
pemeriksaan kesehatan selama kehamilan (Sistiarani, 2008). Seorang ibu
hamil dengan tingkat pendidikan yang lebih tinggi akan lebih mudah meyerap
informasi perpustakaan.uns.ac.id
dan menerapkannya dalam sikap dan perilaku sehari-hari,
digilib.uns.ac.id
X1 ≤ a t1 X1 > a
perpustakaan.uns.ac.id digilib.uns.ac.id
Pemilah 1
t2 t3
X2 > a
X2 ≤ a
Pemilah 2 Pemilah 3
t4 t5 t6 t7
A1 p.7 A4 A5 A7 p.8
A8 A9
A2 A3
t1 t1
t2 t3 x≤a x>a x≤a x>a
perpustakaan.uns.ac.id digilib.uns.ac.id
t2 t3 t2 t3
a x ≤b x>b
t4 t5
t4
b
t2 t5
a
Gambar 2.2. Proses Partisi
Untuk memperjelas proses partisi, akan diberikan contoh pemilahan yaitu pada
Gambar 2.2 terlihat proses partisi simpul dipilah dengan kriteria pemilahan
dan . Pemilahan yang dihasilkan adalah simpul akibat dari kriteria
sedangkan simpul terbentuk akibat kriteria pemilahan . Kemudian proses
partisi berlanjut pada simpul , dengan kriteria pemilahan dan . Simpul
terbentuk karena memenuhi kriteria dan simpul terbentuk karena kriteria
commit to user
pendugaan respon adalah fungsi yang ditentukan pada dan menghasilkan nilai
riil. Jadi, adalah fungsi dari yang bernilai riil
Metode pohon regresi dalam CART merupakan istilah umum dalam
pembentukan penduga respon yang berasal dari data pelatihan . Pembentukan
penduga respon memiliki dua tujuan, yaitu (1) untuk memprediksi variabel respon
secara tepat dan teliti yang berhubungan dengan data yang akan datang (2) untuk
mengetahui hubungan struktural antara variabel respondigilib.uns.ac.id
perpustakaan.uns.ac.id dan variabel prediktor.
Jika terdapat data pelatihan yang terdiri dari objek
digunakan untuk membentuk penduga respon dan terdapat sebanyak data
uji maka ketepatan dapat diukur dengan rata-rata kuadrat
kesalahan (mean squared error), yaitu
dimana adalah penduga respon untuk jika nilai tidak diketahui dan
adalah variansi dari serta merupakan rata-rata kuadrat
kesalahan menggunakan nilai .
Jika rata-rata dan variansi dari data uji masing-masing adalah
perpustakaan.uns.ac.id digilib.uns.ac.id
2. Pada variabel kategorik pemilahan yang terjadi berasal dari semua kemungkinan
pemilahan berdasarkan terbentuknya dua anak gugus yang saling lepas (disjoint).
Jika adalah variabel kategorik nominal dengan kategori, maka akan ada
pemilahan, sedangkan jika adalah variabel kategorik ordinal maka
akan terdapat pemilahan.
Proses pemilahan dilakukan pada tiap simpul dengan cara sebagai berikut.
1. semua kemungkinan pemilahan dicari pada setiap variabel prediktor (Timofeev,
2004),
2. pemilah terbaik dipilih dari masing-masing pemilahan terbaik yang ada. Pemilah
terbaik dihitung berdasarkan selisih jumlah kuadrat deviasi dari masing-masing
simpul dengan simpul pemilahnya. Selisih terbesar akan dijadikan sebagai
pemilah terbaik.
Jumlah kuadrat deviasi digunakan sebagai kriteria kehomogenan pada tiap-tiap
simpul . Jumlah kuadrat deviasi di dalam simpul adalah
individu variabel respon dalam simpul , nilai adalah nilai individu variabel
prediktor yang berada dalam simpul , nilai adalah nilai rata-rata untuk semua
data dalam simpul , dan adalah jumlah data yang berada dalam simpul
(Breiman et al., 1993).
Definisi 2.3. (Breiman et al., 1993) Pemilah
commit to user terbaik dari simpul adalah pemilah
pada yang memaksimumkan jumlah kuadrat pohon regresi .
Setiap pemilah dari menjadi dan maka
yaitu selisih jumlah kuadrat deviasi terbesar yang dijadikan pemilah terbaik dimana
adalah kumpulan pemilah biner, dan masing-masing adalah simpul anak kiri
dan simpul anak kanan.
bergerak dari atas ke bawah (simpul berada di atas simpul ). Pada Gambar 2.3
pohon regresi dan adalah descendan dari tetapi tidak dengan
dan . Begitu pula dengan dan adalah ancestor dari tetapi bukan
ancestor dari (Breiman et al., 1993).
t1
perpustakaan.uns.ac.id digilib.uns.ac.id
t2 t3
t4 t5 t6 t7
t8 t9 t10 t11
0
t2
t4 t5
t8 t9 t10 t11
0
commit to user
t1
t2 t3
t6 t7
Definisi 2.4. (Breiman et al., 1993) Suatu cabang dari dengan simpul akar
terdiri dari simpul itu sendiri dengan semua descendant dari dalam .
Sebagai contoh pada Gambar 2.4 cabang terdiri dari simpul dan descendant
dari yaitu dan .
Definisi 2.5. (Breiman et al., 1993) Pemangkasan sebuah cabang dari pohon
akan menghasilkan semua descendant dari
perpustakaan.uns.ac.id kecualidigilib.uns.ac.id
simpul akarnya ( itu sendiri).
Sebagai contoh pada Gambar 2.5 pohon regresi adalah hasil pemangkasan
dari simpul . Jika pemangkasan terjadi pada simpul maka descendant dari
yaitu dan dipangkas kecuali simpul akarnya yaitu simpul itu
sendiri.
Definisi 2.6. (Breiman et al., 1993) Jika diperoleh dari sebagai hasil dari
pemangkasan suatu cabang, maka disebut pruned subtree dari dan dinotasikan
dengan . Sebagai catatan dan memiliki simpul akar yang sama.
Sebagai contoh gambar pohon regresi menunjukkan pruned subtree.
Proses pemangkasan pohon dimulai dengan mengambil yang merupakan
simpul anak kanan dan yang merupakan simpul anak kiri dari yang
dihasilkan dari simpul induk . Jika diperoleh dua simpul anak dan simpul induk pada
persamaan (2.3) berjumlah 0 atau maka simpul anak dan tersebut
dipangkas. Hasilnya seperti pada persamaan (2.4) yaitu pohon yang memenuhi
kriteria . Inti dari pemangkasan adalah pemotongan hubungan
terlemah (weakest-link cutting) pada pohon regresi (Breiman et al., 1993). Jika pada
commit to user
dimana adalah jumlah data uji, adalah nilai individu variabel prediktor yang
berada dalam data uji, adalah nilai individu variabel respon yang berada dalam
data uji, dan adalah dugaan respon dari pengamatan ke pada pohon ke .
seperti pada persamaan (2.1) dapat dituliskan menggunakan persamaan (2.2) menjadi
perpustakaan.uns.ac.id digilib.uns.ac.id
Pada penduga kesalahan standar, nilai dapat diganti dengan dalam menentukan
kesalahan standar dari . Untuk menentukan kesalahan standar dari
, dianggap adalah tetap dan persamaan (2.6) dapat ditulis dalam bentuk
yaitu
commit to user
20
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
sehingga
21
diketahui bahwa
perpustakaan.uns.ac.id digilib.uns.ac.id
Diketahui bahwa
sehingga
22
diperoleh
perpustakaan.uns.ac.id digilib.uns.ac.id
Diketahui bahwa
commit to user
diperoleh
23
perpustakaan.uns.ac.id digilib.uns.ac.id
Metode penelitian yang digunakan pada penelitian ini adalah studi kasus, yaitu
membentuk pohon regresi dari berat badan bayi saat lahir di kota Surakarta dengan
faktor-faktor yang mempengaruhinya menggunakan metode pohon regresi.
perpustakaan.uns.ac.id digilib.uns.ac.id
24
25
sebanyak 90 data dan data uji sebanyak 10 data. Pemilihan data secara random
dilakukan sebanyak 10 kali sehingga diperoleh 10 kelompok data percobaan
(dataset).
3. Pembentukan pohon regresi dengan algoritma CART pada 10 kelompok data
percobaan menggunakan Software Salford Predictive Miner CART versi 4.0.
dengan tahapan sebagai berikut:
a. Pembentukan pohon regresi dengan aturan
perpustakaan.uns.ac.id pemilahan secara biner
digilib.uns.ac.id
Pada bagian ini dibahas tentang deskripsi variabel penelitian dan pembentukan
pohon regresi dari berat badan bayi saat lahir di kota Surakarta.
4.1
perpustakaan.uns.ac.id Statistik Deskriptif
digilib.uns.ac.id
Statistik deskriptif digunakan untuk melihat homogen atau tidaknya data yang
digunakan sebagai pemilah dalam pembentukan pohon regresi. Data yang digunakan
dalam pembentukan pohon regresi adalah data berat badan bayi saat lahir di kota
Surakarta dan faktor-faktor yang mempengaruhinya. Jumlah data yang digunakan
sebanyak 100 data yang diperoleh dengan menyebarkan kuesioner. Data terdiri dari 9
variabel prediktor dan 1 variabel respon yang terdapat dalam Lampiran 2.
Informasi mengenai gambaran secara umum terhadap berat badan bayi saat
lahir, umur ibu hamil dan kenaikan berat badan ibu dapat dilihat melalui statistik
deskriptif berikut.
Tabel 4.1. Statistik Deskriptif Berat Badan Bayi Saat Lahir, Umur Ibu Hamil, dan
Kenaikan Berat Badan Ibu
Variabel Mean St.Dev Min Max
Berat Badan Bayi saat Lahir 3,021 0,445 2,20 4,30
(dalam kilogram)
commit to user
Usia Ibu Hamil (dalam tahun) 30,190 4,694 23 43
Kenaikan Berat Badan Ibu 11,190 4,141 4 25
(dalam kilogram)
Pada Tabel 4.1. dapat diketahui rata-rata berat badan bayi saat lahir adalah
3,021 kilogram, standar deviasi sebesar 0,445 dengan berat badan bayi paling rendah
adalah 2,20 kilogram dan berat badan bayi paling tinggi adalah 4,30 kilogram. Rata-
rata usia ibu saat hamil adalah 30,190 tahun dengan standar deviasi sebesar 4,694 dan
27
28
usia ibu saat hamil paling rendah adalah 23 tahun serta paling tinggi adalah 43 tahun.
Rata-rata kenaikan berat badan ibu adalah 11,190 kilogram dengan standar deviasi
sebesar 4,141 dan kenaikan berat badan ibu paling rendah adalah 4 kilogram serta
paling tinggi adalah 25 kilogram.
Variabel pendidikan ibu dibedakan menjadi 4 kategori yaitu tamat SMP,
tamat SMA, tamat Perguruan Tinggi dan pendidikan ibu yang tidak termasuk ke
dalam 3 kategori perpustakaan.uns.ac.id
sebelumnya, masuk ke dalam kategori lainnya. Variabel jumlah
digilib.uns.ac.id
(a) (b)
Gambar 4.1. (a) Diagram Batang Pendidikan Ibu
(b) Diagram Batang Jumlah Anak yang Dilahirkan
Pada Gambar 4.1.(a) terlihat bahwa tingkat pendidikan ibu paling banyak
adalah tamat SMA, yaitu ada sebanyakcommit
56to orang.
user
Pendidikan ibu paling sedikit adalah
tamat Perguruan Tinggi dan lainnya, yaitu masing-masing sebesar 13 orang. Pada
Gambar 4.1.(b) terlihat bahwa sebanyak 67 orang mempunyai anak yang dilahirkan
berjumlah 2 anak, sebanyak 23 orang mempunyai anak yang dilahirkan berjumlah 3
anak, sebanyak 8 orang mempunyai anak yang dilahirkan berjumlah 4 anak, dan
sebanyak 2 orang mempunyai anak yang dilahirkan berjumlah 5 anak.
Variabel jarak kehamilan dibedakan menjadi 2 kategori yaitu jarak hamil
kurang dari 2 tahun dan 2 tahun atau lebih. Variabel penyakit ibu saat kehamilan
29
dibedakan menjadi 2 kategori yaitu pernah menderita dan tidak pernah menderita.
Deskripsi variabel jarak kehamilan dan penyakit ibu saat hamil disajikan dengan
diagram lingkaran seperti pada Gambar 4.2.
Pada Gambar 4.2.(a) terlihat bahwa ada sebanyak 73 orang yang memiliki jarak
kehamilan 2 tahun atau lebih dengan persentase sebesar 73% dan sebanyak 27 orang
memiliki jarak kehamilan kurang dari 2 tahun dengan persentase sebesar 27%. Hal ini
berarti sebagian perpustakaan.uns.ac.id
besar ibu memiliki jarak kehamilan yang baik sesuai anjuran
digilib.uns.ac.id
BKKBN. Pada Gambar 4.2.(b) terlihat bahwa sebanyak 94 orang tidak memiliki
penyakit saat kehamilan dengan persentase sebesar 94% dan sebanyak 6 orang
memiliki penyakit saat kehamilan dengan persentase sebesar 6%. Hal ini berarti
sebagian besar ibu tidak memiliki penyakit saat hamil.
ya
6%
2thn
< 2 thn
atau tidak
27%
lebih 94%
73%
(a) (b)
Gambar 4.2. (a) Diagram Lingkaran Jarak Kehamilan
(b) Diagram Lingkaran Penyakit Saat Kehamilan
commit to user
tidak 1 bln
68% 66%
perpustakaan.uns.ac.id digilib.uns.ac.id
(a) (b)
bekerja
38%
tdk
bekerja
62%
(c)
Gambar 4.3. (a) Diagram Lingkaran Ibu Menderita Anemia
(b) Diagram Lingkaran Frekuensi Pemeriksaan Kehamilan
(c) Diagram Lingkaran Status Pekerjaan Ibu
Pada Gambar 4.3.(a) terlihat bahwa ada sebanyak 68 orang tidak menderita
anemia saat hamil dengan persentase sebesar 68% dan sebanyak 32 orang menderita
anemia saat hamil dengan persentase sebesar 32%. Hal ini berarti sebagian besar ibu
memiliki kadar hemoglobin yang cukup selama
commit to user hamil. Pada Gambar 4.3.(b) terlihat
bahwa sebanyak 66 orang memeriksakan kehamilannya setiap satu bulan sekali
dengan persentase sebesar 66%, sebanyak 19 orang memeriksakan kehamilannya
kurang dari satu bulan sekali dengan persentase sebesar 19% dan sebanyak 15 orang
memeriksakan kehamilannya lebih dari satu bulan sekali dengan persentase sebesar
15%. Hal ini berarti sebagian besar ibu memeriksakan kehamilan secara rutin setiap
satu bulan sekali. Pada Gambar 4.3.(c) terlihat bahwa sebanyak 62 orang tidak
bekerja saat hamil dengan persentase sebesar 62% dan sebanyak 38 orang bekerja
31
saat hamil dengan persentase sebesar 38%. Hal ini berarti sebagian besar ibu tidak
bekerja saat hamil.
Berdasarkan deskripsi statistik terlihat bahwa semua data tidak homogen
(heterogen). Dengan demikian, data tersebut dapat digunakan untuk analisis
selanjutnya yaitu pembentukan pohon regresi.
4.2
perpustakaan.uns.ac.id Analisis Pohon Regresi
digilib.uns.ac.id
1. jika pada variabel prediktor kontinu terdapat sebanyak nilai pengamatan yang
berbeda, maka terdapat sebanyak pemilahan yang mungkin dilakukan.
Dalam hal ini, variabel yang bertipe kontinu adalah
a. variabel usia ibu hamil memiliki 19 – 1 = 18 kemungkinan pemilahan
b. variabel kenaikan berat badan ibu ( ) memiliki 16 – 1 = 15 kemungkinan
pemilahan
2. jika pada variabel prediktor kategorik ordinal terdapat
perpustakaan.uns.ac.id digilib.uns.ac.idkategori, maka terdapat
sebanyak pemilahan yang mungkin dilakukan. Dalam hal ini, variabel yang
bertipe kategorik ordinal adalah
a. variabel jarak hamil ( ) memiliki 2 – 1 = 1 kemungkinan pemilahan
b. variabel jumlah anak ( ) memiliki 4 – 1 = 3 kemungkinan pemilahan
c. variabel frekuensi pemeriksaan kehamilan ( ) memiliki 3 – 1 = 2
kemungkinan pemilahan
d. variabel pendidikan ibu ( ) memiliki 4 – 1 = 3 kemungkinan pemilahan
3. jika pada variabel prediktor kategorik nominal terdapat kategori, maka terdapat
sebanyak pemilahan yang mungkin dilakukan. Dalam hal ini, variabel
yang bertipe kategorik nominal adalah
a. variabel penyakit saat kehamilan ( ) memiliki kemungkinan
pemilahan
b. variabel ibu menderita anemia ( ) memiliki kemungkinan
pemilahan
c. variabel status pekerjaan ibu ( ) memiliki kemungkinan
commit to user
pemilahan.
Pembentukan pohon regresi maksimal dimulai dengan mencoba 45
kemungkinan pemilahan pada data berat badan bayi saat lahir dari 90 data yang
terkumpul dalam suatu himpunan yang disebut simpul akar dan diberi nama simpul 1.
Masing-masing kemungkinan pemilahan menghasilkan 2 kelompok data yang
dinamakan simpul anak kiri dan simpul anak kanan, kedua simpul anak diberi nama
simpul 2 dan simpul 3. Pemilah terbaik dihitung berdasarkan selisih jumlah kuadrat
deviasi dari masing-masing simpul dengan simpul pemilahnya. Selisih terbesar akan
33
dijadikan pemilah terbaik. Selisih jumlah kuadrat deviasi dapat dilihat pada
perhitungan berikut
Pemilah terbaik pertama, variabel kenaikan berat badan ibu kilogram
perpustakaan.uns.ac.id digilib.uns.ac.id
Tabel 4.2. Selisih Jumlah Kuadrat Deviasi dari Semua Kemungkinan Pemilahan
Pemilah Simpul anak kiri Simpul anak kanan
1 usia ibu hamil ≤ 23,5 thn usia ibu hamil > 23,5 thn 0,038
2 usia ibu hamil ≤ 24,5 thn usia ibu hamil > 24,5 thn 0,014
3 usia ibu hamil ≤ 25,5 thn usia ibu hamil > 25,5 thn 0,078
4 usia ibu hamil ≤ 26,5 thn usia ibu hamil > 26,5 thn 0,098
5 usia ibu perpustakaan.uns.ac.id
hamil ≤ 27,5 thn usia ibu hamil > 27,5 thn
digilib.uns.ac.id
0,173
6 usia ibu hamil ≤ 28,5 thn usia ibu hamil > 28,5 thn 0,875
7 usia ibu hamil ≤ 29,5 thn usia ibu hamil > 29,5 thn 0,56
8 usia ibu hamil ≤ 30,5 thn usia ibu hamil > 30,5 thn 0,624
9 usia ibu hamil ≤ 31,5 thn usia ibu hamil > 31,5 thn 0,377
10 usia ibu hamil ≤ 32,5 thn usia ibu hamil > 32,5 thn 0,188
11 usia ibu hamil ≤ 33,5 thn usia ibu hamil > 33,5 thn 0,014
12 usia ibu hamil ≤ 34,5 thn usia ibu hamil > 34,5 thn 0,078
13 usia ibu hamil ≤ 35,5 thn usia ibu hamil > 35,5 thn 0,03
14 usia ibu hamil ≤ 36,5 thn usia ibu hamil > 36,5 thn 0,000
15 usia ibu hamil ≤ 37,5 thn usia ibu hamil > 37,5 thn 0,087
16 usia ibu hamil ≤ 38,5 thn usia ibu hamil > 38,5 thn 0,008
17 usia ibu hamil ≤ 39,5 thn usia ibu hamil > 39,5 thn 0,001
18 usia ibu hamil ≤ 41,5 thn usia ibu hamil > 41,5 thn 0,009
19 jarak hamil < 2 thn jarak hamil 2 thn atau lbh 0,374
20 jumlah anak = 2 commit to user
jumlah anak = {3, 4, 5} 0,024
21 jumlah anak = {2, 3} jumlah anak = {4, 5} 0,043
22 jumlah anak = {2, 3, 4} jumlah anak = 5 0,001
23 kenaikan bb ≤ 4,5 kg kenaikan bb > 4,5 kg 0,009
24 kenaikan bb ≤ 5,5 kg kenaikan bb > 5,5 kg 0,016
25 kenaikan bb ≤ 6,5 kg kenaikan bb > 6,5 kg 0,028
26 kenaikan bb ≤ 7,5 kg kenaikan bb > 7,5 kg 1,284
27 kenaikan bb ≤ 8,5 kg kenaikan bb > 8,5 kg 1,084
35
Setelah terbentuk dan diperoleh pemilah terbaik, maka simpul pertama yang
commit to user
berisi data dipilah menjadi buah simpul akhir. Simpul akhir terbentuk akibat
kriteria variabel kenaikan berat badan ibu kilogram. Simpul akhir terbentuk
akibat kriteria variabel kenaikan berat badan ibu kilogram. Pemilahan pertama
dapat dilihat pada Gambar 4.4. Sebanyak data berat badan bayi dipilah
berdasarkan kriteria kenaikan berat badan ibu, yaitu data dengan kenaikan berat
badan ibu kilogram masuk ke dalam simpul akhir dan data dengan
kenaikan berat badan ibu kilogram masuk ke dalam simpul akhir 2.
36
Node 1
X4 <= 7.500
STD = 0.451
Avg = 3.007
N = 90
Terminal Terminal
Node 1 Node 2
STD = 0.361 STD = 0.450
Avg = 2.750 Avg = 3.062
N = 16 N = 74
perpustakaan.uns.ac.id digilib.uns.ac.id
Proses pemilahan terus dilakukan pada simpul berikutnya dan berhenti apabila
tidak terdapat lagi penurunan keheterogenan atau semua nilai y yang ada pada sebuah
simpul adalah sama (homogen), ukuran simpul induk minimum 10 yaitu ukuran
minimum dimana simpul tidak akan dipilah (Steinberg and Colla, 1998), atau hanya
terdapat satu pengamatan pada tiap simpul anak. Pemilahan yang akan menghasilkan
simpul anak yang lebih kecil tidak dipertimbangkan. Pohon regresi yang terbentuk
sebagai hasil dari proses ini dinamakan pohon regresi maksimal (Tmax) secara umum
ditunjukkan pada Gambar 4.5.
commit to user
Simpul yang berwarna hijau pada Gambar 4.5 merupakan simpul dalam
sedangkan simpul yang berwarna merah merupakan simpul akhir. Pohon regresi
37
maksimal tersebut memiliki 15 simpul dalam dan 16 simpul akhir, dengan kedalaman
pohon regresi sebesar 8 tingkatan. Kedalaman pohon menunjukan jumlah level atau
tingkatan dari pohon regresi yang dihitung dari simpul utama sampai pada simpul
akhir yang terbawah. Pohon regresi maksimal secara detail dapat dilihat pada
Lampiran 3.
Pada pohon regresi yang terbentuk, CART menghitung ringkasan statistik di
setiap simpul-simpul akhir yaitu nilai rata-rata dandigilib.uns.ac.id
perpustakaan.uns.ac.id standar deviasi dari variabel
respon. Nilai rata-rata dari simpul akhir merupakan nilai prediksi dari variabel
respon pada kasus simpul terakhir tersebut. Data berat badan bayi dari setiap simpul
akhir pada pohon regresi maksimal dapat dilihat pada Tabel 4.3. Nilai yang terdapat
pada baris terakhir masing-masing kolom merupakan nilai rata-rata dari setiap simpul
akhir. Contoh perhitungan nilai rata-rata dan standar deviasi pada simpul akhir 1
dalam Tabel 4.3 adalah sebagai berikut.
Simpul akhir 1:
Rata-rata
Variansi
Standar deviasi
commit to user
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
Tabel 4.4. Selisih Jumlah Kuadrat Deviasi pada Proses Pemangkasan Pertama
No. Simpul Dalam No. Simpul Dalam
1 Simpul 3 0,592 9 Simpul 6 0,603
2 Simpul 9 0,241 10 Simpul 5 0,567
3 Simpul 12 1,897 11 Simpul 13 0,295
4 Simpul 14 0,345 12 Simpul 11 0,816
5 Simpul 15 0,381 13 Simpul 10 0,857
6 Simpul 2 0,864 14 Simpul 4 1,079
7 Simpul 8 0,496 15 Simpul 1 1,284
8 Simpul 7 0,833
commit to user
digunakan untuk pemilihan pohon regresi optimal. Nilai kesalahan relatif penduga
sampel uji dari masing-masing sub pohon terlihat pada Tabel 4.6. Nilai rata-rata dari
setiap simpul akhir merupakan nilai prediksi
perpustakaan.uns.ac.id dari variabel respon pada kasus
digilib.uns.ac.id
Perhitungan kesalahan relatif pada pohon optimal menggunakan penduga sampel uji
sebagai berikut.
Kesalahan penduga sampel uji:
commit to user
42
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
Nilai ± pada Tabel 4.6 merupakan nilai penduga kesalahan standar yaitu ukuran
dari ketidakpastian di sekitar tingkat kesalahan sebenarnya (sampel uji) dari pohon
tersebut saat berhadapan dengan data baru. Nilai penduga kesalahan standar
memberikan gambaran ketidakpastian dari penduga tingkat kesalahan. Penduga
kesalahan standar diperoleh menggunakan persamaan (2.10) yaitu
43
6 7 0,895 ± 0,223
7** 5 0,778 ± 0,189
8 4 1,043 ± 0,054
9 3 1,043 ± 0,054
10 2 1,061 ± 0,161
11 1 1,171 ± 0,275
**Optimal
Berdasarkan data pada Tabel 4.3 diperoleh nilai dan sebagai berikut
commit to user
44
commit to user
45
perpustakaan.uns.ac.id digilib.uns.ac.id
3,1
0,002 0,000
3,1
0,002 0,000
3
0,021 0,000
2,6
0,297 0,088
2,65
0,245 0,060
3,1
0,002 0,000
3,6
0,207 0,043
3,5
0,126 0,016
3,2
0,003 0,000
3,6
0,207 0,043
jumlah = 1,112 jumlah = 0,025
commit to user
Jadi, nilai penduga kesalahan standar atau ukuran dari ketidakpastian di sekitar
tingkat kesalahan sebenarnya (sampel uji) dari pohon tersebut saat berhadapan
dengan data baru sebesar . Pada Tabel 4.6 dapat ditunjukkan bahwa pohon
regresi optimal yang terpilih adalah pohon regresi yang memiliki kesalahan relatif
penduga sampel uji terkecil sebesar yang berarti nilai kesalahan
prediksi besarnya berat badan bayi saat lahir dari pohon regresi optimal terhadap data
yang dihitung berdasarkan penduga sampel uji berkisar antara sampai .
46
Pohon regresi optimal dapat dilihat pada Gambar 4.6. Pohon yang terpilih
memiliki 4 simpul dalam dan 5 simpul akhir, dengan 4 tingkat kedalaman pohon
regresi. Pada pohon regresi optimal ditunjukkan bahwa dari 9 variabel yang
mempengaruhi berat badan bayi saat lahir, hanya 3 variabel yang membentuk pola
hubungan yaitu variabel usia ibu hamil , kenaikan berat badan ibu dan
status pekerjaan ibu .
perpustakaan.uns.ac.id digilib.uns.ac.id
Node 1
X4 <= 7.500
STD = 0.451
Avg = 3.007
N = 90
Node 2 Node 3
X1 <= 28.500 X8 = (1)
STD = 0.361 STD = 0.450
Avg = 2.750 Avg = 3.062
N = 16 N = 74
Terminal Terminal
Node 4 Node 5
STD = 0.399 STD = 0.539
Avg = 3.095 Avg = 3.456
N = 37 N=8
Pada Gambar 4.6 dapat diketahui bahwa variabel yang menjadi pemilah utama
commit to user
adalah variabel yaitu kenaikan berat badan ibu. Variabel ini memilah 90 data
berat badan bayi menjadi 2 kelompok yaitu sebanyak 16 data dengan kenaikan berat
badan ibu kilogram masuk ke dalam simpul 2, sedangkan 74 data lainnya
dengan kenaikan berat badan ibu kilogram masuk ke dalam simpul 3. Rata-rata
berat badan bayi saat lahir adalah 3,007 kilogram dengan standar deviasi sebesar
0,451.
47
Pada simpul 2, sebanyak 16 data berat badan bayi dipilah lagi berdasarkan
variabel usia ibu hamil menjadi 2 kelompok yaitu sebanyak 6 data berat badan
bayi dengan usia ibu hamil tahun masuk ke dalam simpul kiri yaitu simpul
akhir 1 (sudah homogen) dan 10 data lainnya dengan usia ibu hamil tahun,
masuk ke dalam simpul kanan yaitu simpul akhir 2 (sudah homogen). Rata-rata berat
badan bayi saat lahir adalah 2,750 kilogram dengan standar deviasi sebesar 0,361.
Pada simpulperpustakaan.uns.ac.id
3, variabel status pekerjaan ibu memberi nilai penurunan
digilib.uns.ac.id
keheterogenan yang tinggi sebagai pemilah. Sebanyak 74 data berat badan bayi
dipilah menjadi 2 kelompok yaitu sebanyak 29 data berat badan bayi dengan status
pekerjaan ibu adalah bekerja masuk ke dalam simpul kiri yaitu simpul akhir 3 (sudah
homogen) dan 45 data lainnya dengan status pekerjaan ibu tidak bekerja, masuk ke
dalam simpul kanan yaitu simpul 4. Rata-rata berat badan bayi saat lahir adalah 3,062
kilogram dengan standar deviasi sebesar 0,450.
Pada simpul 4, variabel usia ibu hamil memberi nilai penurunan
keheterogenan yang tinggi sebagai pemilah. Sebanyak 45 data berat badan bayi
dipilah menjadi 2 kelompok yaitu sebanyak 37 data berat badan bayi dengan usia ibu
hamil tahun masuk ke dalam simpul kiri yaitu simpul akhir 4 (sudah
homogen) dan 8 data lainnya dengan usia ibu hamil tahun, masuk ke dalam
simpul kanan yaitu simpul akhir 5 (sudah homogen). Rata-rata berat badan bayi saat
lahir adalah 3,159 kilogram dengan standar deviasi sebesar 0,449.
Pada setiap simpul akhir diketahui bahwa sebanyak 6 data berat badan bayi
masuk ke dalam simpul akhir 1 dengan rata-rata berat badan bayi saat lahir adalah
commit to user
2,450 dan standar deviasi sebesar 0,126. Sebanyak 10 data berat badan bayi masuk ke
dalam simpul akhir 2 dengan rata-rata berat badan bayi saat lahir adalah 2,930 dan
standar deviasi sebesar 0,335. Sebanyak 29 data berat badan bayi masuk ke dalam
simpul akhir 3 dengan rata-rata berat badan bayi saat lahir adalah 2,912 dan standar
deviasi sebesar 0,407. Sebanyak 37 data berat badan bayi masuk ke dalam simpul
akhir 4 dengan rata-rata berat badan bayi saat lahir adalah 3,095 dan standar deviasi
sebesar 0,399. Sebanyak 8 data berat badan bayi masuk ke dalam simpul akhir 5
48
dengan rata-rata berat badan bayi saat lahir adalah 3,456 dan standar deviasi sebesar
0,539.
Pada Tabel 4.9 terlihat bahwa kelompok data ke-2 memiliki nilai kesalahan
relatif penduga sampel uji terkecil yaitu 0,778 0,189. Dengan demikian, kelompok
data ke-2 terpilih sebagai pohon regresi yang digunakan untuk membentuk pola
commit to user
hubungan antara variabel-variabel yang berpengaruh terhadap berat badan bayi saat
lahir di kota Surakarta. Pohon regresi optimal yang terpilih dapat dilihat pada Gambar
4.6.
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan hasil dari pembahasan, dapat disimpulkan bahwa pola hubungan
antara variabel-variabel yang berpengaruh terhadap berat badan bayi saat lahir di kota
Surakarta sebagai perpustakaan.uns.ac.id
berikut: digilib.uns.ac.id
1. jika kenaikan berat badan ibu kilogram dan usia ibu hamil
tahun maka rata-rata berat badan bayi saat lahir sebesar 2,450 kilogram,
2. jika kenaikan berat badan ibu kilogram dan usia ibu hamil
tahun maka rata-rata berat badan bayi saat lahir sebesar 2,930 kilogram,
3. jika kenaikan berat badan ibu kilogram dan status pekerjaan ibu
adalah bekerja maka rata-rata berat badan bayi saat lahir sebesar 2,912 kilogram,
4. jika kenaikan berat badan ibu kilogram, status pekerjaan ibu
tidak bekerja dan usia ibu hamil maka rata-rata berat badan bayi
saat lahir sebesar 3,095 kilogram,
5. jika kenaikan berat badan ibu kilogram, status pekerjaan ibu
tidak bekerja dan usia ibu hamil maka rata-rata berat badan bayi
saat lahir sebesar 3,456 kilogram.
Variabel lainnya yaitu jarak kehamilan , jumlah anak yang dilahirkan ,
penyakit saat kehamilan , ibu menderita anemia , frekuensi pemeriksaan
kehamilan , dan pendidikan ibu tidak berpengaruh secara dominan sehingga
commit to user
tidak masuk ke dalam pola hubungan.
49
50
5.2 Saran
Pada penelitian ini penulis menerapkan metode pohon regresi untuk
menganalisis faktor-faktor yang mempengaruhi berat badan bayi saat lahir. Penelitian
dilakukan hanya di lingkungan Kota Surakarta. Disarankan kepada pembaca yang
tertarik dapat mengembangkan metode ini pada ruang sampel yang lebih besar dan
dapat menambah variabel lain seperti kenaikan berat badan ibu per trimester serta
usia kehamilan saat melahirkan.
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user