ik hm K i t R A M A f mm R U M A H
l U S r A I D AH I N 1 IK H A Z A lI
UNlVKSn'f TfKNOlOG! M A L A Y S I A
PERPUSTAKAAN KUi
TTHO
PSZ19:16(Pind.l/97)
U M V E K S m TEKNOLOGI MALAYSIA
SULIT
TERHAD
TIDAK TERHAD
<r e f t sfDATANG^ ?N PENULTS) Alamat Tetap : NO.3. JALAN MEKAR 5, TAMAN MEKAR. 86100, AYER HITAM, JOHOR. P.M. DR. SITI MARIYAM BT HJ SHAMSUDIN Nama Penyelia (TANDATANGA1
Tarikh : 3
0)<X06EK
2*0O?>
Tarikh
44
Qflc3
CATA TAN
* **
Potong yang tidak berkenaan Jika tesis ini SULIT atau TERHAD, sila lampirkan surat daripada pihak berkuasa/organisasi berkenaan dengan menyatakan sekali sebab dan tempoh tesis ini perlu dikelaskan sebagai SULIT atau TERHAD Tesis dimaksudkan sebagai tesis bagi Ijazah Doktor Falsafah dan Saijana secara penyelidikan, atau disertasi bagi pengajian secara kerja kursus dan penyelidikan, atau Laporan Projek Sarjana Muda (PSM)
"Kami akui bahawa kami telah membaca karya ini dan pada pandangan kami karya ini adalah memadai dari segi skop dan kualiti untuk tujuan penganugerahan Ijazah Saijana Sains Komputer".
Tandatangan Nama Penyelia I Tarikh : P.M. Dr. Siti Mariyam Bt Hj. Shamsuddin
J
: Puan Rosalina Bt. Salehuddin
Laporan projek ini dikemukakan sebagai memenuhi sebahagian daripada syarat penganugerahan Ijazah Sarjana Sains (Sains Komputer)
OKTOBER, 2003
ii
"Saya akui karya ini adalah hasil kerja saya sendiri kecuali nukilan dan ringkasan yang tiap-tiap satunya telah saya jelaskan sumbernya".
iii
Istimewa untuk suami tercinta, Lokman Hakim Ismail, Bonda yang dikasihi, Puan Marziah Abdullah, Buah hati tersayang, Yasmin Kamilia, Amirul Mukminin, dan Sufi Dayana.
IV
PENGHARGAAN
Alhamdulillah setinggi-tinggi kesyukuran ke hadrat Allah S.W.T di atas petunjuk, rahmat dan keizinanNya, maka saya memperolehi ketabahan untuk menyiapkan projek ini. Saya mengambil kesempatan melalui ruangan ini untuk merakamkan setinggi-tinggi penghargaan dan terima kasih kepada Prof. Madya Dr. Siti Mariyam bt. Hj. Shamsuddin, selaku penyelia utama, di atas segala nasihat, bimbingan dan dorongan yang telah dicurahkan sepanjang penyelidikan ini. Penghargaan dan terima kasih juga kepada Puan Rosalina bt. Salehuddin, selaku penyelia kedua di atas segala tunjuk ajar serta ilmu yang diberikan.
Tidak lupa juga kepada semua yang terlibat sama ada secara langsung atau tidak langsung dalam menjayakan projek ini, khususnya kepada Dr. Azuraliza bt. Abu Bakar, Cik Siti Nurulhawa, Pn. Jastini, Pn. Rathiah, Pn. Noorhalina, dan Pn. Rahayu dengan ucapan ribuan terima kasih. Akhir sekali, terima kasih yang tidak terhingga di atas pengorbanan yang diberikan oleh suami, ibu, anak-anak, kakak, serta adik-adik. Semoga kita semua sentiasa berada di dalam rahmat dan lindunganNya.
IV
ABSTRAK
Peramalan merupakan satu bidang kajian yang seringkali dikaitkan dengan penggunaan teknik Rangkaian Neural. Kajian ini menguji keberkesanan model peramalan Rangkaian Neural Suap Balik, iaitu salah satu teknik Rangkaian Neural. Di dalam peramalan, model Perceptron Multi Aras lebih kerap digunakan berbanding Rangkaian Neural Suap Balik. Sehubungan itu, penulis menfokus kepada Rangkaian Neural Suap Balik di dalam meramal harga rumah teres di Kuala Lumpur. Untuk itu, Rangkaian Elman digunakan sebagai model Rangkaian Neural Suap Balik bersama Algoritma Pembelajaran Rambatan Balik. Lapan faktor yang mempengaruhi harga rumah digunakan sebagai parameter input. Perbandingan dilakukan dan hasil kajian membuktikan Rangkaian Elman menghasilkan keputusan yang lebih baik dengan ralat 0.012744 berbanding Model Perceptron Multi Aras, dengan ralat 0.014969.
vi
ABSTRACT
Prediction is one of the research fields that is always relate to the use of Neural Network technique. This study investigates the effectiveness of prediction model in a technique known as Recurrent Neural Network, a technique in Neural Network. In prediction, Multi Layer Perceptron model is more common and frequently used compared to Recurrent Neural Network. Therefore, the author focused on Recurrent Neural Network in predicting the price of terrace houses in Kuala Lumpur. Elman Network is used as Recurrent Neural Network model with the implementation of Backpropogation Learning Algorithm. Eight factors that influence the price of these houses are used as input parameters. Comparisons are made and based on these results, it is proven that Elman Network is better than Multi Layer Perceptron with errors at 0.012744 and 0.014969 respectively.
vii
KANDUNGAN
BAB
PERKARA PENGESAHAN STATUS TESIS PENGESAHAN PENYELIA IIAL AM AN JUDUL PENGAKUAN DEDIKASI PENGHARGAAN ABSTRAK ABSTRACT KANDUNGAN SENARAIJADUAL SENARAI RAJAH SENARAI SIMBOL SENARAI LAMPIRAN
IYIIJKA SURAT
PENDAHULUAN 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 Pengenalan Latar Belakang Masalah Matlamat Kajian Objektif Kajian Skop Kajian Kepentingan Kajian Justifikasi Organisasi Laporan Projek 1 1 3 4 4 5 5 6
Vlll
II
KAJIAN LITERATUR 2.1 Rangkaian Neural Buatan 2.1.1 2.1.1 2.1.2 2.1.3 2.1.4 2.1.5 2.1.6 2.1.7 Konsep Rangkaian Neural Kelebihan-kelebihan Rangkaian Neural Pemprosesan Maklumat dalam Rangkaian Neural Topologi Rangkaian Neural Algoritma Pembelajaran Rangkaian Neural Jenis- Jenis Rangkaian Neural Kelemahan Rangkaian Neural Contoh-contoh Peramalan Harga Rumah 2.2 Rangkaian Neural Suap Balik 2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 2.2.6 2.2.7 Kenapa Rangkaian Neural Suap Balik? Jenis-jenis Rangkaian Neural Suap Balik Rangkaian Elman Senibina Elman Implementasi Hubungan Suapbalik Algoritma pembelajaran Perbezaan Antara Rangkaian Neural Suap Balik dan Rangkaian Suap Hadapan 2.2.8 2.2.9 Bidang Aplikasi Contoh-contoh Kaj ian Menggunakan Rangkaian Neural Suap Balik 2.2.10 Masalah dan Kekangan pada Rangkaian Neural Suap Balik 42 38 34 37 28 31 32 33 34 27 22 27 17 19 21 11 16 11 7 8
2.3
Algoritma Pembelajaran Rambatan Balik 2.3.1 2.3.2 2.3.3 Algoritma Pembelajaran Suap ke hadapan (Forward Propogation) Rambatan Balik (Backward Propogation)
42 43 44 45
III
METODOLOGI KAJIAN 3.1 3.2 Metodologi Kajian Panduan Pembinaan Model Ramalan 3.2.1 3.2.2 3.2.3 3.2.4 3.2.5 3.2.6 3.2.7 3.2.8 Sasaran dan Tempoh Masa Domain Pengetahuan Pengumpulan Data Pra-pemprosesan Data dalam Rangkaian Mengurangkan Dimensi Mengurangkan Perbandingan Input Rekabentuk Senibina Rangkaian Membuat Latihan, uj ian, dan Merekabentuk Semula Gelungan 51 49 50 50 50 47 47 48 48 49
3.3
Rekabentuk Projek 3.3.1 3.3.2 3.3.3 3.3.4 3.3.5 3.3.6 Mengumpul Data Menganalisa Data Rekabentuk dan Senibina Rangkaian Melatih Rangkaian Menguj i Rangkaian Keluarkan Hasil dan Keputusan Akhir
52 53 53 56 60 63 64 64
3.4
IV
ANALISA HASIL DAN KEPUTUSAN 4.1 4.2 4.3 Hasil dan Keputusan larian ke atas 60 Data Ujian (1994-1996) Pemilihan Model Rangkaian Terbaik Hasil dan Keputusan Larian ke atas 100 Data Ujian Sebenar (1997) 71 65 69
KESIMPULAN
5.1 Kesimpulan
74
RUJl I KAN S E N A R A I L A M PI R A N
76
80
xii
SENARAIRAJAH
NO. RAJAH 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 2.14 2.15 3.1 3.2 3.3. 4.1 4.2 4.3 Sel Neuron Manusia
TAJUK
MUKASURAT 9 9 9 10 12 15 15 16 30 30 31 33 36 37 45 52 60 62 70 72 73
Komponen dalam Neuron Struktur Synapse Tiga Bahagian Asas Rangkaian Neural Pemprosesan Maklumat dalam Rangkaian Neural Fungsi Sigmoid Fungsi Threshold Fungsi Linear Rangkaian Elman Rangkaian Jordan Fully-Connected RNN Senibina Rangkaian Elman Rangkaian Suap Hadapan Rangkaian Neural Suap Balik Pemprosesan Data di dalam Rangkaian Rangkakeija Projek Senibina Rangkaian Elman bagi kajian ini Langkah-langkah Yang Terlibat di dalam Fasa Latihan Pengurangan ralat pada setiap lelaran Peramalan harga rumah menggunakan Rangkaian Elman Perbandingan ramalan oleh Rangkaian Elman dan Rangkaian Perceptron Multi Aras
Xlll
SENARAI SIMBOL
Bias Pemalar pembelajaran Eta Pemalar momentum Alpha Signal ralat bagi aras tersembunyi Signal ralat bagi aras output Fungsi Keaktifan Hubungan pemberat antara nod input, nod tersembunyi, dan nod output Hubungan pemberat antara nod konteks dan nod tersembunyi Vektor input Vektor konteks Perwakilan masa Ralat sistem maksima yang dibenarkan Nilai keaktifan pada nod tersembunyi Nilai keaktifan pada nod output Bilangan sampel data Output sasaran Output ramalan Nilai perubahan pemberat antara nod input dan nod tersembunyi Nilai perubahan pemberat antara nod tersembunyi dan nod output
XIV
SENARAI LAMPIRAN
LAMPIRAN A B C D E F F1 F2 F3 G G1 G2 G3 H
TAJUK
MUKASURAT 80-89 90-97 98-99 100-103 104-107 108 109 110 111 112 113 114 115 116
300 Data Perumahan Dari 1994 Hingga 1996 240 Data Latihan Yang Telah Dinormalkan 60 Data Ujian Yang Telah Dinormalkan 100 Data Asal 1997 Sebelum Dinormalkan 100 Data 1997 Yang Telah Dinormalkan Statistik lima larian terbaik dengan Emax 0.009 dan awalan nod konteks 0.5 Graf terbaik larian (8:3:1) dengan Emax 0.009 dan awalan nod konteks 0.5 Graf terbaik larian (8:4:1) dengan Emax 0.009 dan awalan nod konteks 0.5 Graf terbaik larian (8:5:1) dengan Emax 0.009 dan awalan nod konteks 0.5 Statistik lima larian terbaik dengan Emax 0.009 dan awalan nod konteks 0.0. Graf terbaik larian (8:3:1) dengan Emax 0.009 dan awalan nod konteks 0.0 Graf terbaik larian (8:4:1) dengan Emax 0.009 dan awalan nod konteks 0.0 Graf terbaik larian (8:5:1) dengan Emax 0.009 dan awalan nod konteks 0.0 Statistik lima larian terbaik dengan Emax 0.008 dan awalan nod konteks 0.5.
XV
HI H2 H3 I II 12 13 J J1 J2 J3 K K1 K2 K3 L M N
Graf terbaik larian (8:3:1) dengan Emax 0.008 dan awalan nod konteks 0.5 Graf terbaik larian (8:4:1) dengan Emax 0.008 dan awalan nod konteks 0.5 Graf terbaik larian (8:5:1) dengan Emax 0.008 dan awalan nod konteks 0.5 Statistik lima larian terbaik dengan Emax 0.008 dan awalan nod konteks 0.0 Graf terbaik larian (8:3:1) dengan Emax 0.008 dan awalan nod konteks 0.0 Graf terbaik larian (8:4:1) dengan Emax 0.008 dan awalan nod konteks 0.0 Graf terbaik larian (8:5:1) dengan Emax 0.008 dan awalan nod konteks 0.0 Statistik lima larian terbaik dengan Emax 0.007 dan awalan nod konteks 0.5. Graf terbaik larian (8:3:1) dengan Emax 0.007 dan awalan nod konteks 0.5 Graf terbaik larian (8:4:1) dengan Emax 0.007 dan awalan nod konteks 0.5 Graf terbaik larian (8:5:1) dengan Emax 0.007 dan awalan nod konteks 0.5 Statistik lima larian terbaik dengan En,ax 0.007 dan awalan nod konteks 0.0. Graf terbaik larian (8:3:1) dengan Emax 0.007 dan awalan nod konteks 0.0 Graf terbaik larian (8:4:1) dengan Emax 0.007 dan awalan nod konteks 0.0 Graf terbaik larian (8:5:1) dengan Emax 0.007 dan awalan nod konteks 0.0 Nilai ralat yang dikurangkan pada setiap lelaran Pemberat yang telah stabil pada lelaran terakhir Perbandingan hasil oleh Rangkaian Elman dan Perceptron Multi Aras 134-137 131 132 13 3 130 129 128 127 126 125 124 123 122 121 120 119 118 117
BAB I
PENDAHULUAN
1.1
Pengenalan Rangkaian Neural Suap Balik merupakan salah satu model yang terdapat di
dalam Rangkaian Neural. Ia merupakan satu bidang ilmu yang dapat membantu manusia di dalam membuat ramalan dan klasifikasi. Ramalan dan klasifikasi ini dihasilkan daripada data-data pada masa yang lepas. Penggunaan Rangkaian Neural mungkin bukan merupakan perkara yang baru dalam kajian-kajian di Malaysia. Walau bagaimanapun, penggunaan Rangkaian Neural Suap Balik dalam bidang kajian di negara ini boleh dikatakan masih baru, dan tidak ramai yang menggunakannya. Namun begitu, kejayaan Rangkaian Neural Suap Balik telah terbukti berdasarkan kajian yang dilakukan di negara-negara maju seperti Amerika Syarikat, Kanada, Jepun, Australia dan sebagainya.
1.2
Latar Belakang Masalah Industri perumahan merupakan salah satu sektor utama sebagai penyumbang
kepada perkembangan ekonomi Malaysia. Apabila kita membeli atau menjual rumah, kita sebenarnya terlibat dalam pelaburan harta dan komitmen kewangan yang besar. Oleh itu kita hendaklah mampu membuat taksiran dan keputusan yang tepat sebelum terlibat dalam urusniaga jual-beli rumah tersebut.
Harga rumah secara umumnya mampu berubah mengikut pelbagai keadaan dan masa. Pemaju perumahan menetukan harga rumah berdasarkan kepada dua faktor utama, iaitu faktor dalaman dan luaran. Antara faktor dalaman adalah objektif pasaran, serta strategi dan kos pemasaran. Manakala faktor luaran pula ialah pasaran dan permintaan, tanggapan penggunaan terhadap harga dan nilai rumah, harga-harga dan tawaran yang disediakan oleh pesaing, keadaan ekonomi yang tak-linear seperti inflasi, kejatuhan ekonomi, polisi kerajaan dan dan keadaan sosial.
Penentuan harga rumah merupakan satu proses yang sentiasa berubah dan bergantung kepada syarikat-syarikat perumahan yang merekabentuk struktur harga. Mereka mengubah struktur penentuan harga tersebut mengikut masa dengan mengambilkira faktor pelanggan dan pesaing. Terdapat banyak perbezaaan implikasi dalam penurunan harga dan kenaikan harga. Pada keadaan iaitu terdapat banyak pemaju di sesuatu kawasan, setiap syarikat mesti membuat jangkaan reaksi pasaing mereka. Di samping itu, isu terhadap kekurangan bekalan bahan binaan dan juga tenaga buruh mahir turut membawa kepada kenaikan harga rumah.
Disebabkan wujudnya faktor-faktor yang sukar diramal ini, maka perlunya satu kaedah yang mampu mengatasi masalah peramalan harga rumah. Kemampuan untuk menyelesaikan masalah tak-linear adalah satu kelebihan yang terdapat pada model Rangkaian Neural. Teknik-teknik lain seperti regresi dan heuristik kurang berkemampuan dalam membuat peramalan yang tepat dalam penentuan pergerakan harga rumah kerana harga rumah sentiasa berubah mengikut peredaran masa (Marquez et al., 1991). Oleh itu, teknik yang sangat bersesuaian dalam menyelesaikan masalah ini ialah dengan menggunakan Rangkaian Neural. Telah banyak kajian peramalan harga rumah dilakukan menggunakan Rangkaian Neural. Antaranya ialah Kajian Bagi Memperbaiki Hasil Model Rangkaian Neural ke atas Penilaian Harga Rumah (Rossini, 1998), Penggunaan Rangkaian Neural dalam Meramal Indeks Harga Rumah (Rossini, 1997), Peramalan Harga Rumah ke atas Kawasan Bandar dan Luar Bandar (Wilson et al., 2002), Pemodelan Kecerdasan Buatan Terhadap Pasaran Rumah Persendirian di Singapura (Wang dan Ho, 1995), Penilaian Harga Rumah
Menggunakan Rangkaian Neural (Grudnitski, 1997), dan Permodelan Rangkaian Neural dalam Meramal Harga Rumah (Ku Rohana Ku Mahmud et al., 1998). Terdapat beberapa model dalam Rangkaian Neural. Antaranya ialah Model Perceptron Satu Aras, Model Perceptron Multi Aras (MLP), Adaline dan Madaline, Rangkaian Hamming, Model Rambatan Balik, Radial Basis Function (RBF), Kohonen Features Map, dan Rangkaian Neural Suap Balik. Bagi Rangkaian Neural Suap Balik khususnya, terdapat banyak kajian yang telah dijalankan dengan jay any a.
Antaranya ialah ialah Rangkaian Neural Suap Balik dan Bahasa Tabi'i: Pentingnya Suatu Permulaan Yang Ringkas (Rohde dan Plant, 1998), Rangkaian Neural Suap Balik Terhadap Pembelajaran ke atas Laluan Teks (Wermter et al., 2000), Rujukan Peraturan bagi Peramalan Kewangan Menggunakan Rangkaian Neural Suap Balik (Giles, et al., 1997), Pengekstrakan Pengetahuan dan Rangkaian Neural Suap Balik : Suatu Analisis Terhadap Rangkaian Elman yang Dilatih ke atas Pembelajaran Bahasa Tabi'i, (Schellhammer et al., 1998), Pengkodan AcousticPhonetic Berdasarkan Rangkaian Elman (Freitag dan Monte, 1996), dan Rangkaian Neural Suap Balik yang Belajar Membilang, (Rodriguez et al., 1999). Setiap daripada kajian ini akan dihuraikan dengan lebih lanjut di dalam Bab II.
Telahpun terbukti banyak kajian peramalan harga rumah dibangunkan dan beijaya menghasilkan keputusan yang baik menggunakan teknik-teknik di dalam Rangkain Neural. Ini mendorong penulis untuk menjalankan kajian menggunakan salah satu model yang terdapat di dalam Rangkaian Neural iaitu kajian penggunaan Rangkaian Neural Suap Balik terhadap peramalan harga rumah.
1.3
Matlamat Kajian Matlamat utama dalam menjalankan kajian ini ialah untuk membangunkan
model Rangkaian Neural Suap Balik dalam peramalan harga rumah. Rangkaian Neural Suap Balik dijangka berkemampuan dalam menghasilkan keputusan ramalan
yang lebih tepat berbanding dengan kaedah Rangkaian Neural yang lain kerana adanya konsep menyimpan maklumat berdasarkan tempoh masa terdahulu.
1.4
Objektif Kajian
Bagi mencapai matlamat kajian seperti yang dinyatakan di atas, dinyatakan objektif kajian, iaitu :-.
1. 2. 3.
Membangunkan Rangkaian Elman dengan Algoritma Pembelajaran Rambatan Balik. Mendapatkan satu model Rangkaian Neural Suap Balik untuk peramalan harga rumah Mengenalpasti kriteria rumah bagi peramalan harga rumah.
1.5
Skop Kajian Kajian ini hanya tertumpu kepada penggunaan kaedah Rangkaian Neural
Suap Balik iaitu model Rangkaian Elman bersama Algoritma Pembelajaran Rambatan Balik {Back Propogation). Seterusnya hasil kajian yang diperolehi hanya akan dibandingkan dengan hasil kajian Ku Ruhana Ku Mahamud, et al., (1998) yang menggunakan model Perceptron Multi Aras. Oleh itu, data perumahan yang digunakan ialah data yang sama dalam kajian tersebut. Tiada sebarang perbandingan dilakukan dengan kaedah konvensional. Ini adalah kerana kajian ini hanya tertumpu kepada perbandingan hasil teknik Rangkaian Neural Suap Balik berbanding dengan model Perceptron Multi-Aras.
Data yang digunakan dalam kajian ini adalah merupakan data yang sama dengan kajian Ku Ruhana Ku Mahamud, et al, (1998), yang diperolehi daripada INSPEN (Institut Penilaian Negara). Data ini hanya melibatkan data perumahan bagi rumah teres di Kuala Lumpur sahaja. Lapan parameter digunakan sebagai data input
kepada rangkaian iaitu luas tanah, luas binaan rumah, jenis rumah, jenis pemilikan tanah, usia rumah, jarak daripada pusat bandar, kualiti rumah, dan kualiti kawasan persekitaran. Manakala terdapat hanya satu sahaja parameter output iaitu harga rumah. Parameter-parameter ini dipilih berdasarkan kepada penilaian yang dilakukan oleh INSPEN sendiri dalam menghasilkan Indeks Harga Rumah Malaysia.
1.6
Kepentingan Kajian Untuk membantu pemilik dan pembeli rumah membuat keputusan yang lebih
baik dalam proses jual-beli rumah, dan juga membantu agen hartanah untuk membuat penilaian harga rumah.
1.7
Justifikasi
Justifikasi yang dibuat dalam kajian ini adalah : 1. Data yang digunakan adalah sahih iaitu data yang benar-benar wujud dan seterusnya dilakukan penormalan. Setelah dilakukan penormalan, semua data berada di dalam julat 0 hingga 1. 2. Pengujian yang piawai dilakukan dengan mengunakan tiga aras yang menunjukkan terdapatnya satu sahaja aras tersembunyi. 3. Pada setiap larian, penetapan parameter dibuat dengan menukarkan beberapa parameter lain pada satu-satu masa. 4. Fungsi Keaktifan yang digunakan adalah Fungsi Sigmoid.
1.8
Laporan projek ini mengandungi lima bab iaitu:1. Bab Pendahuluan yang menerangkan tentang latar belakang permasalahan kajian, matlamat serta objektif, skop dan kepentingan, serta justifikasi yang digunakan dalam kajian ini.
2. Bab kedua iaitu Kajian Literatur pula membincangkan dengan mendalam mengenai Rangkain Neural, Rangkaian Neural Suap Balik, dan Algoritma Pembelajaran Rambatan Balik. 3. Bab seterusnya ialah Metodologi Kajian yang menerangkan beberapa panduan pembinaan model ramalan dan mendalami setiap tahap rangka keija projek. 4. Bab keempat menghuraikan hasil dan keputusan daripada kajian yang dijalankan.