Anda di halaman 1dari 68

Implementasi Metode Support Vector Machine dalam Pendeteksian Spam Opinion (Junk Post dalam Forum)

Implementation of Support Vector Machine Method to Detect Spam Opinion (Junk Post in The Forum)
Tugas Akhir

Diajukan untuk memenuhi sebagian dari syarat untuk memperoleh gelar Sarjana Teknik Fakultas Informatika IT TELKOM

Rian Agustama Susilo 113080129

Fakultas Informatika Institut Teknologi Telkom Bandung 2012


i

Lembar Pernyataan

Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul Implementasi Metode Support Vector Machine dalam Pendeteksian Spam Opinion (Junk Post dalam Forum) beserta seluruh isinya adalah benar-benar karya saya sendiri dan saya tidak melakukan penjiplakan atau pengutipan dengan cara-cara yang tidak sesuai dengan etika keilmuan yang berlaku dalam masyarakat keilmuan. Atas pernyataan ini, saya siap menanggung resiko/sanksi yang dijatuhkan kepada saya apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini.

Bandung, 4 Mei 2012 Yang membuat pernyataan,

Rian Agustama Susilo

ii

Lembar Pengesahan Implementasi Metode Support Vector Machine dalam Pendeteksian Spam Opinion (Junk Post dalam Forum)

Implementation of Support Vector Machine Method to Detect Spam Opinion (Junk Post in The Forum)

Rian Agustama Susilo 113080129

Tugas Akhir ini telah diterima dan disahkan untuk memenuhi sebagian dari syarat untuk memperoleh gelar Sarjana Teknik Fakultas Informatika Institut Teknologi Telkom

Bandung, 14 Mei 2012

Menyetujui

Pembimbing I

Pembimbing II

Warih Maharani, S.T, M.T NIP: 01780256-1

Intan Nurma Yulita, S.T, M.T NIP: 10850715-3

iii

Abstrak
Seiring dengan penggunaan internet sebagai media untuk bertukar informasi, bertukar dan berbagi opini juga dapat dilakukan. Dari opini-opini yang ada di internet, tidak semua opini tersebut berguna sehingga terkadang menyulitkan pihak-pihak yang membutuhkan informasi yang terkait. Opini yang tidak diperlukan tersebut dapat disebut juga dengan opinion spam. Spam opinion dalam dunia internet dapat terjadi dalam hal apapun, salah satunya dalam forum. Spam opinion dalam forum dapat berupa opini-opini sampah yang tidak berguna dalam suatu topik permasalahan yang sedang dibahas. Text Classification merupakan salah satu solusi yang dapat mengatasi permasalahan tersebut. Salah satu metode pada Text Classification adalah Support Vector Machine. Klasifikasi berfokus pada penentuan postingan yang termasuk junk post atau tidak. Dalam Tugas Akhir ini, proses pembobotan dataset dengan memanfaatkan nilai TF dan juga nilai TF-IDF. Pembobotan dengan TF-IDF menghasilkan hasil yang lebih baik jika dibandingkan dengan TF saja. Kedua pembobotan tersebut digunakan untuk menghitung nilai similarity dari masingmasing postingan dan dikaitkan dengan topik yang sedang dibahas pada forum dengan menggunakan cosine similarity. Hasil evaluasi menunjukkan metode Support Vector Machine mampu menyelesaikan permasalahan spam opinion ini. Proses preprocessing data seperti penghilangan stopword dapat menurunkan hasil akurasi klasifikasi, sedangkan nilai parameter C tidak dapat mempengaruhi hasil klasifikasi secara signifikan. Kata kunci: text classification, opinion spam, Support Vector Machine, TF,TFIDF, cosine similarity

iv

Abstract
Along with the use of the internet as tools to share information, exchange and share opinions can also be perfomed. The opinions that exist on the internet, not all opinions are useful so that sometimes complicate the parties who need the related information. The opinions that are not useful can be describe as Spam Opinion. Spam opinion in internet can occur in any case, one of them in the forum. Spam opinion in the forum can be the junk opinions that useless in a topic being discussed. Text Classification is one of the solution that can solve these problems. One of Text Classification method is the Support Vector Machine (SVM). The classification focused on determining a post that junk post or not. In practice, carried out weighting the data set by using the TF and TF-IDF. The TF-IDF weighting is produced better results when compared to TF alone. Both weighting was used to calculate the similarity of the existing posts which are associated with the topic being discussed on the forum using the cosine similarity. The evaluation result shows that Support Vector Machine method is able to soleve the junk post problems. The process of data preprocessing such as stopword removal may affect the classification results, while the value of the parameter C can not affect the classification results significantly. Keywords: text classification, opinion spam, Support Vector Machine, TF,TFIDF, cosine similarity

Lembar Persembahan
Pada kesempatan ini Penulis ingin menyampaikan terima kasih kepada semua pihak yang telah membantu dalam penyelesaian Tugas Akhir ini: 1. Allah SWT, atas segala rahmat dan karunia-Nya yang tak terkira yang telah memberikan Penulis kesempatan untuk dapat menyelesaikan Tugas Akhir ini. 2. Rasulullah SAW, sebagai panutan, inspirasi dan motivasi hidup dan juga dalam penyelesaian Tugas Akhir ini. 3. Kedua orang tuaku tercinta, terimakasih kepada Mama dan Papa yang selalu memberikan motivasi, semangat,dukungan moril maupun materiil dan selalu mendoakan Penulis dalam pengerjaan Tugas Akhir ini dan selama kuliah yang selalu memberikan dukungan yang tak dapat tersebutkan. 4. Adik-adikku tercinta, Dwijanesya dan Ridho, semoga kalian lebih baik yah dari kakak kalian ini. Tidak lupa juga kepada keluarga besar yang selalu memberikan dukungan dan motivasi dalam pengerjaan Tugas Akhir ini. 5. Ibu Warih Maharani, S.T, M.T selaku pembimbing I yang sudah mencurahkan waktunya untuk mendengarkan keluh kesah penulis, memberikan semua ilmunya untuk penulis, pengalaman dan juga pengarahan yang sangat berarti dalam penyusunan Tugas Akhir ini. Ibu Intan Nurma Yulita, S.T, M.T selaku pembimbing II atas segala bimbingan, waktu, pengarahan, dan tidak lupa pula omelannya yang diberikan selama penyusunan Tugas Akhir ini. Semoga atas semua keikhlasan dalam membimbing penulis, dapat diberikan ganjaran yang setimpal dari Allah SWT. 6. Ibu Vera Suryani, S.T selaku dosen wali yang telah banyak mempermudah jalan penulis hingga saat ini dan juga dosen-dosen IT Telkom yang pernah menjadi dosen dalam perkuliahan yang membimbing serta memberikan ilmunya kepada Penulis. 7. Orang-orang terdekat penulis, Awalia Windarsari P yang banyak banget membantu penulis dalam penulisan buku Tugas Akhir ini. Motivasi dan omelannya yang selalu melekat dan terus memacu semangat penulis. Terima kasih semuanya. 8. Teman-teman Asisten Laboratorium IF Lab, Damar, Aim, Arga, Faris, Oku yang sudah rela menemani penulis dalam penulisan buku ini. Pengen menggila lagi bareng kalian, cepet kelarin Tugas Akhir ya semua. Tidak lupa juga kepada asisten praktikum yang memberikan keceriaan dengan kenyamanan kalian di lab tercinta ini, makasih untuk semangat dan motivasi yang diberikan kepada Penulis. 9. Teman-teman Lab DMC yang menemani perjalanan penulis semenjak semester 2. Makasih buat tempat pinjeman komputernya, pinjeman kasurnya, dan lain-lain yang tidak bisa disebutkan dengan kata-kata. 10. Teman seperjuangan pengerjaan Tugas Akhir, Ika, Rebecca, Tetty, Zizah, Aul, dan lain-lain yang secara tidak langsung memberikan semangat untuk penulis dalam pengerjaan Tugas Akhir ini. Semangat semua. 11. Teman-teman awal perjuangan di kampus ini, Prima, Chandra, Kinur. Terima kasih telah menemani hari-hari penulis di kampus ini.

vi

12. Teman-teman IF 32-02, terima kasih atas pertemanannya selama ini. Kalian is the best. 13. Temen kostan villazone tempat penulis menghabiskan masa-masa awal semester, Risky, Luqman dan Ateng yang sudah rela direpotin oleh penulis. Terima kasih banyak. 14. Teman teman angkatan 2008 lainnya, sebagai teman seperjuangan selama Penulis kuliah di IT Telkom. Banyak sekali yang tidak bisa disebutkan disini. Terima kasih semua. 15. Teman-teman IT Telkom, kakak-kakak kelas yang telah memberikan pengalaman yang berharga dalam memotivasi pengerjaan Tugas Akhir dan juga untuk adik-adik kelas yang Penulis tidak dapat sebutkan satu persatu. Semoga kalian bisa sampai ke tahapan ini. Tetap semangat dan terus berjuang.

vii

Kata Pengantar
Puji Syukur kehadirat Allah SWT atas segala rahmat dan karunia-Nya sehingga Tugas Akhir yang berjudul Implementasi Metode Support Vector Machine dalam Pendeteksian Spam Opinion (Junk Post dalam Forum) dapat Penulis selesaikan. Tugas Akhir ini disusun sebagai salah satu syarat untuk mendapatkan gelar Sarjana Teknik Fakultas Teknik Informatika Institut Teknologi Telkom. Dalam Tugas Akhir yang Penulis susun ini, Penulis menyadari bahwa masih banyak kekurangan. Oleh sebab itu, Penulis mengharapkan kritik dan saran guna memperbaiki Tugas Akhir ini. Penulis juga berharap dengan adanya Tugas Akhir yang Penulis susun ini semoga dapat bermanfaat bagi dunia pendidikan khususnya untuk civitas keluarga besar IT Telkom dan dapat dikembangkan kemudian. Bandung, Mei 2012

PENULIS

viii

Daftar Isi
ABSTRAK .................................................................................................................................... IV ABSTRACT .................................................................................................................................... V LEMBAR PERSEMBAHAN ...................................................................................................... VI KATA PENGANTAR ............................................................................................................... VIII DAFTAR ISI ................................................................................................................................. IX DAFTAR GAMBAR .................................................................................................................... XI DAFTAR TABEL........................................................................................................................ XII DAFTAR ISTILAH .................................................................................................................. XIII 1. PENDAHULUAN .................................................................................................................... 1 1.1 1.2 1.3 1.4 2. LATAR BELAKANG ............................................................................................................. 1 PERUMUSAN MASALAH ...................................................................................................... 2 TUJUAN .............................................................................................................................. 2 METODOLOGI PENYELESAIAN MASALAH ............................................................................ 3

LANDASAN TEORI ............................................................................................................... 4 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 TEXT MINING ...................................................................................................................... 4 OPINION SPAM .................................................................................................................... 5 TF-IDF .............................................................................................................................. 5 COSINE SIMILARITY ........................................................................................................... 6 SCALING DATA .................................................................................................................. 7 SUPPORT VECTOR MACHINE................................................................................................ 7 CROSS VALIDATION ......................................................................................................... 10 PENGUKURAN EVALUASI ................................................................................................. 10 KASKUS ........................................................................................................................... 11

3.

PERANCANGAN SISTEM ................................................................................................. 12 3.1 DESKRIPSI DAN ANALISIS SISTEM .................................................................................... 12 3.1.1 Gambaran Sistem .................................................................................................... 12 3.1.2 Gambaran Umum Sistem......................................................................................... 13 3.2 PERANCANGAN SISTEM .................................................................................................... 13 3.2.1 Kebutuhan Fungsional ............................................................................................ 13 3.2.2 Data Flow Diagram (DFD)..................................................................................... 14 3.2.3 Kamus Data ............................................................................................................. 15 3.2.4 Process Spesification ............................................................................................... 16 3.2.5 Entity Relationship Diagram ................................................................................... 20

4.

IMPLEMENTASI DAN ANALISIS HASIL PENGUJIAN .............................................. 22 4.1 LINGKUNGAN IMPLEMENTASI SITEM ............................................................................... 22 4.1.1 Spesifikasi Perangkat Lunak ................................................................................... 22 4.1.2 Spesifikasi Perangkat Keras .................................................................................... 22 4.2 PENGUJIAN SISTEM .......................................................................................................... 22 4.2.1 Dataset .................................................................................................................... 22 4.2.2 Tujuan Pengujian .................................................................................................... 23 4.2.3 Skenario Pengujian ................................................................................................. 23 4.3 ANALISIS HASIL PENGUJIAN ............................................................................................ 23 4.3.1 Analisis Skenario 1 .................................................................................................. 23 4.3.2 Analisis Skenario 2 .................................................................................................. 25 4.3.3 Analisis Skenario 3 .................................................................................................. 26 4.3.4 Analisis Skenario 4 .................................................................................................. 28

ix

4.3.5 5.

Analisis Keseluruhan Skenario................................................................................ 29

KESIMPULAN DAN SARAN ............................................................................................. 31 5.1 5.2 KESIMPULAN .................................................................................................................... 31 SARAN ............................................................................................................................. 31

DAFTAR PUSTAKA .................................................................................................................... 32 LAMPIRAN A: DATA PENGUJIAN ......................................................................................... 34 DATA THREAD ............................................................................................................................. 34 DATA POST (TRAIN)..................................................................................................................... 35 DATA POST (TEST) ....................................................................................................................... 46 LAMPIRAN B: KAMUS .............................................................................................................. 51 KAMUS STOPWORD ...................................................................................................................... 51

Daftar Gambar
GAMBAR 2-1 REPRESENTASI DOKUMEN DALAM RUANG VEKTOR[9] ................................................ 6 GAMBAR 2-2 SVM BERUSAHA UNTUK MENEMUKAN HYPERPLANE TERBAIK YANG MEMISAHKAN KEDUA KELAS -1 DAN +1 [14] .................................................................................................... 7 GAMBAR 2-3 HYPERPLANE TERBENTUK DIANTARA KELAS-1 DAN +1[14] ......................................... 8 GAMBAR 3-1 WORKFLOW DIAGRAM ............................................................................................... 12 GAMBAR 3-2 DIAGRAM KONTEKS ................................................................................................... 14 GAMBAR 3-3 DFD LEVEL 1 ............................................................................................................. 14 GAMBAR 3-4 DFD LEVEL 2 KLASIFIKASI SVM ............................................................................... 14 GAMBAR 3-5 DFD LEVEL 2 PENGUJIAN MODEL.............................................................................. 15 GAMBAR 3-6 DFD LEVEL 2 SIMULASI ............................................................................................. 15 GAMBAR 3-7 ENTITY RELATIONSHIP DIAGRAM ............................................................................... 20 GAMBAR 3-8 TABEL RELASI ............................................................................................................ 20 GAMBAR 4-1 GRAFIK PENGARUH PARAMETER C DENGAN AKURASI (TEST) SKENARIO 1 ............... 24 GAMBAR 4-2 GRAFIK PENGARUH PARAMETER C DENGAN AKURASI (TEST) SKENARIO 2 ............... 26 GAMBAR 4-3 GRAFIK PENGARUH PARAMETER C DENGAN AKURASI (TEST) SKENARIO 3 ............... 27 GAMBAR 4-4 GRAFIK PENGARUH PARAMETER C DENGAN AKURASI (TEST) SKENARIO 4 .............. 29 GAMBAR 4-5 GRAFIK AKURASI CV(TRAIN) DAN AKURASI (TEST) KESELURUHAN ........................ 29

xi

Daftar Tabel
TABEL 2-1 CONFUSION TABLE ......................................................................................................... 10 TABEL 3-1 PROCESS SPECIFICATION 1.1 .......................................................................................... 16 TABEL 3-2 PROCESS SPECIFICATION 1.2 .......................................................................................... 16 TABEL 3-3 PROCESS SPECIFICATION 1.3 .......................................................................................... 17 TABEL 3-4 PROCESS SPECIFICATION 1.4 .......................................................................................... 17 TABEL 3-5 PROCESS SPECIFICATION 1.5 .......................................................................................... 17 TABEL 3-6 PROCESS SPECIFICATION 1.6 .......................................................................................... 18 TABEL 3-7 PROCESS SPECIFICATION 2.1 .......................................................................................... 18 TABEL 3-8 PROCESS SPECIFICATION 2.2 .......................................................................................... 18 TABEL 3-9 PROCESS SPECIFICATION 2.3 .......................................................................................... 18 TABEL 3-10 PROCESS SPECIFICATION 2.4 ........................................................................................ 19 TABEL 3-11 PROCESS SPECIFICATION 2.5 ........................................................................................ 19 TABEL 3-12 PROCESS SPECIFICATION 2.6 ........................................................................................ 19 TABEL 3-13 PROCESS SPECIFICATION 3.1 ........................................................................................ 19 TABEL 3-14 PROCESS SPECIFICATION 3.2 ........................................................................................ 20 TABEL 3-15 TABEL ENTITAS THREAD.............................................................................................. 20 TABEL 3-16 TABEL ENTITAS POST ................................................................................................... 21 TABEL 4-1 HASIL PENGUJIAN SKENARIO 1 (TANPA PREPROCESSING, PEMBOBOTAN DENGAN TF) ... 24 TABEL 4-2 HASIL PENGUJIAN SKENARIO 2 (TANPA PREPROCESSING, PEMBOBOTAN DENGAN TF-IDF) ................................................................................................................................................. 25 TABEL 4-3 HASIL PENGUJIAN SKENARIO 3 (PENGHILANGAN STOPWORD, PEMBOBOTAN DENGAN TF) ................................................................................................................................................. 26 TABEL 4-4 HASIL PENGUJIAN SKENARIO 4 (PENGHILANGAN STOPWORD, PEMBOBOTAN DENGAN TFIDF) ......................................................................................................................................... 28

xii

Daftar Istilah
Dataset DFD Entity RelationshipDiagram Sekumpulan data mentah yang akan diolah, diuji, dan dianalisis. Data Flow Diagram yang menggambarkan aliran data pada suatu sistem informasi. suatu pemodelan data sistem yang menggunakan beberapa notasi untuk menggambarkan data dalam artian entitas-entitas dan hubungan relasi yang didiskripsikan oleh data tersebut. ERD merupakan salah satu teknik untuk mengorganisir dan mendokumentasi data sistem. Ruang dimensi yang berisi kumpulan vector dari suatu feature yang merepresentasikan suatu objek Suatu wadah diskusi yang membahas suatu topik antar sesama anggota Garis pemisah antar dua kelas Ruang masukan data sistem global dari seluruh jaringan komputer yang saling terhubung menggunakan standar Internet Protocol Suite (TCP/IP) untuk melayani miliaran pengguna di seluruh dunia Postingan sampah dalam forum yang biasanya tidak berguna dan tidak berkaitan dengan topic yang sedang dibahas Disiplin ilmu yang mempelajari bagaimana membuat computer/mesin mempunyai sebuah kecerdasan dan dapat belajar Deskripsi rinci setiap proses yang muncul pada DFD yang sudah tidak dapat didekomposisi lagi kata umum (common words) yang biasanya muncul dalam jumlah besar dan dianggap tidak memiliki makna. Sekumpulan kata hasil pemecahan dokumen atau teks otomatisasi proses bisnis yang meliputi perpindahan dokumen melalui suatu prosedur kerja

Feature Vector Forum Hyperplane Input Space Internet

Junk Post

Machine Learning

Process Spesification Stopword Term Workflow

xiii

1. Pendahuluan
1.1 Latar belakang

Perkembangan internet sampai saat ini sudah benar-benar menarik banyak minat dari segala bidang, mulai dari bidang pendidikan, bisnis, sosial, dan lain-lain. Internet sebagai sarana pemersatu orang untuk berkumpul di dunia maya sudah dirasakan memiliki banyak sekali manfaat untuk kehidupan, salah satunya informasi. Informasi yang beredar di internet sudah sangat up-to-date dan sering kali informasi tersebut lebih cepat sampai ketimbang melalui media lainnya, seperti koran, televisi, dan sarana komunikasi informasi lainnya. Fitur unik dari internet lainnya yang bisa menggabungkan pemikiran maupun opini-opini seseorang ialah forum. Forum dalam internet tidak jauh berbeda dengan forum dalam dunia nyata. Kegiatan utama dalam forum ialah saling berinteraksi satu sama lain dalam mengomentari kejadian ataupun kasus yang disajikan dalam forum itu. Setiap orang bebas memilih topik yang paling digemari dan disukai untuk terlibat aktif dalam forum tersebut. Adanya suatu wadah diskusi seperti forum ini bukan berarti tidak ada masalah dan selalu memberikan dampak positif untuk penggunanya. Banyak masalah yang harus dialami dalam forum. Salah satu yang menjadi bahasan dalam penelitian ini ialah mengenai masalah junk post (opini sampah) yang tidak berguna dan tidak ada keterkaitan antara opini tersebut dengan topik yang sedang dibahas. Analisis spam opinion bisa diterapkan untuk menangani postingan-potingan yang ada dalam forum[18], salah satunya mengenai masalah junk post ini. Junk post atau opini sampah ialah opini yang diberikan oleh seseorang terhadap suatu kasus, namun tidak memiliki bobot terhadap kasus tersebut. Postingan seperti ini dibuat oleh seseorang agar jumlah postingan orang tersebut semakin bertambah dan berharap bisa mendapat reputasi yang baik karena telah aktif dalam forum itu. Aktif disini bukan berarti orang tersebut benar-benar terlibat dalam setiap permasalahan yang ada pada forum, namun karena jumlah postingan yang didapatnya bukan dari pemikiran, melainkan hanya untuk mendapat reputasi yang baik dilihat dari jumlah postingan, tidak melihat dari sisi bagaimana opini tersebut kritis terhadap masalah yang ada. Masalah junk post ini hampir dirasakan di semua forum-forum yang beredar luas di internet. Hal ini dirasakan mengganggu mengingat dalam suatu forum yang seharusnya menjadi lahan diskusi untuk suatu topik, hanya dipakai sebagai sarana untuk menambah jumlah postingan dan mencari reputasi. Oleh karena itu, dirasakan perlu adanya suatu penanganan agar masalah junk post ini tidak berlarut-larut sehingga lebih mewujudkan forum yang benar-benar sebagai lahan diskusi. Pada penelitian ini, penulis ingin mengklasifikasikan bagaimana postingan atau opini yang termasuk junk atau tidak, sehingga ke depannya postingan seperti ini bisa lebih dikurangi dalam sebuah forum. Metode yang digunakan dalam masalah ini yaitu Support Vector Machine (SVM) untuk pengklasifikasian. Pemilihan metode ini dikarenakan SVM bisa diterapkan dalam hal kategorisasi teks[5] dan juga memberikan performansi yang lebih baik jika dibandingkan dengan metodemetode learning lainnya, seperti Nive Bayes, Bayesian network, atau Decision

Trees[8]. Selain itu juga, penerapan SVM pada kasus ini benar-benar linear classifier[14] karena menerapkan linier kernel untuk menentukan apakah postingan termasuk junk atau tidak. Metode SVM tidak memanfaatkan data yang banyak untuk bisa melakukan learning, sehingga metode ini cocok untuk kasus ini karena data dari forum bersifat private menyangkut kepentingan user masingmasing dan terbatas. Dalam penerapannya, dilakukan juga pembobotan postingan memanfaatkan nilai tf-idf karena dari penelitian yang ada, mengukur dimensi dari feature vector dengan Inverse Document frequency (IDF)-nya dapat meningkatkan performansi[12][17] dan menggunakan cosine similarity untuk menghitung nilai similarity dari postingan yang ada yang dikaitkan dengan topik yang sedang dibahas pada forum.

1.2

Perumusan masalah

Dengan mengacu latar belakang di atas, maka permasalahan yang dibahas dan diteliti adalah : 1. Bagaimana mengklasifikasikan suatu postingan/opini termasuk junk post atau tidak? 2. Bagaimana mengimplementasikan metode Support Vector Machine (SVM) dalam penanganan masalah ini? 3. Bagaimana akurasi prediksi yang dihasilkan dari metode Support Vector Machine (SVM)? Sedangkan batasan masalah dalam tugas akhir ini adalah : 1. Forum yang digunakan ialah forum Indonesia, sehingga pengklasifikasian junk atau tidak hanya untuk opini dalam bahasa indonesia 2. Data yang digunakan sebagai data training untuk melakukan pemodelan berasal dari forum-forum yang ada di indonesia, untuk yang paling sederhana penulis memakai dataset dari kaskus sebagai forum terbesar di Indonesia 3. Penelitian ini berfokus pada pengklasifikasian opini seperti apa yang termasuk junk atau tidak 4. Jumlah dataset yang digunakan bergantung kepada setiap forum dan atribut yang dipakai dalam masalah ini bergantung data dari forum tersebut dan akan disesuaikan untuk melakukan pengklasifikasiannya 5. Tidak membahas sistem data mining secara keseluruhan 6. Tidak online learning

1.3

Tujuan

Tujuan yang ingin dicapai dalam tugas akhir ini, yaitu: a. Mengklasifikasikan postingan yang termasuk junk atau tidak menggunakan metode Support Vector Machine (SVM) b. Menganalisis akurasi prediksi yang dihasilkan metode Support Vector Machine dalam penanganan kasus junk post ini.

1.4

Metodologi penyelesaian masalah

Metodologi yang digunakan dalam memecahkan masalah di atas adalah dengan menggunakan langkah-langkah berikut: 1. Studi literatur Pencarian literatur yang berhubungan dengan web mining, opinion spam, teori Support Vector Machine, teori tf-idf, teori cosine similarity. Literatur didapat dari perpustakaan IT Telkom, perpustakaan Lab DMC, jurnaljurnal online gratis di internet maupun jurnal online berlangganan yang dimiliki IT Telkom atau dari sumber-sumber lain. 2. Pengumpulan data Data Training yang dibutuhkan berasal dari forum kaskus sebagai forum terbesar di Indonesia 3. Analisis dan perancangan sistem Melakukan analisis dan perancangan terhadap sistem yang dibangun, menganalisis metode yang akan digunakan untuk penyelesaian masalah, termasuk dalam menentukan bahasa pemrograman yang digunakan, arsitektur, fungsionalitas, dan antarmuka sistem 4. Implementasi dan pembangunan sistem Secara umum prosedur yang dilakukan pada penelitian ini adalah: - Melihat secara keseluruhan bagaimana dataset yang ada, apakah perlu dilakukan feature selection untuk menentukan feature apa saja yang akan terpakai dalam penelitian ini - Melakukan analisis terhadap topik yang sedang dibicarakan dengan metode tf-idf - Melakukan pembobotan terhadap opini dalam dataset dibandingkan dengan topik yang sedang dibahas menggunakan metode tf-idf - Menghitung similarity antara opini denga topik yang ada dengan menggunakan cosine similarity - Melakukan proses klasifikasi dengan menggunakan metode SVM - Melakukan analisis hasil klasifikasi dengan data sebenarnya untuk menyesuaikan apakah opini termasuk junk atau tidak 5. Pengujian dan analisis Pengujian dan analisis meliputi: a. Pengujian untuk menentukan seberapa baik metode tf-idf dan cosine similarity digunakan b. Pengujian untuk menentukan hasil klasifikasi dari metode SVM c. Pengujian untuk menentukan lama proses klasifikasi sesuai dengan jumlah data yang ada d. Menganalisis penerapan metode SVM dengan tf e. Menganalisis penerapan metode SVM dengan tf-idf f. Pengambilan kesimpulan dan penyusunan laporan Tugas Akhir

2. Landasan Teori
2.1 Text Mining

Text mining sudah banyak didefinisikan oleh ahli riset dan praktisi[1][2] . Text mining memiliki definisi menambang data yang berupa teks di mana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata - kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisis keterhubungan antar dokumen. Text mining juga merupakan proses penemuan akan informasi atau trend baru yang sebelumnya tidak terungkap dengan memproses dan menganalisis data dalam jumlah besar. Text mining merupakan subjek riset yang tergolong baru. Text mining dapat memberikan solusi dari permasalahan seperti pemrosesan, pengorganisasian / pengelompokkan dan menganalisis unstructured text dalam jumlah besar. Sistem text mining terdiri dari komponen text preprocessing, feature selection, dan komponen data mining. Komponen text preprocessing berfungsi untuk mengubah data tekstual yang tidak terstruktur seperti dokumen, kedalam data terstruktur dan disimpan ke dalam basis data. Feature selection akan memilih kata yang tepat dan berpengaruh pada proses klasifikasi. Komponen terakhir akan menjalankan teknik data mining pada output dari komponen sebelumnya. Dalam memberikan solusi, text mining mengadopsi dan mengembangkan banyak teknik dari bidang lain, seperti Data mining, Information Retrieval, Statistik dan Matematik, Machine Learning, Linguistic, Natural Languange Processing, dan Visualization. Dalam menganalisis sebagian atau keseluruhan unstructured text, text mining mencoba untuk mengasosiasikan satu bagian text dengan yang lainnya berdasarkan aturan-aturan tertentu. Hasil yang di harapkan adalah informasi baru atau insight yang tidak terungkap jelas sebelumnya. Permasalahan yang dihadapi pada text mining sama dengan permasalahan yang terdapat pada data mining, yaitu jumlah data yang besar, dimensi yang tinggi, data dan struktur yang terus berubah, dan data noise. Perbedaan di antara keduanya adalah pada data yang digunakan. Pada data mining, data yang digunakan adalah structured data, sedangkan pada text mining, data yang digunakan text mining pada umumnya adalah unstructured data, atau minimal semistructured. Hal ini menyebabkan adanya tantangan tambahan pada text mining yaitu struktur text yang kompleks dan tidak lengkap, arti yang tidak jelas dan tidak standar, dan bahasa yang berbeda ditambah translasi yang tidak akurat. Struktur data yang baik dapat memudahkan proses komputerisasi secara otomatis. Sehingga text mining perlu melakukan preprocessing yang lebih kompeks daripada data mining karena data yang diolah berbentuk unstructured. Aplikasi text mining bisa dibagi berdasarkan tipe unstructured text yang diproses. Untuk Unstructured text dalam bentuk emails, instant messages dan blogs, pada umumnya pengguna ingin melakukan mining untuk mencari informasi mengenai orang (email pengirim, alamat, nama lengkap), perusahaan (nama lengkap dan lokasi), organisasi dan kejadian kejadian baru (penemuan baru, pengumuman penting). Untuk buku dan artikel sains, text mining bisa digunakan untuk mendeteksi trend di bidang riset tertentu. Salah satu cara yang bisa dilakukan adalah dengan memonitor jumlah publikasi untuk bidang riset tertentu

dalam jangka waktu tertentu. Hasil hasil untuk bidang riset yang berbeda bisa dibandingkan dan dianalisis guna memberikan hasil trend yang berarti. Untuk technical working paper, dokumentasi, dan software spesifikasi dokumen, text mining bisa di gunakan untuk mengekstrak software requirement dari spesifikasi dokumen secara otomatis atau mendeteksi ke kurangan antara source code dan documentasinya secara otomatis.

2.2

Opinion Spam

Salah satu hal mendasar adanya opinion spam ialah nilai ekonomi dan publikasi dari posisi ranking sebuah page yang diberikan oleh search engine[18]. Dalam konteks opini dalam web, permasalahannya sama. Ini menjadi hal yang sangat wajar jika seseorang mencari dan membaca opini dari suatu web dengan tujuan tertentu. Contohnya dalam pembelian barang, review suatu barang, dan lain-lain. Berdasarkan hal ini, spam opinion ada karena perilaku manusia yang mencoba memberikan opini yang semata-mata hanya ingin menarik minat dari masyarakat umum saja. Tidak jarang juga opini yang berbeda-beda tersebut dapat mempromosikan sesuatu yang salah yang bertujuan untuk merusak reputasi. Salah satu kemungkinan kombinasi metode yang digunakan dalam spam opinion yaitu mengklasifikasikan masalah dalam penentuan spam. Pengkategorisasian spam atau tidak dapat dilihat dari indikator yang menandakan hal tersebut termasuk spam atau tidak. Proses dimulai dengan memberikan label manual kepada data untuk dilakukan learning dengan metode klasifikasi. Hasilnya dapat digunakan untuk mengklasifikasikan setiap opini yang termasuk spam atau tidak. Sepanjang seseorang atau organisasi menggunakan opini dalam menentukan suatu keputusan, pembuat spam memiliki ruang gerak yang tidak terbatas seperti pada suatu review, diskusi maupun pada blog.

2.3

TF-IDF

Term Frequency (TF) merupakan frekuensi kemunculan term pada dokumen. TF suatu dokumen dengan dokumen yang lain akan berbeda, bergantung pada tingkat kepentingan sebuah term dalam dokumen. [7] Inverse Document Frequency (IDF) merupakan sebuah perhitungan dari bagaimana term didistribusikan secara luas pada koleksi dokumen yang bersangkutan. Semakin sedikit dokumen yang mengandung term yang dimaksud, maka nilai idf semakin besar. Jika setiap dokumen dalam koleksi mengandung term yang bersangkutan, maka nilai dari idf dari term tersebut adalah nol. Hal ini menunjukkan bahwa sebuah term yang muncul pada setiap dokumen dalam koleksi tidak berguna untuk membedakan dokumen berdasarkan topik tertentu. Nilai IDF sebuah term t dirumuskan dalam persamaan berikut: IDF(t) = log (N/df(t)) (2.1)

N adalah jumlah dokumen dan df(t) adalah jumlah dokumen yang mengandung term yang bersangkutan.

Dengan menggunakan tf-idf maka dapat diketahui deskripsi terbaik dari dokumen adalah term yang banyak muncul dalam dokumen tersebut dan sangat sedikt kemunculannya pada dokumen yang lain. Bobot terendah akan diberikan pada term yang muncul sangat jarang pada beberapa dokumen (low-frequency documents) dan term yang muncul pada hampir atau seluruh dokumen (highfrequency documents. Penelitian belakangan ini [16] telah mengkombinasikan TF dan IDF untuk menghitung bobot term dan menunjukkan bahwa gabungan keduanya menghasilkan performansi yang lebih baik. Kombinasi bobot dari sebuah term t pada text d didefinisikan sebagai berikut : TFIDF(d.t)=TF(d.t).IDF(t) (2.2)

Faktor TF dan IDF dapat berkontribusi untuk memperbaiki nilai akurasi, recall dan precision.

2.4

Cosine Similarity

Salah satu ukuran kemiripan teks yang paling populer adalah cosine similarity. Cosime Similarity dapat juga digunakan untuk mencari suatu kesamaan (similarity) antar dokumen. Pengertian dokumen dalam Tugas Akhir ini yaitu thread dan juga postingan dalam thread tersebut di suatu forum. Cosine similarity termasuk dalam metode vector space, yaitu mencari kesamaan antar dokumen melalui penggambaran vektor sebagai suatu dokumen. Representasi dua dokumen dalam ruang vector tiga dimensi sebagai berikut :

Gambar 2-1 Representasi Dokumen dalam Ruang Vektor[9] Cara menghitung similarity dengan menggunakan cosine similarity ialah dengan menghitung nilai cosinus sudut antara dua vektor. Jika terdapat dua vektor dokumen dj dan query q, serta t term diekstrak dari koleksi dokumen maka nilai cosinus antara dj dan q didefinisikan sebagai berikut [4]: ( )
| | | | ( )

(2.3)

2.5

Scaling Data

Scaling data sebelum diterapkan dalam klasifikasi data dengan menggunakan Support Vector Machine (SVM) sangat penting dikarenakan data yang ada dalam kasus, menyebar dengan range kontinu yang sangat beragam, sehingga agar data seragam, dilakukan scaling terlebih dahulu. Keuntungan digunakan scaling ialah untuk menghindari atribut dengan range yang besar mendominasi atribut dengan range kecil dan juga dengan dilakukan scaling, akan mempermudah pada saat komputasi program.[11]

2.6

Support Vector Machine

Support Vector Machine (SVM) pertama kali diperkenalkan oleh Vapnik pada tahun 1992 sebagai rangkaian harmonis konsep-konsep unggulan dalam bidang pattern recognition[14]. Sebagai salah satu metode pattern recognition, usia SVM terbilang masih relatif muda, namun menempatkannya sebagai state of the art dalam pattern recognition. SVM adalah metode learning machine yang bekerja atas prinsip Structural Risk Minimization (SRM) dengan tujuan menemukan hyperplane terbaik yang memisahkan dua buah kelas pada input space. Gambar 2-2 memperlihatkan beberapa pattern yang merupakan anggota dari dua buah kelas : +1 dan 1. Pattern yang tergabung pada class 1 disimbolkan dengan warna merah (kotak), sedangkan pattern pada kelas +1, disimbolkan dengan warna kuning (lingkaran). Problem klasifikasi dapat diterjemahkan dengan usaha menemukan garis (hyperplane) yang memisahkan antara kedua kelompok tersebut.[14]

Gambar 2-2 SVM berusaha untuk menemukan hyperplane terbaik yang memisahkan kedua kelas -1 dan +1 [14]

Gambar 2-3 Hyperplane terbentuk diantara kelas-1 dan +1[14] Hyperplane pemisah terbaik antara kedua kelas dapat ditemukan dengan mengukur margin hyperplane tersebut dan mencari titik maksimalnya. Margin adalah jarak antara hyperplane tersebut dengan pattern terdekat dari masingmasing kelas. Pattern yang paling dekat ini disebut sebagai support vector. Garis solid pada gambar 2-3 menunjukkan hyperplane yang terbaik, yaitu yang terletak tepat pada tengah-tengah kedua kelas, sedangkan titik merah dan kuning yang berada dalam lingkaran hitam adalah support vector. Usaha untuk mencari lokasi hyperplane ini merupakan inti dari proses pembelajaran pada SVM. Penerapan kernel pada Tugas Akhir ini menggunakan Linear Kernel. Linier Kernel merupakan kernel yang paling sederhana dalam SVM. Input pada pelatihan SVM terdiri dari poin-poin yang merupakan vektor dari angka-angka ril. Data yang tersedia dinotasikan sebagai i d sedangkan label masing-masing dinotasikan sebagai yi {-1,+1} untuk i = 1,2,,l, dimana l adalah banyaknya data. Diasumsikan kedua kelas -1 dan +1 dapat terpisah secara sempurna oleh hyperplane berdimensi d, yang didefinisikan [14] : . +b=0 (2.4)

Sebuah pattern i yang termasuk kelas -1 (sampel negative) dapat dirumuskan sebagai pattern yang memenuhi pertidaksamaan : sedangkan pattern
i i

+ b -1

(2.5)

yang termasuk kelas +1(sampel positif) :


i

+ b +1

(2.6)

Margin terbesar dapat ditemukan dengan memaksimalkan nilai jarak antara hyperplane dan titik terdekatnya, yaitu 1/ . Hal ini dapat dirumuskan sebagai Quadratic Programming (QP) problem, yaitu mencari titik minimal persamaan (2.7), dengan memperhatikan batasan persamaan (2.8).

(2.7) (2.8)

Permasalahan ini dapat dipecahkan dengan berbagai teknik komputasi, di antaranya Lagrange Multiplier sebagaimana ditunjukkan pada persamaan (2.9). (2.9)

i adalah Lagrange multipliers, yang bernilai nol atau positif. Nilai optimal dari persamaan (2.9) dapat dihitung dengan meminimalkan L terhadap dan b , dan memaksimalkan L terhadap i. Dengan meperhatikan sifat bahwa pada tiik optial gradient L=0, persamaan (2.9) dapat dimodfikasi sebagai maksimalisasi yang hanya mengandung i saja, yaitu yang memenuhi, (2.11) (2.10)

Dari hasil perhitungan diatas didapatlah yang kebanyakan bernilai positif. Data yang berkorelasi dengan yang positif inilah yang disebut sebagai support vector. Setelah menemukan support vector, maka hyperplane pun dapat ditentukan. Penjelasan SVM di atas berlaku jika kedua buah kelas dapat dipisahkan secara sempurna oleh hyperplane. Akan tetapi, pada umumnya input space tidak dapat dipisahkan secara sempurna sehingga menyebabkan batasan pada persamaan (2.8) tidak dapat terpenuhi, sehingga optimisasi tidak dapat dilakukan. Untuk mengatasi permasalahan ini, maka SVM dirumus ulang dengan menggunakan teknik soft margin. Dengan menggunakan teknik soft margin, persamaan (2.8) dimodifikasi dengan memasukan slack variabel dan sebuah fungsi penalty sebagai berikut [13] : dimana dan dengan demikian persamaan (2.7)

(2.12)

(2.13)

Parameter C dipilih untuk mengatur trade off antara margin dan error klasifikasi . Nilai C yang besar berarti akan memberikan penalty yang lebih besar terhadap error klasifikasi tersebut.

2.7

Cross Validation

Cross validation merupakan suatu teknik untuk menguji performansi dari model pada sebuah data yang independen. Mekanisme pengujian pada cross validation ialah dengan melakukan pengecekan terhadap data itu sendiri (independen). Pengecekan tersebut melibatkan beberapa subset data dengan cara membagi data tersebut ke dalam satu subset (training set) dan memvalidasi analisis pada subset lainnya. Cross Validation dilakukan secara berulang dengan partisi yang berbeda-beda dan hasilnya dirata-ratakan sampai pratisi habis. Fold (k) ialah parameter dalam cross validation yang akan membagi data ke dalam k subset data. Perulangan akan dilakukan terhadap satu subset yang diuji sampai k-1 subset. Cross Validation dapat mencegah terjadinya overfitting. Dalam sistem penanganan junk post ini, teknik cross validation digunakan untuk menentukan parameter C terbaik dalam SVM dengan melihat hasil pengujian yang berupa akurasi yang dihasilkan[11].

2.8

Pengukuran Evaluasi

Pengujian keefektifan atau kualitas hasil suatu klasifikasi dibutuhkan suatu pengukuran yang disebut evaluation measure. Skenario pengukuran dapat dibagi menjadi dua, yaitu macro-averaging dan micro-averaging [15] : a. Micro-averaging Diberikan sebuah set confusion table. Dibangun sebuah tabel baru dimana setiap sel pada tabel merepresentasikan jumlah dari dokumen yang bersesuaian dengan kolom maupun baris pada tabel tersebut. b. Macro-averaging Diberikan sebuah confusion table. Dibangun sebuah tabel baru dimana setiap sel pada tabel merepresentasikan nilai presisi atau recall dari setiap kategori. Tabel 2-1 Confusion Table Machine Says Positif Negatif Human Positif True Positif (TP) False Negative (FN) says Negatif False Positif (FP) True Negative (TN) Dalam Tugas Akhir ini, micro-averaging dipilih karena berdasarkan [13], micro-averaging memiliki performansi yang lebih baik jika dbandingkan dengan macro-averaging. Dengan menggunakan micro-averaging, perhitungan akurasi bisa didapatkan dengan menggunakan rumus: (2.14)

10

2.9

Kaskus

Penelitian pada Tugas Akhir ini menggunakan data dari forum Kaskus. Kaskus berdiri pada tanggal 6 November 2000 di Amerika Serikat (Washington) oleh tiga mahasiswa Indonesia. Kaskus merupakan gabungan dari kata KASAK & KUSUK. Tujuan awal dari didirikannya komunitas ini adalah untuk mempersatukan manusia-manusia Indonesia dalam / luar negeri dalam satu Komunitas. Kaskus selalu berusaha memberikan kebebasan berbicara & berfikir bagi anggota, karena kami menganut asas "Freedom Of Speech" dimana merupakan salah satu basic dari Human Rights. Pada bulan Agustus 2005, situs Kaskus mendapatkan penghargaan sebagai "The Best Indonesian Community" oleh PC Magazine Indonesia, pada saat itu member Kaskus sudah mencapai 110.000 anggota. Klasifikasi postingan yang termasuk junk atau tidak ialah sebagai berikut (dikutip dari situs kaskus.com) : One liner postingan seperti: nice info gan, mantap gan, menyimak dulu gan, keren gan, mungkin bawah ane tau gan, dan sebagainya ( tidak ada komentar spesifik yang sesuai dengan topik ). Tulisan pertamax, keduax, ketigax, page one, gagal pertamax, atas ane cepet banget gan,dsb tanpa disertai komentar lain yang sesuai dengan topik, termasuk disini gambar-gambar pertamax, dsb yang diposting tanpa komentar lain yang sesuai dengan topik. Gambar-gambar yang terlalu besar dan tidak senonoh juga termasuk akan didelete. Mantra: asfdggfh, fjfkflsl, dsb Copy paste postingan. Memosting hanya berupa emoticon ( ilovekaskus,sup,maho, dsb ). Spam berupa promosi/ngiklan/link ke lapak dalam setiap postingan. Spamming yang mengganggu kenyamanan forum dan user lain, bersifat merusak trid seperti spamming gambar yang menghina SARA, gambar BB17/porno, gambar DP/disturbing pictures, longcat/bandwith killer images, flash/video/lagu yang mengganggu, dan sebagainya. Postingan ngobrol/chatting di trid yang sudah Out Of Topic, tanpa multiquote. Postingan yang bersifat trolling/flaming ( menghina, kasar, dan sebagainya). Postingan double, tripple, dan seterusnya. Menyundul trid secara berlebihan. Dalam forum kaskus, dikenal adanya suatu thread dan juga post. Thread ialah topik yang dibahasa oleh pembuat topik dengan tujuan ingin menyampaikan bahasan maupun pendapatnya kepada forum. Sedangkan post ialah komentarkomentar yang disampaikan oleh pengguna aktif forum untuk menanggapi topik yang sedang dibahas. Data forum pada umumnya merupakan data yang berbeda dengan artikel Bahasa Indonesia lainnya. Dalam data ini tidak semua struktur kalimat disajikan secara baku dan juga penulisan untuk tiap kata tidak selalu sesuai dengan ejaan pada umumnya. Dalam kata-kata ini juga terdapat penyingkatan untuk kata yang dianggap umum digunakan dalam proses komunikasi sehari-hari.

11

3. Perancangan Sistem
3.1
3.1.1

Deskripsi dan Analisis Sistem


Gambaran Sistem
Data Forum

thread

Data thread or post?

post

Processing Data

Tokenisasi Stopword indexing

Preprocessing Data

Tokenisasi Stopword Indexing

Dengan TF Dengan TF-IDF

Pembobotan Data

train

Train/test?

test

Similarity Pembobotan Data Dengan TF Dengan TF-IDF

Cross Validation untuk penentuan parameter C

Pemodelan dengan SVM Similarity

Model Data

Hasil Pengujian

Akurasi

Gambar 3-1 Workflow Diagram

12

3.1.2

Gambaran Umum Sistem

1. Sistem yang dibuat berbentuk halaman web pada umumnya dengan beberapa menu tampilan, seperti Home, Data, Preprocessing, Training, Testing dan juga Simulasi. 2. Tampilan Home berisi halaman pembuka web yang berisi informasi mengenai forum yang turut terlibat dalam pembuatan tugas akhir ini. 3. Tampilan Data berisi informasi mengenai data yang digunakan dalam pengujian tugas akhir ini. Data yang digunakan dalam sistem ini yaitu data suatu topik beserta postingan dalam suatu forum. 4. Tampilan Preprocessing merupakan tampilan untuk melakukan preprocessing terhadap data. Preprocessing dapat dilakukan jika data terpilih terlebih dahulu. Jika data tidak terpilih, maka proses ini tidak dapat dijalankan. Output dari proses ini ialah menghasilkan file yang akan dipergunakan untuk training dan testing sesuai scenario masing-masing. 5. Tampilan Training digunakan untuk melakukan training terhadap data yang dihasilkan oleh proses preprocessing sebelumnya. Dalam proses ini, training dilakukan berdasarkan scenario yang terdapat pada sistem ini dan melakukan penentuan parameter C yang paling tepat untuk masing-masing scenario. User memilih scenario apa yang akan digunakan dalam proses training dan juga menentukan nilai parameter C yang paling sesuai. Parameter dapat dikatakan baik dilihat dari hasil akurasi cross validation data training tersebut dengan parameter C yang ditentukan sebelumnya. 6. Tampilan Testing digunakan untuk melakukan testing terhadap data testing yang sudah dilakukan preprocessing sebelumnya. Testing dilakukan berdasarkan model yang telah dibuat dalam proses training. Hasil output proses ini yaitu nilai akurasi untuk masing-masing scenario. Tampilan Simulasi digunakan untuk mensimulasikan keadaan suatu forum dimana ada suatu topic pembahasan yang bisa dikomentari oleh anggota forum. User bebas menentukan postingan yang ingin disampaikan namun dalam prosesnya akan dilakukan pengecekan terhadap model yang telah dibuat sebelumnya, sehingga sistem bisa menilai apakah komentar yang disampaikan termasuk komentar junk atau tidak.

3.2
3.2.1

Perancangan Sistem
Kebutuhan Fungsional

Kemampuan yang harus dimiliki oleh sistem: 1. Sistem mampu melakukan text preprocessing meliputi tokenisasi teks, stopword removal, dan indexing. 2. Sistem mampu melakukan pembobotan dengan tf saja dan juga tf-idf. 3. Sistem mampu melakukan validasi dengan cross validation dalam penentuan parameter C dalam SVM 4. Sistem mampu menghasilkan data training dan juga testing yang siap diterima oleh SVM 5. Sistem mampu menghasilkan model dari proses training data 6. Sistem mampu menampilkan performansi dari SVM dalam bentuk akurasi

13

3.2.2

Data Flow Diagram (DFD)


parameter_svm, posting_komentar Sistem filter spam opinion forum hasil_prediksi, akurasi

User

Gambar 3-2 Diagram Konteks

parameter_svm

1.0 Klasifikasi SVM

model_svm

model model_svm

user

model_svm posting_komentar

2.0 Pengujian Model

hasil_prediksi

3.0 Simulasi

akurasi

Gambar 3-3 DFD Level 1

thread

data_thread data_train

1.1 Preprocessing Data

Data_hasil

1.2 Pembobotan TF

bobot_data_TF

1.4 Cosine Similarity

post Bobot_data_TFIDF Data_hasil data_olah 1.3 Pembobotan TF-IDF 1.5 Scaling data_scale Parameter_svm 1.6 Klasifikasi SVM

Model_svm

Gambar 3-4 DFD Level 2 Klasifikasi SVM

14

post

data_test 2.1 Preprocessing Data data_hasil 2.2 Pembobotan TF bobot_data_TF 2.4 Cosine Similarity

bobot_data_TFIDF data_hasil data_olah 2.3 Pembobotan TF-IDF 2.5 Scaling data_scale model_svm model 2.6 Pengujian

akurasi

Gambar 3-5 DFD Level 2 Pengujian Model

model Posting_komentar

model_svm

data_hasil_simmulasi 3.2 Simulasi dengan model hasil klasifikasi SVM hasil_prediksi

3.1 Olah Sesuai format sistem

Gambar 3-6 DFD Level 2 Simulasi 3.2.3 Kamus Data = array <1x1 string> = array <400x1 string> = array <4x1 string> = array <280x1 string> = array <120x1 string> = array

Data store thread post model data_train data_test model_svm Arus Data parameter_svm posting_komentar hasil_prediksi akurasi

= number = string = number = number

15

bobot_data_TF bobot_data_TFIDF data_olah data_scale data_hasil data_hasil_simulasi number string 3.2.4

= number = number = number = number = string = number = [0-9] = [a-z][A-Z][1-9]

Process Spesification

Tabel 3-1 Process Specification 1.1 No. Proses 1.1 Nama Proses Preprocessing data Input data_train, data_thread Output data_hasil Logika Proses For i=1 sampai jumlah data_thread Lakukan tokenisasi terhadap teks Penghilangan stopword dan tanda baca end for For i=1 sampai jumlah data_train yang termasuk thread Lakukan tokenisasi terhadap teks Penghilangan stopword dan tanda baca end for Tabel 3-2 Process Specification 1.2 1.2 Pembobotan TF data_hasil bobot_data_TF

No. Proses Nama Proses Input Output Logika Proses For i=1 sampai jumlah data_thread Lakukan indexing terhadap data dengan thread Hitung frequensi kata yang ada dalam data_thread Hitung banyaknya term untuk mencari lenght data_thread end for For i=1 sampai jumlah data_train Lakukan indexing terhadap data dengan thread Hitung frequensi kata yang ada dalam data_thread dan juga data_train Hitung banyaknya term untuk mencari lenght data_train end for

16

No. Proses Nama Proses Input Output Logika Proses For i=1 sampai jumlah data_thread Lakukan indexing terhadap data dengan thread Hitung frequensi jumlah kata yang muncul di semua data_thread (IDF) Hitung frequensi kata yang ada dalam data_thread Hitung banyaknya term untuk mencari lenght data_thread Kalikan nilai IDF dengan frequensi kata Kalikan nilai IDF dengan jumlah term end for For i=1 sampai jumlah data_train Lakukan indexing terhadap data dengan thread Hitung frequensi jumlah kata yang muncul di semua data_thread (IDF) Hitung frequensi kata yang ada dalam data_thread dan juga data_train Hitung banyaknya term untuk mencari lenght data_train Kalikan nilai IDF dengan frequensi kata Kalikan nilai IDF dengan jumlah term end for Tabel 3-4 Process Specification 1.4 No. Proses 1.4 Nama Proses Perhitungan Cosine Similarity Input bobot_data_TF, bobot_data_TFIDF Output data_olah Logika Proses For i=1 sampai jumlah data_train Hitung nilai similarity berdasarkan jumlah frequensi dan length data dengan melibatkan bobot data sebelumnya end for Tabel 3-5 Process Specification 1.5 1.5 Scaling data data_olah data_scale

Tabel 3-3 Process Specification 1.3 1.3 Pembobotan TF-IDF data_hasil bobot_data_TFIDF

No. Proses Nama Proses Input Output Logika Proses For i=1 sampai jumlah data_train Scale data ke dalam range [0-1] end for

17

No. Proses Nama Proses Input Output Logika Proses For j=1 sesuai keinginan user Lakukan perubahan nilai parameter_svm berdasarkan inputan manual For i=1 sampai jumlah data_scale Cek akurasi cross validation end for end for Tabel 3-7 Process Specification 2.1 2.1 Preprocessing data data_test data_hasil

Tabel 3-6 Process Specification 1.6 1.6 Klasifikasi SVM data_scale, parameter_svm model_svm

No. Proses Nama Proses Input Output Logika Proses For i=1 sampai jumlah data_test Lakukan tokenisasi terhadap teks Penghilangan stopword dan tanda baca end for

No. Proses Nama Proses Input Output Logika Proses For i=1 sampai jumlah data_hasil Lakukan indexing terhadap data dengan thread Hitung frequensi kata yang ada dalam data_test Hitung banyaknya term untuk mencari lenght data_test end for Tabel 3-9 Process Specification 2.3 2.3 Pembobotan TF-IDF data_hasil bobot_data_TFIDF

Tabel 3-8 Process Specification 2.2 2.2 Pembobotan TF data_hasil bobot_data_TF

No. Proses Nama Proses Input Output Logika Proses For i=1 sampai jumlah data_test Lakukan indexing terhadap data dengan test Hitung frequensi jumlah kata yang muncul di semua data_test (IDF) Hitung frequensi kata yang ada dalam data_test Hitung banyaknya term untuk mencari lenght data_test

18

Kalikan nilai IDF dengan frequensi kata Kalikan nilai IDF dengan jumlah term end for Tabel 3-10 Process Specification 2.4 2.4 Perhitungan Cosine Similarity bobot_data_TF, bobot_data_TFIDF data_olah

No. Proses Nama Proses Input Output Logika Proses For i=1 sampai jumlah data_train Hitung nilai similarity berdasarkan jumlah frequensi dan length data dengan melibatkan bobot data sebelumnya end for Tabel 3-11 Process Specification 2.5 2.5 Scaling data data_olah data_scale

No. Proses Nama Proses Input Output Logika Proses For i=1 sampai jumlah data_test Scale data ke dalam range [0-1] end for

Tabel 3-12 Process Specification 2.6 No. Proses 2.6 Nama Proses Pengujian sistem Input data_test, model_svm Output akurasi Logika Proses For i=1 sampai jumlah data_test Cek model_svm terhadap data_test end for Tabel 3-13 Process Specification 3.1 3.1 Penyesuaian format sistem posting_komentar data_hasil_simulasi

No. Proses Nama Proses Input Output Logika Proses For i=1 (sekali memasukkan postingan) Lakukan tokenisasi terhadap teks Penghilangan stopword dan tanda baca Lakukan indexing Hitung frequensi kata Hitung banyaknya term untuk mencari lenght postingan_komentar

19

Hitung nilai cosine similarity end for Tabel 3-14 Process Specification 3.2 3.2 Simulasi Sistem data_hasil_simulasi, model_svm hasil_prediksi

No. Proses Nama Proses Input Output Logika Proses For i=1 (sekali memasukkan postingan) Cek model_svm terhadap data_hasil_simulasi end for 3.2.5 Entity Relationship Diagram

Id_thread

Judul

Id_post

posting

1 Thread memiliki

N Post

isi

status

tipe

kelas

Gambar 3-7 Entity Relationship Diagram


Thread PK id_thread judul isi status FK1 PK post id_post posting tipe kelas id_thread

Gambar 3-8 Tabel Relasi Tabel 3-15 Tabel Entitas Thread


Atribut Id_thread Judul Isi status Integer Varchar Varchar Integer Tipe Data Keterangan Id thread Judul suatu topik Isi topik Status terpilih data

20

Tabel 3-16 Tabel Entitas Post


Atribut Id_post posting Tipe Kelas Id_thread Integer Varchar Varchar Integer Integer Tipe Data Keterangan Id post Isi postingan Tipe data Kelas postingan Id thread suatu post

21

4. Implementasi dan Analisis Hasil Pengujian


4.1 Lingkungan Implementasi Sitem

4.1.1 Spesifikasi Perangkat Lunak Perangkat lunak yang digunakan untuk membangun aplikasi antara lain: 1. Sistem Operasi: Windows 7 2. XAMPP 1.7.7 VC9 3. Text Editor : Notepad++ dan Aptana Studio 4. Web browser : Mozilla Firefox 11 4.1.2 Spesifikasi Perangkat Keras Perangkat keras yang digunakan untuk membangun aplikasi antara lain: 1. Processor : Intel Core i3 2. Memory : 4GB 3. Hardisk : 500GB 4. Monitor dengan resolusi 1360x768 pixel

4.2
4.2.1

Pengujian Sistem
Dataset

Dataset yang digunakan dalam pengujian sistem ini adalah data forum yang berupa thread atau topik pembahasan dalam suatu forum dan juga postingan komentar dari anggota forum lainnya. Data didapat dari forum terbesar di Indonesia yaitu Kaskus. Dalam data ini, dipisahkan menjadi dua bagian data, yaitu data thread dan juga data postingan. Data thread ini berisi tentang topik pembahasan yang disajikan dalam forum. Sedangkan data postingan berisi komentar-komentar terhadap topik tersebut. Data postingan dipisahkan kembali menjadi dua bagian, yaitu data training dan testing yang memiliki fungsi yang berbeda. Data training digunakan sebagai data yang akan digunakan dalam proses learning, sedangkan data testing digunakan sebagai data pengujian hasil learning sebelumnya. Pembagian untuk data training dan juga testing yaitu 70% data postingan sebagai data training dan 30% sebagai data testing. Data training berjumlah 280 data yang terdiri dari dua kelas yang berbeda yaitu -1 untuk data yang termasuk junk dan juga 1 untuk data yang termasuk non-junk. Perbandingan untuk dua kelas tersebut ialah data junk ada sebanyak 158 data sedangkan data non-junk sebanyak 122 data. Tidak jauh berbeda dengan data training, data testing terdiri dari dua kelas pula namun dengan jumlah data yang lebih sedikit. Data testing berjumlah 120 data dengan perbandingan untuk dua kelas dalam data testing yaitu data junk ada sebanyak 68 data dan data non-junk sebanyak 52 data. Penentuan kelas data termasuk junk atau tidak dilakukan secara manual untuk kedua data, data training dan data test. Penentuan ini menggunakan informasi klasifikasi postingan yang termasuk junk atau tidak berdasarkan aturan dari situs penyedia, yaitu Kaskus. Dikarenakan dilakukan secara manual, bisa saja terjadi

22

human error dalam proses pelabelan data yang menyebabkan karakteristik antara data training dan juga data testing berbeda. 4.2.2 Tujuan Pengujian

Tujuan dilakukannya pengujian ini adalah sebagai berikut : a. Mengetahui pengaruh preprocessing data dalam pembentukan model Support Vector Machine. b. Mengetahui preprocessing data terbaik yang dapat diterapkan dalam kasus penanganan spam opinion khususnya untuk filter junk post forum. c. Mengetahui pengaruh parameter C pada performansi Support Vector Machine. 4.2.3 Skenario Pengujian

Pengujian sistem ini dilakukan dengan beberapa percobaan. Percobaan-percobaan ini dilakukan untuk mengetahui pengaruh tiap-tiap parameter pada tiap-tiap dataset terhadap performansi sistem. Berikut ini adalah percobaan-percobaan yang dilakukan : 1. Pengolahan data tanpa preprocessing (pembobotan menggunakan tf) 2. Pengolahan data tanpa preprocessing (pembobotan menggunakan tf-idf) 3. Pengolahan data dengan stopword removal (pembobotan menggunakan tf) 4. Pengolahan data dengan stopword removal (pembobotan menggunakan tf-idf) Keempat skenario pengujian di atas mampu menjawab hal-hal yang menjadi tujuan pengujian pada sistem ini. Dalam keempat skenario di atas, yang menjadi pembanding untuk masing-masing skenario pengujian yaitu data hasil preprocessing. Preprocessing yang diterapkan dalam pengujian ini berbeda-beda dan dapat mempengaruhi hasil pemodelan yang dilakukan oleh sistem. Dari keempat skenario tersebut dapat ditarik kesimpulan manakah preprocessing yang paling tepat dalam penanganan kasus junk post ini. Semakin banyak preprocessing yang dilakukan terhadap data, akan mempengaruhi performansi data tersebut dalam sistem. Begitu pula dengan pengaruh parameter C ketika data hasil preprocessing berbeda-beda dilakukan pengujian, dapat ditarik kesimpulan juga bahwa seberapa pengaruhnya parameter C ini terhadap performansi sistem.

4.3

Analisis Hasil Pengujian

4.3.1 Analisis Skenario 1 Pengujian yang dilakukan pada skenario ini adalah membandingkan pengaruh parameter C dalam SVM terhadap performansi dataset jika tanpa dilakukan preprocessing. Pembobotan yang digunakan dalam skenario ini hanya menggunakan TF saja. Penentuan parameter C yang baik dapat dilihat dari hasil akurasi cross validation pada data train tersebut. Berikut hasil pengujian pada skenario 1 :

23

Tabel 4-1 Hasil Pengujian Skenario 1 (tanpa preprocessing, pembobotan dengan TF)
Skenario Parameter C 1 5 10 15 20 25 30 35 40 45 50 Rata-rata Akurasi CV (train) 77.14% 79.29% 82.86% 80.36% 80.71% 81.43% 81.07% 81.43% 81.79% 81.07% 81.79% 80.81% Akurasi (Test) 79.17% 69.17% 66.67% 64.17% 63.33% 63.33% 63.33% 63.33% 63.33% 62.50% 62.50% 65.53%

Dari

tabel 4-1, pemilihan parameter C dapat mempengaruhi dalam penentuan model hasil klasifikasi. Pengujian skenario 1 menunjukkan bahwa rata-rata akurasi cross validation yang dihasilkan saat training data ialah 80.81%. Akurasi cross validation berfungsi untuk menentukan parameter C terbaik dari serangkaian percobaan. Dari hasil di atas, parameter C terbaik yaitu 10. Namun ketika model diuji coba terhadap data testing, nilai C=10 menghasilkan akurasi yang lebih buruk dibandingkan C=1. Hal ini terjadi karena karakteristik data yang digunakan dalam proses training berbeda dengan testing. Hal ini berdampak kepada akurasi yang diberikan oleh model yang telah dibuat sebelumnya tidak terlalu baik dalam melakukan klasifikasi data sehingga ketika data dengan toleransi tradeoff yang rendah (C=1), memberikan hasil yang baik terhadap data testing.

Akurasi (Test)
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 1 5 10 15 20 25 30 35 parameter C 40 45 50 Akurasi

Gambar 4-1 Grafik Pengaruh Parameter C dengan Akurasi (Test) Skenario 1

24

Berdasarkan grafik di atas, nilai akurasi menunjukkan penurunan jika parameter C terus dinaikkan. Hal ini menandakan parameter C yang berfungsi sebagai parameter untuk mengatur trade off kesalahan memiliki peranan dalam penentuan akurasi. Semakin besar nilai C, akan memberikan penalty yang lebih besar terhadap error klasifikasi yang berakibat akurasi data saat dilakukan testing menjadi menurun. 4.3.2 Analisis Skenario 2

Pengujian yang dilakukan pada skenario ini adalah membandingkan pengaruh parameter C dalam SVM terhadap performansi dataset jika tanpa dilakukan preprocessing. Pembobotan yang digunakan dalam skenario ini hanya menggunakan TF-IDF. Penentuan parameter C yang baik dapat dilihat dari hasil akurasi cross validation pada data train tersebut. Berikut hasil pengujian pada skenario 2 : Tabel 4-2 Hasil Pengujian Skenario 2 (tanpa preprocessing, pembobotan dengan TF-IDF)
Skenario Parameter C 1 5 10 15 20 25 30 35 40 45 50 Rata-rata Akurasi CV (train) 79.64% 83.93% 84.29% 84.64% 84.29% 84.29% 83.93% 82.86% 84.64% 84.29% 84.29% 83.83% Akurasi (Test) 80.83% 79.17% 77.50% 78.33% 77.50% 78.33% 78.33% 78.33% 78.33% 78.33% 78.33% 78.48%

Dari tabel 4-2, nilai akurasi cross validation menunjukkan hasil yang lebih baik jika dibandingkan dengan skenario 1. Hal ini membuktikan bahwa penerapan preprocessing dengan TF-IDF lebih baik jika dibandingkan dengan preprocessing dengan menggunakan TF saja. Pengujian skenario 2 menunjukkan bahwa ratarata akurasi cross validation yang dihasilkan saat training data ialah 83.83%. Hasil ini lebih baik dibanding akurasi cross validation skenario 1 yang hasilnya 80.81%. Dari hasil di atas, parameter C terbaik yaitu nilai C sama dengan 15 dan 40. Penetuan parameter C berguna dalam memberikan tradeoff kesalahan terhadap error klasifikasi. Dalam skenario ini, parameter C terlihat hampir merata untuk keseluruhan percobaan, berkisar antara 79,64% hingga 84,64%. Perbedaan antara akurasi data training maupun testing sekitar 5% saja. Hal ini membuktikan bahwa model yang dihasilkan dari proses training mampu mengklasifikasikan data testing dengan baik, dengan hasil rata-rata akurasi mencapai 78,48%.

25

Akurasi (Test)
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 1 5 10 15 20 25 30 35 40 45 50 parameter C

Akurasi (Test)

Gambar 4-2 Grafik Pengaruh Parameter C dengan Akurasi (Test) Skenario 2 Grafik akurasi testing di atas berbeda dengan skenario 1 yang menunjukkan hasil penurunan jika parameter C dinaikkan. Dalam skenario 2 ini, parameter C menunjukkan penurunan hasil akurasi, namun pada saat C=15 menunjukkan hasil akurasi yang lebih baik dibandingkan C=10. Berdasarkan hasil ini, C yang terbaik untuk skenario 2 saat C=15. Dibuktikan juga dengan hasil akurasi cross validation yang baik saat C=15. Akurasi testing terbaik saat C=1 atau saat C rendah. Hal ini terjadi karena jika semakin besar C yang digunakan dalam proses klasifikasi akan memberikan trade off kesalahan yang lebih besar, sehingga akurasi dapat menurun. 4.3.3 Analisis Skenario 3

Pengujian yang dilakukan pada skenario ini adalah membandingkan pengaruh parameter C dalam SVM terhadap performansi dataset dengan melakukan penghilangan stopword terhadap dataset. Penghilangan stopword memberikan hasil yang berbeda jika dibandingkan dengan skenario-skenario sebelumnya. Pembobotan yang digunakan dalam skenario ini yaitu menggunakan TF saja. Penentuan parameter C yang baik dapat dilihat dari hasil akurasi cross validation pada data train tersebut. Berikut hasil pengujian pada skenario 3 : Tabel 4-3 Hasil Pengujian Skenario 3 (penghilangan stopword, pembobotan dengan TF)
Skenario Parameter C 1 5 10 15 20 25 Akurasi CV (train) 68.21% 75.36% 76.43% 78.93% 79.29% 77.86% Akurasi (Test) 66.67% 60% 58.33% 58.33% 58.33% 58.33%

26

30 35 40 45 50 Rata-rata

78.21% 77.50% 78.93% 80% 78.21% 77.18%

58.33% 58.33% 58.33% 58.33% 58.33% 59.24%

Hasil tabel 4-3 menunjukkan penurunan dalam akurasi, baik akurasi menggunakan cross validation, maupun akurasi saat testing. Perbedaan antara skenario 3 dan 1 yaitu hanya terletak pada proses penghilangan stopword saja. Rata-rata akurasi cross validation pada skenario 1 yaitu 80.81%, sedangkan pada skenario 3 ini 77.18%. Penurunan disebabkan oleh kamus stopword yang digunakan dalam skenario ini yang umumnya kamus tersebut digunakan saat pengklasifikasian kasus lain, sehingga apabila diterapkan dalam kasus junk post ini menunjukkan hasil yang tidak terlalu baik. Nilai parameter C yang terbaik berdasarkan tabel di atas yaitu C=45. Nilai parameter ini memberikan perubahan yang berbeda dengan skenario sebelumnya karena nilai C dalam skenarioskenario sebelumnya tidak sebesar nilai C ketika dilakukan preprocessing. Hal ini menunjukkan SVM memberikan threshold penalty yang cukup besar jika dilakukan preprocessing pada data.

Akurasi (Test)
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 1 5 10 15 20 25 30 35 40 45 50 parameter C Akurasi (Test)

Gambar 4-3 Grafik Pengaruh Parameter C dengan Akurasi (Test) Skenario 3 Grafik di atas menunjukkan penurunan untuk setiap parameter C yang terus naik. Hasil ini sama dengan hasil pada skenario 1 dimana hasilnya pun menurun untuk setiap parameter C yang dinaikkan. Tidak jauh berbeda dengan scenario 1, grafik menurun dikarenakan semakin besar nilai C, akan memberikan penalty yang lebih besar terhadap error klasifikasi yang berakibat akurasi data saat dilakukan testing menjadi menurun.

27

4.3.4

Analisis Skenario 4

Pengujian yang dilakukan pada skenario ini adalah membandingkan pengaruh parameter C dalam SVM terhadap performansi dataset dengan melakukan penghilangan stopword terhadap dataset. Penghilangan stopword memberikan hasil yang berbeda jika dibandingkan dengan skenario-skenario sebelumnya. Pembobotan yang digunakan dalam skenario ini yaitu menggunakan TF-IDF. Penentuan parameter C yang baik dapat dilihat dari hasil akurasi cross validation pada data train tersebut. Berikut hasil pengujian pada skenario 4 : Tabel 4-4 Hasil Pengujian Skenario 4 (penghilangan stopword, pembobotan dengan TF-IDF)
Skenario Parameter C 1 5 10 15 20 25 30 35 40 45 50 Rata-rata Akurasi CV (train) 70.36% 77.86% 76.43% 76.79% 77.50% 77.86% 77.86% 77.14% 76.43% 76.43% 78.57% 76.66% Akurasi (Test) 70.83% 67.50% 66.67% 66.67% 66.67% 66.67% 66.67% 66.67% 66.67% 66.67% 67.50% 67.20%

Hasil tabel di atas menunjukkan penurunan dalam akurasi cross validation jika dibandingkan dengan skenario 3. Namun berbeda ketika dilakukan testing terhadap data. Akurasi lebih tinggi jika dibandingkan dengan skenario 3. Nilai parameter C dalam kasus ini cukup besar, yaitu C=50 yang memberikan akurasi cross validation paling besar. Proses penghilangan stopword mengakibatkan SVM menghasilkan nilai parameter C=50 yang besar. Parameter C yang besar berarti SVM memberikan tradeoff yang cukup besar terhadap error yang dihasilkan. Jika dibandingkan dengan skenario 2, perbedaan terletak pada penghilangan stepword saja. Hasil training antara skenario 2 dan 4 yaitu 83.83% dan 76.66%. Penghilangan stopword mengakibatkan akurasi menurun 6% dari sebelumnya. Karakteristik data ketika dilakukan penghilangan stopword menghasilkan data yang berisi kata-kata yang tidak terlalu umum digunakan, sehingga memberikan data yang tidak sebaik data tanpa penghilangan stopword. Data postingan pada forum ketika dilakukan penghilangan stopword akan menghilangkan kata-kata yang sangat umum digunakan dalam diskusi forum. Semakin banyak kata yang dihilangkan, maka nilai urgensitas dari suatu postingan bisa hilang, sehingga data menjadi buruk untuk dilakukan klasifikasi.

28

Akurasi (Test)
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 1 5 10 15 20 25 30 35 40 45 50 parameter C

Akurasi (Test)

Gambar 4-4 Grafik Pengaruh Parameter C dengan Akurasi (Test) Skenario 4 Grafik diatas menunjukkan penurunan akurasi testing di setiap parameter C yang dinaikkan. Namun ketika C=50, grafik naik karena hasil parameter C yang terbaik saat C=50 sehingga pada proses testing data, memberikan hasil grafik yang naik dibanding parameter C sebelumnya. Walaupun hasil akurasi naik pada C=50, namun hasil terbesar tetap ketika C=1. 4.3.5 Analisis Keseluruhan Skenario

Perbandingan Skenario Keseluruhan


90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 1 2 skenario 3 4 Akurasi CV (train) Akurasi (Test)

Gambar 4-5 Grafik Akurasi CV(Train) dan Akurasi (Test) Keseluruhan

29

Berdasarkan analisis grafik 4-5, skenario yang terbaik dalam pemecahan masalah junk post ini yaitu skenario 2. Dalam skenario ini, data tidak dilakukan penghilangan stopword dan dilakukan pembobotan dengan menggunakan TF-IDF. Akurasi training maupun testing menghasilkan hasil yang terbaik jika dibandingkan skenario lainnya. Selain itu juga, skenario 2 ini lebih baik dibandingkan skenario lain yang dilakukan penghilangan stopword terlebih dahulu. Penerapan preprocessing dalam kasus ini akan menghilangkan kata-kata yang tidak dianggap penting dalam suatu postingan forum. Data postingan pada forum ketika dilakukan penghilangan stopword akan menghilangkan kata-kata yang sangat umum digunakan dalam diskusi forum. Semakin banyak kata yang dihilangkan, maka nilai urgensitas dari suatu postingan bisa hilang, sehingga data menjadi buruk untuk dilakukan klasifikasi. Dalam kasus penerapan junk post forum ini, kata-kata dalam forum tidak sebaku artikel bahasa indonesia pada umumnya, sehingga apabila diterapkan proses penghilangan stopword ini, memberikan hasil yang tidak baik berdasarkan hasil pengujian ini.

30

5. Kesimpulan dan Saran


5.1 Kesimpulan
Berdasarkan pengujian yang dilakukan dalam Tugas Akhir ini, dapat disimpulkan bahwa : a. Semakin banyak proses preprocessing yang dilakukan dalam penanganan junk post ini, akan berdampak buruk kepada sistem penanganan junk post forum. b. Proses penghilangan stopword berpengaruh terhadap hasil klasifikasi SVM. Klasifikasi dengan penghilangan stopword memiliki akurasi Cross Validation yang lebih rendah jika dibandingkan pengolahan tanpa preprocessing. Terbukti juga dengan akurasi testing yang dilakukan terhadap data test. c. Perubahan nilai parameter C dalam metode SVM tidak berpengaruh secara signifikan. Namun pemilihan parameter C yang terlalu kecil menurunkan nilai akurasi cross validation dalam kasus penanganan junk post ini. d. Proses preprocessing yang tepat berdasarkan hasil pengujian Tugas Akhir ini yaitu tidak dilakukan preprocessing pada data dan dengan pembobotan TF-IDF. Hal ini karena karakteristik data forum yang berbeda dengan proses text mining lainnya. e. Dilihat dari nilai akurasi dari proses pengujian di atas, metode SVM dapat menentukan postingan yang termasuk junk atau tidak.

5.2

Saran

Saran yang diperlukan untuk pengembangan sistem lebih lanjut adalah sebagai berikut : a. Melakukan analisis lebih lanjut mengenai proses preprocessing pada data, seperti melakukan stemming atau penanganan thesaurus dalam sistem. b. Melakukan penambahan data terhadap sistem, baik data thread maupun juga keberagaman data dari forum-forum lain c. Melakukan analisis spam opinion dengan menggunakan metode klasifikasi lainnya seperti nave bayes, neural network atau maximum entrophy.

31

Daftar Pustaka
[1] Adiwijaya, Igg. 2006. Text Mining dan Knowledge Discovery. Komunitas Data mining Indonesia & Soft-computing Indonesia. Chen Jinxiu, Ji,Tan. 2005. Unsupervised Feature Selection for Relation Extraction. Singapore: National University of Singapore. Chen Rung-Ching & Chen Su-Ping. 2007. Intrusion Detection Using A Hybrid Support Vector Machine Based on Entropy and TF-IDF. Taiwan: Chaoyang University of Technology. Cios, Krzystof J., dkk. 2007. Data Mining A Knowledge Discovery Approach, New York: Springer. Cristianini Nello & John Shawe-Taylor. 2000. An Introduction to Support Vector Machines and Other Kernel-Bases Learning Methods. UK: Cambridge Press. Dewi Rani Charisma. 2005. Pengelompokan Berita Berbahasa Indonesia menggunakan Clustering. Bandung:STT Telkom. DigilibITTelkom. 2012. TFIDF. Diakses pada 2 April 2012 di http://digilib.ittelkom.ac.id/index.php?option=com_content&view=articl e&id=996:tfidf&catid=6:internet&Itemid=14. Dumais, S., J. Platt, D. Heckman, and M. Sahami. 1998. Inductive Learning Algorithms and Representations for Text Categorization. 7th International Conference on Information and Knowledge Management. Firdaus, Yanuar. 2008. Vector Methods. Bandung: IT Telkom Forman George. 2006. BNS Feature Scaling: An Improved Representation over TFIDF for SVM Text Classification. HewlettPackard Labs Tech Report Hsu, Chih-Wei, Chih-Chung Chang, dan Chih-Jen Lin. 2010. A Practical Guide to Support Vector Classification. Taiwan: National Taiwan University Joachims Thorsten. 1997. Text Categorization with Support Vector Machines: Learning with Many relevant Features. Dortmund: Universitt Dortmund. Nugroho. A. N. (2008). Support Vector Machine: Paradigma Baru dalam Softcomputing. KNSI 2008; Bali.

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9] [10]

[11]

[12]

[13]

32

[14]

Nugroho Satriyo Anto, Arief Budi Witarto, dan Dwi Handoko. 2003. Support Vector Machine-Teori dan Aplikasinya dalam Bioinformatika dari http://ilmukomputer.com Prabowo, Rudy and Thelwall, Mike. Sentiment Analysis: A Combined Approach. United Kingdom: School of Computing and Information Technology. Salton, G. 1989. Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer. Addison-wesley, Reading, Pennsylvania Sari Khrisna Dini Yunita. 2006. Kategorisasi Teks dengan Metode Klasifikasi Support Vector Machine (SVM). Bandung: STTTelkom. Xu Guandong, Yanchun Zhang, and Lin Li. 2011. Web Mining and Social Networking, Victoria: Springer.

[15]

[16]

[17]

[18]

33

Lampiran A: Data Pengujian


Data Thread
Dewasa ini, semakin banyak inovator-inovator handal yang lahir, begitu pun dengan para kreator. Tapi sayangnya siklus ini juga dibarengi dengan timbulnya para plagiator dan follower. Berarti ada kemajuan juga ada kekurangan. Di satu sisi kita bangga dengan lahirnya para inovator juga kreator, sisi lain, mengundang miris melihat lebih banyak yang menjadi plagiator ato malah berpuas sebagai follower. Kalo menurut saya sih sangat disayangkan ketika kita hanya mampu memplagiat atau hanya diam bertepuk tangan sebagai follower sementara banyak hal yang bisa kita lakukan. Oiya, sebelum lanjut, mendukung suatu karya itu beda lho dengan menjadi follower. Pun berinovasi karena pans melihat orang sukses juga beda dengan plagiator, apalagi di Indonesia. Saya pernah baca kalo daya tampung otak manusia itu lebih besar daripada hard disk berukuran tetabyte. Dan katanya, sampai manusia mati, daya yang di pakai otak untuk menyimpan memori dan bekerja itu tidak sampe seperempatnya. Einstein saja yang katanya manusia terpintar "cuma" menggunakan sepertiga kemampuan memori otaknya. Simpel kata, ketika mati, otak kita masih banyak menyisakan space yang belum terpakai. Dan sangat disayangkan sekali, dengan daya tampung otak yang sebesar itu, kita hanya mampu menjadi plagiator/follower. Lalu bagaimana dengan saya? Dari dulu saya mencoba menekankan pada diri sendiri untuk lebih menekan otak pada titik batas tertinggi. Mencoba lebih kreatif dan inovatif. Meyakinkan diri saya untuk bisa dan bisa. Kalau orang lain bisa kreatif, kenapa kita ga? Toh otak manusia dimana-mana sama kok, baik ukurannya, bahan dasarnya, juga posisinya. Yang membedakan hanya cara kita untuk menggunakannya. Juga mindset kita kepada otak. Saya suka mencontoh konsep orang, tapi bukan untuk di pakai mentah-mentah. Saya coba sederhanakan atau malah saya buat lebih besar jika mampu. Saya suka mencari referensi, bukan tuk di copy paste, tapi hanya sebagai contoh acuan yang bisa diperbaiki atau di buat lebih baik. Kalo kita bisa menjadi seorang kreator, buat apa menjadi plagiator? Dengan menjadi kreator, karya situ di kenang sepanjang masa dan juga memberi nafas baru. Menjadi plagiator? Cuma pujian sesaat lalu jatuh dan tak dikenal. Lagian menjadi sebuah kehinaan buat saya kalo hidup cuma untuk memplagiat karya orang. Plagiator cuma menunjukkan dua hal, apakah dia tidak kreatif, ato malah tidak punya ciri khas, makanya memplagiat.

34

Menjadi inovator lebih baik malah, karena situh di tuntut selalu keluar dengan ide dan pemikiran segar, kadang gila. Ini juga membuat otak situh sepuluh kali lebih baik daripada yang lain, karena selalu diasah dan berpikir. Inovator ga pernah mati. Follower? Sekali situh "menasbihkan" diri menjadi follower, selamanya akan menjadi pengikut. Masa depan pengikut? Tak pernah lebih baik daripada seorang babu. Kenapa? situh mengekor. Situh mengikuti, bukan di ikuti. Tapi kan jalan untuk menjadi kreator dan inovator itu susah! Emang iya!!, dan lagi emang ga ada yang gampang kalo ingin menjadi "sesuatu" atau "seseorang". Mau gampang? ya jadilah plagiator atau follower. Tugas situh cuman meniru dan bertepuk tangan serta berteriak amin. Ciputra sukses kenapa? Dia kreator. Kalo ditanya siapa entepreuner sukses di Indonesia? Saya rasa kompak kita menjawab Ciputra. Bagaimana Ciputra mengawali karier entepreneurnya? Ciputra muda hanya memelihara kambing, yang dirawat hingga beranak pinak hingga hasilnya di jual. Mendapat keuntungan, lalu dia membeli binatang yang bernilai lebih besar, dirawat lalu di jual. Begitu terus siklusnya selama berpuluh tahun, hingga akhirnya sukses. Tau mimpi awalnya Ciputra? Dia cuma ingin punya usaha yang besar dan stabil. Hasilnya? Lihat sendiri. Aqua itu apaan? Itu merek dagang inovator. Sebelum ada Aqua, siapa sih yang mau iseng menjual aer putih dalam botol plastik, sementara air di muka bumi ini melimpah? Semua ga ada yang mau, tapi Aqua mau. Dan hasilnya? Saat ini, setiap orang yang bicara air mineral pasti menyebut Aqua. Itu cuma contoh kecil. Masih banyak contoh nyata lainnya di sekitar kita yang hebat dan lebih hebat. Kreator dan inovator yang pada awalnya di katain gila karena ide gilanya. Mereka-mereka yang awalnya mendapat sebutan pemimpi yang akhirnya sukses. Ya mereka-mereka itu yang berani berpikir out of the box. Dan untungnya masih banyak orang-orang seperti itu jaman sekarang, meski sudah terimpit dengan para plagiator dan follower. Mungkin kita masih hidup tanpa lampu kalo Edison ga iseng eksperimen. Mungkin kita masih aja surat-suratan kalo Bell mau main aman. Kita juga mungkin masih jalan kaki kalo aja si Ford ga kepikiran kendaraan bermesin. Dan juga mungkin ga ada yang namanya koran kalo si Julius Caesar tidak iseng menulis pada batu dan menyebarkan pada rakyatnya. Iseng? iye, awalnya mereka iseng. Tapi iseng yang kreatif, iseng yang inovatif. Yang menghasilkan. Kita bisa ga? Bisa dong, lha wong otak kita sama, berat jenisnya sama, bahannya sama. Tinggal gimana kita menggunakannya.

Data Post (Train)


No. Postingan 1 yang penting jangan jadi provokator aja gan Selamat ya atas HT nya

35

2 gak ada yang salah dengan plagiator asal bisa kreatif banyak contoh keberhasilan yang di mulai dgn plagiat dulu selanjutnya baru di kembangkan lagi 3 4 5 6 bener gan, kata guru kewirausahaan ane salin ubah dan kembangin Saya sangat Termotivasi Betul gan ! Harus jadi Kreator ! Itu yg dinamain inovator gan Copy not paste tp copy n explore segala kemungkinan itu ada, kesuksesan itu didapat asal ada usaha plgaiat maupun kreator, apabila dilakukan dengan sungguh tetap sukses kok tergantung tujuan apa yang ingin kita capai setuju gan yang penting kesungguhan dalam berusaha inovator selalu jadi yang terbaik gan ! syah aja kita tiru orang asal jangan niru nya 100% kudu d bedain dan buat nilai tambah nya sebenarnya plagiator bukan yang hina, kadang seorang kreator terlahir karna dari plagiator,yang terpenting adalah kreatifitas gan

7 8 9 10

11 manusia inovator dan kreator adalah manusia yg cerdas gan mereka mampu mengubah sesuatu menjadi lebih bermanfaat 12 inovator itu perlu kerja keras diawal Gan, tp begitu terkenal bisa langsung lancar.kalau plagiator itu tidak perlu kerja keras diawal, tp begitu terkenal bisa langsung kena masalah. 13 kira2 kreasi dan inovasi seperti apa ya gan di jaman yg persaingannya ketat spt saat ini, serba modern dan canggih 14 meninggalkan jejak di trit HT selamat yah mau kreator , inovator , plagiator .. yg pntng dilakukan secara sungguh2 pasti akan berujung sukses 15 ane suka kata-kata ini gan kerja keras..kerja keras.optimumkan potensi yg ada 16 bener banget gan tapi jadi plagiator gak selamanya salah selama terdapat perbedaan yang membuatnya lebih unggul 17 setuju banget gan, bisa di bilang plagiat yg innovative, mantap 18 keren gan apalagi kalau ditambah lagi jadi INSPIRATOR bisa lebih bermanfaat bagi orang laen 19 hmmm setuju gan , tapi untuk mwnyusun inovasi baru harus berdasarkan bahan yang udah ada juga kan 20 sebenarnya itu smua tergantung dari stiap individu gan. Menjadi kreator/motivator ato plagiator/follower.... Saya ada teman kreator tapi dia juga plagiator, nah lhooo!!! Gimana tuh menurut agan-agan dimari?? Heheheeh 21 Ini selaras dengan gerakan yang sedang DIGODOG oleh TIM SlemanOnline.COm dalam rangka menanamkan budaya kreatif yang outputnya membentuk pemuda - pemudi yang inovatif dan mampu berkreasi serta bernilai jual. Wujudnya berupa event lomba dan pelatihan rutin yang bekerjasama dengan Balai Pemuda Olahraga Propinsi DIY sebagai penyedia tempat di Youth Centre, Sleman... Bagi agan-agan yang mau berpartisipasi dalam bentuk donasi atau sponsor bisa email ke mail.slemanonline@gmail.com. Jayal kaum muda Indonesia, jadi bangsa yang kreatif dan inovatif serta bernilai jual tinggi 22 Motivator juga bagus gan bisa menciptakan creator 23 ane jg gan sebagai anak muda da seharusnya kita bisa menciptakan sesuatu yg baru n bermamfaat bukannya cuman nyiplak to ngikut aja

36

24 Kl mindset ane, ane bikin setiap saat ane bekerja, ane sedang kepepet biar pun sebenarnya engga. Hahahhaa Trus mengenai topik ini ane setuju, beribu cara mencapai inovasi salah satunya pedoman yang ane sering pake A = Amati, T = Tiru, M = Modifikasi. Alasan ane, menggunakan ini karena usaha ane baru berjalan. Sangat beresiko apabila ane mencoba sesuatu yg belum terlihat hasil. Basicly, ane menggunakan program/marketing plan yang sudah berhasil dan berdampak signifikan. Ane modifikasi plan koreksi agar sesuai dengan tujuan pencapaian ane utk prog tersebut. Saran TS dibutuhkan 25 Postingan menarik tapi sayang sekali hanya ngomongin kulitnya aja Saran : lebih mantep jika diulas layer per layer how to be creative Keep posting 26 mantap banget gan jadi terinspirasi ane dan termotivasi tentunya,jadilah inovator dan creator 27 Berfikir apa yang tidak difikirkan oleh orang lain 28 gakbisa jadi kreator, mengembangkan menjadi lebih baik juga ane pikir paling penting kaya bangsa Jepang 29 dunia berkembang secara dinamis , kita perlu banyak inovator untuk menghaddapinya 30 betul, gan kreatifitas bisa dimulai dari yang kecil, semisal pandai-pandainya kita untuk mengatur waktu agar efektif dan produktif. salut, Indonesia bisa kreatif ! Pastinya 31 emg bener sich berawal dr mimpi & iseng keberhasilan bisa di raih dengan selalu mencoba & puantang mundur tentunya... 32 Ada orang2 yg ditakdirkan utk jadi follower, ada yg ditakdirkan jadi inventor kan? Contohnya iPad: inventor. tab2 merek2 yg laen: follower. Dua2nya juga bagus2 kok. Menurut ane, walo jadi follower, jadilah follower yg berprestasi. 33 plagiator gak masalah asal niatnya karena memotivasi...misal meniru seorang pengusaha sukses dengan maksud berkeinginan untuk sukses seperti pengusaha tsb. yg penting orang yg ditiru gak masalah. 34 Walo emang plagiat itu gampang sedangkan bikin inovasi itu susah Tapi kita ga boleh nyerah untuk jadi innovator 35 bener gan ane setuju banget dah,,, semoga kita tidak hanya bisa bertepuk tangan dan cuma mengikuti 36 gak ada yang salah dengan plagiator asal bisa kreatif banyak contoh keberhasilan yang di mulai dgn plagiat dulu.....selanjutnya baru di kembangkan lagi 37 kalo kata dosen ane gan niru sih gak papa,,, asal kita bisa ngasih nilai tambah ke produk yang kita tiru,,, 38 contohnya negara Cina, mereka bisa niru apa aja, dengan harga yang lebih murah dan kualitas yang sesuai dengan harganya,,, ini justru jadi keunggulan mereka,,, ATM (AmatiTiru-Modifikasi) 39 Sekedar tambahan dari ane, Pak Tirto Utomo menemukan ide menjual air minum dalam kemasan arena pada waktu itu beliau mendengar sendiri ada pekerja asing yang mengeluh tidak adanya air minum yang ukup aman di konsumsi di Indonesia, sebab air PDAM dari kran belum layak untuk langsung diminum. berbekal dari keluhan tersebut beliaupun berhasrat untuk membuat air minum dalam kemasan yang benar40 tapi di china, malah plagiator bisa lebih baik dari kreator tuh 41 Plagiator sekarang udah banyak Gan, semoga bisa berkurang para plagiator karena plagiator sekarang dah mulai kreatif

37

42 betul banget nih agan, kita dianugerahi otak oleh Alloh senantiasa untuk digunakan sebaik mungkin dalam segala hal, jadi ubah pola pikir kita untuk selalu dapat berkreasi dan berinovasi sesuai dengan apa yang kita pikirkan 43 wih, inspiratif bgt gan.. proses jd inspirator sm kreator emang pahit, tp klo ud berbuah pasti manis bgt hasilnya 44 kalo jadi plagiator tapi kualitas lebih baik nggak masalah kayaknya mungkin hanya mengadopsi, lalu di kembangkan menjadi lebih baik 45 copy cat klo menurut gw sih oke2 saja gan tp harus membuat suatu inovasi yang lebih baru... krn kalau cuma copas apa kata dunia ? 46 bukan hanya iseng, tp mau berusaha,, Mungkin kita masih hidup tanpa lampu kalo Edison ga iseng eksperimen. Mungkin kita masih aja surat-suratan kalo Bell mau main aman. Kita juga mungkin masih jalan kaki kalo aja si Ford ga kepikiran kendaraan bermesin. Dan juga mungkin ga ada yang namanya koran kalo si Julius Caesar tidak iseng menulis pada batu dan menyebarkan pada rakyatnya. 47 threadd bagus niii.. tp kok sepii yaa ?? iyee gan ane setuju banget..jangan pikirin gimana kalo ente gagal tp pikirin bagaimana cara'ny supaya berhasil..learn best by doing..maaf gan ane belom ISO jd belom bisa ngirim ijo".. _nice post gann.. 48 saya sangat termotivasi dengan ini..jangan menyontek wkt ulangan maupun mencatat ataupun mengerjakan tugas...miliki daya juang tinggi 49 Itu namany inovator, copy dan menginovasikan suatu karya..Kalo plagiator it bner2 niru sama persis tapi ngaku atas nama dy, barang KW gt dh.. Ha5.. 50 btul bgt gan kita harus inisiatif sndiri supaya bisa jd inovator n kreator,itu gak mudah, tp kalo mau berusaha pasti bisa sukses 51 bener gan, harus kreatif dan inovatif.. dan bicara soal ciputra, dia juga serring gagal dalam perjalanannya gan, tapi karena mental pantang menyerah dan kerja kerasnya, dia bisa kyk skrg deh.. 52 plagiat boleh2 saja sbnrnya tapi jangan sama bgt ambil beberapa yg perlu d copy bwt refenrensi 53 bener bangets gan,,jadi inovator atau mati, dan jangan jadi follower,,semoga kita bisa sukses 54 Ane setuju banget minimal jadilah dan biasakan jadi inovator, karena lama2 otak kanan yang diasah terus menerus bisa menjadi kreator yang handal. nice job 55 mencontoh hasil karya orang lain gak apa2, yg penting cantumin di daftar pustaka....hehehehe tetap semangat buat para inovator & kreator yg membangun bangsa Indonesia! 56 Mantap gan.. ane juga sekarang berusaha menjadi kreator, karena ane pengen, saat ane ga ada nanti, ada yang bisa dikenang.. 57 gak semua bisa seperti itu, tergantung orangnya punya imajinasi tinggi apa tidak ya disamping adanya ide2 baru yang udah banyak saat ini.. ane awali dulu dengan 1 kalimat dari filosofi leadership "jadilah orang yang bisa dipimpin, maka kamu bisa jadi seorang pemimpin" jadilah plagiator yang kreatif, baru kamu bisa jadi creator jadilah follower yang aktif dan inovatif, baru kamu bisa jadi innovator 58 Super sekali gan Yang pasti satu gan "take action" jangan cuma merencanakan....,,! setuju ama agan ini... contoh yg berguna bg kita.... contoh buat kemajuan kita... hidup!!!

38

59 Plagiator Inovator Jgn prnah brhenti tuk eksplorasi diri..kluar dr tekanan kluar dr rutinitas yg monoton. :capek Ane mau tanya gan?? Kalo koruptor trmasuk bagian mana y gan??? 60 Emang susah jadi kreator gan,tapi bisa kita raih dgn menampilkan inovasi-inovasi baru... Kreator dan inovator merupakan satu kesatuan... 61 Sekedar catatan: Inovasi tidak melulu langsung bisa tercapai Ada tahapannya bagi beberapa orang yang dikenal dengan IDI Imitate Develop Innovate 62 menjadi plagiator, inovator dan creator semuanya bagus asalkan digunakan untuk kebaikan n bermanfaat bagi alam n seluruh makhluk idup di dunia.. 63 hehe, motivating banget harus berpikir jernih buat menjadi kreator.. tiap orang bisa, asal punya kemauan. 64 Berani taruh di pejwan??? "To steal ideas from one person is plagiarism. To steal from many is research." 65 Mengakui ide orang lain, sebagai ide nya hal yang paling munafik yg pernah ane temui. 66 Menurut gw gan seorang / produk yg di kenal kreator sebelumnya adalah plagiator yang inovatifsampai dia menemukan karya atau produk yg menjadi pembeda abadi (trademark) dari produk lain Aqua adalah plagiator dari air mineral Evian di prancis yg saat ini juga sama2 di miliki oleh Danone groupFacebook adalah Plagiator dari Myspace,tapi mark adalah plagiator yg inovatif dan sekarang hasilnya malah melampau myspacemasih banyak yg lain nya ganjadi untuk memulai usaha tidak perlu menunggu apakah kita creator atau plagiatoryg perlu kita lakukan adalah mulai secepat mugkintemukan passion dan produk atau jasa walaupun harus meniru dari produk lain yg sudah terkenal lalu gunakan ATM ( amati,tiru dan modifikasi ) sampai loe menemukan pembeda abadi (trademark)produk atau jasa loe yg diingat konsumen - Kalau beli minum air mineral pasti kita bilang AQUA walaupun mereknya lain.. - Di tempat saya semua sepeda motor di bilang Honda.. - kalau transaksi internet banking ya BCA. - Di Tanya siapa bisnis property tersukses di Indonesia ya CIPUTRA.. Untuk mendapatkan itu bisa kita mulai dari lingkungan terdekat..so Jadilah Plagiator yang inovatif dan mulailah secepat mungkin 67 " Saya suka mencontoh konsep orang, tapi bukan untuk di pakai mentah-mentah. Saya coba sederhanakan atau malah saya buat lebih besar jika mampu. Saya suka mencari referensi, bukan tuk di copy paste, tapi hanya sebagai contoh acuan yang bisa diperbaiki atau di buat lebih baik ".proses demi proses ...layer demi layer yang pada akhirnya menyentuh hasil dari tahapan panjang dedikasi untuk bersungguh menyelesaikan apa yang dimulai...itu intinya. 68 ada plagiator tapi menggembangkan nya ga jauh beda contohnya "Rokok" bahan sama cuman yg di bedain hanya bungkus ,,, ya gitu aja 69 ada tuh gan teknik mencontoh dari jepang, ane lupa namanya jadi kita belajar dari negara lain, mencoba mencontoh lalu dikembangkan 70 ane lbh baik berkaya jelek tp murni hasil sendiri drpd plagiat yg di elu2kan orang byk 71 ane pengen banget gan jadi kreator atopun inovator....cuma pola pikirnya ini loh masih belum bisa "out of the box".... 72 ane plagiator gan..... tapi bagi ane, dalam proses plagiatisme tersebut ada proses belajar. Ane pelajari kelebihan dan kekurangan apa yang ane tiru.Ane berusaha memperbaiki kekurangan tersebut dan menambah kelebihan yang udah ada. 73 ane setuju gan,, ane juga lagi berusaha untuk gag plagiat gan.. ngerjain skripsi dengan kata2 sendiri nih gan,, susah emang tp ntar hasilnya Insyaallah memuaskan.. amiiin..

39

74 ane stuju banget sama pendapat agan ini, kalo kita follower and plagiator jangan harap deh bisa maju 75 ane suka thread agann.... semoga kita jga tidak selalu menjadi negara yang konsumtif gann 76 asal jangan jadi koruptor aja gan... ini yang merupakan bahaya laten Indonesia bahkan dunia 77 ayo skrg kita harus praktekan utk mulai memaksimalkan kemampuan yg Tuhan sudah berikan utk kita di bidang kita masing-masing, utk menjadi kreator dan inovator di bidang yg kita kuasai maupun bidang baru yg kita pelajari... lakukan itu semua dg tujuan yg mulia, utk menjadi orang yg berguna bagi kehidupan kita, keluarga dan orang lain di sekitar kita 78 be actor don't reactor mungkin bisa juga gan 79 bener bro kita harus ber inovasi dan harus berkembang. hukum juga harus jelas terhadap hak cipta 80 bener juga tuh gan... inovator pasti lebih sukses lah ya daripada plagiat... 81 bener kata agan, jadi creator/inovator emang lebih sulit.. tapi sebanding sama hasilnya yah gan 82 berinovasi dan berkreasi emang mudah diucapkan, tp sungguh sangat sulit diterapkan.. tapi yg jelas dengan niat dan kerja keras akan lebih mudah memunculkan inovasi & kreasi 83 bermula dari mencontoh lalu dikembangkan,.kalo plagiat meniru tanpa mengembangkan 84 Betul tuh, kita harus jadi kreator dan inovator ..tapi gak enak banget dengan kata plagiat, asing bagi gw ..menurut gw semua orang yg mempunyai inovator adalah seorang plagiat . gak ada kata plagiat dalam kamus gw 85 Butuh kerja Keras untuk jadi seorang Kreator atau Inovator...!!!Tapi alangkah baiknya jika kita bisa melakukannya... 86 cakep gan trit motivasinya emang hidup itu harus penuh inovasi dan kreasi, tanpa menjiplak oleh karenanya jadi banyak plagiator dan copycat yang akan mengikuti tapi disitulah esensi menjadi trendsetter, selalu diikuti dan dicontek hasil karyanya tapi setidaknya kita bukan meniru dan mengikuti, macam boyband yg lagi marak sekarang ini 87 Cina ekonomi bisa maju dan berkembang pesat merata karena plagiat! Jadi apa yang salah dengan plagiat?? 88 Contoh aja kayak kaskus nih, software orang tapi mimin orangnya kreatif nah seiring berjalannnya perkembangan kaskus, mimin punya ide untuk kaskus ke depannya dimana ntar lagi ada new kaskus jadi gak mempergunakan forum software itu lagi mimin cari developer, programmer, designer, dll untuk membuat bangunan sendiri (inovatif)

89 dari iseng bisa jadi inovator ya, terutama hal2 yg dekat dgn aktivitas kita sehari-hari bisa dijadikan sebuah inovasi juga 90 demi apapun, mantab gan pengen banget jadi inovator , tapi susah dan butuh keberanian. 91 enak banget dagang kambing trus sukses...lihat aja berapa banyak orang dagang kambing di negeri ini..gak sukses sukses....padahal udah milyaran kambing di jualnya... 92 gak perlu punya nilai A+ di sekolah, gak perlu punya duit segepok, gak perlu makan multivitamin, gak perlu penampilan necis, kalo mau puter otak dikit pasti ada jalan jadi orang sukses, yang jelas anti plagiat mode: on

40

93 gan...supeer skali..sesegera mgkin untuk di awali,dgn harapan segera memetik hasilnya...apa itu? sukses (relatif) learnig by doing,bljr dr pengalaman org2 yg sdh byk makan garam..nice gan, nice gan, angkat topi ane 94 haha iya gan bener, di Indonesia banyak amat plagiatornya.... miris gan, dan salah satu contoh kreator itu ga usah jauh-jauh gan, Mimin nemuin kaskus... itu termaksudnya kreator kan wkwk 95 ingin menjadi kreator eh ternyata malah disangka plagiator <padahal Ane gak niat buat ngePlagiat> 96 inovator tanpa kreator = 0.. jadi kita hrs bsa berinovasi dan merealisasikannya 97 itu diterapkan pada pembuatan kereta" api jepang bisa melaju lebih cepat dari yang dicontohnya (amerika) 98 jadi inovator itu gak mudah gan,,hehe boleh2 aja sih niru tp dikit aja,,sekedar menyempurnakan yg sudah2.. 99 jadi terinspirasi sama agan yg satu ini Kalau mau gampang ya jadi Follower/Plagiator kata" yg saya ambil dr thread ini 100 jadilah kreator . kita harus jadi kreator jangan plagiator . 101 jepang dulu juga plagiator mobil2 eropa dan amerika,, sekarang jadu raksasa otomotif dunia,, cina sekarang juga udah maju banget dibidang otomotif,, dulunya (bahkan ampe sekarang) juga plagiator mobil jepang dan eropa dan amerika 102 jgn asal plagiat gan plagiator sih bole2 aja tapi lebih diperluas pemikirannya jgn asal copas sih gan 103 kadang orang sinis tau ide kita... tapi setelah ide kita berhasil org itu akan terkagum kagum...haha 104 kaget gw baca orang sepinter aja baru make sepertiga otaknya, hehehehe cek cepe ah agan ts, ada yg nyelip tuh. 105 kalau copy si boleh cuman jangan di copy 100% justru kalau bisa si menurut gw di kembangin lagi 106 kalian tau Bill gates, kalo dia gak plagiat (Mencuri ilmu dari stevejobs pendiri apple) dia gak akan menjadi orang no 1 terkaya di dunia . bayangkan kalau anda hanya terbelenggu dengan kata "plagiat"bebaskan kreatifitas anda sekarang juga 107 Kalo mimpi saya: Jadi innovator yg punya peran di lingkungan sosial.. Tidak jadi inovator yg berhasil dan kaya saja. Masih jauh sih jalannya,tapi sedang berusaha menuju sana 108 kalo plagiat ngambil kepunyaan orang ya namanya sampah macam negeri tetangga..wkwkwk 109 kalo semuanya creator bisa bisa gan, yang ada kalo yang ane tangkep, supaya manusia bisa out of the box aja gan, tapi nice share gan, menstimulus otak para kaskuser supaya makin kreatif 110 Kayanya baru dapet referensi ni dari buku barunya walter isaacson 111 keren bener gan thread'yskrng bnyk plagiator ..ga kreatif .. merasa ga bisa bkin karangan dy sabet krngn orng beuhhh knp hrus malu dngn kreatifitas sendiri dan knp bisa bangga dngn karangn orng lain yg d jiplak .. 112 kita memang harus jadi kreator, atau inovator (lebih baik) itu semua dengan menambah wawasan, mencari referensi.. dan menemukan yg lebih baik.. bukan untuk mengikutinya 113 klo udah jadi kreator trus dikopi emang rasanya nyesek banget ya cape2 nemuin,orang laen enak banget makenya bahkan langsung matenin

41

114 kreatif, orang cerdas berawal dari dia kreatif dalam melakukan hal, seperti KASKUS gan, founder kita si mimin darwis menemukan kaskus dari iseng 115 mantap bener gan. tulisannya ane sebagai orang indonesia juga ngrasain, kalo ane sendiri masih suka jadi plagiat, masih belum bisa utk buat inspirasi sendiri :sedih tapi, harus ttp berusaha... 116 mantep juragan, harus lebih ngegunain kinerja otak dengan maksimal dan efisien nih. nice share. 117 Mau terus Indonesia. Jadilah pencipta dan pembangun untuk masa depan yang lebih baik 118 memang bener sih, hehe kalau orang lain bisa kita seharusnya bisa, bahkan bisa lebih baik. 119 Mengutip Dari Pak Tung Desem Waringin Amati, Tiru, Modifikasi (ATM) bukan Amati, Tiru Mentah-mentah Jadi sah-sah saja meniru, asal....... 120 meniru mencari kekurangan trus di pebaiki ,hebat gan!tp klu menjadi kreator ,..sungguh luar biasa,... 121 menurut ane sh tidak ada yang salah dgn pagliator karena saia pernah denger pepatah "TIDAK ADA HAL YANG BARU DI KOLONG LANGIT INI",, tinggal bagaimana sesuatu itu,, apakh bisa bermanfaat untuk orang banyak atau tidak Mnrt ane niru hsl karya org blh2x aja sbg acuan..., tp jgn di copas 100%... kita juga ga akan ngaskus kalo mimin ga iseng bikin kaskus,,,,,,hahahahha benar benar super sekali nih agan TS ga boleh copy cat tapi curi,, kata Steve Jobs: Good artists copy great artists steal,, wekakak,, ajib nih postingan.. keren gan ajib nih postingan.. keren gan inspiratif sekali gan. setuju gan, tpi kaang kita terjebak dengan cara yang sudah ada wah sgt menginspirasi gan wah betul tuh gan tapi walaupun plagiator juga ga apa2 asal kreatif inovasi berawal dari imitasi..... IDI.... singkat, padat, jelas simple words, but meaningful Pengikut banyak tp inovator sgt sdikit. plagiat sih ok2 aja, tapi harus ada inovasinya sedikit donk, biar bisa berbeda dengan competitor Luar biasa gan,sangat membuka pikiran kita semua.. terima kasih nice inpoh gan...!!! nice share jangan jadi plagiator gan bener2 keren tritnya. sangat bermutu ... sahati dengan yg ini kalo jadi inspirasi mah it's ok koq tapi ga plagiat yaa.. jadi caranya iseng-iseng berhadiah y ada kata2 kontroversial dari orang paling genius sepanjang masa aku berusaha unuk menjadi kreator dan inovator gan aku sebenarnya tak ingin jadi follower gan amit amit dah jadi copycat

122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146

42

147 148 149 150 151 152 153 154 155 156 157 158 159

ane baca ini sambil bercermin diri sendiri gan..bermanfaat ane jadi ter-motivasi Ane jadi termotivasi gan ane juga pasti ingin jadi kreator donk gan ane setuju gan lebih bagus punya follower yang banyak kaya di twitter,, uppsss ane setuju gan, cz g berguna para plagiat, cuma bs niru doang.. bagus banget ceritanya Bagus gan Bagus sekali gan, bedanya creator sm innovator apa ya.. bener banget gan, lebih baik jadi creator ato inovator bener banget judul udah cukup jelas gan bener banget nih apa yg dishare sm ente. Semoga ane suatu saat nanti akan menjadi kreator sekaligus inovator.

160 bener banget nih apa yg dishare sm ente. Semoga ane suatu saat nanti akan menjadi kreator sekaligus inovator. 161 bener banget tuh gan, sekarang banyak anak musik tanah air yg jadi plagiator :maho 162 bener gan! kalo kita selamanya jadi follower, kapan kita bisa maju 163 bener gan, brati jangan main di twitter ya 164 Bener gan, misalnya inovatif, kalo pakek kertas yang salah print, bisa buat amplop, hhehehehe... 165 bener jadilah anda yang kreatif jgan jadi plagiator 166 benerrr bgt gannnn.. nicee 167 betul banget gan , kita harus jadi inovator bukan plagiator.. 168 betul bgt gan , nice inpo 169 betul neh pas bangeett setuju 170 biar kita lebih punya karakter gan 171 boleh jadi plagiat, tapi PM dulu ama yg punya ,,, hhe 172 di mana pun ane bekerja ane selalu membuat terobosan gan 173 dibanding kreator kyaknya lebih gampang jadi inovator.. soalnya di dunia ini apa lagi sih 174 175 176 177 178 179 180 181 182 183 184 yang dianggep beda? dijamin gan, dimana2 dipake orang emang enak sih jadi plagiator...tinggal copas emang paling manteb tuh jadi motivator kok gan.. menekan otak sampai titik batas tertinggi ga takut overheated gan..? ntar bisa stress.. idem gan ih....., jadi malu. Jadi mikir2 kalo mau buat Tret Baru..Harus byk belajar dr para mastah!! ini trit ane suka,prinsip dlam hidup inovator emang keren gan jarang ada orang kaya gtu smoga ane bisa jadi inovator inovator emang kerenn jerih payahnya pasti ga sia2 Inovator yg terbaik, plagiator orang yg ingin jadi terbaik dengan cara curang inspiring gan tS

43

185 186 187 188 189 190 191 192 193 194 195

iya gan mantep neh jadi follower juga yang penting halal gan jadi inovator emang lebih sulit, tapi pasti jauh lebih baik dari pada plagiator jadi ny masih ada inovasi ny gt jaman gini emang menuntut berpikir kreatif gan, mantap jaman sekarang era ATM (amati, tiru, modifikasi)... jdi intinya kta hrus kreatif dan inovatif tnpa menjadi plagiator Jujur ane plagiator... tapi ane udah kapok, sekarang ane akan jadi inovator.... kebiasaan sebagian besar orang Indonesia cuma Copy Paste doang termasuk ane kemauan yang keras basic-nya kereeen gan semangatnya... tapi kasian itu kucing dibegitukan, biar cuma sedetik ambil fotonya tapi cukup menyiksa buat tuh kucing.... Keren banget gan, do or die klo ga ada follower, twiter bakalan sepi gan Klo semuanya dijiplak tanpa ada yang diubah nah itu bener2 plagiator kreator & inovator inovator & kreator menjadi inovreator Kreator and Inovator U R the Best maap ane cuman bisa copas mantab banget dah gan mantap gan buat renungan.. mantap gan tretnya, kita harus jadi kreator & inovator,nice. mantap! nice info banget gan!

196 197 198 199 200 201 202 203 204 205 206 mantapp gan ! ane jadi terinspirasi,mari kita berkreasi dan berinovasi,di mulai dari sekarang terima kasih gan 207 mantapp inovator emg top 208 mari kita create something gan, biar kita jadi someone yg diakui dunia... 209 mesti banyak2 bengong dan iseng neh asal lg bengong ga di patok ayam 210 mestinya gitu gann, tapii tidak semua orang bisa jadi kreator... 211 mestinya gitu gann, tapii tidak semua orang bisa jadi kreator...sorry klo dopost 212 mulai dari sekarang ......... 213 mulai sekarang iseng yang kreatif sama inovatif, setuju banget bang... 214 Nais inpoh banget nih gan 215 nais posting gan... 216 Ngena bgt yak kalimat Otak kita volume sama tinggal gmn cara nggunakannya.. 217 nice gan nambah semangat! 218 Nice post. Berani menang berani gila 219 nice share banget gan. ane setuju banget dengan agan yg satu ini 220 Nice share gan.. 221 Pelajaran yg ane suka waktu sekolah, Wirausaha-Kreatif/Inovatif 222 pict prtmany ngeri gan 223 plagiator itu :maho gan, wkwkwkwk, iya nggak ?? 224 salut buat..inovator dan kreator indonesia.. 225 sangat memotivasi ane gan..

44

226 sangat terisnpirasi gan.. thank you banget 227 saya cuman mau ngomong gan, kalo di indonesia itu seorang inovator tidak dihargai, contohnya yah ane ini.... 228 semoga berguna bagi semua 229 sepakat bgt gan., intinya kita hidup otak harus jalan terus., kalo gak., 230 seperti kata mario bros yah gan 231 sesuatu yang direncanakan hampir selalu berhasil dibandingkan yang tidak 232 setubuh gan 233 setuju bgt gann.. 234 setuju! emang jujur secara realita sulit buat jadi kreator,mesti banyak ide2 segar 235 sip gan.. jngan jd follower.. brati kalo di twiter jngan follow orang donk.. hihih 236 skrg udah ada hukuman buat plagiator gan jadi trend setter aja 237 so inspiring,, perubahan bisa jadi di artikan sebagai harga mati.. nice thread gan.. 238 tambahin juga inventor gan.... mantap threadnya bisa memotivasi 239 Terima kasih udah share menambah wawasan 240 terimakasih wejangannya Gan..ane juga berusaha menjadi kreator yg terbaik gan 241 tetap jadi inovator deh ane 242 Threadny awesome banget gan ! Seiring ane juga benci ama para plagiator 243 Thx atas inspirasi dan motivasinya gan.. 244 TS gak paham, pada waktu dulu pekelahian bisnis gak se-ekstrim sekarang, dulu orang2 masih mikir hemat dan jadi karyawan...jadi yang mulai bisnis gak bakalan sesusah sekarang... 245 Ttp Inovator gan 246 waduh gan.. mata ane pedes mbaca nya,, hihih 247 wah ia gan bener banget kata TSnya ane stuju banget ma TS 248 wah mantep tritnya gan tp kok kaya pernah baca ya? 249 wah tergantung kehendak tuhan,.,kalau allah menghendaki berhasil kta,.,. 250 wah, bener juga ya gan.. untung saya kurang suka plagiat hehe.. 251 Ane Bantu trit agan dech... 252 ane ngarep jg gan, jd inovator 253 ane pengen banget jadi kaya ciputra gan, tapi ane gak tau cara mulainya gimana gan... 254 Bagus nih gan buat dibaca-baca. Tapi gambarnya lucu tuh gan yang are u a copy cat? 255 256 257 258 259 260 261 262 263 264 koplak juga tuh kucing difotocopy. berusaha tuk menjadi sang inovator boleh niru tapi jangan keseringan.. cek kulkas gan Ebat bgt kata" TS . Pikiran ane skrng jd terbuka ijin nyimak gan ini sepertinya pembahasan kapita selekta kemarin deh inspiring bgt ni thread!!! thanks gan masukannyaa haaa terharu iya kalau instan jd,instan juga larutnya Jadi inovator,trus karyanya dihargai.. Best dah! kalo kreator ane ga mungkin bisa.... kalo inovator nahhh baru bisa...

45

265 266 267 268 269 270 271 272 273 274 275 276 277

kalo menurut ane malah bukan kreator dan inovator. tapi inovator yang kreatif harusnya kreator biasanya seniman gan kreator itu selalu jadi pionir ... mantap dah Sundul aja om mudah2an ane juga bisa kek gitu ya gan Nais trit om newbie ikut menyimak gan inovator dan kreator bagaikan semut dan gula........ oia gan pada tau gak daftar karya di HAKI berapaan? peristiwa yang sama akan berbeda makna gan sepakat dgn agan ini!! tapi untuk menjadi seorang inovator sangat sulit gan terinspirasi bgt dehh... keisengan dapat menjadi kesuksesan thread menarik...maap gan belum bisa kasih baru bisa ngerate aj....makasih dan semoga sukses

278 yang lebih baik itu bagus yang lebih mahal banyak 279 yang penting ga KORUPSI 280 Yups gan. Ane setuju bgt sama TS

Data Post (Test)


No. Postingan 1 biasa sesuatu yang ga direncanakan akan berhasil 2 so inspiring gan nah muncul permasalahn baru, untuk bersungguh-sungguh itu gak mudah ya gann 3 heheheh 4 Sayang ane gak bisa jd inovator gan, 5 oke oke thx brade 6 nyontoh gpp gan asal ditambah lebih baik lagi, kayak kata ki hajar dewantara 7 Ane demen dengan slogan "Innovate or Die" : Ijin copas gambarna ya Gan 8 keren gan okeh nais inpoh yo gan... 9 mantap tritnya mari belajar kreatif 10 u kreatif bs dipicu dg melihat yang sudah ada 11 ane mau jadi inovator saja ah.. 12 wkwk setujug gan, klo jadi provokator mah bahaya 13 intinya out of the box ajah gan 14 nais trit gan jd nambah ilmu nih 15 ane bantu selamat tritny jd HT 16 Setuju banget gan be Original 17 Semuanya tetap perjuangan dan doa 18 memang selalu berjuang nih gan jadi yg terbaru mantap jaya 19 plagiator adalah sesuatu yang menjijikan gan 20 jadi pengen jadi pengusaha Tips & Download Aplikasi PHP & JQuery KEREEN di : 21 Manteb Manteb thread keren penambah motivasi nich

46

setuju banget gan jangan jadi KORUPTOR juga gan setuju ama agan ini ayo gan, sama agan diulas biar nanti ditaroh di pejwan . wah,mantap ni trit nya memotivasi banget,nice trit gan yang kalo diindonesia banyakan follower gan..inovatornya jarang ayo jgn jadi Koruptor aj keep liar gan!! kereeen gan jangan jadi FOLLOWER memang dalam hidup ini kit harus seperti slogan suz*ki gan " Inovasi tiada henti" setuju gan,inti nya jadi lah dirimu sendiri yang inovator hrus pinter jngn tanggung2 biar tdk bs dbajak setuju banget gan>>>>>usaha no 1 gan yg penting semangat dulu.....and be +. gak semua bisa innovatif gan, byk yg ikut2an ajah lebih keren kalo habis di copy (plagiat) dicombine sama inovasi kita gan Wah, itu tulisan agan sendiri? bagus gan profesi agan sebagai motivator ya? copy then upgrade Gabisa ane jadi motivator dan kreator Dicoba gan menjadi kreator lebih baik dr pda follower. keren gan.. Thanks gan atas pencerahannya. Semoga kita semua bisa menjadi inovator ya,,, Bener bro ijin komen, Gan great share ijin ngerate juga ya.. ada kontroversi gan. Inovasi costnya lebih gede daripada jadi follower :P bener banget nih.. jadi creator bukan jadi follower.. mantap Nice share gan.. Bole dicoba nih Nice share gan.. Bole dicoba nih innovative or die, ane pilih inofatif aj deh dont copy to paste, but copy to explore. Mantap ini mantap ...... kalau plagiat?jadilah plagiator yang baik yaitu dengan mencantumkan sumber darimana 50 kita mengambil 51 nice inspiration gan..mulai sekarang ane mau berpikir kreatif 52 agan TS... ane masih bingung bedanya inovator dan kreator. boleh dijelasin ? 53 inspiratif gan 54 nyontek itu indah wkwk, kopas tp aransemen dikt lah xixi belajar aja dulu deh dari orang cinax......... biarpun banyak plagiatornya tapi bisa nguasain 55 ekonomi dunia...... 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 bener jg ya gan kta jangan maw jd follower tp hrs bs jd inovator yg karya kta bs di ikutin n 56 diterima oleh orang laen 57 WOW ! bener bener sangat inspirator gan, terima kasih banyak keep posting 58 iya gan sampai saat ini ane selalu berusaha jadi orang yang tampil beda 59 betul... *cari ide ahh...* 60 OMONG KOSONG, 61 Harus belajar lbh banyak nh

47

kalimatnya indah, Tapi agak susah dikerjakan gmn cara nya, ada kiat2 agar kita bisa lh memaksimalkan otak biar jadi kreatif ? setuju sama si agan.. babeh ane pernah bilang..sukses tidak bisa di foto copy nyimak gan Ane bangat ni gan iya gan ente bener,,,,, semua ada pada tangan kita mau jadi pengikut apa yang di ikuti 67 nice share gan 68 Kalo baya trit ini jd inget kata2 " b ur self" 62 63 64 65 66 69 70 71 72 73 Nais inpoh gan.. Ane sndri dh cba tk jdi kreator tpi blum ada hsilnya gan.. Mngkn ane hrus lbih brsha lgi y gan.. nais trit gan... Memberikan dorongan yang kuat... jangan jadi plagiat copycat.. niru bisa jadi itu awal untuk mencoba berkreasi yg lebih baru lagi nyontek dikit2 boleh donk atau memperbaiki yang dirasa kurang nyontoh gpp gan asal ditambah lebih baik lagi, kayak kata ki hajar dewantara

otak sama, beratnya sama cuma kesempatannya berbeda. yang bilang ciptakan 74 kesempatan itu bull shit. persis sama yang ada di page 1.. ngga ada yang salah sama plagiator.. selagi bisa di 75 kembangin dan hasilnya lebih baik.. itu udah jadi bagian dari inovator.. CMIIW.. 76 Pesan penting buat para tukang tari penjiplak 77 plagiat dengan penyempurnaan lebih baik daripada produk sebelumnya mgkn lebih baik plagiator atw bukan, nda masalah, asal si plagiator udh meminta ijin kepada yg ingin di 78 ikuti ny plagiator sebenarnya tidak masalah gan.asal bisa memodifikasi kembali menjadi barang 79 baruu yang berguna 80 sayangnya kebanyakan orang indonesia masih suka ikut2an, jadinya malah rugi bareng sebelum ane jadi kreator ato inovator ane jadi suporter dolo ja gan..moga ja ketika ane mendukung sesuatu yg baik bagi ane..ane bisa membuat sesuatu yg lebih baik dari yg ane 81 dukung... segala kemungkinan itu ada, kesuksesan itu didapat asal ada usaha...plgaiat maupun kreator, apabila dilakukan dengan sungguh tetap sukses kok.... tergantung tujuan apa 82 yang ingin kita capai.... selalu berusaha di depan untuk memimpin, selalu berusaha sejajar untuk membimbing, 83 selalu berada di belakang untuk menjadikan seseorang menjadi "penting" sepertinya perlu dikasih tips dan trik membuat postingan lebih menarik dg cara yg 84 mudah... agar nubitol kayak ane bisa ikutan eksis jg gan Setuju banget gan Jadi lah transetter bukan follower Indonesia pola hidup orang 85 kebanyakan konsumtif kan, seharus nya lebih produktif setuju bgt nih gan !! apalagi ane mahasiswa desain komunikasi visual yang selalu di tuntut untuk kreatif dan inovatif. Ga hanya menghasilkan karya, tp juga menciptakan sebuah karya baru. "Otak harus di peres sampe keluar aer, nah aernya itu adalah hasil dari kreatifitas kita yang manifestasinya dalam wujud karya" dosen ane sering bilang, kalo mau jd orang hebat, syaratnya Cuma 1. Berani meng-Create 2. Selalu mempertanyakan 86 "kenapa" dan tidak menelan mentah2 informasi yg di dapat. 3. Berpikir "out of the box"

48

Setuju gan Mencontoh dan dijadikan referensi memang boleh gan Soalnya kalo 87 menciptakan sesuatu dari nol memang sangat susah Setuju gan, jadi inovator itu emang ngga gampang, tapi bukan berarti ngga bisa. Otak kita 88 sama, tapi apa yang membedakanya yaitu cara pemakaianya... nice treadh gan Setuju gan, tapi prinsip ane "Jika kita tidak bisa menciptakan sebuah ide yang baru, kita 89 bisa meniru ide yang telah sukses dan memodifikasinya supaya lebih baik..." setuju gan.... plagiat di awal... creator di belakang... jangan creator di awal... plagiator di 90 belakang... setuju ma ente gan...."Life is Never Flat" gk boleh jadi plagiat dan hanya mengikuti gaya hidup org laen....be your self..kembangkan otak dan gaya hidup kalian sendiri.....kembangin kreatifitas diri,, mnjadi followers bleh saja,,asal tidak semuanya kita 91 ikutin....harus berusaha menjadi manusia yg lebih baik dan lebih berguna lagi Sukses itu adalah usaha..Usaha itu merupakan kegiatan yang memiliki misi untuk 92 berhasil...Jika usaha, maka jangan lah setengah-setengah... tapi gimana caranya ngembangin diri supaya bs jd kreator apalagi bisa terus berinovasi, kurang dijelaskan lg gan.. tambahin dooonk gan.. hahaha..(ane mental plagiat gan) 93 caranya biar bs kreatif aja masih nanya, kan tandanya ane ga kreatif ya Terkadang pemikiran Ane itu ternyata sudah dipikirkan oleh orang lain yang sudah lebih 94 dulu memikirkannya yh.. untuk menjadi seorang kreator dn inovator.. perlu kkuatan hati yg didkung dgn pikirn yg positif.. klu mw jd kreator ya, hrus ulet dlu, pntang nyerah..bwt ane stu hal gan.. smpe 95 skrang msh ssah banget bwt optimistis & PD...sory curcol dkit..mantap dh n trit.. yupz bener banget ane setuju banget sama thread ente,,, hanya org males yang ga bisa 96 jadi inovator & kreatif, toh semua org pasti d kasih kelebihan.. 97 ane pernah denger gan boleh kopi tapi jangan sama buat sesuatu yang berbeda 98 ane selalu mencoba untuk menjadi inovator, memang ga gampang, tpi kata kuncinya sih jgn pernah menyerah. ane setuju, gan.. kita harus jadi innovator biar ga mati gaya.. tuh liat kyk microsoft, semuanya nyontek dari produk mac.. apple ngabisin dana milyaran dollar/tahun utk RnD cuma buat abis2an dicontek ama bill gates..!! walaupun BillGates kaya raya, alhasil menurut majalah BusinessWeek steve job layak mendapat julukan TheGreatInnovator, bukan BillGates.. bener tuh...tapi kan kbanyakan gengsi di masa muda gan??????? makanya sdikiy yg jadi kreator berusaha untuk menjadi lebih kreatif lagi di page pertama ada yang bilang copy dan paste udah itu dikembangin, ,ane sebenernya agak kurang setuju, ,soalnya udah pasti otak kita di pake cuma buat ngembangin hasil karya orang lain. tapi buat tahap pemula gapa2 mungkin, ,kan cara belajar otak kita kan beda beda. .

99 100 101

102

duhhh... tapi susah gan jadi inovator enakan jadi kreator, menambahkan nilai dari yang 103 sudah ada 104 dulu ketika masih belajar, ada istilah ATM, Amati Tiru Modifikasi, so, it's so inpiring. emang etika seorang penulis seperti itu gan....no plagiatism...hargailah karya orang lain,, dan apabila kita mau memakai karya orang lain,,y paling ngga nama penulisnya ada di 105 daftar pustaka lah...jangan pernah deh kayak gitu...ga baik tuh plagiatism...

49

gpp gan jd plagiator , itung" modal buat terjun awal nah kedepannya kan udah biasa tuh 106 nyiptain sesuatu , mudah"an bisa d kembangin lg seiring berjalannya waktu Inovatif dan kreatif tuhh kepuasan tersendiri bagi mereka yang mampu mendapatkan 107 konsep2 unik, menawan dan gilaa,, 108 iya Gans... hidup memang harus penuh inopasi... dan bisnis'pun butuh inopasi... 109 Jadilah motivator sepperti om Mario.. Salam zupeeeee..Naiz trit gan..keep posting. jangan nyalahin plagiator ama follower-nya gan...kita juga yang salah suka make jasa dari para plagiator ama follower itu.... jangan lupa china bisa jadi negara yang paling kuat ekonominya gara2 barang tiruan dari negara2 maju lainnya....siapa yang salah? plagiatornya? ato pengguna jasanya? kadang untuk menjadi inovatif tidak perlu menemukan sesuatu tp cukup jadi diri sendiri saja gan kreatif dan inovatif adalah bagian dari kesuksesan mantep bgt gan, semoga kita semua bisa menjadi seorang inovator bukan plagiator ataupun gladiator keep posting gan, ane mau lbih banyak lgi nih thread2 dari agan yg bgini hehe

110 111 112

113

memang untuk menjadi creator dan inovator tidak semudah yg diucapkan, tp berusaha 114 adalah suatu keberhasilan orang orang bilang aku gila karena ngurus pertanian dan perkebunan bukannya jadi PNS spt kebanyakan anak muda di keluargaku, tapi aku liat peluang yg sangat besar di pertanian dan perkebunan, aku selalu baca biograpi org yg pikiran sama denganku, lalu aku ATM = amati tiru modifikasi, skarang dari sekedar iseng di pertanian aku jatuh hati dengan produk2 yg aku hasilkan 115 116 117 118 119 pribadi yg kreative dan inovatif adalah calon pribadi yg kuat dan bijaksana ...teruskan kreatitas dan berinovasi ...maju terus pribadi2 yg kuat Prinsip ane sih, Ambil yang Baik - Buang Jeleknya - Buat yang Baru Setuju gan Kita hrus jdi kreator sm inovator gan biar gak klah brsaing dlam dnia global ini tapi dari folower bisa mnjadi motivator gan...kita mesti berguru dulu jngan instan

tidak ada yang bisa mengalahkan ketekunan... barang siapa yang bersungguh-sungguh dia 120 akan mendapatkan apa yg diinginkannya

50

Lampiran B: Kamus

Kamus Stopword
yang mampu tentang di setelah semua hampir juga am antara dan ada seperti jadi karena sudah tetapi oleh bisa tidak sayang melakukannya lakukan memang baik lain pernah setiap untuk dari mendapatkan punya telah memiliki dia miliknya bagaimana bagaimanapun i jika ke dalam itu sama paling biarkan mungkin aku sebagian besar harus saya off sering pada hanya atau kita sendiri agak kata begitu beberapa mereka kemudian sana ini tis sungguh keinginan adalah kami apa kapan mana sementara siapa mengapa akan dengan belum anda sebuah atas menurut sesuai seberang sebenarnya sekali lagi terhadap memungkinkan sendirian bersama meskipun selalu apapun siapapun anyways saja selain muncul menghargai tepat sekitar samping bertanya terkait tersedia jauh sangat

51

menjadi sebab sebelum sebelumnya belakang percaya bawah terbaik lebih luar keduanya singkat namun ayo c datang cant penyebab tertentu tentu perubahan jelas co com akibatnya mempertimbangkan berisi mengandung saat pasti dijelaskan berbeda melakukan dilakukan selama edu misalnya tempat cukup seluruhnya terutama et dll

bahkan semuanya mana-mana mantan kecuali sedikit kelima pertama diikuti berikut sebagainya lanjut mendapat diberikan memberi pergi salam terjadi halo membantu maka sini inilah selanjutnya disini sesudah dirinya hi nya mudah-mudahan howbeit makanya diabaikan langsung lantaran inc menunjukkan ditunjukkan batin sejauh sebaliknya bukan terus

tahu diketahui terakhir akhir-akhir kurang supaya mari suka kemungkinan kecil lihat mencari tampak ltd banyak berarti apalagi diriku nama nd dekat perlu butuh kebutuhan baru berikutnya biasanya novel sekarang oh ok oke tua diri keluar secara keseluruhan khususnya per ditempatkan silahkan plus menyediakan

2 52

que qv rd kembali benar-benar mengenai tanpa memandang menganggap relatif masing-masing benar melihat berkata mengatakan kedua tampaknya dilihat masuk akal dikirim serius seharusnya boleh sejak seseorang entah sesuatu kadang kadang-kadang suatu segera maaf ditentukan tentukan menentukan masih sub sup t menerima mengambil katakan

cenderung th terima kasih thanx thats situ demikian dalamnya theres d berpikir ketiga teliti seksama melalui seluruh sehingga bersama-sama arah mencoba kali un sayangnya sampai kepada penggunaan digunakan berguna menggunakan nilai berbagai vs ingin cara selamat whereafter sedangkan dimana pun apakah utuh mau

bertanya-tanya ya kau milikmu dirimu nol memperhatikan aduh agar akhir antaranya apa-apa awal ayolah b bagian bahwa bapak barang tadi baru-baru barusan bekas beliau berakhir berbalik bergerak besok biasa bu buat bulat co con contoh dahulu lain-lain depan detail detik manapun disisi tengah-tengah

53 3

abaikan diambil dibuat didapat dimanakah dinyatakan diperlukan ditindaklanjuti puluh belas e ex g giliran h hadir hadirat hadirin hai haiyaa hal hamba hari hello heran ibu inc iya j jangan jatuh jenis juta k kanan karenanya kemana kemari kebanyakan kelompok kemanakah kemarin kenapa

kepentingan keterangan ketika kira kira-kira kiranya kosong kursus l la pula lainnya laki laki-laki lalu lanjutkan lawan layak lewat lusa m malah malahan masalah masing melanjutkan membuat membuka meminta mempunyai menarik menerus mengisi menjaga menyebabkan menyuruh merasa mestinya miliar milikkita mr mrs mulai

n nampak nomer nomor non nyonya o on p paduka pak penting penuh penyajian perihal persis point r rata rata-rata ratus rendah ribu runcing rupiah s saudara saudari sebagai sebagaimana segala sejumlah sekelompok selama-lamanya semoga seorang sepenuhnya sesungguhnya setengah setidaknya siapakah sisi nanti

4 54

sulung sungguh-sungguh tahun tak satupun seorangpun tambah tanya tapi tebal terbaru terbelakang terbesar terbuka terkecil terlalu terlihat ternyata tertarik terus-menerus dapat tipis titik

triliun tuan u umum umumnya v w www x y oleh meski sebanyak cuma percuma para ia rp bagi bahwa tersebut merupakan gara

disebabkan serta selaku kini bila maupun seraya tengah mengatasi menurutnya mengaku mengakui berada tejradi memadai seekor harusnya yang

5 55