Proposal Analisis Data Gangguan Jaringan Pada Pelanggan Indihome PT

ANALISIS DATA GANGGUAN JARIANGAN PADA PELANGGAN INDIHOME
PT. TELKOMUNIKASI INDONESIA TBK. MENGGUNAKAN METODE NAIVE

BAYES CLASSIFIER
Proposal Skripsi Diajukan sebagai Projek Ulangan Tengah Semester pada

Mata Kuliah Bahasa Indonesia 1
Disusun oleh :
Nama : Diana Sinar Permatasari

NPM : 43A87006160012
SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER BANI

SALEH
BEKASI
2019
i
Analisis Data Gangguan Jaringan Pada Pelanggan IndiHome PT. Telekomunikasi

Indonesia Tbk. Menggunakan Metode Naive Bayes Classifier
ABSTRAK
Data mining adalah teknik yang memanfaatkan data dalam jumlah yang besar untuk
memperoleh informasi berharga yang sebelumnya tidak diketahui dan dapat
dimanfaatkan untuk pengambilan keputusan penting. Pada penelitian ini, penulis
menambang data pelanggan PT. Telekomunikasi Indonesia, TBK yang mengalami
gangguan 1035 dan gangguan 1054. Gangguan 1035 terjadi karena data pelanggan belum
memiliki service internet, service voice, maupun belum memiliki service IPTV, penyebab
lain terjadinya gangguan 1035 yakni karena adanya peralihan atau migrasi dari
sebelumnya menggunakan Cooper menjadi Fiber Optic. Sedangkan gangguan 1054
terjadi karena ketidaksesuaian perangkat aktif pelanggan di sistem.
Naive Bayes Classifier merupakan salah satu metode pada probabilistic reasoning.
Algoritma Naive Bayes Classifier bertujuan untuk melakukan klasifikas i data pada kelas
tertentu, kemudian hasil dari klasifikasi dapat digunakan sebagai penyelesaian dari
penghitungan gangguan yang sering terjadi, khususnya ganggua n 1035 dan gangguan
1054 yang terjadi di PT. Telekomunikasi Indonesia, TBK.
Kata Kunci: Teknologi Informasi, Data Mining, Naive Bayes Classifier.
i
ii
KATA PENGANTAR
puji syukur kehadiran Allah SWT yang telah melimpahkan segala rahmat dan hidayah-Nya,
sehingga proposal skripsi dengan judul “Analisis Data Gangguan Jaringan Pada
Pelanggan IndiHome PT. Telekomunikasi Indonesia Tbk. Menggunakan Metode
Naive Bayes Classifier” dapat penulis selesaikan dengan baik.
Penyusunan proposal skripsi ini merupakan salah satu Projek Ulangan Tengah
Semester pada Mata Kuliah Bahasa Indonesia 1 di Sekolah Tinggi Manajemen
Informatika dan Komputer Bani Saleh.
Penulis sungguh sangat menyadari, bahwa penulisan proposal skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan do’a dari berbagai pihak yang ikut
mendoa’akan dan memotivasi penulis, sehingga dapat menyelesaikan proposal skripsi ini.
Maka, dalam kesempatan ini penulis juga mengucapkan terima kasih yang sebesar-
besarnya kepada:
1. Bapak Drs. Taufiq Maulana, MBA, selaku Ketua Sekolah Tinggi Manajemen
dan Komputer (STMIK) Bani Saleh Bekasi.
2. Ibu Puji Rahayu, M.Pd, dosen mata kuliah Bahasa Indonesia 1 STMIK Bani
Saleh, sebagai dosen pengajar dan pembimbing yang telah memberikan penulis
kesempatan membuat proposal skripsi ini.
3. Bapak dan Ibu Dosen STMIK Bani Saleh Bekasi yang telah mendidik penulis.
4. Seluruh Staff dan Karyawan STMIK Bani Saleh Bekasi yang telah memberikan
bantuan serta fasilitas lainnya.
5. Orang Tua penulis yang telah memberikan doa dan dukungannya baik moril dan
materil.
6. Rekan – rekan mahasiswa/i STMIK Bani Saleh khususnya Jurusan Teknik
Informatika angkatan 2016-2017 yang telah memberikan dukungan dan kerja
samanya selama ini.
7. Semua pihak yang ikut terlibat dalam penulisan proposal skripsi ini yang tidak
disebutkan dengan tidak mengurangi rasa hormat. Semoga bantuan dan
kebaikannya dibalas oleh Allah SWT dengan kebaikan yang berlipat ganda dan
melimpah. Penulis berharap semoga
ii
iii
proposal skripsi ini dapat bermanfaat bagi penulis maupun pembaca untuk
menambah pengetahuan.
Bekasi, 03 April 2019
Penulis
iii
iv
DAFTAR ISI
ABSTRAK ...................................................................................................... i
KATA PENGANTAR .................................................................................... ii
DAFTAR ISI ................................................................................................... iv
BAB I PENDAHULUAN
1.1 Latar Belakang .......................................................................................... 1
1.2 Identifikasi Masalah .................................................................................. 1
1.3 Batasan Masalah......................................................................................... 1
1.4 Tujuan Penelitian ...................................................................................... 1
1.5 Manfaat Penelitian .................................................................................... 1
BAB 11 LANDASAN TEORI
2.1 Landasan Teori ........................................................................................... 1
2.1.1 Data Mining .................................................................................... 1
2.1.2 Tahapan Data Mining ..................................................................... 1
2.1.3 Pengelompokan Data Mining ......................................................... 1
2.1.3.1 Deskripsi ............................................................................. 1
2.1.3.2 Estimasi .............................................................................. 1
2.1.3.3 Prediksi ............................................................................... 1
2.1.3.4 Klasifikasi ........................................................................... 1
2.1.3.5 Pengklusteran ..................................................................... 1
2.1.3.6 Asosiasi ............................................................................... 1
2.1.4 Definisi PHP ................................................................................... 1
2.1.5 Pengertian Sistem ............................................................................ 1
2.1.6 Pengertian Sistem Informasi ........................................................... 1
2.1.7 Pengertian XAMPP ......................................................................... 1
2.1.8 Pengertian Web ............................................................................... 1
2.1.9 Pengertian Bootsrap ........................................................................ 1
2.1.10 Pengetian BlackBox Testing .......................................................... 1
2.2 Clustering .................................................................................................. 1
2.3 Naïve Bayes Classifier .............................................................................. 1
iv
v
BAB III METODE PENELITIAN

3.1 Analisis Kebutuhan ................................................................................... 1
3.2 Perancangan Penelitian ............................................................................. 1
3.2.1 Perhitunagn Metode Naïve Bayes Classifier.................................... 1
3.2.2 Unified modelling Language (UML) ............................................... 1
3.2.3 Hasil Analisis Penelitian .................................................................. 1
3.3 Teknik Analisis ......................................................................................... 1
v
1
BAB I
PENDAHULUAN
1.1 Latar Belakang

Teknologi Informasi adalah seperangkat alat yang membantu manusia bekerja
dengan informasi dan melakukan tugas-tugas yang berhubunga n dengan pemrosesan
informasi dan tidak terbatas pada teknologi komputer yang digunakan untuk memproses
dan menyimpan informasi, melainkan juga mencakup teknologi komunikasi untuk
mengirimkan informasi. Teknologi Informasi adalah gabungan antara teknologi
komputer dan teknologi telekomunikasi atau dengan istilah Teknologi Informasi dan
Komunikasi (TIK).
Seiring dengan laju pembangunan dan pertumbuhan ekonomi, kebutuhan
masyarakat akan jasa telekomunikasi semakin bertambah dengan cepat.
Penyelenggaraan jasa telekomunikasi semakin dituntut untuk mampu menyediakan
komunikasi berkualitas tinggi agar dapat menjawab kebutuhan pelanggan akan layanan
data kecepatan tinggi (high speed data) dan suara (voice). Jaringan komputer adalah
salah satu sarana komunikasi yang sangat dibutuhkan dan telah digunakan oleh banyak
kalangan dalam hal pribadi maupun bisnis seperti E-Commerce ataupun E-business
terutama yang menerapkan perdagangan online, telah mengintegrasikan situs Web
mereka dengan situs back-office seperti database, control stock serta penelusuran
pelanggan mereka. A
nalisis data gangguan ialah upaya atau cara untuk mengolah data menjadi informasi
sehingga karakteristik data tersebut bisa dipahami dan bermanfaat untuk solusi
permasalahan, terutama masalah yang dibahas pada penelitian ini yakni gangguan 1035
dengan klasifikasi gangguan Internet Not Found, Voice Not Found dan IPTV Not Found
lalu gangguan 1054 dengan klasifikasi ganguan GPON00, GPON01, GPON02,
GPON03, GPON04, dan GPON 05, sedangkan tujuan dari adanya analisis ini ialah
untuk mendeskripsikan data sehingga dapat dipahami, lalu untuk membuat kesimpulan
mengenai
1
2
karakteristik populasi berdasarkan data yang didapatkan dari sampel. Naive Bayes
Classifier merupakan salah satu algoritma pembelajaran induktif yang paling efektif
dan efisien untuk machine learning dana data mining. Performa Naive Bayes yang
kompetitif dalam proses klasifikasi walaupun menggunakan asumsi keindependena n
atribut (tidak ada kaitan antar atribut). Naive Bayes Classifier merupkan
pengklasifikasian dengan metode probabilitas dan statistik yang dikemukakan oleh
ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan
pengalaman di masa sebelumnya sehingga dikenal dengan teorema bayes. Keuntungan
penggunaan Naive Bayes Classifier adalah bahwa metode ini hanya membutuhkan
jumlah data pelatihan (Traning Data) yang kecil untuk menentukan estimasi parameter
yang diperlukan dalam proses pengklasifikasian.
PT. Telekomunikasi Indonesia Tbk (Telkom), adalah salah satu perusahaan
yang menyelenggarakan jasa telekomunikasi di Indonesia, Telkom STO Kranji, Kota
Bekasi, Provinsi Jawa Barat merupakan salah satu cabang perusahaan Telkom di
Bekasi-Jawa Barat. Produk dari Telkom yang melayani masyarakat salah satunya
adalah IndiHome, IndiHome adalah akses internet dengan menggunakan kabel LAN
(Local Area Network) atau UTP (Ushielded Twisted Pair) yang disambungkan ke
telepon rumah dan dibantu oleh perangkat pendukung lainnya seperti modem, kabel
jaringan yakni Twisted Pair (UTP dan STP), coaxial, fiber optic, Network Interface
Card (NIC), konektor RJ-45, BNC/T, ST, Hub, Switch dan Router. Sedangkan
konsep dari layanan IndiHome merupakan salah satu produk layanan dari Telkom
Group berupa paket layanan yang terpadu dalam satu paket triple play meliputi
layanan komunikasi, data dan entertainment seperti telepon rumah, internet (Internet
on Fiber atau High Speed Internet) dan layanan televis i interaktif dengan teknologi
IPTV (UseeTV). IndiHome juga dilengkap i dengan beragam layanan tambahan
(add-on) yang bisa dipilih sesuai kebutuhan dan keinginan pelanggan seperti Telepon
Mania, wifi.id seamless, TrenMicro Antivirus, IndiHome View (online surveillance
camera). kesimpulan mengenai karakteristik populasi berdasarkan data yang
didapatkan dari sampel. Naive Bayes Classifier merupakan salah satu algoritma
pembelajaran induktif yang paling efektif dan efisien untuk machine learning dana
data mining. Performa Naive Bayes yang kompetitif dalam proses klasifikasi
2
3
walaupun menggunakan asumsi keindependena n atribut (tidak ada kaitan antar

atribut). Naive Bayes Classifier merupkan pengklasifikasian dengan metode
probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes,
yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa
sebelumnya sehingga dikenal dengan teorema bayes. Keuntungan penggunaan Naive
Bayes Classifier adalah bahwa metode ini hanya membutuhkan jumlah data pelatihan
(Traning Data) yang kecil untuk menentukan estimasi parameter yang diperlukan
dalam proses pengklasifikasian.
PT. Telekomunikasi Indonesia Tbk (Telkom), adalah salah satu perusahaan
yang menyelenggarakan jasa telekomunikasi di Indonesia, Telkom STO Kranji, Kota
Bekasi, Provinsi Jawa Barat merupakan salah satu cabang perusahaan Telkom di
Bekasi-Jawa Barat. Produk dari Telkom yang melayani masyarakat salah satunya
adalah IndiHome, IndiHome adalah akses internet dengan menggunakan kabel LAN
(Local Area Network) atau UTP (Ushielded Twisted Pair) yang disambungkan ke
telepon rumah dan dibantu oleh perangkat pendukung lainnya seperti modem, kabel
jaringan yakni Twisted Pair (UTP dan STP), coaxial, fiber optic, Network Interface
Card (NIC), konektor RJ-45, BNC/T, ST, Hub, Switch dan Router. Sedangkan
konsep dari layanan IndiHome merupakan salah satu produk layanan dari Telkom
Group berupa paket layanan yang terpadu dalam satu paket triple play meliputi
layanan komunikasi, data dan entertainment seperti telepon rumah, internet (Internet
on Fiber atau High Speed Internet) dan layanan televisi interaktif dengan teknologi
IPTV (UseeTV). IndiHome juga dilengkapi dengan beragam layanan tambahan (add-
on) yang bisa dipilih sesuai kebutuhan dan keinginan pelanggan seperti Telepon
Mania, wifi.id seamless, TrenMicro Antivirus, IndiHome View (online surveillance
camera).
Pada penelitian ini akan dilakukan analisis gangguan yang disebabkan oleh
jaringan komunikasi ataupun perangkat IndiHome dan alat pendukung yang sudah
rusak atau usang. Untuk mengatasi masalah tersebut maka PT. Telekomunikasi
Indonesia Tbk, melakukan analisis data pelanggan IndiHome untuk memonitor
jaringan yang tersambung internet sebagai alat untuk mengetahui mengapa jaringan
atau koneksi internet sangat lambat atau yang lainnya, penyebab terjadinya gangguan
3
4
apa saja yang sering terjadi pada perangkat IndiHome serta bagaimana
penanganannya. Dengan latar belakang terebut penulis mengambil judul “Analisis
Data Gangguan Jaringan Pada Pelanggan Indihome PT. Telekomunikasi
Indonesia Tbk. Menggunakan Metode Naïve Bayes Classifier”
1.2 Identifikasi Masalah

Identifikasi masalah yang mendasari penelitian ini adalah sebagai berikut:
a. Tidak adanya cara membaca data gangguan error di PT. Telekomunikasi Indonesia
Tbk. secara cepat dan akurat menggunakan metode Naive Bayes Classifier.
b. Tidak adanya cara mengkalkulasikan data gangguan secara cepat dan akurat
menggunakan metode Naive Bayes Classifier.
1.3 Batasan Masalah

a. Total data yang diolah pada penulisan ini sebanyak 1000 data pelanggan IndiHome
yang mengalami gangguan, dan ganggua n yang akan di analisis yakni hanya
gangguan 1035 dan ganggua n 1054, dan data gangguan pelanggan tersebut
merupakan data pada bulan Januari – Desember 2017. Sedangkan, data Training
yang digunakan pada penelitian ini yakni sebanyak 100 data, terbagi dari 50 (Lima
Puluh) data gangguan 1035 dan 50 (Lima Puluh) data gangguan 1054.
b. Pada penelitian ini penghitungan yang digunakan adalah metode Naive Bayes
Classifier, sedangkan aplikasi yang digunakan berbasis Web dan hasil
perhitungannya adalah menampilkan grafik dari hasil perhitungan manual.
1.4 Tujuan Penelitian
a. Memahami cara melakukan monitoring gangguan error yang terjadi pada data
pelanggan Indihome
b. mempermudah menganalisis error yang terjadi pada data pelanggan Indihome.
c. Dapat memberikan informasi mengenai gangguan data pelanggan dari hasil analisis
kepada pihak PT. Telekomunikasi Indonesia TBK.
1.5 Manfaat Penelitian
4
5
a. Manfaat praktis, diharapkan menjadi masukan bagi pihak PT. Telekomunikasi

Indonesia TBK. Khususnya team data management dalam membantu menyelesaikan
gangguan data pada pelanggan secara back-office.
b. Manfaat teoritis, diharapkan menjadi referensi atau masukan bagi perkembangan
ilmu komunikasi dan menambah kajian ilmu komunikasi khususnya di bidang
Teknologi Informasi dan Komunikasi.
c. Membantu dalam pengambilan keputusan dalam menganalisis gangguan yang
terjadi pada Indihome.
5
6
BAB II
LANDASAN TEORI
2.1 Landasan Teori

Jasa telekomunikasi adalah layanan telekomunikasi untuk memenuhi Kebutuhan
bertelekomunikasi dengan menggunakan jaringan telekomunikasi. Jasa telekomunikasi
di Indonesia diantaranya adalah jasa telepon tidak bergerak, jasa telepon seluler, jasa
interkoneksi, jasa layaan pesan singkat, faksimili, jasa layanan internet seluler, dan
video call.
Gangguan merupakan kekeliruan, Gangguan merupakan suatu kekeliruan,
ketidaktepatan atau kesalahan yang dapat disebabkan oleh Software atau perangkat
lunak, Hardware atau perangkat keras, dan Human Error yang berarti kesalahan dari
pengguna. Gangguan 1035 dan gangguan 1054 terjadi karena adanya data pelanggan
yang tidak sesuai pada sistem yang ada dilapangan, jadi solusi dari ganggua n 1035 dan
gangguan 1054 yakni dengan memperbaiki data pelanggan pada sistem mengikuti data
pelanggan yang ada dilapangan.
Data pelanggan yang akan diolah dalam penelitian ini sebanyak 1000 data
pelanggan, 500 data mengalami gangguan 1035 dan 500 data mengala mi gangguan
1054. Data pelanggan yang mengalami gangguan ini akan diolah menggunakan metode
Naive Bayes Classifier dan hasil akhirnya adalah dalam bentuk grafik.
2.1.1 Data Mining

Menurut Widodo (2013) Data Mining adalah analisa terhadap data untuk
menemukan hubungan yang jelas serta menyimpulka n yang belum diketahui
sebelumnya dengan cara terkini dipahami dan berguna bagi pemilik data tersebut.
Secara garis besar, Data Mining dapat dikelompokkan menjadi 2 kategori utama,
yaitu:
6
7
a. Descriptive Mining, yaitu proses untuk menemukan karakteristik penting

dari data dalam satu basis data. Teknik data mining yang termasuk
descriptive mining adalah clustering, asosiation, dan sequential mining.
b. Predictive, yaitu proses untuk menemukan pola dari data dengan
menggunakan beberapa variable lain di masa depan. Salah satu teknik
yang terdapat dalam predictive mining adalah klasifikasi.
Berikut merupakan proses data mining:
Tujuan dari data mining:

a. Explonatory, yaitu untuk menjelaskan beberapa kegiatan observasi atau
kondisi.
b. Confirmatory, yaitu untuk mengkonfirmasi suatu hipotesis yag telah ada.
c. Exploratory, yaitu untuk menganalisis data baru suatu relasi yang janggal.
2.1.2 Tahap-tahap data mining

Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi
beberapa tahap proses. Tahap-tahap tersebut bersifat interaktif, pemakai
terlibat langsung atau dengan perantaraan knowledge base. Berikut
merupakan tahap-tahap data mining sebagai berikut: (Ridwan, M., Suyono,
H., Sarosa, M., 2013)
a. Pembersihan data (data cleaning), merupakan proses menghilangkan noise
dan data yang tidak konsisten atau data tidak relevan.
7
8
b. Integrasi data (data integration), merupakan penggabungan data dari

berbagai database ke dalam suatu database baru.
c. Seleksi data (data selection), data yang ada pada database sering kali tidak
semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis
yang akan di ambil dari database.
d. Transformasi data (data transformation), data yang diubah atau
digabungkan ke dalam format yang sesuai untuk diproses dalam data
mining.
e. Proses mining, merupakan suatu proses utama saat metode diterapkan
untuk menemukan pengetahuan berharga dan tersembunyi dari data.
Beberapa metode yang dapat digunakan berdasarkan pengelompokan data
mining.
f. Evaluasi pola (pattern evaluation), untuk mengidentifikasi pola-pola
menarik ke dalam knowledge based yang ditemukan.
g. Presentasi pengetahuan (knowledge presentation), merupakan visualisasi
dan penyajian pengetahuan mengenai metode yang digunakan untuk
memperoleh pengetahuan yang diperoleh pengguna.
2.1.3 Pengelompokan Data Mining

Data Mining dibagi menjadi beberapa kelompok berdasarkan tugas
yang dapat dilakukan, yaitu: (Anik Andriani, 2013).
2.1.3.1 Deskripsi
Deskripsi merupakan cara untuk menggambarkan pola dan
kecenderungan yang terdapat dalam data yang dimiliki.
2.1.3.2 Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variable target estimasi
lebih ke arah numerik dari pada ke arah kategori. Model yang dibangun
menggunakan record lengkap yang menyediakan nilai variable target
sebagai nilai prediksi.
8
9
2.1.3.3 Prediksi
Prediksi menerka sebuah nilai yang belum diketahui dan juga
memperkirakan nilai untuk masa mendatang.
2.1.3.4 Klasifikasi
Dalam klasifikasi terdapat target variable kategori, misal penggolongan
pada hasil penggajian dapat dipisahkan dalam tiga kategori, yaitu tinggi,
sedang, dan rendah.
2.1.3.5 Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan atau
memperhatikan dan membentuk kelas objek-objek yang memiliki
kemiripan.
2.1.3.6 Asosiasi
Asosiasi bertugas menemukan atribut yang muncul dalam satu waktu.
Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.
2.1.4 Definisi PHP

Menurut pandangan beberapa ahli, PHP dapat diartikan sebagai berikut:
a. Menurut Bernadhed (2013), berpendapat bahwa “PHP adalah sebuah
bahasa pemrograman yang berjalan dalam sebuah web server (server
side)”.
b. Menurut Agus Saputra (2012), berpendapat bahwa “PHP memiliki
kepanjangan Hypertext Processor merupakan suatu bahasa pemrograman
yang difungsikan untuk membangun suatu website dinamis. PHP menyatu
dengan kode HTML, maksudnya adalah beda kondisi, HTML digunakan
sebagai pembangun atau pondasi dari kerangka layout web, sedangkan
PHP difungsikan sebagai prosesnya, sehingga dengan adanya PHP
tersebut, sebuah web akan sangat mudah di-maintenance”.
Berdasarkan pengertian diatas dapat ditarik kesimpulan bahwa adalah
suatu bahasa pemrograman script yang dimengerti oleh komputer secara
langsung dengan hak cipta terbuka (open source) yang digunakan untuk
membuat halaman website yang dinamis dan pengembangan web.
9
10
2.1.5 Pengertian Sistem

Sistem adalah suatu jaringan kerja dari prosedur-prosedur yang saling
berhubungan, berkumpul Bersama-sama untuk melakukan suatu kegiatan
atau menyelesaikan suatu sasaran tertentu. Menurut pandangan beberapa
ahli sistem dapat diartikan sebagai berikut:
a. Menurut Tata Sutabri (2012), berpendapat bahwa “Suatu sistem dapat
diartikan sebagai suatu kumpulan atau himpunan dari unsur, komponen,
atau variable yang terorganisir, saling berinteraksi, saling tergantung
satu sama lain, dan terpadu”.
b. Menurut Yakub (2012), berpendapat bahwa “Sistem adalah suatu
jaringan kerja dari prosedur-prosedur yang berhubungan,
terkumpul bersama-sama untuk melakukan suatu kegiatan atau tujuan
tertentu”.
Berdasarkan pengertian diatas dapat ditarik kesimpulan bahwa sistem
adalah jaringan kerja atau seperangkat elemen-elemen yang disatukan dan
dirancang untuk mencapai tujuan bersama.
2.1.6 Pengertian Sistem Informasi

Menurut pandangan beberapa ahli, sistem informasi dapat diartikan
sebagai berikut:
a. Menurut Tata Sutabri (2012), berpendapat bahwa “Sistem informasi
adalah suatu sistem didalam suatu organisasi yang mempertemukan
kebutuhan pengolahan transaksi harian yang mendukung fungsi operasi
organisasi untuk dapat menyediakan kepada pihak luar tertentu dengan
laporan-laporan yang diperlukan”.
b. Menurut Sutarman (2012), berpendapat bahwa “Sistem informasi
adalah sistem dapat didefinisikan dengan mengumpulkan, memproses,
menyimpan, menganalisis, menyebarkan informasi untuk tujuan
tertentu. Seperti sistem lainnya, sebuah sistem informasi terdiri dari
input (data, instruksi), dan output (laporan, kalkulasi)”.
10
11
Berdasarkan beberapa pendapat yang dikemukakan diatas dapat ditarik

kesimpulan bahwa “Sistem informasi merupakan gabungan dari manusia,
hardware, software, jaringan komunikasi dan data yang saling berinteraksi
untuk menyimpan, mengumpulkan, memproses, dan mendistribusikan
informasi untuk mendukung pengambilan keputusan dalam suatu organisasi”.
2.1.7 Pengertian Xampp

Menurut Kartini (2013), berpendapat bahwa “Xampp merupakan tool
yang menyediakan paket perangkat lunak ke dalam satu buah paket”.
2.1.8 Pengertian Web

Berikut merupakan pengertian Web menurut beberapa ahli:
a. Menurut Agus Hariyanto (2015), Web dapat diartikan sebagai kumpulan
halaman yang menampilkan informasi data teks, data gambar, data
animasi, data video, dan gabungan dari semuanya, baik yang bersifat
statis maupun dinamis yang membentuk satu rangkaian bangunan yang
saling terkait, dimana masing- mas ing dihubungkan dengan jaringan-
jaringan halaman (hyperlink).
b. Menurut Rohi Abdulloh (2015), Web adalah sekumpulan halaman yang
terdiri dari beberapa halaman yang berisi informasi dalam bentuk data
digital baik berupa teks, gambar, video, audio, dan animasi lainnya yang
disediakan melalui jalur koneksi internet.
Berdasarkan uraian, penulis menyimpulkan bahawa web adalah sebuah
software yang berfungsi untuk menampilkan dokumen-dokumen pada suatu
web yang membuat pengguna dapat mengakses internet melalui software yang
terkoneksi dengan internet.
2.1.9 Pengertian Bootstrap

Menurut Husein Alatas (2013) Bootstrap merupakan framework untuk
membangun desain web secara responsif. Artinya, tampila n web yang dibuat
oleh Bootstrap akan menyesuaikan ukuran layer dan browser yang kita
11
12
gunakan baik di desktop, tablet ataupun mobile device. Dengan bootstrap kita
juga bisa membangun web dinamis ataupun statis.
2.1.10 Pengertian Black Box Testing

Menurut Agustiar Budiman (2012), berpendapat bahwa “Pengujian
Blackbox merupakan metode perancangan data uji yang didasarkan pada
spesifikasi perangkat lunak. Data uji dibangkitka n, dieksekusi pada
perangkat lunak dan kemudian keluaran dari perangkat lunak diuji apakah
telah sesuai dengan yang diharapkan”.
2.3 Clustering
Clustering merupakan pengelompokan data tanpa berdasarkan kelas data
tertentu ke dalam kelas objek yang sama. Sebuah cluster adalah kumpulan record
yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan
dengan record dalam cluster lain. Tujuannya adalah untuk menghasilkan
pengelompokan objek yang mirip satu sama lain dalam kelompok-kelompok.
Dengan menggunakan klasterisasi, metode ini dapat mengidentifikas i daerah
yang padat, menemukan pola-pola distribusi secara keseluruhan, dan menemukan
keterkaitan yang menarik antar atribut-atribut data. Dalam data mining, usaha
difokuskan pada metode-metode penemuan untuk klaster pada basis data berukuran
besar secara efektif dan efisien. Kebutuhan klasterisasi dalam data mining meliputi
skalabilitas, kemampuan untuk menangani tipe atribut yang berbeda, mampu
menangani dimensionalitas yang tinggi, mengangani data yang mempunyai noise,
dan dapat diterjemahkan dengan mudah.
Menurut Widodo (2013) Clustering atau klasifikasi adalah metode yang
digunakan untuk membagi rangkaian data menjadi beberapa group berdasarkan
kesamaan-kesamaan yang telah ditentukan sebelumnya. Cluster adalah sekolompok
atau sekumpulan objek-objek data yang similar satu sama lain dalam cluster yang
sama dan disimilar terhadap objek-objek yang berbeda cluster. Objek akan
dikelompokkan ke dalam satu atau lebih cluster sehingga objek-objek yang berada
12
13
dalam satu cluster akan mempunyai kesamaan yang tinggi antara satu dengan yang
lainnya.
Secara garis besar, terdapat beberapa metode klasterisasi data. Pemelihan
metode klasterisasi tergantung pada tipe data dan tujuan klasterisasi itu sendiri.
Metode-metode beserta algoritmanya termasuk didalamnya meliputi:
a. Partitioning Method
Membuat berbagai partisi dan kemudian mengevaluasi partisi tersebut dengan
beberapa kriteria. Yang termasuk ke dalam metode ini meliputi algortima K-
Means, K-Medoid, Proclus, Clara, Clarans, dan PAM.
b. Hierarichal Method
Membuat suatu penguraian secara hierarikal dari himpunan data dengan
menggunakan beberapa kriteria. Metode ini terdiri atas dua macam, yaitu
Agglomerative yang menggunakan strategi Bottom-up dan Devisive yang
menggunakan strategi Top-down. Metode ini melip uti algoritma Birch, Agnes,
Diana, Cure, dan Chamaleon.
c. Density-based Method
Metode ini berdasarkan konektivitas dan fungsi densitas. Metode ini meliputi
algoritma Dbscan, Optics, dan Denclu.
d. Grid-base Method
Metode ini berdasarkan suatu struktur granularitas multi level. Metode klasterisasi
ini meliputi algortima Sting, WaveCluster, dan Clique.
e. Model-base Method
Suatu model dihipotesiskan untuk masing- masing kluster dan ide untuk mencari
best fit dari model model tersebut untuk masing- mas ing yang lain. Metode
klusterisasi ini meliputi pendekatan statistic, yaitu algoritma Cobweb dan jaringan
syaraf tiruan yaitu SOM.
13
14
2.3 Naive Bayes Classifier

Naive Bayes Classifier merupakan sebuah pengklasifikasian dengan metode
probabilitas dan statistik yang ditemukan oleh ilmuwan asal inggris Thomas Bayes,
sebelumnya (Bustami, 2013). Keuntungan penggunaan Naive Bayes Classifier adalah
bahwa metode ini hanya membutuhkan jumlah data pelatihan (Training Data) yang
kecil untuk menentukan estimasi parameter yang diperlukan dalam proses
pengklasifikasian.
Keterangan:
X : Data kelas yang belum diketahui.
H : Hipotesis dari data X yaitu suatu kelas spesifik.
P(H| X) : Probabilitas Hipotesis H berdasarkan kondisi X.
P(H) : Probabilitas Hipotesis H
P(X | H) : Probabilitas X berdasarkan kondisi H
P(X) : Probabilitas X
Pada rumus di atas dapat dijelaskan bahwa teorema naive bayes dibutuhkan sebuah petunjuk
sebagai proses penentu kelas yang sesuai dengan sampel. Sehingga dibutuhkan kesesuaian
terhadap teorema bayes sebagai berikut:
Keterangan:
C : Sebagai kelas
F1…Fn : Petunjuk atau syarat kondisi
14
15
BAB III
METODE PENELITIAN
3.1 Analisis Kebutuhan

3.1.2 Teknik Pengumpulan Data
Teknik pengumpulan data yang akan digunakan adalah mengumpulkan data
pelanggan IndiHome yang mengalami ganggua n 1035 dan gangguan 1054. Data
gangguan yang diperoleh sebanyak 1000 data gangguan 1035 dan data gangguan
1054 yang terbagi sebanyak 500 (Lima Ratus) data gangguan 1035 dan sebanyak
500 (Lima Ratus) data gangguan 1054. Dalam penelitian ini menggunaka n
beberapa klasfikasi dengan mencantumkan beberapa atribut dari masing- masing
gangguan yang akan di analisis.
3.2 Perancangan Penelitian

Naive Bayes Classifier adalah salah satu algortima pembelajaran induktif yang
paling efektif dan efisien untuk machine learning dan data mining. Performa naive
bayes yang kompetitif dalam proses klasifikasi walaupun menggunakan asumsi
keindependenan atribut (tidak ada kaitan antar atribut). Asumsi keindependenan
atribut ini pada data sebenarnya jarang terjadi namun walaupun asumsi
keindependenan atribut tersebut dilanggar performa pengklasifikasian naive bayes
cukup tinggi, hal ini dibuktikan pada berbagai penelitian empiris.
Naive Bayes Classifier merupakan pengklasifikasian dengan metode
probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes,
sebelumnya sehingga dikenal sebagai teorema bayes. Teorema tersebut
dikombinasikan dengan “naive” dimana diasumsikan kondisi antar atribut saling
bebas. Pada sebuah dataset, setiap basis atau dokumen I diasumsikan sebagai vector
dari nilai- nilai atribut <x1,x2,…,x3> dimana tiap nilai-nila i menjadi peninjauan
atribut Xi (iЄ[1,n])). Setiap baris mempunyai label kelas ci Є {c1,c2,…,ck} sebagai
nilai variable kelas C, sehingga untuk melakukan klasifikasi dapat dihitung nilai
15
16
probabilitas p(C=ci|X=xj), dikarenakan pada Naive Bayes diasumsikan setiap atribut

saling bebas, maka persamaan yang didapat adalah sebagai berikut:
a. Peluang p(C=ci|X=xj) menunjukkan peluang bersyarat atribut Xi dengan
nilai xi diberikan kelas C, dimana dalam Naive Bayes, kelas C bertipe kualitatif
sedangkan atribut Xi dapat bertipe kualitatif ataupun kuantitatif.
b. Ketika atribut Xi bertipe kuantitatif maka peluang p(X=xi|C=cj) akan sangat
kecil sehingga membuat persamaan peluang tersebut tidak dapat diandalkan
untuk permasalahan atribut bertipe kuantitatif.
3.2.1 Penghitungan Metode Naive Bayes Classifier

Teknik pengumpulan data yang digunakan adalah Studi Lapangan (Field
Research) dengan cara melakukan penelitia n langsung di lapangan mengenai
Analisis Data Gangguan Jaringan Pada Pelanggan IndiHome PT.
Telekomunikasi Indonesia TBK, dasar dari teorema Bayes dinyatakan dalam
persamaan rumus sebagai berikut:
Keterangan:
X : Data kelas yang belum diketahui.
H : Hipotesis dari data X yaitu suatu kelas spesifik.
P(H | X) : Probabilitas Hipotesis H berdasarkan kondisi X.
P(H) : Probabilitas Hipotesis H.
P(X | H) : Probabilitas X berdasarkan kondisi H.
P(X) : Probabilitas X
Pada rumus diatas dapat dijelaskan bahwa teorema Naive Bayes
dibutuhkan sebuah petunjuk sebagai proses penentu kelas yang sesuai dengan
sampel. Sehingga dibutuhkan kesesuaian terhadap teorema Bayes sebagai
berikut:
16
17
Keterangan:
C : Sebagai kelas.
F1…Fn : Petunjuk atau syarat kondisi.
Dengan demikian rumus diatas menjelaskan bahwa peluang masuknya
sampel karakteristik tertentu dalam kelas C (Posterior) merupakan peluang
munculnya kelas C (sebelum adanya sampel) dikalikan peluamg munculnya
kriteria sampel pada kelas C yang kemudian dibagi dengan peluang munculnya
kriteria sampel secara keseluruhan, sehingga rumus diatas juga bisa dituliskan
sebagai berikut:
Dimana nilai evidence selalu tetap pada tiap-tiap kelas dalam sebuah
sampel. Sedangkan nilai dari posterior adalah perbandinga n nilai antar
posterior. Sehingga rumus tersebut dapat dijabarkan sebagai berikut:
(C|F1…Fn) = P (C).P (F1…Fn|C)
= P (C).P (F1|C) P (F2…Fn|C, F1)
= P (C).P (F1|C) P (F2|C, F1) P (F3…Fn|C, F1, F2)
= P (C).P(F1|C) P (F2|C, F1) P (F3|C, F1, F2) P (F4…Fn|C, F1, F2,F3)
= P (C).P (F1|C) P (F2|C, F1) P (F3|C, F1, F2)…P (Fn|C, F1, F2, F3…Fn-1)
Hasil penjabaran rumus diatas menjelaskan bahwa jika syarat-syarat dalam
kelas semakin banyak maka semakin banyak pula nilai probabilitasnya. Hal
tersebut sangat tidak memungkinkan jika dilakukan analisis manual
satu persatu karena perhitungannya akan semakin sulit. Sehingga dapat
digunakan rumus sebagai berikut:
Persamaan diatas menjelaskan adanya asumsi independen menjadikan

syarat dalam sebuah sampel menjadi lebih sederhana dan memungkinkan
dihitung dengan rumus yang lebih di sederhanakan sebagai berikut:
17
18
Jika diketahui jenis gangguan 1035 yang mempunyai kriteria gangguan

Internet Not Found, Voice Not Found, dan IPTV Not Found, sedangan kriteria
gangguan 1054 adalah GPON 00, GPON 01, GPON 02, GPON 03, GPON 04,
GPON 05, sehingga dapat dilakukan penghitungan untuk menentukan P (class)
sebagai berikut:
a. P (Y = Gangguan 1035) = 500/1000
b. P (Y = Gangguan 1054) = 500/1000
Untuk menghitung jumlah kasus yang sama dengan class yang sama adalah
sebagai berikut:
a. P (Internet not found | Y = Gangguan 1035) =
219/500 P (Voice not found | Y = Gangguan 1035)
= 278/500 P (IPTV not found | Y = Gangguan
1035) = 3/500
b. P (GPON 00 | Y = Gangguan 1054) =

15/500 P (GPON 01 | Y = Gangguan 1054)
= 19/500 P (GPON 02 | Y = Gangguan
1054) = 158/500 P (GPON 03 | Y =
Gangguan 1054) = 127/500 P (GPON 04 |
Y = Gangguan 1054) = 144/500 P (GPON
05 | Y = Gangguan 1054) = 37/500
Untuk mengetahui hasil variable gangguan, kalikan semua hasil variable
pada gangguan 1035 dan gangguan 1054 sebagai berikut:
a. P (Internet not found | 1035) * P (Voice not found | 1035) * P (IPTV not
found | 1035)
= 219/500 * 278/500 * 3/500
= 0,438 * 0,556 * 0,006
18
19
= 0,0015
b. P (GPON 00 | 1054) * P (GPON 01 | 1054) * P (GPON 02 | 1054) * P
(GPON 03 | 1054) * P (GPON 04 | 1054) * P (GPON 05 | 1054)
= 15/500 * 19/500 * 158/500 * 127/500 * 144/500 * 37/500
= 0,03 * 0,038 * 0,316 * 0,254 * 0,288 * 0,074
= 1,9501
Kesimpulan penghitungan dapat dinyatakan bahwa nilai probabilitas
tertinggi yakni ada pada kelas Gangguan 1035 terdapat pada klasifikasi
Voice Not Found (278/500), sedangkan pada kelas Gangguan 1054 nilai
probabilitas tertinggi terdapat pada klasifikasi GPON 02 (127/500).
3.2.2 Unified Modelling Language (UML)

UML merupakan bahasa visual untuk pemodelan dan komunikasi mengenai
sebuah sistem dengna menggunakan diagram dan teks-teks pendukung. (Rosa
& Shalahuddin, 2016:292).
Unified Model Language (UML) adalah satu kumpulan konvensi pemodelan
yang digunakan untuk menentukan atau menggambarka n sebuah sistem
software yang terkait dengan objek.
3.2.2.1 Perancangan Use case Diagram
Use Case diagram digunakan untuk menggambarkan sistem dari sudut
pandang pengguna sistem tersebut (user). Sehingga pembuatan use case
diagram lebih dititik beratkan pada fungsionalitas yang ada pada sistem,
bukan berdasarkan alur atau urutan kejadian. Sebuah use case diagram
mempresentasikan sebuah interaksi antara actor dengan sistem tersebut.
Indra dan George (2017).
3.2.2.2 Perancangan Activity Diagram
Menggambarkan rangkaian aliran dari aktifitas, digunakan untuk
mendeskripsikan aktifitas yang dibentuk dalam suatu operasi sehingga
dapat juga digunakan untuk aktifitas lainnya. Diagram ini sangat mirip
dengan flowchart karena memodelkan workflow dari suatu aktifitas ke
aktifitas yang lainya, atau dari aktifitas ke status. Pembuatan activity
19
20
diagram pada awal pemodelan proses dapat membantu memahami

keseluruhan proses. Activity diagram juga digunakan untuk
menggambarkan interaksi antara beberapa use case. Indra dan George
(2017).
3.2.2.3 Perancangan Sequence Diagram

Menggambarkan interaksi antara sejumlah objek dalam urutan
waktu. Kegunaannya untuk menunjukka n rangkaian pesan yang
dikirim antara objek juga interaksi antar objek yang tejadi pada titik
tertentu dalam eksekusi sistem. Indra dan George (2017).
3.2.2.4 Perancangan Class Diagram
Class adalah spesifikasi yang akan menghasilkan objek dan
merupakan inti dari pengembangan dan desain berorientasi objek. Class
menggambarkan keadaan (atribut atau properti) suatu sistem, sekaligus
menawarkan layanan untuk memanipulasi keadaan tersebut (metode
atau fungs i). Class memiliki tiga area pokok yakni, nama (class name),
atribut, dan metode (opretaion). Indra dan George (2017).
3.3 Teknik Analisis

Jenis penelitian yang digunakan dalam penelitian ini adalah penelitia n
deskriptif dengan pendekatan kuantitatif. Sasaran dari hasil penelitian ini adalah pada
posisi head office PT. Telekomunikasi Indonesia Tbk. Dimana nantinya dapat
membantu penghitungan banyaknya gangguan yang akan terjadi dimasa yang akan
datang. Teknik pengumpulan data yang dilakukan penulis pada penelitian ini adalah:
a. Studi Literatur
Pada studi literatur akan dipelajari dasar dari teori yang digunakan dalam
penulisan serta pengerjaan penelitian. Teori-teori pendukung penulisan serta
pemahaman tentang penelitian ini diperoleh dari jurnal, internet dan penelitian
sebelumnya yang berkaitan dengan topik penelitia n analisis data gangguan
jaringan pada pelanggan IndiHome PT. Telekomunikasi Indonesia Tbk.
Menggunakan metode Naive Bayes Classifier.
20
21
b. Interview
Mencoba berbagai modul yang telah dipersiapkan dari hasil literature serta
mendiskusikan hasilnya dengan dosen pembimbing dan pakar lain.
c. Pengujian BlackBox
Pengujian yang digunakan dalam penelitianini adalah BlackBox Testing.
Pengujian BlackBox berfokus pada persyaratan fungsional perangkat lunak, dengan
demikian pengujian BlackBox memungkinkan perekayasa perangkat lunak
mendapatkan serangkaian kondisi input yang sepenuhnya menggunakan semua
persyaratan fungsional untuk semua program. Kebenaran perangkat lunak yang diuji
hanya dilihat dari data atau kondisi masukan yang diberikan untuk fungsi yang ada
tanpa melihat bagaimana proses untuk mendapatkan keluaran tersebut. Dari keluaran
yang dihasilkan kemampuan program dalam memenuhi kebutuhan pemakai dapat
diukur sekaligus dapat diketahui kesalahan-kesalahannya.
21

Proposal Analisis Data Gangguan Jaringan Pada Pelanggan Indihome PT

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Proposal Analisis Data Gangguan Jaringan Pada Pelanggan Indihome PT

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS DATA GANGGUAN JARIANGAN PADA PELANGGAN INDIHOME

PT. TELKOMUNIKASI INDONESIA TBK. MENGGUNAKAN METODE NAIVE

Proposal Skripsi Diajukan sebagai Projek Ulangan Tengah Semester pada

Nama : Diana Sinar Permatasari

SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER BANI

Analisis Data Gangguan Jaringan Pada Pelanggan IndiHome PT. Telekomunikasi

Kata Kunci: Teknologi Informasi, Data Mining, Naive Bayes Classifier.

Bekasi, 03 April 2019

BAB III METODE PENELITIAN

1.1 Latar Belakang

walaupun menggunakan asumsi keindependena n atribut (tidak ada kaitan antar

1.2 Identifikasi Masalah

1.3 Batasan Masalah

1.5 Manfaat Penelitian

a. Manfaat praktis, diharapkan menjadi masukan bagi pihak PT. Telekomunikasi

2.1 Landasan Teori

2.1.1 Data Mining

a. Descriptive Mining, yaitu proses untuk menemukan karakteristik penting

Berikut merupakan proses data mining:

Tujuan dari data mining:

2.1.2 Tahap-tahap data mining

b. Integrasi data (data integration), merupakan penggabungan data dari

2.1.3 Pengelompokan Data Mining

2.1.4 Definisi PHP

2.1.5 Pengertian Sistem

2.1.6 Pengertian Sistem Informasi

Berdasarkan beberapa pendapat yang dikemukakan diatas dapat ditarik

2.1.7 Pengertian Xampp

2.1.8 Pengertian Web

2.1.9 Pengertian Bootstrap

2.1.10 Pengertian Black Box Testing

2.3 Naive Bayes Classifier

3.1 Analisis Kebutuhan

3.2 Perancangan Penelitian

probabilitas p(C=ci|X=xj), dikarenakan pada Naive Bayes diasumsikan setiap atribut

3.2.1 Penghitungan Metode Naive Bayes Classifier

Persamaan diatas menjelaskan adanya asumsi independen menjadikan

Jika diketahui jenis gangguan 1035 yang mempunyai kriteria gangguan

b. P (GPON 00 | Y = Gangguan 1054) =

3.2.2 Unified Modelling Language (UML)

diagram pada awal pemodelan proses dapat membantu memahami

3.2.2.3 Perancangan Sequence Diagram

3.3 Teknik Analisis

Anda mungkin juga menyukai