Buka menu navigasi

Pengaturan Pengguna

Selamat datang di Scribd!

Lewati carousel

Materi Tambahan 2

Diunggah oleh

0% menganggap dokumen ini bermanfaat (0 suara)

7 tayangan15 halaman

Judul Asli

MATERI TAMBAHAN 2

Hak Cipta

© © All Rights Reserved

Format Tersedia

PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Hak Cipta:

© All Rights Reserved

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

7 tayangan15 halaman

Materi Tambahan 2

Diunggah oleh

Hak Cipta:

© All Rights Reserved

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 15

Cari di dalam dokumen

BIG DATA

Dedi Dwi Saputra, MKom

dedi.eis@nusamandiri.ac.id
0878-8496-8597

1
BIG Data

Dedi Dwi Saputra, M,Kom

HP : 087884968597
EMAIL : dedi.eis@nusamandiri.ac.id
BIG Data

• Praktikum Pre-Processing Text Mining - Part I

• Labelling pada Text Mining
• Cleansing pada Text Mining Berbahasa Indonesia
• Tugas Pertemuan 9

3/15 Dedi Dwi Saputra, M,Kom

1. Labelling pada Text Mining

4/15 5
Dedi Dwi Saputra, M,Kom
Step 1 – Labelling pada Text Mining

Setelah kita mengambil data pada twitter, maka langkah

selanjutnya ialah melakukan proses “Labelling”. Fungsi
“Labelling” ialah untuk mengklasifikasikan sebuah Text pada
sebuah label. Dalam contoh ini menggunakan label dengan
“Complaint & Not Complaint”.

NB :

Perlu diingat, bahwa untuk melakukan proses labelling

seorang peneliti tidak boleh melakukan proses labelling
terhadap datanya sendiri. Karena dapat menimbulkan
“Sentiment Pribadi” terhadap sebuah objek yang sedang di
teliti.

5/15 Dedi Dwi Saputra, M,Kom

2. Cleansing pada Text Mining Berbahasa
Indonesia

6/15 5
Dedi Dwi Saputra, M,Kom
Step 2 – Cleansing pada Text Mining

Pada tahap ke-2 ini yaitu mempersiapkan data untuk melakukan langkah-langkah yang disebut dengan text-
cleansing, dengan menggunakan aplikasi preprocessing. Pertama menggunakan Gataframework yang dapat
diakses melalui link http://www.gataframework.com/textmining/ berikut adalah tahapannya

• Annotation Removal
• Transformation Remove URL
• Tokenize Regular Expression (Regexp)
• Indonesian Stemming
• Indonesian Stopword Removal

7/15 Dedi Dwi Saputra, M,Kom

Step 2 – Cleansing pada Text Mining

• Annotation Removal

Sebuah proses untuk mengurai text berdasarkan “White Space”, dalam proses ini semua anotasi yang
terkandung dalam sebuah “tweet” akan dihilangkan dan mengubah seluruh huruf kapital menjadi huruf kecil.

8/15 Dedi Dwi Saputra, M,Kom

Step 2 – Cleansing pada Text Mining

• Transformation Remove URL

Hasil dari @anotation removal akan di lanjutkan ke proses Transformation Remove URL, dalam proses ini link
atau URL yang terkandung pada tweet akan dihilangkan.

9/15 Dedi Dwi Saputra, M,Kom

Step 2 – Cleansing pada Text Mining

• Tokenize Regular Expression (Regexp)

Hasil dari Transformation Remove URL dilanjutkan oleh proses Tokenization (Regexp) yaitu semua kata yang ada
didalam tiap dokumen dikumpulkan dan dihilangkan tanda baca, serta dihilangkan jika terdapat simbol, karakter
khusus atau apapun yang bukan huruf.

10/15 Dedi Dwi Saputra, M,Kom

Step 2 – Cleansing pada Text Mining

• Indonesian Stemming

Hasil dari Tokenize Regular Expression (Regexp) akan dilakukan proses stemming yaitu mengubah kata
berimbuhan menjadi kata dasar menggunakan indonesian stemming untuk tweet berbahasa Indonesia.

11/15 Dedi Dwi Saputra, M,Kom

Step 2 – Cleansing pada Text Mining

• Indonesian Stopword Removal

Hasil dari indonesian stemming akan di lanjutkan ke proses Indonesian stopword removal, dalam proses ini kata-
kata yang tidak relevan akan dihapus, seperti kata tetapi, untuk, dengan, yang dimana kata yang tidak
mempunyai makna tersendiri jika dipisahkan dengan kata yang lain dan tidak terkait dengan kata sifat yang
berhubungan dengan sentiment.

12/15 Dedi Dwi Saputra, M,Kom

3. Tugas Praktikum

13/15 5
Dedi Dwi Saputra, M,Kom
Tugas Praktikum

14/15 Dedi Dwi Saputra, M,Kom

SEKIAN
&
TERIMAKASIH

15/15 33
Dedi Dwi Saputra, M,Kom

Anda mungkin juga menyukai

HSE Plan
Dokumen10 halaman
HSE Plan
Gazelle Aqiella Indra
100% (4)
b.4.2 Komposisi Tim Dan Penugasan
Dokumen6 halaman
b.4.2 Komposisi Tim Dan Penugasan
Adli AL Gifari
Belum ada peringkat
Tugas 12 - 1302194075
Dokumen8 halaman
Tugas 12 - 1302194075
Ghetsa Aulia R
Belum ada peringkat
Proposal Ujian Praktik
Dokumen4 halaman
Proposal Ujian Praktik
Agustinus Vivit Chrismiranto
Belum ada peringkat
Proposal Ujian Praktik
Dokumen4 halaman
Proposal Ujian Praktik
smpunggulanbinainsani surabaya
100% (1)
CV M Juanda Saputra
Dokumen6 halaman
CV M Juanda Saputra
alfonso napitupulu
Belum ada peringkat
Modul Praktel Tik
Dokumen14 halaman
Modul Praktel Tik
ali maskur
Belum ada peringkat
10535-Article Text-26990-1-10-20200921
Dokumen6 halaman
10535-Article Text-26990-1-10-20200921
Ghea Setyarini
Belum ada peringkat
1669-Article Text-7148-1-10-20220619
Dokumen14 halaman
1669-Article Text-7148-1-10-20220619
Iwan Setiawan
Belum ada peringkat
Proposal: Ujian Praktik Tik
Dokumen4 halaman
Proposal: Ujian Praktik Tik
Irma Rosalina
Belum ada peringkat
Prestasi Luring Dan Daring
Dokumen8 halaman
Prestasi Luring Dan Daring
Fakhrurrazi Ibnu Jalil
Belum ada peringkat
Visualisasi Re-Desain Gedung SMA Negeri 1 Terbanggi Besar Di Kabupaten Lampung Tengah, Propinsi Lampung
Dokumen9 halaman
Visualisasi Re-Desain Gedung SMA Negeri 1 Terbanggi Besar Di Kabupaten Lampung Tengah, Propinsi Lampung
Aurora Migi
Belum ada peringkat
Makalah Aplikasi Komputer
Dokumen21 halaman
Makalah Aplikasi Komputer
Yayan Fadhliano
Belum ada peringkat
Dian Dianatasari
Dokumen6 halaman
Dian Dianatasari
Yami Kojiro
Belum ada peringkat
Format Laporan Pendamping
Dokumen8 halaman
Format Laporan Pendamping
spendu limboto
Belum ada peringkat
Daftar Hadir Mahasiswa
Dokumen10 halaman
Daftar Hadir Mahasiswa
Jelita Store
Belum ada peringkat
PKM KKU Belum FIX 3
Dokumen13 halaman
PKM KKU Belum FIX 3
Gabriel Nicholaus
Belum ada peringkat
Luh Putu Alda M D MAKALAH MOL 3 C6
Dokumen2 halaman
Luh Putu Alda M D MAKALAH MOL 3 C6
Meysintia Dewii
Belum ada peringkat
Job Sheet Word, Excel
Dokumen29 halaman
Job Sheet Word, Excel
ptri
Belum ada peringkat
Rencana Pelaksanaan Pembelajaran (RPP)
Dokumen3 halaman
Rencana Pelaksanaan Pembelajaran (RPP)
Alkar Haris
Belum ada peringkat
Lampiran Usul Biaya Kreatif Dan Inovatif Devitri, S.PD
Dokumen6 halaman
Lampiran Usul Biaya Kreatif Dan Inovatif Devitri, S.PD
Yami Kojiro
Belum ada peringkat
Lamar Panin Bank
Dokumen15 halaman
Lamar Panin Bank
Christina Dwio S N
Belum ada peringkat
Bab Ii - 2018309tif
Dokumen19 halaman
Bab Ii - 2018309tif
riska tawari
Belum ada peringkat
Pelatihan Pembuatan Surat Lamaran Kerja Menggunakan Microsoft Word Pada PKBM Dharma Putra Mandiri
Dokumen8 halaman
Pelatihan Pembuatan Surat Lamaran Kerja Menggunakan Microsoft Word Pada PKBM Dharma Putra Mandiri
Yuni Mustika rini
Belum ada peringkat
Devano Sheva Rizkianto Tugas 2 .Pdf-Dikonversi
Dokumen7 halaman
Devano Sheva Rizkianto Tugas 2 .Pdf-Dikonversi
Sifaq Einstein
Belum ada peringkat
HLMN Pengshn, Kata Pengantar Daftar Isi Dan Ringkasan
Dokumen7 halaman
HLMN Pengshn, Kata Pengantar Daftar Isi Dan Ringkasan
Frey Sanderz de Taylor
Belum ada peringkat
Honda - Application Form Nadia Astrida Oktavia
Dokumen4 halaman
Honda - Application Form Nadia Astrida Oktavia
Nadia Astrida Oktavia Manurung
Belum ada peringkat
LAPORAN LEMBAGA Baru
Dokumen13 halaman
LAPORAN LEMBAGA Baru
Theresia Rumondor
Belum ada peringkat
BAB 3 Lapdal DED Oke
Dokumen128 halaman
BAB 3 Lapdal DED Oke
suhadi wahana
Belum ada peringkat
Komputer 2013
Dokumen6 halaman
Komputer 2013
Alfi Syahri
Belum ada peringkat
19051010079-Bab 1
Dokumen4 halaman
19051010079-Bab 1
Alief nur Imami
Belum ada peringkat
Laporan Akhir
Dokumen47 halaman
Laporan Akhir
Aprilia Dwi Endarwati
Belum ada peringkat
Tugas 1 Sesi 3 Wawasan Kebangsaan Ut
Dokumen10 halaman
Tugas 1 Sesi 3 Wawasan Kebangsaan Ut
Icha Phrathiwhi Airennya Oppaseunggi
Belum ada peringkat
Laporan Q Kedua
Dokumen13 halaman
Laporan Q Kedua
andi hutagalung
Belum ada peringkat
Laporan Ilham
Dokumen12 halaman
Laporan Ilham
Ilham Sandi
Belum ada peringkat
Pre Processing Pembentukan Korpus Al Quran Terjemahan Bahasa Indonesia Untuk Mendukung Information Retrieval
Dokumen10 halaman
Pre Processing Pembentukan Korpus Al Quran Terjemahan Bahasa Indonesia Untuk Mendukung Information Retrieval
Ahsan Thoriq
Belum ada peringkat
Makalah Manajemen Analisa Data Kel2
Dokumen60 halaman
Makalah Manajemen Analisa Data Kel2
amel
Belum ada peringkat
Pelatihan Microsoft Word Untuk Penulisan Skripsi
Dokumen7 halaman
Pelatihan Microsoft Word Untuk Penulisan Skripsi
Rasta Javana coffee
Belum ada peringkat
Laporan PKL - Nikolaus Jenanut
Dokumen27 halaman
Laporan PKL - Nikolaus Jenanut
Maria Tanti Egriska
Belum ada peringkat
Laporan Kerja Praktek-Adit
Dokumen59 halaman
Laporan Kerja Praktek-Adit
adis satwian
100% (1)
Laporan Abdimas 2020 Fix
Dokumen21 halaman
Laporan Abdimas 2020 Fix
Muga Linggar
Belum ada peringkat
Laporan Praktik Kerja Lapangan Di Telkom Witel Denpasar: Oleh Gede Putra Restana 1705021041
Dokumen26 halaman
Laporan Praktik Kerja Lapangan Di Telkom Witel Denpasar: Oleh Gede Putra Restana 1705021041
EKA KADIR
Belum ada peringkat
FREE TEMPLATE CV Lulusan S1 by Vina Muliana
Dokumen2 halaman
FREE TEMPLATE CV Lulusan S1 by Vina Muliana
Antika Nabila
Belum ada peringkat
Lap. Bulan I
Dokumen31 halaman
Lap. Bulan I
Doroteus Frederik Ganggur
Belum ada peringkat
Metode Pembuatan Papan Informasi Proyek
Dokumen3 halaman
Metode Pembuatan Papan Informasi Proyek
herman
Belum ada peringkat
KAKP
Dokumen6 halaman
KAKP
Diki Candra
Belum ada peringkat
SOP DESIGN Edutalk (Tips N Trick Memilih Jurusan)
Dokumen3 halaman
SOP DESIGN Edutalk (Tips N Trick Memilih Jurusan)
Deden akbar syahwaludin
Belum ada peringkat
Format Kontrak Perkuliahan Desain Web
Dokumen3 halaman
Format Kontrak Perkuliahan Desain Web
wahyu
Belum ada peringkat
2.1.1.2 Visi
Dokumen9 halaman
2.1.1.2 Visi
Ahmad Lutfi
Belum ada peringkat
Modul Aplikom
Dokumen16 halaman
Modul Aplikom
Lody Tauho
Belum ada peringkat
Jurnal 2022 Febry
Dokumen20 halaman
Jurnal 2022 Febry
Combat Combat
Belum ada peringkat
Aplikasi Bimbingan Konseling Pada Mts N 2 Lampung Timur Menggunakan Metode Scrum Berbasis Java
Dokumen20 halaman
Aplikasi Bimbingan Konseling Pada Mts N 2 Lampung Timur Menggunakan Metode Scrum Berbasis Java
Viaa
Belum ada peringkat
LKP Jane Kezia Krisdyanto 16013004
Dokumen83 halaman
LKP Jane Kezia Krisdyanto 16013004
panda movie
Belum ada peringkat
Garuda 2424207
Dokumen6 halaman
Garuda 2424207
Rahmat Nur Fitri Ruhiyat
Belum ada peringkat
Andhika
Dokumen33 halaman
Andhika
Erick Lansherr
Belum ada peringkat
Dokumen Penting
Dokumen73 halaman
Dokumen Penting
Dony Visca Barca
Belum ada peringkat
Laporan Magang - 1
Dokumen36 halaman
Laporan Magang - 1
Wiwin Daniatisinaga
Belum ada peringkat
CV - Moch. Nur Faqih, S.T. Pdti-2017
Dokumen2 halaman
CV - Moch. Nur Faqih, S.T. Pdti-2017
Moch Nur Faqih
Belum ada peringkat
Materi Tambahan 1
Dokumen16 halaman
Materi Tambahan 1
Boedoet Luky
Belum ada peringkat
Luky Budhi Utomo - Dwbipert2
Dokumen8 halaman
Luky Budhi Utomo - Dwbipert2
Boedoet Luky
Belum ada peringkat
nsgI0iiSDULp3lEQY7uuptZenmNN5CF6zW2VErNR Pert6
Dokumen9 halaman
nsgI0iiSDULp3lEQY7uuptZenmNN5CF6zW2VErNR Pert6
Boedoet Luky
Belum ada peringkat
Tweet Jntexpress
Dokumen14 halaman
Tweet Jntexpress
Boedoet Luky
Belum ada peringkat
Luky Budhi Utomo - Dwbipert5
Dokumen6 halaman
Luky Budhi Utomo - Dwbipert5
Boedoet Luky
Belum ada peringkat
Lukybudhiutomo Dwbipert4
Dokumen6 halaman
Lukybudhiutomo Dwbipert4
Boedoet Luky
Belum ada peringkat
Luky Budhi Utomo - Dwbipert2
Dokumen8 halaman
Luky Budhi Utomo - Dwbipert2
Boedoet Luky
Belum ada peringkat
Mengimplementasikan Algoritma Pemrograman PDF
Dokumen29 halaman
Mengimplementasikan Algoritma Pemrograman PDF
Boedoet Luky
Belum ada peringkat
PAI - LUKY B.U - 12.6a.18 - MEET 2 - 12185248
Dokumen2 halaman
PAI - LUKY B.U - 12.6a.18 - MEET 2 - 12185248
Boedoet Luky
Belum ada peringkat
Program Menghitung Penghasilan Laundry
Dokumen21 halaman
Program Menghitung Penghasilan Laundry
Boedoet Luky
Belum ada peringkat