Anda di halaman 1dari 7

Social Computing & Big Data Analytics Laboratory Faculty of Economics & Business, Telkom University

www.labscbd.id / scbdlabtelkom@gmail.com

PRAKTIKUM WEEK-7 (MODUL 7):

TEXT ANALYTICS WITH PYTHON

Updated Modul: 15 November 2020


By Team Teaching SCBD Laboratory 2020
( Amalia, Artika, Dinar, Fadhilah, Muh Rizky, Mutiara, Nabilla, Trisna, Willy)
Chief of SCBD laboratory: Dr. Andry Alamsyah
Coordinator of Laboratory : Tri Widarmanti S.MB., MM

PRAKTIKUM 7
Pada praktikum ke 7 Mata Kuliah Big Data dan Data Analytics, kita akan menggunakan Google
Collaboration (online browserbased platform) dan bahasa pemrograman Python untuk praktek
mengenai Text Analytics.

I. Text Mining
Text mining is the process to extract pattern (useful information and knowledge) from large
amount of unstructured data.

II. Peprocessing
Pre-processing atau praproses data merupakan proses untuk mempersiapkan data mentah
sebelum dilakukan proses lain. Pada umumnya, praproses data dilakukan dengan cara
mengeliminasi data yang tidak sesuai atau mengubah data menjadi bentuk yang lebih
mudah diproses oleh sistem.

A. PRAKTIKUM
- Text Mining
Pada praktikum kali ini kita akan menggunakan tools google colab
https://colab.research.google.com/. Dataset yang akan digunakan adalah data tweets
mengenai Brand mobil General Motors.

1. Import Library

1
Social Computing & Big Data Analytics Laboratory Faculty of Economics & Business, Telkom University
www.labscbd.id / scbdlabtelkom@gmail.com

2. Import Data

3. PreProcessing
a. Remove Duplicate

b. RemoveURL

c. LowerCasing

d. Remove Username (Optional)

e. Tokenize

2
Social Computing & Big Data Analytics Laboratory Faculty of Economics & Business, Telkom University
www.labscbd.id / scbdlabtelkom@gmail.com

f. Stemming

3
Social Computing & Big Data Analytics Laboratory Faculty of Economics & Business, Telkom University
www.labscbd.id / scbdlabtelkom@gmail.com

g. Lemmatize

 Membandingkan Tokenize, Stemming, dan Lemmatize

h. Stopwords

4
Social Computing & Big Data Analytics Laboratory Faculty of Economics & Business, Telkom University
www.labscbd.id / scbdlabtelkom@gmail.com

4. Visualization
a. Import Library

5
Social Computing & Big Data Analytics Laboratory Faculty of Economics & Business, Telkom University
www.labscbd.id / scbdlabtelkom@gmail.com

Figure 1 Wordcloud

6
Social Computing & Big Data Analytics Laboratory Faculty of Economics & Business, Telkom University
www.labscbd.id / scbdlabtelkom@gmail.com

TUGAS PRAKTIKUM-7
Rules & Condition
1. Silahkan melakukan crawling menggunakan script crawlingsna pada modul pekan 6.
Gunakan keyword atau topik apapun yang sedang ramai dibicarakan di twitter. Tiap
kelompok topiknya harus berbeda.
2. Kemudian lakukan Text Analyst dengan menggunakan script yang sudah tersedia
pada data masing-masing.
3. Pengumpulan maksimal 2 hari sebelum pelajaran Big Data minggu berikutnya.
4. Kelompok tercepat akan mendapat poin tambahan.
5. Dilarang copas hasil pekerjaan kelompok lain.

Tugas dikumpulkan melalui dropbox asisten lab masing-masing dengan format zip
rar (kumpulkan script.ipynb dan ppt)

Subjek file: Kelas_Nama ketua kelompok_Praktikum7


(Contoh: MB42-11_ShintaMaharani_Praktikum7)

- Terima kasih -

Anda mungkin juga menyukai