Selamat datang di Scribd!

Lewati carousel

Pertemuan 9 Dan 10

Diunggah oleh

Syahla Ruly Nafiza

0% menganggap dokumen ini bermanfaat (0 suara)

9 tayangan2 halaman

Judul Asli

pertemuan9Dan10.txt

Hak Cipta

Format Tersedia

TXT, PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Hak Cipta:

Format Tersedia

Unduh sebagai TXT, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

9 tayangan2 halaman

Pertemuan 9 Dan 10

Diunggah oleh

Syahla Ruly Nafiza

Hak Cipta:

Format Tersedia

Unduh sebagai TXT, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 2

Cari di dalam dokumen

Text Mining

- Menambang data berupa test/kata

- sumber data didapatkan dari dokumen

proses text mining

-Tokenizing --> memecah sekumpulan karakter daalam suatu teks menjadi kata
-Filtering --> mengambil kata kata penting dari hasil token
-Stemming --> mencari kata dasar dari tiap filtering
-Tagging --> mencari bentuk dari tiap kata awal/dasar dari hasil stemming
-Analyzing --> melihat keterkaitan antar dokumen yang ada
pada tahap ini akan menggunakan metode TFIDF(Term Frequency Inversed Document
Frequency)

nltk -->
lancasterstemmer --> proses stemmer
wordnetlemmatizer --> proses tagging
stopwords --> menghilangkan kata kata yang tidak penting
re, string, unicodedata
menyederhanakan proses atau tahapan --> pipline

jika menggunakan classification maka metode yang digunakan adalah confusion_matrix

library visualisasi
matplotlib, seaborn, wordcloud

tqdm --> untuk mempercantik tampilan loading data

merapikan modul atau dokumen yang didownload --> beautifulsoup
ada 2 cara :
- api
- web scarping

menyimpan dan mengambil data dari file --> pickle

penganalisaan teks --> textblob

API --> menjembatani satu aplikasi ke aplikasi lainnya

remove between squere --> menghapus tanda baca

remove punctuation --> menghapus tanda baca
deepcopy --> mengcopy secara keseluruhan

unicode --> membaca karakter

apply --> dapat bekerja pada pandas dan dataFrame yang dapat melakukan transformasi
data lebih dari satu kolom

join --> mengubah format array list mejadi string pada pemrograman pyhton

split --> untuk memisahkan string sehingga menjadi substring yang dipisahkan oleh
karakter tertentu.

data series terdiri dari baris atau terdiri dari kolom

data frame terdiri dari baris dan kolom

value_count --> menghitung berapa kali suatu kata muncul

index --> mengetahui posisi elemen pada array list

list --> digunakan untuk mengubah suatu objek kebentuk
series = struktur data dasar dalam data pandas. stuktur data yangbisa ditampung
berupa integer,float,
dan juga string. Series juga mendukung operasi vektor

textblob --> library yang berguna untuk mengoreksi ejaan

spelling corection --> memperbaiki ejaaan
punk --> mendownload database corpus dari nltk
correct --> function yang melakukan perbaikan ejaan dalam sebuah kata.
corpus --> bagian dari pustaka teks elektronik, tetapi corpus dibangun dengan
kriteria untuk tujuan khusus.
korpus bentuk jamak disebut korpora.

WordNet --> kamus bahasa inggris yang merupakan bagian dari nltk untuk python

lemmatization --> mengubah suatu kata menjadi kata dasar dengan mengetahui konteks
dari kata tersebut.

word_count --> menghitung jumlah kata yang ditulis dalam file

len --> untuk mengidentifikasi dan mengetahui seberapa panjang jumlah item atau
anggota pada suatu objek.

kolom stopwords --> menampilkan banyaknya jumlah kata yang dihapus. kata disini
adalah
kata yang tidak memiliki makna atau kata yang tidak penting.

tahapan awal pelabelan data ulasan oleh responden sesuai dengan label negatif,
label positif dan label netral.

percobaan ke 29 ini merupakan proses pemberian label pada setiap baris yang
terdapat

explot --> pemberian jarak antar gambar

figsize --> ukuran gambar

wordcloud --> gambar yang menunjukkan daftar kata kata yang digunakan dalam sebuah
teks, umumnya

imshow --> menampilkan gambar pada worksheet

interploation --> digunakan untuk menampilkan

Anda mungkin juga menyukai

Mari Belajar Pemrograman Berorientasi Objek menggunakan Visual C# 6.0
Dari Everand
Mari Belajar Pemrograman Berorientasi Objek menggunakan Visual C# 6.0
Risal
Penilaian: 4 dari 5 bintang
4/5 (16)
Membuat Aplikasi Bisnis Menggunakan Visual Studio Lightswitch 2013
Dari Everand
Membuat Aplikasi Bisnis Menggunakan Visual Studio Lightswitch 2013
Risal
Penilaian: 3.5 dari 5 bintang
3.5/5 (7)
bc37f Sistem Berkas Materi 1
Dokumen23 halaman
bc37f Sistem Berkas Materi 1
JulianTPamurrung
Belum ada peringkat
1-Materi Kuliah Struktur Data
Dokumen5 halaman
1-Materi Kuliah Struktur Data
Iwan Hermawan
Belum ada peringkat
Materi Pertemuan Ke 15 Selanjutnya
Dokumen7 halaman
Materi Pertemuan Ke 15 Selanjutnya
Muhammad Irfan Baari
Belum ada peringkat
Kisi - Kisi Basis Data
Dokumen3 halaman
Kisi - Kisi Basis Data
Romy Jeremia T Sihombing
Belum ada peringkat
Kelompok-3 7A Tugas-1 PreprocessingTemplate IlmuData
Dokumen5 halaman
Kelompok-3 7A Tugas-1 PreprocessingTemplate IlmuData
Nur Maya sari
Belum ada peringkat
MATERI Kelompok 5
Dokumen10 halaman
MATERI Kelompok 5
teknik informatika
Belum ada peringkat
Tugas Prak So
Dokumen4 halaman
Tugas Prak So
M. Furqon Rabbani
Belum ada peringkat
Bahan Pertemuan 8
Dokumen16 halaman
Bahan Pertemuan 8
mt pradillah22
Belum ada peringkat
Sqlmap
Dokumen6 halaman
Sqlmap
Kajili -jili project
Belum ada peringkat
Library Python
Dokumen9 halaman
Library Python
Abram Baroteli
Belum ada peringkat
Laporan 2
Dokumen10 halaman
Laporan 2
Amelia Nur Hidayat
Belum ada peringkat
Contoh STBI
Dokumen13 halaman
Contoh STBI
DianKartikaSari
Belum ada peringkat
Data Mining: PENCARIAN DAN PENENTUAN BUKU REFERENSI TUGAS AKHIR MATAKULIAH DENGAN METODE NAÏVE BAYES CLASSIFIER DAN ASSOCIATION RULE
Dokumen7 halaman
Data Mining: PENCARIAN DAN PENENTUAN BUKU REFERENSI TUGAS AKHIR MATAKULIAH DENGAN METODE NAÏVE BAYES CLASSIFIER DAN ASSOCIATION RULE
Dani Ramadani
100% (1)
Presentasi Algoritma
Dokumen10 halaman
Presentasi Algoritma
Wahyudin Sixteenth
Belum ada peringkat
Penjabaran Bab 2 Pemrosesan Query& Optimasi Query (Sumber Utama)
Dokumen25 halaman
Penjabaran Bab 2 Pemrosesan Query& Optimasi Query (Sumber Utama)
Alvino Drp
0% (1)
(Ibnu Damar Muslih)
Dokumen20 halaman
(Ibnu Damar Muslih)
Ibnu Damar M
Belum ada peringkat
LK 02 Struktur Data
Dokumen8 halaman
LK 02 Struktur Data
Dian Dianasari
Belum ada peringkat
Modul Praktikum Stbi 2019
Dokumen24 halaman
Modul Praktikum Stbi 2019
boby wiratama
Belum ada peringkat
LaporanProject 1310191015 Ahmad Sahal I.docx 3
Dokumen26 halaman
LaporanProject 1310191015 Ahmad Sahal I.docx 3
Ahmad Sahal
Belum ada peringkat
Operasi I/O Linux
Dokumen9 halaman
Operasi I/O Linux
Rewinda Hendra Firmansyah
Belum ada peringkat
MATERI-06-Numpy Library
Dokumen32 halaman
MATERI-06-Numpy Library
Rahmat Hidayat
Belum ada peringkat
Tugas Uas Pakom
Dokumen5 halaman
Tugas Uas Pakom
Adnan Hanif
Belum ada peringkat
Java Collection Framework, Dimana Framework Ini Diletakan Dalam Package Java - Util Dan
Dokumen27 halaman
Java Collection Framework, Dimana Framework Ini Diletakan Dalam Package Java - Util Dan
Dhennis Dwinda Tamara
Belum ada peringkat
Era Pratiwi 19220378 SI6R
Dokumen15 halaman
Era Pratiwi 19220378 SI6R
Wedding Organizer Dara
Belum ada peringkat
Lucky Maulana - Laporan Praktikum Sistem Operasi - Modul 1
Dokumen21 halaman
Lucky Maulana - Laporan Praktikum Sistem Operasi - Modul 1
Lucky Maulana
Belum ada peringkat
Laporan Praktikum Input Output
Dokumen7 halaman
Laporan Praktikum Input Output
Retno Ristiani
Belum ada peringkat
Bab1 Konsep Dasar Pengertian Berkas & Akses
Dokumen22 halaman
Bab1 Konsep Dasar Pengertian Berkas & Akses
ikehhh
Belum ada peringkat
Penggunaan Set Dan Dictionary Dalam Python
Dokumen14 halaman
Penggunaan Set Dan Dictionary Dalam Python
setiyawanmuktiwijaya160902
Belum ada peringkat
Tugas Ekt 2 Pempro Kelompok 4
Dokumen12 halaman
Tugas Ekt 2 Pempro Kelompok 4
mahastie
Belum ada peringkat
Jawabn Percobaan 5
Dokumen5 halaman
Jawabn Percobaan 5
Hebron Prasetya
Belum ada peringkat
Bab Ii
Dokumen17 halaman
Bab Ii
Puspita Deri Syahfitri
Belum ada peringkat
Modul Praktikum PW 2016 Bab 4 - OperasiFile
Dokumen7 halaman
Modul Praktikum PW 2016 Bab 4 - OperasiFile
frederik12
Belum ada peringkat
9 - Extracting Information From Text (Part 1)
Dokumen35 halaman
9 - Extracting Information From Text (Part 1)
Mahendra Maulana
Belum ada peringkat
Kelompok 9 - Pemrograman Dasar - Penggunaan Set Dan Dictionary Dalam Python
Dokumen15 halaman
Kelompok 9 - Pemrograman Dasar - Penggunaan Set Dan Dictionary Dalam Python
setiyawanmuktiwijaya160902
Belum ada peringkat
Rangkuman So
Dokumen3 halaman
Rangkuman So
DEWI PITRI YANI
Belum ada peringkat
Laporan SO3
Dokumen30 halaman
Laporan SO3
Roji Ashsigili
0% (1)
Rangkuman UAS ALPRO
Dokumen6 halaman
Rangkuman UAS ALPRO
bluecytrus
Belum ada peringkat
Penjelasan CRUD
Dokumen8 halaman
Penjelasan CRUD
25 ZAKI N
Belum ada peringkat
Perintah Dasar Linux Dan Osi Layer
Dokumen8 halaman
Perintah Dasar Linux Dan Osi Layer
Ali Muklis
Belum ada peringkat
POWERPOINT Struktur Data
Dokumen16 halaman
POWERPOINT Struktur Data
Ray Hanna
Belum ada peringkat
Cara Mudah Membuat Aplikasi Web Dengan JSP Dan Database Mysql
Dokumen5 halaman
Cara Mudah Membuat Aplikasi Web Dengan JSP Dan Database Mysql
panega
Belum ada peringkat
Rangkuman Materi Kompre Algoritma & Apsi
Dokumen23 halaman
Rangkuman Materi Kompre Algoritma & Apsi
Faqih
Belum ada peringkat
Bab Iii
Dokumen18 halaman
Bab Iii
Taufik Fitriyadi
Belum ada peringkat
BAB IV-Metode Information Retrival (IR)
Dokumen8 halaman
BAB IV-Metode Information Retrival (IR)
Winda Lisa
Belum ada peringkat
Materi DPK - Materi File
Dokumen9 halaman
Materi DPK - Materi File
jangkrik kus
Belum ada peringkat
Modul 8 - File
Dokumen9 halaman
Modul 8 - File
Coba-Coba Aja
Belum ada peringkat
Pertemuan 4 - Big Data
Dokumen11 halaman
Pertemuan 4 - Big Data
Donker 1582
Belum ada peringkat
Modul Sistem Operasi
Dokumen178 halaman
Modul Sistem Operasi
Sugar Apple
100% (1)
CG Liza
Dokumen12 halaman
CG Liza
saifuddin
Belum ada peringkat
Kelompok 9
Dokumen10 halaman
Kelompok 9
Akhmad Galib
Belum ada peringkat
Mengenal Fungsi Fython
Dokumen11 halaman
Mengenal Fungsi Fython
lingdarat12
Belum ada peringkat
Sistem File
Dokumen14 halaman
Sistem File
Syatria Babullah
Belum ada peringkat
Pratikum 1
Dokumen3 halaman
Pratikum 1
Rayhan Ahadi Nifri
Belum ada peringkat
Modul System Operasi Linux
Dokumen70 halaman
Modul System Operasi Linux
Ariest
Belum ada peringkat
Exca Wella Monica - G1A020018 - Tugas Praktikum DatMin
Dokumen3 halaman
Exca Wella Monica - G1A020018 - Tugas Praktikum DatMin
Exca Wella Monica
Belum ada peringkat