Selamat datang di Scribd!

Lewati carousel

Tokenisasi Kelompok3

Diunggah oleh

Doni Agung Cahyono

0% menganggap dokumen ini bermanfaat (0 suara)

12 tayangan2 halaman

Tokenisasi

Judul Asli

Tokenisasi_Kelompok3

Hak Cipta

Format Tersedia

PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Tokenisasi

Hak Cipta:

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

12 tayangan2 halaman

Tokenisasi Kelompok3

Diunggah oleh

Doni Agung Cahyono

Tokenisasi

Hak Cipta:

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 2

Cari di dalam dokumen

10/21/2021 Tokenisasi

In [5]:
# -------------------KELOMPOK 3 ------------------------

#Nama : Anak Agung Ayu Putri Wiratni

#NIM : 190030090
#Pt. Asal : ITB STIKOM Bali
#Mata Kuliah : Natural Language Processing - *P

#Nama : Doni Agung Cahyono

#NPM : 17.0504.0066

#Nama : Banur Anas Ibrahim T.W

#NPM : 17.0504.0021

#Tokenisasi
from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Sarana laboratorium. Laboratorium ilmu komunikasi merup
print(filterdText)

['Sarana', 'laboratorium', 'Laboratorium', 'ilmu', 'komunikasi', 'merupakan', 'sarana',

'penunjuang', 'pembelajaran', 'di', 'prodi', 'ilmu', 'komunikasi', 'Laboratorium', 'in
i', 'dibagi', 'menjadi', 'tiga', 'yaitu', 'Public', 'Relations', 'PR', 'Broadcasting',
'Penyiaran', 'Radio', 'dan', 'Fotografi', 'dan', 'editing', 'Laboratorium', 'hanya', 'di
pergunakan', 'sesuai', 'jadwal', 'perkuliahan', 'yang', 'melibatkan', 'praktik', 'Berbed
a', 'dari', 'laboratorium', 'PR', 'dan', 'fotografi', 'editing', 'laboratorium', 'penyia
ran', 'radio', 'dapat', 'diakses', 'dengan', 'terlebih', 'dahulu', 'berkoordinasi', 'den
gan', 'kepala', 'Radio', 'Unimma', 'FM', 'untuk', 'pengaturan', 'jadwal', 'penggunaan',
'sarana', 'dan', 'prasarana', 'Pengaturan', 'jadwal', 'penggunaan', 'laboratorium', 'dil
akukan', 'oleh', 'Kepala', 'Laboratorium', 'dengan', 'berkoordinasi', 'dengan', 'dosen',
'pengampu', 'mata', 'kuliah']

In [1]:
#Stemming

from nltk.stem import PorterStemmer

e_words = ["cry", "crying", "cried"]
ps = PorterStemmer()
for w in e_words:
rootWord=ps.stem(w)
print(rootWord)

cri
cri
cri

In [6]:
#POS Tagging

import re
import nltk
from nltk import word_tokenize
from nltk import pos_tag

nlp = """Sarana laboratorium. Laboratorium ilmu komunikasi merupakan sarana penunjuang

clean_words = re.sub("[^a-zA-Z]", " ", nlp)

clean_words = " ".join(clean_words.split())

tokens = word_tokenize(clean_words)

file:///C:/Users/ASUS/Downloads/Tokenisasi (2).html 1/2

10/21/2021 Tokenisasi
pos_tokens = pos_tag(tokens)
print(pos_tokens)

[('Sarana', 'NNP'), ('laboratorium', 'NN'), ('Laboratorium', 'NNP'), ('ilmu', 'NN'), ('k

omunikasi', 'NN'), ('merupakan', 'NN'), ('sarana', 'NN'), ('penunjuang', 'NN'), ('pembel
ajaran', 'NN'), ('di', 'NN'), ('prodi', 'NN'), ('ilmu', 'NN'), ('komunikasi', 'NN'), ('L
aboratorium', 'NNP'), ('ini', 'NN'), ('dibagi', 'NN'), ('menjadi', 'NN'), ('tiga', 'N
N'), ('yaitu', 'VBZ'), ('Public', 'JJ'), ('Relations', 'NNPS'), ('PR', 'NNP'), ('Broadca
sting', 'NNP'), ('Penyiaran', 'NNP'), ('Radio', 'NNP'), ('dan', 'NN'), ('Fotografi', 'NN
P'), ('dan', 'NN'), ('editing', 'VBG'), ('Laboratorium', 'NNP'), ('hanya', 'NN'), ('dipe
rgunakan', 'NN'), ('sesuai', 'NN'), ('jadwal', 'NN'), ('perkuliahan', 'NN'), ('yang', 'N
N'), ('melibatkan', 'NN'), ('praktik', 'NN'), ('Berbeda', 'NNP'), ('dari', 'VBZ'), ('lab
oratorium', 'NN'), ('PR', 'NNP'), ('dan', 'NN'), ('fotografi', 'NN'), ('editing', 'VB
G'), ('laboratorium', 'NN'), ('penyiaran', 'NN'), ('radio', 'NN'), ('dapat', 'NN'), ('di
akses', 'VBZ'), ('dengan', 'JJ'), ('terlebih', 'JJ'), ('dahulu', 'NN'), ('berkoordinas
i', 'NN'), ('dengan', 'JJ'), ('kepala', 'NN'), ('Radio', 'NNP'), ('Unimma', 'NNP'), ('F
M', 'NNP'), ('untuk', 'JJ'), ('pengaturan', 'NN'), ('jadwal', 'NN'), ('penggunaan', 'N
N'), ('sarana', 'NN'), ('dan', 'NN'), ('prasarana', 'NN'), ('Pengaturan', 'NNP'), ('jadw
al', 'NN'), ('penggunaan', 'NN'), ('laboratorium', 'NN'), ('dilakukan', 'NN'), ('oleh',
'NN'), ('Kepala', 'NNP'), ('Laboratorium', 'NNP'), ('dengan', 'VBZ'), ('berkoordinasi',
'JJ'), ('dengan', 'JJ'), ('dosen', 'VBN'), ('pengampu', 'NN'), ('mata', 'NN'), ('kulia
h', 'NN')]

file:///C:/Users/ASUS/Downloads/Tokenisasi (2).html 2/2

Anda mungkin juga menyukai

Ipynb - Colaboratory
Dokumen13 halaman
Ipynb - Colaboratory
Mardianto Eko Nugroho
100% (1)
Referat Carpal Tunnel Syndrome
Dokumen22 halaman
Referat Carpal Tunnel Syndrome
Dewi S
100% (2)
UTS Bahasa Jawa Kelas 3 Semester 1
Dokumen3 halaman
UTS Bahasa Jawa Kelas 3 Semester 1
Hasbi
80% (30)
Format Laporan P2K3 Di Rumah Sakit
Dokumen4 halaman
Format Laporan P2K3 Di Rumah Sakit
somara natalis
Belum ada peringkat
Tugas Statistika
Dokumen10 halaman
Tugas Statistika
ziopardanu
Belum ada peringkat
Contoh Laporan Review RM
Dokumen5 halaman
Contoh Laporan Review RM
Rantini Indrayani
Belum ada peringkat
Korelasi Data SPT Vs CPT
Dokumen8 halaman
Korelasi Data SPT Vs CPT
Halomoan Harahap
Belum ada peringkat
Modul 8 Array Dan Memanipulasi Array
Dokumen11 halaman
Modul 8 Array Dan Memanipulasi Array
Nobel sunday
Belum ada peringkat
Teori9 - Text Mining in RStudio - Wardatul Jannah
Dokumen34 halaman
Teori9 - Text Mining in RStudio - Wardatul Jannah
wardatul jannah
Belum ada peringkat
Tugas Dasar Pemro
Dokumen43 halaman
Tugas Dasar Pemro
tari_eza
Belum ada peringkat
Dhinda Octoviana Putri - Colaboratory
Dokumen9 halaman
Dhinda Octoviana Putri - Colaboratory
dhindaoctovianaputri27
Belum ada peringkat
Tugas 8 Resume
Dokumen23 halaman
Tugas 8 Resume
dewirizkif
Belum ada peringkat
Pertemuan 9 Membuat Wordcloud
Dokumen32 halaman
Pertemuan 9 Membuat Wordcloud
Akun game
Belum ada peringkat
Matmul Ipynb
Dokumen46 halaman
Matmul Ipynb
Shàng Xià Sila
Belum ada peringkat
UTS-Siti Riska Roiyanatul Janah
Dokumen2 halaman
UTS-Siti Riska Roiyanatul Janah
Riska roiyantul Janah
Belum ada peringkat
Tugasl
Dokumen5 halaman
Tugasl
Antonius Afrialdi Seran
Belum ada peringkat
Kertas Penilaian Pengetahuan
Dokumen11 halaman
Kertas Penilaian Pengetahuan
Nurul Hidayah Muhammad
Belum ada peringkat
2 - Deconvolution
Dokumen8 halaman
2 - Deconvolution
fitri Pangaribuan
Belum ada peringkat
Jobsheet 12 - EDA
Dokumen11 halaman
Jobsheet 12 - EDA
Naufal Adli
Belum ada peringkat
TUGAS KUIS PENGOLAHAN SIGNAL SUARA - 497060 - Dan - 502903
Dokumen23 halaman
TUGAS KUIS PENGOLAHAN SIGNAL SUARA - 497060 - Dan - 502903
Zulfa Majidah
Belum ada peringkat
Pertemuan04 211700001
Dokumen30 halaman
Pertemuan04 211700001
Rama dhani
Belum ada peringkat
Inspeksi Radiograf
Dokumen3 halaman
Inspeksi Radiograf
rovidakamal
Belum ada peringkat
PDF Self Supporting Boxes Structure - Compress
Dokumen18 halaman
PDF Self Supporting Boxes Structure - Compress
19-112 Erika Sitanggang
Belum ada peringkat
7 Dzikr
Dokumen4 halaman
7 Dzikr
Ruddy ben Sayyid Hamzah
100% (4)
Khomaril Nur Fauzi - H1A020008 - Laporan Tugas Besar Praktikum ASD
Dokumen13 halaman
Khomaril Nur Fauzi - H1A020008 - Laporan Tugas Besar Praktikum ASD
KHOMARIL NUR FAUZI 1
Belum ada peringkat
File Program Matriks - Ipynb
Dokumen8 halaman
File Program Matriks - Ipynb
Ara Febrin
Belum ada peringkat
HP12 - F1a220059 - Sitti Nur Age
Dokumen14 halaman
HP12 - F1a220059 - Sitti Nur Age
Sitti Nur Age
Belum ada peringkat
Soal Tensai Komputer SMA 10 Padang 2013
Dokumen3 halaman
Soal Tensai Komputer SMA 10 Padang 2013
Iqrar Agalosi Nureyza
Belum ada peringkat
Contoh Berkas Syarat Kesedian
Dokumen8 halaman
Contoh Berkas Syarat Kesedian
Muhamad Firmansyah
Belum ada peringkat
JOB SHEET 3 DSP
Dokumen17 halaman
JOB SHEET 3 DSP
Rossa
Belum ada peringkat
Format Bab 4
Dokumen25 halaman
Format Bab 4
zorocamx
Belum ada peringkat
Soal Umbptn 2010 TNBK 440
Dokumen0 halaman
Soal Umbptn 2010 TNBK 440
Annissa Siregar
Belum ada peringkat
26 April
Dokumen3 halaman
26 April
Dhafin Ghalib
Belum ada peringkat
Pdfslide - Tips Laporan PKL Kelompok 3 k3 Mekanik Edit
Dokumen19 halaman
Pdfslide - Tips Laporan PKL Kelompok 3 k3 Mekanik Edit
ade
Belum ada peringkat
Sistem Modulasi Digital2
Dokumen12 halaman
Sistem Modulasi Digital2
Adi Putri Kusuma Wardhani
Belum ada peringkat
Absensi Praktek Lapangan 2014
Dokumen2 halaman
Absensi Praktek Lapangan 2014
Chandra Suterez Abizz
Belum ada peringkat
Jaringan Syaraf Tiruan Ditentukan Oleh 3 Hal: Arsitektur Jaringan, Sebagai Pola
Dokumen5 halaman
Jaringan Syaraf Tiruan Ditentukan Oleh 3 Hal: Arsitektur Jaringan, Sebagai Pola
benny
Belum ada peringkat
Kelompok 7 Basis Data Per 10
Dokumen13 halaman
Kelompok 7 Basis Data Per 10
Pirman syah
Belum ada peringkat
LKS RPP Peluang
Dokumen3 halaman
LKS RPP Peluang
Niela Rifai
Belum ada peringkat
Summary Chapter 6 Tkinter Graphics
Dokumen7 halaman
Summary Chapter 6 Tkinter Graphics
Dini Izzaty
Belum ada peringkat
Sijil Perakuan Kelambatan Dan Lanjutan Masa
Dokumen3 halaman
Sijil Perakuan Kelambatan Dan Lanjutan Masa
penauk
Belum ada peringkat
Kisi-Kisi Instrumen Ahli Materi
Dokumen8 halaman
Kisi-Kisi Instrumen Ahli Materi
Agnes Dwi Cahyani
Belum ada peringkat
Dokumen - Tips PPT Workshop Pembuatan Film
Dokumen45 halaman
Dokumen - Tips PPT Workshop Pembuatan Film
Suratman yoyo Budiatmaja
Belum ada peringkat
Sistem Informasi Manajemen Sumber Daya Manusia
Dokumen37 halaman
Sistem Informasi Manajemen Sumber Daya Manusia
Riki Harimulya
Belum ada peringkat
TUGAS R (PAK IWAN) - IRMA AYU SH - 2011133020-Converted (1) - Dikonversi
Dokumen11 halaman
TUGAS R (PAK IWAN) - IRMA AYU SH - 2011133020-Converted (1) - Dikonversi
Fadil Syahputra
Belum ada peringkat
Sqlyog Err
Dokumen7.081 halaman
Sqlyog Err
wawa
Belum ada peringkat
Align Left
Dokumen15 halaman
Align Left
David Suryono
Belum ada peringkat
BJT - Umum - tmk2 SATS4111 Komputer I
Dokumen4 halaman
BJT - Umum - tmk2 SATS4111 Komputer I
natalia walun
Belum ada peringkat
G Kepka Bapedal 107 1997 Perhitungan Pelaporan Informasi Indeks Standar Pencemar Udara
Dokumen16 halaman
G Kepka Bapedal 107 1997 Perhitungan Pelaporan Informasi Indeks Standar Pencemar Udara
api-243366401
Belum ada peringkat
Bab 8 PD
Dokumen10 halaman
Bab 8 PD
zanuartosuryono31
Belum ada peringkat
Format KAK
Dokumen8 halaman
Format KAK
nardoleo71
Belum ada peringkat
Lks Gerak Lurus
Dokumen6 halaman
Lks Gerak Lurus
Herlisa Comel
Belum ada peringkat
Sop Pemantauan Pelaksanaan Prosedur Pemeriksa
Dokumen1 halaman
Sop Pemantauan Pelaksanaan Prosedur Pemeriksa
Randa Ersapta
Belum ada peringkat