Sumber 3
Sumber 3
21 Oktober 2023
Berkenalan
DATA TEXT
VARIETY
Variety menunjukkan keberagaman
jenis data, salah satunya adalah data
text.
Web Scraping APIs Survey
Menggunakan script Menggunakan API Mengumpulkan data
untuk mengambil (Application teks melalui survey.
teks dari situs web. Programming Contoh : Survey
Contoh : Scraping Interface) untuk kepuasan pelanggan.
artikel berita, mengakses data dari
komentar di forum. platform tertentu.
Contoh :
Mengumpulkan
tweet menggunakan
Twitter API.
Membutuhkan teknologi NLP
(Natural Language Processing)
Modeling,
analysis,
visualization
Feature
extraction
Pre-
processing
Before After
•
•
•
•
•
Text Clustering Topic Modeling Text
Classification
Text Clustering
•
Topic Modeling
•
•
Text Classification
•
•
Contoh:
• Pembuatan data sintetik misalnya review
sebuah produk--> untuk kepentingan
penelitian atau pembelajaran
• Menggenerate konten medsos, artikel, berita,
puisi, buku, obrolan dengan chatbot, dll
• Merupakan salah satu implementasi tercanggih dari Text Generation
• Menggunakan Large Language Model (LLMs) : GPT
• Memanfaatkan teknik deep learning dan NLP