Anda di halaman 1dari 21

Kuliah Umum Statistika & Analisis Data

21 Oktober 2023

Berkenalan
DATA TEXT
VARIETY
Variety menunjukkan keberagaman
jenis data, salah satunya adalah data
text.
Web Scraping APIs Survey
Menggunakan script Menggunakan API Mengumpulkan data
untuk mengambil (Application teks melalui survey.
teks dari situs web. Programming Contoh : Survey
Contoh : Scraping Interface) untuk kepuasan pelanggan.
artikel berita, mengakses data dari
komentar di forum. platform tertentu.
Contoh :
Mengumpulkan
tweet menggunakan
Twitter API.
Membutuhkan teknologi NLP
(Natural Language Processing)
Modeling,
analysis,
visualization
Feature
extraction
Pre-
processing
Before After




Text Clustering Topic Modeling Text
Classification
Text Clustering


Topic Modeling



Text Classification



Contoh:
• Pembuatan data sintetik misalnya review
sebuah produk--> untuk kepentingan
penelitian atau pembelajaran
• Menggenerate konten medsos, artikel, berita,
puisi, buku, obrolan dengan chatbot, dll
• Merupakan salah satu implementasi tercanggih dari Text Generation
• Menggunakan Large Language Model (LLMs) : GPT
• Memanfaatkan teknik deep learning dan NLP

Anda mungkin juga menyukai