PERTEMUAN 13
NOVIANDI
MIK | FAKULTAS ILMU-ILMU KESEHATAN
Complex Data Types
Pola
Trends
Associations (Hubungan yang menarik yang
tersembunyi dalam dataset besar).
Definisi Text Mining
Text Mining
= Data Mining (yang diterapkan dalam bentuk data teks)
+ basic linguistic
Text Mining
Bagaimana Text Mining bekerja?
3. Menemukan pola yang lebih baik dari hasil perubahan teks yang
tidak terstruktur menjadi data semi terstruktur
Search Discover
(Goal-Oriented) (Opportunistic)
Structured Data Retrieval Data Mining
Data
Unstructured Information Text Mining
Data (Text) Retrieval
Aplikasi Text Mining
Pemasaran: Menemukan
kelompok pembeli yang
potensial berdasarkan profil
teks pengguna.
Contoh: Amazon
Pencarian kerja:
Mengidentifikasi parameter
dalam pencarian pekerjaan
Contoh: www.flipdog.com
Aplikasi Text Mining
Search engines
Enterprise portals
Knowledge management systems
e-Business systems
Vertical applicaton
o E-mail categorization and routing
o Call center notes categorization
o CRM Systems
Search Subsystem
Indexing Subsystem
Text Mining
Proses Text Mining
Proses Text Mining
Text preprocessing
o Syntactic/Semantic text
analysis
Features Generation
o Bag of words
Features Selection
o Simple counting
o Statistics
Text/Data Mining
o Classification-Supervised
learning
o Clustering-Unsupervised
learning
Analyzing results
Text Mining: Classification Definition
Given: Kumpulan dari labeled records (Training set)
Setiap record berisi satu set feature (attributes), dan
class yang benar (label)
Mengukur kemiripan:
Euclidean distance jika atribut bersifat continuous
Tindakan khusus untuk masalah lainnya.
mis: berapa banyak kata yang umum dalam dokumen tersebut
Classification: An Example
Text Classification: An Example
Terima Kasih