Anda di halaman 1dari 14

FAKULTAS TEKNOLOGI INFORMASI

Analisis Media Sosial dan Digital


[ SI010/ 3 SKS ]
Oleh: Dr. Indra. S.Kom, M.T.I
FAKULTAS
TEKNOLOGI INFORMASI

Pertemuan 8
TREND RISET MENGGUNAKAN DATA
MEDIA SOSIAL
FAKULTAS
TEKNOLOGI INFORMASI

Tujuan Pembelajaran
 Mahasiswa Memahami trend penelitian pada media sosial
 Mengkaitkan trend riset dengan materi the social mining
web
 Project UAS setiap kelompok dari pembahasan Chapter
Mining the social Web
 Penelitian sebelumnya yang berhubungan dengan topik
setiap kelompok
FAKULTAS
TEKNOLOGI INFORMASI

Sumber Paper yang berkualitas baik


 www.IEEEXplore.com
 www.Sciencedirect.com
 Pencarian paper gunakan kata kunci:
 Research trends mining the social web
 Mining the “github”, “mining the Instagram”, etc
 Pelajari detil tahapan pada paper dan terapkan
pada kasus permasalahan di sekitar kita
FAKULTAS
TEKNOLOGI INFORMASI

Langkah memperkuat topik Project UAS


 Mencari paper pada ieeexplore, sciencedirect,
Springer, Google Scholar
 Mencari penelitian sebelumnya dengan kata kunci
pada slide ke-4:
 Research trends mining the social web
 Mining the “github”, “mining the Instagram”, etc
 Membaca cepat Paper, cukup pelajari:
 Abstrak
 Pendahuluan
 Kesimpulan
FAKULTAS
TEKNOLOGI INFORMASI

Langkah memperkuat topik Project UAS (Cont)


 Mohon dicari paper yang saling mensitasi
 Paper yang saling mensitasi digunakan untuk
melihat perkembangan penelitian dari tahun ke
tahun

Paper A

Paper B

Paper C
FAKULTAS
TEKNOLOGI INFORMASI

Langkah memperkuat topik Project UAS (Cont)


 Rangkumlah paper dalam Tabel Taksonomi

Author Dataset Prapemrosesan Metode Pengujian Hasil


Indra et al Tweet Politik Tokenisasi, BN-Grams Topic Recall, Akurasi BN-
(2018) Indonesian Agregasi, dan Doc-p Keyword Grams 60%
Language Stemming Precision,
keyword recall
Aiello et al Tweet Politik Tokenisasi, BN-Grams Topic Recall, Akurasi BN-
(2013) US Election Agregasi, dan Doc-p Keyword Grams 48%
Stemming Precision,
keyword recall
FAKULTAS
TEKNOLOGI INFORMASI

Sumber Paper Aiello & Indra


 http://www.lajello.com/papers/tmm13.pdf
 https://www.sciencedirect.com/science/article/pii
/S131915781730280X/pdfft?md5=a22eb98c020fa
8c2ce41b24b9cdac167&pid=1-s2.0-S13191578173
0280X-main.pdf
FAKULTAS
TEKNOLOGI INFORMASI

Agenda hari ini


 Setiap kelompok @30 menit mencari paper yang
relevan dengan topik penelitian
 Presentasikan mulai pukul 09.00
FAKULTAS
TEKNOLOGI INFORMASI

Trend riset Pada Media Sosial dan sumber lain


 Dr. Suwanto :
 Sumber: http://etd.repository.ugm.ac.id/penelitian/detail/170378
 Abstrak: Kebutuhan adanya basis data teks atau sering disebut korpus saat ini semakin meningkat
untuk berbagai keperluan. Mulai dari mesin penerjemah sampai dengan pengunaan dalam bidang
Internet of Thing. Banyak negara sudah memiliki berbagai jenis korpus, seperti korpus khusus, umum
atau nasional. Indonesia dalam beberapa pustaka sudah disebut akan merencanakan pembentukan
korpus nasional namun sampai penelitian ini dilakukan belum didapatkan informasi yang memadai.
Terjemahan Quran berbahasa Indonesia merupakan salah satu teks yang banyak dibaca oleh masyarakat
dan bisa dijadikan korpus. Korpus terjemahan Quran tersebut dapat menjadi salah satu sub korpus
nasional bahasa Indonesia. Pembangunan korpus terdiri dari berberapa tahapan dan berisi berbagai
metode yang digunakan dalam prosesnya. Pengembangan model pembangunan korpus yang dilakukan
dalam penelitian ini adalah pada tahapan pemrosesan korpus. Penelitian ini melakukan pengembangan
metode anotasi Part of Speech (POS) yang berbasis aturan dengan menggunakan informasi linguistik
bahasa Arab dari korpus Quran yang sudah ada.
 Hasil penelitian menunjukkan metode anotasi POS mampu meprediksi lokasi POS tertentu dengan
akurasi 97.54%. Pemberian tambahan informasi semantik semantik bersifat independen sesuai dengan
karakteristik teks Quran dimana mampu untuk memiliki banyak makna juga dilakukan dalam penelitian
ini. Berdasarkan penelitian menunjukkan bahwa metode anotasi pada korpus terjemahan Quran dapat
dikembangkan berdasarkan informasi linguistik bahasa Arab dari korpus Quran. Kelebihan Sistem
Manajemen Basis Data Relasional dari penelitian ini dapat digunakan untuk menyimpan anotasi semantik
FAKULTAS
TEKNOLOGI INFORMASI

Trend riset Pada Media Sosial dan sumber lain


 Dr. Anak Agung Istri Ngurah Eka Karyawati, S.Si., M.Eng.
 Sumber: http://etd.repository.ugm.ac.id/home/detail_pencarian/105976
 Abstrak:
FAKULTAS
TEKNOLOGI INFORMASI

Abstrak Dr Eka Karyawati


 Why-question adalah pertanyaan non-factoid yang memerlukan jawaban berupa penjelasan. Jawaban-
jawaban itu biasanya tersebar dalam beberapa dokumen. Sehingga, metode yang sesuai untuk menjawab
why-question adalah metode QA yang berbasis IR. Tetapi, ada dua masalah utama dalam metode QA yang
berbasis IR, yaitu masalah word mismatch dan masalah jawaban yang berulang/berlebihan (redundant) and
terfragmentasi (fragmented). Untuk menyelesaikan masalah word mismatch, diusulkan metode QA yang
berbasis semantik yang dikombinasikan dengan metode deteksi kausalitas. Selanjutnya, untuk menyelesaikan
masalah jawaban yang berulang/berlebihan and terfragmentasi, diusulkan metode KI yang berbasis text yang
dikombinasikan dengan metode IR yang berbasis ontologi dalam rangka mengintegrasikan jawa-ban-jawaban
yang diperoleh. Terdapat tiga fase utama dalam metode yang diusulkan. Pertama, why-question dianalisa
untuk mengubahnya ke dalam bentuk representasi triples yang sesuai dengan skema ontologi, dan
mengekspansi pertanyaan menggunakan SPARQL query processing.
 Fase ini menghasilkan anotasi semantik dari pertanyaan (i.e., OSA, ASA, dan CA). Kedua, dengan menggunakan
anotasi semantik dari pertanyaan, dicari dokumen-dokumen yang mengandung jawaban. Ketiga, dokumen-
dokumen tersebut disegmentasi menjadi kalimat-kalimat. Ka-limat-kalimat tersebut diskoring dan dipilih
untuk memperoleh kalimat-kalimat jawaban. Dan selanjutnya, kalimat-kalimat jawaban tersebut
diintegrasikan men-jadi satu jawaban yang terintegrasi menggunakan metode integrasi pengetahuan berbasis
teks. Evaluasi dilakukan pada setiap fase dari metode yang diusulkan. Pada fase question analysis, metode
representasi semantik dari pertanyaan menghasilkan nilai evaluasi yang bagus yaitu 0.98 (Precision), 0.98
(Recall), 0.15 (Undergeneration), dan 0.1 (Overgeneration). Pada fase document retrieval, terlihat adanya
perbaikan yang signifikan hasil dari metode yang diusulkan terhadap metode berbasis text, pada nilai-nilai
MRR (81 kali), P@1 (9,4 kali), P@5 (7 kali), dan P@10 (6,4 kali), dan terhadap metode berbasis ontology, pada
nialai-nilai MRR (80%), P@1 (153%), P@5 (45%), dan P@10 (33%). Pada fase sentence extraction, terlihat adanya
FAKULTAS
TEKNOLOGI INFORMASI

Trend riset
 Dr. Arief Wibowo:
 “Metode Ekstraksi Twitter dan Klasifikasi Berbasis Aturan untuk
Memprediksi Kepadatan Lalu Lintas Jalan”.
 Korpus: tweet kemacetan
 Yessi Yunitasari:
 DETEKSI SARKASME UNTUK ANALISIS SENTIMEN PADA TWEET
BERBAHASA INDONESIA
FAKULTAS
TEKNOLOGI INFORMASI

KESIMPULAN
SELESAI

Anda mungkin juga menyukai