PENDAHULUAN
1.1. LATAR BELAKANG
Pelaksanaan pembelajaran secara daring atau BDR menimbulkan banyak
reaksi masyarakat baik tanggapan yang bersifat positif, negatif atau netral.
Umumnya opini masyarakat dalam menanggapi kebijakan pembelajaran daring di
ekspresikan melalui tulisan di media sosial. Hal tersebut seiring dengan meningkat
penggunaan media sosial di Indonesia yang mencapai 191,4 juta pengguna di bulan
Februari tahun 2022 atau setara dengan 68,9% jumlah populasi penduduk Indonesia
(We Are Social, 2022). Berdasarkan jumlah data tersebut, maka banyak informasi
yang dapat digali dari media sosial. Salah satu pemanfaatan data dari media sosial
adalah analisis sentimen.
Analisis sentimen atau sering disebut ekstraksi opini digunakan untuk
menganalisis polaritas dokumen, ulasan, atau pendapat. Analisis sentimen digunakan
untuk mengklasifikasi dokumen, opini, atau ulasan berdasarkan pendapat atau emosi
yang diungkapkan sehubungan dengan topik tertentu (Raschka, 2016). Analisis
sentimen banyak diterapkan di berbagai bidang untuk mengetahui opini masyarakat
yang dituangkan dalam media sosial terkait suatu topik seperti reaksi masyarakat
menghadapi penyebaran pandemi COVID-19 (Fauziyyah, 2020), merebaknya
penggunaan Bitcoin (Parlika et al., 2020), ulasan mengenai suatu produk (Hirzani et
al., 2015), serta untuk mengetahui pendapat masyarakat dengan tujuan
meningkatkan layanan, sebagai contoh layanan e-commerce (Pulakiang et al., 2019).
Analisis sentimen dilakukan melalui dua pendekatan, yaitu machine learning
dan pendekatan lexicon. Walaupun pendekatan machine learning dalam analisis
sentimen memiliki kelebihan mengidentifikasi sentimen yang tidak secara eksplisit
tertuang di dalam kalimat opini (Firdaus et al., 2021) serta dapat menemukan makna
tiap kata pada proses klasifikasi sentimen (Khoo & Johnkhan, 2018), akan tetapi
pendekatan machine learning memiliki beberapa kekurangan, antara lain
membutuhkan proses training dengan data yang cukup besar (Firdaus et al., 2021)
dan memerlukan waktu cukup lama untuk proses komputasi (Arabnia et al., 2018).
Selain itu, analisis sentimen dengan pendekatan machine learning hanya dapat
digunakan pada topik tertentu, hal ini berkaitan dengan corpus yang dibangun pada
suatu topik yang dibangun pada saat proses training (Muhammad et al., 2013).
Pendekatan lexicon dalam analisis sentimen disebut juga pendekatan kamus
(Kolchyna et al., 2015).
Proses klasifikasi sentimen adalah memberikan nilai tiap kata pada opini
berdasarkan kamus atau corpus yang dilengkapi bobot baik positif maupun negatif
pada tiap katanya (Musfiroh et al., 2021). Selanjutnya dari perhitungan bobot pada
ulasan dapat ditentukan polarity score suatu opini (Taboada et al., 2011). Nilai
polarity score suatu opini digunakan untuk menentukan apakah sentimen opini
tersebut bersifat positif, negatif, atau netral. Akan tetapi pendekatan lexicon
memiliki beberapa kekurangan diantaranya validitas hasil klasifikasi sentimen
tergantung pada kualitas nilai polaritas dan jumlah kata di dalamnya (Catelli et al.,
2022), tidak dapat mendapatkan makna dari beberapa kata yang memiliki kedekatan
arti sehingga berpengaruh pada penilaian polaritas (Fauziah et al., 2021; Khoo &
Johnkhan, 2018). Kemudian upaya pembentukan lexicon kata serta nilai polaritasnya
secara manual masih menjadi kendala (Catelli et al., 2022; Pamungkas & Putri,
2016)
1.3. TUJUAN
a. Mengetahui apa saja bagian analisis data
b. Mengetahui bagaiamana analisis data
c. Mengetahui cara pengerjaannya
d. Mengetahui tingkatannya
BAB 2
TINJAUAN PUSTAKA
7
8
6. User friendly.
Seperti pada tujuan data warehouse pertama, data warehouse harus
dirancang agar dapat dioperasikan dengan mudah oleh pengguna. Tidak
seperti sistem operasional dimana seringkali pengguna tidak memiliki
pilihan yang lain kecuali menggunakan sistem baru, akan terjadi pengguna
data warehouse biasanya merupakan pilihan. Oleh karena itu, proses
penentuan pengguna data warehouse merupakan factor yang sangat
penting.
2.1.4.2 Arsitektur Data Warehouse
Arsitektur pada data warehouse dikelompokan menjadi 5 bagian Gambar
2.2 [10].
3. Data Warehouse
Merupakan tempat penyimpanan data yang multidimensional, dimana data
yang tersimpan berupa metadata, summary data dan row data.
4. Data Mart
Merupakan bagian dari sebuah data warehouse. Seluruh data mart jika
digabungkan akan menjadi satu data warehouse.
5. User
Merupakan pengguna yang akan menggunakan data warehouse. User bisa
memiliki tugas yang berbeda-beda, ada yang untuk dilakukan analisis, ada
yang melakukan reporting, dan ada yang untuk membentuk data mining.
Intinya informasi yang berasal dari data warehouse akan diolah menjadi
“sesuatu” menggunakan tools yang ada dan berguna untuk pengambilan
suatu keputusan.
2.1.4.3 Dimensional Data Warehouse
Kebutuhan pengguna dan realitas data yang menjadi factor penentu untuk
merancang dimensional model data warehouse, seperti bisnis apa yang paling
diperlukan, detailnya seperti apa dan dimensi-dimensi serta fakta-fakta apa yang
harus dilakukan [6].
Maka dimensional model harus sesuai dengan kebutuhan dari pengguna.
Model juga harus dirancang sedemikian rupa agar dapat bertahan dan dapat
beradaptasi dari segala perubahan yang akan terjadi. Desain model yang
dihasilkan dibentuk menjadi sebuah database relasional yang nantinya dapat
mendukung OLAP cubes untuk menyediakan secara “instan” hasil query dimana
hasil query tersebut digunakan untuk analisis.
1. Tabel Dimensi (Dimension Tables)
Tabel dimensi menjelaskan tentang entitas bisnis dari suatu enterprise [6].
Tabel dimensi umumnya berisi data keterangan, dimana data tersebut
jarang sekali mengalami perubahan.
2. Tabel Fakta (Fact Tables)
19
A) Skema Snowflake
Suatu skema disebut skema snowflake jika satu atau lebih tabel
dimensi tidak berhubungan langsung dengan tabel fakta, tetapi harus
berhubungan melalui dimensi lain [6]. Gambar 2.4 dari skema
snowflake.
20
3 Skema Constellation
Pada skema ini terdapat beberapa tabel fakta yang menggunakan satu atau
beberapa tabel dimensi. Berikut adalah contoh skema constellation dapat
dilihat pada Gambar 2.8.
24
kecuali teks unik untuk setiap bari tabel fakta, itu termasuk dalam tabel dimensi.
Tabel dimensi adalah integral dari tabel fakta, tabel dimensi berisi
deskripsi tekstual dari bisnis. Atribut tabel dimensi sangat berperan penting dalam
pembuatan laporan, tabel dimensi adalah kunci untuk membuat data warehouse,
atribut dimensi produk akan mencakup deskripsi singkat (10 sampai 15 karakter).
Berikut contoh tabel dimensi :
28
data dari sudut pandang yang berbeda, sehingga diharapkan akan dapat
memperjelas analisis yang dilakukan.
5. Filtering
Filtering merupakan suatu teknik untuk menyaring informasi yang
dibutuhkan, sehingga para analisis tidak digabungkan oleh banyaknya
informasi yang tersedia.
tinggi badan atau berat badan. Contoh dari bar chart dapat dilihat pada
Gambar 2.16 berikut:
PENUTUP
A. KESIMPULAN
2.
36
6. SQL Server Import dan Export Wizard. Tools ini digunakan untuk
melakukan copy data dari sumber ke tujuan data.
2.1.10 Diagram Konteks
Diagram konteks adalah level teratas dari diagram aliran data, yaitu
diagram yang tidak detail dari sebuah sistem informasi yang menggunakan aliran-
aliran data kedalam dan keluar entitas eksternal. Diagram konteks memberikan
batasan yang jelas mengenai besaran-besaran entitas yang berada di luar sebuah
sistem yang sedang dibuat, artinya diagram ini menggambarkan secara jelas
batasan-batasan dari sebuah sistem yang sedang dibuat.
Diagram konteks adalah sebuah diagram sederhana yang menggambarkan
hubungan antara entity luar, masukan dan keluaran sistem. Diagram konteks ini
direpresentasikan dengan lingkaran tunggal yang mewakili seluruh sistem.
2.1.11 Data Flow Diagram
Diagram Arus Data adalah suatu model logika data atau proses yang
dibuat untuk menggambarkan dari mana asal data dan kemana tujuan data yang
keluar dari sistem, dari mana data disimpan, proses apa yang menghasilkan data
tersebut dan interaksi antara data yang tersimpan dan proses yang dikenakan pada
data tersebut
1. Komponen Terminator
Terminator mewakili entitas eksternal yang berkomunikasi dengan sistem
yang sedang dikembangkan. Biasanya terminator dikenal dengan nama entitas
luar (external entity). Terdapat dua jenis terminator:
a) Terminator Sumber (source) merupakan terminator yang dijadikan sebagai
sumber.
b) Terminator Tujuan (sink) merupakan terminator yang menjadi tujuan dari
data-data yang dibutuhkan.
Terminator dapat berupa orang, sekelompok orang, organisasi, departemen
di dalam organisasi, atau perusahaan yang sama tetapi di luar kendali sistem
yang sedang dibuat modelnya. Terminator dapat juga berupa departemen,
divisi atau sistem di luar sistem yang berkomunikasi dengan sistem yang
sedang dikembangkan. Ada tiga hal penting yang harus diingat tentang
terminator :
38
DAFTAR PUSTAKA
1) Ferrucci, D. et. al. Building Watson: An Overview of the DeepQA Project.
2010. Association for the Advancement of Artificial Intelligence.
2) Fan, J, et al. Automatic knowledge extraction from documents. 2012. IBM
Journal of Research and Development 56.3.4: 5-1.
3) McCord, M. C., Murdock J. W. & Boguraev, B. K. Deep parsing in Watson,
2012. IBM J. Res. & Dev., vol. 56, no. 3/4, Paper 3, pp. 3:13:15.
4) Frawley, W. J., Piatetsky-Shapiro, G., & Matheus, C. J. Knowledge
discovery in databases: An overview. 1992. AI magazine, 13(3), 57.
5) Freitag, D. Machine learning for information extraction in informal domains.
2000. Machine learning, 39(2-3), 169-202.
6) Lin, D., & Pantel, P. DIRT - discovery of inference rules from text. 2001. In
Proceedings of the seventh ACM SIGKDD international conference on
Knowledge discovery and data mining (pp. 323-328). ACM.
7) Harris, Z. Distributional Structure. 1985. In: Katz, J. J. (ed.) The Philosophy
of Linguistics. New York: Oxford University Press. pp. 26-47.
8) Lin, D. MINIPAR: a minimalist parser. 1999. In Maryland linguistics
colloquium.
9) Yates, A., Cafarella, M., Banko, M., Etzioni, O., Broadhead, M., &
Soderland, S. Textrunner: open information extraction on the web. 2007. In
Proceedings of Human Language Technologies: The Annual Conference of
the North American Chapter of the Association for Computational
Linguistics: Demonstrations (pp. 25-26)
10) Fan, J, et al. Prismatic: Inducing knowledge from a large scale lexicalized
relation resource. 2010. Proceedings of the NAACL HLT 2010 first
international workshop on formalisms and methodology for learning by
reading. Association for Computational Linguistics