OLEH:
i
1. Collecting (1805551048 – I Kadek Adi Suandika Antara)
Collecting data merupakan proses mengumpulkan dan memastikan informasi
pada variable of interest (subjek yang akan dilakukan uji coba), dengan cara yang
sistematis yang memungkinkan seseorang dapat menjawab pertanyaan dari uji coba
yang dilakukan, uji hipotesis, dan mengevaluasi hasil. Collecting data adalah suatu
proses yang dilakukan untuk mendapatkan data pada aplikasi social media twitter
mengenai protocol kesehatan. Collecting data dilakukan dengan menggunakan bahasa
pemrograman Python 3.8, dan menggunakan library yang digunakan diantaranya
adalah json yang diperlukan untuk mengolah data nerupa json object, library snscrape
digunakan untuk mendapatkan id dari masing masing tweets berdasarkan waktu dan
keyword tertentu, library tweepy digunakan untuk memperoleh tweets full_text dari
tweet yang id-nya sudah diambil dengan menggunakan library snscrape, library
pymongo (MongoClient) digunakan untuk membuat koneksi dengan database
MongoDB, dan library tweepy (OAuthHandler) berguna untuk autentikasi dengan
API dari twitter. Berikut adalah source code engine collecting data yang digunakan.
import json
import snscrape.modules.twitter as sntwitter
import tweepy
from pymongo import MongoClient
from tweepy import OAuthHandler
Kode Program 1 Import Library
2
dipilih pad MongoDb pada variable db, kemudian menginisialisasikan collection
yang terdapat pada database ke dalam variable collection.
access_token = "1453253153764388864-7oBFjxE5mD5gzWrpAnBtmdn09bf1nx"
access_token_secret =
"gvBIv6zCVxcgXADcPcBsI1cYjI9ZvjaRdYjeLC2afKqaK"
consumer_key = "vmS75kmogpS8hMcXfdS9X5wYt"
consumer_secret =
"2uglqfwJjlUvhpPgve3AbfZVQGXnYwVNmKuByb7Xw32dlH9lLu"
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth)
Kode Program 3 Akses Token API Twitter
3
Gambar 1 Proses Collecting Data
Gambar 2 merupakan hasil data yang diperolah dari collecting data pada
twitter. Data yang diperoleh diambil berdasarkan bulan, hal tersebut dilakukan untuk
menghindari terjadinya error pada saat pengambilan datam karena jumlah data yang
besar. Hasil tersebut didapatkan berdasarkan akat kunci “Protocol Kesehatan”. Untuk
sementara pada saat ini masih collecting data sampai dengan bulan juni 2020.
4
Gambar 3 Hasil Data Collecting
Gambar 3 merupakan hasil data yang diperolah dari collecting data pada
twitter. Data yang diperoleh diambil berdasarkan bulan, hal tersebut dilakukan untuk
menghindari terjadinya error pada saat pengambilan datam karena jumlah data yang
besar. Hasil tersebut didapatkan berdasarkan akat kunci “Prokes”.