Anda di halaman 1dari 5

LAPORAN PROGRES TEKNOLOGI BIG DATA

ANALISIS TINGKAT KEPATUHAN MASYARAKAT INDONESIA


TERHADAP PROTOCOL KESEHATAN DI MASA PANDEMI COVID-19
MENGGUNAKAN DATA TWITTER
HALAMAN COVER

OLEH:

I KADEK ADI SUANDIKA ANTARA (1805551048)

PROGRAM STUDI TEKNOLOGI INFORMASI


FAKULTAS TEKNIK
UNIVERSITAS UDAYANA
2021

i
1. Collecting (1805551048 – I Kadek Adi Suandika Antara)
Collecting data merupakan proses mengumpulkan dan memastikan informasi
pada variable of interest (subjek yang akan dilakukan uji coba), dengan cara yang
sistematis yang memungkinkan seseorang dapat menjawab pertanyaan dari uji coba
yang dilakukan, uji hipotesis, dan mengevaluasi hasil. Collecting data adalah suatu
proses yang dilakukan untuk mendapatkan data pada aplikasi social media twitter
mengenai protocol kesehatan. Collecting data dilakukan dengan menggunakan bahasa
pemrograman Python 3.8, dan menggunakan library yang digunakan diantaranya
adalah json yang diperlukan untuk mengolah data nerupa json object, library snscrape
digunakan untuk mendapatkan id dari masing masing tweets berdasarkan waktu dan
keyword tertentu, library tweepy digunakan untuk memperoleh tweets full_text dari
tweet yang id-nya sudah diambil dengan menggunakan library snscrape, library
pymongo (MongoClient) digunakan untuk membuat koneksi dengan database
MongoDB, dan library tweepy (OAuthHandler) berguna untuk autentikasi dengan
API dari twitter. Berikut adalah source code engine collecting data yang digunakan.

import json
import snscrape.modules.twitter as sntwitter
import tweepy
from pymongo import MongoClient
from tweepy import OAuthHandler
Kode Program 1 Import Library

Kode Program 1 merupakan library yang digunakan untuk melalukan


collecting data twitter. Library yang digunakan untuk melakukan collecting data yaitu
lain json, snscrape, tweepy, pymongo (MongoClient), dan tweepy (OAuthHandler).
client = MongoClient('localhost', 27017)
db = client['db_prokesv3']
collection = db['juni-20']
Kode Program 2 Koneksi Dengan MongoDB

Kode Program 2 merupakan kode program yang digunakan untuk melakukan


koneksi dengan MongoDB Client. Langkah pertama, yaitu menginisialisai MongoDb
dengan localhost pada variable client, setelah itu menginisialisasi database yang

2
dipilih pad MongoDb pada variable db, kemudian menginisialisasikan collection
yang terdapat pada database ke dalam variable collection.

access_token = "1453253153764388864-7oBFjxE5mD5gzWrpAnBtmdn09bf1nx"
access_token_secret =
"gvBIv6zCVxcgXADcPcBsI1cYjI9ZvjaRdYjeLC2afKqaK"
consumer_key = "vmS75kmogpS8hMcXfdS9X5wYt"
consumer_secret =
"2uglqfwJjlUvhpPgve3AbfZVQGXnYwVNmKuByb7Xw32dlH9lLu"
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth)
Kode Program 3 Akses Token API Twitter

Kode program 3 merupakan kode program yang digunakan untuk melakukan


akses dengan token API twitter pada akun Developer Twitter. API twitter tersebut
digunakan untuk menghubungkan dengan twitter menggunakan library tweepy.

for i, tweet in enumerate(sntwitter.TwitterSearchScraper('protokol


kesehatan + since:2020-06-01 until:2020-06-11').get_items()):
id = tweet.id
if(id==None or id==''):
continue
getTweet = api.get_status(id, wait_on_rate_limit=True,
tweet_mode='extended')
json_str = json.dumps(getTweet._json)
print(json_str)
collection.insert_one(getTweet._json)
Kode Program 4 Collecting Data Twitter

Kode program 4 merupakan kode program yang digunakan untuk


mengambil data twitter. Langkah pertama yaitu melakukan searching tweet dengan
menggunakan library snscrape, setelah itu id tweets yang didapatkan menggunakan
library snscrape tersebut digunakan untuk mendapatkan status (full tweet) menggunakan
library tweepy.

3
Gambar 1 Proses Collecting Data

Gambar 1 merupakan tampilan ketika melakukan proses pengambilan data


twitter. Untuk jumlah data yang telah diperoleh dapat dilihat pada gambar berikut.

Gambar 2 Hasil Data Collecting

Gambar 2 merupakan hasil data yang diperolah dari collecting data pada
twitter. Data yang diperoleh diambil berdasarkan bulan, hal tersebut dilakukan untuk
menghindari terjadinya error pada saat pengambilan datam karena jumlah data yang
besar. Hasil tersebut didapatkan berdasarkan akat kunci “Protocol Kesehatan”. Untuk
sementara pada saat ini masih collecting data sampai dengan bulan juni 2020.

4
Gambar 3 Hasil Data Collecting

Gambar 3 merupakan hasil data yang diperolah dari collecting data pada
twitter. Data yang diperoleh diambil berdasarkan bulan, hal tersebut dilakukan untuk
menghindari terjadinya error pada saat pengambilan datam karena jumlah data yang
besar. Hasil tersebut didapatkan berdasarkan akat kunci “Prokes”.

Anda mungkin juga menyukai