Kali ini kita akan mencoba mengambil data dari IMDb (Internet
Movie Database, https://www.imdb.com ) yang disusun berdasar
popularitas film di tahun 2019 dan kemudian menyajikan hasil
analisis dalam bentuk tabel,
seperti berikut,
seperti berikut,
kemudian,
berikutnya,
berikutnya,
terlihat,
sehingga data genre sudah kita dapatkan,
kemudian,
kemudian akan diambil data gross dari film-film popular tersebut,
> gross_data_laman <- html_nodes(lamanweb,'.ghost~ .text-muted+
span')> gross_data <- html_text(gross_data_laman)
> gross_data# menghilangkan huruf M dan $
> gross_data<-gsub("M","",gross_data)
> gross_data<-substring(gross_data,2,6)
> gross_data# cek jumlah data gross_data, karena tidak semua film
memuat gross
# data
> length(gross_data)
kemudian,
kemudian,
ternyata hanya 81 film yang memuat nilai gross pendapatannya,
a<-gross_data[1:(i-1)]
b<-gross_data[i:length(gross_data)]
gross_data<-append(a,list("NA"))
gross_data<-append(gross_data,b)
}
>
seperti berikut,
hasilnya,
,
dan visualisasi data berikutnya adalah,
> ggplot(kumpulan_data_film,aes(x=Runtime,y=Gross_Pendapatan))+
geom_point(aes(size=Rating,col=Genre))
Referensi Utama: