Anda di halaman 1dari 13

GENRE FILM YANG DISUKAI KALANGAN USIA

Oleh:

Kelompok A

 Yusuf Nafiq Buwono (220402038) / yusufbuwono27@gmail.com


 Harland Johan Alvito Sitorus (220402049) / harlandsitorus39@gmail.com
 Lucky Sam Pratama (220402053) / luckysampratama@gmail.com
 Stephany (220402055) / stephany021203@gmail.com
 Josafat Romario (220402064) / josafatromario@gmail.com
 Claudya Permata Riany (220402068) / claudyariany1@gmail.com

UNIVERSITAS SUMATERA UTARA


MEDAN
2022
Kata Pengantar

Puji syukur ke hadirat Tuhan Yang Maha Esa Atas Rahmatnya, penulis
dapat menyelesaikan laporan proposal yang berjudul “Genre Film Yang
Disukai Kalangan Usia” dengan tepat waktu.

Penulis menyadari bahwa proposal penelitian ini masih jauh dari sempurna.
Oleh karenanya, diharapkan saran dan kritik yang membangun agar penulis
menjadi lebih baik lagi di masa mendatang. Semoga laporan proposal ini
dapat menambah wawasan bagi pembaca .

Medan, 2 Desember 2022

Penulis

i
DAFTAR ISI

KATA PENGANTAR i
DAFTAR ISI ii

BAB I
PENDAHULUAN 1
1.1 Latar Belakang 1
1.2 Rumusan Masalah 1
1.3 Tujuan Penelitian 1
1.4 Manfaat Penelitian 1

BAB II
DASAR TEORI 3
2.1 Python 3
2.2 Jupyter Notebook 3
2.3 Exploratory Data Analysis 4
2.4 Pandas 5
2.5 Numpy 6
2.6 Matplotlib 6
2.7 Seaborn 6

BAB III
METODOLOGI PENELITIAN 7
3.1 Deskripsi Datasets 7
3.2 Permasalahan yang akan dianalisa 8

ii
3.3 Rencana Implementasi 8
3.4 Referensi 8

BAB V
KESIMPULAN 9

iii
BAB I
PENDAHULUAN

1.1 Latar Belakang


Film menjadi salah satu industri yang sangat berpengaruh bagi
masyarakat dari segi ekonomi,pendidikan saat ini. Melalui film kita
mungkin dapat mengetahui tingkat ekonomi masyarakat, tingkat
pendidikan masyarakat dan indikator lainnya dalam melakukan
penilaian.
Oleh karena itu, analisis data penikmat film menjadi sangat
diperlukan bukan hanya dipakai oleh para pelaku ekonomi melainkan
pemerintah juga dapat memakainya untuk menerapkan kebijakan
dalam hal pendidikan terutama pembaharuan kurikulum.

1.2 Rumusan Masalah


Bagimana seorang filmmaker dapat membuat filmya diminati
oleh berbagai golongan dalam kalangan usia baik setempat maupun
dunia

1.3 Tujuan Penelitian


Tujuan penelitian ini adalah untuk melihat dan mengetahui data
genre film yang diminati oleh kalangan usia

1.4 Manfaat Penelitian


Penelitian ini diharapkan dapat memberikan manfaat kepada

1
produser sekaligus para masyarakat secara luas.

Adapun manfaat sebagai berikut:


1. Secara realita, melalui data itu, dapat menjadi acuan bagi berbagai
pihak sebut saja pelaku ekonomi, produser maupun pemerintah
untuk mengembangkan film seperti apa nantinya yang akan
diminati/ laris oleh berbagai golongan usia dalam masyarakat ini
dan bagi pemerintah dapat menjadi indicator bagi perkembangan
pendidikan masyarakat.
2. Secara praktisi, penelitian ini diharapkan dapat menjadikan
kontribusi wacana dan masukan untuk para filmmaker dalam
memproduksi film film terutama sebagai produser

2
BAB II

DASAR TEORI

2.1 Python
Python adalah bahasa pemrograman interpretatif multiguna.
Tidak seperti bahasa lain yang susah untuk dibaca dan dipahami,
Python lebih menekankan pada keterbacaan kode agar lebih mudah
untuk memahami sintaks. Hal ini membuat Python sangat mudah
dipelajari baik untuk pemula maupun untuk yang sudah menguasai
bahasa pemrograman lain.
Bahasa pemrograman Python muncul pertama kali pada tahun
1991, yang dirancang oleh seseorang bernama Guido van Rossum.
Sampai saat ini Python masih dikembangkan oleh Python Software
Foundation. Bahasa Python mendukung hampir semua sistem operasi,
bahkan untuk sistem operasi Linux, dan hampir semua distronya sudah
menyertakan Python di dalamnya.

2.2 Jupyter Notebook


Jupyter Notebook merupakan tools yang populer untuk
pengolahan data dengan bahasa pemrograman Python. Jupyter
Notebook memungkinkan untuk mengintegrasikan antara kode dengan
output di dalam satu dokumen secara interaktif. Jupyter
(https://jupyter.org/) sendiri adalah organisasi non-profit untuk
mengembangkan software interaktif dalam berbagai bahasa
pemrograman. Sedangkan Notebook

3
adalah satu software buatan Jupyter, berupa aplikasi web open-source
yang memungkinkan untuk membuat dan berbagi dokumen interaktif
yang berisi live code, persamaan, visualisasi, dan teks naratif yang
kaya.

2.3 Exploratory Data Analysis


Exploratory Data Analysis mengacu pada proses kritis dalam
melakukan investigasi awal pada data untuk menemukan pola,
anomali, menguji hipotesis, dan memeriksa asumsi dengan bantuan
statistik ringkasan dan representasi grafis. Dengan melakukan EDA,
maka kondisi dataset yang dimiliki dapat lebih dipahami. Memahami
kondisi dataset dapat merujuk pada sejumlah hal termasuk namun
tidak terbatas pada poin-poin berikut:
 Mengekstrak variabel penting dan meninggalkan variabel
yang tidak berguna (data preprocessing).
 Mengidentifikasi nilai yang hilang (missing values) dan
kesalahan manusia (human error).
 Memahami hubungan, atau kekurangan, antar variabel.
 Memaksimalkan wawasan yang dimiliki atas kondisi data
dan meminimalkan potensi kesalahan di kemudian hari.
EDA menjadi penting karena tanpa melakukan Exploratory
Data Analysis, maka banyak informasi penting yang terdapat di dalam
dataset bisa hilang begitu saja. Selain itu, meskipun memakan waktu
yang relatif cukup lama, sebenarnya EDA akan menghemat waktu

4
pengerjaan proyek data science. Karena apabila dilakukan data
modelling tanpa menerapkan EDA, besar kemungkinan model yang
akan dikerjakan memiliki performa yang kurang baik karena model
yang dibuat tanpa benar-benar memahami kondisi data yang dimiliki.
Lalu besar kemungkinan akan menghabiskan banyak waktu untuk
mencari kesalahan apa yang harus diperbaiki, dan mengulang proses
data modelling kembali. Tentu proses ini sangat memakan waktu.
Dengan melakukan EDA, maka tidak perlu melakukan pengulangan
seperti ini atau setidaknya mengurangi kemungkinannya.

2.4 Pandas
Pandas merupakan sebuah library pada Python yang berlisensi
BSD dan open source yang menyediakan struktur data dan analisis
data yang mudah untuk digunakan. Pandas melakukan tugas penting
seperti menyelaraskan data untuk perbandingan dan penggabungan
dataset, penanganan data yang hilang, dan lain sebagainya.
Struktur data Pandas dinamakan dataframe, yaitu sebuah
koleksi kolom yang berurutan dengan nama dan jenis. Dengan adanya
fitur dataframe memudahkan untuk membaca sebuah file dan
menjadikannya sebuah table. Dataframe juga dapat mengolah suatu
data dengan menggunakan operasi seperti join, distinct, group by,
agregasi, dan fitur lainnya yang terdapat pada SQL. Format file yang
didukung Pandas meliputi file dengan ekstensi .txt, .csv, .tsv dan
lainnya (Mutmainnah, 2019).

5
2.5 Numpy
Numpy merupakan salah satu library dalam Python. Library ini
dapat digunakan untuk banyak case dalam data science. Dengan
adanya library ini, maka tidak diperlukan lagi baris kode yang panjang
untuk menjalankan program machine learning. Numpy sendiri
merupakan singkatan dari Numerical Python. Pada umumnya
penggunaan library ini untuk menghitung operasi matematika pada
array.

2.6 Matplotlib
Matplotlib adalah library Python 2 Dimensi yang dapat
menghasilkan plot dengan kualitas tinggi dalam berbagai format dan
dapat digunakan di banyak platform. Matplotlib dapat digunakan
sebagai pembuat grafik dalam berbagai platform, seperti Python dan
Jupyter Notebook. Grafik yang dapat dibuat oleh matplotlib cukup
beragam, seperti grafik garis, batang, lingkaran, histogram dan
berbagai macam lainnya.

2.7 Seaborn
Seaborn adalah library yang bertujuan untuk membuat grafik
dan statistik dengan menggunakan Python. Seaborn dibangun
berdasarkan library matplotlib serta terintegrasi dengan struktur data
pada Pandas.

6
BAB III
METODOLOGI PENELITIAN

3.1 Deskripsi Datasets

1. Import numpy as np

2. Import pandas as pd

3. Import seaborn as sns

4. Import matplotlib.pylot as plt

5. Import data

6. Read data

7. Cetak total baris dalam tabel data

8. Membersihkan data untuk persiapan analisis selanjutnya dengan

 memeriksa jumlah dan persentase data yang hilang untuk


setiap kolom dalam datasets
 memeriksa tipe data dan evaluasi apakah cocok untuk data
di kolom yang terkait
 memastikan dataset tidak mengalami
duplikat/berulang/double, untuk memastikan keakuratan
analisis selanjutnya

9. Menganalisa data dari segi rating, voting,budget

10. Menunjukkan data grafik dari analisa data sebelumnya

7
3.2 Permasalahan yang akan dianalisa

Variabel apa saja yang mempengaruhi dalam penganalisaan data


“Genre Film Yang Disukai Kalangan Usia”

3.3 Rencana Implementasi

16 Nov- 23 Nov 2022 : Menentukan tema project

24 Nov – 2 Dec 2022 : Membuat Perencanaan dalam pembuatan


projek dengan proposal

3 Dec – 6 Dec 2022 : Membuat Visualisasi Data dengan


referensi dari Kaggle

7 Dec – 13 Dec 2022 : Membuat presentasi hasil project


14 Dec – 31 Dec 2022 : Membuat laporan akhir project
2 Jan – 13 Jan 2023 : Submit laporan akhir project

3.4 Referensi

 https://www.kaggle.com/code/lykin22/movies-genre-classification-
nlp/data
 http://eprints.dinus.ac.id/18809/10/bab3_17830.pdf
 3_145410006_BAB_II - Hadi Wijoyo[1].pdf

8
BAB V

PENUTUP

Demikian proposal project ini kami buat, semoga dengan adanya proposal ini
membuat kerja sama dalam membangun project ini terwujud dengan baik. Mampu
melaksanakan serta merealisasikan project (Judul project kelompok kita) dengan
semaksimal mungkin, serta tanpa adanya kendala. Project ini akan berhasil dengan
dukungan seluruh pihak yang bersangkutan. Atas segala perhatiannya kami
ucapkan terimakasih

Anda mungkin juga menyukai