Anda di halaman 1dari 3

Nama : Kayla Putri Nandayani

NPM : 5221811027
Prodi : Sains Data
Mata Kuliah : Data Preparation

1. Deskripsi Data
Data ini merupakan data tentang
Data ini memiliki 15 atribut sebagai berikut:
 Position: Atribut ini berisi ranking dari film tersebut. (Integer)
 Const: Atribut ini berisi identifier\kode unik dari film tersebut. (String)
 Created: Atribut ini berisi tanggal film tersebut ditambahkan ke dalam list. (Date)
 Modified: Atribut ini berisi tanggal film tersebut terakhir diedit dalam list. (Date)
 Description: Atribut ini berisi deskripsi singkat tentang film tersebut. (String)
 Title: Atribut ini berisi judul dari film tersebut. (String)
 URL: URL link for the IMDb page of this result. Atribut ini berisi link URL untuk
IMDb dari film tersebut. (URL)
 Title Type: Atribut ini berisi tipe film tersebut. (film, TV series). (String)
 IMDb Rating: Atribut ini berisi rating pada IMDb dari film tersebut. (Float)
 Runtime (mins): Atribut ini berisi durasi dari film tersebut. (Integer)
 Year: Atribut ini berisi tahun film tersebut dirilis. (Integer)
 Genres: Atribut ini berisi genre dari film tersebut. (String)
 Num Votes: Atribut ini berisi jumlah vote yang diterima pada IMDb. (Number)
 Release Date: Atribut ini berisi tanggal film tersebut dirilis. (Date)
 Directors: Atribut ini berisi siapa sutradara dari film tersebut. (String)

Contoh 5 data teratas:

2. Sumber Data
https://www.kaggle.com/datasets/thedevastator/sequels-across-genres?
select=Movies+with+sequels.csv

3. Jumlah record
Data ini memiliki record sebanyak 1074. Missing value di data ini terdapat dalam 7
atribut, yaitu:
 Description, sebanyak 1074 baris
 IMDb Rating, sebanyak 21 baris
 Runtime (mins), sebanyak 21 baris
 Year, sebanyak 13 baris
 Num Votes, sebanyak 21 baris
 Release Date, sebanyak 14 baris
 Directors, sebanyak 9 baris

4. Cara mengetahui Missing Value


Saya mencari missing value dari data ini menggunakan Python Jupyter Notebook.
 Panggil/import dataset yang sudah didownload ke dalam Jupyter Notebook

 Untuk mengetahui atribut mana yang terdapat missing value, ketik “df.isna()”
 Untuk mengetahui jumlah missing value pada setiap atribut, ketik
“df.isna().sum()”

Anda mungkin juga menyukai