Tugas Mencari Data-1
Tugas Mencari Data-1
NPM : 5221811027
Prodi : Sains Data
Mata Kuliah : Data Preparation
1. Deskripsi Data
Data ini merupakan data tentang
Data ini memiliki 15 atribut sebagai berikut:
Position: Atribut ini berisi ranking dari film tersebut. (Integer)
Const: Atribut ini berisi identifier\kode unik dari film tersebut. (String)
Created: Atribut ini berisi tanggal film tersebut ditambahkan ke dalam list. (Date)
Modified: Atribut ini berisi tanggal film tersebut terakhir diedit dalam list. (Date)
Description: Atribut ini berisi deskripsi singkat tentang film tersebut. (String)
Title: Atribut ini berisi judul dari film tersebut. (String)
URL: URL link for the IMDb page of this result. Atribut ini berisi link URL untuk
IMDb dari film tersebut. (URL)
Title Type: Atribut ini berisi tipe film tersebut. (film, TV series). (String)
IMDb Rating: Atribut ini berisi rating pada IMDb dari film tersebut. (Float)
Runtime (mins): Atribut ini berisi durasi dari film tersebut. (Integer)
Year: Atribut ini berisi tahun film tersebut dirilis. (Integer)
Genres: Atribut ini berisi genre dari film tersebut. (String)
Num Votes: Atribut ini berisi jumlah vote yang diterima pada IMDb. (Number)
Release Date: Atribut ini berisi tanggal film tersebut dirilis. (Date)
Directors: Atribut ini berisi siapa sutradara dari film tersebut. (String)
2. Sumber Data
https://www.kaggle.com/datasets/thedevastator/sequels-across-genres?
select=Movies+with+sequels.csv
3. Jumlah record
Data ini memiliki record sebanyak 1074. Missing value di data ini terdapat dalam 7
atribut, yaitu:
Description, sebanyak 1074 baris
IMDb Rating, sebanyak 21 baris
Runtime (mins), sebanyak 21 baris
Year, sebanyak 13 baris
Num Votes, sebanyak 21 baris
Release Date, sebanyak 14 baris
Directors, sebanyak 9 baris
Untuk mengetahui atribut mana yang terdapat missing value, ketik “df.isna()”
Untuk mengetahui jumlah missing value pada setiap atribut, ketik
“df.isna().sum()”