Anda di halaman 1dari 29

TUGAS DATA

ANALYSIS
Luthfir Rahman
AGENDA
DATA COLLECTION
01 DATA ANALYSIS
03

DATA CLEANING
02 CONCLUSION
04
DATA
COLLECTION
DENGAN
MENGGUNAKAN
SQL QUERY
DATA
CLEANING
SAYA MEMBERSIHKAN DATA
FRAME KOLOM
ACTOR_ID,MOVIE_ID,ROLE,ID,G
ENDER DAN NAME KARENA
TIDAK DIPERLUKAN, YANG
DIPERLUKAN ADALAH TAHUN
BERKARIR, NAMA LENGKAP
DAN RANK FILM
SAYA MEMBERSIHKAN DATA
FRAME KOLOM RANK YANG
BERISI NAN , KARENA YANG
DIPERLUKAN ADALAH RATING
FILM YANG BAIK, KITA
MEMERLUKAN RANK >= 7.0,
NANTI AKAN DIBERSIHKAN
LAGI
SAYA MEMBERSIHKAN DATA
FRAME KOLOM RANK YANG
BERISI NAN , KARENA YANG
DIPERLUKAN ADALAH RATING
FILM YANG BAIK, KITA
MEMERLUKAN RANK >= 7.0,
NANTI AKAN DIBERSIHKAN
LAGI
PERLU DIPERHATIKAN, KARENA
KITA AKAN MENCARI AKTOR
LEGENDA ABAD INI, PALING
TIDAK AKAN DIMULAI DARI
TAHUN 1900-1999, KARENA ITU
TEPAT SATU ABAD
DATA
ANALYSIS
AKAN DISORTIR AKTOR
BERDASARKAN DURASI KARIR
DALAM WAKTU YANG LAMA
KARENA ADA KENDALA DARI
DATA, YAITU KETIKA MENCARI
KRITERIA BERKARIR DALAM
WAKTU YANG LAMA TERNYATA
TIDAK DAPAT JAWABAN (
EMPTY DATAFRAME ). EMPTY
DATAFRAME SETELAH
DIPERIKSA TERNYATA
TAHUNNYA SAMA SEMUA TIAP
PEMAIN, TIDAK ADA TAHUN
YANG BERBEDA. INI MENURUT
SAYA MURNI DARI DATA YANG
DIBERIKAN.
AKAN DICARI 3 KANDIDAT
LAIN, YAITU BANYAK FILM
DENGAN RATING YANG BAIK
DIDAPAT KANDIDAT BRIAN (I)
HEATH, JASON BURKE
DAN PIERRE (III) GARNIER

AKAN DICARI NILAI PALING


TINGGI DENGAN RUMUS
RANK*FREKUENSI
PEMENANGNYA ADALAH BRIAN
(I) HEATH KARENA
JUMLAH_SEMUA_NILAI NYA
PALING TINGGI DIBANDINGKAN
NOMINASI LAIN
PEMENANGNYA ADALAH BRIAN
(I) HEATH KARENA
JUMLAH_SEMUA_NILAI NYA
PALING TINGGI DIBANDINGKAN
NOMINASI LAIN
DISINI TIDAK MENGGUNAKAN
RATA-RATA KARENA NILAI
SETIAP PESERTA SETELAH
DIPERIKSA NILAINYA SAMA
SEMUA TIDAK ADA PERBEDAAN
SAMA SEKALI, INI BISA DICARI
DENGAN MENGGUNAKAN
RANK MAKSIMUM - RANK
MINIMUM
CONCLUSION
HASIL AKHIR DATA
DIPENGARUHI OLEH DATA
KESELURUHAN, DALAM KASUS
INI AKTOR YANG
MEMERANKAN RANK BAIK,
TAHUNNYA SAMA SEMUA DAN
RANK NYA SAMA SEMUA
SELESAI

Anda mungkin juga menyukai