Pengantar
Kompetisi ini akan dilaksanakan di Kaggle. Kaggle adalah sebuah platform untuk predictive
modelling dan analytics competition. Ahli statistik dan penambang data kerap bertanding di
Kaggle untuk menghasilkan model terbaik untuk memprediksi dan mendeskripsikan dataset
yang diunggah oleh berbagai perusahaan.
Peserta diharuskan untuk membaca dan memahami problem statement yang diberikan dan
mengunggah hasil akhir dalam bentuk .csv di Kaggle dalam kurun waktu yang telah ditentukan.
Peserta tidak diharuskan untuk membuat visualisasi dalam bentuk apapun untuk setiap problem
statement.
Tentang Kompetisi
Dimulainya Kompetisi
Kompetisi akan dimulai sesaat setelah tautan laman Kaggle Competition disebar di Zoom Chat
Box dan channel Telegram. Partisipan akan memiliki total waktu sebanyak 3 jam untuk
menyelesaikan dua tantangan dalam kompetisi ini. Partisipan memiliki kebebasan untuk
mengalokasikan waktu yang dimiliki dalam menyelesaikan tantangan dalam kompetisi ini.
Ketentuan Submission
Hasil akhir yang diunggah di Kaggle harus dalam bentuk format .csv. Tim yang berada di tingkat
100 teratas di Private Leaderboard diharuskan untuk mengirimkan skrip akhir ke
ndsc.id@shopee.com segera setelah berakhirnya kompetisi. Untuk detil lebih lanjut
mengenai peraturan submission dapat ditemukan di Lampiran D.
Pemilihan Pemenang
Tiga pemenang akan ditentukan dari total skor yang dicapai di kedua tantangan dalam
kompetisi. Tim harus memastikan bahwa submission yang dilakukan sudah berhasil di kedua
tantangan tersebut. Kegagalan untuk melakukan submission pada waktu yang telah
ditentukan akan menyebabkan Anda menerima skor 0 pada tantangan tersebut. Detil lebih
lanjut mengenai pemilihan pemenang dapat ditemukan di Lampiran F.
1
Peraturan dan Regulasi
Shopee berhak untuk mendiskualifikasikan peserta dan/atau tim atas kebijakannya sendiri jika
melanggar Syarat dan Ketentuan Kompetisi ini.
Harap dicatat bahwa peraturan-peraturan di atas belum mencakup semua aturan. Untuk
informasi lebih lengkap, silakan lihat peraturan yang tercantum di Syarat dan Ketentuan.
2
(PENTING) Memulai Kompetisi
Sebelum memulai kompetisi, silakan daftarkan diri Anda pada Telegram dan Kaggle.
Membuat Akun Kaggle #3: Jelajahi laman berikut untuk membiasakan diri Anda dengan
Kaggle
https://www.kaggle.com/c/titanic
Harap pastikan bahwa Anda dan tim sudah bergabung dalam channel Telegram dan
membuat akun Kaggle sebelum hari-H kompetisi, karena waktu yang disediakan akan
sangat terbatas.
Tidak akan ada tambahan waktu yang diberikan kepada tim yang belum bergabung dalam
channel Telegram NDSC dan belum membuat akun Kaggle di hari-H. Tim yang belum
melakukan kedua hal ini akan menanggung risiko performa masing-masing.
Tautan laman Kaggle Competition akan disebarluaskan di Zoom Chat Box channel Telegram di
hari-H kompetisi, sesuai dengan kategori masing-masing.
3
Informasi Lebih Lanjut
Silakan klik pada lampiran di bawah ini untuk informasi lebih lanjut.
● Lampiran A - Bergabung di Channel Telegram
● Lampiran B - Membuat Akun Kaggle
● Lampiran C - Membentuk Tim
● Lampiran D - Panduan Kaggle & Persyaratan Submission
● Lampiran E - Masalah Umum ketika Submission
● Lampiran F - Menentukan Pemenang
● Lampiran G - Kaggle Frequently Asked Questions (FAQs)
4
LAMPIRAN A
5
LAMPIRAN B
3. Daftarkan diri anda dengan salah satu metode pilihan Anda dan mohon dilengkapi
dengan data yang sesuai
6
4. Jangan lupa untuk verifikasi akun Kaggle Anda jika Anda registrasi lewat alamat email.
Jika Anda mengalami kendala dalam registrasi akun Kaggle Anda, harap kunjungi
halaman ini https://www.kaggle.com/contact.
7
LAMPIRAN C
Pembentukan Team
1. Di halaman utama kompetisi, Anda diharuskan untuk membentuk tim di dalam “Team”
tab (Tab yang tersedia adalah: Overview, Data, Kernels, Discussion, Leaderboard,
Rules, Team).
2. Team Leader / Ketua Tim harus mendaftarkan nama tim di kolom “Team Name”. Harap
dipastikan bahwa nama tim di Kaggle sama dengan nama tim yang Anda daftarkan
melalui situs NDSC. Jika Anda memasukan nama tim yang berbeda, kami dapat
mendiskualifikasi tim Anda dari pertandingan ini.
Untuk Anggota Tim, silakan tuliskan nama lengkap Anda pada kolom tersebut
3. Di dalam kolom "Merge with other teams" , ketua tim harus memasukkan nama anggota
tim Anda. Pilih nama dari daftar drop-down dan klik ‘Request Merge’ . (Catatan:
Pemimpin tim hanya dapat mengirim Request Merge ke satu anggota pada satu
waktu. Setiap anggota harus menerima permintaan / request penggabungan
sebelum pemimpin dapat menambahkan anggota lain ke tim)
4. Mohon dipastikan agar semua anggota tim sudah membuat akun Kaggle dan sudah
bergabung pada kompetisi ini melalui Kaggle serta telah melakukan hal di poin 2
sebelum membuat tim. Jika tidak, maka nama anggota tim tidak akan muncul pada
daftar drop-down.
8
5. Anggota tim harus menerima undangan dari ketua tim untuk membuat tim dengan
meng-klik ‘Join this Team’.
9
LAMPIRAN D
3. Unggah Prediksi
Mohon untuk mengunggah file dalam format .csv di Kaggle.
Langkah 1: Klik pada tab ‘Submit Predictions’.
10
nda
Langkah 2: Unggah file .csv dan klik ‘Make Submission’. Pastikan bahwa submission A
memenuhi syarat sebelum Anda mengunggah file Anda.
PENTING!
Mohon untuk mengunggah prediksi sesegera mungkin, atau setidaknya 15 menit
sebelum berakhirnya kompetisi. Late submission dengan alasan apapun tidak akan
diterima.
Catatan:
Tim yang berada di peringkat 100 teratas berdasarkan Private Leaderboard harus
mengirimkan script yang sudah lengkap setelah putaran kompetisi berakhir. Jika terdapat
libraries/modules/packages yang dibutuhkan untuk menjalankan script m
aka harus dijelaskan
dalam skrip. Silakan kirim script ke ndsc.id@shopee.com dengan subjek: Category - Team
ama dari script harus sama
Name (Rank) - Challenge No - Programming Language Used. N
dengan subjek email.
11
Berikut contoh pengiriman email:
Hanya satu orang perwakilan dari tim yang perlu mengirimkan email.
Script yang dikirimkan harus lengkap. Dengan kata lain, script harus dapat dijalankan dari
awal hingga akhir tanpa error dan mengeluarkan file prediksi .csv yang diperlukan untuk
kompetisi. Jika kelompok tidak mengirimkan script lengkap dalam 15 menit setelah
kompetisi ditutup, maka tim tersebut akan didiskualifikasikan.
12
LAMPIRAN E
Berikut adalah masalah yang umumnya ditemui ketika akan melakukan submission.
1. Header yang Salah
Dalam contoh berikut, column header y ang dibutuhkan adalah ‘new_number’. Akan
tetapi, submission i ni memiliki label yang salah yaitu ‘newnumber’. Kaggle akan
menunjukkan kesalahan ini ketika Anda mencoba untuk mengunggah solusi dengan
header y ang salah.
13
3. Kolom Tambahan
Dalam contoh ini, jumlah kolom yang dibutuhkan adalah ‘id’ dan ‘new_number’. Akan
tetapi, dalam submission i ni terdapat kolom tambahan dengan label ‘another_column’.
Kaggle akan menunjukkan kesalahan ini ketika Anda mengunggah solusi dengan kolom
tambahan.
14
5. Index Value yang Terduplikasi
Dalam contoh ini, semua value pada kolom pertama harus bersifat unik. Akan tetapi,
dalam submission ini t erdapat value yang terduplikasi dalam kolom pertama. Kaggle
akan menunjukkan kesalahan ini ketika Anda mencoba mengunggah solusi dengan
value yang terduplikasi pada kolom pertama.
an ketentuan submission secara
Peserta diingatkan untuk membaca problem overview d
seksama sebelum mencoba menjawab pertanyaan. Tidak ada waktu tambahan yang
diberikan kepada peserta yang mengalami masalah ketika hendak mengunggah solusi
mereka.
15
LAMPIRAN F
Menentukan Pemenang
1. Skor akhir dari tiap tantangan akan dihitung dengan menjumlahkan 30% dari skor di
Public Leaderboard dan 70% dari skor di Private Leaderboard.
Total Skor tiap Tantangan = (30% X Public Score) + (70% X Private Score)
Peringkat akhir akan ditentukan dari Total Skor yang diperoleh dari kedua tantangan
kompetisi:
Total Skor = (Skor Tantangan 1 + Skor Tantangan 2)
Contoh 1
Sebagai contoh, skor pada contoh di bawah ini akan dianggap sebagai skor total.
Pada tantangan 1, Team [ods.ai] memperoleh peringkat 5 dan MPWARE memperoleh
peringkat 4.
16
Pada tantangan 2, Team [ods.ai] memperoleh peringkat 4 dan MPWARE memperoleh
peringkat 5.
2. Dalam kasus dimana total skor yang diperoleh adalah seri, maka peringkat akhir akan
ditentukan melalui skor rata-rata dari kedua putaran.
Peringkat Akhir = (Ranking Tantangan 1 + Ranking Tantangan 2)/2
Contoh 2
Pada tantangan 1, Team MPWARE memperoleh skor sebesar 0.91388, sedangkan Team [ods.ai]
memperoleh skor 0.91324.
17
Pada tantangan 2, Team MPWARE memperoleh skor sebesar 0.91321, sedangkan Team
[ods.ai] memperoleh skor sebesar 0.91385.
3. Pada kasus dimana terdapat 2 tim yang memiliki skor seri, maka kriteria yang digunakan
untuk menentukan pemenang akan didasarkan pada presentabilitas dan efisiensi dari skrip.
Penentuan peringkat berada pada kebijaksanaan dari Tim National Data Science Challenge.
a) Presentabilitas - Kemudahan untuk memahami skrip, dengan membaca komen yang
tertulis dalam skrip.
b) Efficiency - Waktu yang dibutuhkan untuk skrip dijalankan dari awal hingga akhir.
18
Kasus Khusus
1. Pada kejadian di mana tim memiliki skor yang sama pada leaderboard, maka tim yang
terlebih dahulu mengunggah hasilnya akan memperoleh peringkat yang lebih tinggi.
a. Meskipun Ping, bestcodertester dan bestcodertester2 memiliki skor yang sama,
tetapi Ping yang terlebih dahulu mengunggah skrip 4 hari yang lalu akan
memperoleh peringkat pertama, begitu seterusnya.
2. Tim yang mengunggah setelah deadline, tidak akan memperoleh skor pada
leaderboard.
a. Tim akan diingatkan untuk memastikan bahwa mereka telah melakukan
submission di Kaggle minimal 15 menit SEBELUM putaran kompetisi
berakhir. Ketika kompetisi berakhir, maka tab ‘Submit Prediction’ akan berubah
menjadi ‘Late Submission’ dan skor yang diperoleh tidak akan muncul pada
kedua leaderboard.
19
LAMPIRAN G
KAGGLE FREQUENTLY ASKED QUESTIONS (FAQs)
Bagian ini berisi Pertanyaan yang sering ditanyakan seputar penggunaan Kaggle yang dibagi menjadi
beberapa bagian berikut:
1. Bergabung dalam Kompetisi
2. Registrasi
3. Membentuk Tim
4. Submission
5. Scoring
6. Kaggle Kernels
Pertanyaan Jawaban
Bagaimana kami dapat bergabung dalam Pada hari H kompetisi, kami akan menyelenggarakan acara
kompetisi dalam Kaggle? Apakah kami pembukaan pada pukul 10.00 WIB sebelum kami
terdaftar secara otomatis? meluncurkan kompetisi ini. Nantinya tautan untuk masuk ke
laman Kaggle akan disebarkan secara real-time m elalui
Zoom Chat Box, kemudian pada Channel Telegram.
Bagaimana caranya untuk bergabung Tautan untuk mengikuti kompetisi akan kami sebarkan pada
dalam kompetisi? Zoom Chat Box secara real-time setelah kami meluncurkan
kompetisi. Setelah kami merilis tautan di Zoom Chat Box,
kami akan merilisnya di Channel Telegram. Untuk itu, agar
kamu mendapatkan update terbaru, mohon untuk tetap
berada di Zoom Meeting Room ya.
Kenapa saya melihat pesan “This is a Kompetisi ini hanya dapat diakses dengan KODE UNIK yang
limited participation competition. Only akan disebarkan pada Zoom Chat Box dan Telegram. Tautan
invited users may participate” pada ini juga akan kami perbaharui setiap beberapa lama sekali.
laman Kaggle? Oleh karena itu, pastikan kamu bergabung dengan
menggunakan tautan terbaru.
20
2. Registrasi
Pertanyaan Jawaban
Apakah setiap anggota tim harus Ya, untuk akun Kaggle, semua anggota tim harus memiliki
membuat akun Kaggle mereka akun mereka masing-masing.
masing-masing?
3. Membentuk Tim
Pertanyaan Jawaban
Bagaimana caranya saya bergabung Setelah kamu memilih “Join Competition” dan menerima
dalam tim di Kaggle? Syarat dan Ketentuannya, maka kamu dapat memilih tombol
“Teams” untuk membentuk Tim.
Bagaimana saya membuat tim di Kaggle?
Silakan lihat Lampiran C untuk panduan lengkap mengenai
bagaimana membentuk dan bergabung dalam satu tim.
21
Apabila saya masuk ke tim yang salah, Silakan periksa dan pastikan bahwa nama tim kamu benar
bagaimana caranya saya bisa keluar? sebelum kamu menerima permohonan merger.
4. Submission
Pertanyaan Jawaban
Untuk kompetisi ini, apakah kami harus Scripts y ang kamu submit u ntuk kompetisi ini haruslah lengkap
mengirimkan codes yang telah ditulis atau - yang artinya script t ersebut harus dapat bekerja dari awal
kami harus mengirimkan hasil yang telah hingga akhir tanpa adanya error dan menghasilkan predictions
di-generated? dalam bentuk .csv yang diharapkan.
tau dependencies p
Jika terdapat libraries a ada script yang
dikirimkan, maka kamu harus menjelaskan hal tersebut.
Silakan baca Lampiran D untuk penjelasan lebih lengkap
tentang submissions.
Apakah kami diperbolehkan untuk Kamu dapat menggunakan visualisasi untuk Exploratory Data
menggunakan tableau, menautkan Analysis, akan tetapi hal tersebut tidak dibutuhkan ketika kamu
tangkapan layar sebagai markdown di melakukan submission.
kompetisi data analytics Kaggle?
Bagaimana saya dapat melakukan Setelah kamu bergabung dalam kompetisi ini, kamu dapat
submission pada kompetisi ini dengan memilih tombol “Submit Prediction” untuk mengunggah
menggunakan Kaggle? jawaban tim.
22
i
Saya tidak dapat melakukan submission d Tim diingatkan untuk membuat submission di Kaggle
Kaggle. Apa yang harus saya lakukan? sesegera mungkin atau minimal 15 menit sebelum
kompetisi berakhir. Submission setelah kompetisi
berakhir tidak akan diterima, begitu pula pertanyaan
tentang keterlambatan submission.
5. Scoring
Pertanyaan Jawaban
Bagaimana peraturan dalam menghitung Metode skoring dapat ditemukan pada bagian Evaluation dari
skor di Leaderboard? laman kompetisi di Kaggle.
Apakah terdapat perbedaan antara Public Untuk kategori Beginner, maka perhitungan skor akan
dan Private Leaderboard? dilakukan dengan 30% dari skor di Public Leaderboard, dan
70% dari skor di Private Leaderboard
6. Kaggle Kernels
Questions Answers
Apakah kompetisi di Kaggle hanya Kaggle Kamu dapat memilih untuk menjalankan scripts kamu di
kernel? Atau kami dapat menggunakan notebook Kaggle. Akan tetapi, kami tidak akan memberikan
machine k ami sendiri? bantuan terhadap pertanyaan-pertanyaan terkait hal
tersebut.
23