Anda di halaman 1dari 6

CLUSTERING PEMAIN BOLA BERDASARKAN POSISI DAN SKILL

Bayu Hanif Pratama


bayu20s2tk@mahasiswa.pcr.ac.id
Politeknik Caltex Riau

A. Preprocessing
I. Memasukkan dan membaca kumpulan data yang kita butuhkan untuk melakukan Analisa.

II. Melakukan pemeriksaan missing values dan kemudian mengubah missing values tersebut sesuai
dengan pengaturan berikut.

III. Melakukan rank correlation untuk melihat hubungan antar data yang akan digunakan.
a. Skenario 1 (posisi pemain)
b. Skenario 2 (skill)

IV. Melakukan normalisasi seluruh data numeric untuk memudahkan proses clustering

B. Metode atau Pendekatan


Metode yang digunakan pada tugas ini adalah clustering menggunakan K-Means.
K-means clustering merupakan salah satu metode cluster analysis non hirarki yang berusaha untuk
mempartisi objek yang ada kedalam satu atau lebih cluster atau kelompok objek berdasarkan
karakteristiknya, sehingga objek yang mempunyai karakteristik yang sama dikelompokan dalam satu
cluster yang sama dan objek yang mempunyai karakteristik yang berbeda dikelompokan kedalam
cluster yang lain. Metode K-Means Clustering berusaha mengelompokkan data yang ada ke dalam
beberapa kelompok, dimana data dalam satu kelompok mempunyai karakteristik yang sama satu
sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok
yang lain.

Dengan kata lain, metode K-Means Clustering bertujuan untuk meminimalisasikan objective
function yang diset dalam proses clustering dengan cara meminimalkan variasi antar data yang ada di
dalam suatu cluster dan memaksimalkan variasi dengan data yang ada di cluster lainnya juga
bertujuan untuk menemukan grup dalam data, dengan jumlah grup yang diwakili oleh variabel K.
Variabel K sendiri adalah jumlah cluster yang diinginkan. Membagi data menjadi beberapa
kelompok. Algoritma ini menerima masukan berupa data tanpa label kelas. Hal ini berbeda dengan
supervised learning yang menerima masukan berupa vektor (x1 , y1) , (x2 , y2) , …, (xi , yi), di mana
xi merupakan data dari suatu data pelatihan dan yi merupakan label kelas untuk xi .

Pada algoritma pembelajaran ini, komputer mengelompokkan sendiri data-data yang menjadi
masukannya tanpa mengetahui terlebih dulu target kelasnya. Pembelajaran ini termasuk dalam
unsupervised learning. Masukan yang diterima adalah data atau objek dan k buah kelompok (cluster)
yang diinginkan. Algoritma ini akan mengelompokkan data atau objek ke dalam k buah kelompok
tersebut. Pada setiap cluster terdapat titik pusat (centroid) yang merepresentasikan cluster tersebut.

K-means ditemukan oleh beberapa orang yaitu Lloyd (1957, 1982), Forgey (1965) , Friedman and
Rubin (1967), and McQueen (1967). Ide dari clustering pertama kali ditemukan oleh Lloyd pada
tahun 1957, namun hal tersebut baru dipublikasi pada tahun 1982. Pada tahun 1965, Forgey juga
mempublikasi teknik yang sama sehingga terkadang dikenal sebagai Lloyd-Forgy pada beberapa
sumber.

C. Penerapan Metode
a. Skenario I, clustering dilakukan berdasarkan posisi pemain
i. Berikut gambar dari rangkaian metode
ii. Dataset pemain bola yang sangat lengkap dengan atribut – atribut yang dapat menjelaskan
sisi kualitas, rating, nilai dalam posisi, nilai dalam kemampuan bermain, dan lain sebagainya.
iii. Tahapan pertama merupakan tahapan preprocessing sebagaimana yang telah dijelaskan pada
poin A makalah ini. Tahapan terdiri dari membaca file dataset, melakukan pengecekan
missing values dan kemudian memperbaiki data tersebut, melakukan rank correlation untuk
mengukur nilai korelasi antar data yang akan dianalisa dan terakhir melakukan normalisasi
data – data yang numeric.
iv. Tahapan berikutnya adalah tahapan inti yaitu clustering menggunakan K-means. Tugas ini
menerapkan k-means dengan jumlah cluster adalah 3, iteration 99 dan centroid-nya adalah
random.
v. Setelah didapatkan hasil clustering, Langkah berikutnya adalah denormalisasi hasil
clustering yang kemudian bisa ditampilkan menggunakan media table view atau visualisasi
dengan scatter plot.
vi. Langkah terakhir yaitu menguji dengan mengukur nilai entropy dari hasil clustering yang
telah dibuat.

b. Skenario II, clustering berdasarkan kemampuan atau skill pemain


i. Berikut gambar dari rangkaian metode
ii. Dataset pemain bola yang sangat lengkap dengan atribut – atribut yang dapat menjelaskan
sisi kualitas, rating, nilai dalam posisi, nilai dalam kemampuan bermain, dan lain sebagainya.
iii. Tahapan pertama merupakan tahapan preprocessing sebagaimana yang telah dijelaskan pada
poin A makalah ini. Tahapan terdiri dari membaca file dataset, melakukan pengecekan
missing values dan kemudian memperbaiki data tersebut, melakukan rank correlation untuk
mengukur nilai korelasi antar data yang akan dianalisa dan terakhir melakukan normalisasi
data – data yang numeric.
iv. Tahapan berikutnya adalah tahapan inti yaitu clustering menggunakan K-means. Tugas ini
menerapkan k-means dengan jumlah cluster adalah 3, iteration 99 dan centroid-nya adalah
random.
v. Setelah didapatkan hasil clustering, Langkah berikutnya adalah denormalisasi hasil
clustering yang kemudian bisa ditampilkan menggunakan media table view atau visualisasi
dengan scatter plot.
vi. Langkah terakhir yaitu menguji dengan mengukur nilai entropy dari hasil clustering yang
telah dibuat.

D. Hasil Analisis
Hasil analisis pada tugas ini antara lain ;
a. Rank correlation, untuk menentukan variable – variable yang digunakan pada penerapan metode
b. Normalisasi, seluruh data numeric dinormalisasikan untuk memudahkan proses selanjutnya
c. K-Means clustering, hasil dari penerapan metode ini merupakan sebuah pengelompokkan
random dengan 3 cluster.
Clustering ini menghasilkan keluaran yang secara acak dipilih oleh algoritma dengan
menerapkan cluster sebanyak 3 dan iterasi maksimal 99.
E. Kesimpulan
Pada tugas ini, diharapkan dapat membantu manager sebuah club sepakbola untuk menentukan
daftar pemain yang akan diturunkan. Pekerjaan dipisahkan menjadi dua scenario, scenario I yaitu
melakukan pengelompokkan berdasarkan posisi pemain. Scenario II yaitu melakukan
pengelompokkan sesuai dengan kemampuan dan skill yang dimiliki.
Sebelum melakukan proses clustering, untuk memudahkan atau untuk hasil yang lebih baik, data
numeric dinormalisasikan.
Hasil dari penerapan metode k-means clustering telah dinilai menggunakan entropy scorer dan
memiliki hasil yang cukup baik.

Anda mungkin juga menyukai