Anda di halaman 1dari 1

Training data, also called AI training data, training set, training dataset, or learning set

— is the information used to train an algorithm. The training data includes both input data and
the corresponding expected output. Based on this “ground truth” data, the algorithm can learn
how to apply technologies such as neural networks, to learn and produce complex results, so
that it can make accurate decisions when later presented with new data. Training data can be
used for various machine learning algorithms, such as sentiment analysis, natural language
processing, and chatbot training.

Testing data, on the other hand, includes only input data, not the corresponding
expected output. The testing data is used to assess how well your algorithm was trained, and to
estimate model properties.

Untuk mendapatkan model, kita harus melakukan analisis terhadap data latih (training
set). Sedangkan data uji (test set) digunakan untuk mengetahui tingkat akurasi dari model yang
telah dihasilkan.

Pada model pelatihan terdapat suatu kumpulan data yang memiliki kelas yang telah
ditetapkan (data latih / training). Kumpulan data latih digunakan untuk membentuk model
klasifikasi. Pada model pengujian / test, model klasifikasi yang sudah terbentuk diuji dengan
data yang lainnya (data uji) untuk mengetahui akurasi dari model klasifikasi tersebut. Model
klasifikasi yang dihasilkan dapat digunakan untuk menentukan kelas dari data yang baru