”
Nama : Ulfatmi Hanifa
NIM : 1911521010
1. Learn: Dengan setiap titik data, interaksi dan hasil, kembangkan dan pertajam keahlian
2. Reason: Pahami konsep yang mendasarinya, bentuk hipotesis, terapkan aturan, dan
simpulkan serta ekstrak ide.
3. Perceive: Gunakan pendengaran dan penglihatan untuk mengumpulkan informasi dari
dunia sekitar.
4. Understand: Terapkan konteks, pahami citra, ucapan, dan data tidak terstruktur lainnya
seperti yang dilakukan manusia
5. Interact: Berbicara dan berinteraksi dengan manusia secara alami
Data adalah modal dalam membuat model dari behavior seseorang untuk memprediksi
sesuatu. Contohnya di social media adanya polarisasi kesukaan seseorang. Hal ini berasal dari
data yang mengalir dalam jumlah besar dan terus-menerus di internet yang disebut sebagai Big
Data yang memungkinkan polarisasi kesukaan seseorang di social medianya. Big Data ini
memungkinkan digunakan saat ini untuk:
1. Algorithm & Big Data: bertujuan untuk membentuk manusia berdasarkan kebiasaan
sosialnya.
2. Social Engineering (News & Social Media).
3. Compete for Attention: persaingan antar perusahaan dengan AI yang digunakan secara
masif, contohnya iklan yang dimana-mana yang dicocokkan dengan pengguna.
Yang membuat AI menjadi mudah :
1. Banyaknya data yang mudah di dapatkan.
2. Data yang banyak sehingga bisa melihat pola dari data
Data is Everywhere
Baru-baru ini, sejumlah besar data dihasilkan setiap menit aktivitas. Anda dapat
menghasilkan data dalam jumlah besar hanya dalam satu hari. Data ini memberikan wawasan
yang berguna.
Data ini berasal dan bersumber dari mana saja, saat ini data dikumpulkan dan dikelola
secara realtime dalam volume yang sangat besar untuk memprediksi sesuatu. Contohnya data
yang dikumpulkan oleh LinkedIn dan Instagram, yaitu data aktivitas penggunanya yang
dimanfaatkan untuk meningkatkan layanannya dengan mencocokkan kebiasaan pengguna dan
juga bisa sebagai kepentingan bisnis lain seperti periklanan.
Data Science
Data science adalan interdisiplin ilmu yang menggunakan metode ilmiah, proses
ilmiah, serta algoritma dan sistem untuk mengekstrak atau menghasilkan pengetahuan dan
insight dari data terstruktur dan data tidak terstruktur dalam ukuran yang besar. Data scientist
adalah orang yang bekerja dibidang ini dan disebut sebagai “The Sexiest Job Of The 21 st
Century”.
Data Analytics
Analytics fokus pada pemahaman masa lalu; apa yang telah terjadi. Analisis fokus pada
mengapa hal itu terjadi dan apa yang akan terjadi selanjutnya. Analytics yang paling powerfull
adalah analisis prediktif yaitu, seni membangun dan menggunakan model untuk membuat
prediksi berdasarkan pola yang diambil dari data historis. Machine Learning berangkat dari hal
ini, yaitu pengetahuan pakar yang berulang-ulang dan dijadikan model untuk mengambil
keputusan selanjutnya. Contohnya, machine learning dalam memutuskan rekomendasi mobil
berdasarkan behavior atau karakteristik seseorang berdasarkan pengetahuan atau history
sebelumnya.
1. Big Data
Sekumpulan data yang besar dan banyak
2. Data Analytics
Proses untuk mengetahui pola dari data, korelasi antar data dan informasi lainnya
3. Data Science
Ilmu pengetahuan untuk extract pengetahuan
4. Machine learning
Pemrosesan yang dilakukan
5. Artificial Intelligence
Program untuk mempelajari kemampuan seperti manusia
Kini, yang paling banyak dipelajari adalah predictive analytics, merupakan seni
membangun dan menggunakan model untuk membuat prediksi berdasarkan pola yang
diekstraksi dari data historis.
Hasil data analytics digunakan dalam Machine Learning. Machine Learning merupakan
sub-bagian dari Artificial Intelligence yang menghasilkan model matematis melalui
pembelajaran data. Terdapat berbagai jenis paradigma dan algoritma Machine Learning yang
telah dihasilkan diantaranya k-nearest neighbor, logistic regression, naive bayes, gradient
boosting, random forest, support vector machines, deep learning, dll.
Dalam machine learning, terdapat dua algoritma pembelajaran yaitu supervised
learning dan unsupervised learning. Supervised learning adalah pendekatan machine learning
yang ditentukan berdasarkan penggunaan dataset berlabel (labeled dataset). Dalam dataset ini,
terdapat sebuah “label”, yaitu satu kolom yang menjadi target output model.
sedangkan unsupervised learning adalah metode pembelajaran dengan menggunakan algoritme
machine learning untuk menganalisis dan mengelompokkan kumpulan data yang tidak berlabel
(unlabelled data).
Cara kerja machine learning dapat diilustrasikan dengan kejadian berikut. Penentuan
mobil yang cocok untuk seorang pembeli: SUV atau city car. Misalkan, calon pembeli pertama,
seorang kepala keluarga, membeli mobil dengan memberikan kriteria yang dibutuhkannya
seperti jumlah anggota keluarga, budget mobil, dll. Kemudian, calon pembeli kedua, seorang
mahasiswa, juga memberikan kriteria mobil yang dibutuhkannya. Lalu, terdapat berbagai
macam calon pembeli yang datang, dan menghasilkan banyak data. Dari data-data tersebut,
dilakukan pembelajaran oleh mesin sehingga dapat dibuatkan. Dengan model tersebut, dapat
diputuskan mobil yang cocok untuk si calon pembeli. Setelah dibangunnya model, tidak butuh
pengambilan keputusan secara manual lagi. Apabila model tidak lagi cocok dengan kondisi
yang ada, dibuatkan model baru lagi.
Model evaluation digunakan untuk melakukan evaluasi tingkat akurasi model machine
leaning yang telah dibangun. Bisa menggunakan confussion matrix, dimana confussion matrix
akan memperlihatkan berapa banyak data yang diprediksi benar, dan aktualnya benar;
diprediksi salah, data aktualnya benar; diprediksi benar, aktualnya salah; dan diprediksi salah,
data akutalnya salah. Kemudian, ada metode ROC Curve yang menggambarkan kemampuan
diagnostik sistem pengklasifikasi biner karena ambang batas diskriminasinya bervariasi.
Pada dekade terakhir, berkembang istilah deep learning yang memiliki prinsip jaringan
syaraf tiruan yang terdiri dari banyak lapisan, yang terbukti menghasilkan model dengan
performa yang lebih baik, terutama untuk problem-problem klasifikasi dan regresi. Deep
Learning dapat melakukan discriminative (berupa mendeteksi object, recognisi object) serta
generative berupa deep fake (rekayasa peristiwa palsu) seperti video obama yang seolah-olah
berpidato menggunakan bahasa Jawa, padahal Obama berpidato menggunakan bahasa Inggris.
Peluang AI
Penggunaan AI akan menghasilkan performa yang baik pada data yang memiliki
tingkat kompleksitas tinggi dan data yang berjumlah banyak dibandingkan menggunakan
algoritma lama. Namun, pada data yang jumlahnya sedikit, penggunaan AI tidak akan
menghasilkan performa yang baik.
Cara melakukan preprocessing pada data tidak terstruktur ada dua, structure analysis
dan content analysis. Dalam structure analysis dilakukan network modeling, centrality,
strength, network cohesion, disebut social network analysis. Dalam context analysis dilakukan
text classification, text clustering, text network analysis, disebut text analytics.
SNA merupakan memiliki metode analisis yang berkonsentrasi pada relationship
research dan sering digunakan dalam mengukur sebuah hubungan dan menggambarkan
beberapa informasi secara individu. Contoh penggunaan SNA (social network analysis) bisa
kita lihat pada penggunaan social media twitter, seperti gambar berikut. Dengan SNA akan
digambarkan seperti jaringan/network yang melihatkan kata-kata yang relate atau
berhubungan yang sering diucapkan pengguna sosial setelah menyebut suatu kata utama.
Misal: orang orang akan menyebut kata Jakarta setelah menyebut kata basuki_btp.
Kemudian, dengan bantuan metode analisis text analytics dapat dilihat apakah sebuah
cuitan di twitter tersebut termasuk cuitan positif atau negative.