Anda di halaman 1dari 5

Risang Hanggoro

MB-40-03
1401164097

1. Jelaskan :
a. Perbedaan mendasar penyelesaian masalah menggunakan pendekatan big data dan
pendekatan umum menggunakan sampel/kuisionet/wawancara
b. Data sience
c. Data analytic
d. Social computing
2. Buat suatu scenario/studi kasus penerapan big data analytic pada suatu perusahaan.
Ceritakan mengenai solusi yang ini dicapai, jenis data yang diperoleh dan asalnya.
Perencanaan model data analytic, metode yang digunakan. Temuan pola dan analisis
3. Jelaskan konsep kompleksitas komputasi pada big data dan sebutkan faktor-faktor yang
menyebabkan kompleksitas meningkat
4. Ceritakan mengenai mesin learning:
a. Dimulai dari penentuan data set untuk pembelajaran dan pengujian sampai ke
pengujian akurasi, model machine learning yang dibuat.
b. Jelaskan prinsip mesin L pada (pilih salah satu model) : estimasi, prediksi/ klarifikasi
c. Contoh aplikasi ML pada dunia nyata
5. Cluster analysis (berdasarkan gambar pada soal ini
a. Jelaskan C.A dalam uraian yang singkat, padat dan jelas
b. Berikan 3 contoh penerapan metode C.A dalam bisnis atau contoh lainnya
c. Buatlah dendogram sederhana yang sesuai berdasarkan hierarchical clustering dari
gambar
d. Jika “K=4’, tentukan cluster apa saja yang terbentuk (berikut anggotanya)
6. Association Rules (RA) (berdasarkan table dalam soap ini)
a. Jelaskan apa itu model AR (min. 5 kalimat)
b. Berikan 3 contoh rules yang muncul berdasarkan table dibawah (transaksi di
supermarket) lengkap dengan nilai S (Support), C(Confident), untuk masing2 rules
tadi.
c. Berikan kasus penerapan model AR selain dari kasus market basket, analysis di super
market.
d. Berikan beberapa matrik pengukuran min. 2 untuk mengevaluasi model AR. Jelaskan
masing-masing matrik tersebut secara singkat padat dan jelas.
7. Sosial Network Analysis (SNA)
a. Jelaskan apa itu SNA
b. Berikan 3 contoh penerapan SNA untuk bisnis atau contoh lainnya
c. Berdasarkan model network dibawah siapa saja yang menjadi actor yang berpengaruh
dan perannya dalam kelompok? Jelaskan dengan menggunakan konsep dan
perhitungan matrik key player di SNA. (pilihlah beberapa kandidat dahulu
berdasarkan pengamatan visual. Lalu hitung metrik terkait untuk kadidat-kandidat
tersebut)
d. Siapa yang paling mengontrol informasi dikelompok tersebut? Jelaskan
8. Sebutkan masing-masing 3 tantangan(challenges), kesempatan(opportunities),
resiko(risk) dalam pemanfaatan big data saat ini

JAWAB:
1.
a.
Pendekatan umum Pendekatan big data
b.
Volume yang dapat di proses kecil Volume yang dapat di proses besar
Kecepatan memproses data pelan Kecepatan memproses data cepat
Pencarian data lambat Pencarian data lebih cepat
Pengelolaan data tidak terlalu dalam Pengelolaan data lebih dalam
Data yang dikolal adalah data statik Data yang dikelola setiap waktu berubah dan dinamik
Data science
adalah bidang interdisipliner tentang proses dan sistem untuk mengekstrak
pengetahuan atau wawasan dari data dalam berbagai bentuk, baik terstruktur atau
tidak terstruktur. Bidang ini merupakan kelanjutan dari beberapa lapangan analisis
data seperti statistik, data mining, dan analisis prediktif.
c. Data analytic
adalah ilmu memeriksa data mentah dengan tujuan menarik kesimpulan tentang
informasi tersebut. Data Analytics digunakan dalam industri Mei untuk
memungkinkan perusahaan dan organisasi untuk membuat keputusan bisnis yang
lebih baik dan dalam ilmu-ilmu untuk memverifikasi atau menyangkal model atau
teori yang ada.
d. Social computing
adalah wilayah dari bidang ilmu komputer yang berkaitan dengan persimpangan
perilaku sosial dan sistemkomputasi. Hal ini didasarkan pada menciptakan atau
menciptakan konvensi sosial dan konteks sosial melalui perangkat lunak
penggunaan dan teknologi.
2. Sasasa
3. data berasal dari berbagai sumber sehingga cukup sulit untuk menghubungkan,
mencocokan, membersihkan dan mengubah data di seluruh sistem. Namun, Big Data
sangat dibutuhkan untuk memiliki korelasi antar data, hierarki dan beberapa keterkaitan
data lainnya atau data yang acak.
Faktor-faktor
- Sejumlah besar data
• Algoritma harus sangat scalable untuk menangani seperti tera-byte data
Tinggi dimensi data
• Mikro-array mungkin memiliki puluhan ribu dimensi
- Kompleksitas tinggi data
• stream data dan data sensor
• Data time-series, grafik, jaringan sosial, dan data multi-linked
• Heterogen dan warisan database
• Spasial, spatiotemporal, multimedia, teks, dan data web
• program perangkat lunak, simulasi ilmiah
- Baru dan canggih aplikasi
4.
a. Di bidang analisis data, pembelajaran mesin adalah metode yang digunakan untuk
merancang model yang kompleks dan algoritma yang meminjamkan diri untuk
prediksi - digunakan komersial, ini dikenal sebagai analytics prediktif Model-model
analitis memungkinkan peneliti, ilmuwan Data , Insinyur, dan analis untuk
"menghasilkan handal, keputusan berulang dan hasil" dan mengungkap "wawasan
tersembunyi" melalui belajar dari hubungan historis dan tren dalam data ( wikipedia)
Pembelajaran mesin adalah ilmu mendapatkan komputer untuk bertindak tanpa
eksplisit diprogram. Dalam dekade terakhir, pembelajaran mesin telah memberi kita
mobil self-driving, pengenalan suara praktis, efektif web pencarian, dan pemahaman
yang jauh lebih baik dari genom manusia. Pembelajaran mesin begitu meresap hari ini
bahwa Anda mungkin menggunakannya puluhan kali sehari tanpa menyadarinya.
Banyak peneliti juga berpikir itu adalah cara terbaik untuk membuat kemajuan menuju
tingkat manusia AI. ( Standford / Coursera)
b.

komputer akan melakukan proses belajar (training) untuk


menghasilkan suatu model. Proses belajar ini menggunakan algoritma
machine learning sebagai penerapan teknik statistika. Model inilah yang
menghasilkan informasi, kemudian dapat dijadikan pengetahuan untuk
memecahkan suatu permasalahan sebagai proses input-output. Model
yang dihasilkan dapat melakukan klasifikasi atau pun prediksi
kedepannya.
c. Rekomendasi Produk Marketplace
5.
A. cluster analisis: suatu analisis statistik multivariate yang bertujua untuk mengetahui
struktur data dengan menempatkan kesamaan obhek observasi ke dalam suatu
kelompok data sehingga dapat dibedakan antar kelompok
B.
1) bisnis pemasaran: digunakan untuk analisis SPT
2) Medis:digunakan dalam PET (Positron emission tomography) scan. analisis
cluster dapat digunakan untuk membedakan antara berbagai jenis jaringan dan
darah dalam gambar tiga dimensi
3) Pendidikan : data untuk clustering dapat berupa data siswa, orang tua, jenis
kelamin atau nilai ujian
C. NYERAH
D. NYERAH
6.
A. S
B.
transaksi transaksi transaksi transaksi transaksi transaksi transaksi transaksi jumlah
1 2 3 4 5 6 7 8 item
A A A A 0 0 A 0 5
B B B B 0 B 0 B 6
0 C C 0 0 0 0 C 3
D D 0 D D D D 0 6
E E E 0 0 0 E 0 4
List Rules
1) If buy A than B
Jumlah transaksi If buy A than B: 4
Jmlah transaksi A: 5
Total transaksi : 8
Jumlah transaksi If buy A thanB 4
Support= = X 100 =50
Total transaksi 8

Jumlah transaksi If buy A thanB 4


Confidence= = X 100 =8 0
Jumlahtransaksi A 5

2) If buy B than C
Jumlah transaksi If buy B than C: 3
Jmlah transaksi B: 6
Total transaksi : 8
Jumlah transaksi If buy C than B 3
Support= = X 100 =37,5
Total transaksi 8
Jumlah transaksi If buy A thanB 3
Confidence= = X 100 =5 0
Jumlahtransaksi A 6
3) If buy D than E
Jumlah transaksi If buy D than E: 3
Jmlah transaksi D: 6
Total transaksi : 8
Jumlah transaksi If buy Dthan E 3
Support= = X 100 =37,5
Total transaksi 8

Jumlah transaksi If buy Dthan E 3


Confidence= = X 100 =50
Jumlah transaksi D 6
C. Penerapan Association Rule dalam Data Nilai Siswa
D.

Anda mungkin juga menyukai