Buat Download Tok

Anda mungkin juga menyukai

Anda di halaman 1dari 3

Nama : Dedy Rosyiid Setiawan

NIM : 01615146237
Kelas : Manajemen Informasi 6

Soal.
1. Sebutkan teknologi atau ​tools ​
yang digunakan dalam proses analisa ​big data!
2. Sebutkan sumber data (​open source) dari internet yang dapat digunakan dalam analisa
big data!

Jawaban.
1. Microsoft Excel, MATLAB, IBM: SPSS Modeler & SPSS Analytics, SAS (Statistical
Analysis System).
a. Microsoft Excel.
Microsoft Excel adalah aplikasi pengolah data yang menggunakan spreadsheet
untuk managemen data dan perintah, dan mayoritas sebuah institusi atau
lembaga ketika mengolah data menggunakan Ms Excel ini. Fitur yang dimiliki
seperti tabel pivot, add-ins, team, dan macro adalah fitur yang sangat berguna
untuk melakukan analisis data.

b. MATLAB.
MATLAB adalah kependekan dari MATrix LABoratory, bahasa
pemrograman tinggi, tertutup, dan case sensitive dalam lingkungan komputasi
numerik yang dikembangkan oleh MathWorks. Salah satu kelebihannya yang
paling populer adalah kemampuan membuat grafik dengan dukungan
kustomisasi terbaik.
c. IBM: SPSS Modeler & SPSS Analytics.
SPSS secara user interface mempunyai tampilan yang hampir sama dengan
Microsoft Excel. Software ini mengintegrasikan Hadoop untuk melakukan
perhitungan komputasi dengan menggunakan big data.
d. SAS (Statistical Analysis System).
Software ​ini menjadi pilihan terbaik untuk melakukan analisis big data karena
pengelolaan resource hardware seperti prosesor dan RAM sangat efesien.
Fitur yang dimiliki diantaranya ​pengambilan informasi dan manajemen data,
laporkan penulisan dan gambar, analisis statistik, ekonometrika, dan
penambangan data, perencanaan bisnis, peramalan, dan dukungan keputusan,
riset operasi dan manajemen proyek, perbaikan mutu, pengembangan aplikasi,
pergudangan data (ekstrak, ubah, muat) dan platform komputasi mandiri dan
jarak jauh.

2. ​
Hadoop adalah framework open source berbasis Java di bawah lisensi Apache untuk
mensupport aplikasi yang jalan pada big data. Hadoop berjalan pada lingkungan yang
menyediakan storage dan komputasi secara terdistribusi ke kluster-kluster dari
komputer/node. ​Asal mula hadoop muncul karena terinspirasi dari makalah tentang ​Google
MapReduce dan ​Google File System (GFS) yang ditulis oleh ilmuwan dari Google, ​Jeffrey
Dean dan ​Sanjay Ghemawat pada tahun 2003. Proses ​development dimulai pada saat proyek
Apache Nutch, yang kemudian baru dipindahkan menjadi sub-proyek hadoop pada tahun
2006.

Anda mungkin juga menyukai