Traslate Jurnal
Traslate Jurnal
net/publication/322057585
Suatu Tinjauan pada Konsep Big Data dan berbagai Teknik Analytic
CITATIONS Dibaca
0 17
3 penulis . termasuk:
Semua konten berikut halaman ini diunggah oleh Jayant Dipak Bokefode di 02 April 2018. Pengguna telah meminta peningkatan dari fi le
download.
International Journal of Tren Komputer dan Teknologi (IJCTT) - Volume 52 Nomor 1 Oktober 2017
'Big Data' adalah teknik berkembang pesat dan modern untuk mengumpulkan, bertahan, menyediakan platform untuk penataan dan pengelolaan Big Data, dan
berbagi, mengawasi dan memeriksa dataset berukuran besar yang datang dengan membuatnya berguna untuk tujuan analisis. Big Data analisis adalah teknik
kecepatan tinggi dan memiliki struktur yang berbeda. dataset data besar adalah mereka analisis penting dan canggih yang beroperasi pada data besar untuk
yang melebihi kapasitas jenis sederhana dari database dan manajemen data arsitektur memeriksa data dalam jumlah besar. Dalam analisis, data yang dibagi
yang digunakan dalam hari sebelumnya. Data dapat terstruktur; terstruktur atau semi- menjadi sektor yang berbeda untuk menilai sesuai dengan waktu, dan
terstruktur yang membutuhkan lebih banyak kekuatan komputasi untuk mengumpulkan membandingkan satu sektor ke sektor lain. Dengan bantuan perusahaan
dan menganalisis data yang dikumpulkan dari sumber yang berbeda. data besar dapat big data dapat mengembangkan pemahaman yang lebih sistematis dan
mengelola berbagai data seperti data terstruktur, semistructured dan tidak terstruktur. perseptif bisnis mereka, yang membantu untuk meningkatkan
Data terstruktur berarti mereka data yang diformat dengan cara langsung sesuai dengan produktivitas dan inovasi.
sistem manajemen database. data semi-terstruktur dan tidak terstruktur berisi semua jenis
data terformat seperti multimedia dan konten media sosial. Data yang besar
membutuhkan arsitektur baru untuk mengelola data, teknik baru dan algoritma untuk
A. Definisi
mengambil data dan analisis untuk menemukan pengetahuan yang tersembunyi dari itu
karena kumpulan data besar yang memiliki berbagai macam, variasi, dan kesulitan. data besar dapat disebut sebagai set data atau kumpulan data set
Makalah ini menjelaskan data besar dan istilah terkait mereka seperti analisis data besar, yang memiliki kecepatan tinggi, ukuran dan kerumitan, yang membuat
mengeksplorasi kemungkinan tentang penelitian di masa depan dan menyajikan dalam mereka sulit untuk mengelola dan proses dengan teknologi tradisional
penelitian kemajuan dan temuan terkait yang dapat membantu penelitian sarjana, bisnis dan alat dan juga sulit untuk menangkap dengan data rate tinggi dan
dan penyedia layanan data untuk mempelajari dan mengembangkan analisis data besar sulit
proyek. Sekarang hari, sebagian besar mengeksplorasi kemungkinan tentang penelitian di untuk melakukan analisis menggunakan database relasional
masa depan dan menyajikan berlangsung penelitian dan temuan terkait yang dapat dan statistik atau visualisasi teknik [1]. Tergantung
membantu penelitian sarjana, bisnis dan penyedia layanan data untuk mempelajari dan pada ukuran data set set data tertentu dianggap sebagai data yang
mengembangkan proyek-proyek data analisis besar. Sekarang hari, sebagian besar besar, set data memiliki ukuran 40-50 terabyte ke beberapa petabyte.
mengeksplorasi kemungkinan tentang penelitian di masa depan dan menyajikan Big Data System memiliki arsitektur berlapis dan memiliki tiga lapisan.
berlangsung penelitian dan temuan terkait yang dapat membantu penelitian sarjana, Lapisan tersebut Infrastruktur Layer, Computing Layer, dan
bisnis dan penyedia layanan data untuk mempelajari dan mengembangkan proyek- Application Layer dapat ditunjukkan pada gambar 2.
proyek data analisis besar. Sekarang hari, sebagian besar
itu
B. Menggambarkan data besar melalui Tiga Vs
perusahaan yang menyelidiki data yang besar untuk memperbaiki posisi
organisasi dalam tren pasar saat ini. Volume data:
Kata kunci: Big Data, Analytics, MapReduce, HDFS.
Volume dapat disebut sebagai ukuran data. sejumlah besar data
dikumpulkan dari berbagai sumber seperti, transaksi, media sosial,
I. saya P ENDAHULUAN
sensor, ritel, audio, video, sektor pemerintah dll berkisar dari terabyte
ke petabyte.
Hari ini, setiap bidang didasarkan pada digitalisasi dan tumbuh
secara eksponensial. Karena pertumbuhan yang tinggi di digitalisasi
jumlah besar terstruktur serta data terstruktur yang dihasilkan dan Berbagai data:
proses yang sedang terjadi terus menerus. Data yang dihasilkan dan
Berbagai data berarti jenis data yang Big dukungan data. data
dikumpulkan dari berbagai sumber seperti, transaksi, media sosial,
besar mendukung berbagai jenis data seperti terstruktur, tidak
sensor,
terstruktur dan semi terstruktur.
ritel, audio, video,
sektor pemerintah dll Sebagai contoh, di facebook setiap bulan 40
miliar isinya sedang bersama. Hal ini diperlukan bagi organisasi untuk
menambang data ini terus bertahan di tren pasar saat ini dan menjadi
pesaing yang baik. Ketika data dianalisis benar membantu organisasi
untuk menentukan strategi saat ini dan masa depan. Teknik
pengolahan data konvensional memberikan kinerja terdegradasi
B. Skala
Data yang dikumpulkan untuk analisis sangat besar; mengelola data ini
membutuhkan daya scalable komputasi, sensor kecepatan tinggi, jaringan yang
kuat, dan kemampuan penyimpanan yang besar. [2] [5]
C. Ketepatan waktu
D. Privasi
Data yang besar telah dihasilkan dari data yang berbeda menangkap
sumber. Sebagai contoh, simulasi dan percobaan ilmiah yang berbeda
dengan mudah menghasilkan byte PETA. Sebagian besar data ini tidak
berguna; perlu disaring. Tantangan pertama adalah, data perlu disaring
sedemikian rupa sehingga data penting tidak akan lepas. Tantangan kedua
adalah, menghasilkan metadata yang benar untuk data yang tersimpan.
d. Query Processing, Modeling Data, dan diperiksa untuk sentimen positif atau negatif [3]. Dalam teknik
Analisis Kalimat-tingkat, kalimat dikumpulkan di-scan untuk polaritas untuk
dikenal entitas hadir. Dalam Aspek berbasis
metode yang berbeda tersedia untuk pertambangan data yang
teknik, dokumen yang
berpengetahuan dari data besar. Query Big Data yang berbeda dari
ditentukan untuk sentimen dan entitas aspek diidentifikasi
teknik tradisional karena heterogen, dinamis dan saling terkait. Query
untuk memperjelas yang masing-masing sentimen mengacu.
atau Mining Data Big memerlukan teknik data yang terintegrasi dan
efisien diakses dan algoritma pertambangan scalable. c. analisis Audio
analisis Audio diterapkan untuk pidato atau audio diucapkan. Teknik ini
juga disebut sebagai analisis pidato. Sekarang hari, analisis audio yang
e. Interpretasi memainkan peran penting dalam call center dan sistem kesehatan. Semua
teknik ini membantu untuk mengevaluasi kinerja agen, untuk meningkatkan
Menganalisis Big Data tidak memiliki nilai jika informasi analitis
tidak disajikan dengan cara userfriendly. Ini penjualan
f. analisis prediktif
Sebuah. analisis teks
analisis prediktif tidak lain adalah peramalan tentang hasil masa
Teks analisis adalah teknik yang digunakan untuk mengambil data depan dari data saat ini dan sejarah. probabilitas ini digunakan untuk
yang berarti dari data tekstual. Data tekstual yang diselenggarakan oleh merencanakan bisnis dan sesuai dengan itu pekerjaan yang telah
bisnis, sisi jaringan sosial, log email, aplikasi online dan
dilakukan [9]. analisis prediktif digunakan untuk memahami
forum, pendidikan kebutuhan pelanggan di masa depan, untuk merancang produk
dokumen, saluran berita, dan call center log ini merupakan sumber sesuai dengan tren pasar dan untuk mengidentifikasi risiko
data tekstual. Dalam analisis teks, berisi tiga tahapan utama analisis kemungkinan dan ruang lingkup untuk organisasi. Analytics prediksi
statistik, linguistik komputasi, dan mesin belajar. analisis teks dilakukan melalui teknik yang berbeda tapi salah satu teknik terkenal
memfasilitasi bisnis dan organisasi untuk mengambil ringkasan berarti adalah pembelajaran mesin, fuzzy logic, data mining dan analisis
dari volume besar teks yang dihasilkan, yang membantu untuk regresi yang membantu analis untuk membuat hipotesis mengenai
pengambilan keputusan. bisnis untuk meningkatkan posisi sebuah organisasi [6].
b. Analisis sentimen
didistribusikan pengolahan atas data besar yang disimpan dalam [15] http://en.wikipedia.org/wiki/Apache_Hadoop.
server”[11] [12]. Desain Hadoop adalah fleksibel dan scalable yang
skala sesuai dengan kebutuhan dan skala sampai ribuan server. Ini
memberikan tingkat tinggi
kesalahan toleransi. software Apache
landasan mengambil inisiatif untuk merancang perangkat lunak yang
menangani volume data yang besar. Ini menangani semua jenis data.
Platform Hadoop terutama dikategorikan ke dalam dua proyek MapReduce
dan HDFS [10]. kerangka MapReduce menetapkan karya untuk cluster
yang berbeda simpul sedangkan HDFS (Hadoop Distributed File System)
cluster Link node ke node lokal untuk membuat satu sistem berkas Big
[13].
VI. C ONCLUSION
Makalah ini, menggambarkan Big data dan konsep dasar yang terkait dan
tantangan diidentifikasi terkait dengan itu dan jika organisasi harus memenuhi
tren pasar saat ini. Mereka harus harus mengumpulkan sejumlah besar data
dan perlu untuk mengimplementasikan kemampuan pemrosesan yang tinggi
untuk mengolah data tersebut maka data ini dapat disempurnakan dengan
menggunakan teknik analisis yang berbeda untuk pengambilan keputusan yang
tepat dan perencanaan strategis. Hadoop menyediakan platform yang fleksibel
untuk memproses dan menganalisis data Big.
R EFERENCES
[1] Memajukan Penemuan dalam Sains dan Teknik.
Konsorsium Masyarakat Computing. Musim semi 2011. [2]
Labrinidis, A., & Jagadish, HV (2012). Tantangan dan peluang
dengan data.Proceedings besar dari VLDB Endowment, 5 (12),
2032-2033. [3]
Feldman, R. (2013). Teknik dan aplikasi untuk analisis sentimen.
Komunikasi-kation dari ACM, 56 (4), 82-89. [4] Amir Gandomi, Murtaza
Haider. Luar hype: Big