Tugas 2 Big Data - 201064001 - Maria Jeanne N P

Diunggah oleh

Jelia Pakaenoni

0% menganggap dokumen ini bermanfaat (0 suara)

7 tayangan4 halaman

Judul Asli

Tugas 2 Big Data_201064001_maria Jeanne n p

Hak Cipta

Format Tersedia

DOCX, PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Hak Cipta:

Format Tersedia

Unduh sebagai DOCX, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

7 tayangan4 halaman

Tugas 2 Big Data - 201064001 - Maria Jeanne N P

Diunggah oleh

Jelia Pakaenoni

Hak Cipta:

Format Tersedia

Unduh sebagai DOCX, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 4

Cari di dalam dokumen

NAMA : MARIA JEANNE NATALIA PAKAENONI

NIM : 201064001
TUGAS 2 TEKNOLOGI INFORMASI DAN BIG DATA

a. Menuliskan materi tentang pengolahan bigdata di R

b. Contoh aplikasi dan syntaxnya
Jawab:
a. Big data adalah sekumpulan informasi dengan format yang berbeda-beda dan
berkembang seiring waktu. Pengertian lain dari Big data analytics atau analisis big data
adalah keseluruhan proses untuk mengumpulkan, merapikan, memperbaiki, hingga
menganalisis data dalam jumlah besar. Prinsip big data ada lima, yakni volume, velocity,
variety, veracity, dan value. Volume adalah skala informasi yang didapatkan, velocity
adalah kecepatan untuk mengumpulkan data-data tersebut, variety adalah keberagaman
jenis data yang diambil, veracity adalah tingkat akurasi & validitas data yang dimiliki,
dan yang terakhir value, nilai dari data yang dimiliki dan dihasilkan. Kemudian ada pula
penambahan tiga prinsip dalam big data yakni volatility, visualiation dan virality dimana
volatility adalah karakteristik yang berkaitan dengan perubahan data, visualiation
adalah tampilan berupa grafis atau visual dari informasi dan data sedangkan virality
adalah seberapa besar data itu dapat didistribusikan ulang kepada publik.
Bahasa R memiliki banyak base function maupun library yang membantu menangani
data yang tidak terstruktur seperti gambar, video maupun teks dalam jumlah yang besar
(big) agar bisa terdokumentasi dengan baik dengan teknologi penyimpanan data yang
terus meningkat, baik dari sisi kehandalan maupun kapasitas. Dimana poin penting
selanjutnya dari data yang telah terstruktur oleh bahasa R ialah dapat dianalisis untuk
menciptakan keputusan yang bisa berdampak baik pada organisasi maupun perusahaan.
1) Untuk Mengolah Data Text
Pengolahan big data diawali dengan mengecek tipe dari data yang akan dikelola,
salah satunya bisa berupa character ataupun string. Selanjutnya akan dilakukannya
proses wrangling, proses wrangling ini merupakan proses mengubah data mentah ke
dalam format yang lebih mudah diolah. Proses pengubahan tersebut mencakup
beberapa langkah diantaranya menggabungkan beberapa sumber data(merging),
mengidentifikasi atau mengatur ulang data, menangani missing value dengan
membersihkannya kemudian yang terakhir memperkaya atau
mengembangkan(memproses) data. Diikuti dengan mengekstrak data yang terdapat
pada teks dan mendeteksi pola atau pattern yang terdapat pada teks. Berikutnya ialah
membuat data teks dengan syntax data frame.
2) Untuk Sampel dan Pemodelan
Pengambilan sampel yang dilakukan telah mewakili keseluruhan data yang akan
dimodelkan, berkurangnya ukuran data saat pengunduhan tidak berpengaruh pada
runtime model data dan validitas statistik, model data tetap layak digunakan dan
validitas statistik pun tetap dipertahankan.
3) Potong dan Tarik
Data dipotong menjadi unit yang dapat dipisahkan dan setiap potongan ditarik secara
terpisah dan dioperasikan secara serial, paralel, atau setelah digabungkan kembali.
Strategi ini secara konseptual mirip dengan algoritma MapReduce.
Bergantung pada kebutuhan, potongan tersebut dapat berupa periode waktu, unit
geografis, atau logis seperti bisnis, departemen, produk, atau segmen pelanggan yang
terpisah
4) Dorong Hitung ke Data
Data dikompresi pada database, dan hanya kumpulan data terkompresi yang
dipindahkan dari database ke R.

b. Aplikasi R dan syntaxnya

1) Contoh aplikasi syntax suatu proyek pada R:

2) Contoh syntax pada R(data text):

3) RHadoop:

Anda mungkin juga menyukai

Big Data and Data Analytic
Dokumen37 halaman
Big Data and Data Analytic
Novi Oktaviia
Belum ada peringkat
Cert Da Iai Day 1 3
Dokumen50 halaman
Cert Da Iai Day 1 3
achmad fikri
Belum ada peringkat
Tugas 1 Big Data Kel 4
Dokumen7 halaman
Tugas 1 Big Data Kel 4
Reza Zulfiqri
Belum ada peringkat
Bima Mulya Firmansyah - Quiz 1 1
Dokumen5 halaman
Bima Mulya Firmansyah - Quiz 1 1
Bima Mulya Firmansyah
Belum ada peringkat
Final Modul 6-KB 4 (Fathahillah) 2022
Dokumen38 halaman
Final Modul 6-KB 4 (Fathahillah) 2022
lutfi hidayat
Belum ada peringkat
TKI-Modul 6-KB 4 Kirim
Dokumen44 halaman
TKI-Modul 6-KB 4 Kirim
Yogi Sasongko
Belum ada peringkat
2212 - Comp6725036 - Emea - TP1-W2-S3-R0 - 2502081051 - Javier Aditama Falaq
Dokumen7 halaman
2212 - Comp6725036 - Emea - TP1-W2-S3-R0 - 2502081051 - Javier Aditama Falaq
Javier Aditama
Belum ada peringkat
Pertemuan Pertama - 6 September 2022
Dokumen39 halaman
Pertemuan Pertama - 6 September 2022
Eksanto San
Belum ada peringkat
Big Data
Dokumen12 halaman
Big Data
Siwo Honkai
Belum ada peringkat
BAB 12. Big Data
Dokumen12 halaman
BAB 12. Big Data
Febriani Nur Azizah
Belum ada peringkat
Big Data Analisis
Dokumen26 halaman
Big Data Analisis
Bara
Belum ada peringkat
Kegiatan Belajar 4 Framework Dan Big Data
Dokumen27 halaman
Kegiatan Belajar 4 Framework Dan Big Data
العليا لطيفةفاني
Belum ada peringkat
Pengenalan Big Data
Dokumen5 halaman
Pengenalan Big Data
Juita Andalestari
Belum ada peringkat
Tugas Personal Ke-1 Week 2: Nama Fikran Ahmadi NIM 2401987701
Dokumen4 halaman
Tugas Personal Ke-1 Week 2: Nama Fikran Ahmadi NIM 2401987701
Fikran Ahmadi
Belum ada peringkat
Kisi Kisi Analisis Big Data & Data Mining
Dokumen7 halaman
Kisi Kisi Analisis Big Data & Data Mining
Dante Hayashi
Belum ada peringkat
Tugas Big Data - Kelas C
Dokumen12 halaman
Tugas Big Data - Kelas C
alessandro pasla
Belum ada peringkat
BAB XII Analisis Big Data PDF
Dokumen11 halaman
BAB XII Analisis Big Data PDF
Abdul Basith
Belum ada peringkat
Rajkumar en Id
Dokumen45 halaman
Rajkumar en Id
Hafiz Gemilang
Belum ada peringkat
Resume Big Data
Dokumen9 halaman
Resume Big Data
Puja Gaming official
Belum ada peringkat
Materi PPT Teprob
Dokumen5 halaman
Materi PPT Teprob
Dian Fitriaramdani
Belum ada peringkat
Big Data Concepts and Tools
Dokumen14 halaman
Big Data Concepts and Tools
Maria Ermelinda Ririn Riastuti
Belum ada peringkat
Real Time Big Data Analytics
Dokumen9 halaman
Real Time Big Data Analytics
Arif Nugroho
Belum ada peringkat
MK Sains Data-Pertemuan 2
Dokumen10 halaman
MK Sains Data-Pertemuan 2
Abdurrozaq
Belum ada peringkat
Tugas Big Data Kelompok 5
Dokumen16 halaman
Tugas Big Data Kelompok 5
Titin Sumarni
Belum ada peringkat
7 BAB IIgdy
Dokumen27 halaman
7 BAB IIgdy
Muhammad Rizky Asiddin
Belum ada peringkat
Rangkuman The Power of Data
Dokumen6 halaman
Rangkuman The Power of Data
drdmonz
Belum ada peringkat
Mighna Urfah Big Data For Dummies
Dokumen7 halaman
Mighna Urfah Big Data For Dummies
Mighna Urfah
Belum ada peringkat
MAKALAH Big Data
Dokumen4 halaman
MAKALAH Big Data
Visa Nur Sa'diah
Belum ada peringkat
Leveraging Cloud Based Big Data Analytics in Knowledge Management For Enhanced Decision Making in Organizations - En.id
Dokumen13 halaman
Leveraging Cloud Based Big Data Analytics in Knowledge Management For Enhanced Decision Making in Organizations - En.id
ibrahim hidayatt
Belum ada peringkat
Uts SMBBD
Dokumen3 halaman
Uts SMBBD
Muhammad Faishal Farras
Belum ada peringkat
UTS Big Data - Ardi Gunawan - 311910242
Dokumen5 halaman
UTS Big Data - Ardi Gunawan - 311910242
ardi gunawan
Belum ada peringkat
TugasCyberLaw 1 - Karina Fitri 110110170353
Dokumen7 halaman
TugasCyberLaw 1 - Karina Fitri 110110170353
wildstar paradise
Belum ada peringkat
Dita Ainurrizka - Pertemuan 10
Dokumen5 halaman
Dita Ainurrizka - Pertemuan 10
dita ainurrizka
Belum ada peringkat
Bab 3 Metopen
Dokumen8 halaman
Bab 3 Metopen
Sinta
Belum ada peringkat
Sistem Data Warehouse - Dwi Puteri Ayuni - Jawaban UAS
Dokumen6 halaman
Sistem Data Warehouse - Dwi Puteri Ayuni - Jawaban UAS
Mal Liah
Belum ada peringkat
Tugas Pertemuan 3 Big Data & Cloud Computing Yulia Eka Putri Muchtar
Dokumen11 halaman
Tugas Pertemuan 3 Big Data & Cloud Computing Yulia Eka Putri Muchtar
Playing With Yuto
Belum ada peringkat
Makalah Big Data
Dokumen25 halaman
Makalah Big Data
Yongki Saputra
Belum ada peringkat
Supply Team Teaching
Dokumen566 halaman
Supply Team Teaching
dimas
Belum ada peringkat
PT 1 Visualisasi Data Kelas 11
Dokumen25 halaman
PT 1 Visualisasi Data Kelas 11
Lulu Anta
Belum ada peringkat
Big Data Pertemuan 4
Dokumen3 halaman
Big Data Pertemuan 4
Ratih erna purnamasari Lubis
Belum ada peringkat
Asniar BigDataAnalyticdiPerguruanTinggi Revisi
Dokumen5 halaman
Asniar BigDataAnalyticdiPerguruanTinggi Revisi
Erika Barus
Belum ada peringkat
Materi Cybersecurity
Dokumen4 halaman
Materi Cybersecurity
Yamerooo.
Belum ada peringkat
Kapita Selekta 2
Dokumen18 halaman
Kapita Selekta 2
Randy Yogaswara
Belum ada peringkat
Review
Dokumen4 halaman
Review
Hendrik Kurniawan
Belum ada peringkat
Uas Big Data
Dokumen7 halaman
Uas Big Data
UKM SPORT
Belum ada peringkat
Quiz Yeni Hellen Kronika 20560003
Dokumen4 halaman
Quiz Yeni Hellen Kronika 20560003
dory agustia rantawi
Belum ada peringkat
Tugas Paper BIG DATA Kelas B Kelompok 8
Dokumen9 halaman
Tugas Paper BIG DATA Kelas B Kelompok 8
reksaalbi71
Belum ada peringkat
APLIKOM
Dokumen11 halaman
APLIKOM
diva
Belum ada peringkat
Sejarah Perkembangan Basis Data
Dokumen5 halaman
Sejarah Perkembangan Basis Data
M Fathul Alim
100% (1)
Big Data Exam
Dokumen5 halaman
Big Data Exam
Andika Yudha
Belum ada peringkat
1 SM
Dokumen12 halaman
1 SM
Yulianti Repati
Belum ada peringkat
Rangkuman TSI Chapter 5 & 6
Dokumen14 halaman
Rangkuman TSI Chapter 5 & 6
sheena diva
Belum ada peringkat
Big Data
Dokumen22 halaman
Big Data
Arif Pamuji
100% (1)
Harisna 2210010518
Dokumen4 halaman
Harisna 2210010518
Harisna
Belum ada peringkat
Review SIP Murah - 15417050 - Timothy Brandon
Dokumen13 halaman
Review SIP Murah - 15417050 - Timothy Brandon
Timothy Brandon
Belum ada peringkat
Materi PPT Bab 6
Dokumen6 halaman
Materi PPT Bab 6
fitria indrianti
Belum ada peringkat
LN03
Dokumen15 halaman
LN03
Doni Butarbutar
Belum ada peringkat
Data Besar
Dokumen11 halaman
Data Besar
zara
Belum ada peringkat
Makalah Big Data
Dokumen24 halaman
Makalah Big Data
maulanaabdillahh13
Belum ada peringkat
Strategi Meningkatkan Kinerja Guru
Dari Everand
Strategi Meningkatkan Kinerja Guru
Andi Sulistiadi
Belum ada peringkat
Proposal Php2d Himasta. - Heribertin Pau Teku
Dokumen33 halaman
Proposal Php2d Himasta. - Heribertin Pau Teku
Jelia Pakaenoni
Belum ada peringkat
TM1 - SPSS - 2022 (Fiks)
Dokumen15 halaman
TM1 - SPSS - 2022 (Fiks)
Jelia Pakaenoni
Belum ada peringkat
Tugas 4 Manajemen Logistik (Kelompok)
Dokumen7 halaman
Tugas 4 Manajemen Logistik (Kelompok)
Jelia Pakaenoni
Belum ada peringkat
KKN Jelia Full PDF
Dokumen13 halaman
KKN Jelia Full PDF
Jelia Pakaenoni
Belum ada peringkat
Kelompok 3 Multivariat - Mds
Dokumen31 halaman
Kelompok 3 Multivariat - Mds
Jelia Pakaenoni
Belum ada peringkat