Anda di halaman 1dari 13

RANGKUMAN BIG DATA ANALYTICS, BIG DATA EXPLAINED, BIG

DATA TOOLS AND TREANDS, BIG DATA TRAINNING

Siti nurhaliza az zahra


(1206622071)

Dosen pengampu :
Fuad Mumtas, S.Kom., M.T.I

MATA KULIAH DATA RAYA DAN PEMROGAMAN PROGRAM STUDI


PENDIDIKAN SENI RUPA FAKULTAS BAHASA DAN SENI
UNIVERSITAS NEGERI JAKARTA 2023
RANGKUMAN BIG DATA ANALYTICS, BIG DATA EXPLAINED, BIG DATA
TOOLS AND TREANDS, BIG DATA TRAINNING

Berbagai macam data yang sangat besar dihasilkan dengan kecepatan yang sangat cepat di
berbagai sektor, oleh karena itu analisis data besar menjadi sangat penting dan tidak bisa
dihindari karena analisis data besar diadopsi di seluruh dunia untuk mendapatkan banyak
manfaat dari data yang dihasilkan. jadi halo semuanya, ini di bawah Shree dari nu Rekha dan
saya akan memandu Anda melalui sesi menarik tentang analisis data besar, jadi teman-teman,
mari kita segera melihat topik untuk diskusi hari ini sehingga topik pertama untuk sesi hari
ini adalah mengapa kita memerlukan analisis data besar dan mengapa hal ini menjadi sangat
penting setelah menganalisis, kita beralih ke topik berikutnya, yaitu apa sebenarnya analisis
data besar. Di mana kita akan mendefinisikan apa sebenarnya analisis data besar, setelah itu
kita akan melihat jenis alat apa saja yang ada. diperlukan untuk analisis data besar,
selanjutnya kita akan menjelajahi berbagai domain dan kasus penggunaan yang Anda ketahui
menggunakan analisis data besar dan terakhir saya akan mengakhiri sesi ini dengan
menceritakan tentang berbagai tren yang lazim di bidang analisis data besar jadi sekarang
tanpa basa-basi mari kita lanjutkan ke topik pertama kita di sesi ini yaitu mengapa analisis
data besar [Musik] jadi teman-teman mengapa menurut Anda analisis data besar itu sangat
penting dan mengapa menurut Anda kita perlu mempelajari topik ini atau kita harus tahu apa
sebenarnya itu, jadi sekarang izinkan saya memberi tahu Anda alasannya, seperti seluruh
alam semesta di galaksi kita yang dikatakan telah membentuk Anda hingga ledakan Big
Bang, data juga telah tumbuh secara eksponensial yang mengarah pada ledakan data, jadi ini
dapat dengan mudah disebut sebagai data besar dan Anda tahu bahwa kita menghasilkan
sekitar 2,5 triliun byte data setiap hari dan satu triliun berjumlah sekitar 10 dipangkatkan 18
byte sehingga Anda dapat menghitung dan membayangkan jumlah data yang kita miliki.
yang dibuat setiap hari dan data ini seperti yang Anda lihat dari gambar yang saya
perdebatkan Anda datang dari berbagai sumber baik itu dari media sosial, dari sektor
perbankan, dari pemerintah dari berbagai lembaga lain, oke dan data ini tidak ada di format
yang sama jadi berasal dari berbagai sumber jadi dalam format yang berbeda-beda jadi
sekarang guys menurut kalian apa itu Big Data hanya sebatas volume atau jumlah besar yang
dihasilkan atau ditentukan dengan berbagai karakteristik lain yang kalian tahu definisikan
secara tepat apa itu Big Data, jadi mari kita lihat apa saja karakteristik berbeda yang terkait
dengan Big Data, jadi di sini saya telah mewakili lima karakteristik tersebut, jadi yang
pertama adalah volume, jadi volume tidak lain adalah sejumlah besar data yang dihasilkan
atau sejumlah besar data. data seperti yang kita lihat sebelumnya di bagian bagaimana data
masuk dari berbagai sumber seperti media sosial, sektor perbankan, pemerintah, dll. Jadi
volume inilah yang sekarang beralih ke karakteristik berikutnya yaitu variasi sehingga variasi
tidak lain adalah format data yang berbeda dari masuk dari berbagai sumber maka big data
mempunyai tiga format yang berbeda satu adalah tatanan terstruktur, semi terstruktur dan
kemudian tidak terstruktur jadi apa itu data terstruktur jadi data terstruktur pada dasarnya
berbentuk database relasional yang berbentuk tabel yang memiliki baris dan kolom datang ke
data tidak terstruktur jadi data tidak terstruktur dalam bentuk file audio, file video, gambar,
dll. Sekarang menjadi data semi terstruktur jadi data semi terstruktur dalam bentuk JSON
dalam file XML jadi ini adalah format dasar data yang Anda ketahui sekarang. ke
karakteristik berikutnya yaitu nilai jadi nilai tidak lain adalah memperoleh data yang berarti
dari seluruh kumpulan data besar ini jadi karakteristik berikutnya yang kami nyatakan di sini
adalah kecepatan jadi kecepatan tidak lain adalah laju di mana data dihasilkan sekarang
menjadi kecepatan jadi kebenaran adalah ketidakkonsistenan dan ketidakpastian yang ada
dalam data jadi ini adalah lima cara dasar data besar tetapi V ini terus berkembang seiring
dan ketika data akan tumbuh selama periode waktu tertentu, jadi saya telah menghentikannya
alasan di sini untuk memberi tahu Anda mengapa sangat penting bagaimana hal ini
membantu banyak organisasi di seluruh dunia. Jadi alasan pertama yang saya nyatakan di sini
adalah untuk menjadikan organisasi lebih cerdas dan efisien sehingga analisis data besar pada
dasarnya berkontribusi besar terhadap faktor-faktor ini. dan organisasi-organisasi mengadopsi
hal ini untuk mengarahkan mereka pada pengambilan keputusan yang lebih cepat, jadi salah
satu contoh yang saya tahu ingin saya bagikan kepada kalian adalah tentang Departemen
Kepolisian New York, singkatnya NYPD, jadi data dan analitiknya sangat besar. membantu
NYPD dan departemen kepolisian besar lainnya untuk mengantisipasi dan mengidentifikasi
aktivitas kriminal sebelum terjadi sehingga yang mereka lakukan adalah menganalisis seluruh
teknologi Big Data untuk melakukan geolokasi dan kemudian menganalisis pola sejarah dan
memetakan pola sejarah ini dengan acara olahraga kacang polong. hari hujan turun arus lalu
lintas dan hari libur federal jadi pada dasarnya apa yang dilakukan NYPD adalah
menggunakan alat teknologi analisis ilmiah pola data ini untuk melakukan tugasnya dan
mereka memastikan bahwa dengan menggunakan alat yang berbeda ini mereka melakukan
tugasnya dengan sebaik-baiknya. kemampuan mereka sehingga dengan menggunakan strategi
data dan analitik yang besar NYPD dapat mengidentifikasi sesuatu yang disebut hotspot
kejahatan jadi pada dasarnya di tempat yang lebih banyak terjadi kejahatan sehingga mereka
dapat mengidentifikasi hotspot tersebut dan kemudian dari sana mereka mengerahkan petugas
lokalnya sehingga mereka dapat mencapainya. ada tepat waktu sebelum hal itu benar-benar
dilakukan jadi beginilah NYPD pada dasarnya memanfaatkan seluruh bidang analisis data
besar yang Anda tahu sehingga mereka dapat mencegah kejahatan dan menjadikan New York
tempat yang lebih aman jadi sekarang setelah menjelajahi alasan pertama, mari beralih ke
alasan kedua alasan dan lihat apa alasan kedua di sini adalah untuk mengoptimalkan operasi
bisnis dengan menganalisis perilaku pelanggan contoh terbaik untuk ini karena Amazon kita
semua tahu seberapa populer Amazon dan seberapa banyak kita menggunakannya setiap hari
sehingga Amazon pada dasarnya menggunakan aliran klik kita data yaitu pelanggan sehingga
mereka menggunakan data aliran klik kami dan data pembelian historis lebih dari 300 juta
pelanggan yang Anda tahu mendaftar ke Amazon dan kemudian mereka menganalisis data
setiap pengguna bagaimana mereka mengklik produk yang berbeda dan bagaimana navigasi
melalui produk mereka situs jadi pada dasarnya mereka menunjukkan hasil yang disesuaikan
kepada setiap pengguna pada halaman web yang disesuaikan sehingga setelah menganalisis
semua klik dari setiap pengunjung di situs web mereka, mereka dapat lebih memahami
perilaku navigasi situs mereka, jalur yang diambil orang untuk membeli produk dan layanan
mereka dan apa lain yang dilihat pelanggan saat membeli produk itu dan juga jalur yang
mengarahkan pelanggan meninggalkan halaman mereka jadi informasi ini pada dasarnya
membantu Amazon untuk meningkatkan pengalaman pelanggan mereka dan karenanya
memperluas basis pelanggan mereka jadi mari kita lihat apa alasan ketiga sekarang begitu
Besar Teknologi data seperti Hadoop dan oolitic berbasis cloud pada dasarnya akan
mengurangi biaya Anda secara signifikan untuk penyimpanan data besar karena untuk
menyimpan data besar jika Anda membeli seperti toko besar dan Anda tahu mesin besar
maka itu akan menghabiskan banyak biaya, jadi dengan menggunakan Hadoop teknologi jadi
apa yang dilakukan Hadoop pada dasarnya menyimpan data besar secara terdistribusi
sehingga Anda dapat memprosesnya secara paralel sehingga mengurangi banyak biaya
sehingga dengan menggunakan Perangkat Keras komoditas mereka mengurangi biayanya
secara signifikan sehingga membawa kita ke alasan ketiga yang harus Anda miliki telah
mengukur alasan ketiga dari Pengurangan Biaya, jadi sekarang mari kita lihat bagaimana
layanan kesehatan menggunakan analitik data besar untuk membatasi biaya mereka sehingga
menggunakan alat data baru yang menyinkronkan peringatan otomatis ketika pasien
dijadwalkan untuk imunisasi atau tugas laboratorium, semakin banyak dokter yang dapat
menguranginya. rawat inap dengan mempraktikkan perawatan pencegahan yang lebih baik
sehingga Anda tahu pasien mulai menggunakan perangkat sensor baru ini di rumah dan di
perjalanan sehingga perangkat sensor baru ini pada dasarnya Anda tahu memberikan aliran
data konstan yang dapat dipantau dan dianalisis secara real-time sehingga mereka membantu
pasien menghindari rawat inap dengan mengelola sendiri kondisi mereka sekarang untuk
pasien yang dirawat di rumah sakit, dokter dapat menggunakan analisis prediktif untuk
mengoptimalkan hasil dan kemudian mengurangi rawat inap sehingga Rumah Sakit Parkland
di Texas adalah salah satu contoh yang telah menggunakan analisis dan pemodelan prediktif
untuk mengidentifikasi penyakit-penyakit tinggi ini. pasien berisiko dan kemudian mereka
memprediksi kemungkinan hasil setelah pasien dipulangkan sehingga backlog dapat
mengurangi 30 hari penerimaan kembali ke Parkland dan semua rumah sakit di wilayah
tersebut untuk pasien Medicare dengan gagal jantung sekitar 31% sehingga untuk Parkland
itu Anda tahu perkiraan penghematan sebesar $500.000 per tahun dan tentu saja belum lagi
penghematan yang juga disadari oleh pasien dengan menghindari penerimaan kembali ini.
Jadi beginilah cara layanan kesehatan yang Anda tahu secara luas menggunakan analisis data
besar untuk mengurangi biaya mereka secara signifikan sekarang mari kita beralih ke lihat
alasan terakhir mengapa analisis data besar sangat penting sehingga alasan terakhir kami
adalah produk generasi berikutnya dan bagaimana analisis data besar benar-benar
berkontribusi untuk menghasilkan lebih banyak produk seperti Anda mengetahui produk
teknologi tinggi sehingga Anda tahu bagaimana kebutuhan pelanggan dapat dipenuhi dan
bagaimana mereka dapat menggunakan produk generasi baru ini untuk keuntungan mereka
sendiri, jadi saya telah mengutip tiga contoh di sini untuk kalian. Jadi contoh pertama di sini
adalah mobil self-driving Google. Saya yakin sebagian besar dari kalian pasti pernah
mendengarnya. apa yang pada dasarnya dilakukan oleh mobil self-driving Google adalah ia
membuat jutaan kalkulasi di setiap perjalanan yang membantu mobil memutuskan kapan dan
ke mana harus berbelok apakah akan memperlambat atau mempercepat dan kapan harus
berpindah jalur sehingga keputusan yang sama diambil oleh pengemudi manusia di belakang.
Roda Mobil self-driving Google juga melakukan hal itu dengan bantuan analisis data besar.
Contoh lain dari mobil self-driving yang dijual adalah Toyota Prius yang dilengkapi dengan
kamera GPS serta komputer dan sensor yang kuat untuk berkendara dengan aman di jalan
tanpa pengemudi. campur tangan manusia jadi beginilah cara Anda mengetahui kontribusi
awal untuk membuat produk-produk berteknologi tinggi yang dalam jangka panjang kita
akan menggunakan probabilitas dan itu akan membuat hidup kita lebih mudah sekarang
beralih ke produk kedua Ramudu di sini jadi ini produk yang sangat menarik izinkan saya
mengajukan pertanyaan kepada Anda berapa banyak dari Anda semua yang suka menonton
acara TV dan berapa banyak dari Anda yang lebih suka menghabiskan akhir pekan tanpa
melakukan apa pun dengan Netflix dan santai saja um izinkan saya menebak hampir semua
dari kita, maksud saya, saya suka menonton acara secara berlebihan selama akhir pekan jadi
saya tahu sekarang Anda pasti sudah menebak satu contoh yang akan saya datangi, jadi ini
adalah Netflix, jadi Netflix berkomitmen untuk dua musim acaranya yang sangat populer,
bagaimana kartu keraguan bahkan melihat satu episode dari acara tersebut tunjukkan
kawan-kawan dan proyek kalian tahu rumah kartu dua musim ini menghabiskan biaya Netflix
sekitar 100 juta dolar, jadi kawan-kawan, bagaimana menurut kalian Netflix bisa mengambil
risiko besar secara finansial jadi jawabannya teman-teman adalah analisis data besar jadi
dengan menganalisis data penonton, perusahaan dapat menentukan bahwa para penggemar
house of card asli yang ditayangkan di Inggris, mereka juga menonton film yang dibintangi
oleh Kevin Spacey yang berperan sebagai pemeran utama dalam show house of cards dan
mereka diarahkan oleh David Fincher yang juga salah satu produser eksekutif acara tersebut,
jadi pada dasarnya Netflix menganalisis semuanya, mulai dari acara apa yang Anda tonton
saat Anda menjedanya atau hingga acara apa pun saat Anda mematikannya, jadi tahun lalu
Netflix meningkatkan basis pelanggan kami sekitar 10% dan kemudian mereka
menambahkan hampir 20 juta pelanggan dari seluruh dunia jadi betapa menariknya maksud
saya ini brilian. Saya yakin lain kali kalian menonton acara saya di Netflix, kalian akan
sangat senang karena kalian sudah tahu caranya backend berfungsi dalam cara Netflix
merekomendasikan acara dan film baru kepada Anda, jadi sekarang beralih ke contoh ketiga
yang saya kutip di sini, jadi ini adalah salah satu hal keren yang pernah saya temui, jadi ini
matras yoga yang cerdas sekarang ini memiliki sensor yang tertanam di matras yang akan
dapat memberikan umpan balik pada poster Anda, menilai latihan Anda dan bahkan
memandu Anda melalui latihan di rumah sehingga pertama kali Anda menggunakan matras
pintar, Anda akan dibawa melalui serangkaian gerakan untuk mengkalibrasi ukuran bentuk
tubuh dan batasan pribadi Anda sehingga informasi profil pribadi Anda ini kemudian
disimpan ke dalam aplikasi matras pintar Anda dan ini akan membantu matras pintar
mendeteksi ketika Anda tidak sejajar atau seimbang sehingga seiring waktu akan secara
otomatis berkembang dengan data yang diperbarui sebagai Anda meningkatkan latihan yoga
Anda jadi sekarang saya yakin dengan ini Anda tahu contoh-contoh yang sangat menarik dan
mengasyikkan. Saya punya gambaran apa sebenarnya yang dilakukan analisis data besar
dalam meningkatkan berbagai organisasi di sektor penjualan dan pemasaran mereka jadi
sekarang mari kita bergerak maju dan akhirnya Anda tahu secara formal mendefinisikan apa
itu analisis data besar jadi inilah apa yang dimaksud dengan analisis data besar analisis data
besar memeriksa jenis data yang besar dan berbeda untuk mengungkap korelasi pola
tersembunyi dan wawasan lainnya jadi pada dasarnya apa yang dilakukan analisis data besar
adalah membantu perusahaan-perusahaan besar untuk memfasilitasi pertumbuhan dan
perkembangan mereka sehingga hal ini terutama melibatkan penerapan berbagai algoritma
penambangan data pada kumpulan data tertentu yang kemudian akan membantu
organisasi-organisasi ini dalam membuat keputusan yang lebih baik sehingga sekarang Anda
tahu mengapa kita memerlukan analisis data besar, apa sebenarnya data besar itu? analitik
sekarang Anda cukup melihat dan menjelajahi tahapan-tahapan apa saja yang terlibat dalam
prosedur analisis data epik ini, jadi ini adalah tahapan-tahapan berbeda yang terlibat dalam
keseluruhan prosedur ini, jadi tahap pertama adalah mengidentifikasi masalahnya, jadi apa
masalahnya? Tentu saja perlu menyelesaikan ini adalah langkah yang paling penting dan ini
adalah langkah pertama dari proses tersebut. Langkah kedua adalah merancang kebutuhan
data kita jadi tentu saja setelah mengidentifikasi masalah kita perlu memutuskan jenis data
apa yang diperlukan untuk menganalisis masalah khusus ini. masalah langkah ketiga adalah
pra-pemrosesan jadi pada langkah pra-pemrosesan pada dasarnya pembersihan data terjadi
dan Anda melakukan semacam pemrosesan sekarang setelah tahap pemrosesan kita sampai
pada tahap keempat yang merupakan tahap analitik jadi dalam tahap ini Anda akan
melakukannya pada dasarnya menganalisis data proses menggunakan berbagai metode
setelah tahap analitik kita akan melanjutkan ke tahap akhir yaitu visualisasi data jadi dalam
tahap visualisasi data pada dasarnya Anda akan memvisualisasikan data menggunakan alat
seperti tab di bawah ini Angularjs tetapi visualisasi data hanya akan terjadi pada akhirnya jadi
ini adalah lima tahapan dasar dalam keseluruhan prosedur ini. Sekarang setelah Anda
memahaminya, mari kita lanjutkan dan pahami apa saja jenis-jenis analisis data besar.
[Musik] ada empat tipe dasar, yang pertama adalah analisis deskriptif, yang kedua adalah
analitik prediktif, ketiga adalah analitik preskriptif, dan keempat adalah analitik diagnostik,
jadi mari kita pahami jenis pertama yaitu analitik deskriptif, analitik deskriptif pada dasarnya
menjawab pertanyaan Anda, apa yang terjadi dan bagaimana analitik deskriptif menjawab
pertanyaan ini, ia menggunakan agregasi data dalam teknik penambangan data untuk
menyediakannya. wawasan ke masa lalu dan kemudian menjawab apa yang terjadi sekarang
berdasarkan data yang masuk jadi pada dasarnya analitik deskriptif persis seperti namanya
menggambarkan semua ringkasan adalah data mentah dan menjadikannya sesuatu yang dapat
ditafsirkan oleh manusia dan masa lalu yang saya yang baru saja disebutkan dalam konteks
ini pada dasarnya bisa terjadi satu menit yang lalu atau bahkan beberapa tahun yang lalu, jadi
contoh terbaik yang dapat saya kutip di sini untuk analisis deskriptif pada dasarnya adalah
alat analisis Google, jadi Google Analytics pada dasarnya membantu organisasi atau bisnis
yang berbeda dengan menganalisis hasil mereka melalui Alat Google Analytics sehingga
hasil yang membantu bisnis memahami apa yang sebenarnya terjadi di masa lalu dan
kemudian mereka mengevaluasi apakah kampanye promosi berhasil atau tidak berdasarkan
parameter dasar seperti tampilan halaman, jadi pada dasarnya analisis deskriptif adalah hal
yang penting bagi Seoul untuk menentukan apa yang harus dilakukan. lakukan selanjutnya
contoh lainnya adalah apa yang kita lihat sebelumnya pada produk generasi baru yaitu
Netflix, jadi Netflix pada dasarnya menggunakan analisis deskriptif seperti yang saya katakan
kepada kalian untuk menemukan korelasi di antara berbagai film yang ditonton pelanggan
dan untuk meningkatkan mesin rekomendasi yang mereka gunakan historis data penjualan
dan pelanggan jadi inilah yang dimaksud dengan analitik deskriptif sekarang mari kita beralih
ke tipe kedua yaitu analitik prediktif jadi tipe kedua yaitu analitik prediktif pada dasarnya
menggunakan model statistik dan teknik fokus untuk memahami masa depan dan menjawab
apa yang bisa terjadi pada dasarnya sebagai kata tersebut menyiratkan bahwa ia
memprediksikan bahwa kita dapat memahami melalui analitik prediktif bahwa apa saja hasil
yang berbeda di masa depan. Jadi pada dasarnya analitik prediktif memberi perusahaan
wawasan yang dapat ditindaklanjuti berdasarkan data sehingga melalui sensor dan data yang
dihasilkan mesin lainnya, perusahaan dapat mengidentifikasi kapan kemungkinan terjadinya
malfungsi. terjadi sehingga perusahaan dapat memesan suku cadang terlebih dahulu dan Prem
melakukan perbaikan untuk menghindari downtime dan kerugian jadi contoh analisis jenis ini
adalah Southwest Airlines jadi Psaltis menganalisis data sensor mereka di pesawat untuk
mengidentifikasi potensi malfungsi atau masalah keselamatan jadi pada dasarnya hal ini
memungkinkan maskapai penerbangan untuk mengatasi masalah yang mungkin terjadi dan
kemudian melakukan perbaikan tanpa mengganggu penerbangan atau membahayakan
penumpang. Ini adalah kegunaan yang sangat baik dari analisis prediktif yang Anda ketahui
tentang bagaimana pada dasarnya mengurangi waktu henti dan kerugian mereka dan juga
Anda tahu mencegah penundaan dan berbagai faktor lain seperti kecelakaan jadi sekarang
mari kita beralih ke alasan ketiga yaitu analitik preskriptif analitik preskriptif menggunakan
algoritma pengoptimalan dan simulasi untuk memberi saran tentang hasil yang mungkin
terjadi dan menjawab pertanyaan apa yang harus kita lakukan sehingga pada dasarnya ini
memungkinkan pengguna untuk menentukan nomor tindakan yang berbeda-beda dan
kemudian membimbing mereka menuju solusi sehingga singkatnya narasi ini adalah tentang
memberikan saran sehingga analisis preskriptif yang mereka gunakan Anda mengetahui
kombinasi teknik dan alat seperti aturan bisnis, algoritme, pembelajaran mesin, dan prosedur
pemodelan komputasi, lalu teknik-teknik ini diterapkan terhadap masukan dari berbagai
kumpulan data termasuk data historis dan transaksional, umpan data real-time, dan kemudian
Big Data sehingga analisis ini melampaui analisis deskriptif dan prediktif dengan
merekomendasikan satu atau lebih kemungkinan tindakan dan contoh terbaik untuk hal ini
adalah Google mobil self-driving contoh ini juga sudah kita lihat di bagian produk generasi
baru jadi pada dasarnya mobil self-driving Google menganalisis lingkungan dan kemudian
memutuskan arah yang akan diambil berdasarkan data sehingga memutuskan apakah akan
memperlambat atau mempercepat perubahan. jalur atau tidak mengambil jalan pintas untuk
menghindari lalu lintas atau lebih memilih rute pendek dll. Jadi dengan cara ini fungsinya
seperti pengemudi manusia dengan menggunakan analisis data dalam skala besar, bukan
analisis preskriptif adalah jenis analisis yang sedikit rumit dan belum diadopsi oleh semua
perusahaan, namun bila diterapkan dengan benar, hal ini dapat berdampak besar pada cara
bisnis mengambil keputusan, jadi sekarang mari kita beralih ke waktu terakhir kita yaitu
analisis diagnostik sehingga analisis diagnostik digunakan untuk menentukan mengapa
sesuatu terjadi di masa lalu sehingga memang demikian. ditandai dengan teknik seperti
penelusuran data, penggalian data, dan korelasi dengan analitik diagnostik. Dibutuhkan
pandangan yang lebih dalam pada data untuk memahami akar penyebab peristiwa. Sangat
membantu dalam penggalian data, faktor dan peristiwa seperti apa yang berkontribusi
terhadap hasil tertentu sehingga sebagian besar ini menggunakan probabilitas, kemungkinan,
dan distribusi data untuk analisisnya, jadi misalnya dalam data penjualan deret waktu, analisis
agnostik akan membantu Anda memahami mengapa penjualan suatu perusahaan mengalami
penurunan atau peningkatan pada tahun tertentu dan seterusnya, jadi contoh untuk analisis
diagnostik bisa menjadi kampanye pemasaran media sosial sehingga Anda dapat
menggunakan analisis diagnostik untuk menilai jumlah posting menyebutkan pengikut
penggemar tampilan halaman ulasan pena dan sebagainya dan kemudian Anda dapat
menganalisis kegagalan dan tingkat keberhasilan kampanye pada tingkat mendasar sehingga
oleh karena itu mereka bisa berupa ribuan sebutan online yang dapat disaring menjadi satu
tampilan untuk melihat apa yang berhasil di kampanye Anda sebelumnya dan apa yang tidak,
jadi sekarang kita telah melihat keempat jenis tersebut. Saya harap Anda memahami berbagai
contoh berbeda dari keempatnya jenis perbedaan di antara keduanya sekarang mari kita
bergerak maju dan melihat alat-alat yang diperlukan untuk analisis data besar jadi ini adalah
beberapa alat yang telah saya cantumkan di sini. Ada lebih banyak alat yang digunakan untuk
analisis data besar tetapi lain jelajahi yang telah saya sebutkan jadi izinkan saya memberi
nama mereka Hadoop pilih Apache HBase Apache spark Thailand Splunk Apache hive
Kafka jadi sekarang izinkan saya mulai dengan yang pertama yaitu Hadoop jadi Hadoop pada
dasarnya adalah kerangka kerja yang memungkinkan Anda menyimpan data besar secara
terdistribusi sehingga Anda dapat memprosesnya secara induk. Apache pick adalah platform
yang banyak digunakan untuk menganalisis kumpulan data besar dan kemudian mewakili
kumpulan data ini sebagai aliran data jadi pada dasarnya Pig digunakan untuk skrip dan
bahasanya adalah pig latin yang sekarang hadir CAF Carso Kafka adalah sistem perpesanan
sekarang guys Apa itu sistem perpesanan? Sistem gulat pada dasarnya adalah sesuatu yang
bertanggung jawab untuk mentransfer data dari satu aplikasi ke aplikasi lainnya sehingga
aplikasi dapat fokus pada data dan tidak perlu khawatir tentang cara berbagi. jadi inilah yang
dilakukan Kafka sekarang di Apache hai sekarang Apache hive adalah alat pergudangan data
sehingga memungkinkan kita melakukan analisis data besar menggunakan bahasa kueri hive
yang mirip dengan sekuel yang akan hadir di Splunk jadi Splunk adalah alat analisis log
sekarang apa adalah log sehingga log dihasilkan pada komputasi maupun non-komputasi
yang memecah belah dan disimpan di lokasi atau direktori tertentu sehingga berisi detail
tentang setiap transaksi atau operasi yang telah Anda lakukan sehingga Nexus Thailand
Thailand adalah integrasi perangkat lunak sumber terbuka platform yang membantu Anda
menganalisis dengan mudah dan kemudian mengubah data menjadi wawasan bisnis sehingga
membantu perusahaan dalam mengambil keputusan secara real-time dan menjadi lebih
berbasis data. Berikutnya adalah Apache spark jadi party spark adalah mesin pengolah data
dalam memori yang memungkinkan kita untuk mengeksekusi pembelajaran mesin Freeman
dan beban kerja SQL secara efisien dan memerlukan pertukaran akses yang cepat ke
kumpulan data jadi pada dasarnya ini digunakan untuk pemrosesan waktu nyata sekarang
berpindah ke yang terakhir yaitu Apache HBase sehingga pihak HBase adalah database tanpa
sekuel yang memungkinkannya Anda dapat menyimpan data tidak terstruktur dan
semi-terstruktur dengan mudah dan menyediakan akses baca atau tulis waktu nyata, jadi ini
adalah alat yang dapat saya daftarkan dan saya juga telah memberi tahu Anda tentang
berbagai fungsi secara singkat yang dijalankannya [Musik] jadi sekarang Saya harus bergerak
maju dan menjelajahi berbagai jenis domain yang Anda tahu menggunakan analisis data
besar, jadi ini adalah beberapa domain yang telah saya daftarkan agar Anda dapat memahami
bagaimana mereka menggunakan analisis data besar dan seberapa luas penggunaannya.
digunakan dalam berbagai jenis domain sehingga layanan kesehatan yang telah kita bahas
sebelumnya telah menggunakan analisis data besar untuk mengurangi biaya, memprediksi
epidemi, menghindari penyakit yang dapat dicegah, dan kemudian meningkatkan kualitas
hidup secara umum sehingga salah satu penerapan data besar yang paling luas di layanan
kesehatan adalah catatan kesehatan elektronik yaitu EHR. Saya yakin sebagian besar dari
Anda pasti pernah mendengarnya. Ini pada dasarnya menyimpan seluruh data pasien yang
sekarang masuk ke industri telekomunikasi sehingga industri telekomunikasi adalah salah
satu kontributor paling signifikan terhadap data besar sehingga industri telekomunikasi pada
dasarnya menganalisis semua data panggilan kami dicatat secara real time dan kemudian
mereka mengidentifikasi perilaku penipuan dan segera menindaklanjutinya. Sekarang divisi
pemasaran industri telekomunikasi pada dasarnya memodifikasi kampanye mereka untuk
menargetkan pelanggannya dengan lebih baik dan kemudian menggunakan wawasan yang
diperoleh mereka untuk mengembangkan produk baru. dan layanan yang diberikan kepada
perusahaan asuransi sehingga perusahaan asuransi menggunakan analisis big data untuk
penilaian risiko, deteksi penipuan, pemasaran, wawasan pelanggan, pengalaman pelanggan,
dan masih banyak lagi. Sekarang pemerintah di seluruh dunia juga mengadopsi analisis big
data, misalnya pemerintah India yang telah menggunakan analisis big data untuk
mendapatkan solusi. perkiraan perdagangan di suatu negara sehingga para ekonom
menggunakan pajak penjualan pusat dan suara perdagangan antara dua negara untuk
memperkirakan sejauh mana negara-negara tersebut melakukan perdagangan antara satu
sama lain yang datang ke bank dan bentuk keuangan sekarang bank dan perusahaan jasa
keuangan mereka menggunakan analisis untuk membedakan interaksi penipuan dari transaksi
bisnis yang sah sehingga dengan menerapkan analitik dan pembelajaran mesin mereka dapat
menentukan aktivitas normal pengguna atau pelanggan berdasarkan riwayat mereka dan
kemudian membedakannya dari perilaku tidak biasa yang mengindikasikan penipuan
sehingga sistem analisis yang mereka sarankan tindakan segera seperti memblokir transaksi
tidak teratur yang menghentikan penipuan sebelum terjadi dan meningkatkan profitabilitas
kini beralih ke domain berikutnya yaitu mobil sehingga banyak perusahaan mobil
menggunakan analisis data besar dan salah satu contohnya adalah Rolls Royce sehingga Rolls
Royce menggunakan data besar dengan memasang ratusan sensor ke dalam mesin dan sistem
propulsinya dan sensor ini pada dasarnya mengingat setiap detail kecil tentang pengoperasian
mesin dan sistem propulsi tersebut sehingga perubahan dalam data secara real-time
dilaporkan kepada para insinyur yang kemudian akan memutuskan yang terbaik. tindakan
seperti penjadwalan atau pemeliharaan atau pengiriman tim teknik jika masalah muncul
sekarang domain berikutnya adalah pendidikan sehingga pendidikan adalah salah satu bidang
di mana analisis data besar diadopsi secara perlahan dan bertahap, namun sangat penting bagi
kita untuk memanfaatkan analisis data besar di bidang ini karena dengan memilih teknologi
kekuatan data besar yang Anda tahu sebagai alat pembelajaran daripada metode ceramah
tradisional, kita dapat meningkatkan pembelajaran siswa serta dapat membantu guru untuk
melacak kinerja dengan cara yang lebih baik sekarang datang ke domain terakhir yaitu ritel,
jadi ritel mencakup e-commerce dan toko-toko dan mereka secara luas menggunakan data
besar dan analitik untuk mengoptimalkan strategi bisnis mereka, jadi kita sudah mulai dengan
contoh Amazon, jadi sekarang kita sudah menjelajahi berbagai domain, mari saya tunjukkan
kasus penggunaan yang saya ambil di sini untuk menjelaskan kepada Anda tentang seberapa
besar analisis data besar digunakan secara luas. Sekarang telah digunakan untuk kasus
penggunaan tersebut. Kasus penggunaan pertama adalah Starbucks sehingga jaringan kedai
kopi terkemuka memanfaatkan analisis perilaku dengan mengumpulkan data tentang
kebiasaan pembelian pelanggannya untuk mengirimkan iklan yang dipersonalisasi dan
penawaran terbuka ke telepon seluler pelanggan sehingga perusahaan juga mengidentifikasi
tren yang menunjukkan apakah pelanggan kehilangan minat pada produk mereka dan
kemudian penawaran langsung khusus kepada pelanggan tersebut untuk regenerasi minat
mereka jadi saya menemukan artikel dari Fox yang melaporkan bagaimana Starbucks
memanfaatkan data besar untuk menganalisis preferensi pelanggan mereka guna
meningkatkan dan mempersonalisasi pengalaman mereka sehingga mereka menganalisis
Anda mengetahui kebiasaan membeli kopi setiap anggota beserta cincin pilihan mereka - jam
berapa pada hari mereka biasanya memesan sehingga bahkan ketika orang mengunjungi
lokasi baru Starbucks, sistem tempat penjualan toko dapat mengidentifikasi pelanggan
melalui ponsel cerdas mereka dan kemudian barista memberi mereka pesanan pilihan mereka
sehingga juga berdasarkan preferensi pemesanan mereka aplikasi yang merupakan aplikasi
Starbucks akan menyarankan produk baru yang mungkin menarik untuk dicoba oleh
pelanggan, jadi beginilah cara Starbucks pada dasarnya mengoptimalkan strategi bisnis
mereka dan meningkatkan serta pada dasarnya meningkatkan basis pelanggan mereka.
Sekarang mari kita lanjutkan dan lihat kasus penggunaan kedua yang mana Saya ingin
berbagi dengan kalian kasus penggunaan kedua adalah PNG Procter & Gamble sehingga
Procter & Gamble menggunakan analisis Keranjang Pasar dan pengoptimalan harga untuk
mengoptimalkan produk mereka sehingga analisis keranjang pasar menganalisis kebiasaan
membeli pelanggan dengan menemukan hubungan antara berbagai item yang pelanggan
tempatkan di keranjang belanja mereka jadi inilah yang sebenarnya dilakukan oleh analisis
keranjang pasar, selain dari ini analisis keranjang pasar dapat dilakukan pada data ritel
transaksi pelanggan di toko Anda sehingga toko-toko seperti Target Walmart dan sebagainya
mereka menggunakan analisis keranjang pasar untuk pada dasarnya meningkatkan belanja
mereka. penjualan dan pemasaran sehingga Anda kemudian dapat menggunakan hasilnya
untuk merencanakan pemasaran dan mengiklankan strategi Anda atau bahkan merancang
katalog baru, misalnya analisis keranjang pasar dapat membantu Anda merancang tata letak
toko yang berbeda dalam satu strategi, item yang sering dibeli bersama dapat ditempatkan di
dekat kedekatan untuk lebih mendorong untuk menggabungkan penjualan barang-barang
tersebut jadi contoh saya pergi ke toko dan ingin membeli roti maka saya juga Anda tahu
situs mentega jadi saya akan pergi membeli mentega juga jadi begitulah cara Anda tahu toko
mengoptimalkannya penjualan jadi mereka menempatkan semua produk ini seperti roti
mentega, telur susu, di dekat mereka karena mereka tahu ketika pelanggan datang untuk
membeli roti, mereka mungkin juga ingin membeli mentega atau susu atau telur oke jadi ini
adalah salah satu contohnya jadi bagaimana PNG pada dasarnya memanfaatkannya adalah
perusahaan menggunakan model simulasi dan analisis prediktif untuk menciptakan desain
terbaik untuk produknya sehingga membuat dan memilah ribuan iterasi untuk
mengembangkan desain terbaik misalnya untuk popok sekali pakai dan kemudian
menggunakan analisis prediktif untuk menentukan seberapa lembab mempengaruhi molekul
wewangian dalam sebuah piring sehingga jumlah wewangian yang keluar pada saat yang
tepat selama proses pencucian piring Maksud saya jadi kita bahkan tidak dapat
membayangkan bahwa produk sederhana seperti sabun cuci piring juga memiliki begitu
banyak proses pemikiran di baliknya dan juga memiliki begitu banyak strategi atau Anda
tahu analitik yang diterapkan di belakangnya, jadi saya harap Anda menemukan kedua kasus
penggunaan ini sangat menarik dan semakin banyak perusahaan seperti itu yang
memanfaatkan analisis data besar dengan cara yang lebih mahir untuk meningkatkan
penjualan mereka. dan pemasaran [Musik] sekarang setelah melihat kasus penggunaan mari
kita lanjutkan dan lihat topik terakhir kita untuk diskusi ini yaitu tren dalam analisis data
besar jadi pada dasarnya keseluruhan gambar ini menggambarkan statistik untuk
pertumbuhan pendapatan pasar data besar dalam miliaran AS dolar dari tahun 2011 hingga
tahun 2027 jadi di era saat ini yaitu tahun 2018 seperti yang kalian lihat, pendapatan pasar big
data saat ini adalah sekitar 42 miliar dolar AS dan akan meningkat secara eksponensial
menjadi sekitar 103 miliar dolar AS. dolar pada tahun 2027 yang merupakan jumlah yang
sangat besar jadi sekarang mari kita maju dan melihat yang berikutnya yaitu fakta dan
statistik dari Forbes jadi saya telah mengumpulkan beberapa di antaranya sehingga menurut
saya sangat menarik dan saya ingin berbagi dengan kalian jadi yang pertama di sini pada
dasarnya menyatakan bahwa hampir 50% responden survei analitik McKinsey baru-baru ini
mengatakan bahwa analitik dan data besar telah mengubah praktik bisnis secara mendasar
dalam fungsi penjualan dan pemasarannya, jadi kami juga telah melihat contohnya seperti
yang Anda tahu seperti di Starbucks PNG atau Amazon jadi perusahaan-perusahaan inilah
yang merespons survei-survei tersebut. Sekarang survei berikutnya menunjukkan bahwa
aplikasi dan analisis big data diproyeksikan akan tumbuh dari sekitar 5,3 miliar dolar pada
tahun 2018 menjadi sembilan belas koma empat miliar dolar pada tahun 2026 yang mencapai
sekitar agregat gabungan lima belas koma empat sembilan persen jadi yang berikutnya di sini
adalah fakta atau statistik yang sangat penting yang saya temukan dan pada dasarnya
membuka mata sehingga menurut aksen yang Anda pelajari 79 persen eksekutif perusahaan
setuju bahwa perusahaan yang tidak menerima big data akan kehilangan posisi kompetitifnya
dan bisa menghadapi kepunahan bahkan lebih dari delapan puluh tiga persen telah mengejar
proyek-proyek Big Data untuk melihat keunggulan kompetitifnya sehingga orang-orang yang
sangat gemuk ini memberi tahu Anda betapa pentingnya bidang ini dan apakah organisasi
khusus Anda atau perusahaan tidak mengadopsi analitik data besar di masa depan, hal ini
akan mengarah pada solusi operasi, jadi sekarang mari kita lihat fakta terakhir yang saya
nyatakan di sini sehingga menurut mitra ventura baru, data besar memberikan nilai paling
besar bagi perusahaan dengan mengurangi pengeluaran mereka sekitar 49,2% dan
menciptakan jalan baru untuk inovasi sekitar empat puluh empat koma tiga persen. Sebuah
contoh dari kedua fakta ini yang kita lihat di generasi baru mengapa kita memerlukan bagian
analisis data besar mungkin untuk berbicara tentang pengurangan biaya serta generasi baru
produk jadi ini contohnya jadi sekarang mari kita maju dan melihat prospek kurir di analitik
data besar jadi yang pertama pesanan Anda nyatakan di sini adalah ada permintaan yang
melonjak untuk profesional analitik sehingga profesional teknologi yang berpengalaman
dalam data besar analitik sangat diminati karena organisasi mencari cara untuk
mengeksploitasi kekuatan data besar sehingga terdapat lonjakan permintaan akan profesional
analitik dan ketika data akan bertambah, orang-orang seperti itu akan diminta untuk
menganalisis data tersebut sehingga membawa kita ke poin kedua, yaitu peluang kerja yang
sangat besar sehingga ada lebih banyak peluang kerja di bidang manajemen dan analitik data
besar dibandingkan tahun lalu dan banyak profesional TI yang siap menginvestasikan waktu
dan uang untuk pelatihan sehingga sekarang perusahaan-perusahaan di berbagai domain siap
untuk melakukan pelatihan. mengadopsi big data analytic jadi peluang kerja pasti lebih besar
jadi sekarang mari kita lihat apa aspek gajinya jadi menurut saya ini salah satu yang paling
penting lagi karena kita perlu tahu gaji seperti apa yang akan kita ambil jika menjadi seorang
profesional analitik data besar jadi 6 dan pekerjaan analitik dan ilmu data termasuk dalam
pintu kaca 50 pekerjaan terbaik di Amerika untuk tahun 2018 ini termasuk ilmuwan data
manajer analitik administrator basis data insinyur data analis data dan pengembang intelijen
bisnis dan gaji rata-rata dari keenamnya pekerjaan analitik yang baru saja saya nyatakan
bersama dengan pekerjaan ilmu data adalah sekitar $95.000 yang benar-benar luar biasa dan
ilmuwan data dinobatkan sebagai pekerjaan terbaik di Amerika selama sekitar tiga tahun
berturut-turut dengan gaji pokok rata-rata seratus sepuluh ribu dolar empat ribu lima seratus
dua puluh untuk lowongan pekerjaan Maksud saya betapa hebatnya sehingga kalian dapat
melihat betapa hebatnya prospek di bidang ini dan jika kalian tertarik maka kalian pasti harus
mempelajari lebih lanjut tentang bidang ini dan kalian tahu siapa yang tahu dan mungkin
Anda akan mendapatkan gaji sebesar itu, namun di India persentase profesional analitik yang
mendapat gaji kurang dari 10 lakh telah turun dan ini merupakan hal yang bagus sehingga
persentase profesional analitik yang berpenghasilan lebih dari 15 lakh telah meningkat dari
sekitar 17 persen pada tahun 2016 menjadi 21 lakh. persen pada tahun lalu 2017 dan saat ini
22,3% pada tahun 2018 ini sekarang izinkan saya memberi tahu Anda jenis pekerjaan apa
yang ada di bidang ini jadi yang pertama di sini adalah konsultan bisnis analisis data besar,
kedua adalah arsitek analisis data besar, ketiga adalah insinyur data besar keempat adalah
arsitek solusi data besar kelima adalah analis data besar keenam adalah rekanan analitik
ketujuh adalah konsultan intelijen dan analitik bisnis dan yang terakhir adalah spesialis
metrik dan analitik jadi saya baru saja menyatakan delapan di atas Anda sehingga ini
mungkin ditangani secara berbeda nama dan jabatan pekerjaan yang berbeda, Anda tahu dan
masih banyak lagi jabatan pekerjaan seperti itu. Saya singkat sehingga Anda dapat
menjelajahinya jadi sekarang mari kita lanjutkan untuk melihat keahlian apa yang Anda
perlukan jika Anda ingin menjadi seorang profesional analitik, jadi ini adalah beberapa
keahlian yang telah saya sebutkan di atas dan mungkin masih banyak lagi tergantung pada
peran yang akan Anda mainkan atau bahkan mungkin Anda tahu terbatas pada satu keahlian
tertentu jadi itu tergantung pada peran apa yang akan Anda mainkan di bidang ini. analisis
data besar jadi yang pertama adalah karena yang digunakan di sini adalah pemrograman dasar
sehingga Anda jelas diharapkan mengetahui semacam bahasa pemrograman tujuan umum.
Yang kedua di sini adalah analisis statistik dan kuantitatif jadi lebih baik jika Anda tahu
tentang statistik dan analisis kuantitatif sekarang beralih ke pergudangan data jadi
pengetahuan Anda tahu bahasa database sekuel dan tidak ada sekuel seperti MySQL dan
tidak ada sekuel memiliki MongoDB Apache HBase dan Cassandra jadi mengetahui database
ini juga sangat penting selanjutnya adalah visualisasi data yang adalah menurut saya salah
satu keahlian paling penting yang diperlukan sehingga sebagai profesional analitik, Anda
harus tahu cara memvisualisasikan data agar Anda tahu pada dasarnya meningkatkan bisnis
Anda sehingga Anda perlu tahu tren seperti apa yang akan ada di sana. data dan bagaimana
peningkatannya. Jenis wawasan apa yang akan diberikan oleh data ini kepada Anda sehingga
Anda harus dapat memvisualisasikan data tersebut. Anda harus dapat memahami apa yang
ditunjukkan oleh data tersebut. Yang berikutnya adalah pengetahuan bisnis yang spesifik jadi
ini sangat penting. menurut saya perlu karena jika analitik Anda profesional dan Anda tidak
tahu bisnis apa yang pada dasarnya dijalankan oleh perusahaan Anda dan Anda tidak
menyadarinya, Anda tidak akan dapat menerapkan pengetahuan Anda tentang analitik untuk
itu pada dasarnya meningkatkan penjualan dan pemasaran. perusahaan baik-baik saja jadi
pengetahuan bisnis perusahaan tertentu atau area yang sedang dikerjakan sangatlah penting
skala terakhir yang saya sebutkan di sini adalah kerangka komputasi jadi dari alat yang kita
bahas di bagian sebelumnya adalah diharapkan mengetahui setidaknya lebih dari satu jadi
jika Anda mengetahui Apache spark Hadoop Pig juga, sekali lagi itu tergantung pada peran
pekerjaan yang akan mereka mainkan, jadi penting bagi Anda untuk mengetahui setidaknya
satu atau lebih alat yang Anda sukai. tahu apa yang diperlukan untuk analisis data besar dan
satu atau dua kerangka komputasi seperti itu karena tentu saja akan membantu Anda dan
Anda akan memiliki pengetahuan dasar tentang bagaimana alat ini digunakan untuk
menganalisis data.

Anda mungkin juga menyukai