Anda di halaman 1dari 29

The Fundamental of Data Analysis

Data Analysis Series from Data Science & Data Analysis Path MySkill.id

Data Analisis adalah suatu proses pengumpulan, pengolahan, transformasi, penyajian ,

dan pemodelan data sehingga dapat mengetahui pola serta informasi yang terdapat di

dalam data.

Menganalisis data memiliki tujuan utama untuk memahami karakteristik data,

mengidentifikasi pola atau tren dalam data, menemukan hubungan antara variabel, dan
membuat prediksi atau kesimpulan yang dapat digunakan sebagai pendukung dalam

pengambilan keputusan.

4 Jenis Analisa Data

Berikut adalah jenis analisa data yang umum digunakan :

1. Analisa Deskriptif: merupakan jenis analisis yang digunakan untuk

menggambarkan karakteristik dan pola data dengan menggunakan statistik ( mean,


median, modus, dan standar deviasi) dari sebuah data linear.

Contoh : Apa upaya yang dilakukan masyarakat untuk mempertahankan

perekonomian mereka di tengah pandemi? hal ini dapat dijawab oleh data yang

menunjukan bahwa frekuensi masyarakat yang berjualan online meningkat dari

sebelumnya.

2. Analisa Diagnostik: merupakan jenis analisis yang digunakan untuk

mengidentifikasi penyebab atau faktor yang mempengaruhi suatu permasalahan atau

kejadian tertentu. Dengan tujuan utama untuk menentukan penyebab akar dari suatu
masalah dan menemukan solusi yang efektif untuk mengatasinya.

Analisis diagnostik dapat dilakukan dengan berbagai metode dan teknik, termasuk

analisis SWOT, analisis penyebab-akibat, analisis kegagalan, dan analisis Pareto.

Contoh : Dalam bisnis, analisis diagnostik dapat membantu manajer dalam

mengidentifikasi penyebab kinerja yang buruk, menemukan solusi untuk

meningkatkan efisiensi operasional, dan meningkatkan kepuasan pelanggan. Dalam


kesehatan, analisis diagnostik dapat membantu dokter dalam mengidentifikasi

penyebab suatu penyakit dan menentukan metode pengobatan yang paling efektif.

3. Analisa Prediktif : merupakan jenis analisis data yang digunakan untuk membuat

prediksi tentang kejadian atau hasil masa depan berdasarkan data historis atau saat ini.

Tujuan utama dari analisis prediktif adalah untuk membantu dalam membuat keputusan

yang lebih baik berdasarkan prediksi yang mungkin terjadi. Model ini dapat digunakan

untuk memprediksi peluang sukses dalam bisnis, risiko kredit, tingkat penjualan produk,
dan sebagainya.

Contoh : Dalam bisnis, analisis prediktif dapat membantu manajer dalam

mengidentifikasi peluang pasar baru, mengoptimalkan strategi pemasaran, dan

memperkirakan permintaan produk di masa depan.

4. Analisa Preskriptif : merupakan jenis analisis yang digunakan untuk memberikan

rekomendasi atau saran tindakan yang harus diambil untuk mencapai tujuan tertentu.

Tujuan utama dari analisis preskriptif adalah untuk mengambil keputusan yang lebih

baik berdasarkan pemahaman tentang dampak dari tindakan yang mungkin diambil.

Contoh : Dalam kesehatan, analisis preskriptif dapat membantu dokter dalam

menentukan pengobatan yang paling efektif untuk pasien dan mengoptimalkan

penggunaan sumber daya medis.

Data Analisis dalam Bisnis

Data memiliki manfaat yang sangat besar dalam dunia bisnis saat ini, beberapa

manfaatnya di antara lain :


1. Mengoptimalkan keputusan bisnis: Dengan menggunakan data, perusahaan

dapat membuat keputusan yang lebih baik dan lebih tepat waktu.

2. Meningkatkan efisiensi operasional: Data dapat membantu perusahaan

sehingga dapat mengidentifikasi area di mana mereka dapat mengurangi biaya dan

meningkatkan produktivitas.

3. Meningkatkan kepuasan pelanggan: Data dapat membantu perusahaan dapat

memperoleh pemahaman yang lebih baik tentang preferensi dan perilaku

pelanggan, sehingga dapat mengoptimalkan produk dan layanan yang mereka


tawarkan.

4. Meningkatkan inovasi produk dan layanan: Data dapat membantu

perusahaan dalam mengidentifikasi tren pasar dan memahami kebutuhan

pelanggan. Dengan menggunakan data, perusahaan dapat mengembangkan produk

dan layanan yang lebih inovatif dan relevan dengan pasar.

Namun, dengan semakin banyak manfaat yang dapat diberikan data juga menjadi

tantangan untuk bisnis yang biasa disebut 4V Challenges of Data :


4V of Data. Sumber : gutcheckit.com

1. Volume: Volume mengacu pada jumlah besar data yang dihasilkan dan
dikumpulkan setiap harinya. Tantangan dalam mengelola volume data adalah

menyimpan dan memproses data yang sangat besar secara efektif dan efisien.

2. Variety: Variety mengacu pada keragaman jenis data yang dikumpulkan, termasuk

data struktural dan tidak terstruktur, seperti gambar, video, suara, dan data teks.

Tantangan dalam mengelola keragaman jenis data adalah mengintegrasikan dan

mengelola data dari sumber yang berbeda.

3. Veracity: Veracity mengacu pada keakuratan dan keandalan data. Dalam beberapa

kasus, data dapat tidak akurat, tidak lengkap, atau bahkan salah. Tantangan dalam
mengelola veracity data adalah memastikan keakuratan data dan mengidentifikasi

data yang tidak akurat atau tidak relevan.

4. Velocity: Velocity mengacu pada kecepatan data yang dihasilkan dan dikumpulkan

setiap harinya. Tantangan dalam mengelola kecepatan data adalah memproses data

secara cepat dan efektif sehingga dapat digunakan untuk pengambilan keputusan

dalam waktu yang tepat.

Proses Data Analisis

Siklus CRISP-DM. Sumber : Data Science-pm


CRISP-DM (Cross-Industry Standard Process for Data Mining) adalah sebuah metode

proses umum yang digunakan dalam analisis data. Metode ini melibatkan enam tahap

utama, yaitu sebagai berikut:

1. Understanding the business problem: Tahap pertama dalam proses CRISP-

DM adalah memahami permasalahan bisnis yang ingin diselesaikan. Pada tahap ini

pertanyaan yang harus dijawab adalah mengenai apa saja yang dibutuhkan oleh

bisnis atau masalah apa yang sedang dicoba diselesaikan oleh bisnis
2. Data understanding: Tahap kedua adalah memahami data yang tersedia. Pada

tahap ini pertanyaan yang harus dijawab adalah mengenai apa saja data yang

dimiliki dan dibutuhkan untuk menjawab pertanyaan bisnis dengan memahami

sumber data, tipe data, dan kualitas data yang tersedia.

3. Data preparation: Tahap ketiga adalah mempersiapkan data untuk analisis. Pada

tahap ini pertanyaan yang harus dijawab adalah bagaimana data tersebut disiapkan.

Hal ini dapat dilakukan dengan menghapus data yang tidak relevan atau buruk, dan

menyiapkan data yang dibutuhkan untuk analisis.

4. Modeling: Tahap keempat adalah mengembangkan model analisis. Pada tahap ini

pertanyaan yang harus dijawab adalah mengenai model apa saja yang bisa
diterapkan dan model analisis apa yang tepat untuk menjawab tujuan bisnis.

5. Evaluation: Tahap kelima adalah mengevaluasi kinerja model analisis dan

memastikan model dapat memecahkan permasalahan bisnis yang ditargetkan.

6. Deployment: Tahap terakhir adalah mengimplementasikan hasil analisis dan

model ke dalam lingkungan bisnis. Pada tahap ini perlu dipastikan hasil analisis

dapat diintegrasikan dengan sistem bisnis yang ada dan model analisis dapat

digunakan secara efektif.


Proses CRISP-DM dapat digunakan dalam berbagai jenis analisis data, termasuk data

mining, machine learning, dan big data analytics. Dalam setiap tahap, tim proyek harus

memastikan hasil yang akurat, relevan, dan dapat diandalkan untuk mengambil

keputusan bisnis yang tepat.

Toolset Data Analisis

Seorang data analyst perlu menguasai berbagai tools atau perangkat lunak yang dapat

membantunya dalam mengelola dan menganalisis data dengan efektif. Berikut ini adalah
beberapa tools yang perlu dikuasai oleh seorang data analyst:

1. SQL: SQL (Structured Query Language) adalah bahasa yang digunakan untuk

mengelola dan mengambil data dari database relasional. Seorang data analyst harus

menguasai dasar-dasar SQL agar dapat mengekstraksi data yang diperlukan untuk

analisis. SQL memiliki banyak akses alternatif yang dapat disesuakan dengan

kebutuhan pengguna diantaranya terdapat MySQL , PostgreSQL , dan SQL

Server

2. Programming: Seorang data analyst harus memiliki pengetahuan dasar tentang

bahasa pemrograman seperti Python, R, atau MATLAB untuk melakukan


analisis data yang lebih canggih. Pengetahuan pemrograman juga akan membantu

dalam mengotomatisasi tugas-tugas yang berulang dan dalam membangun model

prediktif.

3. Data Visualization Tools: Data visualization tools seperti Tableau, Power BI,

dan QlikView membantu data analyst untuk menghasilkan grafik dan visualisasi

data yang dapat dipahami oleh orang awam. Seorang data analyst harus menguasai

penggunaan tools ini untuk membuat presentasi dan laporan yang jelas dan

informatif.
Skills and Tools in Data
Analysis
Data Analysis Series from Data Science & Data Analysis Path
MySkill.id

Fundamental Data Analisis

A. Understanding Business Problems

Pemahaman masalah bisnis sangat penting untuk mengidentifikasi


solusi yang tepat, membantu dalam memahami tujuan bisnis, dan
menentukan bagaimana data dapat digunakan untuk mencapai tujuan
tersebut.

Berikut merupakan langkah-langkah dalam menyelesaikan masalah :

Beberapa hal yang harus dipahami dalam masalah bisnis adalah:

1. Tujuan bisnis: Pemahaman yang jelas tentang tujuan bisnis


membantu dalam memfokuskan analisis data pada solusi yang
tepat.
Contoh: jika tujuan bisnis adalah meningkatkan penjualan,
analisis data harus difokuskan pada faktor-faktor yang
memengaruhi penjualan.

2. Jenis bisnis: Pemahaman tentang jenis bisnis membantu dalam


memahami bagaimana data dapat digunakan untuk mengatasi
masalah.

Contoh : bisnis e-commerce dan bisnis manufaktur memiliki


masalah bisnis yang berbeda.

3. Persaingan: Pemahaman tentang persaingan membantu dalam


memahami bagaimana data dapat digunakan untuk mengidentifikasi
keuntungan kompetitif dan memecahkan masalah bisnis.

4. Pelanggan: Pemahaman tentang pelanggan membantu dalam


memahami preferensi dan perilaku mereka, sehingga data dapat
digunakan untuk meningkatkan kepuasan pelanggan dan
meningkatkan retensi.

5. Data yang tersedia: Pemahaman tentang data yang tersedia


membantu dalam memahami kemungkinan solusi dan memilih alat
dan teknik yang tepat untuk analisis data.

Dengan memahami masalah bisnis, analis data dapat mengidentifikasi


sumber data yang diperlukan untuk menyelesaikan masalah bisnis,
menerapkan teknik analisis data yang tepat, dan memberikan
rekomendasi yang berguna bagi bisnis.

Berikut adalah langkah-langkah dalam menyelesaikan masalah yang


akan mempermudah penyelesaian masalah secara lebih terstruktur :

1. Memahami latar belakang dan konteks

Dalam penyelesaian masalah atau isu, memahami latar belakang


masalah dan konteks menjadi penting karena dapat membantu
mengidentifikasi penyebab masalah dan menemukan solusi yang
efektif.

Untuk memahami latar belakang masalah dapat meliputi


mencari tahu penyebab masalah, dampak masalah terhadap bisnis,
serta upaya yang telah dilakukan untuk menyelesaikan masalah
tersebut.

Sementara itu, untuk memahami konteks permasalahan, perlu


diperhatikan faktor-faktor yang mempengaruhi permasalahan tersebut
baik secara internal maupun eksternal seperti budaya, kinerja,
teknologi, sumber daya manusia,dsb . Dengan memahami konteks,
dapat membantu untuk menemukan solusi yang tepat untuk
permasalahan yang sedang dihadapi.

2. Menentukan sumber daya manusia dan bertanya untuk


menambah informasi

Setelah langkah pertama adalah memahami konteks masalah yang


sedang dihadapi. Pastikan masalah dijelaskan secara rinci dan
terperinci sehingga memungkinkan untuk menentukan sumber daya
manusia yang tepat.

a. Menentukan sumber daya manusia yang tepat hal ini


melibatkan menemukan orang yang memiliki keterampilan dan
pengalaman yang sesuai dengan masalah yang sedang dihadapi.

b. Bertanya untuk informasi tambahan — Setelah menentukan


sumber daya manusia yang tepat, tanyakan pada mereka untuk
informasi tambahan. Pertanyaan yang relevan dapat membantu
memperoleh pemahaman yang lebih baik tentang masalah dan
mungkin memberikan pandangan baru yang dapat membantu dalam
menyelesaikan masalah tersebut.

Dengan bertanya untuk informasi tambahan dari sumber daya


manusia yang tepat, Anda dapat memperoleh wawasan yang lebih
dalam dan ide baru untuk menyelesaikan masalah dengan efektif.
3. Membuat kerangka berpikir untuk menentukan akar
permasalahan

Dalam tahapan ini kerangka berpikir yang dimaksud lebih ke


bagaimana alur dalam menyelesaikan masalah dari informasi atau
data yang telah terkumpul, berikut hal yang dapat dilakukan :

a. Menentukan akar permasalahan — Setelah penyebab masalah


diidentifikasi, langkah selanjutnya adalah menentukan akar
permasalahan. Ini melibatkan mengidentifikasi faktor utama yang
menyebabkan masalah muncul. Hal ini membantu memperoleh
pemahaman yang lebih baik tentang masalah dan memastikan bahwa
solusi yang dipilih sesuai dengan akar permasalahan.

b. Menentukan solusi — Setelah akar permasalahan diidentifikasi,


langkah terakhir adalah menentukan solusi yang tepat untuk
menyelesaikan masalah. Hal ini melibatkan mempertimbangkan
berbagai opsi dan memilih solusi yang paling efektif dalam
menyelesaikan masalah tersebut. Pastikan solusi yang dipilih sesuai
dengan akar permasalahan yang telah diidentifikasi sebelumnya.

B. Problem Solving Tools

Menggunakan problem solving tools akan sangat bermanfaat untuk


menganalisa dan mengidentifikasi permasalahan secara end to end
process, berikut beberapa tools yang bisa kamu terapkan:
 5 Why

5 WHY Problem Solving Tools. Sumber : allaboutlen.com

5 Why adalah salah satu metode analisis penyebab masalah yang


bermanfaat dalam menemukan akar masalah. Berikut adalah cara
penyelesaian masalah dengan 5 Why:

1. Identifikasi masalah: Tentukan masalah yang ingin


dipecahkan.
2. Temukan gejala: Identifikasi gejala atau indikasi yang terkait
dengan masalah yang sedang dihadapi.
3. Tanyakan “Why”: Tanyakan “Why” pada gejala pertama
yang terkait dengan masalah yang sedang dihadapi.
Pertanyaan “Why” bertujuan untuk mengetahui penyebab dari
gejala tersebut. Jawaban dari pertanyaan “Why” dapat
mengarahkan pada penyebab yang lebih mendasar.
4. Teruskan dengan tanya “Why” lagi: Teruskan dengan
tanya “Why” pada jawaban sebelumnya, dan lanjutkan hingga
lima kali atau lebih, hingga mencapai akar masalah.
5. Temukan solusi: Setelah menemukan akar masalah,
temukan solusi yang tepat dan terapkan tindakan perbaikan
yang diperlukan.

Contoh:

Permasalahan: Produksi barang tidak mencapai target.

Identifikasi masalah: Produksi barang tidak mencapai


target.

Temukan gejala: Kinerja produksi turun.

Tanyakan “Why”: Kenapa kinerja produksi turun? Jawaban:


Karyawan sering terlambat datang ke pabrik.
Teruskan dengan tanya “Why” lagi: Kenapa karyawan
sering terlambat datang ke pabrik? Jawaban: Karyawan
kesulitan untuk mencapai pabrik pada waktu yang tepat karena
jalan menuju pabrik padat.

Teruskan dengan tanya “Why” lagi: Kenapa jalan menuju


pabrik padat? Jawaban: Ada pekerjaan konstruksi yang sedang
berlangsung di jalan tersebut.

Teruskan dengan tanya “Why” lagi: Kenapa ada


pekerjaan konstruksi di jalan tersebut? Jawaban: Pekerjaan
konstruksi diperlukan untuk memperbaiki jalan yang rusak.

Teruskan dengan tanya “Why” lagi: Kenapa jalan rusak?


Jawaban: Jalan rusak karena kurangnya perawatan dan
pemeliharaan.

 Action Priority Chart (APC)


Action Priority Chart (APC) adalah sebuah alat yang digunakan
dalam manajemen kualitas dan pemecahan masalah untuk
mengidentifikasi, mengatur, dan memprioritaskan tindakan yang
harus diambil untuk memperbaiki masalah yang dihadapi. Berikut
adalah cara penyelesaian masalah dengan Action Priority Chart:

Contoh :

Permasalahan : Keluhan pelanggan perusahaan makanan


Penjelasan:

a. High Impact dan High Effort: Memperbaiki kualitas


produk adalah tindakan yang memiliki dampak besar dan
membutuhkan usaha yang besar pula. Hal ini karena produk
yang berkualitas buruk adalah penyebab utama keluhan
pelanggan, sehingga memperbaikinya dapat meningkatkan
kepuasan pelanggan dan mengurangi keluhan di masa depan.

b. High Impact dan Medium Effort: Meningkatkan waktu


pengiriman dapat memiliki dampak yang besar pada kepuasan
pelanggan. Namun, karena pelanggan juga memperhatikan
kualitas makanan, hal ini membutuhkan usaha yang lebih
sedikit daripada memperbaiki kualitas produk.

c. High Impact dan Low Effort: Menambah variasi menu


adalah tindakan yang mudah dilakukan namun masih memiliki
dampak yang signifikan pada kepuasan pelanggan. Hal ini
karena pelanggan dapat merasa bosan dengan menu yang itu-
itu saja, sehingga menambah variasi menu dapat meningkatkan
kepuasan pelanggan.

d. Medium Impact dan High Effort: Mengoptimalkan


proses pelayanan pelanggan memerlukan usaha yang cukup
besar namun hanya memiliki dampak yang sedang pada
kepuasan pelanggan. Namun, hal ini tetap perlu diperbaiki
karena pelayanan pelanggan yang baik dapat memperkuat
loyalitas pelanggan dan memperkuat merek perusahaan.

e. Medium Impact dan Medium Effort: Meningkatkan


ketersediaan menu dan mengadakan promo diskon juga dapat
meningkatkan kepuasan pelanggan, namun dampaknya tidak
sebesar memperbaiki kualitas produk dan meningkatkan waktu
pengiriman.

f. Medium Impact dan Low Effort: Mengadakan kegiatan


charity adalah tindakan yang mudah dilakukan dan dapat
memperkuat citra perusahaan. Meskipun tidak langsung
berdampak pada kepuasan pelanggan, hal ini dapat
memperkuat merek perusahaan dan memperluas jangkauan
pelanggan.

g. Low Impact dan High Effort: Memperbaiki proses


produksi memerlukan usaha yang besar namun hanya memiliki
dampak kecil pada kepuasan pelanggan.
h. Low Impact dan Medium Effort: Menambah variasi
menu dan mengadakan promo diskon dapat meningkatkan
kepuasan pelanggan, namun dampaknya tidak sebesar tindakan
yang memiliki dampak besar.

i. Low Impact dan Low Effort: Melakukan perbaikan


kosmetik di restoran adalah tindakan yang mudah dilakukan
namun hanya memiliki dampak kecil pada kepuasan pelanggan.

 Fishbone Diagram
Fishbone diagram. Sumber : templatelab.com

Fishbone diagram atau diagram tulang ikan adalah metode visual


untuk mengidentifikasi dan menganalisis penyebab permasalahan.
Diagram ini memungkinkan kita untuk memvisualisasikan faktor-
faktor yang menyebabkan masalah atau efek yang tidak diinginkan.

Berikut adalah langkah-langkah untuk menggunakan fishbone


diagram dalam menyelesaikan masalah:

1. Identifikasi masalah — Tentukan masalah yang akan


diselesaikan dan tuliskan di bagian kepala diagram.
2. Tentukan kategori penyebab — Tentukan kategori
penyebab masalah yang ingin dianalisis. Beberapa kategori
yang umum digunakan meliputi: Manusia, Metode,
Mesin, Bahan, Lingkungan, dan Ukuran.
3. Gambar tulang ikan — Gambar tulang ikan dengan menarik
sebuah garis horizontal di tengah kertas dan menarik beberapa
garis diagonal seperti tulang ikan yang memanjang ke arah
kanan dari garis horizontal tersebut.
4. Identifikasi penyebab masalah — Tuliskan penyebab
masalah dalam kategori yang relevan pada tulang ikan yang
sesuai. Pastikan untuk mengidentifikasi penyebab masalah
secara spesifik dan terperinci. Setiap penyebab harus berada di
bawah kategori yang sesuai.
5. Analisis penyebab — Setelah semua penyebab masalah
teridentifikasi, analisis penyebab dengan
bertanya “Mengapa?” berulang-ulang pada setiap penyebab.
Tuliskan penyebab baru yang muncul pada tulang ikan.
6. Prioritaskan penyebab — Setelah semua penyebab
teridentifikasi dan dianalisis, prioritas penyebab dengan
mempertimbangkan faktor-faktor seperti dampak dan
frekuensi terjadinya. Penyebab yang memiliki dampak besar
dan frekuensi terjadi yang tinggi perlu diutamakan dalam
penyelesaian masalah.
7. Cari solusi — Setelah penyebab masalah teridentifikasi dan
diprioritaskan, cari solusi untuk setiap penyebab dengan
mempertimbangkan sumber daya yang tersedia, waktu dan
biaya yang dibutuhkan, serta hasil yang diinginkan.

Dengan menggunakan fish bone diagram, kita dapat mengidentifikasi


penyebab masalah secara sistematis, menganalisis dan
memprioritaskan penyebab, serta mencari solusi yang tepat untuk
menyelesaikan masalah.

 Flowchart
Diagram Flowchart . Sumber : rechargecolorado.org

Flowchart adalah alat visual yang berguna dalam menganalisis dan


menyelesaikan masalah. Flowchart membantu dalam
memvisualisasikan alur dari sebuah proses atau masalah sehingga
memudahkan untuk mengidentifikasi masalah dan menemukan solusi
yang tepat.

Flowchart juga dapat membantu permasalahan proses pemesanan


makanan di restoran :

Flowchart dapat digunakan untuk memvisualisasikan alur kerja dari


pemesanan makanan di restoran, mulai dari pelanggan memilih menu,
pelayan mengambil pesanan, dapur memproses pesanan, hingga
makanan disajikan ke pelanggan.

Flowchart proses pemesanan makanan. Sumber brainly.com

C. Data Cleaning and Preparation


Data cleaning and preparation adalah tahapan penting dalam analisis
data karena data yang tidak bersih dan tidak siap untuk diproses dapat
menghasilkan analisis yang tidak akurat atau tidak relevan. Dimana
data cleaning akan melibatkan penghapusan atau penggantian data
yang hilang atau tidak valid. Hal ini dapat dilakukan dengan
menghapus data yang tidak lengkap atau salah, atau dengan mengisi
data yang hilang dengan nilai yang benar.

Macam-macam permasalahan dalam pengolahan data :

Dalam pengolahan data, ada beberapa permasalahan yang sering


dihadapi, seperti data null, outlier, data duplicate, dan typo. Berikut ini
adalah penjelasan singkat mengenai setiap permasalahan tersebut:

1. Data null: Data null atau kosong biasanya terjadi karena data
yang tidak diisi atau karena terjadi kesalahan saat
pengumpulan data. Data null bisa mengganggu analisis data
karena bisa mempengaruhi hasil akhir analisis.

Hal yang dapat menanggulangi apabila terdapat data null


adalah :

- Menghapus data null: Jika jumlah data null hanya sedikit,


kita bisa menghapus data null tersebut dari dataset. Namun, jika
jumlah data null sangat banyak, penghapusan data null bisa
menyebabkan kehilangan informasi penting dan mengganggu
analisis data. Sebaiknya, lakukan pengisian data null dengan
nilai rata-rata atau median dari data yang ada, atau dengan
menggunakan teknik interpolasi atau extrapolasi.

- Mengisi data null: Jika data null harus diisi, maka kita bisa
menggunakan teknik imputasi untuk mengisi data null. Teknik
imputasi dapat dilakukan dengan menggunakan nilai rata-rata,
median, modus, atau dengan menggunakan algoritma Machine
Learning.

2. Outlier: Outlier adalah data yang berbeda dengan data yang lain
dalam set data. Outlier bisa muncul karena kesalahan pengukuran atau
karena adanya data yang tidak biasa. Outlier bisa mempengaruhi hasil
analisis data dan menghasilkan kesimpulan yang salah.

Hal yang dapat menanggulangi apabila terdapat data outlier


adalah :

- Menghapus outlier: Jika outlier hanya sedikit dan tidak


signifikan, kita bisa menghapus outlier tersebut dari dataset.
Namun, jika outlier cukup banyak atau memiliki pengaruh yang
signifikan pada analisis data, kita bisa menggunakan teknik
pengolahan data yang lebih lanjut seperti metode quartile atau
Z-score untuk mengidentifikasi dan menghilangkan outlier
secara akurat.

3. Data duplicate: Data duplicate adalah data yang terduplikasi


dalam set data. Data duplicate bisa mengganggu analisis data karena
bisa mempengaruhi hasil akhir analisis.

Hal yang dapat menanggulangi apabila terdapat data outlier


adalah :
- Menghapus data duplicate: Kita bisa menghapus data
duplicate dari dataset. Namun, sebelum menghapus, kita perlu
memastikan bahwa data yang dihapus benar-benar merupakan
data duplicate dan tidak terjadi kesalahan dalam pengambilan
data.

4. Kesalahan ketik (Typo) : Typo adalah kesalahan pengetikan


atau kesalahan dalam memasukkan data ke dalam set data. Typo bisa
mempengaruhi analisis data karena bisa menghasilkan data yang tidak
akurat.

Hal yang dapat menanggulangi apabila terdapat data outlier


adalah :

- Mengidentifikasi dan memperbaiki typo secara


manual: Kita bisa memperbaiki typo dengan melakukan
pengecekan data secara manual dan mengoreksi kesalahan
ketikan. Namun, cara ini hanya efektif jika jumlah data typo
tidak terlalu banyak.

Explaratory Data Analysis


EDA (Exploratory Data Analysis) adalah suatu metode atau
teknik yang digunakan untuk menganalisis dan memahami dataset
dengan cara melakukan eksplorasi data. Tujuan utama dari EDA
adalah untuk menggali informasi dari data, menemukan pola atau
tren, dan mengidentifikasi permasalahan atau keanehan yang ada
dalam dataset.

Dalam melakukan EDA, biasanya digunakan beberapa teknik atau


metode seperti statistical analysis, data visualization, dan
machine learning. Teknik-teknik ini membantu dalam memahami
karakteristik data dan memperoleh wawasan yang lebih dalam
mengenai data.

Data Analytics Tools

1. Pengolahan Data: Saat ini pengolahan data dapat dilakukan


dengan menggunakan tools sederhana seperti Microsoft Excel,
namun semakin besar jumlah data tentu perlu tools yang jauh
lebih optimal salah satunya adalah SQL (Structured Query
Language)

SQL adalah bahasa yang digunakan untuk mengelola dan mengambil


data dari database relasional. Seorang data analyst harus menguasai
dasar-dasar SQL agar dapat mengekstraksi data yang diperlukan untuk
analisis. SQL memiliki banyak akses alternatif yang dapat di sesuakan
dengan kebutuhan pengguna diantaranya
terdapat MySQL , PostgreSQL , dan SQL Server

2. Programming: Seorang data analyst harus memiliki pengetahuan


dasar tentang bahasa pemrograman seperti Python, R,
atau MATLAB untuk melakukan analisis data yang lebih canggih.
Pengetahuan pemrograman juga akan membantu dalam
mengotomatisasi tugas-tugas yang berulang dan dalam membangun
model prediktif.

3. Data Visualization Tools: Data visualization tools


seperti Tableau, Power BI, dan QlikView membantu data analyst
untuk menghasilkan grafik dan visualisasi data yang dapat dipahami
oleh orang awam. Seorang data analyst harus menguasai penggunaan
tools ini untuk membuat presentasi dan laporan yang jelas dan
informatif.

Anda mungkin juga menyukai