Anda di halaman 1dari 4

Nama : Andi Rifaq Guttu Patalo

Judul : Analisis Eksplorasi Data

Pertemuan : Ke-4 Jam : 08.00

Analisis Eksplorasi Data

Langkah pertama dalam menganalisis data adalah mempelajari


karakteristik dari data tersebut. Terdapat beberapa alasan penting yang perlu kita
pertimbangkan secara cermat sebelum analisis data sebenarnya kita lakukan.
Alasan pertama pemeriksaan data adalah untuk memeriksa kesalahan-kesalahan
yang mungkin terjadi pada berbagai tahap, mulai dari pencatatan data di lapangan
sampai pada entry data pada komputer. Alasan berikutnya adalah untuk tujuan
eksplorasi data sehingga kita bisa menentukan model analisis yang tepat.

Seperti kita ketahui, penelitian yang dilakukan secara ilmiah merupakan


sebuah aktivitas yang bisa dianalogkan dengan pemecahan puzzle. Penelitian
harus berpusat pada masalah, bukan pada tools analisis statistik yang digunakan.
Sikap ingin tahu, curiga, dan imajinasi merupakan kunci utama dalam proses
penemuan tersebut. Eksplorasi data merupakan bagian yang integral dari persepsi
kita. Apabila tujuan akhir dari penelitian bukan untuk menghasilkan inferensi
kausal, analisis data selanjutnya sudah tidak diperlukan lagi. Namun apabila
diperlukan, analisis data eksploratori sangat menunjang dalam menelaah dan
menemukan tentang sifat-sifat data yang nantinya dapat berguna dalam
menyeleksi model statistik yang tepat. Dengan demikian, pada analisis data
eksploratif, sifat dari data pengamatanlah yang akan menentukan model analisis
statistik yang sesuai (atau perbaikan dari analisis yang sudah direncanakan).

Analisis data eksploratif (Exploratory Data Analysis – EDA) merupakan metode


eksplorasi data dengan menggunakan teknik aritmatika sederhana dan teknik
grafis dalam meringkas data pengamatan.

EDA banyak digunakan dalam berbagai hal seperti:

 Memaksimalkan telaahan data


 Mencari struktur data yang tersembunyi (mengungakp misteri yang
tersembunyi)
 Mengeluarkan variable penting
 Mendeteksi kelainan dan anomali
 Melakukan test suatu asumsi
 Membangun model
 Melakukan optimasi

Kontribusi utama dari pendekatan analisis data secara eksploratif terletak


pada penyajian seluruh ringkasan statistik secara visual. Ringkasan statistik secara
numerik saja, dapat mengaburkan, menyembunyikan, atau bahkan salah dalam
merepresentasikan struktur data. Apabila ringkasan numerik digunakan secara
terpisah dan langsung diterima tanpa pemeriksaan data terlebih dahulu secara
visual mungkin akan mengakibatkan pemilihan model tidak tepat. Pemilihan
model yang langsung dilakukan secara tergesa-gesa dan mungkin berdasarkan
pada asumsi yang salah akan mengakibatkan penarikan kesimpulan yang salah.
Untuk alasan tersebut, analisis pendahuluan harus dimulai dengan pemeriksaan
secara visual, bukan ringkasan data secara numerik.

Paradigma Teknik Analisis

Terdapat tiga pendekatan analisis data:

1. Klasis (Classical)
2. Eksploratif (Exploratory (EDA))
3. Bayesian

Dengan demikian, EDA merupakan salah satu dari tigak teknik pendekatan
analisis data yang ada. Ketiga pendekatan tersebut mempunyai kemiripan,
semuanya dimulai dari teori atau permasalahan umum dan diakhiri dengan suatu
kesimpulan. Perbedaannya terletak pada urutan dan fokus dari langkah-langkah
perantara.

 Analisis klasik, urutannya:


o Masalah → Data → Model → Analisis → Kesimpulan
 EDA, urutannya:
o Masalah → Data → Analisis → Model → Kesimpulan
 Bayesian, urutannya:
o Masalah → Data → Model → Distribusi Prior/bersyarat →
Analisis → Kesimpulan

Jadi, pada analisis klasik, pengumpulan data diikuti dengan penerapan


model (normalitas, linieritas, dll) dan selanjutnya adalah analisis, estimasi, dan
pengujian yang difokuskan pada model parameter tersebut. Pada EDA,
pengumpulan data tidak diikuti dengan penerapan model, melainkan segera diikuti
dengan analisis dengan tujuan untuk menentukan model apa yang akan sesuai.
Akhirnya, metode pendugaan Bayesian merupakan proses pendugaan dengan
mempertimbangkan dua hal, yaitu data yang sekarang kita miliki dan informasi
awal mengenai kasus yang sedang kita teliti. Keduanya digunakan secara
bersama-sama untuk membuat suatu kesimpulan atau uji asumsi mengenai model
parameter.

Pada kenyataannya, analisis data merupakan kombinasi dari ketiga


pendekatan di atas (serta pendekatan-pendekatan lainnya). Perbedaan tersebut
diatas hanya diuraikan untuk menekankan perbedaan utama dari ketiga
pendekatan tersebut.

EDA bukan seperangkat teknik. EDA merupakan suatu pendekatan,


pola/sikap/filosofi tentang bagaimana kita dalam menganalisis sekumpulan data.
Lalu, apakah EDA sama dengan statistik grafis? Jawabannya adalah tidak. EDA
memang banyak menggunakan teknik grafis, tapi EDA tidak identik dengan
analisis grafik meskipun keduanya mirip dan kadang terminologinya sering bolak-
balik. Pendekatan analisis secara grafis hanya terbatas pada sekumpulan perangkat
teknik yang semuanya bersifat grafis dan hanya fokus kepada satu aspek
karakteristik data saja, sedangkan EDA mencakup area yang lebih luas. EDA
lebih menekankan pada pendekatan langsung sehingga data sendirilah yang bisa
mengungkapkan struktur dan modelnya.
Beberapa teknik grafis yang sering digunakan dalam EDA seringkali sangat
sederhana. Teknik-teknik tersebut diantaranya adalah:

 plotting data mentah (histogram, dotplot, dataplot, stem-and-leaf plot, )


 plotting statistik sederhana seperti (boxplot, mean plot, std plot)

Penyajian Data Secara Grafis

Struktur data yang paling umum adalah kumpulan dari angka-angka.


Struktur ini sangat sederhana, namun apabila jumlah data pengamatan sangat
besar, sangat sulit bagi kita untuk melihat gambaran karakteristik data tersebut
secara menyeluruh apabila hanya sekedar melihat deretan angka yang begitu
banyak.

Terdapat beberapa teknik untuk meringkas dan mempelajari karakteristik dan


distribusi data di mana data dapat digambarkan secara grafis. Diantaranya adalah
histogram, dotplot, stem-and-leaf plot, density trace, box plot, dan probability
plot.

Manfaat eksplorasi data adalah akan mempermudah kita dalam membaca


suatu data dan memahami data, sehingga data yang berukuran besar dapat
disajikan dalam sbuah model yang lebih sederhana. Kita dapat melakukan
pengecekan jenis2 data secara statistic dengan mudah dengan bantuan software
pengolah data seperti spss, excel dll.kita juga dapat melihat grafik fungsi data
yang telah diolah, sehingga akan mempermudah kita dalam memahami deskripsi
data tersebut.data juga dapat diolah dalam bentuk table, gambar dan uji statistic
langsung. Dengan eksplorasi data tentu akan mempermudah kita dalam
melakukan proses uji statistic, karena data telah disajikan secara lebih sederhana.
Eksplorasi data juga membantu perencana memahami lebih jauh makana spasial
atau keruangan yang terkandung dalam informasi geographis. Dengan eksplorasi
data juga dapat di analisis dengan lebih mudah.Selain itu eksplorasi data juga akan
membantu kita dalam mengambil sebuah keputusan, karena informasi data dapat
kita peroleh dengan cepat. Kemudian data dapat dipaparkan secara baik, jika
terjadi perubahan data maka perubahan akan mudah di perbaiki, data akan lebih
cepat dan mudah di analis.

Kekurangan eksplorasi data, yaitu dibutuhkannya pengetahuan dan biaya


yang cukup besar karena berbasis computer.

 Potential problems with analyses involving missing data. Potensi masalah


dengan analisis yang melibatkan data hilang. These can be insidious, in
that the unwary user is unlikely to realize that anything is wrong. Ini bisa
busuk hati, dalam hal tak awas pengguna tidak akan menyadari bahwa
sesuatu adalah salah.
 Lack of flexibility in analyses that can be done due to its expectations
regarding the arrangement of data. Kurangnya fleksibilitas dalam analisis
yang dapat dilakukan karena harapan tentang pengaturan data. This results
in the need to cut/paste/sort/ and otherwise rearrange the data sheet in
various ways, increasing the likelyhood of errors. Ini hasil yang harus
dipotong / sisipkan / sort / dan lain ulang data Sheet dalam berbagai cara,
meningkatkan kemungkinan terjadinya kesalahan.
 Output scattered in many different worksheets, or all over one worksheet,
which you must take responsibility for arranging in a sensible way. Output
tersebar di berbagai worksheet, atau semua lebih dari satu worksheet, yang
harus bertanggung jawab untuk mengatur di jalan masuk akal.
 Output may be incomplete or may not be properly labeled, increasing
possibility of misidentifying output. Output mungkin tidak lengkap atau
tidak dapat diberi label dengan benar, meningkatkan kemungkinan
misidentifying output.
 Need to repeat requests for the some analyses multiple times in order to
run it for multiple variables, or to request multiple options. Harus
mengulangi permintaan untuk beberapa analisis beberapa kali untuk
menjalankannya untuk beberapa variabel, atau meminta beberapa pilihan.
 Need to do some things by defining your own functions/formulae, with its
attendant risk of errors. Perlu melakukan beberapa hal dengan
mendefinisikan sendiri fungsi / formulae, hadir dengan risiko kesalahan.
 No record of what you did to generate your results, making it difficult to
document your analysis, or to repeat it at a later time, should that be
necessary. Tidak ada catatan apa yang Anda lakukan untuk hasil Anda,
sehingga sulit untuk dokumen analisis Anda, atau untuk mengulang di lain
waktu, sebaiknya yang perlu dilakukan.

CONTOH :

Sebuah pabrik sepatu sedang mengembangkan produk sepatu baru.


Sebelum meluncurkan produk baru tersebut, divisi pemasaran melakukan riset
untuk mengetahui seperti apakah desain dan warna produk yang diminati oleh
konsumen, dimana target pasar yang dibidik adalah kelas menengah.

Awalnya bagian Promosi melakukan riset kecil berupa penyebaran


kuisioner kepada pelanggan untuk mengetahui penting tidaknya suatu atribut
beserta tarafnya. Kemudian diketahui ada 2 atibut yang dinilai berperan
mempengaruhi responden (konsumen). Penelitian dilakukan terhadap 2
responden.

Setelah dibuat stimuli, ke-2 responden tersebut melakukan ranking


terhadap stimuli yang ada. Dimana angka 1 adalah model sepatu yang paling tidak
disukai, dan angka terakhir adalah model sepatu yang paling disukai.buatlah
dengan analisis konjoin untuk menyimpulkan seperti apa model sepatu yang
disukai konsumen?

Atribut Taraf Keterangan

Desain 1 Bertali

2 Tanpa tali
Warna 1 Hitam

2 Putih

3 Lainnya (selain
hitam dan putih)

Anda mungkin juga menyukai