Anda di halaman 1dari 9

Pertemuan Ke-4

ANALISIS EKSPLORASI DATA


Nama : Khusnul Khatimah
Tanggal Perkuliahan : 12 April 2017
Jam Perkuliahan : 13.00-15.00

A. ANALISIS DATA

Analisis data adalah upaya mengolah data menjadi informasi sehingga sifat-sifat
(karakteristik) data dapat dengan mudah dipahami dan bermanfaat dalam menjawab
masalah-masalah yang berkaitan dengan kegiatan.

Tujuan analisis data :


Deskriptif data :
- Frekuensi
- Ukuran tendensi sentral
- Ukuran dispersi
Inferensia data :
- Membuat induksi/hipotesis
- Menarik kesimpulan

B. EKSPLORASI DATA

Eksplorasi data adalah upaya untuk menggali dan mendapatkan sesuatu dari suatu data
sehingga diperoleh kondisi serta informasi pada data yang dianalisa. Selain itu eksplorasi
data dapat dilakukan untuk mendapatkan informasi yang lebih dari pengelolaan suatu
data.

Eksplorasi -> upaya untuk melihat ke dalam data guna mengungkap informasi yang
terkandung dalam data tersebut.
-> manipulasi, penyarian/pengukuran, peragaan.

Peragaan -> tabel dan grafik (histogram, diagram batang, chart, dan lain-lain.

Penyarian -> ukuran pemusatan (mean, median, modus, kuartil), ukuran penyebaran
(variansi, standar deviasi, range, jarak antar kuartil)

C. ANALISIS EKSPLORASI DATA

Analisis eksplorasi data adalah analisis data yang mengeksplorasi data lebih dalam
untuk memeriksa lebih teliti sekelompok data, antara lain data screening, menguji ada
tidaknya outlier, uji asumsi kenormalan data dan kesamaan ragam, serta penanganan data
per subgrup atau per kasus.

Screening -> suatu penyaringan data dari data yang sedang dikelola.
Tujuan Screening :
1. Memeriksa proses pengelolaan data
2. Mengkoreksi kesalahan dalam pengumpulan data.
3. Menghindari ketidakcalidan dalam analisis data.
D. DATA OUTLIER

Outliers adalah data yang menyimpang terlalu jauh dari data yang lainnya dalam suatu
rangkaian data. Adanya data outliers ini akan membuat analisis terhadap serangkaian data
menjadi bias, atau tidak mencerminkan fenomena yang sebenarnya. Istilah outliers juga
sering dikaitkan dengan nilai esktrem, baik ekstrem besar maupun ekstrem kecil. Sebagai
ilustrasi, jika ada empat mahasiswa, mahasiswa pertama mempunyai uang saku per bulan
Rp. 500 ribu, mahasiswa kedua Rp. 600 ribu, mahasiswa ketiga Rp. 700 ribu, dan
mahasiswa keempat karena merupakan anak orang kaya, mempunyai uang saku per bulan
sampai dengan Rp. 5 juta. Secara sekilas tampak bahwa nilai 5 juta relatif jauh
dibandingkan uang saku ketiga mahasiswa yang lain.

Kalau kita rata-ratakan uang saku keempat mahasiswa tersebut, maka rata-ratanya
adalah sebesar (500 ribu + 600 ribu + 700 ribu + 5 juta)/4= 6,8 juta/4 = 1,7 juta. Tiga
mahasiswa yang lain tentunya keberatan jika dinyatakan bahwa rata-rata uang saku
mereka adalah Rp. 1,7 juta per bulan karena jauh sekali dari nilai yang sebenarnya.
Contoh lain misalnya kita ingin merata-ratakan kekayaan seorang PNS usia 30 tahunan,
dengan memasukkan seorang PNS yang kebetulan mempunyai kekayaan sekitar Rp. 25
Milliar.

Penangangan Data Outliers


Harus kita apakah data outliers? Apakah harus kita keluarkan? Atau ada treatment
yang lain. Pengeluaran data outliers memang tidak disalahkan, akan tetapi harus dikaji
dulu, apakah data tersebut merupakan bagian dari populasi atau bukan? Sebagai contoh,
seorang PNS dengan kekayaan dalam contoh di atas, sebaiknya dikeluarkan dari model
penelitian karena tidak mewakili fenomena PNS yang sebenarnya. Dalam contoh
keempat mahasiswa di atas, jika tujuannya adalah untuk melihat apakah perlu menaikkan
SPP atau tidak, ya sebaiknya dikeluarkan karena tentunya 3 orang yang mempunyai uang
saku di bawah 1 juta juga akan keberatan. Akan tetapi dalam kasus yang lain, data
tersebut boleh saja dipergunakan jika memang mewakili kondisi subjek penelitian.
Misalnya, penelitian perusahaan selama krisis di mana hampir semua perusahaan
mengalami kerugian. Akan tetapi ada satu atau beberapa perusahaan yang dengan jitu
melakukan strategi sehingga menghasilkan profit. Nah, hasil penelitian akan lebih
menarik jika data outliers tidak dikeluarkan. Dalam hal ini, peneliti bahkan dapat
mengkaji strategi apa yang digunakan sehingga dapat dijadikan rujukan bagi perusahaan
yang lain.
Dalam statistik, data outliers sering menimbulkan hasil yang bias. Oleh karena itu,
harus diberikan perlakuan khusus. Pengeluaran data outliers atau penggunaan data
outliers tidak semata-mata merujuk kepada statistiknya, tetapi juga adjustment dari
peneliti. Jika memang data outliers tersebut tidak dapat dikeluarkan karena masih
merupakan fenomena subjek penelitian ya sebaiknya tetap dipergunakan. Agar efek
outliers dapat direduksi, maka data dilakukan transformasi data, misalnya dengan
logaritman natural, atau akar kuadrat. Atau juga bisa menggunakan alat statistik non
parametrik, sehingga data outliers tidak akan nampak sebagai outliers karena data
dianggap berskala ordinal. Sebagai contoh, keempat mahasiswa tadi diubah menjadi data
ordinal, sehingga mahasiswa dengan uang saku Rp. 500 ribu menjadi 1, uang saku Rp.
600 ribu menjadi 2, uang saku Rp. 700 ribu menjadi 3, dan yang paling besar menjadi 4.
Ini hanya contoh saja, dan sebagai informasi data dalam bentuk ordinal tidak dapat dirata-
ratakan, akan tetapi dapat digunakan untuk mencari korelasi dengan variabel lain.
E. DIAGRAM

1. Pengertian
Diagram adalah gambar atau grafik yang berisi keterangan dan menjelaskan
sarana, prosedur, atau kegiatan yang biasa dijalankan suatu sistem. Diagram juga dapat
berarti gambaran (sketsa, buram) yang menggunakan garis dan simbol untuk
menerangkan atau memperlihatkan sesuatu.

2. Macam-Macam

a. Diagram Garis
Diagram garis adalah penyajian data statistik dengan memakai garis yang
melakukan pengamatan dari waktu ke waktu secara berurutan. Sumbu X
menunjukkan waktu pengamatan dan sumbu Y menunjukkan nilai-nilai data
pengamatan untuk waktu tertentu. Gabungan waktu dan pengamatan membentuk
titik XY.

Diagram 1 Diagram garis

b. Diagram Lingkaran
Diagram lingkaran adalah penyajian data statistik dengan memakai gambar yang
berbentuk lingkaran. Lingkaran tersebut dibagi dalam beberapa bagian yang
menyatakan nilai dengan bentuk persen.

Diagram 2 Diagram lingkaran

c. Diagram Batang
Diagram batang adalah diagram yang menunjukkan bilangan atau kuantitas yang
dinyatakan dalam bentuk persegi panjang atau persegi. Pada umumnya diagram
batang menggambarkan perkembangan nilai-nilai suatu objek penelitian dalam
kurun waktu tertentu. Diagram batang menunjukkan batang-batang tegak,
mendatar, dan sama lebar dengan batang-batang terpusah.

Diagram 3 Diagram batang


d. Diagram Batang Daun
Diagram batang daun adalah diagram sebagai contoh penyebaran data yang datanya
diurutkan terlebih dahulu dari yang terkecil ke terbesar. Diagram terbagi atas dua
yaitu diagram batang dan daun. Diagram batang daun memuat angkat puluhan serta
bagian daun memuat angka satuan.

Diagram 4 Diagram Batang daun

e. Diagram Kotak Garis


Diagram kotak garis adalah data statistik yang dipakai untuk menampilkan diagram
kotak garis yaitu statistik lima serangkai, yang terdiri dari data ekstrim (data
terkecil dan data terbesar). Q1, Q2, Q3.

Diagram 5 Diagram kotak garis

f. Diagram Gambar

Diagram 5 Diagram gambar

F. TABEL

Macam-Macam Tabel
1. Tabel Baris-Kolom
Tabel baris kolom merupakan penyajian data dalam bentuk tabel dalam bentuk
susunan baris dan kolom yang saling berhubungan.
Tabel 1 Tabel baris kolom

2. Tabel Kontingensi
Tabel kontingensi merupakan bagian dari tabel baris kolom, akan tetapi tabel
mempunyai ciri khusus, yaitu untuk menyajikan data yang terdiri atas dua faktor atau
dua variabel, faktor yang satu terdiri atas b kategori dan lainnya terdiri atas k kategori,
dapat dibuat daftar kontingensi berukuran b x k dengan b menyatakan baris dan k
menyatakan kolom.

Tabel 2 Tabel kontingansi

3. Tabel Distribusi Frekuensi

Tabel 3 Bentuk umum tabel distribusi frekuensi

a. Tabel Distribusi Frekuensi Relatif


Tabel distribusi frekuensi relatif adalah sebuah tabel yang berisi nilai-nilai
data, dengan nilai-nilai tersebut dikelompokkan keadaan interval-interval dan tiap
interval nilai masing-masing mempunyai frekuensinya dalam bentuk persentase.
Tabel distibusi frekuensi relatif ada dua macam, yaitu :
1. Tabel distribusi frekuensi relatif kurang dari
2. Tabel distribusi frekuensi relatif atau lebih

Tabel 4 Bentuk umum tabel distribusi


frekuensi relatif kurang dari

Tabel 5 Bentuk umum tabel distribusi


frekuensi relatif atau lebih

b. Tabel Distribusi Frekuensi Kumulatif


Tabel distribusi frekuensi kumulatif didefenisikan sebagai tabel yang diperoleh
dari tabel distribusi frekuensi, dengan frekuensinya dijumlahkan selangkah demi
selangkah (artinya kelas interval demi kelas interval)
Dalam kolom nilai data, bilangan yang digunakannya berupa ujung bawah untuk
masing-masing kelas interval.
Tabel distibusi frekuensi kumulatif ada dua macam, yaitu :
1. Tabel distribusi frekuensi kumulatif kurang dari
2. Tabel distribusi frekuensi kumulatif atau lebih

c. Tabel Distribusi Frekuensi Relatif Kumulatif


Tabel distribusi frekuensi relatif kumulatif adalah tabel yang diperoleh dari tabel
frekuensi relatif dengan frekuensi dijumlahkan selangkah demi selangkah (kelas
interval demi kelas interval)
Tabel distibusi frekuensi relatif kumulatif ada dua macam, yaitu :
1. Tabel distibusi frekuensi relatif kumulatif kurang dari
2. Tabel distibusi frekuensi relatif kumulatif atau lebih

Tabel distibusi frekuensi relatif kumulatif kurang dari


Jika jumlah frekuensi dalam tabel distribusi frekuensi relatif tidak sama dengan
100 %, maka pada tabel distibusi frekuensi relatif kumulatif kurang dari
perlu diperhatikan dua hal sebagai berikut :
- Pada kelas interval terakhir (yaitu kurang dari k), nilai frekuensi relatif
komulatifnya tetap ditulis 100.
- Di bawah tabel dibuat catatan yang berisi pernyataan berikut :
FREKUENSI RELATIF KOMULATIF UNTUK KELAS INTERVAL
TERAKHIR TIDAK SAMA DENGAN 100, KARENA ADANYA
PEMBULATAN BILANGAN

Tabel 6 Bentuk umum tabel distribusi frekuensi


relatif komulatif kurang dari

Tabel distibusi frekuensi relatif kumulatif atau lebih


Jika jumlah frekuensi dalam tabel distribusi frekuensi relatif tidak sama
dengan 100 %, maka pada tabel distibusi frekuensi relatif kumulatif atau
lebih perlu diperhatikan dua hal sebagai berikut :
- Pada kelas interval pertama (yaitu a atau lebih), nilai frekuensi relatif
komulatifnya tetap ditulis 100.
- Di bawah tabel dibuat catatan yang berisi pernyataan berikut :
FREKUENSI RELATIF KOMULATIF UNTUK KELAS INTERVAL
PERTAMA TIDAK SAMA DENGAN 100, KARENA ADANYA
PEMBULATAN BILANGAN

Tabel 7 Bentuk umum tabel distribusi frekuensi


relatif komulatif atau lebih

G. GRAFIK
CARA MEMBUAT BERBAGAI MACAM GRAFIK DENGAN MS. EXCEL
Menentukan perbandingan dengan mudah adalah dengan menggambarkannya dengan
grafik atau diagram. Berbagai macam bentuknya dibuat semenarik mungkin agar mudah
di pahami.
Berikut langkah langkahnya:

Membuat Grafik dengan menggunakan Diagram Batang.


1. Langkah Pembuatan Grafik Batang (Column Chart)
Buatlah satu file workbook baru pada Excel 2007.
Pada sheet1, masukkan data dengan layout seperti berikut.
2. Pilih range data B5 s/d D11.

3. Klik tab Insert, dan pada bagian Charts pilih Column | 3-D Clustered Column.

4. Akan terbentuk grafik atau chart dengan tampilan seperti berikut ini.

Terlihat pada bagian atas terdapat label 6 propinsi dengan grafik statistik penduduk
masing-masing warna biru untuk tahun 2010 dan warna merah untuk 2010.

5. Untuk memberi judul pada chart ini, klik chart tersebut dan pada menu Ribbon
pilihChart Tools | Layouts | Chart Title | Above Chart.
6. Masukkan judul grafik seperti pada gambar berikut.

7. Selesai, grafik Anda siap ditempatkan di lokasi manapun pada workbook Anda.

Anda mungkin juga menyukai