Anda di halaman 1dari 29

-1-

– PENDAHULUAN
– PEMERIKSAAN POLA SEBARAN DATA
(DATA BERSTRUKTUR TUNGGAL)
Histogram, Diagram Dahan-Daun,
Ringkasan Numerik, Diagram Kotak Garis
(Box Plot)

D10F-3003 / 4 (3-1) SKS

ADE (Analisis Data Eksplorasi)


Tim Teaching ADE
Materi ADE
• Pendahuluan
• Pemeriksaan Pola Sebaran Data (Data Berstruktur Tunggal)
– Histogram, Diagram Dahan-Daun, Ringkasan Numerik, Diagram
Kotak Garis (Box Plot).
• Pembandingan Kelompok Data
• Transformasi Data
– Transformasi Kesimetrisan Data
– Transformasi Kehomogenan Varians
• Pemeriksaan Asumsi Sebaran Data
• Data Berpasangan dan Persamaan Garis Lurus :
– Garis Resisten
– Proses Iterasi dalam Garis Resisten
– Transformasi untuk Meluruskan Garis
• Analisis Elementer :
– Analisis Elementer Rata-Rata
– Analisis Median Polish

ADE 1: Pemeriksaan Pola Sebaran Data Page 2


Analisis Data Eksplorasi

Proses analisis data pada dasarnya meliputi upaya


penelusuran dan pengungkapan informasi yang relevan
yang terkandung dalam data dan penyajian hasilnya
dalam bentuk yang lebih ringkas dan sederhana,
sederhana, yang
pada akhirnya mengarah kepada keperluan adanya
penjelasan dan penafsiran.
penafsiran.

Munculnya pendekatan analisis data eksplorasi dipelopori


oleh J. W. Tukey sejak awal tahun 1970
1970--an dan menjadi
populer dengan terbitnya buku mengenai teknik eksplorasi
data (Tukey
(Tukey,, 1977)

ADE 1: Pemeriksaan Pola Sebaran Data Page 3


Analisis Data Eksplorasi (cont..)

• Munculnya pendekatan ini terutama disebabkan oleh


dua hal, yaitu :
A. Pola sebaran normal yang banyak melandasi teknik-
teknik statistika ternyata tidak selalu mencerminkan
pola sebaran data yang dimiliki
B. Anggapan bahwa pengamatan yang dilakukan
merupakan sampel acak dari suatu populasi tertentu
tidak selalu terpenuhi dalam pelaksanaannya.

• Pada tahap awal, proses ini diusahakan tanpa terikat


pada asumsi-asumsi yang ketat, agar supaya
pengungkapan informasi dapat dilakukan dengan
fleksibel dan lebih merangsang imajinasi yang sehat
tanpa melupakan kaidah-kaidah ilmu maupun teori
yang telah dikenal.

ADE 1: Pemeriksaan Pola Sebaran Data Page 4


Analisis Data Eksplorasi (cont..)

• Analisis data yang bersifat eksploratif diawali


dengan upaya penelusuran dan pengungkapan
struktur dan pola yang dimiliki oleh data tanpa
mengaitkan secara kaku pada asumsi-asumsi
tertentu.

• Dalam menelusuri struktur data, kita berusaha untuk


memeriksa apakah data tersebut dapat diuraikan
menjadi beberapa komponen dan apakah
komponen tersebut bersifat aditif atau multiplikatif,
atau merupakan komponen persamaan garis.

ADE 1: Pemeriksaan Pola Sebaran Data Page 5


Analisis Data Eksplorasi (cont..)

• Penelusuran pola data bertujuan untuk memeriksa


bentuk atau pola sebaran data, yaitu apakah
apakah data cenderung mengumpul di satu nilai
tertentu atau pada beberapa nilai ? atau apakah
beberapa nilai nampak agak jauh atau memencil
dari kumpulannya?

• Perubahan melalui transformasi data seringkali


berhasil menyederhanakan struktur data atau
mendapatkan pola sebaran yang dapat didekati
oleh pola sebaran teoritik.

ADE 1: Pemeriksaan Pola Sebaran Data Page 6


Analisis Data Eksplorasi (cont..)

• Pemeriksaan hasil penguraian komponen data


biasanya dilakukan dengan bantuan alat peraga
berupa grafik, plot, tabel atau dalam bentuk
ringkasan data.

• Grafik menjadi alat peraga yang semakin penting


peranannya dalam analsis data, baik sebagai
ringkasan data maupun sebagai alat diagnosis
kesesuaian model yang diduga.

ADE 1: Pemeriksaan Pola Sebaran Data Page 7


Analisis Data Eksplorasi (cont..)

• Keefektifan peranan analisis data sangat


tergantung kepada kegigihan dalam
mendapatkan model yang relevan dan
menyingkap hal-hal yang masih tersembunyi.

• Pemeriksaan terhadap residu dengan lebih


seksama akan membawa ke arah model yang
lebih baik atau ke arah metode pendugaan yang
lebih sesuai.

ADE 1: Pemeriksaan Pola Sebaran Data Page 8


Pemeriksaan Pola Sebaran

• Kumpulan data yang berupa hasil pengukuran


terhadap peubah tertentu pada umumnya bervariasi.
Variasi atau keragaman nilai-nilai pengamatan, dapat
dilihat melalui pola sebarannya. Pola sebaran sangat
berguna dalam penentuan karakteristik data.

• Pemeriksaan bentuk atau pola sebaran data dapat


diawali dengan meringkas data. Yang kemudian
dapat di sajikan berupa:
– Histogram,
– Diagram dahan daun (stem and leaf display),
– Ringkasan numerik,
– Diagram kotak-garis (box-plot).

ADE 1: Pemeriksaan Pola Sebaran Data Page 9


Meringkas Data

Perhatikan Tabel 1.1 Angka kematian bunuh diri tahun 1971


Negara L/p 25-34 35-44 45-54 55-64 65-74 Negara L/p 25-34 35-44 45-54 55-64 65-74
L 21.6 27.3 31.1 335 23.5 L 7.8 10.6 17.9 20.2 28.2
Kanada Belanda
P 7.8 11.5 14.8 12.3 9.2 P 4.7 8.2 10.5 15.8 17.3
L 9.4 9.8 10.2 14 27.3 L 26.2 29.1 35.9 32.3 27.5
Israel Polandia
P 7.6 4.2 6.7 22.9 19.1 P 4.4 4.7 6.6 7.3 7
L 21.5 18.7 21.1 31.1 48.7 L 4.1 7 9.6 13.7 21.9
Jepang Spanyol
P 14 10.3 13.2 21 40.1 P 1.4 1.6 3.8 5.4 5.7
L 28.8 40.3 52.3 52.8 68.5 L 27.6 40.5 45.7 51.2 35.1
Austria Swedia
P 8.4 16.4 22.4 21.5 29.4 P 13 17.5 19.6 22.4 17.1
L 16.4 25.2 36.1 47.3 56 L 21.7 33.6 41.1 50.3 50.8
Perancis Swiss
P 6.6 8.9 13 16.7 18.5 P 10.4 15.9 18.2 20.1 20.6
L 28.3 34.6 41.3 49.1 51.8 L 9.6 12.7 14.6 17 21.7
Jerman Inggris
P 11.3 15.6 24.2 25.6 27.3 P 5.1 6.5 10.7 13 14.1
L 48.2 65 84.1 81.3 107.4 L 19.6 22.2 27.8 32.8 36.5
Hongaria USA
P 12.7 18.4 26.9 34.7 47.9 P 8.6 12.1 12.5 11.4 9.3
L 7.1 8.3 10.8 17.9 26.6
Italia
P 3.5 3.7 5.5 6.7 7.7

ADE 1: Pemeriksaan Pola Sebaran Data Page 10


Meringkas Data (cont..)

• Dalam data tersebut tampak banyak sekali


informasi yang bisa dipetik.
→ Misalnya, tingkat bunuh diri dari pria
ternyata lebih banyak dibandingkan
dengan wanita. Negara dan umur
tampaknya perlu diperhatikan juga.
• Apabila diperhatikan, tabel tersebut tampak
terlalu umum. Apabila peneliti ingin
memperhatikan aspek khusus saja misalnya
kematian pria pada usia termuda dan tertua,
maka tabel di atas perlu dipecah menjadi:
ADE 1: Pemeriksaan Pola Sebaran Data Page 11
Pria 25-34 Pria 65-74
Negara
Asli Dibulatkan Asli Dibulatkan
Kanada 21.6 22 23.5 24
Israel 9.4 9 27.3 27
Jepang 21.5 22 48.7 49
Austria 28.8 29 68.5 69
Perancis 16.4 16 56.0 56
Jerman 28.3 28 51.8 52
Hongaria 48.2 48 107.4 107
Italia 7.1 7 26.6 27
Belanda 7.8 8 28.2 28
Polandia 26.2 26 27.5 28
Spanyol 4.1 4 21.9 22
Swedia 27.6 28 35.1 35
Swiss 21.7 22 50.8 51
Inggris 9.6 10 21.7 22
USA 19.6 20 36.5 37

ADE 1: Pemeriksaan Pola Sebaran Data Page 12


Meringkas Data (cont..)
• Tampilan tabel diatas kemudian dapat disederhanakan
agar lebih informatif, menjadi tabel distribusi frekuensi
berikut:
100-109 100-109 l
90-99 90-99
80-89 80-89
70-79 70-79
60-69 60-69 l
50-59 50-59 lll
40-49 l 40-49 l
30-39 30-39 ll
20-29 llll lll 20-29 llll ll
10-19 ll 10-19
0-9 llll 0-9

ADE 1: Pemeriksaan Pola Sebaran Data Page 13


1) HISTOGRAM

• Digunakan sebagai langkah awal dalam


mengorganisir data. Dalam pembuatannya,
nilai-nilai pengamatan dikelompokkan
menjadi beberapa kelas interval, kemudian
frekuensi relatif untuk masing-masing kelas
interval digambarkan sebagai tinggi kotak.
Karena pengelompokan inilah, maka kita
kehilangan informasi yang sebenarnya.

ADE 1: Pemeriksaan Pola Sebaran Data Page 14


2) Diagram Batang & Daun Gabungan
(Steam and Leaf )
.

Laki-laki 25-34 Laki-laki 65-74

10 10 7
9 9
8 8
7 7
6 6 9
5 5 621
4 8 4 9
3 3 57
2 22986820 2 4778822
1 60 1
0 9784 0

ADE 1: Pemeriksaan Pola Sebaran Data Page 15


2) Diagram Batang & Daun Gabungan
(Steam and Leaf )
.

Laki-laki 25-34 Laki-laki 65-74


10 7
9
8
7
6 9
5 621
8 4 9
3 57
477882
22986820 2 2
60 1
9784 0

ADE 1: Pemeriksaan Pola Sebaran Data Page 16


Contoh lain dari Steam and Leaf

Diketahui data yang berasal dari distribusi normal dengan rata-


rata 20 dan standar deviasi 5, sbb. :
16,8 25,7 21,4 22,7 28,1 17,5 14,4 20,9
13,1 15,8 21,7 26,2 18,7 20,2 24,6 24,2
14,6 16,9 14,9 26,7 20,2 21,6 15,1 6,9
22,6 12,9 14,1 25,8 17,9 17,7 18,6 20,3
24,4 16,6 20,5 19,7 17,3 18,0 13,7 17,3

– Akan dirinci atas angka satuan (sebagai digit utama untuk


dahan) dan angka persepuluhan (sebagai digit penyerta
untuk daun).
– Lajur DAHAN akan memiliki 24 buah baris yang ditandai dgn
digit 6 – 28. Angka pertama, 16,8 shg DAHAN nya adalah 16
DAUNnya adalah 8. Angka berikutnya 25,7, dituliskan pada
DAHAN 25 dan DAUN 7, dst. Tahapan ini dilanjutkan sampai
data terakhir, sehingga akan didapat diagram DAHAN-DAUN
sbb. :

ADE 1: Pemeriksaan Pola Sebaran Data Page 17


Diagram Batang & Daun Gabungan
.

Dahan Daun
6 9
7
8 • Secara tidak langsung kita telah
9
10
melakukan urutan data.
11
• Proses ini jauh lebih mudah jika
12 9
13 17 dibandingkan dengan
14 1469 pengurutan secara langsung
15 18 dari kumpulan data.
16 689
17 33579 • Hasil ini memberi gambaran
18 67
19 7
pola sebaran datanya.
20 22359
21 467
• Jika diagram ini diputar,
22 67 sehingga lajur dahannya
23 tersusun secara horizontal, maka
24 246 diagram ini tidak jauh berbeda
25 78
26 27 dengan histogram.
27
28 1
ADE 1: Pemeriksaan Pola Sebaran Data Page 18
2) Diagram Batang & Daun Gabungan
(Steam and Leaf )
.

• Dengan table seperti ini, akan terlihat


bagaimana sebenarnya pola dari data.

• Jadi tabel batang daun:


– lebih informatif
– memberikan informasi tentang pola data

• Memperhatikan pola data maka pola data akan


bergantung pada :
dimana data tersebut berpusat dan bagaimana
variasinya.

ADE 1: Pemeriksaan Pola Sebaran Data Page 19


3) Ringkasan Numerik

• Ringkasan numerik merupakan bilangan-


bilangan yang dapat memberikan
gambaran mengenai sekelompok data
(angkatan).

• Dalam pendekatan eksploratif, ringkasan


numerik yang penting adalah : ukuran
pemusatan data dan ukuran penyebaran
data.

ADE 1: Pemeriksaan Pola Sebaran Data Page 20


A. Ukuran Pemusatan Data
(Pusat Angkatan)

– Jika skala pengukurannya interval atau rasio, maka


ukuran yang tepat untuk mewakili kelompok data
tersebut adalah Rata-rata (Mean). Tetapi rata-rata
mempunyai kelemahan, yaitu “tidak tangguh”
(tidak robust), karena terpengaruh oleh nilai ekstrim.
Sehingga jika terdapat nilai data ekstrim, ganti rata-
rata oleh median (Me). Me merupakan pusat
angkatan yang sangat tangguh, disebut : “resistant
statistic”. Secara umum, Me lebih baik dari pada
rata-rata untuk kepentingan eksplorasi karena Me
“insensitive” terhadap outlier, tetapi Me masih
‘sensitive” terhadap satu atau dua observasi yang
berada di tengah.
ADE 1: Pemeriksaan Pola Sebaran Data Page 21
A. Ukuran Pemusatan Data
(Pusat Angkatan)

Jika terdapat outlier, sedangkan outlier tersebut


tidak dikeluarkan dari data, maka sebagai
pengganti nilai Rata-rata gunakan “M Estimator”,
tetapi jika outlier tersebut dikeluarkan maka
sebagai pengganti Rata-rata gunakan “Tri Mean”
Cat : Tri Mean = TRI = (qA + qB + 2 Me)/4

– Jika skala pengukurannya paling sedikit ordinal,


maka sebagai pusat angkatan, gunakan Me.
– Jika skala pengukurannya nominal, maka sebagai
pusat angkatan gunakan Modus.

ADE 1: Pemeriksaan Pola Sebaran Data Page 22


B. Ukuran Sebaran Data
(Ukuran Dispersi)

– Untuk menyimpulkan sekumpulan data, tidak boleh hanya


menggunakan ukuran pemusatannya saja (bisa keliru) tetapi
harus dilengkapi dengan ukuran dispersinya.
– Jika skala pengukurannya interval atau rasio, gunakan standar
deviasi (jangan varians, karena varians dimensinya 2, misalnya
orang2, kg2, dsb), atau rentang.
Catatan :
• Rentang mudah dihitung, tetapi tidak “robust”. Rentang
hanya memperhatikan dua bilangan saja.
• Untuk melihat keseragaman data ataupun variasi data :
– Jika variabelnya sama dan satuan pengukurannya
sama, boleh menggunakan standar deviasi.
– Jika variabelnya berbeda dengan satuan pengukuran
berbeda, maka gunakan Koefisien Variasi (KV).

ADE 1: Pemeriksaan Pola Sebaran Data Page 23


B. Ukuran Sebaran Data
(Ukuran Dispersi)

– Jika skala pengukurannya ordinal, gunakan Rentang Antar


Kuartil (RAK)

RAK = Sebaran Tengah = d = qA - qB

Catatan :
RAK memberikan gambaran yang paling tepat dan tangguh
untuk suatu angkatan.

– Jika skala pengukurannya nominal, maka gunakan Indeks


Dispersi

ADE 1: Pemeriksaan Pola Sebaran Data Page 24


4) Diagram Kotak Garis
(Box Plot atau Box and Wishker)

• Merupakan bentuk grafik hasil ringkasan numerik.


• Ringkasan numerik yang diperlukan untuk
mengkonstruksikan box plot adalah Median (Me),
Kuartil Bawah (qB), Kuartil Atas (qA), Ekstrim Bawah
(xB) dan Ekstrim Atas (xA).
• Tukey, menuliskan ringkasan numerik secara
sistematis sbb. :

Me TRI
qB qA qB qA

xB xA xB xA

ADE 1: Pemeriksaan Pola Sebaran Data Page 25


4) Diagram Kotak Garis
(Box Plot atau Box and Wishker)

• Bentuk kotak mencerminkan xA


gambaran dari 50% data yang
terletak di bag. tengah, sedangkan
garis yang mencuat keluar dari qA
kotak tsb. menggambarkan
cakupan dari 25% data yang
Me
berada di ujung kumpulan data.
• Gambar kotak ini dibatasi oleh nilai
qB
qB dan qA, sedang nilai Me
ditunjukkan dg. garis di dalam kotak
tersebut .
xB
4) Diagram Kotak Garis
(Box Plot atau Box and Wishker)

Dalam stat. inferens sering diperlukan asumsi


bahwa suatu angkatan berdistribusi normal. Dist.
Normal memp. identifikasi khusus, yaitu simetris
terhadap rata-rata juga Me dan mempunyai
asimtot pada sumbu X (mempunyai ekor tipis).

ADE 1: Pemeriksaan Pola Sebaran Data Page 27


4) Diagram Kotak Garis
(Box Plot atau Box and Wishker)

• Secara eksploratif, hal ini dapat dideteksi melalui box plot


dengan memperhatikan :
a) Apakah garis di dalam kotak terletak ditengah-tengah?,
secara numerik :
Me = (qA + qB)/2 = (xA + xB) /2 = d/2
b) Apakah jarak antara xB dengan qB sama dengan jarak
antara xA dan qA, atau :
xA - qA = qB – xB

Jika dipenuhi keduanya, maka angkatan (kelompok data)


dikatakan simetris, tetapi jika hanya a) dipenuhi,maka dikatakan
angkatan tidak jauh dari simetri ( karena bagian yang terpenting
dari data terletak di tengah atau di dalam kotak).
Jika tidak dipenuhi keduanya, maka angkatan dikatakan tidak
simetri.
ADE 1: Pemeriksaan Pola Sebaran Data Page 28
4) Diagram Kotak Garis
(Box Plot atau Box and Wishker)

• Untuk mendeteksi pencilan (outlier):


1. Observasi luar (pencilan atau outlier): observasi yang
berada di luar batas (inner fences):
qB – 1,5 d dan qA + 1,5 d
2. Observasi jauh di luar : observasi yang berada jauh di
luar batas (outer fences):
qB – 3 d dan qA + 3 d

• Harga ekstrim perlu diketahui,karena:


– mungkin merupakan observasi yang salah,mis. salah
pengukuran.
– mungkin merupakan observasi yang memang lain
dari yang lain, sehingga perlu mendapat perhatian
khusus.

ADE 1: Pemeriksaan Pola Sebaran Data Page 29

Anda mungkin juga menyukai