Anda di halaman 1dari 39

PENGANTAR STATISIK

DAN ANALISIS DATA


1. Statistik dan Statistika
2. P
Populasi
l i dan
d Sampel
S l
3. Jenis-jenis Observasi
4. STATISTIKA DESKRIPTIF
SariNumerik
Penyajian Data
MA 2181 Analisis Data
8 Agustus 2011
Utriweni Mukhaiyar
Ilustrasi
2

Data banyaknya pelanggan yang datang ke


sebuah mini market di 15 hari tertentu pada bulan
Juli
l 2011.
26 337 76 49 95 69
9 833 87 39 95 59 83 833 87 4
46
Q1: Berapa rata-rata Q2 : Seberapa Q4 : Apakah rata-rata pelanggan
banyak
y p pelanggan
gg menyebarnya banyak yang
ya g datang
data g di
d mini market
a et tsb
yang datang di 15 pelanggan yang datang lebih besar dibanding mini
hari tsb? dalm 15 hari tsb? market lainnya

Q3 : Adakah hari
yang perlu
perhatian khusus?
St ti tik dan
Statistik d Statistika
St ti tik
3

Statistik : nilai
nilai-nilai
nilai ukuran data yang mudah
dimengerti.
Contoh : statistik IP mahasiswa ITB semester II
2010-2011

Statistika : ilmu yang berkaitan dengan cara


pengumpulan pengolahan,
pengumpulan, pengolahan analisis dan
pernarikan kesimpulan atas data.
Jenis-jenis
Jenis jenis Statistika
4

1. Statistika deskriptif: metode yang


berkaitan dengan pengumpulan dan
penyajian data.
2. St ti tik inferensi:
Statistika i f i metode
t d yang
berkaitan dengan analisis sampel untuk
penarikan
ik kesimpulan
k i l tentang
karakteristik populasi.
Populasi
p dan Sampel
p
5

Populasi

Sampel

setiap obyek populasi memiliki


kemungkinan/kesempatan yang Sampel
p Acak
sama untuk terpilih

hasil pengukuran atau pengamatan Data


Contoh Populasi dan Sampel
6

Akan dilakukan
Ak dil k k penelitian
li i apakah
k h tahun
h
pertama di ITB (TPB) memberikan pengaruh
terhadap perubahan berat badan mahasiswa.
mahasiswa
Untuk itu dilakukan pengambilan data pada
hari terakhir ujian TPB.
Populasi
Kendala: - sangat banyak, -menghabiskan
Se u u
Seluruh waktu -menghabiskan
waktu, menghabiskan biaya
mahasiswa
TPB ITB Kaidah Pengambilan
Keterwakilan sampel
? atas p
populasi
p ?? p ((Teknik
Sampel
Sampling)

Sampel
Contoh: tiap-tiap kelas TPB diambil secara
acak 10 orang mahasiswa.
Jenis-jenis
Jenis jenis Observasi
7

OBSERVASI / DATA

KUALITATIF KUANTITATIF

Nominal Ordinal/Rank Diskrit Kontinu

Tidak mengenal Mengenal urutan Berhubungan dengan Didasarkan pada suatu


proses menghitung, selang/interval
urutan dan operasi dan operasi dan pengamatan atas sehingga meliputi
aritmatika aritmatika himpunan
p terhitung.
g semua bilangan
g riil

Kapasitas hard disk Banyaknya


B k peserta Waktu tercepat mobil
Jnis bidang datar OSKM 2011 dari
((80GB, 160GB, p
F1 di setiap
(persegi,
(persegi lingkaran,
lingkaran fakultas
320GB, ...), kelas MIPA, banyaknya pertandingan, luas
jajaran genjang, dll),
penumpang pesawat yang antri di depan daerah hijau di kota
jenis kelamin , dll bioskop,p dll Bandung, g dll
(ekonomi, bisnis), dll
2008 by UM
Statistika Deskriptif
8

Metode yang berkaitan


dengan
g p pengolahan
g dan ppenyajian
y j
suatu gugus data sehingga
memberikan informasi yang
berguna.
b

bentuk distribusi
data
Karakteristik
Karakter st k D
Distribusi
str bus
9
mean, median, modus,
1. PARAMETER
1 Ukuran kuartil atas,
atas kuartil
DISTRIBUSI Pemusatan bawah, dll
Ukuran Range, simpangan baku,
variansi,, jjangkauan
g antar
Penyebaran
y kuartil, dll

Kemencengan skewness

Kelancipan kurtosis

2. BENTUK
2
Simetris mean = median
DISTRIBUSI
Menceng/skew
mean > median
P itif
Positif
Berpuncak Berpuncak Menceng/skew
mean < median
Jamak Tunggal
gg Negatif
g

# modus > 1 # modus = 1


CONTOH KASUS
10

Data banyaknya
b k pelanggan
l yang datang
d ke
k sebuah
b h mini
market di 15 hari tertentu pada bulan Juli 2011. (n = 15)
26 37 76 49 95 69 83 87 39 95 59 83 83 87 46

x1 x2 x9 x12 x15
Data yang diurutkan:
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95

x(1) x(2) x(9) x(12) x(15)


minimum maksimum
Adakah perbedaan dari penyajian kedua data di atas?
Ukuran Pemusatan &
11
P
Penyebaran
b D
Data
Ukuran pemusatan d
Uk data
statistik yang memberikan informasi dimana data
terkumpul dengan ukuran/jumlah tertentu.
tertentu
Contoh : Mean (rataan), kuartil bawah, kuartil
tengah (median),
(median) kuartil atas,
atas modus,
modus persentil,
persentil ...
Ukuran penyebaran data
statistik yang memberikan informasi bagaimana
data menyebar di sekitar pusat data.
Contoh : range
g (j
(jangkauan
g data),
), IQR
Q (j(jangkauan
g
antar kuartil), variansi, standar deviasi
(simpangan baku), ...
Ukuran Pemusatan Data
12

1. M
Mean (rata-rata)
( )
1 n
x xi
n i 1
Contoh :
x1 x2 ... x15
x
15
87 37 ... 46
67, 60
15
26 50
37 %
39data
46 49 59 )69 76 8350%
(awal)
(awal 83 data
83 87((akhir
87 95) 95
akhir)
13

x(8) 3x 2x 2x

2 Median
2.
Nilai tengah yang membagi dua kelompok
data sama banyak.
banyak

med = x(8) = 76
3. Modus
Nilai yang paling sering muncul.
modd = 83
4. Kuartil
14

26 25
37 %
39 46 49 25
59%69 76 832583% 83 87 87
25 95
% 95

q1 q2 = med q3
Kuartil bawah (q1) : q1 x n 1 q1 x 151 x(4) 46

4 4

h ((q2) : q2 x 2( n 1) x n 1
K til ttengah
Kuartil

4 2

q2 x 151 x(8) 766



2

Kuartil atas (q3) : q3 x 3( n 1) q3 x 3(151) x(12) 87



4 4
5. Persentil

15 26 37 39 46 49 59 69 76 83 83 83 87 87 95 95

p25 p50 = med p75


Persentil ke-i : x i ( n 1)

100

Persentil ke-50 : x 50( n 1) x n 1



100 2
median

Persentil ke-25 dan Persentil ke-75?

kuartil bawah kuartil atas


Ukuran Penyebaran Data
16

Data : x1, x2, x3, ..., xn


Rataan : x
Ukuran penyebaran data yang
melihat bagaimana SETIAP
(keseluruhan) observasi terpisah
dari pusat data.
n
Tidak memberikan informasi apa- (x x )
i
apa karena :
apa, i 1
i
n n

( x x ) x nx nx nx 0
i i
Jumlah Kuadrat (JK)
n

i
i 1 i 1
( x x ) 2

i 1
Ukuran Penyebaran Data
17

1 Jangkauan data (Range)


1.
R = 95 26 = 69
R = datamax datamin
2. Variansi 2
n
? 1
xi
i 1
n n
1
s2 i
n 1 i 1
( x x ) 2

n 1
xi
2

n s2 529,2571
529 2571
i 1

JKXX
3. Simpangan
p g Baku ((standard deviation))
s = s2 s 529, 2571 23, 01
4 Jangkauan antar kuartil
4.
dq = q3 q1 dq = q3 q1 = 87 46 = 41
Data Pencilan
18

Data yang nilainya berbeda jauh dari kelompok


data yang lain.
Bagaimana mendeteksi data pencilan ??
g dqq
1. Hitung dqq = 41
2. Hitung BBP = q1 k.dq BBP = 46 (1,5)(41) = -15,5
Pilih nilai
nil i k = 3/2 (tidak
(tid k mutlak)
mutl k)
3. Hitung BAP = q3 + k.dq BAP = 87 + (1,5)(41) = 148,5
4. Pencilan bawah < BBP tidak ada pencilan bawah
5. Pencilan atas > BAP tidak ada pencilan atas
SARI NUMERIK
Count (banyak data, n) 15
Sum (jumlah data)
19
1014
A
Average ((rata-rata)
t t ) 67 6
67.6
Median (kuartil tengah) 76 mean < median
Mode (modus) 83
Minimum 26
Maximum 95
Range 69
Standard Deviation 23.01 Menceng kiri
Variance 529.2571
Sk
Skewness -0.50**
Kurtosis -1.23*
25th Percentile (p
(persentil-25)) 46
50th Percentile (persentil-50) 76
75th Percentile (persentil-75) 87
Interquartile Range (dk) 41
* Perhitungan dengan Mic. Excel
Penyajian Data
20

1. Tabel Distribusi Frekuensi


2. Pi Chart
Pie Ch t
3. Dot Plot
4. Hi
Histogram
5. Diagram Batang Daun (stem - leaf)
6. Diagram Kotak Titik (box plot)
7. dll
Skala penggambaran harus diperhatikan dalam penyajian data
dalam bentuk grafik.
Penyajian data dalam bentuk grafik dapat dilakukan secara
manual maupun menggunakan software-software statistik seperti
Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
Tabel Distribusi Frekuensi
21

Data
D t banyaknya
b k pelanggan
l yang ddatang
t k
ke sebuah
b h
mini market di 15 hari tertentu pada bulan Juli 2011.
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas Titik Frekuensi Frekuensi
Interval Tengah (f) Kumulatif
Kelas
21-35
21 35 28 1 1
36-50 43 4 5
51-65 58 1 6
66-80 73 2 8
PRINSIP
81-95 88 7 15 DASAR
PELUANG
Bagaimana bentuk histogramnya?
Pie Chart
22

9%
10%

23% 58%

Pie chart merupakan grafik yang berbentuk lingkaran yang


mana setiap potongannya mewakili proporsi atau persentase
suatu komponen dari sebuah kelompok data (100%).
Pemakaian pie chart hanya cocok ketika menyatakan data
d l
dalam b t k proporsii dari
bentuk d i satu
t kelompok
k l k data.
d t
Dot Plot
23

3,5

2,5
frekuensi

1,5
f

0,5

0
0 20 40 60 80 100
nilai

Cara menggambarkan data dalam bentuk


titik dengan
titik, d memperhatikan
h tik frekuensi
f k i dari
d i
data yang bersangkutan
Titik ditumpuk
dit k diatas
di t nilai
il i data
d t yang
digambarkan.
Histogram
24

Histogram adalah gambar berdasarkan distribusi


frekuensi
Setiap frekuensi dipresentasikan oleh suatu segi empat
(rectangle).
Daerah setiap rectangle sebanding dengan frekuensinya.
Diagram Batang-Daun
25
(S
(Stem-Leaf)
L f)
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95

Stem atau batang, mirip dengan grup data pada


histogram, sedangkan leaf atau daun, mirip dengan frekuensi.
Stem atau batang adalah digit pertama yang terpenting yang ada
dalam bilangan yang membentuk harga data, sedangkan digit di
b l k
belakangnya akan
k merupakan k leaf
l f atau
t daun.
d
Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
Diagram Kotak
Kotak-Titik
Titik
26
((Box-Plot))
max
100
95
90
85 q3
80
76 q2
70 mean
60
50 47,5 q1
40

min
30
26
20
10
0

Box Plot digunakan untuk menyelidiki distribusi tanpa


menggunakan grup data seperti pada histogram dan
diagram batang daun.
Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan
datamax yang disusun secara terurut dengan membentuk
kotak.
Pencilan pada Box Plot
27

* pencilan atas
BAP (pagar atas)

upper whisker maksimum


q3
q2
mean

q1

lower whisker minimum

BBP (pagar bawah)


* pencilan bawah
*
Kelemahan dan Keunggulan
28
KELEMAHAN KEUNGGULAN

Tidak efektif untuk ukuran Cepat


DOT PLOT
data yang besar Nilai data asli dapat diperkirakan

Lama Histogram peluang dapat memberi


gambaran tentang distribusi populasi
HISTOGRAM Banyak perhitungan
Tidak menuntut ketelitian dalam
Nilai data tidak nampak mencatat
t t setiap
ti nilai
il i data
d t
Cepat
Tidak memerlukan perhitungan
BATANG-
BATANG Menuntut ketelitian
DAUN mencatat daun Nilai data asli dapat dilihat
Memudahkan perhitungan berbagai
parameter
Membutuhkan perhitungan Box plot dapat memberi gambaran
yang panjang tentang bentuk distribusi populasi
BOX PLOT Terdiri
e d da dari parameter-
pa a ete Efektif
e t u untuk
tu membandingkan
e ba d g a
parameter dari data yang bentuk distribusi beberapa kelompok
sudah diurutkan data sekaligus
Bentuk Distribusi Ideal
29
N
Normall

mean = median

Memiliki bentuk distribusi y


yang
g simetris,, yaitu
y :
Skewness = 0
Kurtosis = 3, (dalam software tertentu kurtosis normal = 0
Latihan 1
30

Suatu
S t jenis
j i polimer
li di
digunakan
k d l
dalam sistem
i t evakuasi
k i
pesawat terbang. Penting diperhatikan bahwa polimer
tersebut harus mampu melawan proses penuaan.
Di bil dua
Diambil d puluh
l h sampell polimer
li yang kemudian
k di
dibagi atas dua percobaan. Percobaan pertama (batch 1)
yang melibatkan 10 sampel dikenakan proses
percepatan penuaan dengan temperatur tinggi selama
10 hari. Sedangkan 10 sampel lainnya (batch 2) tidak
dikenakan proses apa-apa. Kekuatan daya rentang
(dalam psi) sampel-sampel tersebut diukur dan dicatat
sebagai berikut.
Batch 1 227 222 218 217 225 218 216 229 228 221
Batch 2 219 214 215 211 209 218 203 204 201 205

Q Apakah
Q: p p
percobaan p
proses p
penuaan memberikan
dampak pada kekuatan daya rentang polimer?
Sumber: Walpole (2006), hal.13
Latihan 1
31

- Keluarkan sari numerik yang mungkin


Ukuran pemusatan data : MEAN,
MEAN MEDIAN,
MEDIAN KUARTIL BAWAH
BAWAH-
ATAS
Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL,
VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan Apakah diperlukan???
KURTOSIS

Pilih plot yang informatif untuk menjawab pertanyaan tersebut


Misal:
Mi l BOXPLOT
Batch.1 Batch.II
SARI NUMERIK Mean 222 10
222,10 209 90
209,90
Variansi 23,6556 42,1000
32
Simp.Baku 4,86 6,49
Min.
Mi 216 201
Max. 229 219
Q1 218 204,25
Median 221,5 210
Q3 226,5 214,75

230 230
229
226,5
225 225
221,5
220 220
219
218
215 216 215 214,75

210 210 210

205 205 204,25

200 200 201


Batch 1
195 195 Batch 2

APA YANG DAPAT DISIMPULKAN?? @ UM


Latihan 2
33

Berikut adalah data historis gaji pegawai (dollar per


siswa pada 30 sampel sekolah di US bagian timur
awal tahun 1970).
1970)
3,79 2,99 2,77 2,91 3,10 1,84 2,52 3,22 2,45 2,14
2 67
2,67 2 52
2,52 2 71
2,71 2 75
2,75 3 57
3,57 3 85
3,85 3 36
3,36 2 05
2,05 2 89
2,89 2 83
2,83
23,13 2,44 2,10 3,71 3,14 3,54 2,37 2,68 3,51 3,37

Q:
1. Keluarkan sari numerik data di atas.
2. Hitungg variansi dengan
g 2 cara, bandingkan.
g
3. Buat box plot.
4. Ceritakan hasil olahan data Anda.

Dikumpul Senin, 15 Agustus 2011


Sumber: Walpole (2006), hal.29
Transformasi Data (pengayaan)
34

Transformasi dilakukan untuk mendapatkan


bentuk distribusi yang
ang lebih simetris.
simetris
Transformasi Tangga Tukey
-1/x2 -1/x x log (x) x x2 x3 10x

untuk bentuk distribusi : data awal untuk bentuk distribusi :


skewness positif skewness negatif
Merenggangkan
M k datadatayangberharga
d d b h k il
kecil Merapatkan
M k datadatayangberharga
d d b h k il dan
kecil d
dan merapatkan datadatayangberharga besar merenggangkan datadatayangberharga besar

Data contoh kasus : skewness = -0,5


, ((menceng
g kiri),
),
maka transformasi yang mungkin adalah x2, x3, dan 10x.
Transformasi Data (pengayaan)
C t h Kasus
Contoh K
35
x y = x2
Lebih mendekati simetris (skew = 0)
87 7569 dibanding sebelum transformasi
337 1369
369 (skew = -0,5)
0,5)
59 3481
49 2401
69 4761
95 9025
83 6889
87 7569
skew = -0,18
39 1521
95 9025
83 6889
76 5776
83 6889
26 676 ** Ketika data ditransformasi,
ditransformasi maka satuan
46 2116 dari data juga akan berubah
transformasi
Latihan 3
36

Mencari,mengumpulkan,mengolah,menga
nalisisdanmenarikkesimpulanatasdata
Andasendiri.
Sumberdata:bukuteks,TA,datapraktikum,koran,majalah,
internet,dll(sebaiknyadisesuaikandenganpermasalahanyang
mungkin dihadapi di prodi masing masing)
mungkindihadapidiprodimasingmasing).
Ceritakantentangdatatersebut(historidata).
TugasAdiketik(Mic.WordatauMic.Excel)dikumpul(online)Senin,
Tugas A diketik (Mic.Word atau Mic.Excel) dikumpul (online) Senin,
22Agustus2011
Contoh Tugas A
37

Berikut adalah nilai UTS 1 dari 55 mahasiswa MA2181


Analisis Data Tahun 2010.
70,5
70 5 75,5
75 5 68 85,5
85 5 84,5
84 5 78,5
78 5 58,5
58 5 82 75,5
75 5 84 64,5
64 5
53 69,5 92,5 62 68,5 74,5 59,5 83 79,5 89,5 79
53 54 84 66 79 78,5 84 80,5 74,5 74,5 64
74 5
74,5 73 75 82 73 67 5
67,5 70 68 75 70 5
70,5 74 5
74,5
70,5 62 61,5 81 58,5 43,5 74,5 39 77 87 71

Histori data:
Nilai UTS 1 ini diambil dari kelas 02 tahun 2010 yang mahasiswanya adalah
terdiri dari 54 mahasiswa angkatan 2009 dan 1 orang mahasiswa angkatan 2008
prodi Matematika ITB
UTS 1 dilaksanakan
dil k k pada
d hari
h i Rabu,
R b 133 Oktober
Ok b 2010.
20 0
Pelaksanaan ujian adalah paralel dengan kelas 01.
Soal ujian terdiri dari dua bagian, dimana Bagian I terdiri dari 4 soal Pilihan
Ganda dan 2 soal Pilihan Benar-Salah,
Benar Salah dan Bagian II terdiri dari 3 soal ESEI.
ESEI
Nilai maksimum adalah 100 (Soal UTS 1 dilampirkan).
Sumber: Nilai UTS 1 MA 2181 Analisis Data, Kelas: 02, Pengajar: Utriweni
Mukhaiyar
Lampiran Tugas A
38

@ UM
Referensi

Djauhari,M.A.,2001,CatatanKuliahAnalisisData.
Walpole,RonaldE.,et.al,Statistitic
Walpole, Ronald E., et.al, Statistitic forScientistand
for Scientist and
Engineering,8thEd.,2007.

39

Anda mungkin juga menyukai