Anda di halaman 1dari 48

SI 2102 ANALISIS STATISTIK

DAN PROBABILITAS
#2b Penyajian Data Statistik
Dr. Eng. Ir. Widyaningtias
KK TSA – Teknik Sipil – FTSL
EDUNEX ITB
Tabel Frekuensi
Penyusunan Tabel Frekuensi

• Pengelompokan data menjadi kelas

• Mencari jumlah item/sampel dalam setiap kelas

• Disusun agar data mudah di mengerti

Pertimbangan

• Pengelompokan tidak overlap

• Jumlah kelas umumnya antara 5 dan 18

• Jika memungkinkan, pengelompokan memiliki lebar yang sama, walaupun kadangkala lebar yang berbeda diperlukan

• Setiap observasi hanya terdapat dalam satu kelas


Jumlah Kelas
• Cukup kecil untuk menampilkan summary/resume
• Cukup besar untuk menampilkan karakteristik yang relevan
• Kelas dengan batas yang paling kecil harus memasukan nilai data terkecil
• Kelas dengan batas yang paling besar harus memasukan nilai data terbesar
Frekuensi relatif adalah
perbandingan antara
banyak kejadian dengan
banyak percobaan

Frekuensi kumulatif untuk suatu kelas adalah nilai


frekuensi untuk kelas tersebut ditambah dengan
jumlah frekuensi semua kelas sebelumnya.
Histogram
• Visually displays the information from a frequency table
• Plot the group boundaries on the horizontal axis-use a constant linear scale
• frequency (relative frequency) on the vertical axis
• Draw a vertical bar for each group
• where the area of the bar is proportional to the (relative) frequency
• for equal class widths, the height is proportional to the frequency
• Note that there are no gaps between the bars for continuous data.
• to convert to a relative frequency histogram, or a percentage histogram, just change
the vertical scale
Ogive
(Cumulative Frequency Polygon)
• Visually displays the information from a
frequency table
• On the horizontal axis, the group boundaries are
drawn on linear scale
• On the vertical axis, the percentages or
proportions
• For the first point, plot (lower boundary of lowest
class, 0)
• For each class, plot (upper class boundary,
cumulative frequency) on the x and y axis
respectively
• Join the points
Histogram dan Poligon Frekuensi
• Penyajian Histogram dapat disampaikan dalam poligon frekuensi
• Perbandingan dengan kelompok data lain dapat disajian secara superimpose
Review:
Measure of Central Tendency
• Advantages:
• it is easy to compute
• combines well
• i.e. the mean of combined
sample is the weighted
mean of two sample means
• where the weights are
proportions in each sample
• corresponds to the 'centre of
gravity' of the data values
• Disadvantages:
• It is affected by outliers
(pencilan) or extreme values
Median and Mode
• Advantages of the • Advantage of Mode
median • none
• As the central observation, • Disadvantage of the Mode
not affected by extreme
values • It may not exist
• If it exists, it may be far from
• Disadvantage of the "center" of data
median
• It doesn't combine well
• It requires ranking the
observations
Pemilihan Kecenderungan Tengah
• Mean
• Dipengaruhi oleh pencilan (outlier)
• Median
• Tidak dipengaruhi oleh pencilan dalam jumlah yang sedikit
• Umumnya median digunakan untuk skewed data (tapi tidak selalu)
• Menggunakan satu nilai central tendency tidak selalu cukup
• Berhati-hati pada saat merata-ratakan, lakukan itu hanya saat
kondisinya masuk akal (konteks)
• Mean dan Median selalu berbeda kecuali bagi data yang simetri
REVIEW:
Measure of spread
• Range
• the largest observation minus the smallest observation Xmax-Xmin
• Advantage of Range
• It is easy to calculate
• Disadvantage
• It is very influenced by outliers
• Interquartile Range (IqR)
• Shows the range of the middle 50% of observations
• Defined as the difference between third quartile & first quartile
Q3 - Q1
• Advantage
• It is not affected by outliers
• Disadvantage
• It is harder to calculate as it requires ranking
Contoh mencari IQR (INTERQUARTILE
RANGE)
REVIEW:
Standard Deviation
• This is the square root of variance
• advantages
• This statistic is in original units
• Directly comparable to the mean
• disadvantages
• It is influenced by outliers
In statistics, the number of
degrees of freedom is the number
of values in the final calculation of
a statistic that are free to vary.
The number of independent ways
by which a dynamic system can
move, without violating any
constraint imposed on it, is called
number of degrees of freedom.
(Wikipedia)

Hal ini disebabkan karena adanya degree of freedom


untuk sampel (n-1)
Coefficient of Variation

• This is the ratio of the standard deviation to the mean

• It is usually expressed as a percentage

• It measures the spread relative to the average size

jika koefisien variasi semakin kecil maka datanya semakin homogen dan jika koefisien
korelasi semakin besar maka datanya semakin heterogen.
REVIEW:
Variance
• Variance, σ2
• This is the "average" of the squared deviations
from the mean
Variance
• Note the use of the divisor of (n - 1) for the sample variance. This makes the sample
variance an unbiased estimator of the population variance

• Advantages
• good mathematical properties

• Disadvantages
• It is strongly influenced by outliers
• It is also in squared units
• hard to have a good idea about what size it
Estimating the mean and variance from
grouped data
• With grouped data
• have lost the information about where in the group each observation lies
• all we know is the group in which each observation lies
• Therefore we assume each observation in a group lies at the group midpoint
DISPERSION
• Is the amount of spread or scatter that occurs in data set

• If values in set are clustered tightly around their mean, measured


dispersion (std. dev.) is small

• if standard deviation is small, items grouped around their mean

• if standard deviation is large data values widely dispersed about their


mean
Aturan Empiris
• Untuk distribusi data yang berbentuk lonceng (mendekati normal)
• Sekitar 68% dari observasi terdapat dalam rentang satu standard deviasi dari
mean

• Sekitar 95% dari observasi terdapat dalam rentang dua standar deviasi dari
mean

• Sekitar 99.7% dari observasi terdapat dalam rentang tiga deviasi dari mean
QUARTILE
 Mengurutkan data acak
 Membagi 4 (empat) jumlah variabel
 Q1, Q2, Q3 → nilai tengah dari masing-masing variabel yang telah dibagi
 Q1 → nilai tengah dari setengah data/variabel terkecil
 Q2 → median
 Q3 → nilai tengah dari setengah data/variabel terbesar

Data ganjil Data genap


1. Tentukan quartile dari
2, 3, 5, 6, 7

1. Jumlah data adalah 223, tentukan


quartile nya

Kondisi 1

2. Jumlah data adalah 197,


tentukan quartile nya
Kondisi 2
DECILE
 Urutkan data acak
 Bagi menjadi 10 bagian sama besar → 9 nilai
 D1, D2, D3, D4, D5, D6, D7, D8, D9
 Letak decile
untuk data tunggal

untuk data kelompok


Di = desil ke-i
n = banyaknya data
F = frekuensi kumulatif kelas sebelum kelas desil
f = frekuensi kelas desil
b = tepi kelas bawah
l = lebar kelas
Kumpulan data yang dibagi menjadi sepuluh bagian yang
Notes: sama, maka diperoleh sembilan pembagi dan tiap
pembagi dinamakan desil/decile
DECILE • Bagaimana cara
menghitung decile:
• UNTUK DATA TUNGGAL
• Tentukan letak decile

• Hitung decile
Di = xi + (i/10(x1+1-xi)

5.66 1 letak D1 1.1 5.687


5.93 2 letak D2 2.2 6.122
6.89 3 letak D3 3.3 6.911
6.96 4 letak D4 4.4 7.044
7.17 5 letak D5 5.5 7.31
7.45 6 letak D6 6.5 7.528
7.58 7 letak D7 7.6 7.727
7.79 8 letak D8 8.7 8.07
8.14 9 letak D9 9.8 8.194
8.2 10
9.1 11
TENTUKAN NILAI
CONTOH
D4 DAN D6!
• Tentukan nilai D2 dan D9

Jumlah data

Lebar kelas
1.75 0.83 0.58 0.34
1.63
1.54
1.33
0.82
0.82
0.82
0.57
0.57
0.57
0.34
0.34
0.33
Cara mencari jumlah kelas
dan lebar selang 1
1.3 0.8 0.57 0.32
1.29 0.8 0.57 0.31
1.22 0.79 0.55 0.31
1.19 0.79 0.54 0.31
1.15 0.78 0.54 0.3
1.13 0.78 0.53 0.3
1.12 0.77 0.53 0.3
1.11 0.77 0.51 0.29
1.1 0.77 0.5 0.29
1.08 0.75 0.49 0.29 6
1.08 0.75 0.49 0.28
1.07 0.74 0.48 0.28
1.07 0.73 0.45 0.27
1.07 0.72 0.45 0.26
1.06 0.71 0.44 0.26 Cari nilai
1.06 0.71 0.43 0.26 tengah
1.03 0.71 0.43 0.26
1.01 0.7 0.43 0.25
bulat dari
1.01 0.69 0.43 0.24 ketiga nilai
1 0.68 0.42 0.24 yang
1 0.68 0.42 0.24
1 0.66 0.41 0.23
diperoleh
0.96 0.66 0.4 0.22
0.96 0.66 0.4 0.22
0.95 0.66 0.4 0.21
0.92 0.65 0.4 0.21
0.91 0.64 0.4 0.21
0.89 0.64 0.4 0.2
0.88 0.64 0.39 0.19
0.87 0.63 0.38 0.17
0.87
0.86
0.63
0.62
0.38
0.38
0.16
0.16
Lebar selang diperoleh dengan MENGURANGI data
0.85
0.85
0.61
0.6
0.37
0.35
0.15
0.12
terbesar dengan data terkecil DIBAGI jumlah kelas
0.84 0.59 0.35 0.1 (bulatkan ke atas)
0.83 0.59 0.35 0.09
Ruang
Sampel dan
Kejadian
DEFINISI
• Titik sampel (sample point) → elemen data (x)
• Ruang sampel (sample space) → seluruh kumpulan titik sampel (Ω)
• Kejadian (event) → kumpulan satu atau lebih titik sampel yang membentuk
subset/sub-himpunan (X)
KEJADIAN ACAK
• Kejadian acak (Random Event)
• suatu percobaan telah ditampilkan dan deret data pengamatan diambil dibawah kondisi yang seragam,
• tidak ada bias mengarah hasil tertentu.
• gabungan semua hasil yang mungkin harus dipertimbangkan pada awalnya (hasil individu tidak dapat diramalkan).
KEJADIAN KHUSUS (SPECIAL EVENT)
1. Peristiwa mustahil
(impossible event, Φ)
• Himpunan kosong
(empty set)

2 Peristiwa tertentu (certain event, S)


• Semua titik sampel
• Merupakan ruang sampel itu sendiri
3 Peristiwa komplementer (complementary event, Ē)
• Semua peristiwa di luar event (E)
Ruang Sampel (Ω)
• Adalah sekumpulan semua kemungkinan kejadian yang muncul dari percobaan konseptual atau dari suatu operasi
yang melibatkan suatu peluang kejadian.
Contoh: reservoir storage. Jumlah air S yang disimpan dalam sebuah reservoir bervariasi terhadap waktu dari 0 sampai
c, kapasitas reservoir aktif, mempunyai efek gabungan inflow dan outflow.
• Ruang sampel dari percobaan, diukur sebagai volume air dalam reservoir untuk waktu tertentu, dapat ditentukan
sebagai Ω Ξ {S: 0 ≤ S < c}→ set titik-titik sampel dalam interval (0,c).

Flood Control Storage S

c
ω Ac

c-ω c-ω Ω A

Life Storage

Dead Storage
Kejadian/Event (A)
• sekumpulan titik-titik sampel dalam ruang sampel Ω dari suatu percobaan.
• Suatu kejadian → titik sampel tunggal (kejadian simple atau elementary), atau dapat terdiri
dari dua atau lebih titik-titik sampel (compound event).

Flood Control Storage S

c
ω Ac

c-ω c-ω Ω A

Life Storage

Dead Storage
CONTOH
• Suatu kejadian (A) adalah bagian dari ruang sampel Ω.
• Contoh: Reservoir Storage. Lebih mudah untuk menetapkan reservoir storage S (KEJADIAN) dengan
pernyataan k (JUMLAH KEJADIAN) berurutan ω1 , ω2 , … , ωk . Ruang sampel terkait diberikan dengan set:
Ω Ξ {Ai , dengan i = 1, 2, 3, … , k}
dimana Ai Ξ {S: (i – 1)c/k ≤ S < ic/k}, i = 1, 2, … , k
c : volume air maksimum
Flood Control Storage S

c
ω Ac

c-ω c-ω Ω A

Life Storage

Dead Storage
ω4
S Ruang sampel
C Ω A B Bc E
A4
ω3
A3
ω2
A2
ω1
A1
0
(a) Kejadian
(b) (c)
Dead Storage
(a) Reservoir storage diwakili oleh 4
A4 A1 A4 A1 A4 A1 A4 A1 keadaan, ω1 , ω2 , ω3 , dan ω4
(b) Lebar dari kotak2 pada sebelah kanan
A3 A2 A3 A2 A3 A2 A3 A2
adalah berkaitan dengan frekuensi
C ED A relatif pada keadaan tersebut.
(c) Kejadian (events) ditunjukkan dalam
A4 A1 A4 A1 A4 A1 A4 A1
teks yang diwakili oleh kotak pada
A3 A2 A3 A2 A3 A2 A3 A2 pusat pada kanannya dengan area
berkaitan dengan frekuensi relatif
B=Dc E D=Bc
terhadap kejadian (events).
A4 A1 A4 A1 A4 A1 (d) Diagram lingkaran menunjukkan
semua kemungkinan kejadian (warna
A3 A2 A3 A2 A3 A2
gelap) dan juga diluar keadaan (tanpa
C+D Ω Ωc warna). Sebagai contoh,
(d) A Ξ A4 berarti 3c/4 ≤ S < c
ω4
S Ruang sampel
C Ω A B Bc E
A4
ω3
A3
ω2
A2
ω1
A1
0
(a) Kejadian
(b) (c)
Dead Storage

• Tinjau empat keadaan reservoir: ωi Ξ {S : (i – 1) c/4 ≤ S < ic / 4} , i = 1, 2, …


, 4. Kejadian A4 didefinisikan sebagai
A = ω4 Ξ {S : 3c/4≤S<c}
adalah kejadian simpel, karena berkaitan dengan titik sampel tunggal.
• Untuk yang lain, kejadian B ditentukan sebagai
B = ω1 + ω2 Ξ {S : 0≤S<c/2}
adalah kejadian gabungan karena terdiri dari kumpulan dua kejadian simpel,
• Contoh lain: A1 = ω1 Ξ {S : 0≤S<c/4} dan A2 = ω2 Ξ {S : c/4≤S<2c/4}.
Kemungkinan kejadian lainnya ditunjukkan dengan diagram lingkaran.
Null event, Intersection, dan Union (1)
• Null event, intersection, dan union adalah tiga hubungan penting
antara kejadian-kejadian.
• Intersection → fungsi “dan”,
• Union → “dan/atau”.
• Terdapat banyak cara dimana kejadian2 dalam ruang sampel
berhubungan.
• Kejadian A1 dan A2 adalah mutually exclusive atau disjoint jika
peristiwa satu kejadian diluar peristiwa kejadian yang lain.
• tidak ada titik2 dalam A1 yang terdapat dalam A2 dan sebaliknya.
• A1 dan A2 bersama merupakan null event
• Dinyatakan dengan A1A2 = A1 ∩ A2 = Ø.
• Contoh, kejadian A Ξ {S : 3c/4 ≤ S <c} dan B Ξ {S : 0 ≤ S < c/2}
adalah mutually exclusive.
ω4
S
C Ω A B Bc E
A4
ω3
A3
ω2
A2
ω1
A1
0
(a)
(b) (c)
Dead Storage

A4 A1 A4 A1 A4 A1 A4 A1

A3 A2 A3 A2 A3 A2 A3 A2

C ED A

A4 A1 A4 A1 A4 A1 A4 A1

A3 A2 A3 A2 A3 A2 A3 A2

B=Dc E D=Bc

A4 A1 A4 A1 A4 A1

A3 A2 A3 A2 A3 A2

C+D Ω Ωc
(d)
Null event, Intersection, dan Union (2)
• Kejadian A1 dan A2 adalah non-mutually exclusive jika memiliki beberapa titik sampel
yang merupakan intersection (perpotongan).
• A1 ∩ A2 atau A1A2 (A1 ∩ A2 ≠ Ø .
• Contoh A ∩ Bc adalah kejadian {S : 3c/4 ≤ S < c}, bahwa A = A4 , berkaitan dengan state
ω4.

ω4
S
C Ω A B Bc E
A4
ω3
A3
ω2
A2
ω1
A1
0
(a)
(b) (c)
Dead Storage
Null event, Intersection, dan Union (3)
• Union (gabungan) dari dua kejadian A1 dan A2 mewakili peristwa gabungannya dan ini terdiri
dari kejadian yang mempunyai semua titik2 sampel dalam A1 dan A2 .
• A1 U A2 , atau A1 + A2 .
• Sebagai contoh diatas gabungan A1 U A2 adalah
kejadian {S : 0 ≤ S < c/2}, yaitu B.

ω4
S
C Ω A B Bc E
A4
ω3
A3
ω2
A2
ω1
A1
0
(a)
(b) (c)
Dead Storage
Diagram Venn dan Ruang Kejadian A
B
• Kumpulan titik-titik didalam suatu ruang
Ω Ω A = Ac Ω B = Bc
sampel, seperti ditunjukkan pada gambar
(a) (b) berikut disebut set. (c)

Union: A+B Intersection: AB


• Gambar tersebut menunjukkan urutan
diagram Venn. A

Ac B
• Diagram seperti ini menyediakan visual yang
(A+B)c (A B)c (A+B)c
sangat berguna mewakili set-set dan set
(d) (e) operasi seperti complement,
(f) union,
intersection, dan kombinasi lainnya.

A Bc AB • Karena titik-titik sampel, ruang sampel, dan


(A+B)+C=
C kejadian (events) adalah set-set, tipe ilustrasi
Ac B =A+(B+C)
Ac Bc ini dapat digunakan untuk menunjukkan
kejadian-kejadian didalam sebuah ruang
(g) (h) (i)
sampel dan hubungan penting diantara
(AB)C=A(BC) kejadian-kejadian.

AB+C=
(A+B)C=
(A+C)(B+C)
=AC+BC

(j) (k) (l)


Diagram Venn dan Ruang Kejadian A
B

• Kumpulan semuac kejadian


Ω Ω A = Ac ΩB=B
berkenaan dengan suatu percobaan
(a) (b) (c)
dan kombinasi yang mungkin dari
Union: A+B Intersection: A B
kejadian-kejadian disebut sebagai
A
ruang kejadian (event space),
Ac B

(A+B)c (A B)c
• dinyatakan (A+B)
dengan
c Ã.
(d) • Set ini mencakup(f)semua hasil yang
(e)
mungkin dari percobaan termasuk
A Bc AB
sampel Ω
didalam ruang(A+B)+C=
C
Ac B =A+(B+C)
Ac Bc

(g) (h) (i)

(AB)C=A(BC)

AB+C=
(A+B)C=
(A+C)(B+C)
=AC+BC

(j) (k) (l)


A
B

Ω Ω A = Ac Ω B = Bc

(a) (b) (c)

Union: A+B Intersection: A B

A A
B Ac B

(A+B)c (A B)c (A+B)c

(d) (e) (f)

A Bc AB (A+B)+C=
C
Ac B =A+(B+C)
Ac Bc

(g) (h) (i)

(AB)C=A(BC)

(A+B)C=
=AC+BC AB+C

(j) (k) (l)


• Union dan intersection dari kejadian pada diagram tersebut disebut associative
atau distributive.
• Interior dari kotak A dan B dlm gbr (b) dan (c) mewakili dua kejadian simpel.

A
B

Ω A = Ac Ω B = Bc

(b) (c)

• Titik ω mewakili suatu hasil dari kejadian A.


• Union A + B dan intersection AB ditunjukkan pada gbr (d) dan (e).
Union: A+B Intersection: A B

A
B
(A+B)c (A B)c

(d) (e)
• Gbr (f) dan (g) menunjukkan kejadian seperti Ac B dan A Bc. Kejadian
C, dimana memotong A dan B, ditunjukkan pada gbr (h).

A A Bc AB
Ac B C
Ac B
(A+B)c Ac Bc

(f) (g) (h)


• Compound events dari gambar (i) dan (j) adalah
(A + B) + C = A + (B + C), atau (A U B) U C = A U (B U C)
dan
(A B) C = A (B C), atau (A ∩ B) ∩ C = A ∩ (B ∩ C)

(AB)C=A(BC)

(A+B)+C=
=A+(B+C)

(i) (j)
Kejadian ini dikatakan associative karena melibatkan pertambahan atau
perkalian kejadian simpel. Di sisi lain compound events:
(A + B) C = AC + BC, atau (A U B) ∩ C = (A ∩ B) U (B ∩ C)
dan
AB + C = (A + C) (B + C), atau (A ∩ B) U C = (A U B) ∩ (B U C)
diberikan pada gambar (k) dan (l), adalah distributive karena terjadi dari
pertambahan dan perkalian kejadian simpel.

(A+B)C=
=AC+BC AB+C

(k) (l)

Anda mungkin juga menyukai