Anda di halaman 1dari 116

Oleh : Soewono

MENJELASKAN SESUATU YANG


TELAH TERJADI
ALAT UNTUK MENGANALISA DATA
EXPLORATORY DATA ANALYSIS
(descriptive statistics)

JOHN WILDER TUKEY

STATISTICS

CONFIRMATORY DATA ANALYSIS


Inductives statistics
Inferential statistics
Statistical inference
TO MAKE INFERENCE ABOUT A
POPULATION BASED UPON
INFORMATION CONTAINED IN
SAMPLE

MENGHITUNG KEMUNGKINAN
SESUATU YANG AKAN TERJADI

HARUS DILANDASI OLEH TEORI


PROBABILITAS
1

Oleh : Soewono

STEM PLOT
STEM-and-LEAF PLOT
STEM-and-LEAF DISPLAYS
STEM-and-LEAF DIAGRAM

EDA
EXPLORATORY DATA
ANALYSIS

SEBAGAI ALAT UNTUK


MENGETAHUI DISTRIBUSI DATA

BOX PLOT
THE ART of DISPLAYING DATA IN
AN INFORMATIVE AND VISUALLY
ATTRACTIVE FORMAT

X S , Q1 , Q2 , Q3 , X L

BOX-and-WHISKER PLOT
BOX-and-WHISKER DISPLAYS

FIVE-NUMBER-SUMMARY

Oleh : Soewono

DOT PLOTS

MERUPAKAN TAMPILAN GRAFIK YANG PALING


SEDERHANA, MUDAH DIBUAT, DAN SANGAT
BERMANFAAT APABILA DATA KURANG DARI 30.
(SMALL SAMPLE)

BENTUK DARI DOT PLOT ?


SUMBU/GARIS HORIZONTAL MENYATAKAN SKALA,
SEDANG NILAI DATA OBSERVASI DILAMBANGKAN
DENGAN TITIK (DOTS) DIATAS SKALA TERSEBUT

BOX PLOTS
ISTILAH ASLINYA ADALAH :
BOX-and-WHISKER PLOTS
BOX-and-WHISKER DISPLAYS
KOTAK (BOX) BERBENTUK PERSEGI PANJANG, DILETAKKAN DITENGAHTENGAH DIAGRAM; LEBAR KOTAK/SISI PENDEK KOTAK YANG DILETAKKAN
DALAM BENTUK GARIS VERTIKAL MELAMBANGKAN QUARTILES Q1danQ3
OLEH TUKEY DISEBUT HINGES
3

Oleh : Soewono

MEDIAN DINYATAKAN DENGAN LAMBANG + (plus)


SELISIH DARI Q3 Q1 DISEBUT INTERQUARTILE RANGE ATAU H-SPREAD.

IQR Q3 Q1 QS

QUARTILE SPREAD

Oleh : Soewono

STEM PLOT :

DIAGRAM BATANG DAUN


ATAU DIAGRAM DAHAN DAUN

YANG MEMPUNYAI MANFAAT SBB :


a.MERUPAKAN TEKNIK YANG SERBAGUNA DALAM
MENDESKRIPSIKAN DATA STATISTIK
b.SALAH SATU CARA TERCEPAT UNTUK
MENGGAMBARKAN BENTUK DISTRIBUSI, DENGAN
MENGUPAYAKAN PERHITUNGAN YANG SEMINIMAL
MUNGKIN
c.DIAGRAM INI MERUPAKAN ALTERNATIF YANG CUKUP
BAIK, KARENA SELAIN MEMBERIKAN GAMBARAN
BENTUK DISTRIBUSI, JUGA MENAMPILKAN NILAI
PENGAMATAN SECARA UTUH

n BESAR SEKALI
HISTOGRAM
5

Oleh : Soewono

ALOKASIKAN NILAI PENGAMATAN


KE DALAM SALAH SATU KELAS
YANG TELAH DITETAPKAN

HISTOGRAM

PROSES ?

PERAGA YANG POPULER


UNTUK MENGGAMBARKAN
PERILAKU DISTRIBUSI DATA
BUAT KOTAK/PERSEGI PANJANG
PADA SETIAP KELAS, DENGAN
TINGGI KELAS MASING-MASING
MERUPAKAN FREKUENSINYA

Oleh : Soewono

DIGIDOT PLOT ?
TIME SERIES
TIME SEQUENCE

SEKUMPULAN DATA YANG


DICATAT SELAMA PERIODE
TERTENTU
TIME SERIES PLOT ADALAH
GRAFIK DIMANA SUMBU
VERTIKAL MENYATAKAN NILAI
PENGAMATAN DARI VARIABEL
DAN SUMBU HORIZONTAL
MENYATAKAN WAKTU

TRENDS
CYCLES
7

Oleh : Soewono

KOMBINASI ANTARA :
STEM-and-LEAF PLOT
dengan
TIME SERIES PLOT

DIGIDOT PLOT

J. STUART HUNTER

Oleh : Soewono

WARNING :
BOX PLOTS PRODUCED AS OUTPUT FROM COMPUTER SOFTWARE
MAY DIFFER SLIGHTLY IN SHAPE FROM BOX PLOTS CREATED BY
OUR METHOD THROUGH HAND CALCULATION.
THIS IS BECAUSE DIFFERENT ROUNDING MECHANISMS IN
DETERMINING THE QUARTILES ;
ANY DIFFERENCES SHOULD BE NEGLIGIBLE
BOX PLOTS SOMETIME ARE CALLED
BOX-AND-WHISKER PLOTS

Oleh : Soewono

STEM PLOT

STATISTIK LIMA SERANGKAI

BOX PLOT

BENTUK DISTRIBUSI

10

BOX PLOT

INNER FENCES

TO THE LEFT AND


RIGHT OF THE BOX AT
A DISTANCE OF 1,5
TIMES THE IQR

Oleh : Soewono

OUTER FENCES

AT THE DISTANCE OF
3 TIMES THE IQR

OBSERVATIONS THAT LIE BETWEEN THE INNER AND


THE OUTER FENCES ARE CALLED SUSPECTED OUT
LIERS
(OUTLIERS)
OBSERVATIONS THAT LIE BEYOND THE OUTER FENCES
ARE CALLED OUTLIER
(EXTREME OUTLIERS)
11

Oleh : Soewono

PENCILAN
(OUTLIER)

JAUH
(PENCILAN DALAM)

JAUH SEKALI
(PENCILAN LUAR)

Q3 L xi Q3 2 L

xi Q3 2 L

ATAU

ATAU

Q1 2 L xi Q1 L

xi Q1 2 L

L 1,5 Q3 Q1
IQR Q3 Q1 H spread QS

p A Q3 L
LOWER INNER FENCE : pB Q1 L
UPPER OUTER FENCE : PA Q3 2 L
LOWER OUTER FENCE : PB Q1 2 L
UPPER INNER FENCE :

QUARTILE SPREAD

12

Oleh : Soewono

EXPLORATORY DATA ANALYSIS


IS TO DEVELOP a FIVE NUMBER SUMMARY

XS

Q1 Q2 Q3

XL

X
CONSTRUCT
BOX-AND-WHISKER PLOT

PROVIDES OF GRAPHICAL REPRESENTATION OF THE DATA THROUGH.


ITS FIVE-NUMBER SUMMARY
13

Oleh : Soewono

PROPERTIES OF NUMERICAL DATA

The three major properties that describe


a set of numerical data, are :
1. CENTRAL TENDENCY
2. VARIATION
3. SHAPE

14

Oleh : Soewono

NUMERICAL DATA PROPERTIES


CENTRAL TENDENCY

VARIATION

SHAPE

MEAN

RANGE

MEDIAN

INTERQUARTILE
RANGE

MODE

VARIANCE

MIDRANGE

STANDARD
DEVIATION

MIDHINGE

COEFFICIENT of
VARIATION

BOX-AND-WHISKER PLOT
15

Oleh : Soewono

1 n
MEAN: X X i
n i 1
(point of balance)
balancing point

CENTRAL TENDENCY
(measure of central tendency)

MODE :
X
(peak point)

MEDIAN (half position)

X n 1 , if n odd number

1
X n X n , if n even number
1
2 2
2

=> see next pages . .


16

Oleh : Soewono

MIDRANGE

1
XS XL
2

MIDHINGE

1
Q1 Q3
2

1
TRIMEAN Q1 2Q2 Q3
4
QUARTILE = HINGES

Q1
Q3

=LOWER QUARTILE = LOWER HINGE =


=UPPER QUARTILE = UPPER HINGE =

Q 0, 25

Q 0, 75

17

Oleh : Soewono

A ROBUST VARIABILITY MEASURE

INTERQUARTILE RANGE / QUARTILE SPREAD


MIDSPREAD / HINGE SPREAD

IQR Q3 Q1
VARIATION
(measure of variation)

RANGE =

XL XS

VARIANCE
1
S2
n 1
S
CV 100%
X

X
n

i 1

1

N
2

n 1

X
i 1

nX

18

Oleh : Soewono

SHAPE

the manner in which the data


are distributed

SYMMETRICAL
(ZERO-SKEWED)
mean = median

NOT SYMMETRICAL
(SKEWED)

NEGATIVE
LEFT-SKEWED
mean<median

POSITIVE
RIGHT-SKEWED
mean>median

19

Oleh : Soewono

FIVE-NUMBER SUMMARY
consist of

XS

Q1

Q2

Q3

XL

0%

25%

50%

75%

100%

TO CONSTRUCT A BOX-AND-WHISKER PLOT

A GRAPHICAL REPRESENTATION OF THE DATA THROUGH


ITS FIVE NUMBER SUMMARY

20

Oleh : Soewono

FENCES
outlier thresholds
INNER
FENCES

OUTER
FENCES

identitiy
OUTLIER

IF <OUTLIER<OF

Observations falling
beyond the OF

mild outliers
suspect* outliers

extreme outliers
o

An observation that is unusually large or


small relative to the other values in a
data set is called an OUTLIER

highly
suspect outliers
21

Oleh : Soewono

Definition :

For a ranked data set, any points that lie outside the
interval A Q1 1,5 IQR, Q3 1,5 IQR
and yet are still inside the large interval B Q1 3IQR, Q3 3IQR
are called mild outlier.
Furthermore, any points in the data set that lie outside
interval B are classified as extreme outliers.

The end points of interval A are called INNER-FENCES,


and the end points of interval B are called OUTER-FENCES.
DDM :
IF : 1,5 IQR

dibawah Q1
1,5 IQR diatas Q3

OF :

3IQR dibawah Q1
3IQR diatas Q3
22

Oleh : Soewono

THE QUICK BOX PLOT


XS

Q1

50

Q2

Q3

XL

100

scale

all of the data


smallest
quarter of the data

middle half of the data

largest
quarter of the data

scale
23

Oleh : Soewono

WHISKERS ?
THE WHISKERS ARE THE LINES THAT EXTEND OUTWARD FROM THE
ENDS OF THE BOX TO A DISTANCE OF AT MOST 1,5 UNITS OF IQR.
More precisely, the whisker on the right starts at Q3
and terminates at the number min X , Q 1,5 IQR .

SIMILARLY
The whisker on the left, starts at Q1
and terminates at the number max

X S , Q1 1,5IQR .

ANY VALUE BEYOND THESE LIMITS


IS MARKED WITH AN ASTERISK (*)

24

Oleh : Soewono

CONTOH SOAL
DATA DIBAWAH INI MENYATAKAN NILAI HASIL UJIAN AKHIR SEMESTER
MATA KULIAH STATISTIKA, YANG DIIKUTI OLEH 30 PESERTA UJIAN.
48

59

50

50

65

56

95

62

77

57

85

67

60

65

57

60

50

47

25

77

69

58

50

30

60

56

60

60

20

47

a.SUSUNLAH DIAGRAM BATANG DAUN DARI DATA DIATAS


b.DENGAN MENGGUNAKAN DIAGRAM KOTAK GARIS (BOX-PLOT), PERIKSA
APAKAH ADA PENCILANNYA (OUTLIER)
c.BILA ADA PENCILANNYA, DATA KEBERAPA DAN BERAPA BESARNYA
d.DARI PERTANYAAN a/b APAKAH DAPAT DILACAK MENGENAI KEMENCENGAN
(KEMENJULURAN) DARI DATA DI ATAS ?

25

Oleh : Soewono

PERTANYAAN :

TUGAS
Data di bawah ini menyatakan sampel sebanyak 25,mengenai lama waktu job
CPU (dalam detik) :
1.17 1.61
1.16
1.38
3.53
1.23 3.76
1.94
0.96
4.75
0.15 2.41
0.71
0.02
1.59
0.19 0.82
0.47
2.16
2.01
0.92 0.75
2.59
3.07
1.40
Pertanyaan seperti di atas

26

Oleh : Soewono

SOAL SOAL
1.Andaikan X vrd dengan pmf sebagai berikut :
1
1
1
p 1 ; p 2 ; p 3 p 4
2
4
8
Pertanyaan, tentukan :
F x a.
berikut grafiknya
P X b.
1 ; P 1 X 3 ; P 1 X 3
c. Jika Y= 2X + 3, tentukan Var(-1/2 Y)
2.a. Buktikan bahwa fungsi p(x) yang didefinisikan
3 1 x
; x 0,1, 2,....

p x 4 4

0
;untuk x lainnya

adalah pmf dari vrd X


b. Tentukan
P X : 2(i)
P X 2(ii)

P X (iii)
1

27

Oleh : Soewono

3. Misalkan vrd X mempunyai pmf sebagai berikut :


1
; x 1, 0,1

pX x 3
0 untuk x lainnya

Pertanyaan :
a. plot p X x dan hitung E(X) berikut Var X
b. ulangi soal di atas apabila pmf :
1
; x 2, 0, 2

pX x 3
0 untuk x lainnya

4. Diketahui :

0 ;x 0
1
1

F x x
;0x
2
2

1 ;x

Pertanyaan : a. Skets grafik F(x)


b. Macam apa VR X tersebut?
28

Oleh : Soewono

c. Hitung :

P X
4

P 0 X

P X 0

P 0 X
4

5. PDF dari VRK X, diketahui sebagai berikut :

k x x 2 ;0 x 1

fX x

; x lainnya

k Konstanta
Pertanyaan :
Tentukan FX x dan sket grafiknya

29

Oleh : Soewono

6. Suatu VR X didefinisikan

FX x sebagai berikut :

0 ;x 0

F x
x; 0 x 1
2
k ;1 x

Pertanyaan, tentukan :
a. Nilai dari k
b. Tipe dari VR X
c. 1

X 1 ; P
X 1 ; P X 2
2
2

30

Oleh : Soewono

7. Data di bawah ini menyatakan hasil ujian tengah semester Mata Kuliah
Probstat/D3/STT Telkom :
97
53
73
84
90
95
98
92
25
68
63
15
66
72
90
87
41
58
87
52
69
67
83
54
67
70
78
56
80
97
85
52
49
45
98
91
81
74
67
98
Pertanyaan:
1. Susunlah diagram batang daun
2. Box-plot (diagram kotak garis), periksa, apakah ada pencilannya
3. Komentar Saudara bagaimana ?

31

Oleh : Soewono

1.

Pengertian
Peluang dari suatu event, dinyatakan dalam
#A
bentuk
P A :
#
.Suatu kendala dalam merealisir formula
di atas, yaitu apabila banyaknya sample point
sangat besar. Tidak mungkin untuk mencatat
semua outcomes yang mungkin terjadi.
Cara terbaik untuk mengatasi kendala tersebut,
menggunakan cabang/bagian matematika yang
disebut analisa kombinatorika yang berurusan
dengan teknik mencacah.

32

Oleh : Soewono

2. Analisa Kombinatorika (Permutasi & Kombinasi)


COMBINATORICAL ANALYSIS IS THE CALCULUS OF
COUNTING. Dalam counting techniques/teknik

mencacah, apa yang dicacah? Teknik mencacah dapat


memecahkan masalah yang berkaitan dengan peluang
suatu event, dengan mencacah banyaknya sample
point dalam sample space tanpa mendaftarkan terlebih
dahulu unsur-unsurnya. Prinsip dasar mencacah,
sering disebut : kaidah penggandaan (the
multiplication principle)

33

Oleh : Soewono

PROBABILITY THEORY
STATISTICS
COMBINATORICAL ANALYSIS
SELECTIONS
COMMITTEES

ARRANGEMENTS
LINEUPS

COMBINATIONS

PERMUTATIONS

THE CALCULUS of COUNTING


THE ARITHMETIC of COUNTING
BRANCH MATHEMATICS THAT DEALS
WITH COUNTING

34

Oleh : Soewono

FOUNDAMENTAL PRINCIPLE COUNTING


(PRINSIP DASAR MENCACAH)

Kaidah Penjumlahan
-The Addition Principle
-The Sum Rule

Mensyaratkan himpunan/
kumpulan obyek yang disjoint

Kaidah Perkalian
-The Multiplication
Principle
-The Product Rule
Mensyaratkan suatu prosedur yang
dibagi dalam tingkat/tahap yang
terurut dari susunan out comes
yang berbeda

35

Oleh : Soewono

Andaikan tugas-tugas T1, T2, T3, . Tn


dimana dikerjakan masing-masing dalam :
n1, n2, n3, . . . nn cara, dan tidak ada dua
tugas yang dapat dikerjakan dalam waktu
yang bersamaan maka: banyaknya cara
untuk mengerjakan tugas-tugas tersebut,
ada:
n1 + n2 + n3 + . . . + nn cara

36

Oleh : Soewono

Andaikan k operasi disusun secara berurutan,


dimana : Operasi 1 dapat dilakukan dalam n1 cara
Operasi 2 dapat dilakukan dalam n2 cara
.
.
.
Operasi k dapat dilakukan dalam nk cara
Maka :
Banyaknya cara untuk menyusun k operasi dapat
dilakukan dalam :
N = n1. n2. n3 . nk cara
37

Oleh : Soewono

ANY COLLECTION
OF OBJECTS

POPULATION

IS THE COLLECTION OF
ALL POSSIBLE OBSERVATION
OF A SPECIFIED
CHARACTERISTIC OF INTEREST

SUBSET of THIS POPULATION


CALLED a SAMPLE

INDIVIDUAL IN THE POPULATION HAS THE


SAME CHANCE OF BEING CHOSEN FOR
THE SAMPLE, THE SAMPLE CALLED
A RANDOM SAMPLE
CENSUS : THE MEASUREMENT OR EXAMINATION
OF EVERY ELEMENT IN THE POPULATION
38

Oleh : Soewono

POPULATION

SAMPLE

WR

RANDOM SAMPLE

WOR

DRAWING WR SIMPLY
MEANS THAT EACH TIME
YOU DRAW THE
SITUATIONS IS THE SAME

ORDERED

UNORDERED

ORDERED

UNORDERED

39

Oleh : Soewono

NUMBER OF POSSIBLE
ARRANGEMENTS
Of SIZE k FROM n OBJECTS
WITHOUT
REPLACEMEN
T

ORDERED
UNORDERED

n!
nk!


n
k

WITH
REPLACEMEN
T
k

n k 1
k

40

Oleh : Soewono

BANYAKNYA PERMUTASI YANG BERBEDA DARI k TYPE YANG


BERASAL DARI n OBYEK, DIMANA ; TERDAPAT :

n1
n2

..
..

nk
DAN

TYPE YANG SAMA


TYPE YANG SAMA

TYPE YANG SAMA

n n1 n2 ... nk

ADALAH :

P n; n1 , n2 ...nk

n!

n1 ! n2 ! ... nk !

41

Oleh : Soewono

Suatu kantong dari kain berisi bola :


6 bola warna merah
4 bola warna putih
8 bola warna biru
a. Lima bola diambil dari kantong tersebut dengan
kondisi WR. Berapa peluang terambilnya tiga bola
warna merah.
b. Lima bola diambil dari kantong tersebut dengan
kondisi WOR. Berapa peluang terambilnya tiga bola
warna merah.
c. Lima bola diambil dengan kondisi WR. Berapa
peluang terambilnya 2 bola merah, 2 bola putih 1
bola biru.
d. Lima bola diiambil dengan kondisi WOR. Berapa
peluang terambilnya 2 bola merah, 2 bola putih, 1

42

Oleh : Soewono

Soal - soal
1. Suatu delegasi terdiri dari 7 orang mahasiswa dipilih dari :
8 mahasiswa TE
7 mahasiswa TI
6 mahasiswa IF
Tentukan peluang bahwa delegasi tersebut beranggotakan
:
a. 2 mhs IF, 4 mhs TI, dan 1 mhs TE
b. 2 mhs IF
2. Suatu kotak berisi bola sbb:
40 bola warna putih, 50 bola warna merah, 60 bola warna
hitam
Selanjutnya, dalam kotak tersebut 20 bola diambil secara
WOR. Pertanyaan: Tentukan peluang mendapatkan :
a. 10 bola warna putih, 4 merah, 6 hitam
b. 10 bola warna putih

43

Oleh : Soewono

3. Suatu kotak berisi bola sebagai berikut :


20 R, 10 W, 30 B dan 50 G, dalam kotak
tersebut diambil 15 bola.
Tentukan peluang terambilnya 7 R, 2 W, 4B, 2
G apabila pengambilannya :
a. WR
b. WOR

44

4.

a.
b.
c.

d.

Oleh : Soewono
Pabrik memperkerjakan 100 karyawan
dengan kualifikasi
:
50 skilled
30 semi skilled
20 unskilled
Suatu komite yang beranggotakan 10 karyawan
dibentuk.
Jika pemilihan karyawan yang akan menjadi anggota
komite dipilih secara random. Berapa peluang untuk
memilih komite tersebut, bila persyaratannya :
Semua harus berkualifikasi skilled
10 karyawan tsb harus memiliki kualifikasi yang sama
Harus berkualifikasi : 5 skilled ; 3 semi skilled ; 2
unskilled
Paling sedikit harus 8 skilled

Pertanyaan berikutnya :
Apakah saudara dapat memberikan advice selain a,b,c,d ?
45

1.

a)

b)

c)

d)
2.

Oleh : Soewono
Suatu komite yang terdiri dari k orang
dipilih dari 7
orang wanita dan 4 pria. Ada berapa cara untuk
membentuk komite tsb, jika :
komite terdiri 5 orang, dengan komposisi 3 wanita
dan 2 pria
komite harus adil, artinya harus mempunyai anggota
pria dan wanita yang sama
komite terdiri 4 orang, dengan catatan Pak Suparman
harus masuk menjadi anggota komite
komite terdiri 4 orang, dengan catatan paling sedikit 2
Ada
10 mahasiswa, terdiri dari 50 pria, 50 wanita yang
wanita
akan duduk dalam satu lajur kursi sbb :

10

Pertanyaan : berapa peluangnya bahwa dalam


komposisi duduk seperti diatas tidak ada dua mahasiswa
dengan jenis kelamin yang sama duduk bersampingan ?
46

3.

Suatu fakultas, mempunyai tenaga akademik sbb :


6 guru besar / professors
6 lektor kepala / associate professors
10 lektor / assistant professor
12 asisten akhli / instructors
Suatu komite terdiri 6 orang dibentuk dari tenaga
akademik tersebut. Berapa peluangnya anggota komite
tersebut harus terdiri paling sedikit 1 orang LK?

4.

4 pasang suami istri menonton pagelaran orchestra. Ada


berapa cara untuk duduk di sederetan kursi, apabila :
Bebas duduknya
Pasangan suami istri harus berdampingan
Kelompok suami harus di sebelah kanan (duduknya)

a.
b.
c.

5.

6.

Oleh : Soewono
Soal ujian dalam bentuk pilihan berganda
dengan 2
options. Apabila ada 20 soal, ada berapa cara untuk
memilih jawaban yang benar ?

Ada 10 orang terdiri atas 50 pria dan 50 wanita. Ada


berapa cara, agar 10 orang tersebut duduk dengan
posisi selang seling ?

48

Oleh : Soewono

FUNCTION of a RANDOM VARIABLE


(fungsi dariPA / VR )
MISALKAN
JIKA

Y g X

PA / VR , TERNYATA Y JUGA PA / VR
PA / VR SERING DIJUMPAI DALAM FISIKA (LISTRIK), AL :

ADALAH

FUNGSI DARI

JIKA VOLTAGE X DIANTARA RESISTANCE


BAGAIMANA DISTRIBUSI DARI KUAT ARUS :

R ADALAH NORMAL,

X
I g X
R

BAGAIMANA PULA DENGAN DISTRIBUSI DARI POWER :

X2
P g X
R

49

Oleh : Soewono

PERMASALAHAN
JIKA PA / VR X DIKETAHUI FUNGSI DISTRIBUSI, MAKA FUNGSI
DISTRIBUSI DARI PA / VR Y g X BENTUKNYA SEPERTI APA?

SEBAGAI ALAT BANTU UTAMA DALAM MEMBAHAS KASUS TERSEBUT


DIATAS, PERLU DUKUNGAN DARI KALKULUS MENGENAI :
STRICTLY MONOTONIC INCREASING FUNCTION
STRICTLY MONOTONIC DECREASING FUNCTION
INVERSE FUNCTION

50

Oleh : Soewono

FUNCTION of a RANDOM VARIABLE


FUNGSI DARI SUATU VARIABEL RANDOM
FUNGSI DARI PEUBAH ACAK
YANG MELATARBELAKANGI :
STRICTLY MONOTONIC FUNCTION

INCREASING

DECREASING

y f x a bx
SMIF, JIKA b>0

SMDF, JIKA b<0

51

Oleh : Soewono

y g x

g x1 g x2
APABILA x1 x2

SMIF, JIKKA :

g x1 g x2
APABILA x1 x2

SMDF, JIKKA :

52

g x DIKATAKAN SATU-SATU (ONE-TO-ONE) ATAU


INVERTIBLE JIKA UNTUK SETIAP NILAI y DALAM RANGE DARI
g x , HANYA ADA SATU NILAI x SEHINGGA y g x
JIKA y g x FUNGSI SATU-SATU MAKA Y g X
TRANS SATU-SATU. FUNGSI LINIER g x a bx
b 0 ADALAH FUNGSI SATU-SATU.
PADA KONDISI : b 0 g x NAIK MONOTON
b 0 g x TURUN MONOTON
JIKA y g x ADALAH STRICTLY MONOTONIC FUNCTION
Oleh : Soewono

FUNGSI

AKAN TERDAPAT FUNGSI BALIKAN (INVERSE FUNCTION)

g 1 y
JIKA y g x a bx
ya
1
MAKA x g y
b

YANG DIBERI LAMBANG


CONTOH :

53

Oleh : Soewono

1. Fungsi masa peluang (pmf) dari suatu

x 1 0
pX x 1 2
14

18

18

VR X diberikan dalam bentuk :

Y , jika Y g X 2 X 1
Solusi : dari hubungan antara X dan Y, diperoleh :
g 1 1, g 0 1, g 1 3dan g 2 5
Tentukan pmf dari

Dengan demikian , pmf dari

y 1 1
pY y 1 2
14

VRY

sbb :

18

18

54

Oleh : Soewono

Soal yang sama seperti diatas bagi

VR X , jika

Y 2 X 1 , tentukan pY y
2

2. Tentukan fungsi distribusi dari

VRY 3 X 1 jika :

0 ; x3

( a ). FX x 1 3 ; 3 x 6

1 ; x6

0 ; x3

(b). FX x
1 ; 3 x 6
3
1 ; x6

55

Oleh : Soewono

3. Variabel Random X mempunyai pdf seperti dibawah ini :

f x
1

-1
Tentukan pdf dari

Y 3X 2

56

Oleh : Soewono

Secara historis, CHEBYSHEVs inequality penemunya adalah


matematisi Perancis : IRENEE JULES BIENAYME.
Oleh karena itu, beberapa penulis buku menyebutnya :
Chebyshev - Bienayme Inequality
Dengan menggunakan pertaksamaan Markov dan Chebyshev,
kita dapat
menghitung batas batas probabilitas. Selain itu,melalui
Chebyshev inequality,dapat memberikan petunjuk mengenai
peranan terpenting dari
variansi. Variansi dari variabel random, mengendalikan
penyebaran distribusi disekitar nilai ekspektasinya.
CHEBYSHEVs INEQUALITY IS A POWERFUL TOOL FOR DEALING
WITH PROOFS IN THE THEORY OF PROBABILITY

57

Oleh : Soewono

PAFNUTY LVOVICH CHEBYSHEV


Chebyshev
Chebychev
Tcheby sheff

Tcheby cheff

Tshebichef
Markoff
Markov
ANDREI ANDREEVICH MARKOV
Ia adalah muridnya Chebyshev.
Markov bersama gurunya / Chebyshev dan teman sekolahnya : Alexander
Mikhailovich Lyapounov merupakan pelopor dari paham probabilitas modern.

58

Oleh : Soewono

1. MARKOVs inequality
Jika kita mengetahui distribusi dari
dicari
, yaitu :

VR X , maka dengan mudah dapat


P X k
P X k 1 FX k
Tetapi, apabila kita hanya mengetahui rataan / mean dari X , sedangkan
distribusinya tidak diketahui, maka kita tidak dapat mencari P X k
secara tepat.
Jika X adalah variabel random yang hanya mengambil nilai-nilai non
negatif, maka kita dapat mencari batas yang tertuang dalam teorema
MARKOV sebagai berikut :

If
then

is a non-negative random variable and,

E X
P X k
k

k 0

59

Oleh : Soewono

Bukti :

E X x f x dx
0

x f x dx
k

k f x dx k f x dx k P X k
k

Dengan demikian :

Untuk

vr X

E X
P X k
... QED
k

diskret, dapat dicoba sendiri sebagai latihan.

60

Oleh : Soewono

2. CHEBYSHEVs inequality
Andaikan, kita hanya mengetahui mean dan variansi dari
,
sedangkam distribusinya tidak diketahui. Maka kita tidak dapat menghitung
secara tepat P X E X k , tetapi kita dapat mencari batas yang
tertuang dalam teorema CHEBYSHEV sebagai berikut :

Let

VR X

be any random variable. If

k 0 , then

Var X
P X E X k 2
k

Bukti:

P X E X k P X E X k

E X E X


k2
Var X

k2
2

..kenapa?

..kenapa?
..kenapa?

61

Oleh : Soewono

CHEBYSHEVS INEQUALITY
Theorem : Let X be a random variable with mean
Then for any positive number k ,

1
P X k 1 2
k

: Andaikan X vrk dengan rataan / mean


deviasi standard dan pdf f x .

Bukti

Menurut definisi :
Misalkan

2 Var X

, simpangan baku /

x f x dx

k 0, c k 2 2 , maka :

2 Var X

Karena

and standard deviation .

x f x dx c x

f x 0, maka :

f x dx
2

x f x dx

x f x dx 0

c
62

Oleh : Soewono

Dengan demikian :
2

x f x dx
x f x dx

c
2
kedua daerah integrasi diatas : x c

Var X
2

Dengan demikian :

Var X
2

c f x dx

c f x dx

Apabila dinyatakan dalam bentuk probabilitas :

X c
2 Var X c P X c c P

atau :

2 Var X c P X c P X c

63

Oleh : Soewono

Jadi :

P X c P
Atau :

2
X c
c
2
1
c

P c X c
2 2
Karena c k dan masing-masing k dan c non negative, maka

c k

sehingga :

1
P k X k 1 2
k
Atau :
1
P X k 1 2
k
Karena X vr kontinu, maka :
1
P X k 1 2 ...QED
k
64

Oleh : Soewono

X vrd :
I

II

III

k k
daerah R1 : x k daerah R2 : k x k
dan daerah R3 : k
2
2
Menurut definisi : Var X x p x
x

x p x x p x x p x
2

R1

karena

R2

R3

p x 0 maka x p x 0
2

R2

oleh karena itu :

x p x x p x
2

R1

R3

65

Oleh : Soewono

Mengingat :

x k di dalam daerah R1

x k di dalam daerah R3
maka, secara matematis dapat ditulis : x k ;
2
2
2
pada kedua daerah tersebut berlaku x k
2
2 2
Jika, x diganti dengan k , maka diperoleh :

2 k 2 2 p x k 2 2 p x
R1

atau :

R3

1
p x p x
2
k
R1
R3
menyatakan probabilitas bahwa

x k

x dalam daerah R1 U R3 , yaitu :

66

Oleh : Soewono

Teorema : Bienayme-Chebychevs Inequality

g X fungsi yang non negative dari variabel random X


E g X
maka untuk setiap : k 0; P g X k


k
Jika

Bukti : Andaikan A menyatakan himpunan titik-titik yang memenuhi hubungan

g X k dan misalkan pula A menyatakan komplemen A.


Jika f x pdf darig X k , maka : P g X k

f x dx

Mengingat

E g X g x f x dx

g x f x dx g x f x dx
A

k f x dx g x f x dx
A

67

Oleh : Soewono

E g X k f x dx k P
g X k
A

E g X

P g X k
...QED
k
Corollary 1
Ambil g X X , maka diperoleh :
E X
, tidak lain adalah
P X k
Markov Inequality
k
2
Corollary 2
Ambil g X X dan k t maka
2
E X
1
2
2
2

P X t
2
2
2

t
t
Jadi :

adalah Chebyshev Inequality

68

Oleh : Soewono

Contoh :

X DIKETAHUI X 25
X 2 16 , MAKA DAPAT DICARI LOWER BOUND DARI
P 17 X 33 SBB :
JIKA VR

P 17 X 33 P X 25 8

LOWER BOUND DARI

3
P X 25 2
4
3
P 17 X 33
4

69

Oleh : Soewono

SELANJUTNYA UPPER BOUND DARI :

P X 25 12 ?

P X 25 12 P X X 3 X

1
2
3
UPPER BOUND =

1
9

70

Oleh : Soewono

SOAL-SOAL
1. DENGAN MENGGUNAKAN CHEBYSHEV INEQ. CARILAH LOWER
BOUND PADA :

P 4 X 20
DAN Var X 9

, DIMANA

VR X

MEMPUNYAI MEAN

SOLUSI :
GUNAKAN

P k X k
1
1 2
k

MASALAHNYA, MENCARI k=?

71

k 4 DAN
k 20
8 k 3 4 atau 8 k 3 20

Oleh : Soewono

MISALKAN :

1
P k X k 1 2
k
1 15
P 4 X 20 1
16 16
MAKA :

LOWER BOUND PADA :

P 4 X 20

ADALAH

15
16

72

Oleh : Soewono

2. DIBERIKAN

VR D X
1

p x 1 8

DENGAN

pmf : p X x
1

68

18

DENGAN MENGGUNAKAN CHEBYSHEV - INEQ

1
P X k 2
k
CARILAH UPPER BOUND, UNTUK

k 2

SELANJUTNYA, HITUNG MELALUI PROBABILITAS BIASA,


BANDINGKAN HASIL PERHITUNGAN INI DENGAN CHE INEQ.
SOLUSI : UNTUK CHE INEQ, PERLU DUKUNGAN

MEAN & VAR SD.DARI X

DARI TABEL DIATAS : X

E X x p( x)

X 0. Var X E X

E X

73

Oleh : Soewono

1
1
Var X X
4
2
UNTUK : k 2 P X k
1
1

P X 2. P X 1
2
4

1
UPPER BOUND =
4
ACTUAL PROBABILITY
SELANJUTNYA :

DIHITUNG MELALUI PROB. BIASA

EXACT PROBABILITY
74

Oleh : Soewono

P X 1 ?

P X 1 P X 1atau X 1

P X 1 P X 1 P X 1
1
0
8
P X 1 P X 1 P X 1
1
0
8
DENGAN DEMIKIAN :

P X 1 1 8 1 8 1 4

TERNYATA :
EXACT PROB. = CHE INEQ. =

14
75

Oleh : Soewono

SOAL UNTUK DISELESAIKAN SENDIRI


DIBERIKAN

VR X

f X ( x)
PERTANYAAN :

1
2 3
0...

DENGAN pdf SBB :

... 3 x 3
x 3 atau x 3

P X 3 2 ; P X 2

BANDINGKAN PERHITUNGAN DIATAS (EXACT PROB.)


DENGAN UPPER BOUND YANG DIPER. CHE INEQ.

76

Oleh : Soewono

MENURUT CHE INEQ :

VR X

DENGAN VAR. YANG FINITE

1
P X k 2
k
Pdf yang diketahui :

f X ( x)
CHE - INEQ

...

1
2 3
0;

3 x 3
x lainnya

X & Var X

X E X

x 1 2 3 dx 1 2 31 2 x 2

3
3
77

Oleh : Soewono

X 0
Var X E X

E X

x 1 2 3 dx 1 2 3 x 3
3
3
2

Var X 1
78

YANG DICARI :

3
P X ?
2

Oleh : Soewono

1 P

3
1 P X
2

3
3
X
2
2

1 2 3 dx 1
3 2 3 2

3 2

2 3

3
3
EXACT/ACTUAL PROB.
1
1

0,134
2
2 3

32

79

Oleh : Soewono

CHE INEQ ?

3
3
1
4

P X P X 0 .1


2
2
2

3 2 9
UPPER BOUND CHE INEQ =

4
0, 444
9

KESIMPULAN ?

80

SELANJUTNYA :

P X 2 ?
1 P 2 X 2

MENGINGAT

Oleh : Soewono

Df x : 3 x 3

3 2& 2 3
MAKA : P 2 X 2 1
DENGAN DEMIKIAN : P X 2 0
SEDANGKAN :

EXACT/ACTUAL PROB.

81

Oleh : Soewono

CHE INEQ ?

1
P X 2 P X 0 2.1 2
2
1
0, 25
UPPER BOUND CHE INEQ =
4
KESIMPULAN ?

82

Oleh : Soewono

SOAL
Jika

VR X

X 25 dan X 2 16 , maka dapat dicari


P 17 X 33 sbb :

diketahui

lower bound dari :

P 17 X 33 P X 25 8

P X 25 2 3 4

lower bound dari :

P 17 X 33 3 4

Selanjutnya, upper bound dari :

P X 25 12 ?

P X 25 12 P X X 3 X 1 32
1
upper bound =
9
83

Oleh : Soewono

SUPPOSE, ON THE AVERAGE, THE DAILY DEMAND FOR AN ITEM IS


28, WITH VARIANCE 16.
HOW MANY ITEMS SHOULD YOU MAKE SO THAT SUPPLY MEETS
THE DEMAND AT LEAST 90% OF THE TIME ?

84

Oleh : Soewono

THE UNIFORM DISTRIBUTION


THE SIMPLEST CONTINUOUS

RV

IS CALLED THE UNIFORM

RANDOM VARIABLE, IT IS DEFINED AS FOLLOW ;


DEFINITION

IS A UNIFORM RANDOM VARIABLE ON THE

INTERVAL

a, b I IF :

1. THE RANGE OF

X IS THE INTERVAL a, b

2. THE PROBABILITY DENSITY FUNCTION


IS CONSTANT FOR
FOR THIS REASON,

x RX

f X ( x)

X IS UNIFORM DISTRIBUTED ON a, b .

THE UNIFORM DISTRIBUTION IS ALSO REFERRED TO AS THE


RECTANGULAR DISTRIBUTION.

THE PROBABILITY DENSITY FUNCTION OF A UNIFORM RANDOM


VARIABLE IS GIVEN AS THEOREM, FOLLOW ;
85

Oleh : Soewono

THEOREM

: If

X is uniform

distributed on

X : UNI a, b

a, b , denoted by

then :

PROOF

From definition,
The condition
That is,

f X ( x)

1
; a x b
ba
0... ; otherwise

f X ( x)

c , a x b
o , otherwise

f x dx 1 c dx 1

c dx c b a 1
a

Thus,

1
c
; qed
ba
86

Oleh : Soewono

THE DISTRIBUTION FUNCTION FOR A UNIFORM RANDOM VARIABLE IS :

FX t P X t

f x dx

0,.....t a
t a

FX t
,.....a t b
ba
1,.....t b

FX ( x) IS INCREASING LINEARLY ON THE INTERVAL a, b


X : UNI a, b , THEN : E X
X
b
x

dx
ba
a

THUS,
IF

87

Oleh : Soewono

ba
X
2
Var X E X E X
b
2
2
2
x
b

ab

a
E X 2
dx
ba
3
a
2

SO, THAT,

Var X X

b a

12

You can make graphs of the pdf and the distribution function of a uniform
random variable on the interval

a, b

PLEASE, TRY IT.

88

Oleh : Soewono

EXAMPLE 1

: If

X is uniform

distributed over

probability that :

0,10 , calculate the

1 . X 3, 2 . X 6 3 .3 X 8
SOLUTION

:
3

1
3
1 . P X 3 dx
10
10
0
10

1
4
2 . P X 6 dx
10
10
6
8

1
1
3 . P 3 X 8 dx
10
2
3

89

Oleh : Soewono

EXAMPLE 2

: Buses arrive at a specified stop at 15-minute interval,


starting at 7 AM.
That is, they arrive at 7 ; 7.15 ; 7.30 ; 7.45, and so on.
If a passenger arrives at the stop at a time that is
uniformly distributed bet ween 7 and 7.30.

Find the probability that he waits :


(1). Less than 5 minutes for a bus ?
(2). More than 10 minutes for a bus ?
SOLUTION :

90

Oleh : Soewono

EXAMPLE 3
SOLUTION :

2 X 3 FIND THE PDF OF Y, IF


X : UNI 1, 2

: LET Y

X : UNI 1, 2
1 3,... 1 x 2
pdf . f X x
0, elsewhere

Y 2X 3

y g x 2 x 3 xx 21y y71
y 3
g y
2
1
1
1
fY y
fX g y
2
6
1

91

fY

1 6 ; 1 y 7
y
0 ; otherwise

PROBLEMS
LET

Oleh : Soewono

X BE

:
A UNIFORM

R.V OVER a, b

(a). DETERMINE THE MOMENT GENERATING FUNCTION OF


(b). USING THE RESULT OF (a), FIND
ANSWER :
(a).

(b).

MX

E X , E X 2

X.

AND

E X 3

exp tb exp ta
t
t b a

1
1 2
2
E X b a ; E X b ab a 2 ;
2
3
E X 3 1 4 b 3 b 2 a ba 2 a 3
92

Oleh : Soewono

THE EXPONENTIAL DISTRIBUTION


The exponential distribution have many applications in the area of
reliability theory.
The exponential distribution or more precisely the negative exponential
distribution, is often called the distribution of decay.
DEFINITION

: If the random variable

is exponentially distributed,

its probability density function is give by :

1 exp x ; x 0

f x,
And is denoted by

0 , elsewhere
X : EXP , where 0 is a parameter.

In the context of reliability,

1 is the failure rate.

is known as the mean time between failures, and

93

Oleh : Soewono

Another form of probability density function is give by :

exp x ; if x 0

* f x

0 , if x 0; when 0

Any random variable

X having the density function is said to have an

(*)
If X : EX P with probability density

function f x exp x ; if x 0

exponential distribution with parameter


THEOREM

0 , elsewhere

0, then :
1
1
E X X and Var X 2

for

94

Oleh : Soewono

PROOF

X E X x exp x dx
0

x, dv exp x dx

Integrating by parts :u
yields :

E X x exp x

X E X
Next :E

exp x dx
0

x 2 exp x dx

95

Oleh : Soewono

Again intregating by parts :

E X

x exp x
2

2 x exp x dx
0

2
2

E X 2

X Var X E X
2

Hence ,

X Var X
2

E X

2 2 1 2 1 2

96

Oleh : Soewono

DISTRIBUTION FUNCTION
The cumulative distribution function
parameter

F x

of the exponential distribution with

is given by the expression :

0, if x 0

F x

1 exp x , if x 0

PROOF :
Because the density

f x 0 for x 0 ,
It follow that F x 0 when
x0
When x 0 F x P X x

f t dt

exp t dt 1 exp x

97

Oleh : Soewono

Hence ,

0 , if x 0

F x

x
1

e
, if x 0

QED.

The survival function, or tail probability function of the distribution of

F x

, if x 0

x
e
, if x 0

F x 1 F x P X x

NOTE :

98

Oleh : Soewono
LACK OF MEMORY PROPERTY
OF THE EXPONENTIAL DISTRIBUTION

Among all distributions of non negative continuous variable, only the exponential
distribution have no memory.
The memoryless property asserts that :

P X s t X t P X s , s, t 0
P X s t X t

P X s t P X t
P X s t

P X t
P X t

P X s t 1 P X s t 1 F s t
P X t 1 F t

s t
P X s t 1 F s t
e
P X s t X t

P X t
1 F t
e t

e s e t
s

e
e t
99

Oleh : Soewono

NOTE : P
Hence ,

X s 1 F s 1 1 e s e s

P X s t X t P X s

This is the lack of memory property of the exponential distribution.


Given that you have been waiting

s
SUMMARY

additionals

t units of time, the probability you must wait an

units of time is the same as if you has not been

waiting at all.

P X s t X t P X s ; s , t 0 (*)
Let X be the lifetime (in hours) of a component. Then, equation (*) states that
the probability that the component will operate for at least s t hours is the
same as the initial probability that it will operate for at least s hours.
In other words, the component forgets how long it has been operating.

100

EXAMPLE

: Telephone calls arrive at a switchboard


Oleh : Soewono
independently at the
rate of 2 per hour. It is now 4.00PM. The telephone rang at
2.30 PM and has not rung since then. Find the probability
that the phone will still not have rung by 7.00 PM

SOLUTION : Let

X be the waiting time between calls.

1
1

P total wait between calls is 4 hours waited 1 hours already


2
2

X : EXP , then

1
1
P X 4 X 1 P X 3
2
2

1 P X 3 1 F 3
X : EXP , 2
F x 1 e 2 x

In the other words, if

Hence ,

1
1
P X 4 X 1 1 1 e 6 e 6
2
2

101

RELIABILITY

Oleh : Soewono

Reliability is a measure of how well an item works. Reliability is the probability


that an item will perform a required function under stated conditions for a stated
period of time.
Let

T is the random variable we use for the time of failure ;


F t PT t P 0 T t
Reliability R t is defined as the probability that a device will fail after time t

R t P T t 1 F t
or

R t 1 f d
0

MTTF for the random variable T is :

E T t f t dt
0

The mean time to failure

MTTF

102

EXAMPLE

: Commonly, but not universally, we find


Oleh :that
Soewono
the failure of electrical
components is modeled by the exponential random variable.
Specifically, for reliability studies, we write the exponential pdf
and cdf as :
and

where
f t

iscalled
expa rate
tparameter.
F t 1 exp t

Reliability for an exponential random variable is :

R t exp t

This reliability decreases exponentially toward zero as the time of service


increases. The mean time to failure
exponential

MTTF E T

is :

for the

MTTF

t exp t dt

RV

103

dR t
R t 1 F t
f t
dt

Oleh : Soewono

From :

The failure rate

h t

is defined as :

f t
h t
R t

dR t

d
dt
h t

ln R t

R t
dt
The cumulative failure rate
zero to

t:

H t

h d
0

H t

is obtained by integrating

h t

from time

ln R t

The failure rate is also called a hazard rate or hazard function.

104

Oleh : Soewono

EXERCISES

X be an exponential RV with parameter


Find theMGF of
X
Find
Xand Var Xby (a)
If X : EXP 1 , show that :
X : EXP , where is a positive constant.
Show that if X : UNI 0,1 , then ln X : EXP 1


X is uniformly distributed on 0, 2 and Y is exponential with parameter
Find the value of
such that P X 1 P Y 1
X is uniformly distributed on 1, 3 and Y is exponential with parameter
Find such that Var X Var Y

1. Let
a)
b)
2.
3.
4.
5.

105

Oleh : Soewono

6.

X is geometric
Find

with parameter

p and Y is exponential with parameter

such that P X 1 P Y 1

7. Assume that failures of a relay are described by an exponential pdf with a


parameter

0, 002 per year.

Find the reliability and the failure rate.


8. A bus arrives every 20 minutes at a specified stop beginning at 6.40 AM and
continuing until 8.40 AM. A certain passenger doesnt know the schedule, but
arrives randomly (uniformly distributed) between 7.00 AM and 7.30 AM. What is
the probability that the passenger waits more than 5 minutes for a bus ?
9. The lifetime, in years, of a satellite placed in orbit is given by the following pdf

0, 4e 0,4 x , x o
0,

otherwise

What is the probability that this satellite is still alive after 5 years ?
106

Oleh : Soewono

THE COVARIANCE
Essentially, we are interested in generalizing the concept of variance, id (id est) :
the expected value of squared deviation from the mean.
The variance is a measure of dispersion for a single random variable/univariable.
This measure to be small when the distribution is compact about the mean, and
large when the distribution is more spread out.
The covariance is a measure of the relationship that exists between random
variables

X and Y.
The covariances of X and Y, denoted by Cov X , Y .

Is defined by :
Cov X , Y E X X Y Y .
If Cov X , Y 0, then we say that X and Y are uncorrelated, we see
that X and Y are uncorrelated if E XY E X E Y . The converse
is not in general.

107

Var X Y
Var X Y E X Y E X Y
How to find

Oleh : Soewono

X E X Y E Y

2
2

E X E X Y E Y 2 E X E X Y E Y

Var X Var Y 2Cov X , Y


where : Cov X , Y E

X E X Y E Y
is called the covariance of the two random variables
Definition : Let

X and Y.

X and Y be random variables with means X and Y

respectively.
and Y
denoted by Cov X , Y, is
X
Cov X , Y E X X Y Y

The covariance between


given by :

108

From definition, it is abvious that the commutativeOleh


law: Soewono
holds for covariance :

Cov X , Y Cov Y , X
It is also clear that the covariance of a random with itself is its variance, because :

Cov X , X E

You can try and proof :

X E X X E X

Var X

2
2
a
X

b
Y

a
Var
X

b
Var Y 2ab Cov X , Y

where a and b are any constants.


2. Cov X , Y E X Y E X E Y
3.
Var a X bY a 2 Var X b 2 Var Y, if X and Y are

1. Var

statistically independent

4. Let X and

5.

Y be any two random variables.


Show that
Cov a X , bY ab Cov X , Y
where a and b are any constants
Suppose
X and Yare random variables, with :
Y
2
E X 4 , E Y 1, E X 2 41, E

10
109

Oleh : Soewono
compute :
E X Y 6. Using only this information,
Var X Y ;
X ,Y

and
i.
ii.

iii. Are X and Y independent ?

E XY E X E Y , so in
that case Cov X , Y 0. But if X and Y are not independet, then
E XY
may or may not equal
E X E Y , so in that case, Cov X , Y may or may
We know that if X and Y are independent, then

not be 0.

110

Oleh : Soewono

THE CORRELATION COEFFICIENT


If the covariance of X and Y is divided by the product of the standard
deviations of X and of Y, the result is a dimensionless quantity known as the

X ,Y
Definition: Let X and Y be random variables with expected values E X , E Y
2
correlation coefficient and is denoted by
and non zero and not

Y (denoted
by :

X ,Y

or Corr

variances Var X (denoted X ) and Var

2
). ThenY the correlation coefficient between X and Y is given

Cov X , Y

Cov X , Y
X , Y Corr ( X , Y )

XY
VarX . VarY

111

Oleh : Soewono

From definition, clear that


Y are independent.

X ,Y

, like the covariance, will be zero if X and

From definition, we have :

Cov X , Y X , Y X Y
Theorem : The correlation coefficient

X ,Y

between two random variables

X and Y is a number between -1 and +1 inclusive :


Proof : Consider the standardized random variables

1 X , Y 1

X *and Y *corresponding

to X and Y :

X
*

with E

X E X
VarX

;Y
*

*
*

E
Y
0 and

Y EY
VarY

VarX * VarY * 1
112

Oleh : Soewono

Var X * Y * VarX * VarY * 2Cov X *Y *


X
* E Y *
Cov X *Y * E X *Y * E
Cov X *Y * X , Y

Var X * Y * 1 1 2 X , Y 2 1 X , Y
We know that the variance id any random variable must be greater than or
equal to zero; hence:
Similarly,

2 1 X , Y 0 X , Y 1

Var X * Y * 2 1 X , Y 0

which implies that

X ,Y 1

Therefore, combining these results, we have :

1 X , Y 1

qed.

113

Oleh : Soewono

Theorem : If Y is a linear function of X, that is: Y

aX b

, then

is +1if a is positive and -1 if a is negative

X ,Y

Y aX b E Y aE X b
thereforeY E Y a X E X

Proof : Since

VarY a 2VarX and Cov X , Y aVarX


Hence

X ,Y

Ifa 0

X , Y 1

Cov X , Y

2
a
a VarX .VarX
and ifa

0, X , Y 1

QED

114

Oleh : Soewono

EXERCISES
1.Let

be the random sample of size 12 from the uniform distribution on the

interval (0,1) . Approximate


2.Let

Y X 1 X 2 ... X 15 be the sum of a random sample of size 15 from

the distribution whose p.d.f. is

Approximate
P 0.3 Y
3. Let

2
1
X
3
2

3
f x x2
2

1.5

1 x 1

be the mean of a random sample of size 36 from an exponential

distribution with mean 3. Approximate

P 2.5 X 4

115

Oleh : Soewono

4. Let X X ... X
1
2
30

be a random sample of size 30 from a Poisson

distribution with mean of . Approximate


30

a. P 15 X 22

i 1

b.
c.

P 21 X i 27
i 1

30

P 15 X i 22
i 1

30

5. If X is b (100,0.1), find the approximate value of P(12 X 14) using


a. The normal approximation
b. The Poisson approximation
c. The binomial p.d.f.

116

Anda mungkin juga menyukai