Anda di halaman 1dari 104

# STATISTICS & DoE

 STATISTICALLY ESTIMATION
 HYPOTHESIS TESTING
 DESIGN of EXPERIMENT (DoE)
STATISTICALLY ESTIMATION
 Unbias
 Efficient
 Consistent
Interval Estimation

Where:
𝑠𝑡 = statistical sample
𝜎𝑠𝑡 = standard deviation
𝑍𝛼 = coeficient for selected confidential Factor (CF)
2
1
BIG SAMPLE

2
LIMITED SAMPLE

3
UNKNOWN SD
Example for 1
A Tour & Travel agent in Jakarta is undertaking a survey about tourism
in Indonesia. The objective is to estimate average expenditure of each
foreign tourist during their vacation in Indonesia. Accordingly, a
randomized sample of 100 foreign tourist have been choosen from
indefinite population of who are visiting Indonesia to be interviewed.
From survey, it has been identified that average expenditure of the
choosen foreign tourist is \$800 per tourist. If assuming the standard
deviation of the data is approximately \$120 and 95% of confidential
factor was used. What is the range of foreing tourist expenditure
during their visits in Indonesia??????.
Example for 2 ത 0.1165 were taken from a
If random sample with n=64 and 𝑋=
limited population of 300 and having 𝜎𝑋 = 0.012. What is
estimation for 𝜇𝑋 that have 95% of confidential factor????????
Example for 3
A random sample that consists of 100 students has choosen from
student population. All samples will be given a inteligent test to
determine their inteligent coeficient. Test has identified that average
inteligent coeficient of random sample was 112 with standard deviation
of 11. By that result giving your estimation for inteligent coeficient of all
student if decided the confidential factor used is 95% ?????
A
SMALL SAMPLE

B
UNKNOWN 𝜎𝑋 & INDEFINITE POPULATION

C
UNKNOWN 𝜎𝑋 & LIMITED POPULATION
Example for A
 If n=3 ; d.f (degree of freedom)=2 and CF=0.025 then 𝑡0.025
would be 4.3
Example for B
A random sampel that contains of 10 students has been
selected among student population. All samples will undergo a
inteligent test for determining their inteligent coeficient. The
test indicated that the student inteligent coeficient are
underlaying at average of 112 and standard deviation of 11. By
selected confidential factor of 95%, determine the average
inteligent coeficient of selected students.
Example for C
Bureau of academic affairs of a faculty plans to determine the
average mark of English Language course from entrance
students. A random sample of 14 results were taken from
population of 99 students. The average marks is 75.6 with
standard deviation of 2.65. Estimate the range of students
marks with using confidential factor of 95%.
HYPOTHESIS TEST
1. Drawn a hypothesis; 𝐻𝑜 = 𝜇𝑋 or 𝐻1 ≠ 𝜇𝑋
2. Define α/2
3. Find Z
4. Determine the critical area under normal distribution curve
5. Justify the hypothesis
Big Sample
Technically, population of all steel plat produced by a steel
construction company has average length of 80 cm with
embedded standard deviation of 7 cm. After 3 years past, the
company technician feel uncertain about the prelimenary
hypothesis. To test their prejudice, 100 unit samples were
taken randomly by assuming standard deviation was constant.
Determine wheter their first hypothesis (e.g the length of steel
plat is 80cm) is right?
1. 𝐻𝑜 = 𝜇𝑋 = 80𝑐𝑚 or 𝐻1 ≠ 𝜇𝑋
2. Assuming CF=95% thus α/2 would be equal to 0.025
𝑋ത −𝜇𝑜
3. Find 𝑍 =
𝜎𝑋 / 𝑛
4. That above statistical test is a normal distribution with 𝜇𝑍 =
0 and 𝜎𝑍 = 1
5. The critical area for σ=0.05 is Z>1.96 and Z<-1.96
6. Z= 4.2856
7. By the results, the first hypothesis would be reject. It can
be concluded that the average length of steel plat is not
equal to 80 cm anymore
2
IF 𝜎𝑋 unknown
Small Sample
Based on Hypothesis, a stencil machine enable to produce
6500 paper sheets per hour. A stencil company intend to test
that hypothesis. To do so, an observation for 12 unit machines
were undertaking. The result is shown below;

## 6000 5900 6200 6200 5500 6100

5800 6400 6500 5400 6200 6700
1. 𝐻𝑜 = 𝜇𝑋 = 6500 or 𝐻1 ≠ 𝜇𝑋
2. Assuming CF=95% thus α/2 would be equal to 0.025
𝑋ത −𝜇𝑜
3. Find 𝑡 =
𝜎𝑋 / 𝑛
4. That above statistical test is a normal distribution with 𝜇𝑍 =
0 and 𝜎𝑍 = 1
5. The critical area for σ=0.05 is t>𝑡(0.025;11) and t<𝑡(0.025;11)
6. Z= -3.81776
7. By the results, the first hypothesis would be reject. It can
be concluded that the capabiliity of those machines to
produce 6500 paper sheets per hour is wrong
DESIGN of EXPERIMENT (DoE)
 Introduction
 Design of Experiment
 Types of DoE
Introduction
A. Research

## •An idea that has not been tested and

or well defined
•A systematic and well planned
Research process to generate solution from
information gathering, analysis and
interpretation of data that is depended
on a problem
B. Research Cycle
RESEARCH

DESIGN VALIDATION
•Conclusion validity
•Internal validity ANALYSIS OF RESULTS
•Construct validity
•External validity

RESEARCH PROBLEMS
INVESTIGATION
RESEARCH DESIGN •Research goal
•Unit of data collection •Problem owner
•Environment of data collection •Unit of study
•Measurement instruments •Research questions
•Data analysis methods •Conceptual model
•Current knowledge
C. Research Flow

Analysis
D. Research Methodology

Methodology/
Statistics
Strategy

Design
Tool
Sample
E. Research Process
Review

Concepts
& Theories

## Problem Hypothesis Design Data

Current
results

Analysis

Interpretation
Design of Experiment
Without a design,
A. Importances???? research study is just
like the building
To suggests, what type construction without
of statistical analysis to any plan or map.
use and what may be
the inferences by
a particular technique
applied

## to “suggests” the directions

of observations making and
analysis. A design suggests
To tells us “how far we have
which variables are active
been able to control the
and which are assigned. We
experimental errors”. Most
can then act to manipulate
technical function of an
the active variables and to
experimental design is to
control the assigned
control the error variances
variables
B. Goal
research questions

## to control the variance

due to various
factors
C. Classifications of DoE
before-and-after without control

DoE

## completely randomized design

Formal
Latin square design

## simple and complex factorial designs

E. Considerations
F. Characteristics of DoE
The observed treatment effects are unbiased estimates
of the true effects
A quantitative description of the observed treatment
effects regarded as estimates of the “true” effects

## Making possible an objective test of a specified

hypothesis concerning the true effects, that is, it will
permit the computation of the relative frequency with
which the observed discrepancy between observation
and hypothesis would be exceeded if the hypotheses
were true

## Efficient & satisfying the requirements at the minimum

The selection or exact definition of
The definition of the “treatments.” the population to be investigated

## The selection of a criterion

DoE 
The identification of the
factors to be controlled and
the level or levels at which
The selection of a specific each is to be controlled
experimental design
The final restatement of the problem
G. Fundamental of DoE

Replication

Local
Control

Randomization
REPLICATION

RANDOMIZATION LOCAL
DISTRIBUTION CONTROL

VALIDITY OF DIMINUTION
ESTIMATE OF OF ERROR
H. Terminology
• Group of as uniform as possible on all characteristics that
Block could affect the response

## • One or more effects that cannot unambiguously be attributed to

Confounding a single factor or interaction

## • An uncontrollable variable that influences the response but is

Covariate unaffected by any other experimental factors

## Design (Lay- • Complete specification of experimental test runs, including

blocking, randomization, repeat tests, replication, and the
out) assignment of factor–level combinations to experimental units
• Change in the average response between two factor–
Effect level combinations or between two experimental
conditions

Experimental
Region • All possible factor–level combinations for which
(Factor experimentation is possible
space)

## • A controllable experimental variable that is thought to

Factor
influence the response

## • Existence of joint factor effects in which the effect of

Interaction
each factor depends on the levels of the other factors
Level • Specific value of a factor

Repeat • Two or more observations that have the same levels for
Tests all the factors

## • Repetition of an entire experiment or a portion of an

Replication experiment under two or more sets of conditions

## Response • Outcome or result of an experiment

Test • Single combination of factor levels that yields an
observation on the response
Run
Unit • Entity on which a measurement or an observation is
made; sometimes refers to the actual measurement or
(Item) observation
Controlled
Input
(Factors)

## Uncontrolled Process Uncontrolled

(Input) (Input)

Output
(Response)
• The input set for observations
Factors

Levels

Responses

## • The way that output s were gathered

DoE
Dependent
Input
Independent
I. Errors
Maximizing the
Variance of
Desired Variables

Controlling the
Variance of
Extraneous
Variables

Minimizing the
Error or Random
Variance
J. Linear Model

K. Effective DoE

Response
Alternatif Key Factor Regression
Surface
• Reach
target
• Max/Min
Response
• Min
variance
• Robustness
• Multiple
goal
Ka. Comparison Exp.
performed under one
common set of conditions
Supplier A vs. supplier B? Which
new additive is the most to agree on a
effective? Is catalyst `x' an measurement
improvement over the existing by which
catalyst? These and countless competing
other choices between choices can be
alternatives can be presented to compared,
us in a never-ending parade. generate a
Often we have the choice made sample of data
for us by outside factors over from each
which we have no control. But in alternative, and
many cases we are also asked to compare
make the choice. It helps if one average results
has valid data to back up one's
decision. validate that one alternative
is preferred over a wide
range of conditions
Kb. Filterisation (Key Factors)
Importace and/ no factors that affect the
response

combinations

## Prelimenary stages to generated 3 D models

(Sruface) with Surface Response Methodology
Kc. Model with Surface
Response
Obj
1

Influencing
Factors Obj
2

Obj
Importance Factor 3
Improving a machine performances

Hit a Target

## Determining the valid chemical compositions for coating

Menemukan solusi untuk meningkatkan hasil/ mengurangi jumlah
limbah

## Maximizing or minimizing a Response

Standar procedures are enable to control input (i.e flatness)

Reducing variances
Automotive stator that operate at extrem external temperature

## Making a Process Robust

Rate vs Concistency

## Seeking Multiple Goals

Strength vs Output
Where 1st and 2nd order are not appropriate

Regression Modeling

## Fitting to general models

L. Steps
Select Select an
Set objectivs process experimental
variables design

Check for
Execute the Analysis and
data
consistency

Confirmation?
Objectives Factors
La. Set the objectives
Comparative
Completely
Narrow Scope
Randomized Design

Randomized Block
Design
2-4 Factors Full Factorial Design
Screening
Fractional Factorial

More 3 Factors

Placket-Burman Design

Qualitative/
3 level, mixed,
Quantitative Factors-
fractional
non-monotic effect
Response Sruface
Hit a target

Maximize/minimize

Reduce Variation

Robust Taguchi
Number of Comparative Screening Response
Factors
1 1 Factor - -
Completely
Randomized
Design
2-4 Randomized Full/ Fractional Central
Block Design Factorial Composite/ Box-
Behnken
5 or more Randomized Fractional Screen first
Block Design Factorial/
Plackett-Burman
Lb. Consideration for Process
Variables
All importances

## Avoid only response

Lc. Consideration for Level

## Permited allowable level

ranges
Level

Run Factor 1(X1) Factor 2(X2)
1 -1 -1
2 +1 -1
3 -1 +1
4 +1 +1

## Run Factor 1 (X1) Factor 2(X2) I X1xX2

1 -1 -1 +1 +1
2 +1 -1 +1 -1
3 -1 +1 +1 -1
4 +1 +1 +1 +1
M. Asumptions
Is measuring devices capable of measuring all
responses

polynomial model

## Is the prediction and observation model in line

Types of DoE
REGRESSION
 Linear
 Non Linear
Linear
Group of points at the left
side are observation data.
Meanwhile the linear line
(e.g. Equation y = mx + c)
is a representation of
statistical data analysis
from all observations. To
obtain that line then linear
regression analysis must
be undertaken
 To examine and measure a statistical relationship
between two or more variables. A simple regression
analysis can be carried out to investigate only two
variables. Meanwhile for more than two variables, a
multiple regression analysis can be selected.
 In regression analysis, an regression equation
determine and utilize to reflect the pattern and/ or
function of relationship between the variables.
 Estimated variable is commonly recognized as
dependent variable atau response variable and
normally plotted at y-axis. Meanwhile independent
variable or explanatory variable is the variable that
is assumed affecting the dependent variable and
normally plot at x-axis.
Analisa korelasi bertujuan untuk
mengukur "seberapa kuat" atau "derajat
kedekatan" suatu relasi yang terjadi antar
variabel.
Analisa regresi ingin mengetahui pola
relasi dalam bentuk persamaan regresi,
Analisa korelasi ingin mengetahui
kekuatan hubungan tersebut dalam
koefisien korelasinya. Dengan demikian
biasanya analisa regresi dan korelasi
sering dilakukan bersama-sama.
 Dalam menentukan apakah terdapat suatu 73
hubungan yang logis antar variabel, terutama bila

## penilaian dilakukan terhadap angka-angkaPhD @2015

statistik saja, perlu diperhatikan beberapa hal
yang berkaitan dengan masuk akal atau tidaknya
hubungan tersebut jika ditinjau dari sifat dasar
hubungan tersebut.
 Terdapat beberapa kemungkinan bentuk relasi
meliputi hubungan sebab akibat (cause-and-
effect relationship), hubungan akibat penyebab
yang sama (common-cause factor relationship)
hubungan semu (spurious relationship).

1. Pendahuluan
Langkah pertama dalam menganalisa 74
relasi antar variabel adalah dengan PhD @2015

## membuat diagram pencar (scatter

diagram) yang menggambarkan titik-
titik plot dari data yang diperoleh.
Diagram pencar ini berguna untuk
 membantu dalam melihat apakah ada relasi yang
berguna antar variabel,
 membantu dalam menentukan jenis persamaan yang
akan digunakan untuk menentukan hubungan tersebut.

1. Pendahuluan
Linier positif Linier negatif
76
PhD @2015

77
PhD @2015

## Curvelinier Tak tentu

Fungsi regresi linear dapat dinyatakan dalam hubungan matematis oleh: Y  A  BX .
Sebagai misal Y = 2 + 1,4X, secara teoritis bila X = 10, maka Y = 16. Pada kenyataannya
tidak demikian, sebab yang mempengaruhi Y bukan hanya X tetapi ada faktor lain yang tidak
dimasukkan dalam persamaan, faktor tersebut secara keseluruhan disebut sebagai
akurat, selalu ada resiko yang disebabkan oleh adanya kesalahan. Kesalahan ini tidak dapat
dihilangkan sama sekali, maka resiko ini harus diperkecil sekecil mungkin dengan
memperkecil kesalahan. Dengan memperhitungkan kesalahan, regresi linear dinyatakan
sebagai Y  A  BX   .

79
PhD @2015

## Asumsi yang digunakan dalam regresi linear adalah sebagai berikut:

a. E i   0

b. E i2    2

c. E i  j   cov(i , j )  0

d. X i konstan
Untuk memperkirakan A dan B dipergunakan metode kuadrat kesalahan terkecil, dimana
Model sebenarnya : Y  A  BX  
Model perkiraan : Y  a  bX  e
a, b, dan e adalah penduga untuk A, B, dan 

 e i2   Yi  (a  bX i ) .
2
Yi  a  bX i  ei atau ei  Yi  (a  bX i ) dan
i

80
PhD @2015

## penurunan parsial terhadap a dan b yang sederhana diperoleh

 i  i   X i  X iYi
Y X 2

a  Y  bX  i i i i
2
dan
 
n X i2    X i 
i  i 
n X i Yi   X i  Yi
b i i i
2
 
n X    X i 
i
2

i  i 
2. Analisis Regresi Linear
81
PhD @2015

y
ŷ  a  bx

y
y (0)
(+)
y
y
(-)
(+)

y
(0) y
(-)
y
(+)
y
y (-)
(+) y
(-)

## 2. Analisis Regresi Linear

Gambar 2 Garis regresi linier pada diagram pencar
x
Nilai variabel A dan B untuk populasi diberikan oleh
A  Y  B X dan
E  XY   E  X E Y  cov X , Y   xy
B  
2
 
E X  E  X 
2
var  X  x
1 
Bila s xy    X i Yi   X i  Yi / n  adalah penduga untuk  xy dan
n i i i 

1   
2

sx 
2 
 i  i i  
n  i
X 2
  X  / n  adalah penduga untuk  2 , maka
x

s xyx y i i

2.b Analisis
s

2
x
i
2 Regresi Linear
x i
i
83
PhD @2015

    
2

dimana  xi yi    X i Yi   X i  Yi / n  dan
 i 
i xi   i X i   i X i  / n 
2  2

i i i  

 2 
 e2  X 
var b    b2  dan var a    a   e  
2 2 1
2 
 i
x 2
 n i i 
x
i 
2
X
cova, b    a ,b   e2
 xi
2

## 2. Analisis Regresi Linear

84
PhD @2015

Contoh 1
Dari suatu praktikum fisika dasar diperoleh data yang menghubungkan variabel
bebas x dan variabel terikat y seperti ditunjukkan dalam tabel berikut.
Uji ke- x y
1 6 30
2 9 49
3 3 18
4 8 42
5 7 39
6 5 25
7 8 41
8 10 52
 56 296
2. Analisis Regresi Linear
85
PhD @2015

Jika berdasarkan kajian teoritis dan sifat dari fenomena yang menghubungkan x
dan y dapat diasumsikan mempunyai bentuk hubungan linier, maka persamaan
garis regresinya dapat ditentukan sebagai berikut.
Tabel perhitungan:
Uji ke- x y xy x2 y2
1 6 30 180 36 900
2 9 49 441 81 2401
3 3 18 54 9 324
4 8 42 336 64 1764
5 7 39 273 49 1521
6 5 25 125 25 625
7 8 41 328 64 1681
8 10 52 520 100 2704
 56 296 2257 428 12920
2. Analisis
x  Regresi
 x  56  7
n 8
y  Linear
 y  296  37
n 8
86
PhD @2015

## Kolom y2 ditambahkan pada tabel meskipun belum digunakan untuk perhitungan

persamaan garis regresi. Nilai tersebut akan digunakan kemudian. Jadi dengan
menggunakan hasil pada tabel, nilai dari konstanta a dan b dapat ditentukan:
n   xy     x   y  8(2257)  (56)(296) 1480
b    5,1389
n  
 x2   x 
2
8(428)  (56) 2
288

a  y  bx  37  (5,1389)(7)  1,0277
Jadi persamaan garis regresi linier yang menggambarkan hubungan antara
variabel x dan y dari data sampel pada percobaan/praktikum di atas adalah:
yˆ  a  bx  1,0277  5,1389x
Dengan menggunakan persamaan garis regresi yang diperoleh, maka dapat
diperkirakan hasil yang akan diperoleh (nilai y) untuk suatu nilai x tertentu.
Misalnya untuk x = 4 maka dapat diperkirakan bahwa y akan bernilai:
2. Analisis Regresi Linear
yˆ  a  bx  1,0277  5,1389x =1,0277 + 5,1389(4) = 21,583
87
PhD @2015

60

50 y = 5.1389x + 1.0278

40

30
y

20

10

0
0 2 4 6 8 10 12

2. AnalisisGambar.
Regresi Linear
Garis regresi untuk contoh soal 1
88
PhD @2015

## Karena variansi dari A dan B tidak diketahui maka digunakan variansi

dari a dan b yang dapat dinyatakan sebagai

e 2  i  i
y  b 2
x 2
y i  b xi y i
S 
2
 i i i
 i i

## n2 n2 n2

e

 2 
S 2

2 1 X 
Sb 
2 e
dan S a  S e  
2
2 
i xi
2
 n  xi 
2. Analisis Regresi  i 
Linear
89
PhD @2015

y y

x x

(a)x (b)x

Derajat
2. Analisis variasi sebaran
Regresi data
Linear
90
PhD @2015

Dengan menggunakan data dan tabel perhitungan pada contoh 1, maka standard
error estimasi dari garis regresi yang diperoleh adalah:

s y ,x 
  y 2   a   y   b   xy 
n2
(11,920)  1,0277(296)  5,1389(2,257)
  1,698
82

## 2. Analisis Regresi Linear

91
PhD @2015

Untuk melihat pengaruh X terhadap Y, maka dilakukan pengujian pada koefisien regresi
B. Bila X tidak mempengaruhi Y maka B = 0, bila ada pengaruh negatif B < 0, ada pengaruh
positif B > 0, dan bila ada pengaruh X terhadap Y maka B  0. Perumusan untuk pengujian
a. Ho : B = 0
b. H1 : B > 0 (ada pengaruh X terhadap Y positif)
c. Dengan  diketahui, dari tabel distribusi-t maka dapat dihitung t untuk pengujian satu
arah dan t  untuk pengujian dua arah.
2

## d. Tentukan statistik uji (tb) yang diberikan oleh

b  Bo sb 
s y,x
tb 
sb ;  x  2

 (x ) 
2

n
3. Uji Koefisien dan Korelasi
e. Simpulkan, tolak Ho atau terima Ho.
92
PhD @2015

## Pendugaan Parameter Regresi

Dari nilai  atau derajat kepercayaan (1 -  ) yang telah ditentukan, interval
pendugaan parameter A dan B dapat ditentukan, yang diberikan masing-masing oleh:
b  t  sb  B  b  t  sb dan
2 2

a  t  sa  A  a  t  sa
2 2

## 3. Uji Koefisien dan Korelasi

93
PhD @2015

Dengan menggunakan data dan tabel perhitungan pada contoh 1 dan hasil
perhitungan standard error estimasi dari garis regresi yang diperoleh pada contoh 12,
maka uji kemiringan (slope) garis regresi dapat dilakukan sebagai berikut:
1. Hipotesis:
Ho : B = 0
H1 : B  0
2. α = 0.05
3. Digunakan distribusi t0,025 dengan df = n - 2 = 8 - 2 = 6
4. Batas-batas daerah penolakan uji dua ujung (two-tailed)
Dari tabel distribusi t batas kritis adalah = tcr = 2,447
5. Aturan keputusan:
Tolak H0 dan terima H1 jika perbedaan yang terstandard antara kemiringan
sample (b) dan kemiringan populasi yang dihipotesiskan (B Ho) kurang dari -
2,447 atau lebih dari 2,447. Jika sebaliknya terima H0
3. Uji Koefisien dan Korelasi
94
PhD @2015
6. Rasio Uji
s y ,x 1,698 1,698
sb     0,283
 x   56  6
2 2

x2   n
428 
8

b  BHo 5,1389  0
RUt  ttest    18,159
sb 0,283

7. Pengambilan keputusan
Karena RUt = 18,159 bernilai jauh lebih besar daripada nilai batas tcr = 2,447,
maka H0: B = 0 ditolak. Hal ini bahwa hipotesis alternatif yang menyatakan
bahwa terdapat kemiringan pada garis regresi untuk populasi serta suatu
hubungan regresi yang berarti benar-benar ada antara variabel X dan Y.

## Kesimpulan diatas dapat juga diperkuat dengan menentukan perkiraan interval

3. Uji Koefisien dan Korelasi
nilai B dengan tingkat kepercayaan 95 persen sebagai:
b - t(sb) < B < b - t(sb)
5,1389 - 2,447(0,283) < B < 5,1389 + 2,447(0,283)
4,4464 < B < 5,8314
Dengan menganggap nilai variable terikat, y yang sesungguhnya terdistribusi
normal di sekitar garis regresi maka suatu estimasi interval dapat diperoleh sebagai:
95
yˆ  z  sy ,x  Presented by Ismet Hari Mulyadi
PhD @2015
Dalam relasi ( z adalah skor z yang akan menentukan tingkat kepercayaan dari
penerimaan estimasi interval yang dilakukan. Gambar 7 mengilustrasikan estimasi
interval untuk z = 2.

 3s y , x
y ŷ
 3s y , x

yˆ1  2s y ,x ŷ 1

x
x1

96
PhD @2015

## Untuk Sampel Kecil (n < 30)

a. Prediksi Kisaran Nilai Rata-rata y Jika Diketahui x
Estimasi interval untuk sampel kecil dengan situasi ini dapat diperoleh dengan
rumus berikut:

 
 
g 
2
1 x  x
yˆ  t / 2 sy ,x  

 
2
n x

  
 x2 
n



dimana:
ŷ = estimasi titik yang dihitung dengan persamaan regresi untuk nilai x tertentu
tα/2 = nilai t untuk α/2 ( =tingkat kepercayaan) dengan derajat kebebasan n-2
xg = nilai x yang ditentukan
n = jumlah observasi pasangan pada sampel
97
PhD @2015

## b. Prediksi Kisaran Nilai Spesifik y Jika Diketahui x

Estimasi interval untuk sampel kecil dengan situasi ini dapat diperoleh dengan
rumus berikut:
 
 
 
2
1 x  x
yˆ  t / 2 s y ,x 1   
g

 
2
n  x

   
x2 
n


98
PhD @2015

 Dengan menggunakan data dan tabel perhitungan pada contoh 1 dan persamaan
garis regresi yang dihasilkan serta nilai sy,x pada contoh 2 , dapat diprediksi
dengan tingkat kepercayaan 95 persen dan derajat kebebasan = n - 2 = 8 -2 = 6,
untuk x = 4,

 
 
g 
2
1 x  x
yˆ  t / 2 s y ,x  

 
2
n  x

  
 x2 
n



 
1  4  7  2

##  21,583  2,447 1,698  

 8 428   56  8 
2
 

Jadi dengan derajat kepercayaan 95 persen diperoleh: 19,038 < ŷ < 24,128
99
PhD @2015
Sebelum dilakukan analisa regresi, langkah yang biasa ditempuh adalah melakukan
analisa korelasi yang ditujukan untuk mengetahui erat tidaknya hubungan antar variabel.
Pada analisa regresi, untuk observasi Y diasumsikan bahwa X adalah tetap konstan dari
sampel ke sampel. Interpretasi koefisien korelasi untuk mengukur kuatnya hubungan antar
variabel tergantung pada asumsi yang digunakan untuk X dan Y. Bila X dan Y bervariasi
maka koefisien korelasi akan mengukur “covariability (kesamaan variasi)” antara X dan Y. Di
dalam analisa regresi, koefisien korelasi digunakan untuk mengukur “cocok/tepat (fitness)”
garis regresi sebagai pendekatan data observasi. Besarnya koefisien korelasi dinyatakan
sebagai

cov( X , Y )  xy
 
 x y  x y

Dalam prakteknya,  tidak diketahui tetapi nilainya dapat diestimasi berdasar data sampel.
Bila r adalah penduga  , dengan r dinyatakan sebagai
x y i i n X i Yi   X i  Yi

4. Analisis
  Korelasi
r

  i
i

xi
i
yi

n

X 
i
2
i

Xi 
2
i i

2 
n Yi    Yi 
2

i  i  i  i 
Pengujian hipotesis tentang  dilakukan dengan langkah-langkah sebagai berikut
a. Ho :  = 0 (tidak ada hubungan antara X dan Y)
100
H1 :  > 0 (ada hubungan positif) Presented by Ismet Hari Mulyadi
H1 :  < 0 (ada hubungan negatif)
PhD @2015
H1 :  0 (ada hubungan)
Apabila  = 0, maka variansi r diberikan oleh
1 r2
var( r )   r2 
n2
2
Dimana r disebut sebagai koefisien determinasi untuk mengukur besarnya kontribusi X

b. Dengan  diketahui, dari tabel distribusi-t maka dapat dihitung t ( n  2 ) untuk pengujian

( n2)
2

## c. Tentukan statistik uji (t b) yang diberikan oleh

r n2
tr  dengan derajat kebebasan n
1 r2

## d. Simpulkan, tolak Ho atau terima Ho.

4. Analisis Korelasi
101
PhD @2015

 Dengan menggunakan data dan tabel perhitungan pada contoh 1 dan persamaan
garis regresi yang dihasilkan dapat diperoleh koefisien determinasi dan koefisien
korelasi sebagai berikut. Dari persamaan regresi a = 1,0277 dan b = 5,1389.
Jumlah pasangan pengamatan n = 8. Maka:

a   y   b   xy   n  y 
2

r2 
  y  2
 n  y  2

## 1,0277  296   5,1389  2257   8  37 

2

  0,982
11920  8  37 
2

r   0,982  0,991

4. Analisis Korelasi
102
PhD @2015

## Hubungan antara koefisien regresi b dengan koefisien korelasi r dinyatakan oleh

br
sy
sx
dimana s y 
1
n i

 Yi  Y 
2
dan s x 
1
n i

 Xi  X 2
.

4. Analisis Korelasi
103
Dalam statistika seringkali menduga nilai rata-rata Y pada nilai X tertentu.Presented
PhD @2015
ditunjukkan bahwa Yˆ  a  bX adalah penduga E(Y|X). Misalkan Ŷo adalah nilai Yˆ pada X =

Xo, maka

 
E Yˆo  Ea  bX o   Ea   EbX o  A  BX o  EYo | X o 

## Interval penduga E(Yo|Xo) dengan tingkat keyakinan 1    diberikan oleh

1 X o  X  1 X o  X 
2 2

a  bX o   t / 2 se   E Yo | X o   a  bX o   t / 2 se 
n  Xi 2
n  X i2
Interval penduga untuk individu Yo pada X = Xo diberikan oleh

1 X o  X  1 X o  X 
2 2

a  bX o   t / 2 se   Yo  a  bX o   t / 2 se 
n  Xi 2
n  X i2

4. Analisis Korelasi
104
5. Regresi Linear Non Linear Presented by Ismet Hari Mulyadi
PhD @2015

Tidak selamanya hubungan antara X dan Y dapat bersifat linear, akan tetapi bisa juga
non linear. Metode kesalahan kuadrat terkecil dapat pula digunakan untuk menentukan
parameter sebagai koefisien pada hubungan yang non linear. Bentuk-bentuk hubungan non
linear dapat didekati/ditransformasi sebagai hubungan linear, Tabel 11.1. adalah beberapa
bentuk transformasi dari non linear menjadi linear Yo  Ao  Bo X o .
Tabel 11.1. Hubungan Koefisien Non Linear Dengan Hasil Transformasi Linear
Persamaan Hasil Transformasi Yo  Ao  Bo X o
Persamaan Asal
Yo Ao Bo Xo

## Y  AX B log Y log A log X

B Y A B 1
Y  A
X X

Y  Ae BX ln Y ln A B X