Anda di halaman 1dari 32

INTRODUCTION TO OPTIMAL DESIGN

Utami Dyah Syafitri


Disampaikan pada mata kuliah STA500

Program Studi Statistika dan Sains Data


Departemen Statistika FMIPA IPB

Utami Dyah Syafitri - PS Statistika dan Sains Data


Ilustrasi (1)
• Suatu percobaan dilakukan untuk mengetahui pengaruh rasio dari rasio
antara “the Initial potassium/carbon (K/C) atomic ratio” (%) terhadap “the
desorption of carbon monoxide “ (mole/mole C %)
N0 Initial K/C atomic CO desorbed N0 Initial K/C atomic CO desorbed
ratio (%) (mole/mole C %) ratio (%) (mole/mole C %)
1 0.05 0.05 12 1.25 2.45
2 0.05 0.10 13 2.10 3.05
3 0.25 0.25 14 2.10 3.19
4 0.25 0.35 15 2.10 3.25
5 0.5 0.75 16 2.10 3.43
6 0.5 0.85 17 2.10 3.50
7 0.5 0.95 18 2.10 3.93
8 1.25 1.42 19 2.50 3.75
9 1.25 1.75 20 2.50 3.93
10 1.25 1.82 21 2.50 3.99
11 1.25 1.95 22 2.50 4.07
Utami Dyah Syafitri - PS Statistika dan Sains Data
4.5

Pola hubungan antara


4
Initial K/C atomic ratio
3.5
dengan CO desorbed
linear
CO desorbed (mole/mole C %)

2.5

2 Kenapa enam level yang


digunakan?
1.5

0.5
Kenapa ulangan pada
0 masing-masing level
0 0.5 1 1.5 2 2.5 3
Initial K/C atomic ratio (%) berbeda?

Utami Dyah Syafitri - PS Statistika dan Sains Data


Ilustrasi (2) The Viscosity of Elastomer Blends
Filler level (phr)
Napththenic oil
(phr) Filler 0 12 24 36 48 60
0 A 26 28 30 32 34 37
B 26 38 50 76 108 157
C 25 30 35 40 50 60
10 A 18 19 20 21 24 24
B 17 26 37 53 83 124
C 18 21 24 28 33 41
20 A 12 14 14 16 17 17
B 13 20 27 37 57 87
C 13 15 20 20 24 29
30 A 12 13 13 14 14
B 15 27 27 41 63
C 11 14 17 17 18 25

Utami Dyah Syafitri - PS Statistika dan Sains Data


Utami Dyah Syafitri - PS Statistika dan Sains Data
Ilustration (3) - design in conjoin analysis
• Conjoin analysis merupakan analysis preferensi bagi konsumen
• Misalkan preferensi terhadap sepeda

Utami Dyah Syafitri - PS Statistika dan Sains Data


Atribut yang digunakan dalam membeli sepeda
• Jenis sepeda : road, mountain, urban, junior
• Bentuk stang : lengkung, lurus
• Ukuran roda: 16 inch – 29 inch
• Bentuk sadel : tipis, standar, lebar
• Harga : 1 juta – 20 juta
• Model : Standar, Lipat
• Merk : Polygon, United Bike, Roucky Mountain Bicyles, Santa Cruz

Bagaimana cara menyusun profile untuk dievaluasi oleh pelanggan?

Utami Dyah Syafitri - PS Statistika dan Sains Data


Traditional conjoint

Rank

1 10 1 10 1 10
Rating
Utami Dyah Syafitri - PS Statistika dan Sains Data
Choice Based Conjoint

Utami Dyah Syafitri - PS Statistika dan Sains Data


Tahapan (1)

Tahap I Tahap II Tahap III

• Definisi • Pemilihan • Keterpenuhan


permasalahan Metode Konjoin asumsi dari
• Merancang analisis konjoin
stimuli
• Merancang
bagaimana
stimuli diukur
• Merancang
kuesioner

Utami Dyah Syafitri - PS Statistika dan Sains Data


Tahapan (2)

Tahap IV Tahap V Tahap VI Tahap VII

• Pendugaan • Interpretasi • Validasi • Aplikasikan


model hasil baik hasil: hasil konjoin
konjoin dalam level internal dan analisis
• Evaluasi umum eksternal untuk
kebaikan maupun validity segmentasi
model dalam level pelanggan,
individu analisis
• Kepentingan profit, choice
relatif dari simulator
atribut

Utami Dyah Syafitri - PS Statistika dan Sains Data


Desain-Empat pertanyaan
• Atribut mana yang paling penting dalam menilai preferensi dari
responden – pemilihan atribut
• Bagaimana responden tahu mengenai makna dari masing-masing
faktor – pemilihan level
• Apa yang dievaluasi oleh responden – kombinasi dari atribut 
profil
• Berapa banyak profil yang dievaluasi -- rancangan

Utami Dyah Syafitri - PS Statistika dan Sains Data


Desain
• Karena biasanya jumlah level dan faktor banyak maka
tidak digunakan rancangan faktorial
• Rancangan yang biasa digunakan adalah fraksional
faktorial atau bridging design atau orthogonal array
atau rancangan yang optimal berdasarkan kriteria
tertentu
• Rancangan yang optimal -- Skala pengukuran dari respon
juga menentukan rancangan yang dihasilkan

Utami Dyah Syafitri - PS Statistika dan Sains Data


Illustration (4)
A {3,2} simplex-lattice design
The available stock
F1 F2 F3

F1= 1.5 kg F2= 3 kg F3=3 kg 100% 0% 0%

0% 100% 0%

0% 0% 100%

Assume that each mixture 50% 50% 0%

has weight 1 kg 0% 50%


50%

0% 50% 50%

The total amount


2 kg 2 kg 2 kg

Utami Dyah Syafitri - PS Statistika dan Sains Data


The alternative designs
Six different mixtures Seven different mixtures
F1 F2 F3 F1 F2 F3

0% 10% 90% 100% 0% 0%

0% 60% 40% 0% 100% 0%

5% 25% 70% 0% 0% 100%

10% 45% 45% 0% 50% 50%

45% 40% 15% 25% 75% 0%

55% 15% 40% 25% 0% 75%

0% 50% 50%

1.15 kg 1.85 kg 3 kg
1.5 kg 2.25 kg 2.25 kg
1.5 kg 2.75 kg 2.75 kg

Utami Dyah Syafitri - PS Statistika dan Sains Data


The design problem

• What ingredient proportions have to be used?

• What is the optimal number of mixtures or


experimental runs?

Utami Dyah Syafitri - PS Statistika dan Sains Data


Optimal design?

A flexible
approach

Search a design that


maximizes the information
contained within the
experiment
The available budget
The number of factors Taking
Types of factors into
account
The model
Other constraints

Utami Dyah Syafitri - PS Statistika dan Sains Data


Goals in experimentation

Precision of Precision of
parameter response
estimation prediction

D-optimality I-optimality
criterion criterion
A-optimality G-optimality
criterion criterion

Utami Dyah Syafitri - PS Statistika dan Sains Data


D-optimality
• seeks designs that minimize the volume of the
confidence ellipsoid about the unknown parameters
• seeks designs that minimize the determinant of the
covariance matrix s 2(X’X)-1
• seeks designs that maximize determinant of information
matrix on b, namely X’X
• focuses on precise estimation

Utami Dyah Syafitri - PS Statistika dan Sains Data


D-optimality criterion
• seeks designs that minimize the volume of the
confidence ellipsoid about the unknown
parameters in the model

Design 1

Design 2
b1

b2
Utami Dyah Syafitri - PS Statistika dan Sains Data
G- and I-optimality
• G-optimality seeks designs that minimize the maximum
prediction variance over the experimental region c
• I-optimality seeks designs that minimize the average
variance of prediction over the experimental region c

 f '  x X ' X  f  x d x


1

 d x
• Rodriguez et al. (2010) argue in favor of I-optimality over
the

Utami Dyah Syafitri - PS Statistika dan Sains Data


I-optimality
• Response prediction at given x

yˆ | x  f ' x X' X  f x 
1

• Variance of response prediction at given x

var( yˆ | x )  s f ' x X' X  f x 


2 1

• Seek designs that minimize the average variance


of prediction over the experimental region

Utami Dyah Syafitri - PS Statistika dan Sains Data


Computation
I-optimality criterion can be calculated exactly for simplex
shaped experimental regions.
 
tr X' X   f x f ' x dx 
1 1

q    

moments
matrix = B
Element of B is calculated: (assume that no additional constraints)
  p  1
q

 x  i 1
p1 p2 pq i
x  x dx1dx2  dxq
( q   p )
1 2 q q
i 1 i
Utami Dyah Syafitri - PS Statistika dan Sains Data
I-optimality criterion
• I-optimality seeks designs that minimize the
average variance of prediction over the
experimental region c

Design 1

Design 2

Utami Dyah Syafitri - PS Statistika dan Sains Data


Back to Ilustration (4) - The alternative designs
Six different mixtures Seven different mixtures
F1 F2 F3 F1 F2 F3

0% 10% 90% 100% 0% 0%

0% 60% 40% 0% 100% 0%

5% 25% 70% 0% 0% 100%

10% 45% 45% 0% 50% 50%

45% 40% 15% 25% 75% 0%

55% 15% 40% 25% 0% 75%

0% 50% 50%

1.15 kg 1.85 kg 3 kg
1.5 kg 2.25 kg 2.25 kg
1.5 kg 2.75 kg 2.75 kg

Utami Dyah Syafitri - PS Statistika dan Sains Data


Method

The resulting optimal design problem is akin to


the knapsack problem in operations research.

We propose a

Variable Neighborhood Search (VNS)


algorithm

Utami Dyah Syafitri - PS Statistika dan Sains Data


The flowchart
INPUT

A candidate set based on


a {q,h} simplex design

A set of availability
constraints

OUTPUT

The optimal number of


runs

The optimal ingredient


proportions

Utami Dyah Syafitri - PS Statistika dan Sains Data


Neighborhood evaluation
Scenario 3.4

ANOVA (p value = <0.001*)

Utami Dyah Syafitri - PS Statistika dan Sains Data


The instance

• There are three types of flour


• Each experimental run requires at least 30% of flour 1 and
20% of flour 3
• The availability constraints are 10.2 kg of flour 1, 4 kg of
flour 2, and 4.9 kg of flour 3
• Second-order Scheffé model
• Every experimental run requires 1 kg in total

Utami Dyah Syafitri - PS Statistika dan Sains Data


I-optimal design D-optimal design
15 runs, 8 distinct points 18 runs, 6 distinct points

2 4

4 2
2 5
1
2 2 1 4 2 1
1

F1=7.35 kg F2=2.75 kg F3=4.9 kg F1=9.25 kg F2=3.85 kg F3=4.9 kg

Utami Dyah Syafitri - PS Statistika dan Sains Data


Discussion
• When there are availability constraints, the optimal number of
runs is unknown beforehand
• Our algorithm for finding the optimal designs resembles
algorithms from operations research for solving multi-
dimensional knapsack problems
• We define a new type of design problem with substantial
differences between D- and I-optimal designs

Utami Dyah Syafitri - PS Statistika dan Sains Data


Utami Dyah Syafitri - PS Statistika dan Sains Data

Anda mungkin juga menyukai