Anda di halaman 1dari 26

Mtaheuristiques pour le flow-shop de

permutation bi-objectif stochastique


Arnaud Liefooghe* Laetitia Jourdan* Matthieu Basseur**
El-Ghazali Talbi *
* LIFL INRIA Lille-Nord Europe, quipe-projet Dolphin

Parc scientifique de la Haute-Borne, 40 av. Halley, 59650 Villeneuve dAscq, France


{Arnaud.Liefooghe, Laetitia.Jourdan, El-Ghazali.Talbi}@lifl.fr
** LERIA, UFR Sciences

2 Boulevard Lavoisier, 49045 Angers cedex 01, France


Matthieu.Basseur@univ-angers.fr

RSUM. Bien que les algorithmes volutionnaires soient couramment utiliss pour rsoudre des
problmes multi-objectifs dune part, et stochastiques dautre part, trs peu de travaux ont t
mens sur ces deux aspects simultanment. Par exemple, les problmes dordonnancement sont
habituellement traits sous une forme mono-objectif dterministe, alors quils sont clairement
multi-objectifs et quils sont soumis de nombreux facteurs dincertitude. Dans cet article, nous
prsentons diffrentes approches pour rsoudre des problmes doptimisation multi-objectif stochastiques et les appliquons un problme dordonnancement de type flow-shop de permutation
bi-objectif avec dures dexcution alatoires.
ABSTRACT. Although evolutionary algorithms are commonly used for solving multi-objective
problems on the one hand and stochastic problems on the other hand, very few studies have
investigated these two aspects simultaneously. For instance, scheduling problems are usually
tackled in a single-objective deterministic form, whereas they are clearly multi-objective and
they are subject to a wide range of uncertainty. In this paper, we present different approaches
to solve stochastic multi-objective optimization problems and apply them to a bi-objective permutation flow-shop scheduling problem with random processing times.

Mtaheuristiques, algorithmes volutionnaires, optimisation multi-objectif, incertitude, problmes dordonnancement, dures dexcution alatoires

MOTS-CLS :

KEYWORDS: Metaheuristics, evolutionary algorithms, multi-objective optimization, uncertainty,


scheduling problems, random processing times

RSTI - RIA 22/2008. Mtaheuristiques, pages 183 208

184

RSTI - RIA 22/2008. Mtaheuristiques

1. Introduction
Durant les vingt dernires annes, beaucoup de travaux se sont penchs sur les
problmes doptimisation multi-objectif, dont le but est de trouver un ensemble de
solutions offrant diffrents compromis entre les critres considrs. Rsoudre ce type
de problme de faon exacte est souvent impossible en raison de la difficult intrinsque du problme ou du grand nombre doptima. Ainsi, des mthodes approximatives
telles que les mtaheuristiques, et particulirement les algorithmes volutionnaires,
sont couramment utilises afin de trouver une bonne approximation de cet ensemble de
solutions de compromis (Deb, 2001; Coello Coello et al., 2002). Un algorithme volutionnaire est une mthode doptimisation stochastique itrative inspire par lvolution biologique des espces. Une solution ralisable pour le problme tudi est vue
comme un individu soumis lvolution. Un ensemble dindividus interviennent au
sein de lalgorithme et constituent une population. Celle-ci samliore au fur et mesure de gnrations jusqu la vrification dun critre darrt. chaque gnration,
une succession doprateurs gntiques est applique aux individus afin de constituer
la population de la gnration suivante.
Par ailleurs, une grande partie des problmes doptimisation rels sont soumis
des incertitudes devant tre prises en compte, tant au niveau de la (ou des) fonction(s)
objectif quau niveau des paramtres environnementaux ou des variables de dcision.
Comme le montre ltat de lart propos par Jin et Branke (Jin et al., 2005), beaucoup de mthodes de rsolution ddies aux problmes doptimisation sous incertitude
sont galement des algorithmes volutionnaires. Malgr limportance de loptimisation multi-objectif et de loptimisation sous incertitude, trs peu de travaux consacrs
loptimisation multi-objectif sous incertitude existent ce jour. En outre, bien quelles
soient gnralement adaptables au cas combinatoire, les tudes existantes nont t
exprimentes que sur des problmes continus ou sur des fonctions de test. Or, il nest
pas vident que les performances soient identiques pour des problmes combinatoires.
Par exemple, les problmes dordonnancement sont des problmes combinatoires habituellement tudis sous une forme mono-critre dterministe. Pourtant, bien quil
existe de nombreux problmes dordonnancement multi-objectifs dune part (Tkindt
et al., 2002), et stochastiques dautre part (Billaut et al., 2005), aucune tude alliant
ces deux aspects simultanment existe ce jour.
Dans cet article, nous prsentons divers modles de reprsentation de lincertitude
pour un problme dordonnancement de type flow-shop de permutation. Nous proposons galement plusieurs mthodes doptimisation multi-objectif permettant de manipuler un type quelconque de distribution de probabilit, que ce soit sur les paramtres
ou sur les fonctions objectif. Ces mthodes sont des algorithmes volutionnaires multiobjectifs bass sur un indicateur de qualit proposs par Zitzler et Knzli (Zitzler et
al., 2004) pour le cas dterministe. Ces algorithmes sont alors appliqus un problme de flow-shop de permutation bi-objectif avec dures dexcution incertaines.
notre connaissance, cest la premire fois quun tel problme est tudi sous une forme
multi-critre. Le reste de larticle est organis comme suit. La section 2 est consacre
loptimisation multi-objectif et loptimisation multi-objectif sous incertitude. Dans

Flow-shop bi-objectif stochastique

185

la section 3, un problme de flow-shop bi-objectif avec temps dexcution stochastiques est formul. La section 4 prsente trois algorithmes volutionnaires ddis
la rsolution de problmes doptimisation multi-objectif stochastiques et leur application sur le problme dordonnancement tudi ici. La section 5 donne des rsultats
exprimentaux. Enfin, la dernire section conclut le document et donne quelques perspectives de recherche dans ce domaine.

2. Prliminaires
Cette section donne les notions, dfinitions et notations fondamentales pour loptimisation multi-objectif. Puis, nous nous concentrons plus particulirement sur le cas
de loptimisation multi-objectif bas sur un indicateur de qualit, et prsentons les
principaux travaux ddis la prise en compte de lincertitude en optimisation volutionnaire.

2.1. Optimisation multi-objectif


Loptimisation multi-objectif vise optimiser plusieurs composants dun vecteur
de fonctions cot, chaque composant correspondant un objectif. Le processus doptimisation cherche donc minimiser ou maximiser plusieurs critres simultanment.
La difficult rside dans le fait que ces critres sont souvent antagonistes, i.e. lorsque
lun deux est amlior, les autres sont gnralement dgrads. Un problme doptimisation multi-objectif (Multi-objective Optimization Problem, ou MOP) peut tre
formul ainsi :

min f (x) = (f1 (x), f2 (x), . . . , fn (x))
(M OP ) =
[1]
tel que x X
o f1 , f2 , . . . , fn sont les n 2 fonctions objectif optimiser, x = (x1 , x2 , . . . , xk )
est un vecteur de k variables de dcision, et X reprsente lensemble des solutions
ralisables dans lespace dcisionnel. Dans le cas combinatoire, un vecteur de dcision x X a un nombre fini de valeurs possibles. Soit Z lensemble des points
ralisables dans lespace des objectifs. chaque vecteur de dcision x X est affect un vecteur objectif z Z bas sur le vecteur de fonction cot f : X Z
avec z = z1 , z2 , . . . , zn = f (x) = f1 (x), f2 (x), . . . , fn (x). Notez que tout au long
de larticle nous considrons que les valeurs objectif sont normalises. Pour ce faire,
chacune des fonctions objectif est remplace par une fonction normalise correspondante dont les valeurs sont comprises dans lintervalle [0, 1]. Sans perte de gnralit,
nous supposons ici que Z Rn et que les n fonctions objectif sont minimiser.
Un vecteur objectif z Z domine faiblement un vecteur objectif z Z si et
seulement si i [1..n], zi zi . On notera alors z  z . Un vecteur objectif z Z
domine un vecteur objectif z Z si et seulement si z  z et j [1..n] tel que
zj < zj . On notera alors z z . Une solution x X est Pareto optimale sil nexiste

186

RSTI - RIA 22/2008. Mtaheuristiques

pas de solution x X telle que f (x ) f (x). Le but de loptimisation est de


trouver lensemble des solutions Pareto optimale, ou ensemble Pareto optimal PO.
Cet ensemble est dfini ainsi :
PO = {x X| 6 x X, f (x ) f (x)}

[2]

Gnrer la totalit des solutions Pareto optimales est en gnral impossible (en
raison du temps de calcul et de la complexit du problme). Les algorithmes volutionnaires sont couramment utiliss pour trouver une approximation de cet ensemble
qui soit de bonne qualit en termes de convergence et de diversit. Le lecteur se rfrera (Deb, 2001; Coello Coello et al., 2002) pour plus de dtails sur loptimisation
volutionnaire multi-objectif.

2.2. Optimisation base sur un indicateur de qualit


Il existe diffrentes interprtations de ce quest une bonne approximation de lensemble Pareto optimal. La dfinition de qualit dapproximation dpend fortement
des prfrences du dcideur et du scnario de loptimisation. En se basant sur cette
observation, Zitzler et Knzli (Zitzler et al., 2004) proposent de dfinir le but de loptimisation laide dun indicateur binaire de qualit I : R (o reprsente
lensemble de tous les ensembles possibles de solutions). La valeur I(A, B) quantifie
la diffrence de qualit entre deux ensembles A et B . Maintenant, si R dnote
un ensemble de rfrence (qui peut tre PO ou nimporte quel autre ensemble), le but
global de loptimisation peut tre formul comme suit :
argminA I(A, R)

[3]

Considrons une population P comme un ensemble de solutions de X. La fonction


de f itness dun algorithme volutionnaire multi-objectif mesure lutilit dune solution x P par rapport au but de loptimisation, ici donn par lquation 3. Comme
propos dans lalgorithme IBEA (Indicator-Based Evolutionary Algorithm) (Zitzler
et al., 2004), nous dfinissons la valeur de f itness dune solution x P comme la
mesure de la perte de qualit de la population P si x en tait supprime :
f itness(x) = I(x, P \ {x})

[4]

Lindicateur I, qui peut tre choisi en fonction des prfrences du dcideur, est donc
directement utilis pour quantifier la qualit dune solution durant les processus de
slection de lalgorithme volutionnaire. Un des avantages de loptimisation base sur
un indicateur de qualit est que lindicateur utilis peut prendre en compte la notion
de diversit. Ainsi, aucun mcanisme de diversification supplmentaire nest gnralement ncessaire au sein de lalgorithme volutionnaire.
Prenons lexemple de lindicateur -additif (I+ ) propos dans (Zitzler et al., 2003;
Zitzler et al., 2004). Comme illustr sur la figure 1, I+ mesure la distance minimale

Flow-shop bi-objectif stochastique


f2

187

f2
z

z
I(z,z) > 0

I(z,z) > 0
z

z
I(z,z) > 0

I(z,z) < 0
f1

f1

Figure 1. Illustration de lindicateur -additif (I+ )


par laquelle un point z Z doit ou peut tre translat dans lespace objectif pour
dominer faiblement un autre point z Z. Pour un problme o les n objectifs sont
minimiser, il peut tre dfini comme suit :
I+ (z, z ) =

max (zi zi )

i{1,...,n}

[5]

Ainsi, dans le cas dterministe, pour valuer la qualit dune solution x X par
rapport une solution x X laide de I+ , il suffit dutiliser le vecteur objectif
associ chacune des solutions (nous verrons que ce sera moins trivial pour le cas
stochastique) :
I+ (x, x ) = I+ (f (x), f (x ))

[6]

Ensuite, pour mesurer la qualit dune solution x X par rapport une population P laide de I+ (et donc calculer la valeur de f itness de x), plusieurs stratgies existent pour le cas dterministe. Un exemple couramment employ (Zitzler et
al., 2004) est donn dans lquation suivante, o est un facteur de redimensionnement.
X

I+ (x, P \ {x}) =
eI+ (x ,x)/
[7]
x P \{x}

Cette approche additive a tendance amplifier linfluence des solutions non domines
sur les autres solutions. Dautres exemples dindicateurs de qualit pouvant tre utiliss au sein dIBEA sont donns dans (Hansen et al., 1998; Zitzler et al., 2003; Zitzler
et al., 2004).

2.3. Optimisation volutionaire en environnement incertain


Dans leur tat de lart sur les mthodes volutionnaires ddies loptimisation
sous incertitude, Jin et Branke (Jin et al., 2005) classifient les types dincertitude
en quatre catgories : (i) fonction objectif bruite, (ii) variables ou paramtres environnementaux soumis des perturbations ou changeant aprs le processus doptimisation, (iii) fonction objectif approxime, (iv) fonction objectif voluant au cours

188

RSTI - RIA 22/2008. Mtaheuristiques

du temps. Les auteurs remarquent que peu dtudes ont t ralises sur loptimisation multi-objectif en environnement incertain. Ainsi, Hughes (Hughes, 2001) et
Teich (Teich, 2001) ont suggr dtendre le concept de dominance Pareto pour le
cas stochastique en remplaant le rang dune solution par sa probabilit dtre domine ; mais chacune de ces deux tudes met une hypothse sur la distribution de
probabilit suivie par les fonctions objectif. Dans (Babbar et al., 2003), les auteurs
prsentent une autre mthode de ranking, base sur une valeur moyenne par objectif
et sur la variance de ces valeurs, calcules partir dun chantillon dvaluations. De
mme, Deb et Gupta (Deb et al., 2005) proposent dappliquer des mthodes classiques
doptimisation multi-objectif en utilisant une valeur moyenne par objectif. Plus rcemment, Goh et Tan ont tudi limpact de fonctions objectif bruites sur des algorithmes
volutionnaires multi-objectifs et ont propos plusieurs dispositifs pour manipuler le
bruit (Goh et al., 2007). Enfin, Basseur et Zitzler (Basseur et al., 2006) ont rcemment
tendu le concept doptimisation par indicateur de qualit afin de prendre lincertitude
en considration. Les mthodes proposes dans la littrature ont majoritairement t
testes sur des problmes continus et o lincertitude se trouve sur les fonctions objectif. Ainsi, notre connaissance, cest la premire fois quun problme doptimisation
combinatoire multi-objectif ayant des paramtres environnementaux stochastiques est
tudi. Nanmoins, tous les concepts introduits dans cet article sont applicables au cas
continu et tout type dincertitude, que ce soit sur les paramtres ou sur les fonctions
objectif.

3. Le problme dordonnancement de type flow-shop de permutation bi-objectif


avec dures dexcutions stochastiques
Le flow-shop est lun des problmes dordonnancement les plus tudis de la littrature. La majorit des travaux qui lui sont consacrs le considre sous une forme
dterministe mono-objectif et vise gnralement minimiser la date de fin de lordonnancement (le makespan). Bien que le flow-shop soit largement tudi sous une forme
stochastique dune part (Billaut et al., 2005) ou multi-objectif dautre part (Tkindt
et al., 2002), aucune tude alliant ces deux aspects simultanment na t mene
lheure actuelle. Dans cette section, nous prsentons un modle bi-objectif dterministe du flow-shop. Puis, nous nous intressons aux diffrentes sources dincertitude
auxquelles il peut tre soumis. Nous nous focalisons ensuite sur le flow-shop avec
temps dexcution incertains et proposons des modles stochastiques pour ce problme. Bien que ce travail se concentre sur le flow-shop, il est gnralisable tout
type de problmes stochastiques et aisment adaptable dautres problmes dordonnancement.

3.1. Modle dterministe


Le flow-shop consiste ordonnancer N jobs J1 , J2 , . . . , JN sur M machines
M1 , M2 , . . . , MM . Une machine ne peut traiter quun seul job la fois. Les machines

Flow-shop bi-objectif stochastique

189

Figure 2. Exemple dordonnancement pour un flow-shop de permutation 3 jobs et 4


machines
sont donc ici comparables une chane de production. Un job Ji est compos de
M tches conscutives ti1 , ti2 , . . . , tiM , o tij est la jime tche du job Ji , ncessitant la machine Mj . chaque tche tij est associ une dure dexcution pij , et
chaque job Ji est associe une date due di (la date de fin souhaite du job). Comme
illustr dans la figure 2, nous nous focalisons ici sur le flow-shop de permutation, o
la squence des jobs est identique et unidirectionnelle sur chaque machine (i.e. les
jobs doivent tous tre excuts dans le mme ordre M1 , M2 , . . . , MM ). Ainsi, pour
une instance de N jobs, il existe N ! solutions ralisables dans lespace de dcision.
Beaucoup de critres peuvent tre envisags lors de lordonnancement de tches sur
plusieurs machines. Le flow-shop considr ici consiste minimiser la fois le makespan (Cmax ) et le retard total (T ), qui sont deux des objectifs les plus tudis de
la littrature. Pour chaque tche tij ordonnance un temps sij , les deux fonctions
objectif peuvent tre calcules comme suit :
Cmax =

T =

N
X
i=1

max

i{1,...,N }

[siM + piM ]

[max(0, siM + piM di )]

[8]

[9]

Daprs la notation tablie par Graham et al. (Graham et al., 1979), le problme dordonnancement de type flow-shop de permutation bi-objectif tudi ici est
symbolis par F/perm, di /(Cmax , T ). Le lecteur est invit consulter (Nagar et
al., 1995; Tkindt et al., 2002; Landa Silva et al., 2004) pour plus dinformations
sur les prolmes dordonnancement multicritre.

3.2. Sources dincertitude


Dans les situations relles dordonnancement, lincertitude provient principalement des variables denvironnement et peut donc tre classe dans la seconde catgorie de la classification propose par Jin and Branke (Jin et al., 2005) ; i.e. variables ou

190

RSTI - RIA 22/2008. Mtaheuristiques

paramtres environnementaux soumis des perturbations. En effet, rares sont les paramtres associs aux problmes dordonnancement qui sont dpourvus dincertitude.
Les solutions sont sensibles ces perturbations, et il savre donc indispensable de tenir compte des zones dignorances et des -peu-prs que laissent entrevoir certains
paramtres (Roy, 2005). Cette incertitude peut provenir de diffrentes sources, telles
que des variations sur les dates dues, des pannes de machines, lajout ou la suppression inattendue de jobs, des temps dexcution variables, etc. Daprs la littrature du
domaine, il apparat que pour le flow-shop de permutation considr ici, lincertitude
est susceptible de provenir essentiellement des dates dues et des temps dexcution.
Tout dabord, dans le modle dterministe, la date due dun job Ji est donne par
une constante di . Pourtant, dterminer ce nombre sans ambigut parat difficile. Il
semblerait donc plus naturel de donner un intervalle [d1i , d2i ] durant lequel la satisfaction pour la compltion du job Ji dcrot. De plus, une date de fin di peut subir des
modifications dynamiques du fait quun job sans trop dimportance un moment peut
devenir plus important un autre moment (et vice versa). Par ailleurs, un temps dexcution peut varier dune excution une autre du fait dvnements extrieurs. Ainsi,
le temps dexcution pij associ une tche tij est rarement constant dans la ralit.
Il parat donc vident quaucun paramtre ne peut tre vu comme une donne exacte
et prcise et que des modles non dterministes doivent tre labors pour rsoudre un
problme dordonnancement. Pour cela, nous dcidons dadopter une approche proactive o les temps dexcutions sont considrs comme incertains et sont modliss
laide de variables alatoires.

3.3. Modles stochastiques


notre connaissance, le problme du flow-shop stochastique na jamais t tudi de faon multicritre. Pourtant, dans un cas rel, ds quun historique des temps
dexcution prcis et valide des diffrentes tches est disponible, il est relativement
ais dobtenir la distribution de probabilit associe aux donnes et, ainsi, la loi de
probabilit correspondante. Suite une analyse, nous proposons ici quatre distributions de probabilit gnriques pouvant tre suivies par une dure de traitement alatoire. Bien sr, une analyse statistique rigoureuse, base sur des donnes relles, est
imprative pour dterminer la loi de distribution exacte associe un temps dexcution pour un problme concret dordonnancement. Un tat de lart sur le problme du
flow-shop monocritre avec dures dexcution alatoires est propos dans (Gourgand
et al., 2005).
3.3.1. Loi uniforme
Tout dabord, il se peut quun temps dexcution pij soit compris entre deux valeurs a et b, la rpartition tant uniforme entre ces deux valeurs (voir figure 3). pij suit
alors une loi uniforme sur lintervalle [a, b] et admet pour densit :
 1
si x [a, b]
ba
[10]
f (x) =
0
sinon

Flow-shop bi-objectif stochastique

191

Bien que peu dexemples de temps dexcution suivant une loi uniforme aient t
trouvs au sein dapplications relles, ce modle a t conserv afin de fournir un
modle simplifi de la ralit. Il a, par exemple, t utilis dans (Kouvelis et al., 2000;
Gourgand et al., 2005). Le seul exemple effectif envisag est celui o la dure dun
traitement est dpendante du placement initial de la machine sur laquelle il est ralis.
3.3.2. Loi exponentielle
Une dure de traitement pij est susceptible de suivre une loi exponentielle E(, a),
o et a sont deux paramtres positifs (voir figure 3). Sa densit de probabilit est
alors :

e(xa) si x a
[11]
f (x) =
0
sinon
Les distributions exponentielles sont couramment utilises pour modliser les vnements alatoires qui risquent de se produire avec incertitude. Cest typiquement le
cas en prsence dalas ; cest--dire lorsquune valeur est associe un paramtre,
mais que celle-ci est susceptible dtre modifie par certains vnements inattendus (Sanlaville, 2005). Ce type dincertitude est constat dans les cas de panne, ou,
plus gnralement, ds lors quune machine ncessite une intervention humaine : rparation, entretien, recharge de composants ncessaires son bon fonctionnement, rinstallation dun objet mal plac, etc. La dure du traitement scoule alors jusqu la fin
de lintervention (ou jusqu la rparation de la machine endommage). Des temps de
traitement ont t modliss laide dune loi exponentielle dans (Makino, 1965; Talwar, 1967; Cunningham et al., 1973; Ku et al., 1986; Gourgand et al., 2005).
3.3.3. Loi normale
Il savre galement possible quun temps dexcution pij suive une loi normale N (, ), o est lEsprance et 2 > 0 la Variance de pij (voir figure 3).
Dans ce cas, sa densit de probabilit est donne par :
 1  x 2 
1
[12]
f (x) = exp
2

Ce genre de cas est particulirement frquent en prsence de facteurs humains. En effet, il semble peu probable quun ouvrier accomplisse une certaine tche en un temps
parfaitement identique chaque excution. Ce dernier la ralisera plus ou moins rapidement selon divers critres tels que son degr dattention, sa forme physique, etc.
Par ailleurs, il se peut quun traitement dpende de facteurs inconnus, incontrlables
ou dcrits de manire imprcise ou ambigue par lanalyste. Prenons lexemple dune
usine chimique (Fortemps, 1997). Un traitement est, dans ce cas, une raction chimique entre plusieurs composants. Or la dure dune raction chimique nest pas fixe,
elle peut varier selon la temprature, la pression, la qualit des composants, et dautres
paramtres dont certains peuvent tre compltement inconnus. Il est donc impossible
de vouloir contrler toutes ces dpendances. Les temps dexcution observs varient
alors selon une loi normale. Cette modlisation a, par exemple, t utilise dans (Wang
et al., 2005; Gourgand et al., 2005).

192

RSTI - RIA 22/2008. Mtaheuristiques

3.3.4. Loi log-normale


Une variable alatoire x suit une loi log-normale de paramtres (, ) si log x suit
la loi N (, ) (voir figure 3). Sa densit de probabilit est alors :
(
1
1

exp( 12 ( log x )2 ) si x > 0


x 2 x
f (x) =
[13]
0
sinon
La distribution log-normale est couramment utilise pour modliser linfluence de variables environnementales incontrlables. Dans notre cas, un temps dexcution modlis laide dune loi log-normale prendra en compte la totalit des incertitudes
observes simultanment (panne, prsence de facteurs humains, paramtres inconnus
ou incontrlables). Par exemple, cette modlisation a t utilise dans (Maddox et
al., 1996; Dauzre-Prs et al., 2005).

p(x)

p(x)

1
___
ba

ba

x
a

a. Distribution uniforme

b. Distribution exponentielle
p(x)

p(x)

ba

ba

c. Distribution normale

d. Distribution log-normale

Figure 3. Exemples de fonctions de densit de probabilit susceptibles de modliser


une dure dexcution alatoire : (a) loi uniforme, (b) loi exponentielle, (c) loi normale
(d) loi log-normale

Flow-shop bi-objectif stochastique

193

4. Algorithmes volutionnaires bass sur un indicateur de qualit pour les


problmes doptimisation multi-objectif stochastiques
Dans cette section, nous prsentons diverses extensions de loptimisation volutionnaire multi-objectif base sur un indicateur de qualit, initialement propose
dans (Zitzler et al., 2004) et prsente en section 2.2, pour la prise en compte de lincertitude. Ainsi, trois algorithmes volutionnaires ddis la rsolution de problmes
doptmisation multi-objectif stochastiques sont proposs. Bien sr, ces mthodes sont
gnriques et peuvent donc tre facilement applicables tout type de problmes doptimisation, et pas uniquement au problme de flow-shop tudi dans cet article.

4.1. Prise en compte de lincertitude


Dans le cas dterministe, chaque solution x appartenant lensemble des solutions ralisables de lespace de dcision X est assign exactement un vecteur objectif z
appartenant lensemble des points ralisables de lespace objectif Z sur la base du
vecteur de fonctions objectif f . Ainsi, f (x) dfinie lvaluation relle dune solution
x X. Au contraire, dans le cas stochastique, chaque fois quune solution x X
est value, le vecteur objectif rsultant est diffrent. Donc, le vecteur de fonctions f
ne calcule pas une image dterministe de X vers Z, car un ensemble potentiellement
infini de vecteurs objectif est maintenant associ une solution x X. Plus grand
est le degr dincertitude, plus large sera la variance parmi les vecteurs objectif obtenus par de multiples valuations dune solution. Cest pourquoi, comme propos
dans (Basseur et al., 2006), chaque solution x X, nous associons une variable
alatoire F prenant ses valeurs dans Z. F (x) donne une valuation de la solution
x X dans lespace objectif. Dans cet article, contrairement dautres approches (Jin
et al., 2005), nous ne considrons pas quil existe une valuation relle perturbe par
le bruit associe une solution, mais un ensemble dvaluations probables. Nous
considrons que lvaluation relle dune solution est absolument indtermine avant
la fin du processus doptimisation. Nous ne faisons aucune hypothse sur une quelconque distribution de probabilit associe aux paramtres ou aux fonctions objectif,
car lespace dvaluation potentiel dune solution est gnralement inconnu et peut
varier pour chaque solution. De ce fait, nous tentons destimer lespace dvaluation
potentiel dune solution laide dun ensemble fini dchantillons de ses valuations.
Pour cela, nous dfinissons S(x) = {z (1) , z (2) , . . . , z (s) } comme un ensemble fini
dvaluations indpendantes pour une solution x X, cest dire un ensemble de
vecteurs objectif associs x. Ainsi, la probabilit quune solution x X soit reprsente par un vecteur objectif z Z peut tre estime par la frquence relative de z
dans S(x) :
P (F (x) = z) =

z S(x),z =z

1
|S(x)|

[14]

194

RSTI - RIA 22/2008. Mtaheuristiques

4.2. Algorithmes proposs


Nous prsentons ici trois algorithmes volutionnaires ddis la rsolution de
problmes doptimisation multi-objectif stochastiques, bass sur trois indicateurs de
qualit pouvant tre utiliss au sein dIBEA (Zitzler et al., 2004) spcifiquement labors pour le cas stochastique. Afin de comparer deux vecteurs objectif, nous utiliserons lindicateur -additif (Zitzler et al., 2003; Zitzler et al., 2004), introduit dans
lquation 5. Cet indicateur se montre particulirement efficace sur diffrents types
de problmes dterministes (Zitzler et al., 2004), et a obtenu de meilleurs rsultats
que lindicateur binaire hypervolume propos dans (Zitzler et al., 2004) sur la version
dterministe du problme abord ici (Liefooghe, 2006).
4.2.1. Estimation base sur une simple valuation
Le premier indicateur stochastique propos, I 1 , consiste conserver lapproche
utilise dans le cas dterministe. Une solution est value une seule fois et la qualit
de cette solution est estime en utilisant cette seule valuation (voir la figure 4). Ainsi,
|S(x)| = 1 pour chaque solution x X. La qualit dune solution x X par rapport
une autre solution x X est mesure ainsi :
I 1 (x, x ) = I(z (1) , z (1) ) tel que

S(x) = {z (1) }, S(x ) = {z (1) }

[15]

1
-valeur de x X
Ainsi, P (F (x) = z) = 1 et P (F (x ) = z ) = 1. Par exemple, la I+

par rapport x X se calcule :


1
I+
(x, x ) = I+ (z (1) , z (1) ) tel que

x2

f2

espace
potentiel
dvaluation
valuation
relle
une
valuation

solution
ralisable

Espace dcisionnel

S(x) = {z (1) }, S(x ) = {z (1) } [16]

x1

Espace objectif

f1

Figure 4. I 1 : une seule valuation est utilise pour approximer lvaluation dune
solution

Flow-shop bi-objectif stochastique

195

Comme propos dans (Zitzler et al., 2004), la I 1 -valeur dune solution x X par
rapport au reste de la population P (et donc la valeur de fitness de x, voir lquation 4)
est dtermine ainsi :
X
1

I 1 (x, P \ {x}) =
eI (x ,x)/
[17]
x P \{x}

o > 0 est un facteur de redimensionnement. lheure actuelle, la plupart des mthodes procdent de cette faon, car elles considrent que les paramtres sont constants
et ne tiennent pas compte de lincertitude. Lavantage de cette mthode est son faible
cot de calcul, mais lerreur destimation peut tre grande, la seule valuation utilise
ntant pas ncessairement reprsentative de lespace potentiel des valuations dune
solution.
4.2.2. Estimation base sur le vecteur objectif moyen
La seconde approche, I avg , se base sur une ide communment suivie dans le cas
mono-objectif et suggre par quelques tudes de problmes multi-objectifs stochastiques (comme, par exemple, dans (Babbar et al., 2003; Deb et al., 2005)). Comme
illustr sur la figure 5, elle consiste calculer un vecteur objectif moyen z avg partir
des valuations S(x) dune solution x X :

z avg =

z1avg
z2avg
..
.
znavg

tel que

ziavg =

X
1
zi , i 1, 2, . . . , n [18]
|S(x)|
zS(x)

Ensuite, une approche dterministe classique est applique sur le vecteur objectif
moyen associ chaque solution x X telle que dans lquation suivante, o z avg
x2

f2

valuation
moyenne

solution
ralisable

Espace dcisionnel

espace
potentiel
dvaluation

x1

valuation
relle
une
valuation

Espace objectif

f1

Figure 5. I avg : la moyenne des valeurs des valuations est utilis pour approximer
la qualit dune solution

196

RSTI - RIA 22/2008. Mtaheuristiques

est le vecteur objectif moyen associ x, et z avg est le vecteur objectif moyen associ
x .
I avg (x, x ) = I(z avg , z avg )

[19]

Ainsi, de mme que prcdemment, la I avg -valeur dune solution x X par rapport
au reste de la population P peut se formuler ainsi :
X
avg

I avg (x, P \ {x}) =


eI (x ,x)/
[20]
x P \{x}

Cette mthode possde galement lavantage davoir un faible cot de calcul si lvaluation dune solution dans lespace objectif nest pas trop coteuse (ce qui est le cas
pour notre problme). Pourtant, des pertes dinformation peuvent survenir en utilisant
cette estimation moyenne, telles que la distribution potentielle des points dans lespace
objectif.
4.2.3. Estimation probabiliste
Le troisime et dernier indicateur stochastique consiste estimer la qualit dune
solution de faon probabiliste. Ici, nous considrons quune probabilit de distribution
arbitraire est associe chaque solution dans lespace objectif (voir la figure 6). Cette
c
approche, dnote I eiv , rside principalement en une modification de la procdure
daffectation des performances telle que propose dans (Basseur et al., 2006) pour le
cas spcifique de lindicateur -additif.
x2

f2
p = 0.25

espace
potentiel
dvaluation

p = 0.25

solution
ralisable
p = 0.25

valuation
relle
une
valuation

p = 0.25

Espace dcisionnel

x1

Espace objectif

f1

Figure 6. I eiv : la qualit dune solution est estime de faon probabiliste, un indicateur de qualit tant associ pour chaque valuation
Tout dabord, pour chaque valuation dune solution, nous allons calculer une estimation de lesprance de sa I+ -valeur par rapport la population P . Soit une valuation z telle que z S(x ) et x P . Nous allons considrer toutes les paires (x, z)
telles que x P \ {x } et z S(x), et les trier dans lordre croissant selon les
valeurs I+ (z , z). Supposons que lordre obtenu soit (x1 , z 1 ), (x2 , z 2 ), . . . , (xl , z l ).

Flow-shop bi-objectif stochastique

197

Alors, lestimation de lesprance mathmatique de la I+ -valeur de lvaluation z


par rapport la population P est dfinie ainsi :
+ (z , F (P )))
E(I

I+ (z , z1 ) . P (F (x1 ) = z1 )

I+ (z , z2 ) . P (F (x2 ) = z2 | F (x1 ) 6= z1 )

...

I+ (z , zl ) . P (F (xl ) = zl | 1i<l F (xi ) 6= zi )

[21]

Notez quil nest pas ncessaire de calculer les l sommes et que le temps de calcul
c
peut donc tre rduit. Ensuite, la I eiv -valeur dune solution x X par rapport la
population P est calcule comme suit :
c

I eiv (x, P \ {x}) =

X
1

E(I(z,
F (P \ {x}))
|S(x)|

[22]

zS(x)

eiv
La complexit en temps du calcul de la I+
-valeur dune solution est de lordre de
2
O(n(|P |.s) log(|P |.s)), o |P | est la taille de la population, n est le nombre dobjectifs et s est le nombre dvaluations par solution.

4.3. Implmentation
Pour dvelopper les algorithmes dcoulant des indicateurs stochastiques prsents
c
dans la section prcdente (que nous allons dnoter IBEA1 , IBEAavg et IBEAeiv ),
nous avons utilis une plate-forme ddie la conception de mtaheuristiques pour
loptimisation multi-objectif : ParadisEO-MOEO1 (Liefooghe et al., 2007). Tout
dabord, il a t ncessaire dtendre cette plate-forme en dfinissant une notion de
vecteur objectif pour les problmes stochastiques. Ensuite, nous avons dvelopp les
mthodes proposes en suivant le mme schma que pour les mthodes dterministes
dj implmentes. Tous ces nouveaux concepts seront bientt disponibles au sein de
la plate-forme ParadisEO-MOEO. Les trois approches diffrent les unes des autres de
par lindicateur de qualit utilis. Les points communs des trois algorithmes sont :
reprsentation : permutation de taille N (o N est le nombre de jobs) ;
initialisation de la population : individus gnrs alatoirement ;
slection pour la reproduction : tournoi binaire dterministe ;
oprateur de croisement : deux points (Ishibuchi et al., 1998) (voir Figure 7) ;
oprateur de Mutation : insertion (Ishibuchi et al., 1998) (voir Figure 8) ;
slection pour le remplacement : litiste (aprs avoir supprimer les doublons) ;
critre darrt : nombre de gnrations.
1. ParadisEO est disponible sur le web

198

RSTI - RIA 22/2008. Mtaheuristiques


Point 1

Point 2

Figure 7. Oprateur de croisement

Figure 8. Oprateur de mutation

5. Rsultats
5.1. Jeux de donnes
Pour tester nos algorithmes, nous proposons diffrents jeux de donnes2 construits
partir des instances proposes par Taillard pour le flow-shop mono-objectif (Taillard,
1993).
5.1.1. Jeux de donnes dterministes bi-objectif
Tout dabord, nous avons tendu les instances de Taillard (Taillard, 1993) pour le
cas multi-objectif dterministe en ajoutant une date due chacun des jobs. Ces dates
dues ont t gnres de faon alatoire entre p M et p (N + M 1), o M
reprsente le nombre de machines, N le nombre de jobs et p la moyenne des temps
dexcution pralablement gnrs pour linstance considre. Ainsi, une date due
sera comprise entre la date de fin moyenne du premier job ordonnanc et la date de
fin moyenne du dernier job ordonnanc. Des jeux de donnes sont proposs pour des
problmes de N = 20, 30, 50, 70, 100, 150, 200, 300 et 500 jobs et M = 5, 10, 15 et
20 machines, avec 10 instances diffrentes par taille (N M ). Une instance nomme
N _M _i reprsente la ime instance compose de N jobs et M machines.
5.1.2. Jeux de donnes stochastiques
Afin de gnrer de lincertitude sur une instance dterministe initiale, les quatre
distributions de probabilit proposes la section 3.3 peuvent tre appliques sur les
donnes initiales laide dun fichier de configuration. Nous avons choisi de permettre
la configuration de cette incertitude sur les machines uniquement, en spcifiant, pour
chacune delles, une distribution de probabilit et ses paramtres ou des proportions
lies sa tendance centrale. Ainsi, chaque fois que de lincertitude sera gnre
sur une instance dterministe, les dures dexcution obtenues seront diffrentes ; ceci
afin de reflter au mieux la ralit du monde industriel.
2. Les jeux de donnes pour le cas dterministe et le cas stochastique sont disponibles sur le
web

Flow-shop bi-objectif stochastique

199

5.2. Tests raliss


Afin de raliser nos exprimentations, nous avons gnr de lincertitude sur les
temps dexcution des jeux de donnes bi-objectif dterministes. Pour cela, nous avons
utilis les modles stochastiques dfinis prcdemment. Ainsi, pour une instance donne, nous avons cr 10 valuations indpendantes dont les temps dexcution pij
suivent des distributions uniforme, normale, exponentielle ou log-normale de la faon
suivante :
loi uniforme : pij U(a = 0.85 pij , b = 1.15 pij ) ;
loi normale : pij N ( = pij , = 0.15 pij ) ;
1
);
loi exponentielle : pij E(a = pij , = 0.15p
ij

loi log-normale : pij log-N ( = log pij , = 0.15 log pij ) ;

lois variables : la loi associe aux dures dexcution diffre sur chacune des
machines.
La taille de la population N a t fixe 50 individus. Pour chaque type de distribution de probabilit, 10 excutions par instance et par algorithme ont t ralises,
avec 10 valuations diffrentes par solution (sauf pour IBEA1 o seule la premire
valuation est utilise). Les diffrentes mthodes testes utilisent la mme population initiale et le mme nombre de gnration (5 000 gnrations pour les instances
20 jobs et 5 machines, et 10 000 gnrations pour les instances 20 jobs et 10 machines). Les probabilits dapplication de loprateur de croisement et de loprateur
de mutation ont t fixes 0.05 et 1 respectivement. Le facteur de redimensionnement , ncessaire dans IBEA1 et IBEAavg , est fix 0, 05.

5.3. Evaluation de performance


notre connaissance, il nexiste pas de protocole pleinement adapt lvaluation
des performances de mthodes de recherche pour les problmes doptimisation multiobjectif stochastiques. Par consquent, nous choisissons de rvaluer lensemble final
de solutions de chacun des algorithmes sur le jeu de donnes de rfrence (celui qui a
servi llaboration des jeux de donnes stochastiques), et de considrer cette valuation comme tant lvaluation relle des solutions. Ensuite, nous ne conservons que les
points non domins sur lensemble de vecteurs objectif obtenus par chaque mthode
sur cette valuation. Ainsi, il nous est possible dutiliser des mtriques classiques,
employes dans le cas dterministe, pour mesurer la qualit des approximations des
fronts Pareto obtenus. Dans le cas multi-objectif, la comparaison de rsultats est plus
dlicate que dans le cas mono-objectif, le rsultat tant constitu dun ensemble de
points non domins, donc non comparables entre eux. Il savre donc tout aussi important de mesurer la qualit de ces points en termes de convergence quen termes de
diversit. Pour cela, nous utiliserons la mtrique Contribution, ddie lvaluation
de la convergence, ainsi que la mtrique Hypervolume, ddie la fois lvaluation
de la convergence et de la diversit.

200

RSTI - RIA 22/2008. Mtaheuristiques

Z
f2

PA

PB

f1

Figure 9. Illustration de la mtrique Hypervolume : calcul des aires de dominance


densembles de solutions Pareto par rapport un point de rfrence Z

La mtrique Contribution (Meunier et al., 2000) permet davoir une ide de lapport dun algorithme par rapport un autre. Elle se base sur la comparaison de
deux fronts Pareto approchs PA et PB (respectivement obtenus par deux algorithmes A et B). Soit PAB lensemble des points non domins de PA PB . La
valeur Contribution(A, B) (respectivement Contribution(B, A)) mesure la proportion de lensemble PAB reprsente par les points de PA (respectivement PB ).
Ainsi, si les deux algorithmes A et B produisent les mmes approximations Pareto,
Contribution(A, B) = Contribution(B, A) = 1/2. Si tous les vecteurs de A sont
domins par des vecteurs de B, Contribution(A, B) = 0. Et, de manire gnrale,
Contribution(A, B)+Contribution(B, A) = 1. La mtrique Hypervolume (Zitzler
et al., 1999) calcule lhypervolume de la rgion multidimensionnelle ferme par un
front Pareto approch PA et un point de rfrence Z (voir figure 9). Cet hypervolume reprsente la taille de lespace objectif domin par PA . Le point de rfrence
que nous utiliserons pour comparer les rsultats observs sur une instance donne sera
constitu des valeurs maximales obtenues lors de nos exprimentations pour chacun
des critres sur cette instance, multiplies par 1.1 (ce qui permet de tenir compte des
points extrmes sans leur donner trop dimportance).
Par ailleurs, afin de comparer de faon significative les algorithmes proposs,
nous avons choisi de raliser un test dhypothse de Wilcoxon (Wilcoxon, 1945) pour
chaque instance et chaque type de distribution de probabilit. Dans chacune des tables
de rsultats de la section suivante, la colonne T indique le rsultat du test statistique
pour une p-valeur infrieure 5%, i.e. :
selon la mtrique considre, les rsultats de lalgorithme situ la ligne spcifie sont significativement meilleurs que ceux de lalgorithme situ la colonne
spcifie (+) ;

Flow-shop bi-objectif stochastique

201

selon la mtrique considre, les rsultats de lalgorithme situ la ligne spcifie sont significativement moins bons que ceux de lalgorithme situ la colonne
spcifie () ;
selon la mtrique considre, il ny a pas de diffrence significative entre les
rsultats de lalgorithme situ la ligne spcifie et ceux de lalgorithme situ la
colonne spcifie ().

5.4. Rsultats et discussion


Les rsultats obtenus par les algorithmes proposs pour des dures dexcution
suivant une loi uniforme, une loi exponentielle, une loi normale, une loi log-normale
ou des lois variables sont respectivement prsents dans les tableaux 1, 2, 3, 4 et 5. Le
nombre moyen de points non domins obtenus par les algorithmes suite la ravluation des solutions sur linstance de rfrence est donn dans le tableau 6.
De manire gnrale, selon le protocole dvaluation des performances que
nous avons utilis, IBEAavg est majoritairement plus performant et nest jamais
c
moins performant quIBEA1 et IBEAeiv sur lensemble des instances testes. Seul
1
IBEA se montre significativement plus efficace, daprs la mtrique Hypervolume,
sur la premire instance teste dont les dures de traitement suivent une loi lognormale (voir le tableau 4). tant donn quIBEAavg utilise des valeurs objectif
moyennes, la supriorit de cette mthode peut facilement se justifier pour des probabilits dont la tendance centrale est la moyenne, comme cest par exemple le cas
pour une distribution uniforme ou normale. Nanmoins, noublions pas que lincertitude est situe ici sur les paramtres et non sur les fonctions objectif. Ce qui peut
signifier que, pour lensemble des lois de probabilit considres sur les dures dexcution, lincertitude engendre sur la valeur des objectifs pourrait se rduire une loi
de probabilit dont la tendance centrale est la moyenne.
Comme indiqu sur les tableaux 1 et 3, pour des temps de traitement normalec
ment et uniformment distribus, IBEA1 savre plus efficace quIBEAeiv selon la
mtrique Hypervolume. Cependant, selon la mtrique Contribution, il nexiste pas de
diffrence significative entre ces deux algorithmes, part pour une distribution unic
forme o IBEAeiv surpasse IBEA1 sur la dernire instance (voir le tableau 1). Pour
des dures exponentiellement distribues, il ny a pas de diffrence significative entre
ces deux mthodes (voir le tableau 2). Les seules exceptions sont la seconde instance
o IBEA1 est significativement plus performant selon la mtrique Hypervolume, et la
c
dernire instance o IBEAeiv est significativement plus performant selon la mtrique
Contribution. Enfin, comme prsent sur les tableaux 4 et 5, la mtrique Contribution
c
indique quil nexiste pas de diffrence significative entre IBEAeiv et IBEA1 pour
des temps de traitement distribus selon une loi log-normale ou de faon variable.
c
Au contraire, selon la mtrique Hypervolume, IBEAeiv se montre gnralement plus
1
efficace quIBEA pour la loi log-normale (except sur la premire instance), alors

202

RSTI - RIA 22/2008. Mtaheuristiques

quil est plus performant uniquement sur la dernire instance pour des dures distribues de faon variable.
c

La faible efficacit dIBEAeiv peut en partie sexpliquer par un manque de diversit des solutions obtenues dans lespace de dcision. Ainsi, lors de la rvaluation de
cet ensemble de solutions sur linstance de rfrence, le front obtenu savre gnralement peu diversifi en raison de la spcificit de notre problme (voir le tableau 6),
et ne peut donc pas rivaliser avec ceux des deux autres mthodes proposes en termes
de diversit. Dans (Basseur et al., 2006), ce problme du nombre de points non domins napparat pas, le protocole dvaluation des performances tant diffrent. Ainsi,
il pourrait se montrer intressant de mettre en place un mcanisme de diversification
c
au sein dIBEAeiv afin daugmenter la qualit des ensembles produits. Nanmoins,
les rsultas exprimentaux sont tous discutables, le protocole dvaluation des performances ntant quimparfaitement adapt aux problmes doptimisation multi-objectif
stochastiques.

20_05_01
20_05_02
20_10_01

IBEAavg
d
IBEAeiv
avg
IBEA
d
IBEAeiv
avg
IBEA
d
IBEAeiv

Contribution
IBEA1
IBEAavg
p-valeur T p-valeur T
>5%

>5%
0.009

0.013
+
>5%
0.006

0.002
+
0.005
+ 0.002

Hypervolume
IBEA1
IBEAavg
p-valeur T p-valeur T
0.002
+
0.002
0.001

0.002
+
0.005
0.001

0.001
+
0.001
0.001

Tableau 1. Comparaison des valeurs de mtriques Contribution et Hypervolume obc


tenues par IBEA1 , IBEAavg et IBEAeiv pour des dures dexcution suivant une
loi uniforme laide dun test statistique de Wilcoxon

20_05_01
20_05_02
20_10_01

IBEAavg
d
IBEAeiv
avg
IBEA
d
IBEAeiv
avg
IBEA
d
IBEAeiv

Contribution
IBEA1
IBEAavg
p-valeur T p-valeur T
>5%

>5%
>5%

>5%

>5%
>5%

0.045
+
0.036
+ >5%

Hypervolume
IBEA1
IBEAavg
p-valeur T p-valeur T
0.001
+
>5%
0.033

>5%

0.002
0.001

0.001
+
>5%
0.005

Tableau 2. Comparaison des valeurs de mtriques Contribution et Hypervolume obc


tenues par IBEA1 , IBEAavg et IBEAeiv pour des dures dexcution suivant une
loi exponentielle laide dun test statistique de Wilcoxon

Flow-shop bi-objectif stochastique

20_05_01
20_05_02
20_10_01

IBEAavg
d
IBEAeiv
avg
IBEA
d
IBEAeiv
avg
IBEA
d
IBEAeiv

Contribution
IBEA1
IBEAavg
p-valeur T p-valeur T
>5%

>5%
>5%

>5%

>5%
>5%

0.004
+
>5%
0.004
+

203

Hypervolume
IBEA1
IBEAavg
p-valeur T p-valeur T
0.002
+
0.021
0.001

0.001
+
0.002
0.001

0.002
+
0.001
0.001

Tableau 3. Comparaison des valeurs de mtriques Contribution et Hypervolume obc


tenues par IBEA1 , IBEAavg et IBEAeiv pour des dures dexcution suivant une
loi normale laide dun test statistique de Wilcoxon

20_05_01
20_05_02
20_10_01

IBEAavg
d
IBEAeiv
avg
IBEA
d
IBEAeiv
avg
IBEA
d
IBEAeiv

Contribution
IBEA1
IBEAavg
p-valeur T p-valeur T
>5%

>5%
>5%

>5%

>5%
>5%

>5%

>5%
>5%

Hypervolume
IBEA1
IBEAavg
p-valeur T p-valeur T
0.032

0.001
0.001

0.001
+
0.001
+ 0.001

0.001
+
0.001
+ 0.020

Tableau 4. Comparaison des valeurs de mtriques Contribution et Hypervolume obc


tenues par IBEA1 , IBEAavg et IBEAeiv pour des dures dexcution suivant une
loi log-normale laide dun test statistique de Wilcoxon

20_05_01
20_05_02
20_10_01

IBEAavg
d
IBEAeiv
avg
IBEA
d
IBEAeiv
avg
IBEA
d
IBEAeiv

Contribution
IBEA1
IBEAavg
p-valeur T p-valeur T
>5%

>5%
>5%

>5%

>5%
>5%

>5%

>5%
>5%

Hypervolume
IBEA1
IBEAavg
p-valeur T p-valeur T
0.001
+
0.019
0.001

0.014
+
>5%
0.010

0.001
+
0.003
+ >5%

Tableau 5. Comparaison des valeurs de mtriques Contribution et Hypervolume obc


tenues par IBEA1 , IBEAavg et IBEAeiv pour des dures dexcution distribus
de faon variable laide dun test statistique de Wilcoxon

204

RSTI - RIA 22/2008. Mtaheuristiques

20_05_01

20_05_02

20_10_02

loi uniforme
loi exponentielle
loi normale
loi log-normale
lois variables
loi uniforme
loi exponentielle
loi normale
loi log-normale
lois variables
loi uniforme
loi exponentielle
loi normale
loi log-normale
lois variables

IBEA1
3.7
1.1
5.8
1.9
2.0
3.7
2.8
2.4
1.0
2.7
10.4
4.5
6.8
3.5
6.2

IBEAavg
3.1
2.6
3.6
1.8
2.5
3.5
2.2
2.8
3.9
2.9
12.4
7.2
7.0
2.0
4.8

IBEAeiv
1.0
1.0
1.0
1.6
1.0
1.0
1.0
1.1
1.3
2.0
2.6
3.4
2.6
1.8
2.2

Tableau 6. Nombre moyen de points non domins obtenus par IBEA1 , IBEAavg et
c
IBEAeiv suite la ravluation des solutions sur linstance de rfrence
6. Conclusion et perspectives
Dans cet article, plusieurs mtaheuristiques ddies la rsolution de problmes
doptimisation multi-objectif stochastiques ont t prsentes. Dans un premier temps,
nous avons vu que les problmes concrets dordonnancement se devaient couramment
de traiter plusieurs critres simultanment et taient gnralement soumis un grand
nombre dincertitudes. Des modles non dterministes ont t proposs pour un problme dordonnancement bi-objectif de type flow-shop de permutation avec dures
dexcution alatoires. Par ailleurs, des jeux de donnes ont t construits pour le problme considr ; dans un premier temps pour le cas multi-objectif, ensuite tendus
au cas stochastique. Dun point de vue algorithmique, la contribution du travail rside en la proposition dindicateurs de qualit spcifiquement labors pour la prise
en compte de tout type dincertitude, et pouvant tre utiliss au sein de lalgorithme
volutionnaire bas sur un indicateur de qualit IBEA (Indicator-Based Evolutionary
Algorithm) propos par Zitzler et Knzli (Zitzler et al., 2004). Trois indicateurs stoc
chastiques (I 1 , I avg et I eiv ) ont t introduits, donnant lieu trois algorithmes voc
lutionnaires (respectivement IBEA1 , IBEAavg et IBEAeiv ). Notez que tous ces
algorithmes seront bientt intgrs au sein de la plateforme ParadisEO-MOEO. Ces
indicateurs utilisent tous lindicateur -additif pour comparer des vecteurs objectif
entre eux. I 1 prserve lapproche utilise dans le cas dterministe. Une solution est
value une seule fois et sa qualit est estime en utilisant cette simple valuation.
I avg consiste utiliser un vecteur objectif moyen pour estimer la qualit dune soc
lution. Enfin, I eiv estime la qualit dune solution de manire probabiliste telle que
propos dans (Basseur et al., 2006). Nous avons ensuite expriment nos algorithmes
sur le flow-shop de permutation. Nous avons vu quIBEAavg tait globalement plus

Flow-shop bi-objectif stochastique

205

efficace que les deux autres mthodes de rsolution sur les instances que nous avons
c
testes. Les rsultats obtenus par IBEAeiv sont un peu surprenants. Dun point de
vue thorique, cet algorithme semble en effet celui qui estime la qualit dune solution de la faon la plus reprsentative, ce qui napparat pas du tout exprimentalement.
Ceci semble tre expliqu par un manque de diversit des solutions de lensemble fic
nal obtenu par IBEAeiv . Nanmoins, nous avons vu que le protocole utilis pour
lvaluation des performances, bien que dune grande simplicit, tait insuffisant pour
analyser quitablement les rsultats obtenus dans le cas stochastique.
Diffrentes perspectives apparaissent suite ce travail. Tout dabord, dautres
sources dincertitude que les dures dexcution, telles que les dates dues, existent
pour le problme dordonnancement tudi ici ; il serait donc intressant de les
considrer galement. De plus, des approches diffrentes de lapproche stochastique
peuvent permettre de reprsenter lincertitude sur les dures dexcution. Ainsi, des
approches floues ont dj t utilises pour modliser ce type dincertitude pour des
problmes dordonnancement mono-objectif. Ensuite, beaucoup de problmes dordonnancement plus de deux objectifs existent et pourraient tre expriments. tudier le paysage des jeux de donnes que nous avons proposs pourrait galement
se montrer utile ; ceci afin dexpliquer plus prcisment le comportement des algorithmes et den tirer partie lors du processus doptimisation. Par ailleurs, dautres indicateurs de qualit utiliser au sein dIBEA peuvent tre imagins pour rsoudre des
problmes doptimisation multi-objectif stochastiques. Les comparer aux indicateurs
proposs dans cet article serait donc intressant. De mme, les concepts proposs ici
peuvent facilement tre applicables dautres types de mtaheuristiques, telle que la
recherche locale base sur indicateur de qualit propose dans (Basseur et al., 2007).
Ceci pourrait, par exemple, donner lieu une hybridation entre plusieurs mthodes
de rsolution, et pourrait considrablement amliorer les rsultats. Cependant, avant
toute autre chose, il semble indispensable de rflchir un protocole dvaluation pleinement adapt au cas multi-objectif stochastique, ceci afin de comparer les mthodes
de rsolution de manire plus impartiale.

7. Bibliographie
Babbar M., Lakshmikantha A., Goldberg D. E., A Modified NSGA-II to Solve Noisy Multiobjective Problems , Genetic and Evolutionary Computation Conference (GECCO 2003),
vol. 2723 of Lecture Notes in Computer Science, Springer-Verlag, Chicago, USA, p. 21-27,
2003.
Basseur M., Burke E. K., Indicator-Based Multi-Objective Local Search , IEEE Congress
on Evolutionary Computation (CEC 2007), Singapore, p. 3100-3107, 2007.
Basseur M., Zitzler E., Handling Uncertainty in Indicator-Based Multiobjective Optimization , International Journal of Computational Intelligence Research, vol. 2, n 3, p. 255272, 2006.
Billaut J.-C., Moukrim A., Sanlaville E. (eds), Flexibilit et robustesse en ordonnancement,
Herms Science, Paris, France, 2005.

206

RSTI - RIA 22/2008. Mtaheuristiques

Coello Coello C. A., Van Veldhuizen D. A., Lamont G. B., Evolutionary Algorithms for Solving
Multi-Objective Optimization Problems, Kluwer Academic Publishers, 2002.
Cunningham A. A., Dutta S. K., Scheduling jobs with exponentially distributed processing
times on two machines of a flow shop , Naval Research Logistics Quarterly, vol. 16, p. 6981, 1973.
Dauzre-Prs S., Castagliola P., Lahlou C., Niveau de service en ordonnancement stochastique , in J.-C. Billaut, A. Moukrim, E. Sanlaville (eds), Flexibilit et robustesse en ordonnancement, Herms Science, Paris, France, chapter 5, p. 97-113, 2005.
Deb K., Multi-Objective Optimization using Evolutionary Algorithms, Wiley, 2001.
Deb K., Gupta H., Searching for Robust Pareto-Optimal Solutions in Multi-Objective Optimization , in C. A. C. Coello, A. H. Aguirre, E. Zitzler (eds), Evolutionary Multi-Criterion
Optimization, third International Conference (EMO 2005), vol. 3410 of Lecture Notes in
Computer Science, Springer-Verlag, Guanajuato, Mexico, p. 150-164, 2005.
Fortemps P., Jobshop Scheduling with Imprecise Durations : A Fuzzy Approach , IEEE
Transactions On Fuzzy System, vol. 5, n 4, p. 557-569, 1997.
Goh C. K., Tan K. C., An Investigation on Noisy Environments in Evolutionary Multiobjective Optimization , IEEE Transactions on Evolutionary Computation, vol. 11, n 3, p. 354381, 2007.
Gourgand M., Grangeon N., Norre S., Modle du flow-shop de permutation stochastique , in
J.-C. Billaut, A. Moukrim, E. Sanlaville (eds), Flexibilit et robustesse en ordonnancement,
Herms Science, Paris, France, chapter 7, p. 135-161, 2005.
Graham R. L., Lawler E. L., Lenstra J. K., Rinnooy Kan A. H. G., Optimization and Approximation in Deterministic Sequencing and Scheduling : A Survey , Annals of Discrete
Mathematics, vol. 5, p. 287-326, 1979.
Hansen M. P., Jaszkiewicz A., Evaluating the quality of approximations of the non-dominated
set, Technical Report n IMM-REP-1998-7, Institute of Mathematical Modeling, Technical
University of Denmark, 1998.
Hughes E. J., Evolutionary Multi-Objective Ranking with Uncertainty and Noise , in E. Zitzler, K. Deb, L. Thiele, C. A. Coello Coello, D. Corne (eds), Evolutionary Multi-Criterion
Optimization, First International Conference (EMO 2001), vol. 1993 of Lecture Notes in
Computer Science, Springer-Verlag, London, UK, p. 329-343, 2001.
Ishibuchi H., Murata T., A Multi-Objective Genetic Local Search Algorithm and Its Application to Flowshop Scheduling , IEEE Transactions on Systems, Man and Cybernetics, vol.
28, p. 392-403, 1998.
Jin Y., Branke J., Evolutionary Optimization in Uncertain Environments - A Survey , IEEE
Transactions on Evolutionary Computation, vol. 9, n 3, p. 303-317, 2005.
Kouvelis P., Daniels R. L., Vairaktarakis G., Robust scheduling of a two-machine flow shop
with uncertain processing times , IIE Transactions, vol. 32, n 5, p. 421-432, 2000.
Ku P. S., Niu S. C., On Johnsons Two-Machine Flow Shop with Random Processing Times ,
Operations Research, vol. 34, p. 130-136, 1986.
Landa Silva J. D., Burke E., Petrovic S., An Introduction to Multiobjective Metaheuristics for
Scheduling and Timetabling , in X. Gandibleux, M. Sevaux, K. Srensen, V. Tkindt (eds),
Metaheuristics for Multiobjective Optimisation, vol. 535 of Lecture Notes in Economics
and Mathematical Systems, Springer-Verlag, p. 91-129, 2004.

Flow-shop bi-objectif stochastique

207

Liefooghe A., Optimisation multi-objectif sous incertitude : Application aux problmes dordonnancement de type flow-shop , Masters thesis, Universit des Sciences et Technologies
de Lille, France, 2006.
Liefooghe A., Basseur M., Jourdan L., Talbi E.-G., ParadisEO-MOEO : A framework for
Evolutionary Multi-objective Optimization , in S. Obayashi, C. Poloni, K. Deb (eds), Evolutionary Multi-Criterion Optimization, Fourth International Conference (EMO 2007), vol.
4403 of Lecture Notes in Computer Science, Springer-Verlag, Matsushima, Japan, p. 386400, 2007.
Maddox M. J., Birge J. R., Using second moment information in stochastic scheduling ,
Recent advances in control and optimization of manufacturing systems, vol. 214 of Lecture
Notes in Control and Information Sciences, Springer, London, UK, p. 99-120, 1996.
Makino T., On a scheduling problem , Journal of the Operations Research Society of Japan,
vol. 8, p. 32-44, 1965.
Meunier H., Talbi E.-G., Reininger P., A Multiobjective Genetic Algorithm for Radio Network Optimization , IEEE Congress on Evolutionary Computation (CEC 2000), San
Diego, USA, p. 317-324, 2000.
Nagar A., Haddock J., Heragu S., Multiple and bicriteria scheduling : A literature survey ,
European Journal of Operational Research, vol. 81, p. 88-104, 1995.
Roy B., propos de robustesse en recherche oprationnelle et aide la dcision , in J.C. Billaut, A. Moukrim, E. Sanlaville (eds), Flexibilit et robustesse en ordonnancement,
Herms Science, Paris, France, chapter 2, p. 35-50, 2005.
Sanlaville E., Ordonnancement sous conditions changeantes : Comment prendre en compte
les variations, alas, incertitudes sur les donnes ?, Habilitation diriger des recherches,
Universit Blaise Pascal Clermont Ferrand, 2005.
Taillard E. D., Benchmarks for Basic Scheduling Problems , European Journal of Operational Research, vol. 64, p. 278-285, 1993.
Talwar P. P., A note on sequencing problems with uncertain job times , Journal of the Operations Research Society of Japan, vol. 9, p. 93-97, 1967.
Teich J., Pareto-Front Exploration with Uncertain Objectives , in E. Zitzler, K. Deb,
L. Thiele, C. A. Coello Coello, D. Corne (eds), Evolutionary Multi-Criterion Optimization, First International Conference (EMO 2001), vol. 1993 of Lecture Notes in Computer
Science, Springer-Verlag, London, UK, p. 314-328, 2001.
Tkindt V., Billaut J.-C., Multicriteria Scheduling - Theory, Models and Algorithms, Springer,
2002.
Wang L., Zhang L., Zheng D.-Z., A class of hypothesis-test based genetic algorithm for flow
shop scheduling with stochastic processing time , The International Journal of Advanced
Manufacturing Technology, vol. 25, n 11-12, p. 1157-1163, 2005.
Wilcoxon F., Individual comparisons by ranking methods , Biometrics, vol. 1, p. 80-83,
1945.
Zitzler E., Knzli S., Indicator-Based Selection in Multiobjective Search , Proceedings of
the 8th International Conference on Parallel Problem Solving from Nature (PPSN VIII), vol.
3242 of Lecture Notes in Computer Science, Springer-Verlag, Birmingham, UK, p. 832-842,
2004.

208

RSTI - RIA 22/2008. Mtaheuristiques

Zitzler E., Thiele L., Multiobjective Evolutionary Algorithms : A Comparative Case Study
and the Strength Pareto Approach , IEEE Transactions on Evolutionary Computation, vol.
3, n 4, p. 257-271, 1999.
Zitzler E., Thiele L., Laumanns M., Foneseca C. M., Grunert da Fonseca V., Performance
Assessment of Multiobjective Optimizers : An Analysis and Review , IEEE Transactions
on Evolutionary Computation, vol. 7, n 2, p. 117-132, 2003.