de conance
8 octobre 2009
Outline Introduction Gnration de nombres pseudoalatoires Gnration de ralisations de variables alatoires Estimation de paramtres (moyenne, variance, corrlation) Intervalles de conance
Introduction Gnration de nombres pseudo-alatoires Gnration de ralisations de variables alatoires Estimation de paramtres (moyenne, variance, corrlation) Intervalles de conance
Outline Introduction Gnration de nombres pseudoalatoires Gnration de ralisations de variables alatoires Estimation de paramtres (moyenne, variance, corrlation) Intervalles de conance
Introduction
Avec la simulation nous essayons de reproduire le comportement dun systme. Ensuite nous essayons destimer certaines caractristiques (performance par exemple). Modlisation du systme comme un processus stochastique dynamique Gnration de direntes (plusieurs) ralisations du processus stochastique laide de gnrateurs de nombres alatoires. Mesures des rsultats obtenus Analyse statistique et conclusions
Chapitre prcdent : Analyse mathmatique Modliser le systme comme un processus stochastique (modes de transmission par exemple) Rsolution du modle laide doutils mathmatiques La phase de modlisation est prsente pour les deux approches. La prcision peut tre dirente pour les deux mthodes...
Combien faut-il runir de personnes pour que la probabilit que deux personnes aient leur anniversaire le mme jour soit dau moins 0.5 ? Les gens sont numrotes de 1 n. Si n = 1 alors il y a 365 possibilits de dates danniversaire, quiprobables (admis). Si n = 2 il y a 3652 possibilits de dates danniversaire. Observation : Lorsque n = 2, il y a 365 possibilits que les dates danniversaire tombent sur le mme jour. Donc il a y 3652 365 possibilits pour que les dates danniversaire ne tombent pas en mme temps, ou 365 (365 1) = 365 364.
En gnralisant : Probabilit que aucun anniversaire ne tombe en mme temps parmi n personnes : 365 364 363 . . . (365 n + 1) 365n Autrement dit la probabilit quau moins deux personnes aient leurs anniversaires en mme temps (pn ) est de pn = 1 365 364 363 . . . (365 n + 1) 365n
Exemple numrique :
n = 23, pn = 0.5073 n = 40, pn = 0.8912 n = 75, pn = 0.9997
Avantages-Inconvnients de la simulation
Outline Introduction Gnration de nombres pseudoalatoires Gnration de ralisations de variables alatoires Estimation de paramtres (moyenne, variance, corrlation) Intervalles de conance
Avantages
Hypothses moins restrictives Le modle et les paramtres peuvent tre changs rapidement. Utilisation possible de mesures relles dans les simulations. Certains rsultats ne peuvent tre obtenus que par simulation
Dsavantages
Prend beaucoup de temps de calcul La validation prend du temps Les rsultats peuvent tre diciles interprter, les relations entre variables dicile tablir. Les rsultats peuvent tre inexacts, surtout si le temps de simulation est trop court ou si lanalyse est trop courte. Les simulations peuvent tre complexes.
Avantages
Les rsultats sont obtenus rapidement. Les rsultats du modle sont exacts. Donnent de bonnes indications sur le comportement du modle Optimisation possible (souvent dicile) Analyse souvent rapide.
Dsavantages
Hypothses souvent trop restrictives (par exemple : stationarit). Les calculs-preuves sont souvent trs diciles, voire impossible.
Classication gnrale
Temps discret, tats discrets. Temps discret, tats continus. Temps continu, tats discrets. Temps continu, tats continus.
Classication temporelle
Temps continu : Le temps de lordinateur est toujours discret. On prend des intervalles aussi petits que possible pour observer tous les changements dtats. Temps discret : On observe le systme des temps dtermins : t, t + t, .... Simulations vnements discrets : Focalisation sur le systme chaque fois quil se passe quelque chose. On a une liste dvnements.
Programme gnraux
C/C++ : Fonctionnent pour tout type de simulations, trs exibles, sans fonctions spciques pour la simulation. Matlab, Octave, ... : Principal inconvnient : Lenteur.
Outline Introduction Gnration de nombres pseudoalatoires Gnration de ralisations de variables alatoires Estimation de paramtres (moyenne, variance, corrlation) Intervalles de conance
Les ralisations sont bases sur un gnrateur de nombres pseudo-alatoires. Premier pas :
Gnration de nombres pseudo-alatoires uniformment distribus dans lintervalle [0, 1].
14 / 39
Un gnrateur de nombres alatoires est un algorithme qui gnre des nombres pseudo-alatoires Gnrateur de nombres pseudo-alatoires ! ! ! Gnration de nombres entiers Zi dans lintervalle 0, 1, 2, 3, . . . , m 1. Remarques :
La squence gnre est priodique (avec pour but davoir la priode la plus grande possible !) Les nombres gnrs ne sont pas alatoires du tout ! mais compltement dterministes, do le nom pseudo. La squence gnre est dguise : On ne remarque pas quelle est dterministe ! Les nombres produits apparassent comme tant indpendants et uniformment distribus dans {0, 1, 2, 3, . . . , m 1}
Validation : Tests statistiques pour vrier lindpendance des nombres gnrs et luniformit de la distribution.
15 / 39 Stephan Robert, HEIG-Vd Modlisation stochastique, Simulation
Caractristiques souhaites :
Rapide Peu complexe Portable Longs cycles Les nombres doivent tre indpendants Les nombres doivent avoir une distribution dnie
Le gnrateur congruentiel multiplicatif utilise lalgorithme suivant pour gnrer des nombres dans {0, 1, 2, 3, . . . , m 1} :
Zn = aZn1 mod m
Paramtres :
Z0 < m : graine. a, m : entiers positifs. Doivent tre choisis avec soin ! m : Nombre premier. Priode : m 1. a : Racine primitive modulo m. Exemple (Cray Research) : m = 248 et a = 44485709377909.
Stephan Robert, HEIG-Vd Modlisation stochastique, Simulation
17 / 39
Calcul de 19 7 modulo 23 : Calcul en arithmtique normale, par exemple 19 7 = 133 Diviser 133 par 23 : 5 (5 23 = 115), reste : 133 115 = 18, donc 19 7 mod 23 = 18. Exemple : Z0 = 7, a = 19 et m = 23 Z1 = 19 7 mod 23 = 133 mod 23 = (5 23 + 18) mod 23 = 18, Z2 = 19 18 mod 23 = 342 mod 23 = (322 + 20) mod 23 = 20, etc...
Le gnrateur congruentiel linaire utilise lalgorithme suivant pour gnrer des nombres dans {0, 1, 2, 3, . . . , m 1} :
Zn = (aZn1 + c) mod m
Paramtres :
Z0 < m : graine. a, m, c : entiers positifs. Doivent tre choisis avec soin ! m et c sont premiers entre eux. Priode maximale : m 1. a 1 est divisible par tous les facteurs premiers de m et est un multiple de 4 si m est un multiple de 4.
Stephan Robert, HEIG-Vd Modlisation stochastique, Simulation
19 / 39
Remarque : Soit Zn le nombre gnr dans lintervalle {0, 1, 2, 3, . . . , m 1}, alors Zn /m est peu prs distribu uniformment dans lintervalle [0, 1] (selon les tests statistiques).
Outline Introduction Gnration de nombres pseudoalatoires Gnration de ralisations de variables alatoires Estimation de paramtres (moyenne, variance, corrlation) Intervalles de conance
= xi )
Fonction de rpartition pour la loi exponentielle : F (x) = 1 ex En dveloppant : 1 x = ln(1 F (x)) En remplaant 1 F (x) par U (gnr par le gnrateur de nombres alatoires, = 1 U ) :
1 x = ln(U )
Mthode de Box-Miller : Les deux variables alatoires ci-dessous sont iid et normalement distribues :
X1 = X2 =
avec U1 , U2 gnrs dans [0, 1]. Pour obtenir une distribution de Y N (, 2 ) il sut de savoir que Y = + X avec X N (0, 1).
Outline Introduction Gnration de nombres pseudoalatoires Gnration de ralisations de variables alatoires Estimation de paramtres (moyenne, variance, corrlation) Intervalles de conance
Estimation de paramtres
(Introduction)
Hypothse : Les variables alatoires Xi sont iid, desprance mathmatique et de variance 2 , alors Estimation de la moyenne n = n = X
1 n n
Xi =
i=1
n1 n
n1 + X
Xn n1
)2 = (Xi X
)2 (Xn X n2
i=1
V ar(Xn1 ) +
Outline Introduction Gnration de nombres pseudoalatoires Gnration de ralisations de variables alatoires Estimation de paramtres (moyenne, variance, corrlation) Intervalles de conance
Intervalles de conance
(Rappels)
Observation : lestimation nest jamais exacte. On construit donc un intervalle de conance dans lequel lestimation doit se trouver avec une probabilit donne (typiquement 0.9, 0.95, 0.99). Principe : Considrons un estimateur (variable alatoire !) T du paramtre qui a une certaine densit de distribution fT (). Alors nous pouvons construire un intervalle de conance : On xe un risque derreur , ou seuil de conance 1 de telle sorte ce que P (|T | c) = 1
Faisons lhypothse que les variables alatoires Xi , i = 1, . . . , n sont iid avec une esprance mathmatique inconnue, et une variance connue, 2 . Nous savons par le thorme central limite, pour n grand, que n X N (0, 1) / n
P (
c X c n ) = 1 / n / n / n
F (x) =
1 2 eu /2 du 2
=1
c / n
=1
33 / 39
et donc
et donc
P (|T | z1 . ) = 1 2 n
Proposition : Lintervalle de conance pour lestimation de la moyenne avec un niveau de conance de (1 ) est donn par
z1 . X n 2
34 / 39 Stephan Robert, HEIG-Vd Modlisation stochastique, Simulation
Souvent nous ne connaissons ni lesprance mathmatique, ni la variance, qui peut cependant tre estime avec lestimateur de la variance, alors n X Student(n-1) Sn / n o (Student(n-1)) est une loi de Student (n-1) degrs de libert (tend vers la loi normale que n devient grand !).
Avec un raisonnement identique au prcdent, nous pouvons construire un intervalle de conance pour estimer : Proposition : Lintervalle de conance pour lestimation de la moyenne avec un niveau de conance de (1 ) est donn par
tn1,1 . X n 2
o les valeurs de tn1,1 sont donnes par la loi de Student. 2 Remarque : Pour n 30 , tn1,1 sera remplac par z1/2 . 2
38 / 39
99.9% 318.3 22.33 10.21 7.173 5.893 5.208 4.785 4.501 4.297 4.144 4.025 3.930 3.852 3.787 3.733 3.686 3.646 3.610 3.579 3.552 3.527 3.505 3.485 3.467 3.450 3.435 3.421 3.408 3.396 3.385 3.307
Observations
Outline Introduction Gnration de nombres pseudoalatoires Gnration de ralisations de variables alatoires Estimation de paramtres (moyenne, variance, corrlation) Intervalles de conance
Etant donn une prcision voulue pour les rsultats, il est possible de dterminer le nombre de simulations quil faut eectuer. Suite au prochain pisode :-).... Well be back !