Evnements alatoires
Il sagit dvnements dont on ne peut prdire
Evnements lmentaires e1 , e2 , e3 , . . .:
1. incompatibles, cest--dire quils ne peuvent se raliser simultanment. 2. la runion E = {e1 , e2 , . . .} de tous les vnements lmentaires recouvre tous les cas possibles. lensemble des rsultats lmentaires conduisant sa ralisation, i.e. E = {ei1 , . . . , eik }.
laquelle nous imposons de satisfaire (i) lvnement impossible A et lvnement certain E A (ii) si E1 , E2 , . . . A alors i1 Ei A (iii) si E A alors E A.
cohrence du raisonnement, autorisant parler dvnements qui se produisent lorsque plusieurs se produisent simultanment (intersection) ou lorsquau moins lun dentre eux se produit (union).
A chaque vnement E , on associe un nombre Pr[E ] retant le degr de vraisemblance accord a priori la ralisation de E . Considrons Pr[E ] comme la prime pure payer pour recevoir un versement de 1 euro si E se ralise ( 0 Pr[E ] 1). Hypothses: absence dopportunit darbitrage
(i.e. pas de prot sans risque), march parfait (pas de taxe, dimpts, information parfaite, . . . ) et pas dactualisation.
On peut montrer grce lhypothse dabsence dopportunit darbitrage que les proprits suivantes (classiques dans la thorie des probabilits) sont satisfaites par les primes:
E F = Pr[E F ] = Pr[E ] + Pr[F ]. E F Pr[E ] Pr[F ]. Pr[E ] + Pr[E ] = 1
Ei Ej = Pr[E1 E2 . . .] =
k 1 Pr[Ek ].
Probabilit conditionnelle
Ayant notre disposition de linformation,
matrialise par la connaissance quun vnement F sest produit, comment rvaluer en consquence la probabilit quun vnement E se ralise?
Cette rvaluation est appele probabilit conditionnelle de E sachant F , note Pr[E |F ]. Comme F sest ralis, il est naturel davoir Pr[F ] > 0. Sous cette condition,
Evnements indpendants
Les vnements E et F sont indpendants lorsque Pr[E |F ] = Pr[E ] Pr[F |E ] = Pr[F ] Pr[E F ] = Pr[E ] Pr[F ]. De manire gnrale, ayant des vnments E1 , E2 , . . . , En , ceux-ci seront dits indpendants
lorsque
Pr [iI Ei ] = Pr[Ei ]
iI
Soit un systme exhaustif dvnements {F1 , F2 , . . .}, i.e. Fi Fj = si i = j et Pr[i1 Fi ] = 1 avec Pr[Fi ] > 0 pour tout i. Thorme des probabilits totales: Pr[E ] =
i 1
Exemple
Notons E lvnement lassur cause au moins un sinistre sur lanne" et F lvnement lassur est une femme". Si 10% des femmes et 15% des hommes causent au moins un sinistre sur lanne, quelle est la proportion de polices causant au moins un sinistre sur lanne dans un portefeuille comportant 2/3 dhommes et 1/3 de femmes? Cette proportion vaut Pr[E ] = = Pr[E |F ] Pr[F ] + Pr[E |F ] Pr[F ] 1 2 0.1 + 0.15 = 0.133. 3 3
Variables alatoires
Une variable alatoire X X : E R; e x = X (e)
Fonction de rpartition
dnie par
limx0+ FX (x + x) = FX (x) pour tout x); - satisfait limx FX (x) = 0 et limx+ FX (x) = 1.
Fx 1
Fx(x2)=Fx(x3)
Fx(x1)
x1
x2
x3
x4
Considrons une assurance couvrant le vol ou la perte des bagages lors dun dplacement dtermin. Ce type de produit est souvent propos par les agences de voyage leurs clients. An dviter dinterminables querelles lors de la xation du prjudice subi par le voyageur, lassureur verse un forfait de 250 euro si les bagages viennent tre perdues ou voles au cours du voyage (ceci permet galement de limiter le risque de fraude). Dterminez - les vnements lmentaires - lensemble des vnements - la variable alatoire dcrivant la charge de sinistre par police - la fonction de rpartition de celle-ci.
par exemple le nombre de sinistres survenus au cours dune priode; leur support est donc (contenu dans) N = {0, 1, 2, . . .}. schma de Bernoulli ou un treillis binomial:
Il sagit de rpter un certain nombre de fois une exprience alatoire et dobserver chaque reprise la ralisation ventuelle dun vnement spci. Cette exprience doit tre reproduite sous des conditions identiques et les rsultats antrieurs ne peuvent inuencer la ralisation ultrieure ventuelle de lvnement dintrt.
Variables de Bernoulli
Une variable alatoire N est dite de Bernoulli de paramtre 0 < q < 1, not N Ber(q ), lorsque Pr[N = 1] = q = 1 Pr[N = 0]. En sciences actuarielles, on associe
Variable binomiale
Une variable alatoire N est dite Binomiale dexposant m et de paramtre q , m N et 0 < q < 1, note N Bin(m, q ), lorsque N prend ses valeurs dans {0, 1, . . . , m} et Pr[N = k ] = m k q k (1 q )mk , k = 0, 1, . . . , m,
o
m k m! . = k !(m k )!
q, si k = 1, 1 q, si k = 0,
do Bin(1, q ) = Ber(q ).
nombre de succs dans un schma de Bernoulli: si une exprience alatoire est rpte m fois indpendamment et sous des conditions identiques, le nombre de rptitions au cours desquelles un certain vnement E se ralise est de loi Bin(m, Pr[E ]).
nombre de sinistres touchant le portefeuille dans les formes dassurance pour lesquelles au plus un sinistre par priode est possible pour chaque police (comme lassurance sur la vie, lassurance annulation ou lassurance rapatriement conclue pour un voyage spci, par exemple).
Si q est la probabilit quune des m polices du portefeuille donne lieu un sinistre, et si ces m
polices sont identiques et ne sinuencent pas mutuellement, le nombre N de polices sinistres est de loi Bin(m, q ).
Variable gomtrique
La variable de comptage N est dite gomtrique de paramtre q , 0 < q < 1, note N G eo(q ) lorsque Pr[N = k ] = q (1 q )k , k N. Si on considre un schma binomial et quon parle de succs lorsquun vnement E se ralise lors
dune des rptitions de lexprience alatoire (et dchec dans le cas contraire), la loi G eo(q ) peut se voir comme celle du nombre dchecs prcdant le premier succs: lorsque N = k il aura donc fallu k + 1 rptitions de lexprience pour obtenir un premier succs.
Une variable alatoire N est dite de loi binomiale ngative de paramtres et q , > 0 et 0 < q < 1, note N N Bin(, q ), lorsque N prend ses valeurs dans N et Pr[N = k ] = +k1 k q (1 q )k , k N.
Nanmoins, cette dnition doit tre tendue au cas o nest pas entier.
xt1 exp(x)dx, t R+ .
Une simple intgration par parties montre que (t) = (t 1)(t 1) pour tout t > 1. Il sagit donc dune interpolation de la fonction factorielle, puisque (n + 1) = n! pour n N. +k1 k
( + k ) ( + k ) = = . (k + 1)() k !()
Supposons quon sintresse la ralisation ventuelle dun vnement E et quon qualie de succs une telle ralisation (avec q = Pr[E ]). Lorsque est entier, la variable N B in(, q ) est
Variable de Poisson
La loi de Poisson fut obtenue comme limite de la
cette loi de probabilit, on relvera ltude de Bortkiewicz en 1898, qui utilisa la loi de Poisson pour modliser le nombre annuel de soldats tus par des ruades de chevaux dans larme prussienne. Poisson fut ds lorigine associe des comptages daccidents ou de pannes.
La loi de Poisson fut introduite comme une approximation de la loi binomiale lorsque m tait trs grand et q trs petit.
En effet, si Nm B in(m, m ),
1 m
mk k +1 m 1 m
exp(), si m +
, si m + k+1
Plus prcisment, N est de loi de Poisson, ce qui se note N P oi(), si k Pr[N = k ] = exp() , k N. k! La loi de Poisson peut donc se voir comme celle
du nombre de succs dans un schma de Bernoulli, lorsque le nombre de rptitions est trs grand (m +) et la probabilit de succs ngligeable (q 0) de manire que mq > 0.
Lois de comptage
Probabilits
k m m! o = k!(m k)! k
q k (1 q )1k m q k (1 q )mk
1 m+1
G eo(q ) N Bin(, q )
N N
o
q (1 q )k +k1 k
+k1 k
q (1 q )k
(+k) (k+1)()
k
(+k) k!()
P oi()
exp() k!
fX (y )dy, x R,
Aussi, la probabilit que X prenne une valeur dans lintervalle (a, b], est alors
b
fX (x)dx.
x=a
densit donne donc les probabilits associes diffrents intervalles de la droite relle.
statistique pour modliser le fruit du pur hasard, ou des phnomnes au sujet desquels aucune information ntait disponible (Bayes en 1763 et Laplace en 1872).
Une variable alatoire X est dite de loi uniforme sur lintervalle [0, 1] not X U ni(0, 1), lorsque X
Soit U U ni[0, 1] et soit X une variable alatoire 1 (U ) a mme quelconque; la variable alatoire FX loi que X .
Plus gnralement, on parlera de loi uniforme sur lintervalle [a, b] pour dsigner celle dont la densit
si a x b, 0, sinon.
1 ba ,
Variable Bta
Une variable alatoire X est dite de loi Bta de paramtres > 0 et > 0, not X Bet(, ), lorsque X admet la densit fX ( z ) =
(+ ) 1 1 , x (1 x ) ()( )
0, sinon.
si 0 x 1,
modliser des pourcentages (par exemple le cot dun sinistre par rapport au montant total assur). prendre des allures trs diffrentes en fonction des valeurs des paramtres.
Variable Bta
On peut aisment construire partir de X une variable alatoire Z qui prend ses valeurs dans lintervalle [a, b] grce la formule Z = a + (b a)X . Il est facile de vrier que la densit de Z est
donne par
f Z ( x) =
(+ ) ()( )(ba)+ 1 (z
0, sinon.
si a z b,
a)1 (b z ) 1 ,
Variable normale
Une variable alatoire X est dite de loi Normale de paramtres R et > 0, not X N or(, 2 ), lorsque X prend ses valeurs dans R et admet la
fonction de rpartition
x Pr[X x] = x ,
exp(y 2 /2)dy, x R.
et vaut
d 1 x2 (x) = (x) = exp( ). dx 2 2 La gure suivante montre le graphe des densits de probabilit associes aux lois N or(10, 1), N or(10, 2) et N or(10, 3).
Variable log-normale
transformation exponentielle sur une variable gaussienne, an de dnir une variables positive, ce qui mne la loi log-normale.
Plus prcisment, si Y N or(, 2 ) et que nous dnissons X = exp Y , il vient pour x > 0, Pr[X x] = Pr[exp Y x] = Pr[Y ln x] ln x = .
Une variable alatoire X est dite de loi Log-Normale de paramtres R et 2 > 0, not X LN or(, 2 ), lorsque X prend ses valeurs dans R+ et admet la fonction de rpartition FX (x) =
ln(x)
, si x > 0,
0, sinon.
la t apparatre comme la loi limite dun produit de variables alatoires positives. Elle fut par la suite largement utilise, en conomie et en nance.
La densit de probabilit de X est donne par 2 1 1 ln(x) exp 2 , si x > 0, x 2 f X ( x) = 0, sinon. La fonction quantile vaut
1 FX (p) = exp + 1 (p) .
La gure suivante montre la densit de probabilit associe la loi LN or(, 2 ) pour = 0 et = 0.5,
Une variable alatoire X est dite de loi exponentielle ngative, de paramtre > 0, not X E xp(), lorsque X admet la densit de
probabilit
f X ( x) =
FX (x) =
1 = ln(1 p).
des montants de sinistres relativement peu dangereux pour la compagnie, puisque F X (x) = exp(x) prsente une dcroissance exponentielle sur R+ .
La gure suivante montre la densit de probabilit associe la loi E xp() pour diffrentes valeurs de : la densit de probabilit est unimodale et le
mode est en 0.
Variable Gamma
La loi Gamma a t obtenue par Laplace ds
1836. Bienaym en mit en vidence un cas particuler (la loi khi-carre, ou du khi-deux) en 1838 en relation avec la loi multinomiale.
Une variable alatoire X est dite de loi Gamma de paramtres > 0 et > 0, not X G am(, ), lorsque X admet la densit f X ( x) =
x1 exp(x ) , ()
0, sinon.
si x 0,
xt1 exp(x)dx, , t R+ .
dans ce cas,
x1 exp(x) f X ( x) = , x R+ . () Si X est de loi gamma de paramtres et , alors X est de loi gamma standard de paramtre . Un cas particulier intressant de la loi Gamma est la loi khi-carre (ou khi-deux) n degrs de
ngative, i.e.
(x )j , x 0. exp(x ) j!
Variable de Pareto
Vilfredo Pareto lintroduisit ds 1897 pour
modliser la rpartition des revenus dans une population. alatoire de loi exponentielle ngative.
On peut lobtenir en transformant une variable Puisque la loi exponentielle ngative modlise des
sinistres peu dangereux pour la compagnie, on pourrait considrer que le montant de sinistre X a mme loi que exp(Y ), o Y E xp():
Pr[exp(Y ) x] = Pr[Y ln x] =
favorable pour lassureur, puisque la fonction de queue dcrot polynomialement (et non plus exponentiellement) vers 0. la loi de la variable alatoire
Ainsi, une variable alatoire X est dite de loi de Pareto de paramtres > 0 et > 0, not X P ar(, ), lorsque X admet la fonction de
rpartition
FX (x) =
1 0, sinon.
, x+
si x 0,
dangereuses pour lassureur (puisque la probabilit que le montant de sinistre dpasse x dcrot polynomialement avec le montant x).
(x+)+1 ,
0, sinon,
si x 0,
o > 0, > 0; fX est clairement unimodale (le mode unique est en 0).
La gure suivante montre un graphique de f, et
Lois continues
Densit
1 ba (+ ) 1 1 x (1 x ) ()( ) 1 1 2) exp( ( x ) 2 2 2 2 ln( x ) 1 1 exp 2 x 2 x1 exp(x ) () (x+)+1
exp(x)
Vecteurs alatoires
Un vecteur alatoire X est X1 X2 t = ( X , X , . . . , X ) , X= 1 2 n . . . Xn
o les Xi sont dnies sur le mme espace probabilis (E , A, Pr). dnie par
FX (x) = Pr[X1 x1 , X2 x2 , . . . , Xn xn ], x Rn .
Indpendance
indpendantes lorsque
quels que soient les rels xi et xj , et les sous-ensembles I et J disjoints de {1, . . . , n}.
FX (x) =
i=1
Loi compose
Dnissons S=
Xi
i=1
Nous supposerons que les variables alatoires Xi , i = 1, 2, . . . sont indpendantes et identiquement distribues, et que N est indpendante des Xi .
Produit de convolution
Soient W1 et W2 des variables alatoires
" dsigne le produit de convolution: tant donnes deux fonctions de rpartition H1 et H2 telles que H1 (0) = H2 (0) = 0, H1 H2 est dni
par
H 1 H 2 ( x) =
y =0
H1 (x y )dH2 (y ), x 0.
Pr[N =
(k ) k ]FX (x),
x R+ ,
o
FX (x) =
(k ) x y =0
FX
(k 1)
(x y )dFX (y ), x R+ ,
Exemples
Si N B in(n, q ) alors on parle de loi binomiale compose, ce qui se note S CBin(n, q, FX ). Dans
ce cas,
FS (s) =
k =0
n k
q k (1 q )nk FX (s).
(k )
Dans ce cas,
FS (s) =
+ k =0
k (k ) exp() FX (s). k!
Franchise
Lassureur couvre lintgralit du dommage sil excde le montant de la franchise. Le montant Y de lindemnit verse par lassureur
est
0 si S , S si S > .
FS () si y FS (y ) si y > .
Dcouvert obligatoire
charge de lassur.
est
0 si S , S si S > .
FY (y ) = Pr[Y y ] = Pr[S + y ] = FS ( + y ).
Ds lors, Y = (1 )S et FY (y ) = FS
Un dcouvert obligatoire proportionnel laisse en toute hypothse une portion de 100% du montant de sinistre charge de lassur, 0 1. y 1
, y R+ .
comportement de lassur peut inuencer le montant total du sinistre (par exemple en assurance hospitalisation).
Plafond dindemnisation
Si on note le plafond dindemnisation, la somme Y ( ) que recevra lassur suite un prjudice de montant S sera Y ( ) = min{S, } = S si S , si S > .
comme suit:
FY () (y ) =
FS (y ) si y < , 1 si y .
Censure
La connaissance des montants Z pays par une
compagnie dassurance qui a introduit des clauses limitant son intervention dans les conditions de ses polices nest pas quivalente la connaissance des montants de sinistre S eux-mmes
Dans le cas dune franchise, la fonction de rpartition de Z vaut pour z > 0 Pr[0 < Y z ] FZ (z ) = Pr[Y z |Y > 0] = Pr[Y > 0] = 0 si z
F S (z ) F S ( ) 1 F S ( )
si z > .
Notons Yi le montant de lindemnit due par la compagnie dassurance pour le ime sinistre, di le dcouvert obligatoire correspondant, et ui le
plafond dindemnisation.
La fonction f (y |, ) reprsente la fonction de probabilit des donnes compltes, avec le(s) paramtre(s) dintrt, et des paramtres de
nuisance.
La contribution du ime sinistre la fonction de
Quatre cas peuvent tre distingus: (1) (2) (3) di = 0 Yi < ui , L1 (i) = f (Yi |, ) . 0 < di di + Yi < di + ui , L2 (i) =
f (di +Yi |,) 1F (di |,) .
di = 0 ui Yi , L3 (i) = 1 F (ui |, ) .
La contribution la vraisemblance est L1 (i), L2 (i), L3 (i) ou L4 (i) suivant la valeur de Yi par rapport di et ui .
vraisemblance est
L (i) = L1 (i)1 (i) L2 (i)2 (i) L3 (i)3 (i) L4 (i)4 (i) . La fonction de log-vraisemblance pour lchantillon
vaut alors
L =
incendie, partir de G UIAHI , F. (2000) Fitting to Loss Distributions with Emphasis on Rating Variables. CAS Forum.
montant du dcouvert obligatoire, du plafond dindemnisation, et un code par type de construction. dans le cas 3 et 3 dans le cas 4.
Deductible 1000 250 1000 250 100 250 250 250 1000 250 100 250 250
Policy Limit 57000 41000 1000 60000 10000 24000 16000 60000 66000 36000 53000 70000 51000 Loss 502 31971 367 698 4863 834 646 198 275 500 1518 243 357
Construction 2 1 1 2 2 2 1 2 2 1 2 2 1
Deductible 250 1000 100 250 250 250 500 250 250 250 100
Policy Limit 43000 1000 33000 7000 64000 45000 30000 2000 10000 52000 3000 50000 Loss 75 865 206 2303 11760 402 3352 511 1115 237 1197 7107
Construction 2 3 2 1 2 2 1 1 2 2 2 2
Deductible 250 250 250 250 1000 1000 1000 1000 250 250 1000 2500 250
Policy Limit 120000 100000 350000 373000 208000 600000 284000 263000 312000 280000 312000 250000 300000 Loss 100 2501 1057 180 9385 23000 5589 652 3975 485 2092 250000 250
Construction 2 2 2 1 1 3 1 2 1 2 2 1 2
Deductible 500 1000 250 1000 500 250 250 500 1000 250 250 1000
Policy Limit 125000 115000 630000 402000 204000 300000 350000 595000 275000 290000 560000 371000 Loss 305 190 1875 5075 972 271 87 625 20934 609 325 6012
Construction 2 2 1 2 2 3 1 2 1 1 2 1
LAkaikes Information Criterion (AIC ) est dni par AIC = 2 [L k ], o k est le nombre de
paramtres. Le modle qui minimise la valeur de AIC est considr comme le meilleur. Les ajustements sont rsums ci-dessous:
Distribution Lognormal Pareto Weibull Gamma Inverse Gamma Exponential L 897,8 895,2 899,8 914,5 893,7 986,4 k 2 2 2 2 2 1 AIC 1799,6 1794,4 1803,6 1833,0 1791,4 1974,8